Você está na página 1de 148

CESAR ROBERTO SANTOS

ANLISE DE ASSINATURAS MANUSCRITAS


BASEADA NOS PRINCPIOS DA GRAFOSCOPIA

Dissertao apresentada ao Programa de PsGraduao em Informtica Aplicada da Pontifcia


Universidade Catlica do Paran como requisito
parcial para obteno do ttulo de Mestre em
Informtica Aplicada.

CURITIBA
2004

CESAR ROBERTO SANTOS

ANLISE DE ASSINATURAS MANUSCRITAS


BASEADA NOS PRINCPIOS DA GRAFOSCOPIA

Dissertao apresentada ao Programa de Ps-Graduao


em

Informtica

Aplicada

da

Pontifcia

Universidade

Catlica do Paran como requisito parcial para obteno


do ttulo de Mestre em Informtica Aplicada.

rea de Concentrao: Metodologias e Tcnicas de


Computao
Orientador:

Prof. Dr. Flavio Bortolozzi

Co-orientador: Prof. Dr. Edson Jos Rodrigues Justino

CURITIBA
2004

Santos, Cesar Roberto


Anlise de Assinaturas Manuscritas Baseada nos Princpios da Grafoscopia. Curitiba,
2004. 132p.

Dissertao - Pontifcia Universidade Catlica do Paran. Programa de Ps Graduao em


Informtica Aplicada.

1. Anlise pericial de documentos questionados. 2. Verificao de Assinaturas. 3. Redes


Neurais. 4. Caractersticas grafomtricas extradas. I. Pontifcia Universidade Catlica do
Paran. Centro de Cincias Exatas e Tecnologia. Programa de Ps-Graduao em
Informtica aplicada.

Dedico este trabalho a minha esposa Ceres pela pacincia e


compreenso demonstrada e tambm ao meu filho Nathan.

Agradecimentos

Deus que me deu foras nos momentos de desnimo desta jornada.

minha esposa, meu filho, e, tambm, aos meus pais que sempre me incentivam a continuar
lutando pelos meus ideais.

Ao Professor Orientador Dr. Flvio Bortolozzi pelas contribuies seguras. Ao Professor e


amigo Co-orientador Dr. Edson Justino pela ajuda na fundamentao terica do trabalho,
pelos questionamentos e contribuies construtivas, pelo incentivo e ainda pelo lao de
amizade construdo.

Ao Professor Dr. Robert Sabourin pela fundamentao terica e contribuies seguras dadas a
este trabalho.

Ao amigo e Professor Dr. Alceu de Souza Brito Jr. pelo incentivo a ingressar nesta jornada
fornecendo a oportunidade de demonstrar meu potencial.

Pontifcia Universidade Catlica do Paran pelo apoio financeiro, em especial ao Programa


de Ps-Graduao em Informtica Aplicada (PPGIA), pelo apoio estrutural que permitiu a
realizao deste trabalho.

Aos meus Colegas de estudos, Professores, e Funcionrios do PPGIA.

A todos que direta ou indiretamente colaboraram na realizao deste trabalho.

SUMRIO

LISTA DE FIGURAS .....................................................................................................VIII


LISTA DE TABELAS ..................................................................................................... XII
LISTA DE ABREVIATURAS E SIGLAS..................................................................... XIII
LISTA DE SMBOLOS.................................................................................................. XIV
RESUMO ..........................................................................................................................XV
ABSTRACT .................................................................................................................... XVI
1. INTRODUO ............................................................................................................... 1
1.1. DESAFIO ...................................................................................................................... 2
1.2. MOTIVAO ................................................................................................................ 5
1.3. PROPOSTA.................................................................................................................... 6
1.4. CONTRIBUIES ........................................................................................................... 7
1.5. ORGANIZAO DA DISSERTAO ................................................................................. 7
2. FUNDAMENTAO TERICA ................................................................................... 8
2.1. RECONHECIMENTO DE PADRES ................................................................................... 8
2.2. TIPOS DE ABORDAGENS NA VERIFICAO DE ASSINATURAS ....................................... 10
2.3. MTODOS DE VERIFICAO ....................................................................................... 12
2.4. TEORIA DA CLASSIFICAO BAYESIANA ..................................................................... 14
2.4.1. Teoria de Deciso Bayesiana ............................................................................. 15
2.5. REDES NEURAIS ARTIFICIAIS ...................................................................................... 17
2.5.1. Perceptron Multicamadas .................................................................................. 18
2.5.2. Melhorias de Desempenho da Rede Neural ........................................................ 19
2.5.3. Aprendizagem em Redes MLP ............................................................................ 23
2.5.4. Mtodos de Validao do Processo de Aprendizagem ........................................ 30
2.6. SVM ......................................................................................................................... 31
2.7. COMENTRIOS FINAIS ................................................................................................ 35
3. ESTADO DA ARTE NA AUTENTICAO DE ASSINATURAS............................. 36
3.1. ABORDAGENS GLOBAIS.............................................................................................. 36
3.2. ABORDAGENS LOCAIS ................................................................................................ 38
3.3. ABORDAGENS GLOBAIS E LOCAIS ............................................................................... 41
3.4. VISO CRTICA DO ESTADO DA ARTE ......................................................................... 45
3.5. COMENTRIOS FINAIS ................................................................................................ 46
4. METODOLOGIA.......................................................................................................... 48
4.1. REQUISITOS ............................................................................................................... 48
4.2. RECURSOS ................................................................................................................. 49
vi

4.3. GRAFISMO ................................................................................................................. 49


4.3.1. Grafoscopia ....................................................................................................... 50
4.3.2. Grafologia.......................................................................................................... 58
4.3.3. Consideraes sobre o Grafismo ........................................................................ 63
4.4. MEDIDAS DE DISTNCIA ............................................................................................ 65
4.4.1. Distncia Euclidiana.......................................................................................... 66
4.4.2. Distncia Euclidiana Quadrtica ....................................................................... 67
4.4.3. Distncia de Manhattan Bloco-Cidade ............................................................ 67
4.5. DICOTOMIA................................................................................................................ 67
4.5.1. Transformao Dicotmica ................................................................................ 69
4.5.2. Comparando Policotomia e Dicotomia............................................................... 72
4.5.3. Resumo da Abordagem Dicotmica.................................................................... 74
4.6. COMENTRIOS FINAIS ................................................................................................ 74
5. MTODO PROPOSTO................................................................................................. 75
5.1. VISO DO PERITO NA ANLISE DE ASSINATURAS QUESTIONADAS ............................... 75
5.2. ETAPAS NO PROCESSO DE VERIFICAO DE ASSINATURAS .......................................... 78
5.2.1. Aquisio e Pr-processamento.......................................................................... 79
5.2.2. Segmentao ...................................................................................................... 82
5.2.3. Extrao das Primitivas ..................................................................................... 84
5.2.4. Clculo das Distncias entre as Primitivas......................................................... 94
5.2.5. Produo de Um Modelo.................................................................................... 96
5.2.6. Processo de Deciso .......................................................................................... 98
5.3. COMENTRIOS FINAIS .............................................................................................. 102
6. EXPERIMENTOS REALIZADOS E ANLISES DOS ERROS.............................. 103
6.1. PROTOCOLO DE AVALIAO..................................................................................... 103
6.2. OS EXPERIMENTOS ................................................................................................... 106
6.2.1. Determinao da Resoluo do Grid na Segmentao...................................... 107
6.2.2. Mxima Combinao de Amostras ................................................................... 107
6.2.3. Balanceamento do Nmero de Amostras de Cada Classe ................................. 108
6.2.4. Seleo do Conjunto de Primitivas ................................................................... 109
6.2.5. Aumento na Quantidade de Autores e Variao nas Amostras.......................... 110
6.2.6. Limiares de Rejeio e Aceitao ..................................................................... 112
6.2.7. SVM ................................................................................................................. 113
6.2.8. Comparativo do Mtodo Proposto com a Anlise Humana............................... 114
6.3. ESTIMANDO A PROBABILIDADE DO ERRO .................................................................. 115
6.4. COMENTRIOS FINAIS .............................................................................................. 118
7. CONCLUSO E TRABALHOS FUTUROS.............................................................. 120
7.1. CONCLUSO ............................................................................................................ 120
7.2. TRABALHOS FUTUROS .............................................................................................. 121
8. REFERNCIAS BIBLIOGRFICAS........................................................................ 123
A. EXPERIMENTO COM KERNEL LINEAR DO SVM............................................. 131
B. EXPERIMENTO COM OUTRAS MEDIDAS DE DISTNCIAS ........................... 132

vii

Lista de Figuras

Figura 1.1

Exemplo de (a) assinatura genuna de um autor em especfico, (b)

variao intrapessoal medida pela sobreposio de trs assinaturas


genunas do mesmo autor.
Figura 1.2

Similaridade interpessoal (a) e (b).

Figura 1.3

Exemplo de (a) assinatura original, (b) falsificao aleatria, (c)

falsificao simulada, (d) falsificao simples.


Figura 1.4

Separao entre as classes w1 e w2 no espao 2 .

Figura 2.1

Modelo genrico do mtodo de reconhecimento de padres.

10

Figura 2.2

Diagrama hierrquico de classificao dos tipos de abordagens de

12

verificao de assinaturas.
Figura 2.3

Modelo simplificado de um neurnio.

17

Figura 2.4

Interpretao geomtrica das regras de unidades escondidas em um

21

espao bi-dimensional de acordo com Lippmann [LIPPMANN, 1987].


Figura 2.5

Curvas de aprendizagem com relao ao excesso ou falta de

28

treinamento.
Figura 2.6

Probabilidade do erro para um problema de duas classes.

29

Figura 2.7

Margem de separao mxima para duas classes.

32

Figura 2.8

Superfcie de deciso de um classificador polinomial.

33

Figura 4.1

Assinatura de calibre reduzido (a) e de alto calibre (b).

51

Figura 4.2

Assinatura cursiva com espaamentos entre os nome e sobrenomes.

51

Figura 4.3

Exemplo de assinatura inclinada em documento no-pautado.

52

Figura 4.4

Exemplo de inclinao direita (a) e esquerda (b).

53

Figura 4.5

Exemplo de assinatura de segmentos angulares (a) e com segmentos

53

curvilneos (b).
Figura 4.6

Exemplo de mnimos grficos.

54

Figura 4.7

Exemplo de assinatura com escrita rpida (a) e lenta (b).

54

Figura 4.8

Exemplo de assinatura com relao a inicio e fim abrupto: (a)

55

Assinatura original; (b) Assinatura falsificada.

viii

Figura 4.9

Exemplo de assinatura relacionada a elevao do objeto de escrita: (a)

56

Assinatura original; (b) Falsificao com elevao do objeto de escrita.


Figura 4.10 Exemplos de assinaturas sem tremores e com tremores: (a) Assinatura

56

original; (b) Assinatura falsificada com traado trmulo.


Figura 4.11 Exemplos de assinaturas sem presso e com presso (a) Assinatura

57

original. (b) Falsificao simulada com pontos de presso.


Figura 4.12 Exemplos de assinaturas sem e com correes (a) Assinatura original.

57

(b) Falsificao simulada com pontos corrigidos.


Figura 4.13 Exemplos de assinaturas sob o ponto de vista da ordem, podendo ser

60

uma assinatura: (a) clara; (b) confusa; (c) concentrada; (d) espaada.
Figura 4.14 Exemplos de assinaturas com relao a simetria: (a) Assinatura

60

proporcional; (b) Assinatura desproporcional; (c) Assinatura mista.


Figura 4.15 Exemplos de assinaturas com relao a dimenso: (a) Assinatura alta;

61

(b) Assinatura baixa.


Figura 4.16 Exemplos de assinaturas com relao a presso: (a) Assinatura tensa;

61

(b) Assinatura frouxa.


Figura 4.17 Exemplos de assinaturas sob o ponto de vista da forma: (a) Assinatura

62

caligrfica; (b) Assinatura arredondada; (c) Assinatura reta vertical; (d)


Assinatura reta horizontal.
Figura 4.18 Exemplos de assinaturas do ponto de vista de gestos caractersticos: (a)

63

Gancho; (b) Clava; (c) Golpe de sabre e inflada; (d) Espiral; (e)
Movimento em tringulo e lao; (f) Bucle; (g) Arco; (h) Guirlanda e
serpentina.
Figura 4.19 Preciso nas mtricas de distncia euclidiana, euclidiana quadrtica e

66

bloco-cidade.
Figura 4.20 Hierarquia de tipos de caractersticas de acordo com Cha [CHA, 2001].

69

Figura 4.21 Transformao de: (a) Domnio das caractersticas (policotomia) para

70

(b) Domnio das distncias das caractersticas (dicotomia).


Figura 4.22 Distribuio das distncias das caractersticas no espao 3D.

71

Figura 4.23 Distribuio do erro Tipo I e Tipo II.

72

Figura 4.24 Comparao entre (a) Domnio das caractersticas (policotomia) e (b)

73

Domnio das distncias das caractersticas (dicotomia) [CHA, 2001].

ix

Figura 4.25 Processo de Verificao e transformao dicotmica baseada em

74

[CHA, 2001].
Figura 5.1

Modelo geral usado na percia grafotcnica de verificao de

76

autenticidade de assinaturas.
Figura 5.2

Esquema do processo de deciso na verificao de assinaturas off-line

77

baseado na viso pericial.


Figura 5.3

Um comparativo nas etapas no processo de verificao de assinaturas:

78

(a) processo de anlise e deciso pericial; (b) processo computacional


proposto.
Figura 5.4

Estratgia de alinhamento a esquerda: (a) Assinatura Original (b) 3

82

assinaturas originais sobrepostas (c) Nvel de coincidncia de pixels.


Figura 5.5

Exemplos de Segmentaes utilizadas no mtodo representando

84

clulas verticais por horizontais: (a) 4x10; (b) 4x63; (c) 8x20; (d)
10x25; (e) 10x63; (f) 20x20; (g) 25x63.
Figura 5.6

Primitiva de pontos de presso (a) imagem original (b) imagem plotada

86

no grid (c) valores de presso encontrado em cada clula da imagem.


Figura 5.7

Primitiva de incio e fim abrupto (a) imagem original (b) imagem

88

esqueletizada (c) pontos circulados correspondentes a inicio ou fim do


segmento no grid (d) pontos de inicio e fim correspondentes na
imagem original plotado no grid.
Figura 5.8

Primitiva segmentos de tremor (a) processo de extrao dos segmentos

89

mais longos plotados no grid e utilizao do cdigo de cadeia (b)


resultado do nvel de tenso do segmento.
Figura 5.9

Primitiva densidade de pixels (a) imagem limiarizada (b) imagem

90

plotada no grid com segmento extrado para a contagem de pixels.


Figura 5.10 Primitiva inclinao axial (a) Conjunto de elementos estruturantes que

91

representam os tipos de inclinao axial da clula (b) Imagem


esqueletizada com os valores correspondentes da inclinao axial.
Figura 5.11 Primitiva implementada por Rigoll e Kosmala [RIGOLL &

91

KOSMALA, 1998] ngulo absoluto e diferena angular.


Figura 5.12 Diagrama do processo de extrao da primitiva curvatura.

92

Figura 5.13 Primitiva centro de gravidade (a) imagem limiarizada plotada no grid e

93

alinhada a esquerda (b) centro de massa de cada clula (c) distncia


euclidiana d do centro de massa origem.
Figura 5.14 Descrio do processo de transformao dicotmica com relao as

95

primitivas implementadas.
Figura 5.15 Histograma de deciso no conjunto de validao com limiares de

101

deciso.
Figura 6.1

Exemplo do processo de comparao humana na similaridade entre 2


assinaturas.

xi

114

Lista de Tabelas

Tabela 2.1

Matriz de confuso de trs classes

30

Tabela 2.2

Alguns kernels do SVM comumente usados.

34

Tabela 3.1

Resumo do estado da arte relevante para a dissertao.

44

Tabela 4.1

Caractersticas combinadas da grafologia e da grafoscopia e as

64

primitivas implementadas.
Tabela 5.1

Segmentao com mltiplas resolues.

Tabela 6.1

Protocolo do nmero de assinaturas utilizado nos experimentos

83
104

iniciais.
Tabela 6.2

Protocolo do amostras utilizadas nos experimentos iniciais.

105

Tabela 6.3

Protocolo do nmero de assinaturas utilizado nos experimentos finais.

105

Tabela 6.4

Protocolo do amostras utilizadas nos experimentos finais.

106

Tabela 6.5

Resultados com diferentes resolues de grid.

107

Tabela 6.6

Resultados obtidos com a mxima combinao da sub-base de 40

108

autores.
Tabela 6.7

Resultados com variao do nmero de amostras por classe.

108

Tabela 6.8

Resultado da seleo do melhor conjunto de primitivas.

110

Tabela 6.9

Resultado do aumento da quantidade da autores e variao nas

111

quantidade de amostras.
Tabela 6.10 Resultados obtidos uso de limiares de rejeio.

113

Tabela 6.11 Resultado comparativo de rede MLP com SVM.

113

Tabela 6.12 Resultado da avaliao humana do processo de verificao de

115

assinaturas em comparao com a abordagem proposta.


Tabela 6.13 Estimao por intervalos das taxas de erro do conjunto de teste.

116

Tabela 6.14 Tabela de Contingncia 2 x 2.

117

Tabela A.1

Resultado entre SVM com kernel linear e polinomial

131

Tabela B.1

Resultado do experimento com outras medidas de distncias.

132

xii

Lista de Abreviaturas e Siglas

ART

Adaptive Resonance Theory

Dpi

Dot per inch

HMM

Hidden Markov Model

IC

Intervalo de Confiana

k-NN

k Nearest Neighbors

LARD

Laboratrio de Anlise e Reconhecimento de Documentos

MLP

Multi-Layered Perceptron

MMH

Hiperplano de Margem Mxima

MSE

Erro quadrtico mdio

PPGIA

Programa de Ps-Graduao de Informtica Aplicada

PUC-PR

Pontifcia Universidade Catlica do Paran

RBF

Redes com Funes de Base Radial

RF

Fator de Confiabilidade

RNA

Rede Neural Artificial

SNNS

Sttutgart Neural Network Simulator

SRM

Minimizao do Risco Estrutural

SV

Vetores de Suporte

SVM

Support vector machine

QV

Quantizao Vetorial

VC

Dimenso Vapnik Chervonenkis

xiii

Lista de Smbolos

Dimenso do vetor do atributo.

P( . / . )
P( . ), P[.]

Probabilidade a posteriori.
Probabilidade a priori.

f(x)

Funo de densidade e probabilidade.

w.

Grupo ou classe.

Objeto, padro de entrada ou atributo.

yi

Sada da rede neural, rtulo da sada do SVM

G(x)

Funo discriminante de Bayes.

N, n

Nmero de classes ou autores.

T, T1, T2

Limiares de Rejeio e Aceitao.

Bias.

p.

Pesos dos neurnios.


Constante de aprendizagem.

Falsa aceitao.

Falsa rejeio.

Hiperplano de separao tima.

K(xi, x)
C

Funo do kernel.
Penalidade do erro no SVM.

Magnitude do erro de classificao.

p

Vetor de pesos no SVM.

dij

Distncia entre i e j

.(+)

Variveis de distncias entre caractersticas do mesmo autor.

.(-)

Variveis de distncia entre caractersticas de autores diferentes.

Exemplares de assinaturas de cada autor.

  

..

Medida de distncia entre valores de caractersticas de duas assinaturas.

fv. .

Vetor de caractersticas extrada de uma imagem.

Ri

Deciso na verificao de assinaturas baseado na percia grafotcnica.

Mdia dos nveis de cinza celular.


Nmero de primitivas extradas.
xiv

Resumo

A verificao automtica de assinaturas estticas ou off-line trata especificamente de


um problema em aberto devido a fatores como a variao entre assinaturas do mesmo autor,
semelhana entre a escrita de autores diferentes, alm dos diversos tipos de falsificaes. A
abordagem proposta nesta dissertao par resolver este problema baseia-se na viso da
grafoscopia e utiliza um classificador baseado em redes neurais artificiais, as caractersticas
extradas do grafismo, medidas de distncias e um mtodo dicotmico. Nesse modelo,
somente duas classes so assumidas: autoria e no autoria. Para validar o experimento 180
autores fornecem assinaturas genunas no treinamento e 60 outros provem as falsificaes,
sendo que a combinao entre os dois conjuntos forma a base de dados para os experimentos.
A abordagem apresentada prope uma soluo atravs do uso de um nmero reduzido de
assinaturas por autor (em torno de 5), assim como a reduo do nmero de classes, problema
este encontrado em outros mtodos relacionados a verificao de assinaturas. As seguintes
etapas fazem parte da abordagem: aquisio dos dados (digitalizao das imagens das
assinaturas), pr-processamento (filtro para retirada de rudos e preparao para extrao de
caractersticas aplicadas sobre as imagens digitalizadas), segmentao (imagem particionada
em clulas para a extrao das caractersticas), extrao das caractersticas (seleo das
propriedades relevantes que representam a assinatura, baseadas na grafoscopia e grafologia),
clculo de distncias entre caractersticas (etapa na qual a distncia entre os vetores de
caractersticas pertencentes a duas amostras so primeiramente computadas e usada para
verificar a autenticidade do autor), produo de um modelo (um conjunto de referncia de
assinaturas gerado para utilizao no processo comparativo, que usa rede neurais artificiais,
em especfico o percetron multicamada com algoritmo backpropagation), e finalmente o
processo de deciso (a sada do modelo produzido avaliada, verificando se a assinatura
pertence determinada classe ou no). Os erros mdios obtidos esto na faixa de 9,79% para
falsa rejeio e de 6,71% para falsa aceitao.

Palavras-chave: 1. Anlise pericial de documentos questionados. 2. Verificao de


Assinaturas. 3. Redes Neurais. 4. Caractersticas grafomtricas extradas.

xv

Abstract

The off-line signature verification is an open problem due mainly to the variability
presented by samples from the same writer, the similarity among samples from different
writers as well as to different forgery types. The proposed approach is based on the
graphometry, neural networks, distance measures and the dichotomic method. In this method
only two classes are used: genuine and forgery. A set of 180 writers composes the genuine
database in the training and a subset of 60 writers composes the forgery database. The
proposed solution uses a reduced number of samples for each author (around 5 samples per
writer) and only two classes. This protocol is composed by an acquisition procedure
(obtaining signatures images), preprocessing (preparating the acquired images for feature
extraction), segmentation (image divided in cells for the features extraction), feature
extraction (selection of the significant properties that represent the signature, based on
graphometric analysis), feature distance measurement (stage in which the distance between
the vectors feature belonging to two samples is computed and used to verify author
autenticity), model production (signature reference set is generated by comparison process
using neural network multilayer perceptron with backpropagation algorithm) and a decision
process (the output of previous stage is evaluated, being verified if the signature belongs or
not to the genuine class). The mean error rate obtained are 9,79%, in the false rejection and
6,71% in the false acceptance.

Key-words: 1. Document Questioned Experts Approach. 2. Signature Verification. 3.


Neural Networks. 4. Graphometric Features.

xvi

Captulo 1

1. Introduo

A biometria a utilizao de caractersticas biolgicas (face, ris, impresso digital) ou


tratamento comportamental (assinatura e voz) para a verificao da identidade do indivduo.
Autenticao biomtrica entendida como uma alternativa, mais confivel, aos sistemas de
segurana baseados em senha, pois relativamente difcil de ser falsificada, roubada ou
obtida. Em particular, a assinatura est relacionada ao comportamento biomtrico: ela no
baseada em propriedades fsicas, tal como a impresso digital ou a face de um indivduo, mas
apenas em caractersticas comportamentais [KHOLMATOV, 2003].
A assinatura constitui atualmente, no contexto jurdico, um dos meios para comprovar
a inteno em transaes envolvendo documentos [JUSTINO, 2002], ou seja, quando se
assina qualquer documento, este ato representa a aceitao dos fatos, indicando a sua
concordncia. Esta premissa garante a utilizao de assinaturas como recurso comprobatrio
em contratos, escrituras e cheques bancrios, entre outros, pois representa uma marca ou selo
pessoal do indivduo.
Diversos tipos de documentos precisam ser assinados. Desta forma, tcnicas
confiveis para verificao de assinaturas so requisitadas. Mesmo que a maioria das recentes
pesquisas estejam focadas em assinaturas digitais de documentos eletrnicos (isto , um
cdigo de chave codificado associado com um documento em sua verso eletrnica,
especialmente projetado para evitar manipulao por pessoas no autorizadas), um grande
nmero de documentos de papel assinados ainda produzido diariamente [SANSONE &
VENTO, 2000], tais como os cheques bancrios.
No se pode negar que o uso de cartes de crditos cresceu muito nos ltimos anos em
relao aos cheques bancrios. Porm para cada transao eletrnica existem duas envolvendo
cheques, principalmente, devido ao uso do cheque pr-datado (verso brasileira do
capitalismo). Alm disso, muitos comerciantes usam os cheques recebidos dos clientes como
moeda, assim escapando de pagamentos de taxas bancrias [SILVA, 2003], o que garante a

aplicao do sistema proposto e a continuidade do uso de assinaturas neste tipo de documento,


podendo ser usado tambm em recibos de carto de crdito.
Muitas vezes, pelo fato de estar sujeita a uma anlise subjetiva, que pode gerar
discordncias, a deteco de autenticidade de assinaturas constitui-se em uma tarefa
complexa, pois a verificao manual para uma grande quantia de documentos tediosa e
facilmente influenciada por fatores fsicos e psicolgicos [XIAO & LEEDHAM, 1999]. No
campo computacional, a verificao de assinaturas estticas continua sendo um problema em
aberto, no existindo um mtodo totalmente aceito. Uma abordagem que incorpore a viso
subjetiva de forma satisfatria, certamente encontrar aplicaes prticas, principalmente no
que diz respeito a sistemas de automao bancria e comercial.
Atualmente, com recursos computacionais mais eficazes, tarefas que h alguns anos
pareciam inviveis agora atraem novas pesquisas. Dentro deste contexto, a verificao de
assinaturas uma importante e desafiadora rea de estudos na qual buscam-se solues
computacionais automatizadas relacionadas autenticao, procurando estabelecer uma
comparao segura entre um modelo de assinatura conhecido com um outro questionado.
O uso da anlise grafotcnica pericial utilizada em cincias forenses representa um
nicho de pesquisa que se encaixa perfeitamente na verificao de assinaturas manuscritas.
Desta forma, os critrios tcnicos dos peritos so empregados na anlise das caractersticas da
escrita, as quais podem ser conscientes ou inconscientes, como tambm na deciso da
autenticidade.

1.1. Desafio

A abordagem proposta tem como desafio minimizar a complexidade que envolve


alguns fatores relacionados escrita da assinatura, como a variao intrapessoal, ilustrada na
Figura 1.1(b), que decorre da instabilidade que existe entre assinaturas do mesmo autor. A
assinatura de uma pessoa pode mudar ao longo do tempo devido a diversos fatores como o
estado psicolgico do autor ou a mudana do dispositivo de entrada [XIAO & LEEDHAM,
1999]. Outro fator de complexidade a similaridade interpessoal, conforme ilustrada na
Figura 1.2 que representa a semelhana entre assinaturas de autores distintos.

(a)

(b)

Figura 1.1: Exemplo de (a) assinatura genuna de um autor em especfico, (b) variao
intrapessoal medida pela sobreposio de trs assinaturas genunas do mesmo autor.

(a)

(b)

Figura 1.2: Similaridade interpessoal (a) e (b).

Alguns aspectos ligados variao de escrita podem estar relacionados ao alfabeto,


forma de escrita de determinada regio, condio social, pas, estado fsico ou mental e idade
cronolgica da populao analisada [CHA, 2001].
Assinar no um processo perfeitamente preciso com dados de caractersticas
idnticas. A nica certeza que quando duas assinaturas so exatamente idnticas, uma delas
provavelmente uma cpia [RASHA, 1994].
Assinaturas, por representarem um caso especial de manuscritos, podem ser divididas
nas categorias, cursivas ou rubricas, estas contendo caracteres especiais, distorcidos ou ainda
uma representao simblica, tais como desenhos estilizados. Neste caso, uma anlise no
contextual necessria, pois no existe a interpretao de texto durante a verificao,
conforme Sabourin e Genest [SABOURIN & GENEST, 1994], o que representa outro fator de
complexidade.
As assinaturas podem ainda sofrer aes fraudulentas, sendo classificadas por peritos
em documentos questionados quanto sua autenticidade em genuna e no genuna
[JUSTINO, 2002].

O uso da palavra falsificao um termo legal que deve ser

cuidadosamente usado nas concluses apresentadas pelo perito em documentos questionados


[JUSTINO, 2001]. Falsificaes podem ser bastante diferentes de assinaturas genunas tanto
em aparncia como em suas caractersticas, ou podem ser to similares que mesmo peritos
sentem dificuldades em distingui-las corretamente [XIAO & LEEDHAM, 1999], desta forma

dificultando a aplicao de sistemas computacionais na verificao de assinaturas [JUSTINO


et al., 2003].
As assinaturas no genunas, ou falsificaes, normalmente podem ser classificadas
em duas categorias: simples ou habilidosa conforme Faez [FAEZ et al., 1997]. Justino
[JUSTINO, 2001] define uma terceira categoria, a aleatria, que ilustrada na Figura 1.3
juntamente com os demais tipos. Estas categorias so definidas como:

Simples: o falsificador simplesmente escreve o nome do autor, que pode ser


semelhante ou no original;

Servil, simulada ou habilidosa: o falsificador simula uma assinatura genuna


usando um modelo como referncia, tentando chegar o mais prximo possvel de
seu traado original;

Aleatrias: o falsificador inventa uma assinatura ou utiliza a sua prpria, a qual


no possui semelhanas com a genuna.

(a)

(c)

(b)

(d)

Figura 1.3: Exemplo de (a) assinatura original, (b) falsificao aleatria, (c) falsificao
simulada, (d) falsificao simples.
No processo que envolve a verificao automtica de assinaturas o objetivo
discriminar entre uma assinatura genuna e todos os tipos de falsificaes. Portanto, dadas
duas classes w1, representando a classe de assinaturas genunas de um autor e w2,
representando a classe de assinaturas no genunas, o desafio basicamente separ-las.
Porm, quando falsificaes so submetidas ao sistema, principalmente as simuladas, a
complexidade aumenta. Se um limiar de deciso puder ser definido, a classificao consiste
em determinar em qual lado do limite qualquer novo dado deve se situar. A funo
matemtica de tal limite de deciso uma funo discriminante, sendo que ach-la geralmente

no trivial. Por esta razo, em um processo de aprendizagem algumas amostras de


falsificaes so identificadas erroneamente como pertencendo classe w1, o que pode
acontecer at mesmo com amostras de falsificaes simples [JUSTINO et al., 2003],
conforme a Figura 1.4.
Espao 2 do Mapeamento das Caractersticas
Conjunto de Verificao

limiar
w1
w1

Autor 1

w2

w2
Autor 2
Falsificao Simples
Falsificao Simulada

y
Figura 1.4: Separao entre as classes w1 e w2 no espao 2 .

Em situaes prticas a classe w2, que representa a classe de amostras no genunas


pode englobar os vrios tipos de falsificaes (simples, simuladas e aleatrias). As
falsificaes aleatrias so representadas por amostras de assinaturas genunas que pertencem
a um autor diferente.

1.2. Motivao

O direcionamento da abordagem proposta est baseado nos preceitos do grafismo,


apresentados inicialmente por Chuang [CHUANG, 1977] e mais recentemente por Justino
[JUSTINO, 2001], nos quais os subsdios e a viso que o perito grafotcnico possui para a
resoluo de problemas criminais so transcritos na extrao das caractersticas.

O nmero de espcimes utilizado em qualquer abordagem relacionado ao


reconhecimento de manuscritos que envolve treinamento de classificadores torna-se um
problema quando transposto para sistemas prticos, em aplicaes bancrias ou comerciais,
que dispem em geral de um nmero reduzido de amostras de cada classe, autor ou indivduo.
invivel, ento, solicitar diversas vezes aos usurios a produo de assinaturas para o
sistema empregado (manual ou automatizado). Desta forma uma abordagem alternativa
validada estatisticamente faz-se necessrio, para um mtodo ser aceito cientificamente e
tambm para a sua utilizao prtica.
Atualmente mtodos baseados em modelos pessoais [HUANG & YAN, 1997]
[SABOURIN & GENEST, 1994],

so geralmente adotados como soluo nesta rea.

Entretanto, em aplicaes reais existe, em geral um nmero bastante limitado de amostras que
podem ser usados no treinamento de modelos pessoais (em torno de 4 a 6), o que inviabiliza a
maioria destas abordagens, apesar de apresentarem excelentes resultados [JUSTINO et al.,
2003].
Alm da motivao prtica, existe tambm o interesse despertado pelo carter
desafiador da rea de pesquisa. A rea de reconhecimento de padres possui tcnicas que so
aplicadas na soluo de problemas reais cujo comportamento no obedece aos princpios
rgidos da lgica. Estes so alguns dos motivos que despertam o interesse nesta abordagem
cientfica.

1.3. Proposta

A proposta deste trabalho apresentar uma abordagem de verificao de assinaturas


estticas, com o objetivo de autenticar a assinatura de um escritor, ao contrrio do
reconhecimento de assinaturas no qual o objetivo determinar quem o autor da assinatura
[CAVALCANTI et al., 2002]. Dentro deste contexto as seguintes metas so propostas:

Minimizar a complexidade que envolve todas as etapas de um sistema de


verificao de assinaturas;

Reduzir o nmero de amostras genunas por autor na produo de um modelo,


simulando ambientes de aplicaes no automatizadas, e somente o uso a priori de
falsificaes aleatrias;

Utilizao dos preceitos da grafoscopia na anlise das caractersticas da escrita


[JUSTINO, 2001] como alternativa para o problema proposto;

Obter uma metodologia que reduza o nmero de modelos associados


autenticao de assinaturas.

1.4. Contribuies

Nesta subseo apresentam-se as contribuies deste trabalho de pesquisa as quais so:

Uma alternativa para o nmero excessivo de assinaturas genunas por autor.


Problema este encontrado na maioria das abordagens relacionadas verificao de
assinaturas [JUSTINO, 2001], [HUANG & YAN, 1997];

O uso de uma abordagem genrica que utiliza somente um nico treinamento em


todo o processo, independente do autor ou assinatura analisada;

A implementao computacional dos princpios da grafoscopia tanto na extrao


das caractersticas quanto no processo de deciso.

1.5. Organizao da Dissertao

Esta dissertao est organizada em sete captulos. O primeiro contm uma introduo
sobre verificao automtica de assinaturas manuscritas. No segundo captulo apresentada
uma fundamentao terica de classificadores para verificao de assinaturas. No terceiro
captulo apresenta-se o resumo do estado da arte na autenticao das assinaturas. No quarto
captulo elucidada a metodologia. No quinto as etapas da abordagem proposta. Os
experimentos realizados neste trabalho para validar estatisticamente o mtodo so mostrados
no sexto captulo. E finalmente no stimo captulo so apresentadas as concluses e propostas
para trabalhos futuros.

Captulo 2

2. Fundamentao Terica

Este captulo apresenta uma base terica dos processos de autenticao de assinaturas,
contendo uma breve descrio de reconhecimento de padres, tipos e mtodos de abordagens
relacionados ao problema. Tambm so apresentados os classificadores abordados, com um
estudo de redes neurais, em especfico redes MLP e dicas de configurao de parmetros das
mesmas. Ao final, apresentada uma introduo do classificador SVM.

2.1. Reconhecimento de Padres

Um padro uma descrio de um objeto que pode ser um conjunto de medidas ou


observaes normalmente representadas atravs de um vetor ou notao de matriz [RASHA,
1994]. No processo de verificao de assinaturas, uma assinatura um exemplo de padro que
pode ser representado por uma matriz de pixels. O reconhecimento de padres pode ser
definido como a categorizao de dados de entrada em classes identificveis, via extrao de
caractersticas significantes ou atributos de detalhes relevantes. Conseqentemente o objetivo
fundamental do reconhecimento de padres a classificao. Um sistema de reconhecimento
de padres bsico divide-se em duas fases. A primeira a extrao das caractersticas e a
segunda a classificao [RASHA, 1994].
Caractersticas so quaisquer medidas extraveis de um padro que podem contribuir
para a classificao, sendo que as mesmas podem ser representadas por valores contnuos ou
discretos.
Na distino entre diferentes classes, muitas caractersticas so requisitadas. Selecionar
estas caractersticas pode ser uma difcil tarefa que exigir significantes esforos
computacionais. A seleo de caractersticas o processo inicial para o reconhecimento de

padres, que envolve geralmente um julgamento, ou seja, os descritores de uma assinatura


devem conter informaes representativas da classe a que ela pertence de modo a permitir
diferi-la de falsificaes [MARAR et al., 2002].
A chave escolher e extrair caractersticas que [RASHA, 1994]:

Sejam computacionalmente possveis;

Conduzam a um sistema com poucos erros de m-classificao;

Reduzam a quantia de informao manipulada, sem perda de desempenho.

Satisfazendo estes critrios na extrao de caractersticas, ocorre o processo de


treinamento, durante o qual apresenta-se repetidamente ao classificador um conjunto de
padres de entrada juntamente com a categoria qual cada padro apresentado pertence.
Posteriormente, na etapa de testes apresenta-se um novo padro que pertence mesma
populao de padres utilizada no treinamento. O classificador deve ser capaz de identificar a
classe daquele padro particular, pela informao que ele extraiu dos dados de treinamento.
A fase de aprendizado uma etapa muito importante do sistema de verificao. Se
realizada adequadamente os modelos oriundos dessa fase possuem um conjunto rico de
informaes que permitem uma boa preciso do processo de verificao. Esta etapa possibilita
a eliminao de redundncias, o que por sua vez, propicia uma reduo do tempo gasto no
processo de deciso.
De acordo com Haykin [HAYKIN, 2001], os seres humanos tm habilidades inerentes
ao reconhecimento de padres, pois recebem dados do mundo a sua volta atravs dos sentidos
e so capazes de reconhecer a fonte dos dados, quase que imediatamente e sem esforo. Eles
podem, por exemplo, reconhecer um rosto familiar de uma pessoa, muito embora esta pessoa
tenha envelhecido.
Em termos conceituais, Haykin [HAYKIN, 2001] define que um padro
representado por um conjunto de m observaes, que pode ser visto como um ponto x de um
espao de observaes (de dados) m-dimensional. A extrao de caractersticas descrita por
uma transformao que mapeia o ponto x para um ponto intermedirio y no espao de
caractersticas q-dimensional, com q < m, como indicado na Figura 2.1.

10

Extrao
de
Caractersticas

Espao de observao
m-dimensional

Classificao

Espao de caractersticas
q-dimensional

Espao de deciso
r-dimensional

Figura 2.1: Modelo genrico de mtodo de reconhecimento de padres


Esta transformao pode ser vista como uma reduo de dimensionalidade
(compresso de dados), cuja utilizao justificada por simplificar a tarefa de classificao. A
prpria classificao descrita como uma transformao que mapeia o ponto intermedirio y
para uma das classes em um espao de deciso r-dimensional, em que r o nmero de classes
a ser distinguida.

2.2. Tipos de Abordagens na Verificao de Assinaturas

As abordagens relacionadas verificao automtica de assinaturas esto diretamente


ligadas ao mecanismo de aquisio de dados. Se o processo de verificao ocorre no mesmo
tempo em que a assinatura escrita, o mtodo dito on-line ou dinmico, neste caso h
necessidade de um dispositivo de acesso especial para processamento quando a assinatura
produzida. Quando as informaes so inicialmente adquiridas provavelmente de uma folha
de papel por um digitalizador ou cmera para posterior anlise da imagem, o mtodo dito
off-line ou esttico. A tarefa de verificao em sistemas off-line torna-se mais complexa que
em on-line, principalmente pela quantidade de informaes disponveis [CAVALCANTI et
al., 2002].
Os mtodos estticos apresentam duas classes de caractersticas extradas da imagem
de acordo com Justino [JUSTINO, 2001]. A classe primeira chamada de esttica, porque
possui a capacidade de representar as caractersticas relacionadas forma, como por exemplo,
o comprimento e a altura mxima de uma assinatura. A segunda classe chamada de

11

pseudodinmica, possui a capacidade de representar as caractersticas dinmicas da escrita


como tenso do traado, inclinao e presso. Mtodos baseados em caractersticas estticas
so usados geralmente para identificar falsificaes simples e aleatrias. A razo que estes
mtodos mostram-se mais aptos para descrever caractersticas relacionadas forma da
assinatura. J as abordagens pseudodinmicas so capazes de capturar detalhes da
movimentao da escrita, sendo portanto mais adequados para identificar falsificaes
habilidosas.
A abordagem usada para manipular caractersticas em uma imagem determina a
eficincia de um mtodo na resoluo do problema. De acordo com Justino [JUSTINO,
2001] tais mtodos podem ser:

Globais: os quais usam as caractersticas gerais da imagem, sendo mais insensveis


s variaes intrapessoais, porm com menor capacidade de distino de
falsificaes simuladas;

Locais: dependem de um processo de segmentao da imagem em partes a serem


analisadas, descrevendo a particularidade do traado e sendo mais eficientes na
identificao de todos os tipos de falsificaes.

A imagem de uma assinatura basicamente uma coleo de pontos distribudos sobre


uma rea bem definida e possuindo formas distintas.
As caractersticas globais, que podem capturar a natureza da distribuio destes pontos
no espao, so idealmente desejveis para aspectos mais grosseiros da assinatura. Estas
caractersticas no so capazes de capturar aspectos estruturais das imagens das assinaturas,
essenciais para a deteco de traos de falsificaes ou fotocpias, mas possuem poder
suficiente para discriminar e eliminar erros de substituio [BAJAJ & CHAUDHURY, 1996].
O diagrama hierrquico da Figura 2.2 demonstra a classificao dos mtodos de
verificao automtica de assinaturas, destacando os que fazem parte da abordagem proposta.

12

Tipos
Verificao de
Assinaturas

On-line

Off-line

Global

Esttico

Local

Pseudodinmico

Contextual

Esttico

No-contextual

Pseudodinmico

Figura 2.2: Diagrama hierrquico de classificao dos tipos de abordagens de verificao


de assinaturas.

2.3. Mtodos de Verificao

A escolha do tipo de representao (os tipos de primitivas) constitui uma etapa


essencial na elaborao de um mtodo de verificao. As dificuldades surgem principalmente
em relao maneira como so tratadas as entidades naturais usadas para obter a descrio
matemtica, induzida por um mtodo terico formal.
Essa induo possui dois reflexos: o dimensionamento do espao representativo do
fenmeno, que deve possuir propriedades para facilitar o processo de deciso, e a obteno de
um espao de representao que permita uma implementao computacional [JUSTINO,
2001].
Os dois tipos de mtodos formais mais comuns so:

13

Mtodos estruturais: buscam descrever informaes geomtricas de maneira


estrutural, representando formas complexas a partir de componentes elementares,
chamadas primitivas. Os mtodos estruturais distinguem-se basicamente em dois
grupos [JUSTINO, 2001]:
1. Mtodos estruturais propriamente ditos: a estrutura utilizada um grafo que
permite representar as formas, ou seja, as primitivas e as relaes entre elas. A
fase de deciso consiste na comparao do grafo representativo da forma do
modelo com o grafo da forma em teste;
2. Mtodos sintticos: a estrutura usada para codificar a forma em uma lista,
utilizando um alfabeto cujos componentes representam elementos da forma a
descrever. A fase de deciso consiste na anlise da lista com a ajuda de regras
sintticas, como as utilizadas em um texto escrito em uma linguagem natural.

Mtodos estatsticos: consistem em efetuar as medies do espao mtrico atravs


da estatstica. O aprendizado executado atravs da separao de um conjunto de
amostras em classes obedecendo a um conjunto de caractersticas comuns. A
modelagem estatstica se beneficia dos processos automticos. Os principais
mtodos estatsticos so os paramtricos e os no- paramtricos [JUSTINO, 2001]:
1. Paramtricos, trabalham com a hiptese de que as classes possuem uma
distribuio de probabilidade com comportamento determinado. O mtodo
supe o conhecimento prvio das leis que regem as probabilidades das classes
envolvidas e ainda que seus parmetros de estimao possuem normalmente um
comportamento gaussiano. Esses mtodos exigem uma base de dados de
aprendizado para uma correta estimao dos parmetros;
2. No-paramtricos, assumem que as leis de formao da probabilidade de uma
classe so desconhecidas. O problema consiste em propor algoritmos de
convergncia que determinem o limiar ideal de deciso.
Mais recentemente a neurocomputao, mais especificamente as redes neurais

artificiais, tem sido reconhecida como um mtodo para resolver problemas de reconhecimento
de padres [RASHA, 1994]. A computao neural surgiu da necessidade de entender como os
sistemas neurais biolgicos armazenavam e manipulavam a informao. importante
destacar que uma rede neural capaz de aprender as caractersticas estatsticas do ambiente
no qual ela opera, desde que os dados utilizados para o seu aprendizado sejam suficientemente
representativos do ambiente.

14

De acordo com Haykin [HAYKIN, 2001], o reconhecimento de padres realizado por


uma rede neural de natureza estatstica. Os padres so representados por pontos em um
espao de deciso multidimensional, dividido em regies, cada uma associada a uma classe.
As fronteiras de deciso so determinadas pelo processo de treinamento e sua construo
torna-se estatstica pela variao inerente que existe dentro das classes e entre as mesmas.
As redes neurais so capazes de estimar as probabilidades a posteriori, das quais
provm a base para estabelecer regras de classificao e anlise de desempenho estatstico
[ZHANG, 2000].

2.4. Teoria da Classificao Bayesiana

Esta teoria a base dos mtodos de classificao estatstica. Ela prov o modelo de
probabilidade fundamental para os procedimentos de classificao, como a anlise
discriminante estatstica [ZHANG, 2000]. Considera-se um problema geral de classificao
de M grupos no qual cada objeto tem um vetor de atributos x de dimenso d, em que w denota
a varivel membro que toma um valor wj se um objeto pertencente classe j. Define-se
P(wj) como a probabilidade a priori da classe j e f(x|wj) como a funo densidade de
probabilidade. De acordo com a regra de Bayes:
P( w | x) =
j

f ( x | w ) P( w )
j
j
f ( x)

(2.1)

P(wj|x) a probabilidade a posteriori da classe j dado o vetor x, e f(x) a funo densidade de


probabilidade:
f ( x) = M f ( x | w ) P( w )
j =1
j
j

(2.2)

Supondo que um objeto com um vetor de caractersticas x observado e uma deciso feita
sobre sua classe, a probabilidade do erro de classificao :
P( Erro | x) = P ( wi | x ) = 1 P( w j | x) ,considerando que j a classe correta. (2.3)
i j

Conseqentemente, se o propsito minimizar a probabilidade do erro de classificao total


(taxa de m classificao), temos a regra Bayesiana de classificao:

15

Decida wk para x se P ( wk | x) = max P ( wi =1, 2,...,M | X )

(2.4)

A interpretao das sadas de redes neurais como probabilidades Bayesiana permite


que as sadas de mltiplas redes possam ser combinadas para melhorar o nvel de deciso,
simplificando a criao de limiares de rejeio, desde que certas condies sejam satisfeitas:

Hajam elementos de processamentos suficientes para realizar o mapeamento;

Hajam dados em quantidade e qualidade;

A aprendizagem convirja para o mximo global;

As sadas estejam entre 0 e 1 com

= 1.

Classificadores estatsticos so baseados na teoria de deciso de Bayes, e o fato de que


redes neurais podem prover estimativas de probabilidades a posteriori implicitamente
estabelecem uma ligao entre redes neurais e classificadores estatsticos. A direta
comparao entre eles pode no ser possvel porque as redes neurais so mtodos de modelos
livres no-lineares enquanto que os mtodos estatsticos so basicamente lineares e baseados
no modelo, de acordo com Zhang [ZHANG, 2000].
Atravs da codificao apropriada dos valores de sada a rede neural pode modelar
diretamente algumas funes discriminantes. Assim, o vetor de caracterstica de entrada
mapeado em um valor associado com uma classe particular. Por exemplo, em um problema de
classificao binria, a sada desejada codificada como 1 sendo o dado da classe w1 e 1 se
ele da classe w2. Ento a rede neural estima a seguinte funo discriminante g(x) [DUDA &
HART, 1973]:
g(x) = P(w1 |x) P(w2 |x)

(2.5)

A regra discriminante simples: associar x para w1 se g(x) > 0 ou para w2 se g(x) < 0.
Qualquer aumento na funo de probabilidade a posteriori pode ser usado para alterar a
equao (2.5) para formar uma funo discriminante diferente, mas essencialmente a mesma
regra de classificao.

2.4.1. Teoria de Deciso Bayesiana

De acordo com Fumera [FUMERA et al., 2000], um classificador N-classes


apontado para subdividir o espao de caractersticas em N regies de deciso Di, i = 1,...,N, tal
que os padres da classe wi pertencem regio Di. Conforme a teoria de reconhecimento de

16

padres estatsticos, tal regio de deciso definida para maximizar a probabilidade do


correto reconhecimento, ou seja, a preciso do classificador, e conseqentemente minimizar a
probabilidade do erro do classificador. Para este fim, a regra de deciso de Bayes associa a
cada padro x a classe para a qual a probabilidade a posteriori P(wi|x) mxima.
Uma otimizao da probabilidade da taxa de erro provida pela regra de Bayes pode ser
obtida usando a opo de rejeio, de acordo com Fumera [FUMERA et al., 2000].
Neste sentido, os padres com maior probabilidade de serem mal classificados so
rejeitados, ou no classificados, e manuseados com procedimentos mais sofisticados.
Entretanto, altas taxas de rejeies geralmente consomem muito tempo em aplicaes
prticas. Desta forma um consenso entre erro e rejeio necessrio.
A formulao do melhor ponto entre erro-rejeio, ou seja, a regra de rejeio tima,
apresentada por Chow [FUMERA et al., 2000]. Segundo esta regra um padro rejeitado se:
max P( wk | x) = P( wi | x) < T ,

k =1,..., N

(2.6)

onde T   !#"%$'&($)"*!,+.-/$(0&1$)- " o x aceito e associado para a classe w, se


max P( wk | x) = P( wi | x) T ,

k =1,..., N

(2.7)

O espao de caractersticas , portanto, subdividido em N + 1 regies. A regio de


rejeio Do definida de acordo com a equao (2.6), enquanto as regies de deciso
D1,....,Dn so definidas de acordo com a equao (2.7).
A regra de rejeio de Chow [FUMERA et al., 2000], desta forma, prov um timo
ponto de erro-rejeio, somente se as probabilidades a posteriori das classes dos dados forem
exatamente conhecidas. Infelizmente em aplicaes prticas tais probabilidades so afetadas
por estimativas de erros. Desta forma, Fumera [FUMERA et al., 2000] prope o uso de
mltiplos limiares de rejeio. A tarefa de classificao com N classes de dados
caracterizada pela probabilidade a posteriori estimada P( wi | x), i = 1,..., N . Um padro x
rejeitado se:
max P( wk | x ) = P( wi | x) < Ti ,

k =1,..., N

(2.8)

enquanto ele aceito e associado classe wi, se:


max P ( wk | x) = P ( wi | x) Ti

k =1,..., N

(2.9)

17

2.5. Redes Neurais Artificiais

Um sistema neural artificial bsico composto de neurnios agrupados em camadas.


Um neurnio artificial pode consistir de valores de entradas, pesos, um valor limiar, e uma
sada [WILSON, 1999]. O modelo de neurnio artificial i, denominado perceptron, pode ser
visualizado na Figura 2.3. O modelo consiste de um combinador linear seguido por uma
unidade no-linear. O combinador consiste em uma srie de sinapses ou conexes
(parmetros ajustveis) conectadas aos respectivos terminais de entrada, cujas sadas
ponderadas so combinadas em um somador. Nesse somador tambm conectado, como
entrada, um sinal externo de polarizao tambm conhecido como bias b. O bias tem o efeito
de aumentar ou diminuir a entrada lquida da funo de ativao, dependendo dela ser positiva
ou negativa, respectivamente. A sada do somador, denominada de neti, a entrada da unidade
no-linear ou funo de ativao contnua e diferenvel [HAYKIN, 2001].
x1

p1

x2
.
.
.
.
xn

p2

neti

f(neti)

yi

Unidade no-linear
p0 = b

wn

x0 = 1
Combinador linear
Figura 2.3: Modelo simplificado de um neurnio.
O modelo do neurnio identificado pela caracterstica de sua unidade no-linear:
n
net = p x + b
i
i i
i =1

(2.10)

sendo f(neti) a funo de ativao, xi o conjunto de entradas e pi os pesos de cada uma das
entradas.Algumas funes de ativao utilizadas so:
linear: idn( x) = x

(2.11)

+ 1, se x > 1
saturao: sat ( x) = x, se 1 x 1
1, se x < 1

(2.12)

18

+ 1, se x > 1
sinal: sign( x) =
1, se x < 1
tangente hiperblica: tanh(x) =

sigmide: sig(x) =

(2.13)
e x e x
e x + e x

1 e x
1 + e x

(2.14)

(2.15)

A funo sigmoidal, que a mais usada, possui esse nome devido ao formato em S
(letra grega sigma) da funo de ativao. Ela uma funo de fcil tratamento matemtico, e
usada em uma classe de redes neurais denominada MLP (Multilayer Perceptron), a qual
utiliza o algoritmo de treinamento chamado algoritmo de Propagao Reversa
(Backpropagation algortihm). A rede MLP corresponde a um modelo com unidades de
processamento dispostas em camadas que se interconectam, uma aps a outra, chegando at
uma camada de sada. Com este algoritmo, o aprendizado ocorre de tal forma que os erros so
inicialmente computados na camada de sada e ento so consecutivamente computados nas
camadas anteriores: da o nome backpropagation [HAYKIN, 2001].

2.5.1. Perceptron Multicamadas

O Perceptron Multicamadas (MLP) uma rede neural que consiste de uma camada de
ns de entrada, uma ou mais camadas de ns-processadores ou computacionais (neurnios)
ocultos ou escondidos e uma camada de sada tambm composta por ns computacionais. Os
ns-fontes so utilizados para aplicao do sinal de entrada e os neurnios das camadas
ocultas agem como detectores de caractersticas. Esses neurnios so ditos ocultos, pois eles
so fisicamente inacessveis pelas entradas ou pela sada da rede. Os neurnios de sada
fornecem as respostas de rede neural aos sinais de entrada a ela apresentada [PRINCIPE et al.,
2000].
O nmero de ns-fonte na camada de entrada determinado pela dimenso do espao
de observao que responsvel pela gerao dos sinais de entrada. O nmero de nscomputacionais na camada de sada determinado pela dimenso da resposta desejada.
Assim, o projeto de uma MLP requer a preocupao em pelo menos trs aspectos
[WALCZAK & CERPA, 1999]:

A determinao do nmero de camadas ocultas;

19

A determinao do nmero de neurnios em cada uma das camadas ocultas;

A especificao dos pesos ou ponderaes em cada sinapse que conecta os


neurnios.

O primeiro e o segundo itens esto relacionados com a complexidade da rede neural. A


determinao dos pesos nas sinapses tarefa para um algoritmo prprio, por exemplo, o
algoritmo backpropagation. Essa determinao dos pesos pode ser vista como o
armazenamento de informaes do contedo dos dados utilizados no processo de treinamento,
quando acontece o aprendizado, nos pesos das sinapses.

2.5.2. Melhorias de Desempenho da Rede Neural

Walczak e Cerpa [WALCZAK & CERPA, 1999] descrevem que o projeto de uma
rede neural uma problemtica na qual existe um grande nmero de arquiteturas fsicas
alternativas de redes neurais e mtodos de treinamento que podem ser aplicados para um dado
problema de negcios. O objetivo incorporar uma quantia significativa de conhecimento
dentro do projeto de redes neurais mesmo antes do processo de aprendizagem ter comeado.
O desempenho da generalizao de aprendizagem supervisionada de redes neurais
backpropagation geralmente melhora quando o tamanho da rede minimizado com respeito
aos pesos das conexes entre ns de processamento (elementos de entrada, escondidos, e
camadas de sada). As seguintes situaes resultam em uma pobre generalizao das
amostras: redes que so grandes demais tendem para a memorizao dos dados de entrada e
redes com poucas conexes no contm elementos de processamento suficiente para
corretamente modelar o conjunto de dados de entrada.
De acordo com Lippmann [LIPPMANN, 1987], o nmero de ns deve ser grande o
suficiente para formar uma regio de deciso que seja to complexa quanto requerido pelos
dados do problema, porm no deve ser to grande a ponto de muitos pesos no serem
confiveis. Dentro deste contexto, a seleo de variveis de entrada uma importante e
complexa tarefa para o projeto de redes neurais.
As redes neurais melhoram o desempenho com domnio adicional de conhecimento
provido atravs de variveis de entrada. Se uma quantia suficiente de informao
representando o critrio de deciso crtica no dada para uma rede neural, ento a mesma
no pode desenvolver um correto modelo do domnio. comum acreditar que a aprendizagem

20

em redes neurais capaz de determinar variveis de entrada que so importantes e


desenvolver um correspondente modelo atravs da modificao de pesos associados s
conexes entre as camadas de entrada e camadas escondidas.
Walczak e Cerpa [WALCZAK & CERPA, 1999] estabelecem que o primeiro passo
para determinar o conjunto timo de variveis de entrada voltado para o desempenho de
aquisio de conhecimento padro. O propsito primrio da aquisio do conhecimento para
garantir que o conjunto das variveis de entrada esteja suficientemente especificado, provendo
o critrio de todos os domnios relevantes para a rede. Se duas variveis tm uma alta
correlao, ento uma destas duas variveis pode ser removida do conjunto de variveis sem
afetar o desempenho da rede.
Em Petersen [PETERSEN et al., 2002] discutido o problema que envolve um grande
nmero de dimenses de entrada na classificao em processamento de imagens,
especialmente quando os algoritmos so aplicados diretamente nos pixels dos dados.
O projeto de camadas escondidas depende da seleo do algoritmo de aprendizagem.
Por exemplo, mtodos de aprendizagem no supervisionada tais como ART normalmente
requerem que a quantidade de ns da primeira camada escondida seja igual ao tamanho da
camada de entrada. J mtodos supervisionados so geralmente mais flexveis no projeto de
camadas escondidas [WALCZAK & CERPA, 1999].
Embora seja possvel projetar uma rede neural sem camadas escondidas, este tipo de
rede pode somente classificar dados de entrada que so linearmente separveis, os quais
limitam severamente suas aplicaes. Redes neurais artificiais que contm camadas
escondidas tm a habilidade para lidar de forma robusta com a no-linearidade e problemas
complexos e, portanto, podem operar em problemas mais interessantes. possvel especificar,
de forma geral, a quantidade de camadas escondidas correspondente complexidade do
domnio do problema a ser resolvido. Redes simples sem camadas escondidas criam um
hiperplano. J uma camada escondida combina hiperplanos de forma convexa nas reas de
deciso e duas camadas escondidas na rede combinam reas de deciso de forma convexa que
contm regies cncavas.
Uma interpretao geomtrica adotada e modificada de Lippmann [LIPPMANN,
1987] na Figura 2.4 demonstra a capacidade do perceptron em separar regies de deciso com
uma, duas e trs camadas em um espao bidimensional. A segunda coluna desta figura indica
o tipo de deciso que pode ser formada com diferentes redes. As prximas duas colunas
apresentam regies de deciso, as quais representam o problema do OU exclusivo e regies

21

misturadas. Um simples perceptron pode formar somente a metade das regies de deciso,
desta forma no capaz de solucionar problemas que no sejam linearmente separveis,
conforme a primeira linha da Figura 2.4, j uma rede com uma camada escondida pode formar
limites de deciso mais complexos como mostrado na segunda linha da Figura 2.4.

Estrutura em
Camadas
Escondidas

Descrio da
Regio de Deciso

Problema do OU
exclusivo

Classes com regies


misturadas

Metade do plano
limitado pelo
hiperplano
Simples

Regies abertas
Uma
Complexidade
limitada pelo
nmero de unidades
escondidas
Duas
Figura 2.4: Interpretao geomtrica das regras de unidades escondidas em um espao bidimensional de acordo com Lippmann [LIPPMANN, 1987].
Na Figura 2.4 uma anlise feita com relao ao nmero de camadas e ns de acordo
com Lippmann [LIPPMANN, 1987]. Em relao ao nmero de ns, dois ns so suficientes
para resolver o OU exclusivo como na segunda linha da Figura 2.4. Mas na quarta coluna
demonstrado que nenhum nmero de ns com uma camada escondida pode separar as classes
com regies misturadas. Um perceptron com duas camadas escondidas forma arbitrariamente
regies de decises complexas e separa as classes com regies misturadas conforme a terceira
linha da Figura 2.4. A anlise acima demonstra que no mais que duas camadas escondidas
so requeridas no perceptron como redes feedforward pelo fato de uma rede com duas
camadas escondidas gerar arbitrariamente regies de deciso complexas.
Uma heurstica para determinar a quantidade de camadas escondidas requerida por
uma rede neural proposta por Walczak e Cerpa [WALCZAK & CERPA, 1999], o qual

22

acredita que com o aumento da dimensionalidade do espao do domnio do problema, o


nmero de camadas escondidas deveria aumentar correspondentemente. O nmero de
camadas escondidas heuristicamente determinado pelo nmero de passos intermedirios,
dependente da categorizao prvia, para transportar as variveis de entrada em um valor de
sada. Portanto, o domnio de um problema que tem uma soluo de uma equao no-linear
padro possivelmente resolvvel por uma rede neural com uma simples camada escondida.
Uma regra estabelecida com relao quantidade de camadas escondidas que uma
grande quantidade delas habilita a rede neural a melhorar sua proximidade de ajuste, enquanto
uma pequena quantidade melhora a suavidade ou a capacidade de extrapolao da rede.
Para se escolher o nmero de ns a ser includo em uma camada escondia, deve-se
levar em conta o tempo e a preciso do treinamento. Um grande nmero de ns nas camadas
escondidas resulta em um perodo mais longo de treinamento, enquanto que poucos ns
provm um treinamento mais rpido, pelo custo de se ter um detector de caracterstica menor.
Muitos ns escondidos em uma rede habilita a mesma a memorizar o conjunto de
dados de treinamento, produzindo um pobre desempenho de generalizao. Walczak e Cerpa
[WALCZAK & CERPA, 1999] descrevem algumas heursticas existentes para selecionar a
quantidade de ns escondidos para uma rede tal como: usar 75% da quantidade de ns de
entrada, usar 50% da quantidade de entrada e sada, ou usar 2n + 1 ns na camada escondida
em que n seria o nmero de ns na camada de entrada. Estas heursticas de algoritmos no
utilizam domnio do conhecimento para estimar a quantidade de ns escondidos e podem no
ser as mais produtivas.
De acordo com Fujita [FUJITA, 1998], o nmero de unidades escondidas em uma rede
neural feedfoward significante na caracterizao do desempenho da rede. Ela influencia a
capacidade da rede, a habilidade da generalizao, a velocidade de aprendizagem e, ainda, a
resposta de sada.
Normalmente ocorre que uma rede tem um desempenho pobre at um nmero
suficiente de unidades escondidas que representam a correlao entre o vetor de entrada e os
valores de sada desejada, e com o aumento do nmero de unidades escondidas alm do
suficiente, aumenta-se o tempo de treinamento sem um correspondente aumento na preciso
da sada.

23

2.5.3. Aprendizagem em Redes MLP

Um processo de aprendizagem na rede neural pode ser visto como um problema de


alterar a arquitetura da rede e as conexes de pesos, tal que a rede neural possa eficientemente
aprender. Desta forma a rede geralmente adquire conhecimento baseado nas conexes de
pesos dos padres de treinamento disponveis. A habilidade das redes neurais, para
automaticamente aprenderem, baseadas em padres, faz delas uma rea excitante e atrativa.
Ao invs de seguir um conjunto de regras especificado por peritos humanos, a rede neural
trata a aprendizagem baseada em regras de relao de entrada-sada de uma dada coleo de
exemplos representativos. Esta uma das maiores vantagens da rede neural sobre sistemas de
tradicionais.
Para entender ou projetar um processo de aprendizagem, deve-se primeiro ter um
modelo de ambiente no qual uma rede neural opera, isto , identificar qual informao est
disponvel para a rede, o que seria um paradigma de aprendizagem. Em segundo deve-se
entender como os pesos da rede so atualizados, ou seja, qual regra de aprendizagem governa
o processo de atualizao. Um algoritmo de aprendizagem se refere a um procedimento no
qual regras de aprendizagem so usadas para ajustar os pesos.
H trs principais paradigmas de aprendizagem [RASHA, 1994]: supervisionado, nosupervisionado e hbrido. No supervisionado a rede provida com a resposta correta na sada
para cada padro de entrada. Pesos so determinados para permitir rede produzir respostas
to prximas quanto possveis para as respostas corretas conhecidas. Aprendizagem por
reforo uma variao de aprendizagem supervisionada na qual basicamente a rede provida
somente com uma crtica (de fortalecimento ou enfraquecimento) na sada da rede.
Em contrapartida, a aprendizagem no-supervisionada no requer uma resposta correta
associada com cada padro de entrada no conjunto de dados da aprendizagem. Ela explora a
estrutura dos dados, ou correlao entre dados nos padres, e organiza os padres dentro de
categorias desta correlao.
Aprendizagem hbrida combina aprendizagem supervisionada e no-supervisionada.
Parte dos pesos so geralmente determinados por aprendizagem supervisionada, enquanto
outros so obtidos atravs de aprendizagem no-supervisionada.
A teoria da aprendizagem deve enderear trs vises fundamentais e prticas
associadas com a aprendizagem das amostras: capacidade; complexidade das amostras, e

24

complexidade computacional. A capacidade se preocupa em compreender como muitos


padres podem ser armazenados, e tambm que funes e limites de deciso uma rede pode
formar. A complexidade das amostras determina o nmero de padres de treinamento
necessrios para treinar a rede para garantir uma generalizao vlida A complexidade
computacional refere-se ao tempo requerido para um algoritmo de aprendizagem estimar uma
soluo de padres de treinamento.

2.5.3.1. Balanceamento de classes em redes MLP

Lawrence [LAWRENCE et al., 1998] tentam confrontar a idia de que em mtodos de


classificao que utilizam redes MLP h problemas em relao s probabilidades a priori de
classes individuais. Se o nmero de exemplos de treinamento que corresponde a cada classe
variar significantemente entre as classes, a estimao precisa de uma probabilidade Bayesiana
a posteriori requer que a rede seja: grande o suficiente, que o treinamento convirja para um
mnimo global, possua dados de treinamento infinito, e que a probabilidade da classe a priori
do conjunto de teste seja corretamente representada no conjunto de treinamento. Se o nmero
de exemplos de treinamento para cada classe variar significantemente entre as classes, ento
h necessidade de um bias para predizer a classe mais comum, podendo conduzir a um pior
desempenho de classificao para as classes mais raras.
Lawrence [LAWRENCE et al., 1998] citam que em alguns problemas de classes com
baixa probabilidade a priori, nenhuma amostra foi classificada como estas classes depois do
treinamento, concluindo que os problemas de balanceamento indicam que ou a estimao de
probabilidade a posteriori Bayesiana imprecisa, ou que tal estimao pode no ser a
desejada.
Um mtodo simples para aliviar esta dificuldade de desigualdade das probabilidades a
priori das classes de acordo com Lawrence [LAWRENCE et al., 1998] ajustar o nmero de
padres em cada classe, ou por sub-amostragem, neste caso removendo padres de classes de
alta freqncia, ou por duplicao de padres em classes de baixa freqncia. Por subamostragem, padres podem ser removidos aleatoriamente, ou heuristicamente removendo
padres em regies de baixa ambigidade. A sub-amostragem envolve uma perda de
informao que pode ser prejudicial. J a duplicao envolve uma grande base de dados e um
maior tempo de treinamento para o mesmo nmero de pocas de treinamento (tempo de
convergncia pode ser maior ou menor).

25

Chan e Stolfo [CHAN & STOLFO, 1998] demonstram que a distribuio das classes,
no treinamento, afetam o desempenho dos classificadores e a distribuio natural pode ser
diferente da distribuio desejada do treinamento as quais maximizam o desempenho.
Japkowicz [JAPKOWICZ, 2000] tenta demonstrar que nem sempre os diferentes tipos
de desbalanceamento de dados afetam o desempenho da classificao, assim como Weiss e
Provost [WEISS & PROVOST, 2001] demonstram que conjuntos de dados balanceados nem
sempre produzem os melhores resultados. Japkowicz demonstra que alguns mtodos podem
contornar problemas de balanceamento como:

upsizing, mtodo em que a classe representada por um pequeno conjunto de


dados aumentado, tal que se iguala ao tamanho da classe majoritria.

downsizing, mtodo, em que a classe representada por um grande conjunto de


dados pode ser diminuda para igualar o tamanho da classe majoritria.

A concluso de Japkowicz [JAPKOWICZ, 2000] que o tamanho do conjunto de


treinamento, com dados que so linearmente separveis parecem ser insensitivos ao
desbalanceamento, porm medida que a complexidade aumenta o sistema torna-se sensitivo
ao desbalanceamento de dados. Outra concluso que medida que o tamanho do conjunto
de treinamento aumenta, o grau de desbalanceamento tender a diminuir a taxa de erro. Isto
sugere que em grandes domnios, o problema do balanceamento de classes pode no ser um
impedimento para sistemas de classificao.
Especificamente, a viso da relativa cardinalidade de duas classes, que
freqentemente um problema relacionado ao desbalanceamento de classes, pode de fato ser
facilmente superado pelo uso de um grande conjunto de dados. Desta forma, o estudo de
Japkowicz aponta que o desbalanceamento um problema relativo dependente da
complexidade do problema, representado pelos dados no qual o balanceamento ocorre, como
tambm pelo tamanho global do conjunto de treinamento, em adio ao grau de
balanceamento das classes presente nos dados.
Rasha [RASHA, 1994] e Lee [LEE, 1995] utilizam conjuntos com diferentes
cardinalidades de amostras para cada classe durante a fase de treinamento em abordagens de
verificao de assinaturas utilizando redes neurais. Lee [LEE, 1995] em experimentos com
conjuntos de cardinalidades diferentes revela o desempenho superior com a incorporao de
falsificaes aleatrias na fase de aprendizagem, porm com amostras desbalanceadas.

26

2.5.3.2. Consideraes sobre o treinamento em redes MLP

De acordo com Rasha [RASHA, 1994] muitos esforos so requeridos para projetar
uma rede neural MLP. Durante o treinamento, pode-se notar que a estratgia de ajustar os
pesos torna-se um processo muito lento, podendo permanecer em um mnimo local, ou
tornando-se instvel e oscilando entre solues. A seguir so apresentados alguns parmetros
de treinamento a serem considerados:

Treinamento por padro ou por poca: Quando se treina a rede, o erro calculado e
cada unidade na rede tem seus pesos ajustados tal que ele reduz o valor da funo de
erro. Os pesos da rede podem ser ajustados para cada padro de treinamento e
conseqentemente implementa-se o treinamento por padro. Uma alternativa treinar
por poca. Uma poca uma varredura de todos os padres no conjunto de
treinamento. Conseqentemente, uma correo acumulada do conjunto de pesos
executada depois de cada poca de treinamento. Mtodos de treinamento intermedirio
ou hbrido tambm so possveis;

Baixando a constante de aprendizagem 2 : 2 a aprendizagem (ou termo de ganho) que


especifica a largura do passo de treinamento. Se o termo de ganho comear com
valores grandes, grandes sero os passos em relao aos pesos e superfcie de erro para
a soluo. Se a superfcie mudar rapidamente, um grande ganho pode causar uma
oscilao no sistema, que poder demorar ou impedir a convergncia. Em
contrapartida, se a superfcie relativamente suave, ento haver um grande ganho de
velocidade de convergncia;

Vetores de treinamento em ordem seqencial ou aleatria: este parmetro importante


para otimizar a aprendizagem para que vrios padres sejam apresentados em
diferentes ordens em diferentes ciclos. Pensando em alguns problemas, valido
destacar que uma ordem seqencial de vetores de treinamento pode ser requerida para
enfatizar certas propriedades, mas uma ordem aleatria de vetores de treinamentos
geralmente indicada.

Supertreinamento (Overtraining): uma importante questo a ser considerada quando


parar o treinamento. Se a rede treinada demasiadamente, o erro minimizado por
organizar os discriminantes muito especificamente, para o conjunto de treinamento.
Desde que um conjunto de treinamento contenha apenas uma frao de exemplos
possveis de uma classe, estes discriminantes seriam firmemente focados em

27

caractersticas particulares do conjunto de treinamento. Quando tal rede for usada para
classificar amostras que no foram utilizadas no treinamento, estes discriminantes
altamente especficos tem uma pobre generalizao e executam com menos preciso
que uma rede que no foi supertreinada. Uma maneira para superar este problema
quebrar o treinamento em dois conjuntos. A primeira parte usada para treinar de
modo habitual. A segunda parte usada a cada n ciclos para controlar a curva de
aprendizagem. Quando o erro comear a subir neste segundo conjunto o treinamento
interrompido, e a rede testada pelo conjunto de teste. Outra maneira de parar o
treinamento escolher um valor de erro e esperar que o valor seja atingido, o que pode
causar uma sub-ajuste (underfitting) ou um sobre-ajuste (overfitting).
De acordo com Moody [MOODY, 1994] mais fcil ocorrer um sobre-ajuste no
treinamento com um conjunto pequeno de treinamento. Desta forma, deve-se tomar cuidado
para no selecionar um modelo que seja grande demais, pois o mesmo resulta em um longo
tempo de convergncia e o desempenho global conseqentemente nunca perfeito.
Tambm conjuntos de dados limitados fazem a estimao do risco de predio mais
difcil, se no houver dados suficientes disponveis. Nestas situaes, preciso usar
abordagens alternativas que habilitem a estimao do risco de predio dos dados
separadamente como a re-amostragem, usando, por exemplo, validao cruzada tipo kparties [PLUTOWSKI, 1996].
O erro esperado do treinamento e teste com relao bias / variana para amostras
finitas de treinamento ilustrada na Figura 2.5. De acordo com Zhang [ZHANG, 2000] bias e
variana so, na maioria das vezes, incompatveis. Com um conjunto de dados fixado, o
esforo em reduzir um implicar no aumento do outro.
Um bom compromisso entre bias e variana necessrio para construir um
classificador baseado em redes neurais. Na Figura 2.5 notam-se regies de sub-ajuste (bias
elevado) e de sobre-ajuste (varincia), em que tcnicas de seleo do modelo ideal tentam
encontrar o ponto timo entre falta e excesso de treinamento, os quais correspondem a um
mnimo global dos erros do conjunto de teste ou curva de risco de predio.

28

Erro

Sub-ajuste

Sobre-ajuste
Conjunto de teste

Conjunto de treinamento
Tempo do Treinamento

Modelo Ideal

Figura 2.5: Curvas de aprendizagem com relao ao excesso ou falta de treinamento.

2.5.3.3. Estimando o desempenho de redes MLP

O objetivo de qualquer problema de classificao classificar e predizer com sucesso


um novo dado. Entretanto, na maioria das formulaes prticas uma regra de classificao
pode no lidar perfeitamente com este problema. H sempre a probabilidade de um erro de
classificao. Um erro uma m classificao: ao classificador apresentado um caso e ele
classifica-o incorretamente. Uma razo para isto o fato de existirem caractersticas comuns
para duas ou mais classes. Por exemplo, uma curva de distribuio normal de duas classes,
disposta conforme Figura 2.6 de acordo com Rasha [RASHA, 1994].

p(x|wi)
p(x|w1)

p(x|w2)

Figura 2.6: Probabilidade do erro para um problema de duas classes.

29

As probabilidades do erro de classificao conforme a Figura 2.6 podem, por exemplo, ser
calculadas como:

P(erro) = P(escolher w1 e x pertencer w2) + P(escolher w2 e x pertencer w1)

(2.16)

Em geral nos problemas de classificao de padres pode haver dois tipos de erros de
classificao:

Falsa rejeio: o padro de entrada um membro da classe e incorretamente


classificado como no-mem5/6%798:<;>=.:??A@/BDC E(FHGJI.K>L/MNFPO QSRTM%U'V/M%UWUXEYFZF<[F\#WFHM%U]UI o
para a classe w2 ^ U`_HM%UXV/M%U WAUXEY,FaF`[bF>\#WAFcM%U%]dUI o para classe w1;

Falsa aceitao: o padro de entrada no um membro da classe e incorretamente

e \fF>WdWIf[I e Fgh e h ijhHi<U'iZk/M%hHg/F e \.F WWUlQ/m0E(F`GJI.K>L/M%FaO .6 representa a falsa aceitao para


a classe w1 ^ Ua_nM%U)VMNUWUXElY,F`Fa[F\#WF`F e U>IoYF o para classe w2.
Um limiar de deciso necessita ser estabelecido em qualquer problema de

classificao. Na Figura 2.6 T representa este limiar. A escolha segue os critrios para
minimizar a mdia do erro de falsa rejeio e falsa aceitao tentando minimizar o custo do
erro.
Para avaliar as medidas de desempenho que levem em conta a probabilidade de um
erro de classificao, a significncia e o custo de um erro, algumas medidas de desempenho
so necessrias como:

Taxa de erro aparente: a taxa de erro atual que o classificador aparentar, quando
aplicado para todos os casos desconhecidos que ele tratar. Se um nmero ilimitado de
classes estiver disponvel, a taxa de erro verdadeira ser computada como o nmero de
amostras infinitamente abordadas. Entretanto, em casos prticos, o nmero de
amostras disponveis finito, e relativamente pequeno. A taxa de erro aparente ou
emprica calculada, como notada na equao (2.17), como sendo o nmero de erros
feitos pelo classificador em relao ao nmero de amostras.

Taxa de erro aparente =

n erros
n amostras

(2.17)

Conseqentemente quanto maior o de nmero de amostras, a taxa aparente estar mais


prxima da taxa de erro verdadeira.

30

Matriz de confuso: uma matriz bi-dimensional usada para dispor os diferentes erros.
A Tabela 2.1 ilustra uma matriz de confuso para trs classes. A matriz de confuso
lista a correta classificao contra a classificao predita para cada classe. Enquanto os
elementos diagonais na matriz de confuso representam o nmero de classificaes
corretas, os elementos fora da diagonal representam o nmero de erros para um
particular tipo de erro de m classificao. Portanto uma matriz de confuso desejada
ter um valor mximo nos elementos diagonais e valor zero fora dela.
Tabela 2.1: Matriz de confuso de trs classes
Classes Preditas
1
2
3

1
50
0
0

Classes Verdadeiras
2
0
48
2

3
0
5
45

2.5.4. Mtodos de Validao do Processo de Aprendizagem

A essncia do aprendizado backpropagation codificar uma relao funcional entre


entradas e sadas representada por um conjunto de exemplos rotulados. A esperana que a
rede torne-se bem treinada, de modo que ela aprenda bastante sobre o passado, para poder
generalizar sobre o futuro. Sob esta perspectiva, o processo de aprendizado equivale a uma
escolha de parametrizao da rede para este conjunto de exemplos. Mais especificamente,
pode-se ver o problema de seleo da rede como sendo um problema de escolha, dentro de um
conjunto de estruturas de modelo candidatas (parametrizaes), de acordo com um certo
critrio. Dentro deste modelo, o mtodo holdout fornece um procedimento atrativo. Primeiro
o conjunto de dados disponvel particionado aleatoriamente em um conjunto de treinamento
e em um conjunto de teste. O conjunto de treinamento depois particionado em dois
conjuntos disjuntos: subconjunto de estimao, usado para selecionar o modelo; subconjunto
de validao, usado para testar ou validar o modelo. Comumente utiliza-se um conjunto de
validao para ajuste de parmetros, como critrio de parada tambm.
De acordo com Haykin [HAYKIN, 2001], o mtodo de validao com diviso em
duas partes (holdout validation) um dos mtodos mais comuns para estimar a generalizao
do erro. Este mtodo, tambm chamado de teste de estimativa simples, particiona o conjunto

31

de dados em dois subconjuntos mutuamente excludentes, chamados de conjunto de


treinamento e conjunto de teste. comum designar 2/3 do conjunto de dados para o conjunto
de treinamento e 1/3 para o conjunto de teste.
Provavelmente, a aplicao mais popular do mtodo holdout conhecida como parada
com validao [PLUTOWSKI, 1996], do ponto de mxima generalizao, e aplicvel para
todo o procedimento de treinamento interativo, pois a otimizao da aprendizagem ocorre em
pequenos passos com uma interatividade ocasionando a soluo sobre os conjuntos de
treinamento e validao. A forma bsica consiste em medir o erro sobre um conjunto de
validao aps cada peso atualizado, continuando este processo enquanto o erro estiver
decrementando, e parar quando o erro no conjunto de validao subir, ou se tornar estvel o
suficiente. Portanto, este mtodo otimiza parcialmente o critrio de aprendizagem no conjunto
de treinamento, e na verdade, tambm otimiza o critrio de aprendizagem no conjunto de
validao. Desta forma o conjunto de treinamento usado para prover informao
independente da regra de atualizao dos pesos. A parada com validao pode ser vista como
o modo regular a generalizao de um modelo durante o treinamento.
No mtodo holdout como parada com validao nota-se que o conjunto de validao
afeta o processo de aprendizagem. Portanto um terceiro conjunto de amostras independentes
torna-se necessrio (conjunto de teste) para obter uma estimativa precisa de desempenho de
generalizao do modelo treinado. Indiretamente com este mtodo ocorre o processo de
aprendizagem do conjunto de validao. Desta forma, para que se garanta que os dados de
teste no sejam usados, o mtodo de classificao opera com trs conjuntos: conjunto de
treinamento usado para construir a estrutura, conjunto de validao usado para otimizar ou
ajustar parmetros e tambm no critrio de parada e o conjunto de teste usado para avaliar o
desempenho.

2.6. SVM

Um problema encontrado em redes neurais artificiais, em especfico em redes MLP


inferir uma relao entre nmero de camadas escondidas e as classes, o qual determinado
heuristicamente. Uma alternativa para este problema pode ser o SVM (support vector
machine), pois representa o papel de classificador em problemas de reconhecimento de

32

padres e tem sido utilizado recentemente em vrios trabalhos relacionados a manuscritos


como em Justino [JUSTINO et al., 2003] e Kholmatov, [KHOLMATOV, 2003]
demonstrando alta performance com relao a ferramentas tradicionais de aprendizagem.
No SVM, os padres de entrada so transformados para um vetor de caractersticas de
alta dimensionalidade, cujo objetivo separar no espao as caractersticas linearmente. Neste
caso o problema da aprendizagem reduzido para o treinamento de um simples perceptron.
Uma vez que o espao adequado de caractersticas definido, o SVM seleciona o hiperplano
particular chamado hiperplano de margem mxima (MMH), o qual corresponde a maior
distncia de seus padres no conjunto de treinamento. Estes padres so chamados de vetores
de suporte (SV).
A idia principal separar as classes com superfcies que maximizem a margem entre
eles. A Figura 2.7 demonstra um conjunto de dados de duas classes w1 e w2 linearmente
separveis com margem de separao mxima p ou hiperplano de separao tima [OSUNA
et al., 1997].

w2
w1

hiperplano tim o

Figura 2.7: Margem de separao mxima para duas classes


linearmente separveis.
Para achar a superfcie de deciso tima, o algoritmo de treinamento dos vetores de
suporte tenta separar da melhor forma possvel os pontos de dados de ambas as classes, sendo
que os pontos mais perto do limite entre as duas classes so selecionados, por serem mais
importantes na soluo do que os pontos que esto mais longes, os quais ajudam a definir a
forma da melhor superfcie de deciso que outros pontos.
Problemas complexos exigem funes mais complexas de classificadores para a sua
soluo como um classificador polinomial, que forma superfcies de deciso diferenciadas

33

conforme a Figura 2.8. Os vetores de suporte so representados por pontos com


preenchimentos escuros.

Figura 2.8: Superfcie de deciso de um classificador polinomial.

De acordo com Mukkamalla [MUKKAMALLA et al., 2002], o SVM baseado na


idia de minimizao do risco estrutural, o qual minimiza o erro de generalizao, isto , erros
verdadeiros em amostras no-vistas. O nmero de parmetros livres usado no SVM depende
da margem que separa os pontos de dados, mas no do nmero de caractersticas de entrada
afim de evitar o sobre-ajuste.
O SVM prov um mecanismo genrico de preencher a superfcie de hiperplano por
dados atravs de uso de uma funo de kernel. O usurio pode prover uma funo, tal como
linear, polinomial, ou RBF, para o SVM durante o processo de treinamento, o qual seleciona
vetores de suporte ao longo da superfcie desta funo. Esta capacidade permite classificar
uma faixa de problemas maiores.
O limite de deciso entre duas classes definido pelo SVM:

f ( x) = sign y i i0 K ( xi , x) + bo
xi sv

(2.18)

onde x um padro de entrada; xi o ith vetor de suporte, SV o conjunto de vetores


de suporte; yi = 1 o rtulo do padro xi ; bo o bias do hiperplano; i0 o ith multiplicador
de Lagrange para o hiperplano timo; e finalmente K(xi,x) a funo do kernel, que pode
mapear se necessrio o dado de entrada para um alto espao dimensional, conhecido como
espao de caractersticas. A funo kernel escolhida a priori e determina o tipo de
classificador (linear, polinomial ou RBF). A Tabela. 2.2 aponta alguns kernels comumente
usados.
Tabela 2.2 Alguns kernels do SVM comumente usados.

34

Kernel
Linear

Expresso
K ( xi , x) = x.xi

Polinomial de grau d

K ( xi , x) = (1 + x.xi )

Gausseano RBF

K ( xi , x) = exp x xi

A idia bsica do SVM mapear um espao de entrada em um espao de


caractersticas de alta dimensionalidade. Este mapeamento pode ser feito linearmente ou no,
de acordo com a funo do kernel usada para o mapeamento. Neste novo espao de
caractersticas, o SVM constri hiperplanos timos atravs dos quais as classes so separadas
com objetivo de estabelecer uma margem maior entre cada classe e um erro mnimo na
classificao. O hiperplano timo pode ser escrito como uma combinao de poucos pontos
de caractersticas cujos pontos so chamados vetores de suportes do hiperplano timo
[KHOLMATOV, 2003].
O SVM baseado no princpio de minimizao do risco estrutural (SRM). O princpio
de induo (SRM) tem dois objetivos principais. Primeiro, controlar o risco emprico no
conjunto de dados de treinamento e segundo controlar a capacidade da funo de deciso
usada para obter o valor deste risco. A funo de deciso do SVM treinada linearmente f (xr )
descrita pelo vetor de pesos pr , um limiar b e padres de entrada xs :
f ( xt ) = sign( pt .xt + b)

(2.19)

Dado um conjunto de treinamento S1 composto por duas classes separadas, w1 (y1 = +1) e w2
(y1 = -1), o SVM acha o hiperplano com a mxima distncia euclidiana. De acordo com os
princpios do SRM, haver apenas um hiperplano timo com a margem mxima u , definida
como a soma das distncias do hiperplano para os pontos mais prximos das classes. Este
limiar do classificador linear o hiperplano timo separador, conforme j demonstrado na
Figura 2.7.
S1 = (( xt 1 , y1 ),...( xt l , y l )), xt 1 n , y1 { 1,+1}

(2.20)

No caso de conjuntos de treinamentos no-separveis, o ith ponto de dado tem uma


varivel v i inativa, a qual representa a magnitude do erro de classificao. Uma funo de
penalidade w1x#y z representa a soma dos erros da m classificao:

35

f ( ) =

(2.21)

i =1

A soluo do SVM [JUSTINO et al., 2003], pode ser encontrada se mantiver o limite
superior na dimenso VC (nmero de pontos mximo que pode ser separado para um
conjunto de dados), e por minimizar o limite superior no risco emprico, isto o nmero de
erros de treinamento, com a seguinte minimizao:
min
| =
w,b ,

n
1{ {
p. p + C i
2
i =1

(2.22)

sendo que C > 0, determina uma negociao entre o erro emprico e o termo de complexidade.
O parmetro C escolhido livremente. Um grande valor para C corresponde a uma associao
de uma penalidade mais alta para os erros.

2.7. Comentrios Finais

A teoria descrita neste captulo de fundamental importncia para a elaborao do


presente trabalho. Os tipos de abordagens e mtodos relacionados a verficao de assinaturas
fornecem uma viso clara do presente trabalho situando o mesmo no contexto de
reconhecimento de padres. A introduo a redes neurais e principalmente as dicas de
melhorias de desempenho das redes MLP relacionado a arquitetura da rede neural, so de
grande valia para o presente trabalho, assim como representa uma contribuio para trabalhos
futuros. A introduo ao SVM fornece subsdios para os experimentos realizados. No captulo
seguinte so descritas algumas abordagens relacionadas a verficao de assinaturas,
classificadas por tipos de abordagens.

Captulo 3

3. Estado da Arte na Autenticao de Assinaturas

Existe um nmero considervel de trabalhos [JUSTINO, 2001], [SABOURIN &


GENEST, 1994], [XIAO & LEEDHAM, 1999] e [BALTZAKIS & PAPAMARKOS, 2001]
sobre o problema de verificao de assinaturas. Por ser uma rea que atrai muitos
pesquisadores e sendo um problema ainda em aberto, a verificao automtica de assinaturas,
tanto on-line quanto off-line, possui trabalhos com abordagens distintas no que se refere a
caractersticas, classificador e mtodos usados. Neste captulo alguns trabalhos que se
relacionam com o tema so descritos separadamente por tipos de abordagens, assim como
uma viso crtica do estado da arte.

3.1. Abordagens Globais

Deng [DENG et al., 1999] apresentam um sistema de verificao de assinaturas offline baseado em funes wavelet, utilizando um algoritmo de perseguio de contorno
fechado para transformar as imagens de assinaturas em sinais unidimensionais. Os dados de
curvatura de contorno so decompostos em sinais multiresoluo usando transformada
wavelet. Alm disso, uma medida estatstica criada para decidir, sistematicamente, quais so
os contornos fechados e os dados de freqncias associados a estes contornos, demonstrando
quais autores so mais estveis e discriminantes relacionados a este critrio. Baseando-se
nestes dados, calculado um valor de limiar timo que controla a preciso do processo de
extrao de caractersticas. O sistema utiliza imagens binrias na extrao das caractersticas,
usadas tanto em sistemas on-line quanto em off-line. A base de dados usada por Deng [DENG
et al., 1999] composta de 50 autores cada um com 20 assinaturas genunas e 5 pessoas
fornecem 10 tipos de falsificaes dos 50 autores perfazendo um total de 3500 assinaturas.

37

Um outro mtodo proposto por Bajaj e Chaudhury [BAJAJ & CHAUDHURY, 1996]
utiliza trs caractersticas globais. O uso de caractersticas globais d-se pelo fato de que as
mesmas trabalhavam com a forma da imagem, provendo um mecanismo mais rpido de
acesso para os dados de assinatura, ao contrrio de caractersticas locais que requerem
tcnicas computacionalmente onerosas para a determinao de similaridade. Bajaj e
Chaudhury [BAJAJ & CHAUDHURY, 1996] usam momentos de projeo tambm usados
por Marar [MARAR et al., 2002] e Ribeiro e Vasconcelos [RIBEIRO & VASCONCELOS,
1999], a qual utiliza uma medida estatstica da distribuio dos pixels da assinatura e, ao
contrrio de outras caractersticas globais, relativamente insensvel a distores e variaes
de estilo. Um outro tipo de caracterstica, utilizado por Bajaj e Chaudhury [BAJAJ &
CHAUDHURY, 1996] est relacionado com a distribuio extrema de pixels envolvendo os
limites inferiores e superiores da assinatura, denominado envelopes. Para aumentar a
confiabilidade da classificao, os resultados obtidos das trs caractersticas so combinados
em mltiplos classificadores. A verificao feita com base no vetor destas 3 caractersticas
utilizando trs redes MLP. O uso de mltiplos classificadores introduz um elemento de
redundncia no esquema, pois os erros de classificao so compensados por um simples
classificador, se, claro, outros classificadores no proverem a correta deciso. As sadas dos
trs classificadores so combinadas para a deciso final, atravs da estratgia do vencedor
leva tudo. O mtodo tem a vantagem de combinar evidncias providas por diferentes tipos de
caractersticas, porque no caso da haver confuso na classificao quanto caracterstica
outro conjunto pode auxiliar. A base de dados usada no experimento composta por 10
autores, cada um provendo 15 assinaturas e somente 100 assinaturas aleatrias dos 10 autores.
Nota-se, tambm, que o modelo de redes neurais mais amplamente utilizado em
problemas relacionados verificao de assinaturas a rede MLP e o algoritmo
backpropagation, porm Ribeiro e Vasconcelos [RIBEIRO & VASCONCELOS, 1999]
utilizam arquiteturas construtivas (as quais constroem sua prpria estrutura incluindo
unidades e camadas intermedirias) Cascade-Correlation, Tower e Pyramid sob a abordagem
autoassociativa (em que as sadas so foradas a reproduzir as entradas) sendo os resultados
comparados com a rede MLP. Ribeiro e Vasconcelos acreditam que modelos de redes
feedforward que atuam como classificadores no so adequados, pois a discriminao de
classes neste tipo de rede realizada por superfcie de separao, a qual gerada para
particionar os dados de entrada. No entanto, tais superfcies so abertas. J as redes
feedforward que atuam como autoassociadores geram superfcies de separao fechadas, e

38

utilizam critrios de rejeio relacionados maneira com que a entrada se aproxima da sada.
Na extrao de caractersticas Ribeiro e Vasconcelos [RIBEIRO & VASCONCELOS, 1999]
utilizam momentos invariantes, inclinao e fator de presso global da imagem. Ao final o
resultado em uma base de dados reduzida com 21 autores demonstra algum ganho com
relao falsa rejeio, mas nenhum acrscimo falsa aceitao.

3.2. Abordagens Locais

O nmero de assinaturas genunas do mesmo autor no processo de treinamento tornase um problema na maioria dos mtodos propostos. Uma abordagem que procura minimizar
este problema proposta por Xiao e Leedham [XIAO & LEEDHAM, 1999], nesta abordagem
uma rede neural MLP usada como classificador. A base fundamental do mtodo reside no
fato que peritos forenses localizam primeiro as diferenas entre a assinatura de entrada e a
assinatura genuna armazenada, comparando caractersticas locais, ento analisam a variao
destas caractersticas julgando se as mesmas so essenciais ou acidentais. Neste estudo, Xiao
e Leedham [XIAO & LEEDHAM, 1999] tratam das partes estveis da assinatura, ou seja,
segmentos com menores variaes, como tambm dos ns de resposta do classificador. Para
alcanar estes objetivos, usado um mtodo para gerar falsificaes artificiais das assinaturas
genunas assim como uma rede neural com realimentao apropriada dos pesos dos ns de
resposta. Com relao s caractersticas, a distribuio dos pixels em quatro direes
utilizada dentro de um grid. Os resultados obtidos com poucos autores so aceitveis,
principalmente pelo nmero de assinaturas genunas utilizadas (em torno de 9), porm
conveniente ressaltar que 9 autores voluntrios so insuficientes para uma perfeita validao
estatstica.
Alguns trabalhos abordam o problema de falsificaes aleatrias [MURSHED et al.,
1995], em que o sistema treinado somente com assinaturas genunas. A alegao que na
prtica nem sempre possvel obter assinaturas falsificadas, tornando-se impraticvel quando
aplicada em sistemas reais como aplicaes bancrias. Para lidar com estas dificuldades
alguns pesquisadores tm usado assinaturas de outros autores no sistema como sendo
assinaturas falsas, as chamadas falsificaes aleatrias. Neste caso, a taxa de falsa aceitao
artificialmente reduzida no contexto de falsificao, de acordo com Murshed. Por exemplo, se

39

um sistema treinado com assinaturas genunas do escritor a e com falsificaes aleatrias


dos escritores b, c e d, ento o sistema adquire um conhecimento de caractersticas
contidas nas assinaturas destes escritores. Durante a fase de avaliao quando o sistema
confrontado com assinaturas dos escritores b, c e d como sendo falsificaes aleatrias,
ele usa seu conhecimento adquirido durante o treinamento, e provavelmente classifica estas
assinaturas como aleatrias. Ainda no trabalho de Murshed, nota-se que o desempenho final
pode no ser o mesmo se introduzidas assinaturas de autores que no contribuem para a fase
de treinamento. Durante o estgio de treinamento, o sistema aprende caractersticas das
assinaturas genunas de um dado escritor, formando tantas classes de categorias quantas so
as caractersticas distintas. Quando o treinamento termina, o sistema tem conhecimento
somente de assinaturas genunas deste escritor. Semelhante a abordagem de Sansone e Vento
[SANSONE & VENTO, 2000], no mtodo de Murshed [MURSHED et al., 1995] o primeiro
estgio centraliza a imagem e dividi a mesma em regies (grid). Em seguida segmentos
grficos de tamanho fixos so extrados de cada regio e modelada por uma rede neural para
reduzir o tamanho destes segmentos. No estgio seguinte cada uma das regies modelada
por uma rede Fuzzy ARTMAP. Finalmente, o estgio de deciso analisa os resultados
produzidos para cada Fuzzy ARTMAP e toma a deciso sobre a autenticidade das assinaturas.
Para dividir a assinatura de entrada durante o treinamento/verificao em regies, uma
identidade de grid projetada para cada escritor, tal que sua forma reflete a mdia global das
assinaturas de referncias deste referido escritor. Neste mtodo usa-se memria associativa
atravs de uma rede backpropagation para a reduo da dimensionalidade aplicada nas
imagens e a sada do primeiro estgio forma um vetor com 768 entradas nas redes Fuzzy
ARTMAP. A base de dados usada composta por 200 assinaturas de 5 autores, com 40
assinaturas genunas. Nesta abordagem, como na maioria dos trabalhos correlatos, demonstrase que os melhores desempenhos so obtidos com um nmero maior de assinaturas genunas
por autor no treinamento.
Tambm Zhang [ZHANG et al., 1998] propem um mtodo de verificao de
assinaturas baseado na tcnica de quantizao vetorial, em que um nmero de codebooks
estabelecido para palavras de cada pessoa e a classificao estabelecida num esquema de
reconstruo chamada decodificador da populao. Para este mtodo usam-se 3770
assinaturas de 19 autores. As imagens so normalizadas em tamanho fixo de 240 por 120
pixels. Na extrao de caractersticas duas tcnicas so usadas. Na primeira, a imagem
segmentada em regies de 24 x 12 e para cada regio so contados os pixels. Na outra tcnica,

40

usa-se a transformao de escala de cinza por regio, sendo aplicada uma mscara de tamanho
3 x 3 sobre as regies de tamanho 80 x 40. Zhang [ZHANG et al., 1998] enfatizam a
necessidade de se coletar as assinaturas em tempos distintos, para tanto realizam experimentos
diferenciados com amostras coletadas em perodos distintos.
Outra abordagem que utiliza a gerao de assinaturas genunas artificiais para
treinamento proposta por Huang e Yan [HUANG & YAN, 1997] com uma variante em que
assinaturas artificiais com alto grau de distoro so incorporadas como falsificao no
processo de treinamento. Um modelo de segmentao em clulas de tamanhos diferenciados
aplicado na extrao das caractersticas locais. As caractersticas geomtricas so obtidas do
ncleo da assinatura, do contorno, da distribuio dos pixels, de fronteiras direcionais e da
regio de mxima presso. A base de dados usada de 3528 assinaturas de 21 autores sendo
que cada autor cede 24 assinaturas genunas e 6 outras pessoas produzem 24 falsificaes dos
21 autores. Vrios nveis de resoluo do grid so testados, sendo um nvel para cada rede, a
qual comps as caractersticas dentro do tamanho do grid em especfico. Aps o treinamento
individual de cada rede, as sadas so passadas para uma outra rede neural cuja funo
combinar as respostas de cada rede e produzir uma deciso.
Sabourin e Genest [SABOURIN & GENEST, 1994] propem uma abordagem local
com caractersticas estatsticas. Este mtodo utiliza a tcnica denominada Extended-ShadowCode na qual as operaes de projees so definidas em um grid, ocorrendo simultneas
projees para cada pixel preto nas barras horizontais, verticais e na diagonal. A projeo
contm um conjunto de bits distribudos ao longo de cada barra, os quais so contados. O
mtodo de verificao estatstico e utiliza dois classificadores knn (vizinho mais prximo) e
um classificador de mnimas distncias. Com relao ao uso de uma base de dados Sabourin e
Genest [SABOURIN & GENEST, 1994] utilizam 800 assinaturas, sendo 40 assinaturas
produzidas por 20 autores distintos.
De acordo com Justino [JUSTINO et al., 2002] cada tipo de falsificao requisita um mtodo
de reconhecimento diferente. Mtodos baseados em abordagens estticas so usados para
identificar falsificaes aleatrias e simples. A razo que estes mtodos descrevem melhor
as caractersticas relacionadas forma da assinatura. A abordagem baseada na grafometria
[JUSTINO et al., 2002] supre esta lacuna do uso de mtodos de reconhecimentos diferentes,
em relao escolha do tipo de caractersticas, pois engloba caractersticas que possuem um
tratamento

local,

as

chamadas

pseudodinmicas.

Justino

utiliza

caracterstica

pseudodinmica inclinao axial que descreve adequadamente o movimento da escrita, como

41

tambm utiliza caractersticas estticas representadas pela densidade de pixels e a sua


distribuio. Justino [JUSTINO et al., 2002] usam a imagem binria dentro de um grid para
extrair as caractersticas. Na densidade de pixels, a contagem efetuada em cada regio do
grid (clula), j a distribuio representa a distribuio geomtrica dentro da clula. Na
inclinao axial, os pixels pretos so projetados nos 4 sensores da periferia de cada clula,
usando como base o eixo central da clula. Cada sensor prove um valor numrico que
corresponde ao total de pixels projetados. Este valor numrico normalizado pelo tamanho do
sensor. Um conjunto de codebooks gerado para cada caracterstica utiliza uma base de dados
especfica para a gerao do lxico. No processo de quantizao vetorial o algoritmo k-means
utilizado. Este procedimento tem como objetivo a reduo da dimensionalidade dos vetores
gerados, que so ento enviados ao classificador HMM para o processo de aprendizagem.
Como o treinamento baseado em um modelo pessoal, Justino [JUSTINO et al., 2002]
determina limiares de aceitao e rejeio levando em conta cada autor em especfico, desta
forma melhora os resultados. A base de dados deste experimento composta por 5200
assinaturas de 100 autores sendo 4000 genunas correspondendo a 40 assinaturas de 100
autores e 1200 falsificaes simples e simuladas.

3.3. Abordagens Globais e Locais

Sistemas em que a aplicao enquadra-se em qualquer contexto despertam interesse de


pesquisadores. Qi e Hunt [QI & HUNT, 1994], propem a representao de caractersticas
invariantes mudana de escala nas assinaturas, sendo usadas caractersticas globais e
geomtricas como altura, largura, centro de gravidade, ngulo de inclinao e projees, e
ainda caractersticas locais representadas por um grid. No processo de verificao utiliza-se
um sistema multi-escala baseado em distncia euclidiana. Nesta abordagem 25 autores so
usados, com 15 autores que provem 20 assinaturas genunas e os 10 restantes cedem 15
falsificaes perfazendo um total de 450 assinaturas para o treinamento e teste. Para esta
verificao, utilizam-se somente medidas de distncias.
Sansone e Vento [SANSONE & VENTO, 2000] propem um sistema baseado em
rede neurais com mltiplos estgios de deciso no processo de verificao. Cada estgio
representado por uma rede MLP usando um conjunto adequado de caractersticas. O primeiro

42

estgio adota somente caractersticas globais (a estrutura da assinatura) e dedicado


eliminao de falsificaes simples e aleatrias, mas, mesmo com a generalidade empregada,
implica em um efeito no desejado, no qual algumas falsificaes simuladas so aceitas como
genunas. O segundo estgio recebe apenas assinaturas no classificadas como falsas no
primeiro estgio (isto , aquelas assinaturas realmente genunas, ou falsificaes reproduzidas
de uma maneira simulada que enganaram o primeiro estgio), e adota uma caracterstica
especfica para esta tarefa, neste caso, so usadas regies de alta presso. Ambos os estgios
empregam um critrio para estimar a confiabilidade do desempenho do classificador, tal que,
quando h incerteza quanto assinatura, esta remetida para um estgio que toma a deciso
final, levando em conta a deciso dos estgios prvios junto com a correspondente estimao
de confiabilidade. Na avaliao da confiabilidade, o sistema usa limiares de rejeio. A base
de dados do experimento composta de 49 autores sendo 20 assinaturas genunas por autor e
um total de 1960 assinaturas.
Faez [FAEZ et al., 1997] propem um mtodo de verificao de assinaturas utilizando
redes neurais baseado em caractersticas de descritores de forma: esqueleto da imagem, baixo
envelope e alto envelope, e regies de alta presso, sendo esta ltima caracterstica extrada
em nveis de cinza. Sobre cada imagem de assinatura alinhada sobreposto um grid de 5x10
extraindo caractersticas locais da imagem. Uma rede MLP para cada descritor de forma, ou
seja, cada caracterstica treinada, e no final cada n de sada da rede fornece uma medida de
confiana na deciso. Para encontrar a deciso tima usa-se a deciso integral Fuzzy
combinando as sadas individuais de cada rede. Faez [FAEZ et al., 1997] geram assinaturas
genunas artificiais, uma vez que a abordagem propem o uso de quantidade reduzida de
amostras por autor. A base de dados possui 50 autores: cada autor com 10 assinaturas
genunas e outras pessoas fornecendo 10 falsificaes por autor, sendo 5 simuladas e 5
simples. No total 1000 assinaturas mais 40 assinaturas por autor geradas artificialmente so
utilizadas
Baltzakis e Papamarkos [BALTZAKIS & PAPAMARKOS, 2000] propem um novo
mtodo com habilidade de verificar e reconhecer a assinatura em um processo multi-estgio
utilizando classificadores neurais. O sistema baseado no uso de trs grupos de
caractersticas: as globais, nas quais se encaixam a altura da assinatura, rea da imagem,
largura da imagem, comportamento base, projees vertical e horizontal, curvatura, pontos de
borda, cruzamentos e laos. Outro grupo extrai informaes locais do grid, no qual os pixels
pretos so contados e normalizados em 0 ou 1 de acordo com a quantidade de pixels dentro de

43

cada regio. Uma outro grupo de caracterstica utilizada a textura com uso da matriz de coocorrncia da imagem em nvel de cinza dividindo em regies para sua extrao. No primeiro
estgio, cada grupo de caracterstica dado entrado em uma rede MLP separadamente e a
distncia euclidiana tambm extrada das caractersticas. O segundo estgio, composto das
sadas das caractersticas do primeiro estgio e da distncia euclidiana das caractersticas,
representa quatro entradas em uma rede RBF baseada na qual a deciso final tomada. A base
de dados composta de 2000 assinaturas de 115 autores. Cada autor prove 15 ou 25
assinaturas.
A Tabela 3.1 abaixo demonstra o resumo das abordagens apresentadas com seus
respectivos diferenciais em termos de tipos de abordagens e caractersticas, que fazem parte
do ponto de partida para este trabalho.

44

Tabela.3.1: Resumo do estado da arte relevante para a dissertao


Referncia

Caractersticas

[DENG et al., 1999]

Abordagem global
Wavelet (Como
pseudodinmicas)

[BAJAJ & CHAUDHURY, 1996]

Abordagem global
Projeo de momentos verticais e horizontais
Envelope baixo e alto da imagem da assinatura

[RIBEIRO & VASCONCELOS, 1999]

Abordagem global
Momentos invariantes, inclinao e presso global.

[XIAO & LEEDHAM, 1999]

Abordagem local
Uso de distribuio de pixels nas quatro direes Rede Neural MLP
dentro de cada clula de um grid.

[MURSHED et al., 1995]

Abordagem local
Segmentos grficos do grid e uso de rede Rede Fuzzy ARTMAP
backpropagation como redutor de dimensionalidade

[ZHANG et al., 1998]

Quantizao Vetorial e esquema de


Abordagem local
Caractersticas estticas relacionadas a contagem de reconstruo
pixels em regies de um grid

[HUANG & YAN, 1997]

[SABOURIN & GENEST, 1994]

[JUSTINO et al., 2002]

[QI & HUNT, 1994]

Classificador
caractersticas

estticas

e Medidas de Distncia

Redes Neurais MLP

Redes

Neurais

MLP,

Cascade-

Correlation, Tower e Pyramid

Abordagem local
Caractersticas geomtricas com uso de um grid
para extrair o ncleo da assinatura, distribuio de Redes Neurais MLP
pixels, fronteiras direcionais e regies de alta
presso.
Abordagem local
Caractersticas estticas com uso de grid na k-NN e classificador de mnimas
contagem de pixels baseado nas projees
distncias
horizontais, verticais e diagonais das clulas.
Abordagem local
Caractersticas
estticas
representadas
por
Quantizao Vetorial e HMM
densidade de pixels e distribuio de pixels
Caracterstica pseudodinmica representado pela
inclinao axial
Abordagem global e local
Caractersticas geomtricas relacionadas altura, Medidas de distncia
largura, ngulo de projeo e inclinao e uso de
um grid

[SANSONE & VENTO, 2000]

Abordagem global e local


Contorno da assinatura e regies de alta presso

[FAEZ et al., 1997]

Comit de redes MLP


Abordagem global e local
Combinando as sadas em uma
Caractersticas geomtricas usando envelope baixo
e alto. Caractersticas pseudodinmicas de presso, deciso Fuzzy
parada e inclinao.

[BALTZAKIS & PAPAMARKOS, 2000]

Abordagem local e global com trs grupos de


caractersticas:
1 grupo:largura, altura, rea, comportamento base, Redes MLP no treinamento de cada
projees
verticais,
projees
horizontais,
grupo e rede RBF na deciso
curvatura, pontos de borda, cruzamentos e bordas
2 grupo: contagem de pixels utilizando um grid
3 grupo: textura

Redes Neurais MLP

45

3.4. Viso Crtica do Estado da Arte

A viso crtica proposta busca contribuir para uma abordagem mais consistente e que
possua conotao prtica. Entretanto, uma comparao mais refinada em termos de resultados
estatsticos em cada abordagem torna-se difcil, justamente pela diversidade de bases de dados
e protocolos experimentais existentes, e tambm por no existir nenhuma base de dados
internacional compartilhada, implicando um grande problema para a comparao de
desempenho entre mtodos [FANG et al., 2003] [MURSHED et al., 1995].
Os resultados apresentados por algumas abordagens mostram taxas de erros baixas,
porm quando analisados profundamente demonstram que tratam apenas de alguns tipos de
falsificaes, desconsiderando, por exemplo, as falsificaes simuladas [BALTZAKIS &
PAPAMARKOS, 2000].
comum ter solues combinando diferentes tipos de classificadores, pois cada um
contribui de maneira diferenciada na elaborao do resultado final [BALTZAKIS &
PAPAMARKOS, 2000]. Em outros casos, possvel encontrar soluo combinando um
conjunto do mesmo tipo de classificador [BAJAJ & CHAUDHURY, 1996].
Muitas abordagens baseadas em caractersticas globais [DENG et al., 1999], [BAJAJ
& CHAUDHURY, 1996] e [RIBEIRO & VASCONCELOS, 1999] demonstram ser mais
rpidas no processo de extrao de caractersticas, porm, de acordo com Justino [JUSTINO
et at, 2002], mtodos que utilizam caractersticas locais possuem capacidade discriminatria
maior em relao falsificaes simuladas e simples. Com relao base de dados, muitos
mtodos apresentam quantidades de autores reduzidos para validao estatstica [XIAO &
LEEDHAM, 1999], [BAJAJ & CHAUDHURY, 1996] e [MURSHED et al., 1995]. J a
quantidade de assinaturas genunas usada por autor, no processo de aprendizagem, representa
um problema, caso o nmero extrapole uma quantidade maior do que os normalmente
aplicados em sistemas atuais, e desta forma dificulta a sua aplicao prtica [SANSONE &
VENTO, 2000], [MURSHED et al., 1995], [HUANG & YAN, 1997] [SABOURIN &
GENEST, 1994] e [JUSTINO et al., 2003].
Existem algumas abordagens que utilizam tcnicas de gerao de amostras artificiais
automaticamente [XIAO & LEEDHAM, 1999] e [FAEZ et al., 1997], como tambm a
gerao artificial automtica de amostras de falsificaes [HUANG & YAN, 1997]. Neste
caso, h controvrsias com relao incorporao destes tipos de amostras no processo de

46

verificao por no refletir a variao intrapessoal como tambm as eventuais falsificaes do


mundo real. Um caso extremo o de Velez [VELEZ et al., 2003] que apresentam um
mtodo de gerao de mltiplas assinaturas de cada indivduo, baseado em uma assinatura
correspondente. Neste processo, tenta-se emular a variao intrapessoal dentro das assinaturas
de cada autor, as quais so aplicadas em diferentes combinaes, usando para tanto uma
assinatura original. Desta forma cada assinatura original gera 1936 padres de assinaturas
sintticas.
Algumas abordagens utilizam um processo de reduo da dimensionalidade do vetor
de caractersticas como em Justino [JUSTINO, 2001] e Murshed [MURSHED et al., 1995].
Neste ltimo, um processo de reduo de dimensionalidade nas imagens ainda forma um
vetor de sada com 768 posies como entrada para uma rede Fuzzy ARTMAP.
Mtodos que incorporam grids [XIAO & LEEDHAM, 1999] e [JUSTINO, 2001], de
certa forma j aplicam um processo de reduo da dimensionalidade das caractersticas.
Outros como Drouhard [DROUHARD et al., 1994] acreditam que um classificador
mais eficiente se diminuir a dimenso do vetor de entrada (dados desnecessrios) e a variao
no vetor de entrada ser menos abrupta (dados com rudos). Porm, caractersticas de um grid,
submetidas diretamente ao classificador sem um processo de reduo da dimensionalidade
dos vetores de caractersticas, so abordadas por Xiao e Leedham [XIAO & LEEDHAM,
1999]. Xiao e Leedham utilizam um grid de 9x8 com 4 primitivas totalizando 288 posies
de entrada em uma rede MLP. Os resultados obtidos nas taxas de erros so: 9,2% de erro na
taxa de falsa rejeio e 17% de erro na taxa de falsa aceitao.
J em Rasha [RASHA, 1994] a camada de entrada de uma rede MLP composta de
5.600 neurnios correspondendo prpria imagem 160x35 pixels. Infelizmente no h uma
maneira de determinar estes parmetros, desde que eles so fortemente dependentes da
aplicao.

3.5. Comentrios Finais

Os trabalhos apresentados neste captulo contribuem na elaborao do presente


trabalho no que se refere ao tipo de abordagem empregada , escolha das caractersticas e
classificadores. Desta forma proposta uma abordagem local com caractersticas estticas e

47

pseudodinmicas baseadas no uso de tcnicas grafomtricas e uma rede neural MLP como
classificador. No captulo seguinte descrita toda a fundamentao metodolgica aplicada na
abordagem proposta.

Captulo 4

4. Metodologia

Neste captulo detalhada a metodologia aplicada na abordagem proposta para a


verificao de assinaturas. apresentado um estudo detalhado das tcnicas forenses
fundamentais na anlise de documentos questionados, mais especificamente no processo de
extrao das caractersticas assim como medidas de distncias, juntamente com a abordagem
dicotmica usada para a produo de um modelo.

4.1. Requisitos

Uma anlise mais profunda sobre a da aplicao da maioria das abordagens para
verificao de assinaturas impe restries, sendo limitada a um problema em especfico. Esta
reduo de escopo contribui para o alcance de resultados desejveis, porm o uso prtico pode
ficar comprometido quando o meio utilizado diferir do meio proposto. Esta abordagem no
pretende acabar com este problema, porm a minimizao faz parte da proposta.
A seguir so apresentados alguns requisitos, que devem ser objeto de um estudo
detalhado em cada etapa do processo:

Ser suscetvel aos vrios tipos de falsificaes a que o sistema submetido;

Procurar a reduo do nmero de classes no ambiente de classificao;

Considerar uma limitao do espao grfico de 3 x 10 centmetros, que representa um


retngulo destinado assinatura no documento. Esta restrio imposta pertinente
base de dados de laboratrio utilizada por Justino [JUSTINO, 2001]. Todas as
especificaes tcnicas do processo de aquisio da base de dados esto descritas em
Justino [JUSTINO, 2001].

49

4.2. Recursos

O objetivo desta seo descrever detalhadamente os subsdios necessrios no


desenvolvimento da soluo para o problema proposto de verificao de autenticidade de
assinaturas, levando em conta cada um dos requisitos estabelecidos. Ela subdivide-se em
quatro partes principais, que vem ao encontro dos requisitos que a abordagem exige:
1. Dentro do grafismo o uso de tcnicas grafomtricas na extrao de caractersticas
geomtricas locais, procurando transcrever a viso tcnica na anlise de
similaridade, a qual foi amplamente estudada por Justino [JUSTINO, 2001];
2. A utilizao de medidas de distncia nas caractersticas extradas no processo de
aprendizagem;
3. A reduo de escopo no processo de classificao exige uma tcnica denominada
dicotomia;
4. E finalmente a combinao de todos estes recursos que ser abordada no captulo 5
no processo de:
a. Produo de um modelo, que se faz necessrio atravs de uma base de
dados e ao uso de um classificador;
b. Verificao, que utiliza a grafoscopia relacionada viso do perito
grafotcnico no processo de deciso baseado em um comparativo de
similaridade.

4.3. Grafismo

O grafismo engloba quatro campos de estudo: a grafoscopia que o estudo da origem


do documento grfico; a grafologia, por sua vez, o estudo da escrita visando a determinao
da psique do escritor; a paleografia, o estudo histrico da escrita; por fim, a caligrafia, que
o estudo artstico da escrita. A grafoscopia e a grafologia, so importantes para este trabalho,
pois abordam o estudo das caractersticas pessoais de um escritor ligadas sua escrita
[JUSTINO, 2001].

50

4.3.1. Grafoscopia

A grafoscopia tradicional foi desenvolvida com o objetivo de esclarecer questes


criminais. Tratando-se de um campo da criminalstica, ela tem sido conceituada como a rea
cuja finalidade a verificao da autenticidade e da autoria de um documento, a partir de
caractersticas grficas utilizadas na elaborao de um documento [JUSTINO, 2001].
Como a escrita est sujeita a inmeras mudanas, decorrentes de causas variadas, ela
exige conveniente interpretao tcnica para o completo xito dos exames grafoscpicos
periciais. As variaes do grafismo originam-se de causas normais, artificiais e ocasionais. As
primeiras so aquelas que acompanham o prprio desenvolvimento humano, nos perodos
abrangidos pela infncia e adolescncia, maturidade e velhice. J as segundas, so
transformaes da escrita causadas pelo artificialismo ocorrido nos casos de falsificaes e
dissimulaes grficas. As causas ocasionais originam-se das molstias, dos estados
emocionais, de leses na mo e de outros fatores fsicos [JUSTINO, 2001].
Os elementos tcnicos usados nos exames das identidades grficas so:

Genricos: que se dividem em calibre, espaamento, proporo, comportamento pauta,


comportamento base, valores angulares, valores curvilneos e inclinao axial;

Genticos: que se subdividem em dinmicos (presso, progresso) e trajetos (ataques,


desenvolvimentos, remates, mnimos grficos). Cada um desses elementos pode ser
enquadrado. Em um exame grafoscpico, com convergncia ou divergncia (mnima,
mdia, mxima).
No que se refere s assinaturas analisadas, elas nem sempre apresentam-se em

perfeitas condies, ocorrendo casos em que existem recobrimentos, falhas devido a dobras
ou desgastes de papel, ou outras anomalias, impedindo o levantamento de elementos tcnicos
suficientes para uma concluso decisiva [JUSTINO, 2001].
Por mais que alguma semelhana nas assinaturas ou escrita de cada autor possa existir,
elementos indicadores de individualidade estaro presentes na seqncia de letras de uma
palavra. So caractersticas discriminantes observadas de perto pelo perito durante uma
percia. A seguir so apresentadas algumas dessas caractersticas individuais.

51

4.3.1.1. Calibre

o tamanho da escrita relacionado com o espao grfico disponvel, sendo uma


caracterstica intrnseca de cada autor. No contexto de assinaturas este tipo de caracterstica
melhor visualizada em assinaturas cursivas. A Figura 4.1(a) mostra um exemplo de uma
assinatura de reduzido calibre e outra assinatura de alto calibre 4.1(b).

(a)

(b)

Figura 4.1: Assinatura de calibre reduzido (a) e de alto calibre (b).

4.3.1.2. Espaamento

Corresponde a interrupo do curso da escrita entre combinaes de segmentos e


letras. O espaamento ocorre com certa freqncia em assinaturas cursivas quando
normalmente a escrita formada por nome composto, conforme representado na Figura 4.2.

Figura 4.2: Assinatura cursiva com espaamentos entre os nome e sobrenomes.

4.3.1.3. Alinhamento em Relao Linha Base

Esta caracterstica corresponde capacidade do escritor de produzir linhas de textos


alinhadas com uma linha guia horizontal fictcia (no-pautado) ou real (pautado). As
assinaturas podem apresentar graus distintos de inclinao, usualmente para baixo em
documentos pautados e no-pautados, confira na Figura 4.3.

52

Figura 4.3: Exemplo de assinatura inclinada em documento no-pautado.

4.3.1.4. Inclinao Axial

A inclinao axial o ngulo de inclinao da escrita, em relao ao eixo vertical,


sendo o eixo horizontal representado por uma linha de base imaginria. Essa inclinao pode
ocorrer esquerda ou direita, conforme Figura 4.4(a) e (b). A inclinao axial da escrita
pode ocorrer desde o princpio de uma palavra at o final da mesma, ou desde o princpio de
uma orao, pargrafo ou pgina, at o final das mesmas. No so raros os casos em que o
escritor apresenta um misto dessa inclinao, isto , inclinaes esquerda, direita e
alinhado ao eixo vertical (com inclinao axial nula). Se essa mudana de inclinao axial
habitual, ela pode ser considerada uma caracterstica identificadora. Embora esteja longe de
ser uma regra definitiva, uma escrita com inclinao axial direita ou esquerda pode indicar
a existncia de um escritor destro ou canhoto, respectivamente. No entanto, comum entre os
escritores canhotos, o posicionamento inclinado do documento, no momento da escrita. Esse
procedimento tem como objetivo produzir uma inclinao axial nula, ou quase nula. Esse
hbito pode ser considerado uma caracterstica ou estilo do escritor [JUSTINO, 2002].
Muitos peritos quantificam as variaes na inclinao axial encontradas por todo o
documento, medindo os ngulos fisicamente e pondo os resultados no laudo pericial. Com
isso, possvel trazer luz diferenas sutis entre a escrita questionada e a analisada. Alguns
cuidados devem ser tomados nesses casos, pois a variao intrapessoal (variaes de escrita
do mesmo escritor) pode conduzir a uma anlise incorreta.

53

(a)

(b)

Figura 4.4: Exemplo de inclinao direita (a) e esquerda (b).

4.3.1.5. Segmentos Angulares e Segmentos Curvilneos

Os segmentos angulares formam ngulos que mudam bruscamente de direo. J os


segmentos curvilneos esto relacionados a uma escrita sem segmentos retos com formas
arredondadas, conforme os exemplos de assinatura na Figura 4.5(a) e (b).

(a)

(b)

Figura 4.5: Exemplo de assinatura de segmentos com segmentos angulares (a) e com
segmentos curvilneos (b).

4.3.1.6. Mnimos Grficos

Os mnimos grficos so formados pelos pontos finais, vrgulas, os pingos nos is,
acentos (crase, circunflexo, til e agudo) e cedilhas. Uma pequena poro de escritura como
um mnimo grfico pode, em alguns casos, tornar-se uma caracterstica identificadora
relevante. Os pingos nas letras is podem apresentar diferentes formas, dependendo do estilo
de escrita do autor. Podem possuir um formato curvo e aberto para cima na forma de um trao
(clave) horizontal ou vertical, pode estar inclinado esquerda ou direita, ou apresentar a
forma de um simples ponto, confira na Figura 4.6.

54

Figura 4.6: Exemplo de mnimos grficos.

4.3.1.7. Velocidade

A velocidade da escrita freqentemente uma caracterstica essencial para a


identificao do autor. Est relacionada com os elementos tcnicos genticos da progresso.
Um movimento rpido do objeto de escrita difcil de ser duplicado por um falsificador,
confira na Figura 4.7.

(a)

(b)

Figura 4.7: Exemplo de assinatura com escrita rpida (a) e lenta (b).
Os elementos seguintes descrevem alguns indicadores de escrita rpida e lenta:

Rpida

Traado tenso, sem tremor;

Alongamento na finalizao dos traos;

Falta de legibilidade;

Lento

Vacilao e tremor, escritura mais angular;

Cruzamentos dos t em posio correta;

Parada e recomeo abrupto (clave);

A escrita feita de letras individuais e legveis;

Movimento pode apresentar ornamentos.

55

4.3.1.8. Indcios de Falsificaes

Na seqncia so apresentados alguns indicativos de falta de autenticidade dentro da


grafoscopia relacionados a aspectos tcnicos genticos:

Incios e paradas abruptas Estas caractersticas esto relacionadas com ataques e


remates. Nos casos de falsificaes, ocorrem quando o falsificador coloca a ponta da
caneta em contato com o papel, e ento inicia a escrita. Quando conclui a escrita ou algum
trecho, ele interrompe a escrita e retira a caneta, encerrando o contato com o papel. Isto
pode causar um incio ou trmino abrupto, enfatizando ou determinando onde a caneta foi
colocada em contato com a superfcie do papel [JUSTINO, 2002], conforme demonstrado
na Figura 4.8(b). s vezes, este contato to prolongado, que acaba deixando no papel
um pequeno borro. Esse borro ser maior quando a caneta possuir uma tinta mais
liquefeita ou o papel apresentar maior porosidade. Sendo assim, a assinatura pode
apresentar marcas desnecessrias e estranhas, causadas por incios e paradas de caneta.
Normalmente o incio e trmino de uma assinatura so caracterizados por linhas de
traados firmes, apresentando caractersticas de velocidade, Figura 4.8(a);

(a)

(b)

Figura 4.8: Exemplo de assinatura com relao a inicio e fim abrupto: (a) Assinatura
original; (b) Assinatura falsificada.

Elevao do objeto de escrita O escritor pode interromper o percurso do traado para


efetuar uma correo na direo. Isto ocasionado pela elevao da caneta em um ponto
na escrita, eliminando temporariamente seu contato com o papel. Esta ao pode levar ao
aparecimento de uma pequena descontinuidade no traado, ou sobreposio de duas
linhas de tinta onde deveria haver uma s linha contnua [JUSTINO, 2002], confira na
Figura 4.9 (a) e (b);

56

(a)

(b)

Figura 4.9: Exemplo de assinatura relacionada a elevao do objeto de escrita: (a) Assinatura
original; (b) Falsificao com elevao do objeto de escrita.

Tremor A presena de tremores nos traos pode ser um indicativo de fraude.


Usualmente as assinaturas, por se tratarem de desenhos estilizados, contam com a destreza
de quem as criou, devido a um processo exaustivo de repetio. Portanto, o traado
apresenta caractersticas de firmeza e velocidade. Como a criao de uma assinatura no
genuna pouco mais que um desenho, apresentar, na maioria das vezes, um movimento
lento da caneta com traado trmulo e inseguro, conforme a Figura 4.10(b);

(a)

(b)

Figura 4.10: Exemplos de assinaturas sem tremores e com tremores: (a) Assinatura
original; (b) Assinatura falsificada com traado trmulo.

Presso Esta caracterstica resulta na variao de largura do traado e na deposio de


material de tinta ou grafite em uma dada regio do mesmo. Conseqncias da presso do
objeto de escrita sobre o papel [JUSTINO, 2002]. uma caracterstica pseudodinmica
que geralmente no est presente nos locais em que o traado rpido, como ocorre nas
assinaturas genunas mostradas na Figura 4.11(a). Nestes casos a linha de tinta permanece
constante em densidade e apresenta como resultado uma presso constante. No entanto,
em locais onde o movimento lento haver pequenos afinamentos das linhas, indicando
irregularidade de presso e dando indcios de falta de destreza, usuais nos casos de

57

falsificaes. Tal procedimento pode ser conferido na Figura 4.11(b) em relao


assinatura original na Figura 4.11(a);

(a)

(b)

Figura 4.11: Exemplos de assinaturas sem presso e com presso (a) Assinatura original.
(b) Falsificao servil com pontos de presso.

Correes Retrao o processo em que o objeto de escrita repinta uma poro escrita da
linha, normalmente na direo oposta. Um exemplo um movimento descendente seguido
por um movimento ascendente em cima da linha j existente. considerada uma
caracterstica do escritor, enquanto representar um comportamento natural da experincia
de escrita. Por outro lado, se acontecer como uma forma de conserto, para corrigir a forma
de uma letra, pode ser um indicativo de falsificao, conforme Figura 4.12(b).

(a)

(b)

Figura 4.12: Exemplos de assinaturas sem e com correes (a) Assinatura original. (b)
Falsificao servil com pontos corrigidos.
(a) Assinatura original. (b) Falsificao servil com correes circuladas.
importante salientar que alguns desses indicadores podem estar presentes em
assinaturas genunas de pessoas em idade avanadas ou enfermas. A mera presena destes
indicadores no significa que a assinatura analisada no seja genuna, mas dever contribuir
na determinao global da autenticidade. de se esperar que a assinatura de uma pessoa em
idade avanada apresente traos mais trmulos e vacilantes. Porm, se a assinatura
questionada apresentar uma habilidade superior esperada, uma possvel fraude pode estar
presente. Freqentemente, um falsificador, em decorrncia de um nvel de habilidade alta

58

inerente da sua escrita, pode produzir uma assinatura contendo menos indicaes de
falsificaes que uma pessoa com um nvel mais baixo de habilidade.

4.3.2. Grafologia

o estudo da escrita visando a determinao da psique do escritor. Existem vrias


escolas grafolgicas. Nesse trabalho so tratadas somente as que possam subsidiar os estudos
em verificao de assinaturas. Para tanto, sero comentados somente os movimentos com
abordagem cientfica, ou seja, o movimento clssico que se baseia na mmica e o movimento
moderno psicanaltico, que se orienta por smbolos [JUSTINO, 2001].

Mmica: nesta escola, a grafologia comporta dois estudos, o dos sinais e o das
resultantes. Os sinais so tomados no conjunto da escrita, em que se considera a altura,
a largura, a inclinao e a regularidade ou nos pormenores das palavras, das letras e
dos sinais. Sendo assim, deve-se procurar os sinais de superioridade e de inferioridade,
de carter moral (costumes e sentimentos), vontade, senso esttico, idade, sexo e
algumas indicaes patolgicas.

Simblica: baseia-se principalmente nos estudos da avaliao e interpretao dos


smbolos. Existem, indubitavelmente, relaes entre os diversos smbolos grafolgicos
que compem o trao individual e o psiquismo do escritor.

Os sinais usados pela escola mmica e simblica assemelham-se aos utilizados pela
grafoscopia, mas as anlises das resultantes possuem abordagens diferenciadas. As duas
primeiras avaliam a psique do escritor, a fim de estabelecer possveis patologias. J a ltima
avalia a veracidade da autoria da escrita, com a finalidade de identificar possveis fraudes.
So elementos bsicos da grafologia:

Campo grfico: o espao bidimensional em que a escrita produzida;

Gesto grfico ou movimento grfico: todo movimento de dedos e/ou da mo que o


indivduo faz para escrever. Cada movimento grfico gera um trao grfico;

Trao: o trajeto que a caneta descreve em um nico gesto executado pelo escritor;

Trao descendente, fundamental, pleno ou grosso: todo trao descendente e grosso


de uma letra;

Trao ascendente, ou perfil: o trao ascendente e fino de uma letra;

59

Ovais: so os elementos em forma de crculo das letras a,o,g,q, etc;

Hastes: so todos os traos plenos (movimento de descenso) das letras l,t,b, etc e
do f at a base da zona mdia. Tambm so consideradas hastes os traos verticais
do m e do n maisculo e minsculo;

Lanadas inferiores: so todos os planos (descendentes) do g, j, y, etc e do f a


partir da zona mdia at embaixo;

Bucles: so todos os traos ascendentes (perfis) das hastes e das lanadas inferiores e,
por extenso, todo movimento que ascende cruzando a haste e unindo-se a ela
formando crculo;

Partes essenciais: o esqueleto da letra, a parte indispensvel da sua estrutura;

Parte secundria ou acessria: o revestimento da letra, ornamental ou no, necessria


sua configurao.

Nas letras, preciso distinguir tambm as diferentes zonas:

Zona inicial, rea onde se encontra o ponto que inicia a letra;

Zona final, rea onde se encontra o ponto que termina a letra;

Zona superior, rea onde se encontra o ponto mais alto, ocupado pelas hastes, pelos
acentos, pelas barras do t e parte das maisculas;

Zona mdia, rea central, ocupada por todas as vogais minsculas e pelas letras
m,n,r etc. cuja altura torna-se base para medir o nvel da elevao das hastes e o
nvel do descenso das lanadas inferiores;

Zona inferior, zona baixa da escrita a partir da base de todos os ovais descendentes das
maisculas ou de outras letras.

O uso individual ou

em conjunto destes elementos da grafologia est presente em

algumas caractersticas encontradas tanto na escola mmica quanto na simblica e que esto
relacionadas ao contexto de assinaturas, sendo descritas a seguir.

4.3.2.1. Aspectos Grficos

So fundamentais para a abordagem proposta e esto relacionadas com a escrita vista


como grafia psicomotriz, ou seja, medindo-se o nvel de tenso, rapidez, profundidade,
irradiao (altura-extenso), relevo, esttica, coeso, regularidade, inclinao, direo das

60

linhas, progresso e proporo. Quase todos esses aspectos do grafismo so mensurveis, isto
, podem ser avaliados grafometricamente a partir de um modelo ou padro. Tudo que exceda
ou fique abaixo deste modelo sintomtico [JUSTINO, 2001].

4.3.2.2. Ordem

A distribuio dos elementos grficos pode ser classificada em: clara, boa separao
indicando uma uniformidade na distribuio de letras e palavras, conforme Figura 4.13(a);
confusa, em que o texto aparece como uma massa no uniforme e embaralhada, conforme
Figura 4.13(b); concentrada, em que na viso do conjunto prepondera o texto sobre os espaos
em branco, Figura 4.13(c) e espaada, em que na viso do conjunto preponderam os espaos
em branco Figura 4.13(d);

(a)

(b)

(c)

(d)

Figura 4.13: Exemplos de assinaturas sob o ponto de vista da ordem, podendo ser uma
assinatura: (a) clara; (b) confusa; (c) concentrada; (d) espaada.

4.3.2.3. Proporo

Est relacionada simetria da escrita, normalmente notada em assinaturas cursivas,


podendo ser de trs tipos: proporcional, a assinatura em que as letras e as partes
constitutivas da mesma apresentam pequenas desigualdades rtmicas, conforme Figura
4.14(a); desproporcional, a assinatura onde as letras ou partes de letras apresentam
desequilbrio e translaes mais ou menos exageradas, conforme Figura 4.14(b); mista, em
que nota-se a existncia simultnea da proporcionalidade e desproporcionalidade, afetando as
letras maisculas, veja Figura 4.14(c).

(a)

(b)

(c)

61

Figura 4.14: Exemplos de assinaturas com relao simetria: (a) Assinatura proporcional; (b)
Assinatura desproporcional; (c) Assinatura mista.

4.3.2.4. Dimenso

A dimenso traduz o grau de expansividade do escritor, podendo ser resumida em duas


classes: a escrita alta, onde o corpo da escrita (zona mdia) ultrapassa as propores em
relao s hastes e as lanadas inferiores conforme Figura 4.15(a); a escrita baixa, em que o
corpo da escrita, em proporo s letras, mais larga do que alta conforme Figura 4.15(b).

(a)

(b)

Figura 4.15: Exemplos de assinaturas com relao a dimenso: (a) Assinatura alta; (b)
Assinatura baixa.

4.3.2.5. Presso

A fora ou intensidade do trao, por sua caracterstica dinmica, est em estreita


relao com a rapidez, com a continuidade e com a irradiao do impulso grfico. A presso
pode ser expressa por duas caractersticas: a escrita tensa, em que os movimentos grficos so
retos, firmes e seguros, conforme Figura 4.16(a); a escrita frouxa, onde existe um dficit de
tenso nos movimentos, os quais so mais ou menos sinuosos, ondulados ou torcidos em
qualquer direo, conforme Figura 4.16(b).
Um outro parmetro mensurvel, em relao presso, a fora da impresso do
trao. Pode ser dividido em dois: o peso real, que a soma da espessura do trao, a fora e
profundidade; o peso aparente, em que s considerada a espessura do trao.

(a)

(b)

62

Figura 4.16: Exemplos de assinaturas com relao a presso: (a) Assinatura tensa; (b)
Assinatura frouxa.

4.3.2.6. Forma

Quanto forma, existem trs tipos identificveis de escritas: a caligrfica, em que


modelo caligrfico escolar predominante, conforme Figura 4.17(a); a arredondada, em que
os elementos curvos so preponderantes, Figura 4.17(b); a reta vertical, em que predominam
os segmentos retos verticais ou levemente inclinados, Figura 4.17(c), a reta horizontal,
quando predominam os segmentos em linha reta horizontal, conforme Figura 4.17(d).

(a)

(b)

(c)

(d)

Figura 4.17: Exemplos de assinaturas sob o ponto de vista da forma: (a) Assinatura
caligrfica; (b) Assinatura arredondada; (c) Assinatura reta vertical; (d) Assinatura reta
horizontal.
4.3.2.7. Gesto caracterstico

Existem em cada indivduo gestos que se repetem a cada instante, espcies de tique ou
atitude que o caracteriza. Na escrita tambm existem modalidades de traos ou letras que
chamam a ateno, porque imprimem ao traado uma fisionomia especial que nenhum outro
poderia reproduzir da mesma maneira. Os elementos grficos que podem formar o gesto
caracterstico em assinaturas so: gancho - consiste no movimento de regresso encontrado
nos finais das letras ou nas barras dos t conforme Figura 4.18(a); clave - carrega todo o
golpe de energia sobre a zona final do traado que fica em forma de ponta quebrada, confira
na Figura 4.18(b); golpe de sabre - o movimento promovido por um impulso da caneta, que
pode afetar as barras dos t e as partes inferiores das letras (lanadas inferiores), confira na
Figura 4.18(c1); inflao - que apresenta um tamanho exagerado, presente nas maisculas,
Figura 4.18(c2); espiral - que est presente nas letras maisculas, conforme Figura 4.18(d);
lao - que uma espcie de movimento de retorno ao ponto de partida, confira na Figura

63

4.18(e1); movimento em tringulo - produzido principalmente nas lanadas inferiores dos


t, g, y e nas barras dos t, pode tambm aparecer na circunferncia das letras da zona
mdia, conforme Figura 4.18(e2); bucle - que se apresenta na circunferncia das letras da
zona mdia, nas maisculas e nas ligaes, conforme Figura 4.18(f); arco - encontrado
preferencialmente nas zonas inicial, superior e mdia (nas ligaes), visto na Figura 4.18(g);
guirlanda - consiste num movimento em forma de arco aberto para cima, presente nos traos
iniciais e finais e nas barras dos t, conforme Figura 4.18(h1); serpentina - que afeta os
traos iniciais e finais e as letras m e n, conforme Figura 4.18(h2).
2

(a)
1

(b)

(c)

(d)

(e)

(f)

(g)

(h)

Figura 4.18: Exemplos de assinaturas do ponto de vista de gestos caractersticos: (a) Gancho;
(b) Clava; (c) Golpe de sabre e inflada; (d) Espiral; (e) Movimento em tringulo e lao; (f)
Bucle; (g) Arco; (h) guirlanda e serpentina.
importante salientar o que foi dito anteriormente: a grafologia oferece um conjunto
de caractersticas que avaliam os aspectos psicolgicos de um escritor, usando como
ferramenta a escrita.

4.3.3. Consideraes sobre o Grafismo

Foram apresentadas nos itens anteriores, as vrias formas de abordagens usadas no


estudo do grafismo e as peculiaridades de cada uma delas, em particular as duas de maior
importncia para o estudo da assinatura manuscrita, a grafoscopia e a grafologia.
No caso da grafologia, a contribuio encontra-se no conjunto de caractersticas que
determinam os aspectos psquicos do autor, usados nesse caso como atributos que diferenciam

64

um autor do outro. O comportamento psicolgico reflete-se nas caractersticas de sua escrita,


e nesse caso essas caractersticas podem ser utilizadas como elementos discriminantes entre
vrios autores.
J a grafoscopia, por tratar da autenticidade de documentos questionados, no qual se
enquadram as assinaturas manuscritas, apresenta subsdios valiosos para a extrao de
caractersticas.
Projetar bons extratores de caractersticas para sistemas verificadores de assinaturas,
ainda um grande obstculo, dada a complexidade do problema. A escolha de caractersticas
significativas em uma etapa essencial na elaborao de um mtodo de verificao, e a
representao computacional destas caractersticas afeta diretamente os resultados obtidos,
pois a robustez do mtodo proporcional qualidade das mesmas. A Tabela 4.1 apresenta
uma relao entre a grafologia e grafoscopia, permitindo determinar um conjunto de
caractersticas a serem adotadas pelo mtodo de verificao automtica proposto.
Tabela 4.1: Caractersticas combinadas da grafologia e da grafoscopia e as primitivas
implementadas.
Grafoscopia
(genticos / genricos)

Grafologia
(mmica / simblica)

Calibre
Proporcionalidade
Espaamento
Comportamento Base
Presso
Ataque / Remate
Progresso
Inclinao Axial
Valores Angulares e Curvilneos
Mnimos Grficos
Comportamento Pauta

Altura / largura / dimenso


Regularidade / proporo
Presso Real
Gestos Caractersticos
Presso Aparente
Inclinao
Ocupao do Espao grfico
-

Primitiva Usada

Densidade de pixels
Centro de Gravidade

Pontos de Presso
Incio e Fim Abrupto
Segmentos de Tremor
Inclinao Axial
Curvatura
-

Levando-se em considerao as restries impostas pela aplicao e as limitaes da


base de dados do laboratrio, pelo fato das amostras terem sido adquiridas em fundo branco e
em tamanho fixo, algumas destas caractersticas no se aplicam ao problema proposto:

Comportamento pauta Essa primitiva est ligada diretamente presena das


linhas de base. Como nesse trabalho foram usadas imagens desprovidas dessa
informao, ela ser deliberadamente excluda do conjunto das primitivas tratadas;

65

Mnimos grficos Por possurem dimenses normalmente reduzidas, podem ser


eliminados ou mesmo modificados durante o processo de digitalizao ou prtratamento, resultando em instabilidade;

Ocupao do espao grfico Pela utilizao da base de dados na qual as imagens


possuem tamanho fixo, e o espao destinado assinatura relativamente pequeno,
o uso da ocupao do espao grfico est restrito rea em torno da assinatura.
Com o uso da segmentao em clulas esse mapeamento suprido.

Com base na Tabela 4.1, intrinsecamente as caractersticas estticas se referem


forma como comprimento e altura e representam o comportamento esttico da escrita,
podendo serem representadas pela Densidade de Pixels e pelo Centro de Gravidade, e
incorporam vrias caractersticas da grafoscopia e grafologia. J as caractersticas
pseudodinmicas como progresso, presso e inclinao axial representam o comportamento
dinmico da escrita e portanto, esto relacionadas diretamente com os traos da assinatura. As
caractersticas desta categoria usadas no presente trabalho so: pontos de presso, incio e fim
abrupto, tremor, curvatura e inclinao axial.

4.4. Medidas de Distncia

Em problemas de classificao, h uma dependncia significante das medidas de


distncia. As medidas de distncia possuem propriedades invariantes, podendo tambm
integrar caractersticas heterogneas [CHA, 2001]. Existem dois pontos cruciais no
desenvolvimento de um sistema automtico de verificao de assinaturas computadorizado. O
primeiro alcanar uma representao que pode maximizar a distncia entre assinaturas de
indivduos diferentes. O outro seria que assinaturas da mesma pessoa se mantenham constante
uma vez que uma medida de distncia seja definida corretamente [QI & HUNT, 1994].
Duas premissas so importantes no mtodo proposto. Uma selecionar caractersticas
importantes da imagem e outra selecionar uma apropriada medida de distncia, cuja escolha
envolve sempre uma subjetividade das caractersticas das variveis e das escalas usadas para a
medio. Dentre as diversas medidas utilizadas para determinar a distncia entre elementos de

66

uma matriz de dados, as abordadas para o trabalho so: Euclidiana, Manhatan, city block ou
bloco-cidade e Euclidiana Quadrtica.
De acordo com Novaes [NOVAES, 2002] a distncia bloco-cidade se aproxima da
distncia euclidiana quando apenas um atributo diferencia dois objetos. Quando mais de um
atributo for usado, a distncia bloco-cidade tende a separar mais os objetos. Um exemplo
hipottico utilizando um atributo nas trs medidas de distncias mostrado na Figura 4.19.
O ato de classificar um padro pode ser considerado como sendo uma tarefa de
definio de pertinncia, em que devemos associar um novo elemento a um dos conjuntos
(classes) existentes, o que faz com que sua representao no espao de caractersticas assuma
a forma de agrupamento de pontos. Este aspecto de proximidade entre os elementos de um
conjunto pode ser utilizado como parmetro para a classificao de padres. A definio de
funes que sejam capazes de indicar uma medida de semelhana ou distncia entre dois
padres constitui um meio de formalizar o processo de classificao.
Euclidiana

x
vetor

Bloco-cidade
Euclidiana quadrtica

y
Figura 4.19: Preciso nas mtricas de distncia euclidiana, euclidiana quadrtica e blococidade.

4.4.1. Distncia Euclidiana

a funo de distncia mais intuitiva, sendo derivada do clculo da distncia


geomtrica entre dois pontos. A distncia euclidiana adequada para o tratamento de classes
cujos elementos tendem a se agrupar prximos mdia, ou seja, possuem varincia
desprezvel. Problemas em que as classes apresentam comportamento semelhante, quanto
forma da funo de distribuio de probabilidades e valores de varincia tambm so
indicados para o uso da distncia euclidiana.

67

A distncia euclidiana entre duas amostras xi e xj a raiz quadrada do somatrio dos


quadrados das diferenas entre os valores de xi e xj para todas as variveis, ou seja, para
k = 1,.., P [BARBEAU et al., 2002]:
d ij =

(x
k =1

ik

x jk )

(4.1)

4.4.2. Distncia Euclidiana Quadrtica

A distncia entre duas amostras xi e xj o somatrio dos quadrados das diferenas


entre os valores de xi e xj para todas as variveis, ou seja, para k = 1,.., P [BARBEAU et al.,
2002]:
P

d ij2 = ( xik x jk )2

(4.2)

k =1

4.4.3. Distncia de Manhattan Bloco-Cidade

A distncia de Manhattan se aproxima da distncia euclidiana quando apenas um


atributo diferencia dois objetos [NOVAES, 2002]. Pode-se dizer que ela uma verso
simplificada da distncia euclidiana.
A distncia entre duas amostras xi e xj o mdulo das diferenas entre os valores de xi
e xj para todas as variveis, ou seja, para k = 1,.., P [BARBEAU et al., 2002]:
P

d ij = | xik x jk |

(4.3)

k =1

4.5. Dicotomia

A identificao da autoria da escrita, mais especificamente de assinaturas, tem grande


utilizao no sistema judicirio. Uma das fundamentaes bsicas na identificao da escrita

68

que cada indivduo possui uma escrita consistente e distinguvel de outro indivduo [CHA,
2001]. Desta forma, a individualidade da assinatura se encaixa neste contexto.
Para a identificao da autoria de escrita ou assinaturas, necessrio determinar a
validade estatstica da individualidade do autor, baseando-se no desempenho das
caractersticas atravs da verificao, quantificao e anlise estatstica.
Considerando o problema de muitas classes, em que o nmero elevado de classes est
relacionado maioria dos mtodos de identificao de padres associados verificao de
assinaturas. Nota-se que os sistemas de verificao de assinaturas so freqentemente
desenvolvidos usando um nmero de classes pequeno e finito, tirado de um universo maior de
classes. Entretanto, de acordo com Cha [CHA, 2001] o agrupamento no subconjunto de
classes no prov a validade da individualidade da escrita. Sem a validade da individualidade
a deduo estatstica questionvel devido ao resultado deste modelo no poder ser deduzido
para a populao inteira. Como o objetivo da abordagem proposta a verificao de
assinaturas atravs de um mtodo com o uso mnimo de amostras por autor, a comparao da
deduo estatstica baseado no universo populacional no ser aprofundada, simplesmente
mencionada a dificuldade de se estabelecer um modelo por classe quando o problema envolve
toda a populao. Por esta razo, proposto um mtodo dicotmico para estabelecer a
distino inerente de classes, diferindo dos mtodos conhecidos como policotmicos.
No mtodo dicotmico utiliza-se um classificador que coloca um padro em uma de
somente duas categorias para estabelecer a individualidade. O problema modelado por duas
classes: autoria ou no-autoria. Dadas duas amostras, a distncia entre as caractersticas de
dois documentos computada e classificada como positiva (autoria) ou negativa (noautoria). Simbolicamente, as variveis de distncia entre caractersticas de amostras do
mesmo autor e as variveis de distncia entre caractersticas de amostras de autores diferentes
podem ser representadas pela notao (+) e (} ) respectivamente.
Uma vantagem do mtodo dicotmico a mltipla integrao de tipos de
caractersticas, as quais podem ter diversas origens. Vrios tipos de caractersticas so
mostrados na Figura 4.20, as quais podem ser integradas utilizando medidas de distncias de
acordo com Cha [CHA, 2001]. Na abordagem proposta somente caractersticas elementares
so abordadas.

69

T ip o s
C a ra c t e rs t ic a s

Elem entares

His togram a

D is c reto

Contnua

Com plexa

Binria

N om inal

O rdinal

S tring

M dulo

Figura 4.20: Hierarquia de tipos de caractersticas de acordo com Cha [CHA, 2001].

No domnio da distncia das caractersticas (mtodo dicotmico), todos os tipos de


distncias de caractersticas tornam-se valores escalares independente do tipo de
caracterstica. Em outras palavras, mltiplos tipos de caractersticas so integrados em valores
escalares de distncias de caractersticas para resolver o problema.
De acordo com Cha [CHA, 2001] enigmtico distinguir cada autor pelo nmero de
classes, este universo muito grande ou no-especificado em problemas de classificao. Para
estabelecer a inerente distino de classes, isto , a validao da individualidade, o problema
de muitas classes tratado em uma dicotomia. Neste mtodo usa-se a distncia entre duas
amostras da mesma classe e de duas classes diferentes, no havendo a necessidade de se
observar todas as classes dentro do escopo.

4.5.1. Transformao Dicotmica

Em um problema de classificao de uma categoria representando toda a populao,


tambm chamado policotomizador, h m exemplares de assinaturas de cada n pessoas (n
muito grande). Dado um exemplar de assinatura, x, de um autor desconhecido pertencente ao
universo de n autores, a tarefa determinar se x foi escrito por este autor. Como o nmero de
classes muito grande, este problema aparentemente insupervel. O mtodo dicotmico
proposto para resolver este problema, conforme a Figura 4.21.

70

Distncia de caracterstica do mesmo autor

w1
w2
w3

f2

Distncia de caractersticas de autores diferentes


2

B
B
W
W

f1
(a)

(b)

Figura 4.21: Transformao de: (a) Domnio das caractersticas (policotomia) para (b)
Domnio das distncias das caractersticas (dicotomia).
O processo demonstrado para trs autores, {w1, w2, w3}. Cada autor prov trs
assinaturas e trs valores escalares de caractersticas so extradas por assinatura. A Figura
4.21(a) mostra as assinaturas no grfico para cada escritor.
Para transformar em espao da distncia, o processo aplicado no vetor de distncia
de cada caracterstica de assinaturas do mesmo autor e o mesmo denotado por x(+) ~ A
amostra da distncia entre autores , em contrapartida, obtida medindo a distncia das
caractersticas entre duas assinaturas de autores diferentes, sendo representada por x(-) dij
representa os i autores de jassinaturas.

x( + ) = ( dij dik ) onde i = 1 at n, j, k = 1 at m e j Z

x( ) = ( dij d kl ) onde i, k = 1 at n, i ZZ j, l = 1 at m

, /
(4.5)

onde n o nmero de autores, m o nmero de assinaturas por autor, a medida de


distncia entre valores de caractersticas de duas assinaturas. A Figura 4.21(b) representa a
transformao do espao das caractersticas para o espao das distncias das caractersticas.
Uma distncia entre caractersticas do mesmo autor, W e uma distncia entre caractersticas de
autores diferentes, B, no domnio da caracterstica na Figura 4.21(a), correspondem aos
pontos W e B no domnio da distncia das caractersticas na Figura 4.21(b), respectivamente.
Desta forma, h somente duas categorias: distncia entre caractersticas de duas assinaturas do
mesmo autor e distncia entre caractersticas de duas assinaturas de autores diferentes no
domnio da distncia da caracterstica.

71

Seja n(+)

x(+) e n(-)

x(-) o tamanho da distncia das classes dos mesmos autores

e autores diferentes. Se n pessoas provem m assinaturas:


n(+) = n C 2m

(4.6)

representa o total de amostras positivas, e as amostras negativas representada por:


n(-)

m C 2n
2

(4.7)

j o total geral de amostras calculado por:


n(+) + n(-)

C 2mn

(4.8)

Uma maneira de representar figurativamente mltiplas caractersticas plotar os


valores das distncias de cada caracterstica em um vetor de distncias multidimensional. A
Figura 4.22 ilustra os valores de distncias no espao 3D {dist(b), dist(c), dist(e)}
figurativamente. Similarmente ao espao unidimensional, a distncia intraclasse tende em
direo origem enquanto a distncia entre classes tende a se distanciar da origem.

Figura 4.22: Distribuio das distncias das caractersticas no espao 3D.

Utilizando o fato que a distncia intraclasse menor, o dicotomizador determina o


limite de deciso intraclasse e entre classes. Uma boa maneira de representar a relao entre
duas classes calculando a curva entre duas distribuies, que descreve o comportamento de
duas populaes figurativamente sem perda de generalidade. O erro Tipo I, ocorre quando o
mesmo autor da assinatura identificado como autor diferente e o erro Tipo II, ocorre
quando duas assinaturas de autores diferentes so identificados como mesmo autor como
mostra a Figura 4.23.

72

Figura 4.23: Distribuio do erro Tipo I e Tipo II.


Sendo o limite de deciso representado por T , e so calculados por:

(dicotomizador(dij,dkl) )

(4.9)

Pr(dicotomizador(dij,dkl) < T | i )

(4.10)

4.5.2. Comparando Policotomia e Dicotomia

Um inconveniente da abordagem dicotmica que ela pode fracassar para detectar


diferenas entre w1 e w2 as quais no diferem grandemente no domnio das distncias, embora
sejam diferentes geometricamente no espao de caractersticas [CHA, 2001], conforme
Figura 4.24.

f2

>

AUTOR 1

AUTOR 3
AUTOR 2
(a)

f1

(b)

Figura 4.24: Comparao entre (a) Domnio das caractersticas (policotomia) e (b) Domnio
das distncias das caractersticas (dicotomia) [CHA, 2001].

73

Para um melhor aproveitamento do mtodo seria desejvel que todas as distncias


entre elementos da mesma classe (autor) no domnio da caracterstica pertencessem tambm
mesma classe, no domnio da distncia da caracterstica. Similarmente, o ideal seria que todas
as distncias entre duas classes diferentes no domnio da caracterstica, pertencessem a classes
diferentes no domnio da distncia entre caractersticas. Infelizmente, isto nem sempre ocorre;
classes perfeitamente agrupadas no domnio da caracterstica podem no ser perfeitamente
representadas pela dicotomia no domnio da distncia [CHA, 2001]. A comparao na
abordagem dicotmica relativa para uma populao e crucialmente afetada pela escolha e
diversidade da populao. O objetivo inicial deste trabalho validar a individualidade de
assinaturas estatisticamente, no detectar as diferenas particulares de instncias distintas.
Na abordagem dicotmica pode-se utilizar uma quantia ilimitada de amostras de cada
classe, desde que estas novas amostras tambm sejam mapeadas dentre duas possveis classes,
em que a distribuio das amostras pode ser usada para a deduo da distribuio da
populao inteira, neste caso semelhante abordagem policotmica.
Para Cha [CHA, 2001], o qual aborda a individualidade da escrita e a deduo
estatstica, o modelo dicotmico representa uma melhor deduo estatstica do que o modelo
policotmico. Cha [CHA, 2001] afirma que o modelo policotmico no capaz de deduzir
estes resultados para a populao toda, pelo fato de existirem classes invisveis.
Uma relao pode ser estabelecida entre aplicao e preciso. Quando h uma
quantidade grande de amostras de cada indivduo difcil a sua aplicao. Desta forma, podese desejar transformar o domnio das caractersticas no domnio das distncias das
caractersticas, em que se obtm grandes amostras para ambas as classes, tornando o problema
tratvel por uma deduo estatstica. Os resultados porm nem sempre sero satisfatrios, de
acordo com Cha [CHA, 2001].
Quando h um pequeno nmero de classes, em que se pode ter cada amostra de cada
classe, o mtodo policotmico pode ser usado para validar a individualidade das classes.
Entretanto, nada impede de se utilizar o dicotomizador mesmo em problemas com poucas
classes.
A abordagem proposta apresenta grandes diferenas do modelo individual
policotmico. Nos modelos policotmicos um nmero de amostras genunas de um autor em
especfico capaz de representar a variao pessoal da classe w1, sendo capaz de discriminar
outros autores e todos os tipos de falsificaes, gerando um modelo pessoal robusto, conforme
Figura 1.4.

74

4.5.3. Resumo da Abordagem Dicotmica

Na abordagem dicotmica [CHA. 2001], dada duas imagens de documentos aleatrios,


o problema de verificao determinar se as dois documentos foram escritos pela mesma
pessoa com dois tipos de probabilidades de erros de confuso. A Figura 4.25 descreve o
processo de transformao dicotmica, onde fv ij a i-esima caracterstica de j-esimo
documentos do vetor de caractersticas fv, e fvd o ltimo vetor de caracterstica do documento.
docx

docy

( fv , fv ,.., fv )
( fv , fv ,.., fv )
x
1

Extrao de
Caractersticas

x
2

y
1

x
d

y
2

y
d

d ( fv1x , fv1y )
Distncias
Computadas

d ( fv 2x , fv 2y )

.
.
.
.

d fv dx , fv dy

Dicotomizador

Mesmo / Diferente
Autor

Figura 4.25: Processo de Verificao e transformao dicotmica baseada em [CHA, 2001].


Primeiro, as caractersticas so extradas de ambas as imagens docx e docy:

( fv1x , fv 2x ,.., fv dx ) e

( fv

y
1

, fv 2y ,.., fv dy ). Ento cada distncia de caracterstica computada:

{ d fv1x , fv1y ,..., d fv dx , fv dy }. O dicotomizador recebe o vetor das distncias destas


caractersticas como entrada. Aps, o modelo treinado e a sada representa a autoria.

4.6. Comentrios Finais

A metodologia proposta apresentada neste captulo relacionada ao problema de


verificao de assinaturas detalhada em pontos essenciais necessrios para a abordagem
como: o grafismo, englobando tanto a grafoscopia quanto a grafologia, o uso das medidas de
distncias e a dicotomia que representam os pilares do mtodo proposto. No prximo captulo
apresentado a viso do perito na anlise de assinaturas questionadas, assim como as etapas
que envolvem o mtodo proposto.

Captulo 5

5. Mtodo Proposto

Neste captulo detalhado o mtodo proposto para a verificao de assinaturas.


apresentado a viso do perito grafotcnico aplicada anlise de assinaturas questionadas em
comparao com um modelo computacional, assim como as fases que compe o processo de
verificao de assinaturas.

5.1. Viso do Perito na Anlise de Assinaturas Questionadas

As tcnicas forenses convencionais utilizadas na anlise de documentos questionados


por peritos grafotcnicos, mais especificamente em assinaturas, so de suma importncia na
elaborao de uma abordagem automtica nesta rea, conforme visto na seo 4.3. Com base
neste estudo, procura-se montar uma estrutura que utilize todos os recursos da grafoscopia,
procurando tambm simular a viso que o perito tem no processo de anlise de um documento
questionado, dentro de um mtodo computacional. Para este propsito, somente duas classes
do modelo so usadas pelos peritos, as que classificam uma assinatura em genuna w1 ou no
genuna w2 , esta ltima representada pelos diversos tipos de falsificaes (simples, simulada e
aleatria), confira a Figura 5.1.
A idia baseada em um processo de comparao, em que o perito, de posse de
algumas amostras genunas do autor analisado, compara com a amostra questionada tendo
como base caractersticas grafotcnicas. O processo de deciso baseado em uma mtrica de
similaridade da amostra questionada em relao a todas as amostras genunas.

76

Es pao 2D us ado no P roc es s o de Anlis e P eric al


d1
a ssin a t ur a s
ge n u in a s

lim ia r de de c is o

C o n ju n t o de V e r if ic a o

w1

a ssin a t ur a s
n o ge n u in a s

w1

A ssin a t ur a s
aut o r
aut o r
aut o r

w2

A ssin a t ur a s n o G e n un a s
F a lsif ic a e s

G e n un a s
1
2
3

w2

d2

Figura 5.1: Modelo geral usado na percia grafotcnica de verificao de autenticidade de


assinaturas.

Com base no modelo da viso pericial, um modelo computacional pode ser


estruturado. Matematicamente, o perito de posse de um conjunto de m assinaturas genunas Ski
(i=1,2,3,,m)

usa as mesmas em comparao com uma assinatura questionada SQ. O perito

observa a medida de diferena Di

(i=1,2,3,,m),

entre as F caractersticas grafomtricas do

conjunto de assinaturas genunas, fVki,j(i=1,2,3,,m)(j=1,2,3,,F) e caractersticas da assinatura


questionada, fVQj(j=1,2,3,,F). Aps este procedimento toma a deciso Ri (i=1,2,3,,m). O relatrio
final de deciso D depende da soma das decises parciais, obtido atravs destas comparaes,
conforme a Figura 5.2.

77

A ssinatura G enuina
SK 1

A ssinatura Q uestionada
SQ

SK 2
SK 3
SK 4
SK n
E xtrao de Caractersticas

fVKij(i =1,2,3,...,m)( j =1,2,3,...,F ) f VQj ( j =1, 2, 3,..., F )


A nlise das dif erenas encontradas

Di = { fVKi f VQ }

Comparao

Ri (i =1, 2,3,...,m)
m

D = Ri

R elatrio de deciso
pericial

i =1

Figura 5.2: Esquema do processo de deciso na verificao de assinaturas off-line baseado


na viso pericial.
O procedimento utilizado pelos peritos propicia o desenvolvimento de uma nova
abordagem que incorpora as caractersticas da grafoscopia, dicotomia e medidas de distncias.
Cha [CHA, 2001] props um mtodo para estabelecer a autoria da escrita, usando medidas de
distncias das caractersticas extradas em um processo de dicotomizao, o qual a base para
se produzir um mtodo que discrimine assinaturas genunas e falsificaes. As etapas deste
processo esto descritas na seo seguinte.

78

5.2. Etapas no Processo de Verificao de Assinaturas

Um sistema de verificao automtica de assinaturas requer cuidados adicionais


associados com algumas etapas, conforme a Figura 5.3(b) demonstra, em comparao com a
anlise pericial, Figura 5.3(a).
T om ada de D eciso P ericial

E tapas no P rocesso de V erif icao


de assinaturas

SQ1

SK 1

SQn

..............

..............

SK n

E xtrao de Caractersticas

f VKij ( i =1, 2, 3,..., n )( j =1, 2, 3,..., F )

A q u isi o
P r tra ta m e n to
S e g m e n ta o

E x tra o d e
C a ra c te rstic a s

f VQj ( j =1, 2, 3,..., F )

A nlise das dif erenas encontradas

D ist n c ia s
C o m p u ta d a s

P ro d u o d o
m o d e lo

D e c is o

M o d e lo

Di = { fVKi f VQ }
Com parao

Ri ( i =1, 2 ,3,..., n )
R elatrio de
deciso pericial

D = Ri
i =1

(a)

m e sm o a u to r /
a u to r d ife re n te

(b)

Figura 5.3: Um comparativo nas etapas no processo de verificao de assinaturas: (a)


processo de anlise e deciso pericial; (b) processo computacional proposto.

Na maioria das abordagens relacionadas a problemas de classificao de manuscritos,


em especfico na verificao de assinaturas, algumas etapas so essenciais e devem fazer parte
do processo como um todo:

79

Aquisio dos dados, a imagem da assinatura produzida atravs de um scanner,


e a assinatura aparece como uma imagem;

Pr-processamento, preparao para extrao de caractersticas atravs de


alinhamento da imagem, limiarizao e esqueletizao;

Segmentao, particionamento da imagem em clulas, atravs de um grid, para


tratamento do traado a nvel local.

Extrao de caractersticas (primitivas), nesta etapa so selecionadas as


propriedades mais relevantes que representam a assinatura;

Distncias entre caracterstica, diferena entre os vetores de caractersticas


extradas, usadas na entrada da produo do modelo e no processo de deciso.

Produo de um modelo, um conjunto de referncia de assinaturas gerado para


se realizar o processo comparativo;

Processo de deciso, avaliada a sada do modelo produzido, verificando se a


assinatura pertence mesma classe ou classes diferentes.

A seguir cada uma das etapas detalhada, demonstrando os aspectos genricos e as


particularidades encontradas em termos do mtodo verificao de assinaturas proposto.

5.2.1. Aquisio e Pr-processamento

Pelo fato da maioria das imagens j terem sido coletadas, adquiridas, tratadas e
estarem armazenadas no LARD (Laboratrio Anlise e Reconhecimento de Documentos) do
PPGIA (Programa de Ps-Graduao de Informtica Aplicada da PUC-PR), o processo de
aquisio resume-se coleta de 560 imagens adicionais, adquiridas conforme os moldes do
trabalho de Justino [JUSTINO, 2001].

5.2.1.1. Base de dados

Um dos fatores importantes para avaliar o desempenho de um mtodo para a


verificao de assinaturas a anlise da composio da base de dados usada para validar os
procedimentos de aprendizado e testes. Ela deve conter um nmero mnimo de autores que

80

permita a validao estatstica. Outro fator relevante o nmero de espcimes por autor a ser
utilizado, que deve representar satisfatoriamente as variaes de cada autor.
Na base do LARD, as imagens j esto recortadas em tamanho fixo de (3 x 10 cm),
com 256 nveis de cinza em papel com fundo branco e densidade de 300 dpi, sem
interferncias de rudos ou imagens pr-impressas. Possuindo inicialmente um total de 5200
imagens de assinaturas de 100 autores, em que cada autor cede 40 assinaturas originais e os
60 primeiros, 10 falsificaes simples e 10 simuladas. Com a aquisio de 140 autores base,
cada um provendo 4 assinaturas genunas, um total de 5760 imagens de assinaturas fazem
parte da base de dados atualmente.
Um problema encontrado na confeco da base de dados, a dificuldade de se coletar
um nmero grande de amostras de assinaturas autnticas da mesma pessoa. Segundo Fang
[FANG et al., 2003] uma razo seria devido natureza confidencial de assinaturas pessoais.
Outra razo a variao dos padres de assinaturas manuscritas no decorrer do tempo
[KHOLMATOV, 2003].
De acordo com Fang [FANG et al., 2003] para se obter uma estimativa real das
variaes, as assinaturas deveriam ser coletadas em um nmero de sesses programadas sobre
um longo perodo. Entretanto, isto invivel. Conseqentemente, o nmero de amostras de
treinamento de um escritor freqentemente insuficiente. Na abordagem proposta este
problema no se torna to relevante devido necessidade de um nico treinamento. Desta
forma assinaturas coletadas em perodos regulares ou irregulares tendem a possuir distncias
semelhantes de suas caractersticas iniciais, se comparadas com assinaturas da mesma poca
da coleta, fazendo com que as mesmas sempre se enquadrem na classe das genunas.
O protocolo de diviso da base de dados que ser apresentado nos resultados do
captulo 6 baseado em Cha [CHA, 2001] como visto na seco 4.5. Nesta abordagem, as
amostras passam a ser representadas pelas distncias computadas entre caractersticas de duas
assinaturas e, no mais as caractersticas extradas de cada assinatura. Desta forma, ocorre
uma combinao entre as distncias de caractersticas das assinaturas com o objetivo de obter
um nmero maior de amostras intra e interclasse.

5.2.1.2. Pr-processamento

O pr-tratamento ou pr-processamento, em decorrncia do fato das imagens no


apresentarem rudos, resume-se em:

81

Limiarizao das imagens em nveis de cinza. Neste processo so utilizados


mtodos diferenciados dependendo da primitiva extrada. O mtodo global por
entropia de Abutaleb [ABUTALEB, 1989] previamente aplicado na base em
nveis de cinza com intuito de tornar o traado mais espesso, juntamente com
processos morfolgicos de abertura e de fechamento para a retirada de pequenos
rudos ainda existentes. A aplicao deste mtodo favorece as caractersticas
estticas e os segmentos mais relevantes. J o mtodo global de Otsu [OTSU,
1979], usado mais especificamente para as caractersticas pseudodinmicas, pois
fornece uma representao mais fiel do traado original;

Operao morfolgica de abertura e fechamento. O operador de abertura


remove todos os pontos menores que o elemento estruturante utiliza. O operador
de fechamento, ao contrario, preenche os buracos e concavidades menores. Ambos
fechamento e abertura suavizam uma imagem [KHOLMATOV, 2003] e
[JUSTINO, 2001].

Extrao do ncleo da imagem da assinatura atravs de um processo de


afinamento. Neste mtodo aplicado por Huang [HUANG & YAN, 1997], o intuito
de extrair primitivas invariantes a densidade do traado. Huang [HUANG &
YAN, 1997] usam a tcnica nas imagens em nveis de cinza. No mtodo proposto
a tcnica aplicada nas imagens limiarizadas .

Mapeamento da imagem limiarizada sobre a imagem em nveis de cinza. Para


a extrao de primitivas em nveis de cinza, uma sobreposio de imagem
limiarizada por Otsu na imagem original em nvel de cinza aplicada, desta forma
prevalece o fundo branco e o traado em nvel de cinza.

Centralizao das imagens. Neste processo h o deslocamento do centro de


gravidade da imagem para corrigir variaes de traado na coleta das imagens.

Alinhamento esquerda das imagens. No processo de alinhamento esquerda


desloca-se a imagem da assinatura no canto esquerdo da rea retangular aps o
deslocamento do seu centro de gravidade. Esta estratgia aplicada devido ao
nvel de coincidncia dos pixels de imagens sobrepostas, o que garante um maior
aproveitamento na extrao das caractersticas, conforme exemplo da Figura 5.4. O
mesmo processo aplica-se em cada autor usado no conjunto de validao do
sistema. Os autores cedem 3 assinaturas cada. Estas assinaturas so sobrepostas

82

computando-se o nmero de pixels que ocupam o mesmo espao grfico nas 3


imagens. Ao final observa-se um nvel percentual de coincidncia maior do que
comparando o mesmo processo com imagens somente centralizadas.

(a)

(b)
Assinatura 1 : 16.337 pixels
Assinatura 2 : 16.348 pixels
Assinatura 3 : 16.263 pixels

(c)
Coincidentes : 5.268 pixels
Percentual :
32 %

Figura 5.4: Estratgia de alinhamento a esquerda: (a) Assinatura Original (b) 3 assinaturas
originais sobrepostas (c) Nvel de coincidncia de pixels.

5.2.2. Segmentao

Emprega-se uma grade ou grid como ferramenta de segmentao em todas as


caractersticas extradas. O grid utilizado extensivamente em mtodos de verificao
automtica de assinaturas off-line [SABOURIN & GENEST, 1994], [HUANG & YAN, 1997]
e [JUSTINO, 2001]. Estes trabalhos tambm demonstram como os mtodos baseados em grid
podem ser adaptados para caractersticas grafomtricas.
As caractersticas geomtricas globais tratam uma imagem de assinatura como uma
identidade integrada e no so capazes de prover informao estrutural de elementos de
imagens, como o ngulo de um canto e a curvatura de um arco. Este tipo de informao
estrutural obtida usando um grid o qual sobreposto em uma imagem [QI & HUNT, 1994].
Autores como Sabourin e Genest [SABOURIN & GENEST, 1994], Qi e Hunt [QI &
HUNT, 1994] e Justino [JUSTINO, 2001] dividem a imagem em clulas para trat-las
localmente como primitivas. Um grid pode ser utilizado desde que no ultrapasse os limites
da rea destinada assinatura, requisito que satisfeito pela base utilizada.

83

Sendo os segmentos unidades elementares das assinaturas, esses possuem formas e


comprimentos variados, tornando-se difcil a avaliao de sua importncia no contexto geral
da assinatura. A anlise local de uma clula de grid permite a adoo de critrios de seleo
desses segmentos. Deve-se lembrar tambm, que a ausncia de segmentos pode ser relevante,
como nos espaos em branco entre dois ou mais blocos de uma assinatura, ou mesmo a
anlise de ocupao do espao grfico. Todas estas caractersticas podem ser absorvidas
atravs do uso do grid, j que se trata de uma segmentao abrangente [JUSTINO, 2001].
A Tabela 5.1 apresenta um conjunto de resolues com relao segmentao
horizontal e vertical que so utilizadas no mtodo.
Tabela 5.1: Segmentao com mltiplas resolues.
Resoluo das
clulas
Baixa
Baixa
Mdia
Mdia
Mdia
Alta
Alta

Nmero de clulas
verticais
4
4
8
10
10
20
25

Nmero de clulas
horizontais
10
63
20
25
63
20
63

Nmero de pixels
na vertical
100
100
50
40
40
20
16

A estratgia empregada de utilizar toda a rea horizontal e vertical, pr-fixando o


tamanho do grid para todas as imagens desta forma preparando a fase seguinte de extrao de
primitivas as quais necessitam de tamanhos fixos, ao contrrio de Justino [JUSTINO, 2001]
que utiliza a rea toda somente na vertical. J na horizontal o limite o incio e fim da
assinatura. Os exemplos das segmentaes que se utiliza no mtodo esto demonstrados na
Figura 5.5.
Conforme captulo 6, os melhores resultados so com resolues mdias de clulas
quadradas , mais especificamente 8 linhas por 20 colunas, que corresponde a 50 x 50 pixels.

84

(a)

(b)

(c)

(d)

(e)

(f)

(g)
Figura 5.5: Exemplos de Segmentaes utilizadas no mtodo representando clulas verticais
por horizontais: (a) 4x10; (b) 4x63; (c) 8x20; (d) 10x25; (e) 10x63; (f) 20x20; (g) 25x63.

5.2.3. Extrao das Primitivas

Projetar bons extratores de caractersticas para sistemas verificadores de assinaturas,


ainda um grande obstculo, dada a complexidade do problema [MARAR et al., 2002]. A
escolha de caractersticas significativas constitui-se em uma etapa essencial na elaborao de
um mtodo de verificao, e a representao computacional destas caractersticas reflete

85

diretamente nos resultados obtidos, pois a robustez do mtodo cresce proporcional qualidade
das mesmas. O estudo apresentado na seo 4.3 fornece subsdios para a escolha das
primitivas relevantes.
As caractersticas estticas referem-se forma, tais como o comprimento e a altura.
Elas so representadas tambm pelo comportamento esttico da escrita, podendo
perfeitamente serem representadas pela densidade de pixels, e pelo centro de gravidade, as
quais incorporam vrias caractersticas da grafoscopia e grafologia como calibre, proporo,
espaamento, altura, largura, dimenso, regularidade e proporo. J as pseudodinmicas,
representam o comportamento dinmico da escrita e portanto esto relacionadas diretamente
com os traos da assinatura. As primitivas efetivamente implementadas desta categoria so:
pontos de presso, incio e fim abrupto, segmentos de tremor, inclinao axial e curvatura.
Uma descrio detalhada da implementao das primitivas apresentada a seguir.

5.2.3.1. Pontos de Presso

Nesta primitiva, ao invs de se usar imagens binrias, usada a imagem original em


nveis de cinza. A razo que padres em nveis de cinza contm mais informaes na
presso da caneta. Presses mais altas correspondem as pixels mais escuros e possivelmente a
alta velocidade corresponde a lanadas mais finas [FANG et al., 2003].
Huang e Yan [HUANG & YAN, 1997] utilizam pontos de presso calculando a
diferena entre a mxima e mnima intensidade de nveis de cinza, estabelecendo um limiar
fixo, sendo que pixels que extrapolam este limiar correspondem a regies com alta presso.
J em Cavalcanti [CAVALCANTI et al., 2002], a informao de presso calculada baseada
em HPR (regies de alta presso) dadas pela equao (5.1). Nesta equao, I a imagem
original, Ihp a imagem com HPR e THP o limiar de alta presso. O THP definido usando
um histograma da imagem I.
255, se I (i, j ) THP
I hp =
0, caso contrrio

(5.1)

Para o problema proposto, a estratgia encontrar todos os pontos de presso que


fazem parte do traado. Desta forma, determinada a mdia dos nveis de cinza com base
na somatria dos nveis de cinza do traado de cada pixel gp da clula. Aps, divide-se o
resultado pela quantidade total de pixels do traado dentro da mesma clula Nc, conforme
equao (5.2). A partir deste limiar da presso, estabelecida a presso celular gcel para cada

86

clula em que os mesmos so normalizados pelo valor mximo do nvel de cinza que a clula
pode receber, equao (5.2), os quais representam a presso efetiva da clula.
Atravs de um mapeamento da imagem limiarizada sobre a imagem original em nveis
de cinza, resulta uma terceira imagem IRES, esta com fundo branco e segmentos pertencentes
ao traado em nvel de cinza, que usada como base para a extrao da primitiva.
mxn

=
g cel =

g
k =0

(5.2)

Nc

255

(5.3)

A Figura 5.6 demonstra uma imagem original em nveis de cinza, Figura 5.6(a), a
imagem com traado em nveis de cinza e fundo branco plotado no grid, Figura 5.6(b) e o
resultado da presso celular com seus respectivos valores, Figura 5.6(c).

(a)

(b)

(c)
Figura 5.6: Primitiva de pontos de presso (a) imagem original (b) imagem plotada no grid (c)
valores de presso encontrado em cada clula da imagem.

87

5.2.3.2. Incio e fim abrupto

O objetivo desta caracterstica basicamente estabelecer os pontos finais e os pontos


iniciais de cada segmento, conforme exemplo descrito na seo 4.3.1.8. Malaviya e Peters
[MALAVIYA & PETERS, 1997] tratam esta caracterstica em caracteres manuscritos
individuais.
A extrao do incio e fim abrupto segue as seguintes etapas:

A imagem da assinatura limiarizada atravs do algoritmo de Otsu [OTSU, 1979];

A imagem limiarizada esqueletizada;

Um grid aplicado na imagem esqueletizada;

Os pontos de incio e fim que cada segmento da assinatura possui so mapeados,


atravs de um algoritmo que percorre os pixels dentro de cada clula da imagem
esqueletizada. Uma mscara de 8-vizinhos aplicada com objetivo de encontrar os
pixels com um nico vizinho, que representa o incio ou final de um segmento
Ie(x,y)

Cada clula dividida em sub-clulas com o objetivo de encontrar mais de um


segmento inicial ou final. Neste caso, todos os segmentos so armazenados para
uma posterior mdia;

A imagem limiarizada mapeada sobre a imagem original em nveis de cinza que


resulta em uma terceira imagem resultante IRES com fundo branco e segmentos
pertencentes ao traado em nvel de cinza;

O posicionamento exato de cada pixel candidato ao incio e final abrupto Ie(x,y)


encontrado com a sobreposio dos mesmos na imagem IRES desta forma, podendo
computar a presso desta regio atravs da equao (5.2) e equao (5.3);

Cada ponto mapeado apresenta um valor contnuo, representando a rigidez ou leveza


nos pontos de incio ou finalizao do traado. Valores discretos testados em experimentos,
demonstram menor poder discriminante em termos de taxas de erro. O processo desde a
esqueletizao, at a marcao dos pontos correspondentes a provveis paradas ou incios
abruptos, pode ser resumido conforme a Figura 5.7.

88

(a)

(b)

(c)

(d)

Figura 5.7: Primitiva de incio e fim abrupto (a) imagem original (b) imagem esqueletizada
(c) pontos circulados correspondentes a inicio ou fim do segmento no grid (d) pontos de
inicio e fim correspondentes na imagem original plotado no grid.

5.2.3.3. Segmentos com Tremor

Representa uma caracterstica pseudodinmica caracterizada pela dinmica do traado,


abordada por Justino [JUSTINO, 2001]. Inicialmente a imagem limiarizada com o algoritmo
de Abutaleb [ABUTALEB, 1989], o qual torna os segmentos mais espessos e desta forma
pode-se medir o nvel de tenso do traado. Para isto seleciona-se o segmento mais
significativo (ou mais longo) da imagem limiarizada. No segmento mais significativo
aplicado uma esqueletizao. O clculo da taxa de variao direcional Tx dos pixels conexos,
medido atravs do percurso dos segmentos baseado em cdigo de cadeias com oito pontos de
cdigos. Neste ponto computada as transies percorridas CT, as quais so normalizadas
pelo comprimento do segmento Cs, ou seja:
Tx =

CT
Cs

(5.4)

Conforme a figura 5.8 h uma descrio com um exemplo detalhado da primitiva


segmentos de tremor.

89

Cdigo de Cadeia
7

0
1

2
3

5
4

(a)

Segmento analisado de acordo com cdigo cadeia


Seqncia: 10100101010 (9 transies)
Comprimento: 11 pixels
Smbolo: 9 = 0,818182
11

(b)

Figura 5.8: Primitiva segmentos de tremor (a) processo de extrao dos segmentos mais
longos plotados no grid e utilizao do cdigo de cadeia (b) resultado do nvel de tenso do
segmento.

90

5.2.3.4. Densidade de pixels

Representa uma caracterstica esttica que abordada por vrios autores como Justino
[JUSTINO, 2001], Baltzakis [BALTZAKIS & PAPAMARKOS, 2000] e Zhang [ZHANG et
al., 1998]. Na abordagem proposta, a estratgia adotada a contagem de pixels pretos Np
dentro de toda extenso de cada clula (m . n) em uma imagem limiarizada.
mn

Cp =

Np
k =0

mn

(5.5)

Esta primitiva possui a virtude de incorporar um descritor estatstico, o que propicia a


sua insensibilidade s variaes intrapessoais, conforme a Figura 5.9.

Figura 5.9: Primitiva densidade de pixels (a) imagem limiarizada (b) imagem plotada no grid
com segmento extrado para a contagem de pixels.

5.2.3.5. Inclinao Axial

A inclinao axial uma primitiva pseudodinmica que abordada por Qi e Hunt [QI
& HUNT, 1995] e Justino [JUSTINO, 2001] e descreve o aspecto dinmico do traado. De
acordo com Justino [JUSTINO, 2001] uma anlise global da inclinao axial pode induzir a
um processo de generalizao, levando assim ao aumento da taxa de erro da falsa aceitao.
Isso pode ocorrer principalmente envolvendo as falsificaes simuladas.
Na extrao desta primitiva uma anlise local envolvendo cada clula aplicada. O
processo computa o nmero de ocorrncias de cada um dos elementos estruturantes descritos
na Figura 5.10(a). O elemento estruturante de maior ocorrncia, dentro da clula, passa a
representar o smbolo da mesma, Figura 5.10(b). Basicamente o processo representa uma
normalizao discreta dos smbolos que cada segmento forma na aplicao do elemento
estruturante 8-vizinhos.

91

Elemento Estruturante com


8 vizinhos
1

2
3

4
x
5

6
7
8

Conjunto de Smbolos
0
0
0

1
x
1

0
0
0

0
1
0

0
x
0

0
1
0

0
0
1

0
x
0
3

1
0
0

1
0
0

0
x
0

0
0
1

(a)

(b)
Figura 5.10: Primitiva inclinao axial (a) Conjunto de elementos estruturantes que
representam os tipos de inclinao axial da clula (b) Imagem esqueletizada com os valores
correspondentes da inclinao axial.

5.2.3.6. Curvatura

Esta primitiva pode ser implementada sob vrias formas. Em Rigoll e Kosmala
[RIGOLL & KOSMALA, 1998] os ngulos absolutos entre dois pontos (X) )l )
consecutivos da imagem so computados, como tambm a diferena entre estes ngulos
(sen D)l ), conforme figura 5.11:

Figura 5.11: Primitiva implementado por Rigoll e Kosmala [RIGOLL & KOSMALA, 1998]
ngulo absoluto e diferena angular.

92

Nesta caracterstica pseudodinmica a imagem limiarizada, com o algoritmo de


Abutaleb [ABUTALEB, 1989], usada no processo de esqueletizao Ie. Atravs de um
algoritmo de busca, o segmento mais significativo dentro de cada clula do grid, detectado,
baseado em cdigo de cadeias com oito pontos de cdigos, percorrido o segmento
encontrado. Neste ponto, a variao angular de 45, caso a direo do prximo ponto do
segmento em relao ao anterior seja no sentido anti-horrio e 45, caso a direo seja no
sentido horrio. Ao final o valor em graus encontrado corresponde curvatura do segmento
analisado. Podendo variar em uma escala de 495 at 495, sendo estes ltimos valores
representando a mais de uma volta completa em um segmento, como por exemplo um bucle
ou espiral demonstrado na Figura 4.18(f). Um ponto interesse nesta primitiva est relacionado
com pequenas variaes no sentido direcional do segmento, as quais no interferem no
resultado final, conforme na Figura 5.12.

Cdigo de Cadeia
7

-45

+45

2
3

5
4

Figura 5.12: Diagrama do processo de extrao da primitiva curvatura.

93

5.2.3.7. Centro de Gravidade

A caracterstica do centro de gravidade abordada por Justino [JUSTINO et al.,


2003], e tem por objetivo determinar o posicionamento da concentrao estatstica de pixels
dentro de cada clula. Na extrao desta primitiva no mtodo proposto, primeiramente
aplicado o grid sobre a imagem limiarizada, em seguida determina-se o centro de massa de
cada segmento, ou seja, um ponto central de acordo com a maior concentrao de pixels.
Aps esta etapa calcula-se a distncia d da origem da clula at o ponto do centro de massa
atravs da distncia euclidiana. Para normalizar este processo, o valor encontrado dividido
pela distncia da origem at o canto oposto da clula que corresponde maior distncia dentro
da clula. A Figura 5.13 apresenta o processo de extrao da primitiva centro de gravidade.

(a)

(b)

(c)
Figura 5.13: Primitiva centro de gravidade (a) imagem limiarizada plotada no grid e
alinhada a esquerda (b) centro de massa de cada clula (c) distncia euclidiana d do
centro de massa origem.

94

5.2.4. Clculo das Distncias entre as Primitivas

A classificao depende significativamente das medidas de distncias, portanto


importante a escolha de uma medida de distncia satisfatria. Neste experimento trs tipos
distintos de distncias so testadas conforme seo 4.4: distncia euclidiana, distncia
euclidiana quadrtica e bloco cidade.
Aps a extrao, um vetor com as caractersticas gerado. Pelo fato deste vetor ser de
tamanho fixo, a maneira mais natural compar-lo com o uso de medidas de distncias.
Entretanto isto produz uma mtrica de similaridade pobre, desde que as caractersticas
correspondentes no vetor so distorcidas devido variao natural entre assinaturas genunas.
Conseqentemente,

necessidade

de

um mtodo

que

relacione

caractersticas

correspondentes de dois vetores de uma maneira no-linear.


Outro aspecto est associado abordagem dicotmica, a qual prope um modelo
genrico de aprendizagem, com um nico treinamento utilizado. Os resultados so
indesejveis se somente as caractersticas de vrios autores so submetidas diretamente ao
classificador. Desta forma, a utilizao de medidas de distncias entre as caractersticas
extradas utilizada, pois distncias entre caractersticas de amostras do mesmo autor
independente do autor, tendem a ser menores do que distncias de caractersticas entre autores
diferentes [CHA, 2001].
No clculo das distncias, primeiramente, toda a base de dados convertida dentro de
um conjunto de vetores de caractersticas, os quais so obtidos de ambas as assinaturas SKi e
SQ, equao (5.6) e equao (5.7).
fv KiF

( i =1, 2 ,...,n )

= ( fi1F , fi 2F ,

fv QF = ( f 1F , f 2F ,

(5.6)

fi dF )

(5.7)

f dF )

onde F(1 F 7) representa o subconjunto de caractersticas e d o nmero mximo de clulas


de cada caractersticas. O vetor de distncias Dfi

(i=1,2,3,,n)

entre o vetor de caractersticas

genunas e o vetor de caractersticas de amostra questionada computado para se obter a


entrada no classificador (rede MLP ou SVM), no treinamento, validao e teste. Nesta
abordagem, as medidas de distncias usadas so: euclidiana, euclidiana quadrtica e blococidade conforme equao (5.8), (5.9) e (5.10) respectivamente.

95

Df i

=  ( fv kiF fv QF )

Df i

=  ( fv kiF fv QF )

Df i

=  fv kiF fv QF

( i =1, 2 ,...,n )

F =1

(5.8)

( i =1, 2 ,..., n )

F =1

(5.9)

( i =1, 2,..., n )

F =1

(5.10)

Na Figura 5.14 ilustrado o clculo das distncias e a transformao dicotmica utilizando F


= 7. O processo pode ser descrito em: dada uma assinatura genuna x e outra assinatura
questionada y, tomando como base um grid com clulas quadradas de tamanho 50x50 pixels,
Aplica-se cada uma das primitivas sobre as duas imagens gerando um vetor com 160 posies
(d = 160) representando o nmero de clulas. O vetor da primitiva densidade de pixels para a
imagem x representado por
abrupto

x ),
(DEN1x .....DEN160

pontos de presso

x .... PRE x ) , incio e fim


(PRE161
320

x .... ABR x ) , segmentos de tremor (TRE x ......TRE x ) , inclinao axial (INC x ...... INC x ) ,
(ABR321
480
481
640
641
800

curvatura

x ....CUR x )
(CUR801
960

e centro de gravidade

x .... BAS x ) .
(BAS961
1120

O mesmo procedimento

aplicado na imagem y. No final um vetor de at 1120 posies usado com uma mtrica de
distncia na entrada da produo do modelo, o qual descrito na prxima seo.

x
...

P
R

I
...

M
I
T
I
V
A
S

x )
(DEN1x .....DEN160
x .... PRE x )
(PRE161
320
x
x )
(ABR321.... ABR480
x ......TRE x )
(TRE481
640
x ...... INC x )
(INC641
800
x
x )
(CUR801....CUR960
x
x
(BAS961.... BAS1120 )
y )
(DEN1y .....DEN160
y
y )
(PRE161....PRE320
y
y
(ABR321
.... ABR480 )
y
y
(TRE481
......TRE 640 )
y
y
(INC641
...... INC800 )
y
y
(CUR801
....CUR960 )
y
y
(BAS961
.... BAS1120 )

D
I
S
T

(
)
(
)
(
)
y
x
d (TRE 481 ......TRE 640 )
x ...... INC y )
d (INC 641
800
y
x
d (CUR801 ....CUR960 )
y
x
d (BAS 961 .... BAS1120 )
y
d DEN1x ..... DEN160
x .... PRE y
d PRE161
320
x .... ABR y
d ABR321
480

L
A
S
S
I

...

F
I
C

Figura 5.14: Descrio do processo de transformao dicotmica com relao as primitivas


implementadas.

96

Em termos de resultados a Tabela B.1 no Anexo B, demonstra um comparativo entre


distncia euclidiana, euclidiana quadrtica e city-block. A distncia euclidiana apresenta os
melhores resultados, e por isso fixada em todos os experimentos.

5.2.5. Produo de Um Modelo

H dois estgios na fase de produo de um modelo, um o treinamento o outro a

verificao. No estgio de treinamento, as distncias das caractersticas d fv1x , fv my

) so

computadas usando pares de amostras de assinaturas. Na abordagem so usadas para suprir


este estgio redes neurais artificiais (RNA) MLP e suport vector machines (SVM).
Nas ltimas dcadas, redes neurais tm sido usadas extensivamente na rea de
reconhecimento de padres, em especfico na verificao de assinaturas [XIAO &
LEEDHAM, 1999], [BAJAJ & CHAUDHURY, 1996], [SANSONE & VENTO, 2000] e
[HUANG & YAN, 1997]. O SVM representa uma nova alternativa em problemas de
classificao, aplicado em outros trabalhos com bons resultados [JUSTINO et al, 2003],
[KHOLMATOV, 2003], e por isto tambm utilizado.
Na rede MLP se ambas as assinaturas so escritas pelo mesmo autor, a sada da rede
recebe o valor 1 como tambm no SVM. Caso contrrio, se as assinaturas so escritas por
autores diferentes utilizado 0 na sada da rede MLP e 1 no vetor do SVM.
Os conjuntos de treinamento, validao e teste so normalizados entre 0 e 1 em ambos
os classificadores, desta forma melhorando o tempo de convergncia durante a fase de
treinamento.
Usando a hiptese de que todas as distncias entre duas amostras de assinaturas
escritas pelo mesmo autor, independente do autor, so menores, o classificador treinado para
separar pequenas distncias de caractersticas (genunas) e grandes distncias de
caractersticas (falsificaes).
A rede MLP e o SVM so compostos de duas sadas, uma para indicar que duas
assinaturas pertencem para o mesmo autor, w1, e a outra para indicar que duas assinaturas so
produzidas por autores diferentes, w2. No tratamento de limiares de rejeio e aceitao
utiliza-se mltiplos limiares de rejeio [FUMERA et al., 2000].

97

No processo de aprendizagem, cada amostra resultante da distncia das caractersticas


computadas fornece um vetor de distncia de caractersticas D com posies variando de 160
(1 primitiva) at 1120 (7 primitivas), correspondendo a uma resoluo de 8 clulas verticais
por 20 horizontais, representando as entradas tanto na RNA quanto no SVM.

5.2.5.1. Topologia e Parmetros da Rede Neural

Por ser um processo estocstico, a RNA necessita de critrios empricos para escolha
de topologia e arquitetura. Aps os mesmos serem escolhidos, conforme visto nesta seo, a
topologia fixada. Testes com variaes da arquitetura MLP, tais como o termo momentum
no demonstram os melhores resultados. Desta forma o backpropagation padro fixado nos
experimentos.
Com relao camada de sada dois neurnios so usados, uma vez que a abordagem
trata somente duas classes: autoria e no-autoria.
Entretanto, no que se refere camada escondida, a arquitetura varia de uma camada a
duas camadas escondidas. No uso de uma camada escondida, 4 neurnios so usados
baseados na estratgia de Oh e Suen [OH & SUEN, 2000] de duas vezes o nmero de ns da
sada na camada escondida. J com o acrscimo de outra camada escondida, o nmero de
neurnios varia empiricamente de 4 a 80. Pelo melhor desempenho com o uso de duas
camadas escondidas nos experimentos, admite-se que os dados no so linearmente
separveis.
O nmero de neurnios nas camadas escondidas em nenhum dos experimentos excede
50% do nmero de ns da camada de entrada [WALCZAK & CERPA, 1999], o que acarreta
um longo perodo de treinamento.
O mtodo holdout e critrio de parada com conjunto de validao usado para estimar
o erro e ajuste de parmetros. O conjunto de validao serve para ajustar os pesos da rede
MLP, nmero de camadas escondidas, constante de aprendizagem e o nmero de pocas,
sendo o esforo computacional reduzido, pois quando o desempenho da memorizao e
generalizao fica em um patamar aceitvel, isto , quando o erro do conjunto de validao
atinge o menor valor em termos de MSE e comea a subir, o treinamento parado. Neste
ponto o nmero de ciclos varia de 30 at 350 ciclos em todos os experimentos.

98

Com relao aos parmetros livres: a constante de aprendizagem definida entre 0.01
e 0.03, o erro mnimo aceitvel do MSE igual a 0.001 e os pesos so inicializados entre
+0.001 e 0.001.
Para os experimentos, o software simulador SNNS [ZELL et al., 1994] aplicado no
processo de aprendizagem.

5.2.5.2. Parmetros do SVM

Com o objetivo de estabelecer uma regularizao emprica para o melhor valor da


constante C, os valores variam de 0 a 1000. Os resultados dos experimentos do captulo 6
demonstram a habilidade do procedimento de aprendizagem para discriminar entre w1 e w2.
Com relao ao kernel utilizado, experimentos com kernel polinomial apresentam resultados
superiores ao kernel linear. Isto comprova que a abordagem representa um problema nolinear, conforme resultados da Tabela A.1 no Anexo A. O parmetro d do kernel polinomial
iniciado com 1 e os parmetros r e s em 0,01. Maiores detalhes sobre configuraes e
parmetros do SVM podem ser encontradas em Joachims [JOACHIMS, 2000]. Os
experimentos utilizam o pacote freeware SVMlight [SVM, 2003].

5.2.6. Processo de Deciso

Nesta etapa, avalia-se as sadas do modelo produzido, verificando se a assinatura


pertence ou no a determinada classe, para isso utiliza-se uma funo de probabilidade a
posteriori, conforme apresentado na seo 2.4.
Neste estgio, o processo de deciso representando uma situao prtica aplicado. O
mesmo baseia-se nos princpios da deciso pericial na anlise grafotcnica, quando da anlise
de uma assinatura questionada, conforme seo 5.1.
Geralmente no procedimento executado pelo perito grafotcnico, um conjunto de
comparaes realizado. No mtodo proposto, cada amostra genuna conhecida (referncia)
comparada com amostras de assinaturas questionadas. Para este propsito, um conjunto de
assinaturas genunas usado como referncia ou modelo, no processo comparativo, com o
objetivo de produzir uma deciso final. O sistema proposto combina todas as sadas de
classificao em uma regra de deciso baseada no voto majoritrio [LAM & SUEN, 1997].

99

A combinao de resultados parciais pode ser implementada utilizando uma variedade


de estratgias, dentre elas o voto majoritrio. Trata-se de um modo simples usado de maneira
mais efetiva para melhorar os resultados. Porm, o voto majoritrio no usa nenhum
conhecimento do comportamento a priori dos classificadores.
Lam e Suen [LAM & SUEN, 1997] demonstram a estratgia de combinao de
deciso baseada em vrios classificadores, nos quais as mesmas amostras so submetidas, e o
voto majoritrio aplicado sobre as sadas destes classificadores (experts). Em Lam e Suen
[LAM & SUEN, 1997], assume-se que Nclass classificadores so empregados, e que para
cada amostra de entrada, cada classificador produz uma nica deciso, obtendo a identidade
da amostra. Esta identidade pode ser uma das classes permitidas, ou uma rejeio quando
nenhuma das identidades so consideradas possveis. Em combinao de Nclass
classificadores, a amostra associada classe para qual h um consenso, ou quando Vm dos
classificadores concorda na identidade, assim:

Vm=

Nclass
+1
2

se Nclass par

Nclass + 1
2

se Nclass impar

(5.11)

Uma adaptao do voto majoritrio aplicada no mtodo proposto. Fixa-se o


classificador e somente as amostras variam, sendo o voto majoritrio aplicado sobre as sadas
do classificador. Como o nmero de sadas so duas (mesmo autor ou autores diferentes), a
amostra questionada submetida ao processo de deciso com 5 amostras verdadeiras usadas
de referncia Nref. Desta forma assume-se que:
Nref + 1
Vm =
2

(5.12)

, na qual a deciso final baseia-se em Vm 3, ou seja, se amostras pertencem ao mesmo


autor, a soma das decises Vm 3 para x(+), caso contrrio Vm 3 para x(-) testados.

5.2.6.1. Limiares de Rejeio e Aceitao

Com relao a limiares de rejeio, autores como Qi e Hunt [QI & HUNT, 1994]
desconsideram limiares por acreditarem que os mesmos so utilizados para minimizar a taxa
de erro total de cada funo de verificao, porm menosprezando a taxa de m classificao.
Segundo Qi e Hunt [QI & HUNT, 1994] estes limiares so baseados somente nas amostras de

100

treinamento e validao, embora utilizados para o desempenho, comparao e avaliao de


diferentes esquemas de verificao. Para Gori e Scarselli [GORI & SCARSELLI, 1998] que
tratam exclusivamente de redes MLP, critrios de limiares podem demonstrar excelente
desempenho de discriminao, porm podem falhar na tarefa de rejeio.
J em Kholmatov [KHOLMATOV, 2003], sistemas de verificao de assinaturas offline seriam mais teis se classificassem robustamente uma poro das assinaturas
apresentadas como genunas ou falsas e deixassem o resto (uma pequena poro) para
inspeo, desta forma projetando um sistema que classificasse as assinaturas em trs classes:
genuna, falsa e incerta ou inconclusiva.
Sansone e Vento [SANSONE & VENTO, 2000] levam em conta a determinao de
um limiar timo da rejeio e do erro, por considerarem requisitos do domnio da aplicao.
Estes requisitos esto relacionados ao custo de m classificao, rejeio e correta
classificao.
A introduo de uma opo de rejeio tem a inteno de rejeitar o maior percentual
possvel de amostras, as quais so m classificadas. J o preo que se paga mesmo quando
usada adequadamente que este critrio introduz um efeito contrrio, pelo fato de que
algumas amostras terem sido classificadas corretamente agora so rejeitadas.
Drouhard [DROUHARD et al., 1994] especifica que em sistemas que requerem uma
deciso imediata, a adio de um critrio de rejeio para a regra de deciso permite
significantes melhoras no desempenho dos classificadores, por recusar o caso de uma
classificao duvidosa. Entretanto, mesmo se o custo de uma rejeio for mais baixa que o de
um erro, a taxa de rejeio deve ser a menor possvel por duas razes. A primeira que
tambm se pode rejeitar boas decises e se a taxa de rejeio de uma boa deciso for to alta
quanto das ms decises, o desempenho do classificador ser diminudo ao invs de
aumentado. O segundo problema da utilidade do classificador, em caso extremo, ter uma
taxa de erro de 0% e de rejeio de 100%. Neste caso, o classificador intil. Uma maneira
para tratar este fenmeno atravs de um fator de confiabilidade RF, no qual se considera a
taxa de erro, assim como a taxa de rejeio na avaliao do desempenho do classificador.
No mtodo proposto, os limiares que separam as assinaturas genunas das falsas no
so empiricamente escolhidos, e sim baseados no estudo de Fumera [FUMERA et al., 2000]
demonstrado na seo 2.4.1. Para a determinao dos limiares (T1,...,TN) os mesmos so
estimados usando o conjunto de validao finito.

101

Um histograma de deciso no conjunto de validao dos dados classificados


corretamente proposto baseado em [CHA, 2001] para determinao dos limiares. Desta
forma as probabilidades da sada do classificador tendem a ser mais volumosas em direo ao
valor 1 quando se referem distncia dos dados entre mesmos autores ou classes iguais,
enquanto que as probabilidades, quando se tratam de autores ou classes diferentes tendem a
ser mais volumosas em direo ao valor 0, conforme Figura 5.15.
Histograma de Deciso
Inconclusiva
T1

Padres

T2

0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5 0,55 0,60 0,65 0,70 0,75 0,80 0,85 0,90 0,95 1,00

Sada do Classificador

Tendncia de classes diferentes

Tendncia da mesma classe

Figura 5.15: Histograma de deciso no conjunto de validao com limiares de deciso.

O critrio utilizado na Figura 5.15 o de submeter um conjunto de amostras de


validao ao classificador. Baseado nas sadas corretamente classificadas estabelece-se o
limiar da classe positiva como sendo o menor valor encontrado, ou seja, o que menos tende a
1, T1. J o limiar da classe negativa o maior valor encontrado nas amostras corretamente
classificadas como negativas, ou seja, a amostra que menos tende a 0, T2.
A deciso, ao invs de ser tomada diretamente, baseada nas sadas do classificador,
as probabilidades so computadas tendo por base as equaes (4.9) e (4.10), substituindo o
limiar T por T1 < T e T2 respectivamente, permitindo a incorporao de limiares de rejeio
no processo.

T (classificador d ( fv x , fv y ) < T | autor(x) = autor(y))


1
1
d
0
Pr(classificador d ( fv1x , fv dy ) 2 | autor(x) autor(y))

(5.13)
(5.14)

102

Qualquer sada entre T1 e T2 rejeitada ou considerada inconclusiva e separada para


procedimentos mais sofisticados.
Ao contrrio da maioria das abordagens que estabelecem um treinamento (ou uma
rede quando o classificador for uma RNA) para cada classe, necessitando um limiar diferente
para cada treinamento, a abordagem proposta preocupa-se em estabelecer dois nicos limiares
de rejeio.

5.3. Comentrios Finais

A viso do perito na anlise de assinaturas questionadas analogamente como uma


soluo computacional para o mtodo proposto apresentada neste captulo fornece uma viso
clara da abordagem proposta. Todas as etapas que envolve o processo de verificao de
assinaturas so tambm detalhadas. Os resultados dos experimentos esto descritos no
prximo captulo.

Captulo 6

6. Experimentos Realizados e Anlises dos Erros

Neste captulo so apresentadas as sub-base de dados e os conjuntos que fazem parte


dos protocolos utilizados. So apresentados tambm os resultados obtidos pelos experimentos,
como a anlise dos erros.

6.1. Protocolo de Avaliao

A base de dados para os experimentos subdividida em duas sub-bases. A primeira


usada para o processo de aprendizagem e seleo dos parmetros timos, contendo
inicialmente 40 autores e passando para 180 autores nos experimentos finais. Nesta sub-base,
as amostras do conjunto de treinamento variam de aproximadamente 60% a 80%, j nos
conjuntos de validao e teste as amostras variam de aproximadamente 10% a 20% de acordo
com experimento. A segunda sub-base composta por 60 autores com os quais so feitos os
testes definitivos. As falsificaes esto presentes nesta sub-base.
O protocolo utilizado para os experimentos iniciais em termos de assinaturas est
demonstrado na Tabela 6.1, em que 40 autores so utilizados para o treinamento e 60 autores
para o teste final com a tcnica do voto majoritrio. Na base de 40 autores o treinamento
utiliza 20 assinaturas genunas de cada autor, e a validao utiliza 10 assinaturas de cada
autor. J o teste usado para fins de ajustes de parmetros, utiliza tambm 10 assinaturas de
cada autor, perfazendo um total de 1600 assinaturas no processo de aprendizagem. No teste
com o voto majoritrio, 5 assinaturas de cada um dos 60 autores so utilizadas como
referncia, ou seja, como se estivessem previamente armazenadas em um sistema para
posterior consulta e comparao com assinaturas questionadas, desta forma representando
uma situao prtica.

104

No teste com assinaturas questionadas, para cada um dos 60 autores utiliza-se 5


assinaturas genunas, 5 falsificaes simples, 5 falsificaes simuladas e 5 falsificaes
aleatrias. Para as falsificaes aleatrias utiliza-se somente 59 autores. No geral so
utilizadas 1495 assinaturas, ou seja, 300 como referncia e 1195 para o teste do voto
majoritrio.
Tabela 6.1: Protocolo do nmero de assinaturas utilizado nos experimentos iniciais.
Assinaturas
40 Autores

60 Autores

Conjuntos

Treinamento

Genuna /
Aleatria
800

Validao

400

Teste

400

Genuna

Simples

Simulada

Aleatria

1600

Total
800
400

300

300

300

295

300

Referncia
Total

100 Autores

Teste Voto Majoritrio

600

1595
300

300

300

295

3095

Pelo fato da abordagem proposta necessitar de combinao entre valores das distncias
das primitivas de acordo com o mtodo proposto por Cha [CHA, 2001], as 1600 assinaturas
da sub-base de 40 autores so submetidas a combinaes baseadas nas distncias das
primitivas, de acordo com a equaes (4.6) e (4.7), para amostras intraclasse e interclasse
respectivamente. J a sub-base de 60 autores 5 assinaturas questionadas genunas, em relao
s 5 assinaturas de referncia, geram 25 amostras para cada autor, fornecendo um total de
1500 amostras genunas para o teste do voto majoritrio. As falsificaes da mesma forma
rendem 1500 amostras simples, 1500 simuladas e 1475 aleatrias, perfazendo um total de
5975 amostras para teste, conforme a Tabela 6.2. Isto representa o protocolo mximo
utilizado nos experimentos, podendo variar para menos, ou seja, para um nmero menor de
autores e assinaturas por autor dependendo do experimento.

105

Tabela 6.2: Protocolo de amostras utilizadas nos experimentos iniciais.


Amostras
60 Autores
Conjuntos

40 Autores

Teste Voto Majoritrio


Genuna

Simples

Simulada

Aleatria

100
Autores
Total

Genuna

Aleatria

Treinamento

7.600

312.000

Validao

1.800

78.000

Teste

1.800

78.000

1.500

1.500

1.500

1.475

85.775

Total

11.200

468.000

1.500

1.500

1.500

1.475

485.175

319.600
79.800

Para os experimentos finais, o nmero de autores no conjunto de treinamento


aumentado de 40 para 180. Porm cada autor novo fornece somente 4 assinaturas, totalizando
560 assinaturas. Desta forma, h um decrscimo no nmero de assinaturas cedidas por cada
autor em toda a primeira sub-base, conseqentemente uma diminuio do nmero de amostras
utilizadas. Para um melhor aproveitamento na aprendizagem devido limitao da base de
dados, os 180 autores so usados no treinamento, j a validao e teste so realizados com 40
autores. A diferenciao em termos de assinaturas que cada autor fornece, ou seja, 4
assinaturas para treinamento, outras 4 para validao e outras 4 para teste. O protocolo da subbase de 60 autores permanece o mesmo. A Tabela 6.3 demonstra o protocolo em termos de
assinaturas utilizadas, enquanto que a Tabela 6.4 demonstra o protocolo em termos de
amostras geradas.
Tabela 6.3: Protocolo do nmero de assinaturas utilizado nos experimentos finais.
Assinaturas
180 Autores

60 Autores

Conjuntos

Teste Voto Majoritrio

Treinamento

Genuna /
Aleatria
720

Validao

160

Teste

160

Genuna

Simples

Simulada

Aleatria

1040

Total
720
160

300

300

300

295

1355

300

300

295

2535

300

Referncia
Total

240 Autores

600

300

A Tabela 6.4 representa o protocolo mximo com o qual avalia-se o desempenho final
do mtodo. Nos experimentos propostos, existem variaes para uma quantidade menor de
amostras, com objetivo de reduzir o custo computacional.

106

Tabela 6.4: Protocolo das amostras utilizadas nos experimentos finais.


Amostras
60 Autores
Conjuntos

180 Autores

Teste Voto Majoritrio


Genuna

Simples

Simulada

Aleatria

240
Autores
Total

Genuna

Aleatria

Treinamento

1.080

16.110

17.190

Validao

240

780

1.020

Teste

240

780

1.500

1.500

1.500

1.475

6.995

Total

1.560

17.670

1.500

1.500

1.500

1.475

25.205

6.2. Os experimentos

Na abordagem proposta os resultados dos experimentos iniciais no so os esperados.


Uma anlise mostra que o nmero limitado de amostras de assinaturas disponveis para o
treinamento, no cobre o espao de caractersticas. Isto limita a habilidade da rede em
generalizar amostras no vistas. Com um acrscimo de 140 autores uma tendncia de melhora
verificada.
A seguir apresentam-se os resultados obtidos pelos experimentos,. Os testes so
divididos em vrios grupos considerando os seguintes aspectos:

determinao da resoluo do grid na segmentao;

mxima combinao de amostras baseado em Cha [CHA, 2001];

balanceamento do nmero de amostras de cada classe;

seleo do conjunto de primitivas;

aumento na quantidade de autores e variao nas amostras;

limiares de rejeio e aceitao;

SVM;

comparativo do mtodo proposto com anlise humana

O objetivo dos experimentos realizados a reduo das taxas de erro Tipo I e Tipo II,
atravs do uso da matriz de confuso nos conjuntos de teste.
Em todos os experimentos, um teste inicial realizado com o intuito de ajustar os
parmetros livres dos classificadores. Para isto, o conjunto de teste da primeira sub-base
usado.

107

6.2.1. Determinao da Resoluo do Grid na Segmentao

Neste experimento so definidas as resolues em termos de grid que serve de base


para os demais experimentos. Para tanto, a primitiva densidade de pixels fixada e o processo
de treinamento ocorre somente para esta primitiva, devido dificuldade prtica com o teste de
primitivas agrupadas, o qual requisita muito esforo computacional, pois o protocolo da
Tabela 6.2 dos experimentos iniciais utilizado para treinamento e teste. Os resultados esto
apresentados na Tabela 6.5, a qual demonstra que a resoluo 8 linhas por 20 colunas
correspondendo a clulas quadradas de 50 x 50 pixels apresenta os melhores resultados, sendo
deste modo esta resoluo fixada para os demais experimentos.
Tabela 6.5: Resultados com diferentes resolues de grid.
Densidade de pixels
Resoluo

8x20

Falsa Rejeio
Erro Tipo I
(%)
Verdadeiras
22,22

Falsa Aceitao
Erro Tipo II
(%)
Servis
Aleatrias
26,38
2,50

Erro Total
(%)

Simples
2,22

4x10

27,78

1,94

23,33

0,65

13,42

10x25

21,11

4,16

27,50

5,83

14,65

25x63

33,05

4,44

23,33

1,66

15,62

4x63

25,27

3,05

28,05

6,66

15,75

20x20

20,27

5,00

35,55

2,50

15,83

10x63

24,72

5,00

27,77

7,50

16,24

Total
13,33

6.2.2. Mxima Combinao de Amostras

Baseando-se na combinao de amostras proposta por Cha [CHA, 2001], o protocolo


da Tabela 6.2 proposto e utilizado parcialmente nos experimentos iniciais. Um experimento
com o protocolo completo realizado e os resultados encontram-se na Tabela 6.6. Neste
experimento as primitivas testadas so densidade de pixels, pontos de presso, incio e fim
abrupto e segmentos de tremor.

108

Tabela 6.6: Resultados com a mxima combinao da sub-base de 40 autores.


Falsa Rejeio
Erro Tipo I (%)
Genunas
8,67

Tipo do Teste
Voto Majoritrio

Falsa Aceitao
Erro Tipo II (%)
Simples Servis
Aleatrias
0,00
18,33
2,03

Erro Total
(%)
Total
7,28

6.2.3. Balanceamento do Nmero de Amostras de Cada Classe

Com base nos estudos da seo 2.5.3.1, que trata do balanceamento das classes,
executado outro experimento com o objetivo de definir melhor a cardinalidade do nmero de
amostras na abordagem. O protocolo da Tabela 6.2 dos experimentos iniciais serve de base
para este experimento, porm selecionado um nmero reduzido de amostras aleatrias. A
tcnica de downsizing [JAPKOWICZ, 2000] empregada conforme Tabela 6.7. Desta
forma o nmero de amostras falsas passa para 253, procurando equiparar o tamanho das
classes. J no upsizing [JAPKOWICZ, 2000] aumentado o nmero de amostras dos
mesmos autores para 840 procurando equiparar as classes. Os resultados demonstram que o
melhor desempenho em termos de taxa de erro total para as classes desbalanceadas, em
especfico para a base de dados testada com 780 amostras falsas e 240 verdadeiras, de acordo
com a Tabela 6.7.
Tabela 6.7: Resultados com variao do nmero de amostras por classe.
Teste
Tcnica

Treinamento

Amostras
Genunas
desbalanceada
240

Amostras
Falsas
780

Falsa Rejeio
Erro Tipo I
(%)
Verdadeiras
11,00

Falsa Aceitao
Erro Tipo II
(%)
Simples
Servis Aleatrias

Erro
Total
(%)
Total

5,33

37,00

5,42

14,68

downsizing

240

253

3,00

9,00

51,33

16,95

20,07

upsizing

840

780

4,33

15,93

54,40

18,03

23,17

109

6.2.4. Seleo do Conjunto de Primitivas

Nesta etapa so testadas todas as primitivas descritas na Tabela 4.1. Uma seleo das
melhores primitivas mostra-se necessria, desta forma primitivas que no agregam poder
discriminatrio no treinamento so desconsideradas. Para este experimento a tcnica utilizada
a FFS (Forward Feature Selection) [JOSSO et al., 2001], a qual descarta a possibilidade de
se testar todos os subconjuntos ou combinaes de primitivas. Apesar de ser esta a maneira
ideal, o teste com todas as primitivas cria um enorme nmero de combinaes aumentando o
esforo computacional.
A tcnica FFS [JOSSO et al., 2001] consiste em unir as primitivas com melhor
desempenho individual. Este mtodo no garante o melhor conjunto, mas pode ser uma boa
maneira de selecionar algumas primitivas iniciais. Na busca de um melhor aproveitamento,
agrega-se os melhores desempenhos e desta forma seleciona-se a primitiva com melhor
desempenho, a partir da testa-se com todas as demais. O melhor desempenho agrega-se
primitiva j selecionada. Novamente testa-se todas as primitivas restantes com o conjunto
selecionado agregando a primitiva com melhor desempenho, e assim sucessivamente at que
todos os testes sejam efetuados.
O objetivo final avaliar a eficcia das primitivas separadamente e coletivamente.
Para este experimento, o protocolo utilizado o da Tabela 6.2 dos experimentos iniciais,
porm parcialmente, ou seja, utiliza-se um sub-conjunto de 10 autores ao invs dos 40 para o
treinamento, validao e teste. A reduo de autores com o intuito de otimizar o tempo de
resposta para os experimentos iniciais. Os resultados encontram-se ordenados pelos melhores
desempenhos conforme Tabela 6.8.

110

Tabela 6.8: Resultado da seleo do melhor conjunto de primitivas.


Primitiva

Erro Tipo I
(%)

Dens/Press/Trem/Curv
Dens/Press/Trem/Curv/Par
Dens/Press/Incli
Dens/Press/Trem
Dens/Press
Dens/Press/Trem/Curv/Grav
Dens/Press/Trem/Curv/Incli
Dens/Press/Trem/Curv/Par/Incli
Dens/Press/Trem/Grav
Densidade
Dens/Press/Trem/Inicio/Grav/Incli/Par
Presso
Press/Trem/Curv/Grav/Incli/Par
Dens/Press/Trem/Incli
Dens/Press/Trem/Par
Inclinao
Tremor
Gravidade
Inicio
Curvatura

21,23
26,21
26,01
24,15
26,21
25,55
22,01
22,00
25,00
33,01
26,00
42,03
25,00
24,00
18,67
48,23
49,15
68,00
58,55
97,00

Erro Tipo II
Erro Mdio
(%)
(%)
Simples
Simulada Aleatria
3,00
18,00
1,00
10,81
2,67
16,15
1,00
11,50
5,67
15,01
0,36
11,76
4,33
16,67
2,00
11,78
5,67
13,67
1,67
11,81
2,33
20,67
1,16
12,42
6,67
21,00
2,04
12,93
3,33
23,03
3,90
13,06
2,33
22,33
3 ,64
13,32
3,00
17,70
0,27
13,50
3,00
22,00
3,01
13,50
1,00
12,03
0,36
13,86
2,00
23,67
5,06
13,93
7,33
22,67
2,15
14,03
10,33
30,00
1,33
15,08
2,00
14,00
3,47
16,92
2,33
15,03
1,69
17,05
4,33
12,03
0,44
21,20
2,01
20,03
6,40
21,74
4,00
0,00
2,13
25,78

6.2.5. Aumento na Quantidade de Autores e Variao nas Amostras

Testes estatsticos requerem mtua independncia dos dados, porm nos experimentos
realizados esta premissa quebrada, pelo nmero elevado de amostras do mesmo autor que o
processo incorpora. Este excesso de amostras dificulta o poder de generalizao no
treinamento comprometendo os resultados.
A soluo para este problema a diminuio das amostras genunas de cada autor nos
conjuntos de treinamento, como tambm a incorporao de 140 novos autores na base de
dados. Outra soluo diminuir a quantidade de amostras aleatrias, tentando minimizar o
desbalanceamento elevado.
Em experimentos a partir do treinamento com 2 at 7 assinaturas genunas, os
melhores resultados so com 4 assinaturas genunas, gerando 6 combinaes de amostras
genunas.

111

A estrutura apresentada neste experimento a que demonstra ser mais promissora.


Desta forma a equao (4.6) tem o nmero de assinaturas m fixado em 4:
n(+) = n C 2m

para m = 4.

(6.1)

Para uma diminuio mais significativa do nmero de amostras aleatrias no treinamento,


visando um melhor balanceamento entre as amostras, a equao (4.7) sofre uma variao:
n(-) m C 2n ,
2

para m = 1,

(6.2)

desta forma, gerando o menor nmero possvel de combinaes de amostras aleatrias e


preservando pelo menos uma amostra aleatria de cada autor.
Com a diminuio de amostras genunas, a eficincia do mtodo est no aumento do
nmero de autores. O protocolo de teste usado o da Tabela 6.4, utilizada nos experimentos
finais. A Tabela 6.9 demonstra os resultados obtidos com 4 assinaturas genunas por autor,
como tambm um comparativo da evoluo na taxa de erro medida que se incorpora novos
autores.
Tabela 6.9: Resultado do aumento da quantidade da autores e variao nas quantidade de
amostras.
Variao das amostras genunas e nmero de autores
Treinamento
Assinaturas

Teste
60 autores

Amostras
Treinamento

Autores

Genuna

Aleatria

Genuna

Aleatria

40
50
60
70
80
90
100
110
120
130
140
150
160
170
180

4
4
4
4
4
4
4
4
4
4
4
4
4
4
4

1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

240
300
360
420
480
540
600
660
720
780
840
900
960
1.020
1.080

780
1.225
1.770
2.415
3.160
4.005
4.950
5.995
7.140
8.385
9.730
11.175
12.720
14.365
16.110

Erro
Tipo I
(%)
Genuna
12,33
10,33
7,00
6,67
8,00
8,33
8,33
8,00
8,33
6,00
7,00
11,33
11,33
10,67
10,33

Simples
0,33
1,33
4,67
3,33
2,00
2,33
2,00
2,67
3,67
5,00
1,33
1,67
2,00
2,67
1,67

Erro
Tipo II
(%)
Simulada
32,00
30,67
36,33
36,33
32,67
36,67
33,00
33,00
27,00
26,00
25,67
19,00
14,67
16,67
15,67

Aleatria
3,73
6,78
8,14
7,12
6,78
8,14
8,47
9,49
7,80
8,14
6,78
6,10
5,42
5,76
4,41

Erro
Total
(%)
Total
12,09
12,27
14,03
13,36
12,36
13,86
12,95
13,29
11,70
11,28
10,19
9,52
8,35
8,94
8,02

112

6.2.6. Limiares de Rejeio e Aceitao

De acordo com a figura 5.15, dois limiares de rejeio so encontrados, tendo por base
as probabilidades que o classificador retorna do conjunto de validao. Para o limiar T1,
encontrado o valor de 0,5546, j para o limiar T2, 0,4968. O critrio usado de que todo valor
maior que T2 e menor que T1 que corresponde taxa de rejeio Rt pode ser aplicado no
processo de deciso da abordagem.
Como visto na seo 4.5.1, o desempenho do classificador medido pela mdia da
taxa de erro total, a qual pode ser expressa de acordo com Drouhard [DROUHARD et al.,
1994] por Et em termos de E1 (taxa de erro tipo I), E2 (taxa de erro tipo II) e P[wi]
(probabilidade a priori da classe wi), como :
Et = E1 . P[w1] + E2 . P[w2].

(6.3)

A taxa total de rejeio Rt, obtida com uma equao semelhante equao (6.3), com
a taxa de erro Ei substituda pela taxa de rejeio Ri (R1 rejeio de assinaturas genunas e R2
rejeio de falsificaes aleatrias). Como demonstra Drouhard [DROUHARD et al., 1994], a
taxa de rejeio e o erro total podem ser integrados em um nico parmetro, o fator de
confiabilidade:

RF = 1

Et
100 Rt

(6.4)

desta forma a melhor avaliao estatstica dos resultados do classificador encontrada.


De acordo com os limiares estabelecidos a taxa de rejeio total Rt do experimento
de 1,34% e sendo o erro mdio total Et de 7,48%, o fator de confiabilidade encontrado RF =
0,9241. J sem limiares de rejeio o fator de confiabilidade de RF = 0,9198. A Tabela 6.10
apresenta os resultados com base na Tabela 6.4 que se utiliza nos experimentos finais.
A introduo do critrio de rejeio na abordagem proposta melhora tanto o fator de
confiabilidade, quanto o erro Tipo I, o erro Tipo II e a taxa de erro total.

113

Tabela 6.10: Resultados com o uso de limiares de rejeio.

Com limiares de rejeio

Falsa Rejeio
Falsa Aceitao
Erro Tipo I
Erro Tipo II
(%)
(%)
Genunas
Simples Servis Aleatrias
9,79
1,33
14,72
4,09

Sem limiares de rejeio

10,33

1,67

15,67

4,41

Erro Total
(%)

Fator
Confiabilidade

Total
7,48

0,9241

8,02

0,9198

6.2.7. SVM

Com o objetivo de melhorar as taxas de erro, um experimento com o SVM realizado


tomando como base o protocolo da Tabela 6.4. A dificuldade no ajuste de parmetros livres
com relao a pesos, constante de aprendizagem encontrado na rede MLP, minimizada na
seleo do modelo do SVM, restringindo-se somente escolha do kernel, e a penalidade
representada pelo parmetro C. O nmero de vetores de suporte encontrado no experimento
com os sub-conjuntos de 40 at 180 autores varia de 337 at 1.345. Os resultados esto
descritos na Tabela 6.11.
Tabela 6.11: Resultado comparativo de rede MLP com SVM.

Autores

Variao de amostras genunas nmero de autores


MLP
SVM
Erro
Erro
Erro
Erro
Erro
Erro
Tipo I
Tipo II
Mdio Tipo I
Tipo II
Mdio
(%)
(%)
(%)
(%)
(%)
(%)
Genuna Simples Simulada Aleatria Total Genuna Simples Simulada Aleatria Total
12,33
0,33
32,00
3,73
10,33
1,00
31,44
7,80
40
12,09
12,64
10,33
1,33
30,67
6,78
10,67
1,67
29,77
6,78
50
12,77
12,22
7,00
4,67
36,33
8,14
9,67
0,67
26,76
6,78
60
14,03
10,97
6,67
3,33
36,33
7,12
10,00
0,33
25,42
5,76
70
13,36
10,37
8,00
2,00
32,67
6,78
9,33
0,67
24,41
5,08
80
11,86
9,87
8,33
2,33
36,67
8,14
9,33
0,00
28,43
4,75
90
13,86
10,62
8,33
2,00
33,00
8,47
9,33
0,00
25,75
4,07
100
12,95
9,79
8,00
2,67
32,00
9,49
9,00
0,67
24,41
5,76
110
13,04
9,96
8,33
3,67
27,00
7,80
8,33
0,33
23,08
5,76
120
11,70
9,37
6,00
5,00
26,00
8,14
9,00
0,00
19,40
4,75
130
11,28
8,28
7,00
1,33
25,67
6,78
10,67
0,33
19,40
5,08
140
10,19
8,87
11,33
1,67
19,00
6,10
11,33
0,33
17,73
5,76
150
9,52
8,78
11,33
2,00
14,67
5,42
12,67
0,00
18,06
4,07
160
8,35
8,70
10,67
2,67
16,67
5,76
12,00
0,33
17,39
4,07
170
8,94
8,44
180
10,33
1,67
15,67
4,41
8,02
11,33
0,00
16,72
3,39
7,86

114

6.2.8. Comparativo do Mtodo Proposto com a Anlise Humana

Baseado em Fang [FANG et al., 2003] um comparativo de desempenho com seres


humanos proposto. Para este fim, dois voluntrios no especialistas so recrutados para
executar a tarefa de verificao de assinaturas, estando os mesmos familiarizados com os
mtodos de verificao de assinaturas.
Tentando simular a maneira com que o computador aprende as caractersticas das
assinaturas e baseado no protocolo utilizado no processo de aprendizado, a sub-base de 40
autores (1.600 assinaturas) disponibilizada para os voluntrios se familiarizarem com as
peculiaridades e variaes das assinaturas genunas, como tambm com as falsificaes
aleatrias. Ou seja, uma assinatura genuna em relao s genunas de outros autores, desta
forma seguindo risca o mtodo de aprendizagem.
No processo de verificao, incluindo os autores no-vistos, a base de 60 autores
usada. Para aumentar o grau de dificuldade, somente assinaturas genunas e falsificaes
simuladas so utilizadas. Durante o trabalho de verificao 50 combinaes aleatrias entre
10 assinaturas genunas e 10 falsificaes simuladas, para cada um dos 60 autores, so
mostradas na tela do computador de tempo em tempo.
Para este experimento so executadas um total de 3.000 avaliaes compostas de
1.500 genunas e 1.500 falsificaes simuladas. O mtodo consiste em comparar uma
assinatura questionada com a assinatura genuna de referncia, com o objetivo de determinar
somente se as duas assinaturas pertencem ao mesmo indivduo ou no, conforme o exemplo
na Figura 6.1.

Figura.6.1: Exemplo do processo de comparao humana na similaridade entre 2 assinaturas.

115

Com relao s probabilidades, preciso mencionar o fato da equiparao do nmero


de assinaturas genunas e falsificaes simuladas. A probabilidade a priori de cada assinatura
questionada pertencer ao mesmo autor de 0,5.
A taxa de erro mdia dos dois voluntrios encontrada de 11,48% e 12,71%. A mdia
global da taxa de erro dos mesmos 12.09%. Comparado com o melhor desempenho da
abordagem de 13,00% sem considerar os limiares de rejeio e aceitao, o resultado
demonstra a taxa de erro em nveis semelhantes anlise humana. Os resultados esto
resumidos na Tabela 6.12.
Tabela 6.12: Resultado da avaliao humana do processo de verificao de assinaturas em
comparao com a abordagem proposta.

Voluntrios
Voluntrio 1
Voluntrio 2
Mdia Geral
Abordagem Proposta

Taxa Erro
Falsa Rejeio
(%)
Genuna
7,77
4,62
6,19
10,33

Taxa Erro
Falsa Aceitao
(%)
Falsificao Simulada
15,18
20,80
17,99
15,67

Taxa Erro
Mdio
(%)
11,48
12,71
12,09
13,00

6.3. Estimando a Probabilidade do Erro

A probabilidade do erro da abordagem proposta calculada para o protocolo de teste


da Tabela 6.4, usada nos experimentos da rede MLP e do SVM. Sendo a populao de
interesse composta por pares de assinaturas produzidas pelo mesmo autor n(+) e pares de
assinaturas produzidas por autores diferentes n(-). Uma amostra n(+) obtida do par de duas
assinaturas produzidas pelo mesmo autor. Uma amostra de n(-) obtida do par de assinaturas
produzidas por autores diferentes. H dois tipos de probabilidades de erros relevantes para
estimar o intervalo de confiana. A probabilidade do erro com que o sistema classifica duas
assinaturas como membros de n(+) embora sejam membros de n(-) , erro Tipo I, e a
probabilidade do erro com que o sistema classifica duas assinaturas como membros de n(-)
embora sejam membros de n(+), erro Tipo II.
Em adio aos erros estimados, ou seja, a estimativa por pontos, a previso do
desempenho medida atravs de intervalos de confiana, os quais estabelecem uma margem

116

para mais e para menos para taxa de erro estimado. Segundo Guerra [GUERRA &
DONAIRE, 1991], a estimao por intervalos fornece uma probabilidade para o verdadeiro
valor do parmetro. Algumas definies so:

O intervalo t1 p t 2 denominado de intervalo de confiana (I.C.) ;

Os extremos desse intervalo t1 e t2 so denominados de limites de confiana;

A probabilidade conhecida (1 ( denominada de nvel de confiana;

/. chamado de nvel de significncia e representa o erro que se est


cometendo quando se afirma que a probabilidade do intervalo contm o verdadeiro
valor do parmetro populacional p (1 (
A escolha do nvel de confiana depende da preciso com que se deseja estimar o

parmetro. O nvel utilizado normalmente varia de 90% a 99%, sendo que o aumento da
confiana no intervalo implica o aumento de sua amplitude. Quanto maior for o nvel de
confiana (ou seja, quanto menor for o nvel de significncia), mais amplo ser o intervalo.
Tomando como base as taxas de erro retornadas pela abordagem f, sendo o nmero de
amostras da classe analisada n, relativamente grande, pressupe uma distribuio normal e um
desvio padro populacional conhecido, sendo z / 2 o valor crtico da tabela de distribuio
normal para o nvel de confiana desejado. O intervalo de confiana para a proporo
populacional p calculado por [GUERRA & DONAIRE, 1991]:
f z / 2

f (1 f )
p f + z / 2
n

f (1 f )
n

(6.5)

Para as melhores taxas de erro encontradas na Tabela 6.11. aplica-se a equao (6.5),
com um nvel de confiana de 95%, ou seja, 9.(l z / 2 1,960 e n = 1195, que representa
o nmero de decises do teste com o voto majoritrio. Os resultados encontram-se na Tabela
6.13.
Tabela 6.13: Estimao por intervalos das taxas de erro do conjunto de teste.
Classificador
MLP
SVM

Intervalo de Confiana
Erro Tipo I
Erro Tipo II
(%)
(%)
6,89 p 0N'
f = 10,33 5,55 p  '
f = 7,25
7,74 p %) 
f = 11,33 5,06 p 
f = 6,70

Erro Total
(%)

6,48 p X
6,33 p X X

f = 8,02
f = 7,86

O objetivo do trabalho no escolher qual o melhor classificador, porm um


comparativo entre os mesmos testado a fim de direcionar o trabalho na busca de taxas de

117

erros mais aceitveis. Baseado nas taxas de erro encontrado na Tabela 6.11, aplicado o teste
de hipteses de duas propores e o teste de McNemar [DIETTERICH, 1998]. Ambos usados
para demonstrar se um algoritmo de classificao possui resultados semelhantes a outro com
certo grau de incerteza.
O teste aplicado comparando a rede MLP com o SVM, levando em considerao a
tabela de contingncia, conforme a Tabela 6.14, necessria para ambos os testes.
A seguinte hiptese testada: H0: indicando que no h diferena significativa entre os
classificadores de rede Neural e SVM na abordagem proposta; e H1: indicando que os
classificadores demonstram desempenhos diferentes para a abordagem proposta.
Tabela 6.14: Tabela de Contingncia 2 x 2.
N00 :Nmero de amostras classificadas N01 : Nmero de amostras classificadas
incorretamente
por
ambos
incorretamente pelo SVM mas no
classificadores
pela rede MLP.
N10 : Nmero de amostras classificadas
N11 : Nmero de amostras classificadas
incorretamente pela rede MLP mas
corretamente por ambos
no pelo SVM
classificadores
O teste de McNemar tem uma distribuio qui-quadrado com 1 grau de liberdade
[DIETTERICH, 1998]. A quantidade de 2 calculado de acordo com:

=
2

(n

n10 1)

01

n01 + n10

(6.6)

A hiptese nula assume que o desempenho de dois algoritmos diferentes o mesmo,


isto n10 = n01. O valor-P de um valor qui-quadrado calculado com o teste de McNemar, de
acordo com a tabela de distribuio qui-quadrado [GUERRA & DONAIRE, 1991]. Quando o
valor-P apresentar valores menores, ele sugere que a hiptese nula improvvel de ser
verdadeira. No se pode rejeitar a hiptese nula se a probabilidade 2 3,84 que corresponde
ao valor-P menor que 0,05 [DIETTERICH, 1998]. Estes valores correspondem a um teste
significativo segundo Guerra & Donaire [GUERRA & DONAIRE, 1991].
O resultado da comparao da rede MLP com o SVM gera para 2 o valor de 0,00526
e para valor-P 0,9422, sendo superior a 0,05, demonstrando que a hiptese nula no pode ser
rejeitada. Isto sugere que o uso da rede MLP e do SVM como classificadores, nesta aplicao,
pode alcanar resultados semelhantes.

118

Outra forma simples de testar a hiptese comparativa dos classificadores que leva em
considerao a falta de independncia dos dados, pelo fato dos resultados serem obtidos a
partir do mesmo conjunto de teste, atravs do uso do teste de diferena de duas propores
[DIETTERICH, 1998]. Seja a probabilidade a posteriori da taxa de erro total da rede MLP e
do SVM representados por PMLP e PSVM, respectivamente, as quais se referem m
classificao de n amostras do conjunto de teste. Como n uma varivel aleatria binomial,
pode-se aproximar uma distribuio normal devido ao valor razovel de n. Pelo fato de PMLP e
PSVM serem dependentes do mesmo conjunto de teste, z que representa o grau de diferena
entre a rede MLP e o SVM, calculado como:
z=

n PMLP PSVM
n01 + n10

(6.7)

o qual tem aproximadamente uma distribuio normal. A hiptese nula ser rejeitada se |z| >
Z0,950 = 1,96, ou seja, se o valor de de acordo com a tabela normal distribuda for menor que
0,05 [GUERRA & DONAIRE, 1991], o qual corresponde a um teste provavelmente
significativo.
O resultado da comparao da rede MLP com o SVM em termos do valor de z gera
0,1387 com valor de 0,8897 sendo superior a 0,05, demonstrando desta forma que a
hiptese nula no pode ser rejeitada e sugerindo desempenhos iguais na rede MLP e no SVM.

6.4. Comentrios Finais

Experimentos realizados com o treinamento de falsificaes simples e simuladas


demonstram que o ganho em termos de resultados no significativo. Estes testes so
desconsiderados pelo fato da aquisio deste tipo de amostra ser dificultoso e discutvel.
O resultado do experimento demonstrado na Tabela 6.6 apresenta uma taxa de erro
mdio superior aos demais experimentos, porm o esforo computacional deste experimento,
no justifica o ganho em termos de desempenho.
Com relao ao uso de medidas de distncias, experimentos demonstram que a
distncia euclidiana apresenta os melhores resultados, conforme Tabela B.1 no Anexo B. O
ganho mnimo em termos de resultado dos experimentos no justifica um estudo mais
aprofundado com relao outras medidas de distncias.

119

No experimento que trata os limiares de rejeio e aceitao, um aumento nos limiares


acarreta melhores taxas de erro, em contrapartida, h uma rejeio maior. O uso de limiares
de rejeio tambm discutvel, pois de acordo com Drouhard [DROUHARD et al., 1994],
no caso extremo, o classificador com uso de limiares pode ter uma taxa de erro de 0% mas
ter uma taxa de rejeio de 100%.
Para os casos de falsificaes simuladas, os ndices obtidos pelas redes no so sempre
satisfatrios. Este fato pode ser explicado pela dificuldade inerente construo de um
sistema de verificao que rejeite este tipo de assinatura. Muitas vezes, at a anlise humana
no consegue fazer a distino entre assinaturas genunas e assinaturas falsas simuladas.
J os melhores resultados obtidos com a utilizao das falsificaes aleatrias, devese tambm ao fato das mesmas fazerem parte do treinamento como a maioria das amostras.
O fato de se ter mnimos locais, dificulta o processo de treinamento em redes MLP, o
qual pode ser minimizado com o uso do SVM. Ambos os classificadores fornecem boa
preciso nos resultados. Em termos de performance, ambos classificadores tambm
demonstram ser semelhantes para o problema proposto, de acordo com o teste de hiptese
para duas propores e o teste de McNemar.
O alto nvel de erro na falsa rejeio (erro Tipo I, em torno de 10%) produzido pela
falta de habilidade do modelo de absorver a variao intrapessoal, como tambm por um
nmero reduzido de autores usados na fase de treinamento.
A reduo do nmero de amostras aleatrias do protocolo dos experimentos iniciais
para os experimentos finais no reflete perda no desempenho. A unio deste conjunto excluso
no traz nenhum acrscimo, ou poder discriminante com o aumento do protocolo. Pelo
contrrio, quando muitas amostras de um mesmo autor so usadas no treinamento, o excesso
destas amostras faz com que o sistema especifique o autor, perdendo o poder de
generalizao, ou seja, especialize as variaes intrapessoal deste autor.

Captulo 7

7. Concluso e Trabalhos Futuros

Neste captulo so apresentadas as concluses obtidas com o trabalho, bem como


sugestes para trabalhos futuros.

7.1. Concluso

O trabalho proposto apresenta uma nova abordagem para a verificao de assinaturas


estticas baseadas nos preceitos da grafoscopia. Depois de detalhada a metodologia de
extrao de caractersticas, transformao dicotmica com o uso da distncia euclidiana
aplicada sobre as primitivas, produo do modelo e processo de deciso baseado na viso
pericial, com os experimentos para valid-la estatisticamente, estas so as concluses a que se
chega:

O objetivo principal do mtodo proposto, a verificao automtica de assinaturas,


atingido e apresenta resultados promissores, em torno de 8% na mdia de taxa de erro
total, sem limiares de rejeio. O mtodo robusto para os diversos tipos de
assinaturas e para as falsificaes, principalmente nas falsificaes simples e
aleatrias, como tambm demonstra resultados semelhantes anlise humana.

Por se tratar de um modelo genrico, o mesmo gera um menor esforo computacional


pela no necessidade de re-treinamento. Esta caracterstica minimiza a complexidade
que envolve as etapas de um sistema de verificao de assinaturas.

A problemtica do nmero excessivo de assinaturas genunas por autor no processo de


treinamento discutido na maioria dos trabalhos apresentados no captulo 3 pode ser
superada com a abordagem proposta. No trabalho proposto usada somente 5
assinaturas genunas por autor no processo de deciso.

121

A abordagem proposta simula a anlise grafotcnica pericial manual tanto na anlise


das caractersticas quanto no processo de deciso, demonstrando de forma clara a
comparao entre uma assinatura questionada e uma verdadeira atravs da viso do
perito, deste modo procurando simular um ambiente prtico que represente o mundo
real.

O modelo genrico, ao contrrio dos trabalhos apresentados no captulo 3, os quais so


baseados em modelos pessoais, representa uma nova viso no tratamento da
problemtica da verificao de assinaturas estticas e apresenta-se como promissor
tanto pelos resultados, quanto pela abordagem adotada, a qual utiliza somente duas
classes possveis: autoria e no autoria em todo o processo.

O principal propsito deste trabalho reportar um mtodo robusto de verificao de


assinaturas baseado nos princpios da grafoscopia. Dois importantes pontos emergem. O
primeiro o potencial apresentado pelo mtodo de reduzir o nmero de amostras de
assinaturas necessrias no treinamento e na validao. O segundo a habilidade do modelo de
absorver novos autores sem gerar novos modelos pessoais. Em termos de taxa de erro, os
resultados mostrados so promissores, especialmente em termos de falsificaes simples e
aleatrias. possvel notar a capacidade da rede MLP e do SVM de classificar diferentes
tipos de falsificaes, sem prvio conhecimento das mesmas.

7.2. Trabalhos Futuros

Os trabalhos futuros propostos nesta rea de pesquisa so os seguintes:

A base de dados de um modo geral composta de uma quantidade elevada de


assinaturas, gerando por autor um nmero elevado de amostras no processo de
aprendizagem pela combinao de pares de assinaturas. Porm, um aumento na
quantidade de autores, com uma quantidade mnima de assinaturas, demonstra uma
tendncia na melhora de performance, o que pode ser explorado.

Embora o mtodo no tenha mostrado resultados experimentais superiores aos


mtodos existentes, h a possibilidade de combin-lo com outros mtodos para
alcanar melhores resultados. Nenhum mtodo simples pode resolver o problema de

122

verificao de assinaturas perfeitamente, e solues prticas so freqentemente


derivadas da combinao de diferentes mtodos [FANG et al., 2003]. Abordagens
locais tratam particularidades do traado de autores em especfico, sendo fundamentais
em mtodos que utilizam modelos pessoais. Um tratamento global pode fornecer um
poder discriminante maior para uma abordagem mais genrica, a qual pode ser
combinada em uma estratgia multi-estgio no processo de deciso, conforme
[SANSONE & VENTO, 2000]. O primeiro estgio trataria as falsificaes simples e
aleatria e enquanto outro estgio trataria as falsificao simuladas e as amostras
genunas.

123

8. Referncias Bibliogrficas

[ABUTALEB, 1989] ABUTALEB, A. S. Automatic Thresholding of Gray-Level Pictures


Using Two Dimensional Entropy. Computers Graphics & Image Processing, No.47,
1989, 22-32 p.

[BAJAJ & CHAUDHURY, 1996] BAJAJ, R.; CHAUDHURY, S. Signature Verification


Using Multiple Neural Classifiers. Pattern Recognition. Vol. 30, No. 1, 1996, 1-7 p.

[BALTZAKIS & PAPAMARKOS, 2000] BALTZAKIS, H; PAPAMARKOS, N. A New


Signature Verification Technique Based on a Two-Stage Neural Network Classifier.
Engineering Applications of Artificial Intelligence. Nr.14, 2000, 95-103 p.

[BARBEAU et al., 2002] BARBEAU, J.; VIGNES-LEBBE, R.; STAMON, G. A Signature


based on Delaunay Graph and Co-occurrence Matriz. In Proceedings of the
ICCVG2002, Pologne, 2002, 1-8 p.

[CAVALCANTI et al., 2002] CAVALCANTI, G. C.; DORIA, R. C.; FILHO, E.C.B.C.


Features Selection for Off-Line Recognition of Different Size Signatures. International
Workshop on Neural Networks for Signal Processing (NNSP2002), Martigny, VelaisSwitzerland, 2002, 335-364 p.

[CHA, 2001] CHA, S. Use of Distance Measures in Handwriting Analysis. PhD Thesis, State
University of New York at Buffalo, EUA, 2001.

[CHAN & STOLFO, 1998] CHAN, P.; STOLFO, S. Learning with Non-uniform Class and
Cost Distribuitions: Effects and a Distributed Multi-Classifier Approach. Workshop on
Distributed Data Mining, Notes KDD-98, Technical Report, 1998, 1-9 p.

124

[CHUANG, 1977] CHUANG, P. C. Machine Verification of Handwritten Signature Image.


Proc. Int. Conf. On Crime Countermeasures-Sci, J. S. Jackson and R. W. De Vore,
University of Kentucky, Lexington, 1977, 105-109 p.

[DENG et al., 1999] DENG, P.; LIAO, H. M.; HO, C. W.; TYAN, H.; Wavelet-based Off-line
Signature Verification. Computer Vision and Image Understanding, Vol.76, no. 3,
1999, 173-190 p.

[DIETTERICH, 1998] DIETTERICH, T. Approximate statistical tests for comparing


supervised classification learning algorithms. Neural Computation, Vol.10, no. 7,
1998, 1895-1923 p.

[DROUHARD et al., 1994] DROUHARD, J.; SABOURIN, R.; GODBOUT, M. Evaluation


of a Training Method and of Various Rejection Criteria for a Neural Network Classifier
Used for Off-Line Signature Verification. IEEE International Conference on Neural
Networks, Orlando, Florida, 1994, 4294-4299 p.

[DUDA & HART, 1973] DUDA, R. O.; HART, P. E. Pattern Classification and scene
analysis. John Wiley & Sons Inc., 1973.

[FANG et al., 2003] FANG, B.; LEUNG, Y. Y.; TANG, K. W.; TSE, P. C. K; KWOK, Y.
K.; WONG, Y. K. Off-Line Signature Verification by the tracking of feature and stroke
positions. Pattern Recognition, Vol.36, 2003, 91-101 p.

[FAEZ et al., 1997] FAEZ, KARIM; DEHGHAN, MEHDI; FATHI, MAHMOOD.


Signature Verification Using Shape Descriptors and Multiple Neural Networks. IEEE
Tencon Speech and Image Technologies for Computing and Telecommunications,
1997, 415-418 p.

[FUJITA, 1998] FUJITA, O. Statistical Estimation of the Number of Hidden Units for
Feedforward Neural Networks. Neural Networks, Vol. 11, 1998, 851-859 p.

125

[FUMERA et al., 2000] FUMERA, G.; ROLI, F.; GIACINTO, G. Reject Option with
multiple thresholds. Pattern Recognition. Vol. 33, 2000, 2099-2101 p.

[GORI & SCARSELLI, 1998] GORI, M.; SCARSELLI, F. Are Multilayer Perceptrons
Adequate for Pattern Recognition and Verification?. IEEE Transactions on Pattern
Analysis and Machine Intelligence, Vol. 20, No. 11, 1998, 1121-1132 p.

[GUERRA & DONAIRE, 1991] GUERRA, JOS MAURI; DONAIRE, DENIS. Estatstica
Indutiva teoria e aplicaes. Liv. Cincia e Tecnologia, 2.ed., So Paulo, 1992, 129177 p.

[HAYKIN, 2001] HAYKIN, SIMON. Redes Neurais Princpios e prtica. Bookman, 2.ed.,
Porto Alegre, 2001.

[HUANG & YAN, 1997] HUANG, K.; YAN, H. Off-line Signature Verification Based on
Geometric Feature Extraction and Neural Network Classification. Pattern Recognition,
Vol.30, No.1, 1997, 9-17 p.

[JAPKOWICZ, 2000] JAPKOWICZ, N. Learning from Imbalanced Data Sets: A Comparsion


of Various Solutions. International Workshop on Learning from Imbalanced Data Sets,
Technical Report WS-00-05, 2000.
[JOACHIMS, 2000] JOACHIMS, T. SVMlight is an implementation of Support Vector
Machines (SVMs) in C. Version 5.0, User Manual, University of Dortmund, 2000.

[JUSTINO, 2001] JUSTINO, E. O Grafismo e os Modelos Escondidos de Markov na


Verificao Automtica de Assinaturas. Tese de Doutorado, Pontifcia Universidade
Catlica do Paran, Brasil, 2001.

[JOSSO et al., 2001] JOSSO, B.; BURTON, D.; LALOR, M. Wavelet strategy for surface
roughness analysis and characterisation. Computer Methods in Applied Mechanics and
Engineering, Vol. 191, 2001, 829-842 p.

126

[JUSTINO, 2002] JUSTINO, E. A Anlise de Documentos Questionados. Relatrio Tcnico


para obteno do grau de professor Titular. Pontifcia Universidade Catlica do Paran,
Brasil, 2002.

[JUSTINO et al., 2002] JUSTINO, E.; SABOURIN, R .; BORTOLOZZI, FLAVIO. The


Interpersonal and Intrapersonal Variability Influences on Off-Line Signature
Verification Using HMM. 15th Brazilian Sumposium on Computer Graphics and Image
Processing (SIBGRAPI02), Fortaleza, Brazil, 2002, 197-202 p.

[JUSTINO et al., 2003] JUSTINO, E.; SABOURIN, R .; BORTOLOZZI, FLAVIO. An OffLine Signature Verification Method Based on SVM Classifier and Graphometric
Features. In Proceedings 15th International Conference on Advances in Pattern
Recognition (ICAPR2003), Calcuta, India, aceito para publicao 11 Dezembro, 2003.

[KHOLMATOV, 2003] KHOLMATOV, A. A Biometric Idendtity Verification Using OnLine & Off-Line Signature Verification. Masters Thesis, Sabanci University, 2003.

[LAM & SUEN, 1997] LOUISA, L.; SUEN, C. Application of Majority Voting to Pattern
Recognition: An Analysis of Its Behavior and Performance. IEEE Transactions on
Systems, Man and Cybernetics, Vol.27, No.3, 1997, 553-568 p.

[LAWRENCE et al., 1998] LAWRENCE, I. B.; BACK, A.; TSOI, A. C.; GILES, C. L.
Neural Network Classification and Prior Class Probabilities. Tricks of the Trade,
Lecture Notes in Computer Science State-of-the-Art Surveys, Springer Verlag, 1998,
299-314 p.

[LEE, 1995] LEE, L. L. Neural Approaches for Human Signature Verification. Third
International Conference on Document Analysis and Recognition ICDAR95, Montreal,
Canad, 1995, 1055-1058 p.

[LIPPMANN, 1987] LIPPMANN, R. P. An Introduction to Computing with Neural Nets.


IEEE Acoustics, Speech and Signal Processing Magazine, Vol. 4, No. 2, 1987, 4-22 p.

127

[MALAVIYA & PETERS, 1997] MALAVIYA, A.; PETERS, L. Fuzzy Feature Description
of Handwriting Patterns. In Pattern Recognition, Vol. 30, No. 10, 1997, 1591-1604 p .

[MARAR et al., 2002] MARAR, J.F.; RODRIGUES, R.F.; COSTA, D.N. Deteco de
Falsificao em Assinaturas Humanas Baseada em Redes Neurais Artificiais. II
Congresso Brasileiro de Computao, Brasil, 2002.

[MUKKAMALA et al., 2002] MUKKAMALA, S.; JANOSKI, G; SUNG, A.H. Intrusion


Detection Using Neural Networks and Support Vectors Machines. Proceedings of IEEE
International Joint Conference on Neural Networks, IEEE Computer Society Press,
EUA, 2002, 1702-1707 p.

[MOODY, 1994] MOODY, J. Prediction Risk and

Architecture Selection for Neural

Networks. From statistics to Neural Netowrks: Theory and Pattern Recognition


Applications, V.Cherkassky J.Friedman and H. Wechsler (eds),

Springer-Verlage,

1994, 147-165 p.

[MURSHED et al., 1995] MURSHED, N.; BORTOLOZZI, F.; SABOURIN, R. Off-Line


Signature Verification Using Fuzzy ARTMAP Neural Networks. IEEE International
Conference on Neural Networks, Perth, Austrlia, 1995, 2179-2184 p.

[NOVAES, 2002] NOVAES, U. R. Agrupamento de Dados atravs de Algoritmos Swarm.


Dissertao de Mestrado.Universidade Federal do Rio de Janeiro, Brasil, 2002.

[OH & SUEN, 2002] OH, I.; SUEN, C. Y. A Class-Modular Feedforward Neural Network for
Handwriting Recognition. Pattern Recognition, Vol. 35, 2002, 229-244 p.

[OSUNA et al., 1997] OSUNA, E.; FREUD, R.; GIROSI, F. Support Vector Machines:
Training and Applications. MIT Artificial Intelligence Memo 1602; MIT A. I. Lab,
1997.

[OTSU, 1979] OTSU, N. A Threshold Selection Method from Gray-level Histograms. IEEE
Transactions on Systems, Man and Cybernetics, v. SMC 9, No.1 ,1979, 62-66 p.

128

[PETERSEN et al., 2002] PETERSEN, M. E; RIDDER, D; HANDELS, H. Image Processing


with Neural Networks A review. Pattern Recognition, Vol. 35, 2002, 2279-2301 p.

[PLUTOWSKI, 1996] PLOTOWSKI, M. E. P. Survey: Cross-Validation in theory and in


practice. Technical Report. Princeton, New Jersey, USA, 1996.

[PRINCIPE et al., 2000] PRINCIPE, J. C.; EULIANO, N. R.; LEFEBVRE, W. C. Neural


And Adaptive Systems: Fundamentals through Simulations. John Wiley & Sons Inc.,
2000.

[QI & HUNT, 1994] QI, Y.; HUNT, B.R. Signature Verification Using Global and Grid
Features, Pattern Recognition, Vol. 27, No. 12, 1994, 1621-1629 p.

[QI & HUNT, 1995] QI, Y.; HUNT, B.R. A Multiresolution Approach to Computer
Verification of Handwritten Signatures, IEEE Transactions on Image Processing, Vol. 4,
No. 6, 1995, 870-874 p.

[RASHA, 1994] RASHA, ABAS. A Prototype System for Off-Line Signature Verification
Using Multilayered Feedforward Neural Networks. Masters Thesis, RMIT Department
of Computer Science, Melbourne, 1994.

[RIBEIRO & VASCONCELOS, 1999] RIBEIRO, J.; VASCONCELOS, G. Arquiteturas


Construtivas Autoassociativas para a Verificao Automtica de Assinaturas,
Proceedings of the 4th Brazilian Conference on Neural Networks, So Jos dos Campos,
So Paulo, 1999, 263-268 p.

[RIGOLL & KOSMALA, 1998] RIGOLL, G.; KOSMALA, A. A Systematic Comparison


Between on-line and off-line methods for signature verification with Hidden Markov
Models, 14th International Conference on Pattern Recognition, vol. 2, Australia, 1998,
1755-1757 p.

129

[SABOURIN & GENEST, 1994] SABOURIN, R .; GENEST, G. An Extended-Shadow-Code


Based Approach for Off-Line Signature Verification. 12th IAPR International
Conference on Pattern Recognition, Israel, 1994, 450-460 p.

[SANSONE & VENTO, 2000] SANSONE, C.; VENTO, M. Signature Verification:


Increasing Performance by a Multi-Stage System. Pattern Analysis & Applications,
No.3, 2000, 169-181 p.

[SILVA, 2003] Os exterminadores dos cheques, Veja, Editora Abril, No. 36, ed. 1819 2003,
98-99 p.
[SVM, 2003] SVMlight Support Vector Machine, www.cs.cornel.edu/People/tj/svm_light ,
acessado em 1 de Setembro de 2003.

[VELEZ et al., 2003] VELEZ, J. F.; SANCHEZ, A.; MORENO, A. B. Robust Off-Line
Signature Verification Using Compression Networks and Positional Cuttings. IEEE Int.
Workshop on Neural Networks for Signal Processing (NNSP03), Toulouse, France,
2003.

[WALCZAK & CERPA, 1999] WALCZAK, S.; CERPA, N. Heuristic Principles for the
Design Of Artificial Neural Networks. Information and Software Technology. Vol. 41,
No. 2, 1999, 109-119 p.

[WEIS & PROVOST, 2001] WEIS, G. M.; PROVOST, F. The Effect of Class Distribution on
Classifier Learning: An Empirical Study. Technical Report ML-TR-44. Rutgers
University, EUA, 2001.

[WILSON, 1999] WILSON, A. T. Off-line Handwriting Recognition Using Artificial Neural


Networks. Technical Report, University of Minnesota Morris, EUA, 1999.

[XIAO & LEEDHAM, 1999] XIAO, X; LEEDHAM, G. . Signature Verification by Neural


Networks with Selective Attetion and a Small Training Set. Applied Intelligence, Vol.11,
No.2, 1999, 213-223 p.

130

[ZELL et al., 1994] Zell, A. et al. SNNS Stuttgart Neural Network Simulator. User Manual,
Version 4.2, University of Stuttgart, 1994.

[ZHANG et al., 1998] ZHANG, BAI-LING; FU, MIN-YUE; YAN, HONG. Handwritten
Signature Verification based on Neural Gas Based Vector Quantization. Proc. 14th
International Conference on Pattern Recognition, Brisbane, 1998, 1862-1864 p.

[ZHANG, 2000] ZHANG, G. P. Neural Networks for Classification: A Survey. IEEE


Transactions on Systems, Man, and Cybernetcis. Vol. 30, No. 4, 2000, 451-462 p.

Apndice

A. Experimento com Kernel Linear do SVM

O uso do classificador SVM testado com kernel linear devido aos resultados
promissores encontrado em Justino [JUSTINO et al., 2003], porm os resultados demonstram
ser inferiores ao kernel polinomial.
Tabela A.1: Resultado comparativo entre SVM com kernel linear e polinomial.

Autores

Variao de amostras genunas nmero de autores


SVM(kernel polinomial)
SVM (kernel linear)
Erro
Erro
Erro
Erro
Erro
Tipo I
Tipo II
Mdio Tipo I
Tipo II
(%)
(%)
(%)
(%)
(%)
Genuna Simples Simulada Aleatria Total Genuna Simples Simulada Aleatria
10,33
1,00
31,44
7,80
8,00
2,00
33,44
6,44
40
12,64
10,67
1,67
29,77
6,78
9,33
1,33
29,77
8,14
50
12,22
9,67
0,67
26,76
6,78
8,00
2,00
30,10
7,12
60
10,97
10,00
0,33
25,42
5,76
8,33
1,00
28,43
6,10
70
10,37
9,33
0,67
24,41
5,08
6,67
0,33
28,43
5,76
80
9,87
9,33
0,00
28,43
4,75
7,00
1,00
30,43
5,08
90
10,62
9,33
0,00
25,75
4,07
7,33
1,33
31,10
5,08
100
9,79
9,00
0,67
24,41
5,76
7,33
0,67
29,10
6,78
110
9,96
8,33
0,33
23,08
5,76
8,33
0,67
24,75
6,10
120
9,37
9,00
0,00
19,40
4,75
6,67
1,67
22,07
5,76
130
8,28
10,67
0,33
19,40
5,08
7,33
1,33
21,74
5,76
140
8,87
11,33
0,33
17,73
5,76
9,33
0,67
20,40
6,44
150
8,78
12,67
0,00
18,06
4,07
9,67
1,00
20,74
5,42
160
8,70
12,00
0,33
17,39
4,07
10,67
1,00
20,74
5,08
170
8,44
10,67
0,33
20,07
3,73
180
11,33
0,00
16,72
3,39
7,86

Erro
Mdio
(%)
Total
12,47
12,14
11,81
10,97
10,29
10,87
11,21
10,97
9,96
9,04
9,04
9,21
9,20
9,37
8,70

132

B. Experimento com Outras Medidas de Distncias

Com objetivo de melhorar ainda mais os resultados em termos de taxas de erros


demonstrados, novas medidas de distncias so implementadas e testadas, sendo que as
medidas utilizadas so as descritas na seo 4.4. Para este experimento utilizada a Tabela
6.4 usada nos experimentos finais. Porm o protocolo parcialmente utilizado com um subconjunto de 40 autores. Os resultados apresentados referem-se ao conjunto de teste da base de
aprendizagem e da base de teste final usada com o voto majoritrio.
Tabela B.1: Resultado do experimento com medidas de distncias.
Teste base 40

Teste base 60

Euclidiana

Erro Tipo I
(%)
Genunas
13,33

City-block

12,30

6,29

10,67

1,07

37,67

5,76

13,79

Quadrtica

8,67

10,37

12,67

2,67

39,33

8,81

15,87

Distncia

Erro Tipo II
(%)
Aleatrias
5,06

Erro Tipo I
(%)
Genunas
12,33

Erro Tipo II
Erro Total
(%)
(%)
Simples
Servis Aleatrias
Total
0,33
32,00
3,73
12,09

Você também pode gostar