Escolar Documentos
Profissional Documentos
Cultura Documentos
CURITIBA
2004
Informtica
Aplicada
da
Pontifcia
Universidade
CURITIBA
2004
Agradecimentos
minha esposa, meu filho, e, tambm, aos meus pais que sempre me incentivam a continuar
lutando pelos meus ideais.
Ao Professor Dr. Robert Sabourin pela fundamentao terica e contribuies seguras dadas a
este trabalho.
Ao amigo e Professor Dr. Alceu de Souza Brito Jr. pelo incentivo a ingressar nesta jornada
fornecendo a oportunidade de demonstrar meu potencial.
SUMRIO
vii
Lista de Figuras
Figura 1.1
Figura 1.3
Figura 2.1
10
Figura 2.2
12
verificao de assinaturas.
Figura 2.3
17
Figura 2.4
21
28
treinamento.
Figura 2.6
29
Figura 2.7
32
Figura 2.8
33
Figura 4.1
51
Figura 4.2
51
Figura 4.3
52
Figura 4.4
53
Figura 4.5
53
curvilneos (b).
Figura 4.6
54
Figura 4.7
54
Figura 4.8
55
viii
Figura 4.9
56
56
57
57
60
uma assinatura: (a) clara; (b) confusa; (c) concentrada; (d) espaada.
Figura 4.14 Exemplos de assinaturas com relao a simetria: (a) Assinatura
60
61
61
62
63
Gancho; (b) Clava; (c) Golpe de sabre e inflada; (d) Espiral; (e)
Movimento em tringulo e lao; (f) Bucle; (g) Arco; (h) Guirlanda e
serpentina.
Figura 4.19 Preciso nas mtricas de distncia euclidiana, euclidiana quadrtica e
66
bloco-cidade.
Figura 4.20 Hierarquia de tipos de caractersticas de acordo com Cha [CHA, 2001].
69
Figura 4.21 Transformao de: (a) Domnio das caractersticas (policotomia) para
70
71
72
Figura 4.24 Comparao entre (a) Domnio das caractersticas (policotomia) e (b)
73
ix
74
[CHA, 2001].
Figura 5.1
76
autenticidade de assinaturas.
Figura 5.2
77
78
82
84
clulas verticais por horizontais: (a) 4x10; (b) 4x63; (c) 8x20; (d)
10x25; (e) 10x63; (f) 20x20; (g) 25x63.
Figura 5.6
86
88
89
90
91
91
92
Figura 5.13 Primitiva centro de gravidade (a) imagem limiarizada plotada no grid e
93
95
primitivas implementadas.
Figura 5.15 Histograma de deciso no conjunto de validao com limiares de
101
deciso.
Figura 6.1
xi
114
Lista de Tabelas
Tabela 2.1
30
Tabela 2.2
34
Tabela 3.1
44
Tabela 4.1
64
primitivas implementadas.
Tabela 5.1
Tabela 6.1
83
104
iniciais.
Tabela 6.2
105
Tabela 6.3
105
Tabela 6.4
106
Tabela 6.5
107
Tabela 6.6
108
autores.
Tabela 6.7
108
Tabela 6.8
110
Tabela 6.9
111
quantidade de amostras.
Tabela 6.10 Resultados obtidos uso de limiares de rejeio.
113
113
115
116
117
Tabela A.1
131
Tabela B.1
132
xii
ART
Dpi
HMM
IC
Intervalo de Confiana
k-NN
k Nearest Neighbors
LARD
MLP
Multi-Layered Perceptron
MMH
MSE
PPGIA
PUC-PR
RBF
RF
Fator de Confiabilidade
RNA
SNNS
SRM
SV
Vetores de Suporte
SVM
QV
Quantizao Vetorial
VC
xiii
Lista de Smbolos
P( . / . )
P( . ), P[.]
Probabilidade a posteriori.
Probabilidade a priori.
f(x)
w.
Grupo ou classe.
yi
G(x)
N, n
T, T1, T2
Bias.
p.
Falsa aceitao.
Falsa rejeio.
K(xi, x)
C
Funo do kernel.
Penalidade do erro no SVM.
p
dij
Distncia entre i e j
.(+)
.(-)
..
fv. .
Ri
Resumo
xv
Abstract
The off-line signature verification is an open problem due mainly to the variability
presented by samples from the same writer, the similarity among samples from different
writers as well as to different forgery types. The proposed approach is based on the
graphometry, neural networks, distance measures and the dichotomic method. In this method
only two classes are used: genuine and forgery. A set of 180 writers composes the genuine
database in the training and a subset of 60 writers composes the forgery database. The
proposed solution uses a reduced number of samples for each author (around 5 samples per
writer) and only two classes. This protocol is composed by an acquisition procedure
(obtaining signatures images), preprocessing (preparating the acquired images for feature
extraction), segmentation (image divided in cells for the features extraction), feature
extraction (selection of the significant properties that represent the signature, based on
graphometric analysis), feature distance measurement (stage in which the distance between
the vectors feature belonging to two samples is computed and used to verify author
autenticity), model production (signature reference set is generated by comparison process
using neural network multilayer perceptron with backpropagation algorithm) and a decision
process (the output of previous stage is evaluated, being verified if the signature belongs or
not to the genuine class). The mean error rate obtained are 9,79%, in the false rejection and
6,71% in the false acceptance.
xvi
Captulo 1
1. Introduo
1.1. Desafio
(a)
(b)
Figura 1.1: Exemplo de (a) assinatura genuna de um autor em especfico, (b) variao
intrapessoal medida pela sobreposio de trs assinaturas genunas do mesmo autor.
(a)
(b)
(a)
(c)
(b)
(d)
Figura 1.3: Exemplo de (a) assinatura original, (b) falsificao aleatria, (c) falsificao
simulada, (d) falsificao simples.
No processo que envolve a verificao automtica de assinaturas o objetivo
discriminar entre uma assinatura genuna e todos os tipos de falsificaes. Portanto, dadas
duas classes w1, representando a classe de assinaturas genunas de um autor e w2,
representando a classe de assinaturas no genunas, o desafio basicamente separ-las.
Porm, quando falsificaes so submetidas ao sistema, principalmente as simuladas, a
complexidade aumenta. Se um limiar de deciso puder ser definido, a classificao consiste
em determinar em qual lado do limite qualquer novo dado deve se situar. A funo
matemtica de tal limite de deciso uma funo discriminante, sendo que ach-la geralmente
limiar
w1
w1
Autor 1
w2
w2
Autor 2
Falsificao Simples
Falsificao Simulada
y
Figura 1.4: Separao entre as classes w1 e w2 no espao 2 .
1.2. Motivao
Entretanto, em aplicaes reais existe, em geral um nmero bastante limitado de amostras que
podem ser usados no treinamento de modelos pessoais (em torno de 4 a 6), o que inviabiliza a
maioria destas abordagens, apesar de apresentarem excelentes resultados [JUSTINO et al.,
2003].
Alm da motivao prtica, existe tambm o interesse despertado pelo carter
desafiador da rea de pesquisa. A rea de reconhecimento de padres possui tcnicas que so
aplicadas na soluo de problemas reais cujo comportamento no obedece aos princpios
rgidos da lgica. Estes so alguns dos motivos que despertam o interesse nesta abordagem
cientfica.
1.3. Proposta
1.4. Contribuies
Esta dissertao est organizada em sete captulos. O primeiro contm uma introduo
sobre verificao automtica de assinaturas manuscritas. No segundo captulo apresentada
uma fundamentao terica de classificadores para verificao de assinaturas. No terceiro
captulo apresenta-se o resumo do estado da arte na autenticao das assinaturas. No quarto
captulo elucidada a metodologia. No quinto as etapas da abordagem proposta. Os
experimentos realizados neste trabalho para validar estatisticamente o mtodo so mostrados
no sexto captulo. E finalmente no stimo captulo so apresentadas as concluses e propostas
para trabalhos futuros.
Captulo 2
2. Fundamentao Terica
Este captulo apresenta uma base terica dos processos de autenticao de assinaturas,
contendo uma breve descrio de reconhecimento de padres, tipos e mtodos de abordagens
relacionados ao problema. Tambm so apresentados os classificadores abordados, com um
estudo de redes neurais, em especfico redes MLP e dicas de configurao de parmetros das
mesmas. Ao final, apresentada uma introduo do classificador SVM.
10
Extrao
de
Caractersticas
Espao de observao
m-dimensional
Classificao
Espao de caractersticas
q-dimensional
Espao de deciso
r-dimensional
11
12
Tipos
Verificao de
Assinaturas
On-line
Off-line
Global
Esttico
Local
Pseudodinmico
Contextual
Esttico
No-contextual
Pseudodinmico
13
artificiais, tem sido reconhecida como um mtodo para resolver problemas de reconhecimento
de padres [RASHA, 1994]. A computao neural surgiu da necessidade de entender como os
sistemas neurais biolgicos armazenavam e manipulavam a informao. importante
destacar que uma rede neural capaz de aprender as caractersticas estatsticas do ambiente
no qual ela opera, desde que os dados utilizados para o seu aprendizado sejam suficientemente
representativos do ambiente.
14
Esta teoria a base dos mtodos de classificao estatstica. Ela prov o modelo de
probabilidade fundamental para os procedimentos de classificao, como a anlise
discriminante estatstica [ZHANG, 2000]. Considera-se um problema geral de classificao
de M grupos no qual cada objeto tem um vetor de atributos x de dimenso d, em que w denota
a varivel membro que toma um valor wj se um objeto pertencente classe j. Define-se
P(wj) como a probabilidade a priori da classe j e f(x|wj) como a funo densidade de
probabilidade. De acordo com a regra de Bayes:
P( w | x) =
j
f ( x | w ) P( w )
j
j
f ( x)
(2.1)
(2.2)
Supondo que um objeto com um vetor de caractersticas x observado e uma deciso feita
sobre sua classe, a probabilidade do erro de classificao :
P( Erro | x) = P ( wi | x ) = 1 P( w j | x) ,considerando que j a classe correta. (2.3)
i j
15
(2.4)
= 1.
(2.5)
A regra discriminante simples: associar x para w1 se g(x) > 0 ou para w2 se g(x) < 0.
Qualquer aumento na funo de probabilidade a posteriori pode ser usado para alterar a
equao (2.5) para formar uma funo discriminante diferente, mas essencialmente a mesma
regra de classificao.
16
k =1,..., N
(2.6)
k =1,..., N
(2.7)
k =1,..., N
(2.8)
k =1,..., N
(2.9)
17
p1
x2
.
.
.
.
xn
p2
neti
f(neti)
yi
Unidade no-linear
p0 = b
wn
x0 = 1
Combinador linear
Figura 2.3: Modelo simplificado de um neurnio.
O modelo do neurnio identificado pela caracterstica de sua unidade no-linear:
n
net = p x + b
i
i i
i =1
(2.10)
sendo f(neti) a funo de ativao, xi o conjunto de entradas e pi os pesos de cada uma das
entradas.Algumas funes de ativao utilizadas so:
linear: idn( x) = x
(2.11)
+ 1, se x > 1
saturao: sat ( x) = x, se 1 x 1
1, se x < 1
(2.12)
18
+ 1, se x > 1
sinal: sign( x) =
1, se x < 1
tangente hiperblica: tanh(x) =
sigmide: sig(x) =
(2.13)
e x e x
e x + e x
1 e x
1 + e x
(2.14)
(2.15)
A funo sigmoidal, que a mais usada, possui esse nome devido ao formato em S
(letra grega sigma) da funo de ativao. Ela uma funo de fcil tratamento matemtico, e
usada em uma classe de redes neurais denominada MLP (Multilayer Perceptron), a qual
utiliza o algoritmo de treinamento chamado algoritmo de Propagao Reversa
(Backpropagation algortihm). A rede MLP corresponde a um modelo com unidades de
processamento dispostas em camadas que se interconectam, uma aps a outra, chegando at
uma camada de sada. Com este algoritmo, o aprendizado ocorre de tal forma que os erros so
inicialmente computados na camada de sada e ento so consecutivamente computados nas
camadas anteriores: da o nome backpropagation [HAYKIN, 2001].
O Perceptron Multicamadas (MLP) uma rede neural que consiste de uma camada de
ns de entrada, uma ou mais camadas de ns-processadores ou computacionais (neurnios)
ocultos ou escondidos e uma camada de sada tambm composta por ns computacionais. Os
ns-fontes so utilizados para aplicao do sinal de entrada e os neurnios das camadas
ocultas agem como detectores de caractersticas. Esses neurnios so ditos ocultos, pois eles
so fisicamente inacessveis pelas entradas ou pela sada da rede. Os neurnios de sada
fornecem as respostas de rede neural aos sinais de entrada a ela apresentada [PRINCIPE et al.,
2000].
O nmero de ns-fonte na camada de entrada determinado pela dimenso do espao
de observao que responsvel pela gerao dos sinais de entrada. O nmero de nscomputacionais na camada de sada determinado pela dimenso da resposta desejada.
Assim, o projeto de uma MLP requer a preocupao em pelo menos trs aspectos
[WALCZAK & CERPA, 1999]:
19
Walczak e Cerpa [WALCZAK & CERPA, 1999] descrevem que o projeto de uma
rede neural uma problemtica na qual existe um grande nmero de arquiteturas fsicas
alternativas de redes neurais e mtodos de treinamento que podem ser aplicados para um dado
problema de negcios. O objetivo incorporar uma quantia significativa de conhecimento
dentro do projeto de redes neurais mesmo antes do processo de aprendizagem ter comeado.
O desempenho da generalizao de aprendizagem supervisionada de redes neurais
backpropagation geralmente melhora quando o tamanho da rede minimizado com respeito
aos pesos das conexes entre ns de processamento (elementos de entrada, escondidos, e
camadas de sada). As seguintes situaes resultam em uma pobre generalizao das
amostras: redes que so grandes demais tendem para a memorizao dos dados de entrada e
redes com poucas conexes no contm elementos de processamento suficiente para
corretamente modelar o conjunto de dados de entrada.
De acordo com Lippmann [LIPPMANN, 1987], o nmero de ns deve ser grande o
suficiente para formar uma regio de deciso que seja to complexa quanto requerido pelos
dados do problema, porm no deve ser to grande a ponto de muitos pesos no serem
confiveis. Dentro deste contexto, a seleo de variveis de entrada uma importante e
complexa tarefa para o projeto de redes neurais.
As redes neurais melhoram o desempenho com domnio adicional de conhecimento
provido atravs de variveis de entrada. Se uma quantia suficiente de informao
representando o critrio de deciso crtica no dada para uma rede neural, ento a mesma
no pode desenvolver um correto modelo do domnio. comum acreditar que a aprendizagem
20
21
misturadas. Um simples perceptron pode formar somente a metade das regies de deciso,
desta forma no capaz de solucionar problemas que no sejam linearmente separveis,
conforme a primeira linha da Figura 2.4, j uma rede com uma camada escondida pode formar
limites de deciso mais complexos como mostrado na segunda linha da Figura 2.4.
Estrutura em
Camadas
Escondidas
Descrio da
Regio de Deciso
Problema do OU
exclusivo
Metade do plano
limitado pelo
hiperplano
Simples
Regies abertas
Uma
Complexidade
limitada pelo
nmero de unidades
escondidas
Duas
Figura 2.4: Interpretao geomtrica das regras de unidades escondidas em um espao bidimensional de acordo com Lippmann [LIPPMANN, 1987].
Na Figura 2.4 uma anlise feita com relao ao nmero de camadas e ns de acordo
com Lippmann [LIPPMANN, 1987]. Em relao ao nmero de ns, dois ns so suficientes
para resolver o OU exclusivo como na segunda linha da Figura 2.4. Mas na quarta coluna
demonstrado que nenhum nmero de ns com uma camada escondida pode separar as classes
com regies misturadas. Um perceptron com duas camadas escondidas forma arbitrariamente
regies de decises complexas e separa as classes com regies misturadas conforme a terceira
linha da Figura 2.4. A anlise acima demonstra que no mais que duas camadas escondidas
so requeridas no perceptron como redes feedforward pelo fato de uma rede com duas
camadas escondidas gerar arbitrariamente regies de deciso complexas.
Uma heurstica para determinar a quantidade de camadas escondidas requerida por
uma rede neural proposta por Walczak e Cerpa [WALCZAK & CERPA, 1999], o qual
22
23
24
25
Chan e Stolfo [CHAN & STOLFO, 1998] demonstram que a distribuio das classes,
no treinamento, afetam o desempenho dos classificadores e a distribuio natural pode ser
diferente da distribuio desejada do treinamento as quais maximizam o desempenho.
Japkowicz [JAPKOWICZ, 2000] tenta demonstrar que nem sempre os diferentes tipos
de desbalanceamento de dados afetam o desempenho da classificao, assim como Weiss e
Provost [WEISS & PROVOST, 2001] demonstram que conjuntos de dados balanceados nem
sempre produzem os melhores resultados. Japkowicz demonstra que alguns mtodos podem
contornar problemas de balanceamento como:
26
De acordo com Rasha [RASHA, 1994] muitos esforos so requeridos para projetar
uma rede neural MLP. Durante o treinamento, pode-se notar que a estratgia de ajustar os
pesos torna-se um processo muito lento, podendo permanecer em um mnimo local, ou
tornando-se instvel e oscilando entre solues. A seguir so apresentados alguns parmetros
de treinamento a serem considerados:
Treinamento por padro ou por poca: Quando se treina a rede, o erro calculado e
cada unidade na rede tem seus pesos ajustados tal que ele reduz o valor da funo de
erro. Os pesos da rede podem ser ajustados para cada padro de treinamento e
conseqentemente implementa-se o treinamento por padro. Uma alternativa treinar
por poca. Uma poca uma varredura de todos os padres no conjunto de
treinamento. Conseqentemente, uma correo acumulada do conjunto de pesos
executada depois de cada poca de treinamento. Mtodos de treinamento intermedirio
ou hbrido tambm so possveis;
27
caractersticas particulares do conjunto de treinamento. Quando tal rede for usada para
classificar amostras que no foram utilizadas no treinamento, estes discriminantes
altamente especficos tem uma pobre generalizao e executam com menos preciso
que uma rede que no foi supertreinada. Uma maneira para superar este problema
quebrar o treinamento em dois conjuntos. A primeira parte usada para treinar de
modo habitual. A segunda parte usada a cada n ciclos para controlar a curva de
aprendizagem. Quando o erro comear a subir neste segundo conjunto o treinamento
interrompido, e a rede testada pelo conjunto de teste. Outra maneira de parar o
treinamento escolher um valor de erro e esperar que o valor seja atingido, o que pode
causar uma sub-ajuste (underfitting) ou um sobre-ajuste (overfitting).
De acordo com Moody [MOODY, 1994] mais fcil ocorrer um sobre-ajuste no
treinamento com um conjunto pequeno de treinamento. Desta forma, deve-se tomar cuidado
para no selecionar um modelo que seja grande demais, pois o mesmo resulta em um longo
tempo de convergncia e o desempenho global conseqentemente nunca perfeito.
Tambm conjuntos de dados limitados fazem a estimao do risco de predio mais
difcil, se no houver dados suficientes disponveis. Nestas situaes, preciso usar
abordagens alternativas que habilitem a estimao do risco de predio dos dados
separadamente como a re-amostragem, usando, por exemplo, validao cruzada tipo kparties [PLUTOWSKI, 1996].
O erro esperado do treinamento e teste com relao bias / variana para amostras
finitas de treinamento ilustrada na Figura 2.5. De acordo com Zhang [ZHANG, 2000] bias e
variana so, na maioria das vezes, incompatveis. Com um conjunto de dados fixado, o
esforo em reduzir um implicar no aumento do outro.
Um bom compromisso entre bias e variana necessrio para construir um
classificador baseado em redes neurais. Na Figura 2.5 notam-se regies de sub-ajuste (bias
elevado) e de sobre-ajuste (varincia), em que tcnicas de seleo do modelo ideal tentam
encontrar o ponto timo entre falta e excesso de treinamento, os quais correspondem a um
mnimo global dos erros do conjunto de teste ou curva de risco de predio.
28
Erro
Sub-ajuste
Sobre-ajuste
Conjunto de teste
Conjunto de treinamento
Tempo do Treinamento
Modelo Ideal
p(x|wi)
p(x|w1)
p(x|w2)
29
As probabilidades do erro de classificao conforme a Figura 2.6 podem, por exemplo, ser
calculadas como:
(2.16)
Em geral nos problemas de classificao de padres pode haver dois tipos de erros de
classificao:
classificao. Na Figura 2.6 T representa este limiar. A escolha segue os critrios para
minimizar a mdia do erro de falsa rejeio e falsa aceitao tentando minimizar o custo do
erro.
Para avaliar as medidas de desempenho que levem em conta a probabilidade de um
erro de classificao, a significncia e o custo de um erro, algumas medidas de desempenho
so necessrias como:
Taxa de erro aparente: a taxa de erro atual que o classificador aparentar, quando
aplicado para todos os casos desconhecidos que ele tratar. Se um nmero ilimitado de
classes estiver disponvel, a taxa de erro verdadeira ser computada como o nmero de
amostras infinitamente abordadas. Entretanto, em casos prticos, o nmero de
amostras disponveis finito, e relativamente pequeno. A taxa de erro aparente ou
emprica calculada, como notada na equao (2.17), como sendo o nmero de erros
feitos pelo classificador em relao ao nmero de amostras.
n erros
n amostras
(2.17)
30
Matriz de confuso: uma matriz bi-dimensional usada para dispor os diferentes erros.
A Tabela 2.1 ilustra uma matriz de confuso para trs classes. A matriz de confuso
lista a correta classificao contra a classificao predita para cada classe. Enquanto os
elementos diagonais na matriz de confuso representam o nmero de classificaes
corretas, os elementos fora da diagonal representam o nmero de erros para um
particular tipo de erro de m classificao. Portanto uma matriz de confuso desejada
ter um valor mximo nos elementos diagonais e valor zero fora dela.
Tabela 2.1: Matriz de confuso de trs classes
Classes Preditas
1
2
3
1
50
0
0
Classes Verdadeiras
2
0
48
2
3
0
5
45
31
2.6. SVM
32
w2
w1
hiperplano tim o
33
f ( x) = sign y i i0 K ( xi , x) + bo
xi sv
(2.18)
34
Kernel
Linear
Expresso
K ( xi , x) = x.xi
Polinomial de grau d
K ( xi , x) = (1 + x.xi )
Gausseano RBF
K ( xi , x) = exp x xi
(2.19)
Dado um conjunto de treinamento S1 composto por duas classes separadas, w1 (y1 = +1) e w2
(y1 = -1), o SVM acha o hiperplano com a mxima distncia euclidiana. De acordo com os
princpios do SRM, haver apenas um hiperplano timo com a margem mxima u , definida
como a soma das distncias do hiperplano para os pontos mais prximos das classes. Este
limiar do classificador linear o hiperplano timo separador, conforme j demonstrado na
Figura 2.7.
S1 = (( xt 1 , y1 ),...( xt l , y l )), xt 1 n , y1 { 1,+1}
(2.20)
35
f ( ) =
(2.21)
i =1
A soluo do SVM [JUSTINO et al., 2003], pode ser encontrada se mantiver o limite
superior na dimenso VC (nmero de pontos mximo que pode ser separado para um
conjunto de dados), e por minimizar o limite superior no risco emprico, isto o nmero de
erros de treinamento, com a seguinte minimizao:
min
| =
w,b ,
n
1{ {
p. p + C i
2
i =1
(2.22)
sendo que C > 0, determina uma negociao entre o erro emprico e o termo de complexidade.
O parmetro C escolhido livremente. Um grande valor para C corresponde a uma associao
de uma penalidade mais alta para os erros.
Captulo 3
Deng [DENG et al., 1999] apresentam um sistema de verificao de assinaturas offline baseado em funes wavelet, utilizando um algoritmo de perseguio de contorno
fechado para transformar as imagens de assinaturas em sinais unidimensionais. Os dados de
curvatura de contorno so decompostos em sinais multiresoluo usando transformada
wavelet. Alm disso, uma medida estatstica criada para decidir, sistematicamente, quais so
os contornos fechados e os dados de freqncias associados a estes contornos, demonstrando
quais autores so mais estveis e discriminantes relacionados a este critrio. Baseando-se
nestes dados, calculado um valor de limiar timo que controla a preciso do processo de
extrao de caractersticas. O sistema utiliza imagens binrias na extrao das caractersticas,
usadas tanto em sistemas on-line quanto em off-line. A base de dados usada por Deng [DENG
et al., 1999] composta de 50 autores cada um com 20 assinaturas genunas e 5 pessoas
fornecem 10 tipos de falsificaes dos 50 autores perfazendo um total de 3500 assinaturas.
37
Um outro mtodo proposto por Bajaj e Chaudhury [BAJAJ & CHAUDHURY, 1996]
utiliza trs caractersticas globais. O uso de caractersticas globais d-se pelo fato de que as
mesmas trabalhavam com a forma da imagem, provendo um mecanismo mais rpido de
acesso para os dados de assinatura, ao contrrio de caractersticas locais que requerem
tcnicas computacionalmente onerosas para a determinao de similaridade. Bajaj e
Chaudhury [BAJAJ & CHAUDHURY, 1996] usam momentos de projeo tambm usados
por Marar [MARAR et al., 2002] e Ribeiro e Vasconcelos [RIBEIRO & VASCONCELOS,
1999], a qual utiliza uma medida estatstica da distribuio dos pixels da assinatura e, ao
contrrio de outras caractersticas globais, relativamente insensvel a distores e variaes
de estilo. Um outro tipo de caracterstica, utilizado por Bajaj e Chaudhury [BAJAJ &
CHAUDHURY, 1996] est relacionado com a distribuio extrema de pixels envolvendo os
limites inferiores e superiores da assinatura, denominado envelopes. Para aumentar a
confiabilidade da classificao, os resultados obtidos das trs caractersticas so combinados
em mltiplos classificadores. A verificao feita com base no vetor destas 3 caractersticas
utilizando trs redes MLP. O uso de mltiplos classificadores introduz um elemento de
redundncia no esquema, pois os erros de classificao so compensados por um simples
classificador, se, claro, outros classificadores no proverem a correta deciso. As sadas dos
trs classificadores so combinadas para a deciso final, atravs da estratgia do vencedor
leva tudo. O mtodo tem a vantagem de combinar evidncias providas por diferentes tipos de
caractersticas, porque no caso da haver confuso na classificao quanto caracterstica
outro conjunto pode auxiliar. A base de dados usada no experimento composta por 10
autores, cada um provendo 15 assinaturas e somente 100 assinaturas aleatrias dos 10 autores.
Nota-se, tambm, que o modelo de redes neurais mais amplamente utilizado em
problemas relacionados verificao de assinaturas a rede MLP e o algoritmo
backpropagation, porm Ribeiro e Vasconcelos [RIBEIRO & VASCONCELOS, 1999]
utilizam arquiteturas construtivas (as quais constroem sua prpria estrutura incluindo
unidades e camadas intermedirias) Cascade-Correlation, Tower e Pyramid sob a abordagem
autoassociativa (em que as sadas so foradas a reproduzir as entradas) sendo os resultados
comparados com a rede MLP. Ribeiro e Vasconcelos acreditam que modelos de redes
feedforward que atuam como classificadores no so adequados, pois a discriminao de
classes neste tipo de rede realizada por superfcie de separao, a qual gerada para
particionar os dados de entrada. No entanto, tais superfcies so abertas. J as redes
feedforward que atuam como autoassociadores geram superfcies de separao fechadas, e
38
utilizam critrios de rejeio relacionados maneira com que a entrada se aproxima da sada.
Na extrao de caractersticas Ribeiro e Vasconcelos [RIBEIRO & VASCONCELOS, 1999]
utilizam momentos invariantes, inclinao e fator de presso global da imagem. Ao final o
resultado em uma base de dados reduzida com 21 autores demonstra algum ganho com
relao falsa rejeio, mas nenhum acrscimo falsa aceitao.
O nmero de assinaturas genunas do mesmo autor no processo de treinamento tornase um problema na maioria dos mtodos propostos. Uma abordagem que procura minimizar
este problema proposta por Xiao e Leedham [XIAO & LEEDHAM, 1999], nesta abordagem
uma rede neural MLP usada como classificador. A base fundamental do mtodo reside no
fato que peritos forenses localizam primeiro as diferenas entre a assinatura de entrada e a
assinatura genuna armazenada, comparando caractersticas locais, ento analisam a variao
destas caractersticas julgando se as mesmas so essenciais ou acidentais. Neste estudo, Xiao
e Leedham [XIAO & LEEDHAM, 1999] tratam das partes estveis da assinatura, ou seja,
segmentos com menores variaes, como tambm dos ns de resposta do classificador. Para
alcanar estes objetivos, usado um mtodo para gerar falsificaes artificiais das assinaturas
genunas assim como uma rede neural com realimentao apropriada dos pesos dos ns de
resposta. Com relao s caractersticas, a distribuio dos pixels em quatro direes
utilizada dentro de um grid. Os resultados obtidos com poucos autores so aceitveis,
principalmente pelo nmero de assinaturas genunas utilizadas (em torno de 9), porm
conveniente ressaltar que 9 autores voluntrios so insuficientes para uma perfeita validao
estatstica.
Alguns trabalhos abordam o problema de falsificaes aleatrias [MURSHED et al.,
1995], em que o sistema treinado somente com assinaturas genunas. A alegao que na
prtica nem sempre possvel obter assinaturas falsificadas, tornando-se impraticvel quando
aplicada em sistemas reais como aplicaes bancrias. Para lidar com estas dificuldades
alguns pesquisadores tm usado assinaturas de outros autores no sistema como sendo
assinaturas falsas, as chamadas falsificaes aleatrias. Neste caso, a taxa de falsa aceitao
artificialmente reduzida no contexto de falsificao, de acordo com Murshed. Por exemplo, se
39
40
usa-se a transformao de escala de cinza por regio, sendo aplicada uma mscara de tamanho
3 x 3 sobre as regies de tamanho 80 x 40. Zhang [ZHANG et al., 1998] enfatizam a
necessidade de se coletar as assinaturas em tempos distintos, para tanto realizam experimentos
diferenciados com amostras coletadas em perodos distintos.
Outra abordagem que utiliza a gerao de assinaturas genunas artificiais para
treinamento proposta por Huang e Yan [HUANG & YAN, 1997] com uma variante em que
assinaturas artificiais com alto grau de distoro so incorporadas como falsificao no
processo de treinamento. Um modelo de segmentao em clulas de tamanhos diferenciados
aplicado na extrao das caractersticas locais. As caractersticas geomtricas so obtidas do
ncleo da assinatura, do contorno, da distribuio dos pixels, de fronteiras direcionais e da
regio de mxima presso. A base de dados usada de 3528 assinaturas de 21 autores sendo
que cada autor cede 24 assinaturas genunas e 6 outras pessoas produzem 24 falsificaes dos
21 autores. Vrios nveis de resoluo do grid so testados, sendo um nvel para cada rede, a
qual comps as caractersticas dentro do tamanho do grid em especfico. Aps o treinamento
individual de cada rede, as sadas so passadas para uma outra rede neural cuja funo
combinar as respostas de cada rede e produzir uma deciso.
Sabourin e Genest [SABOURIN & GENEST, 1994] propem uma abordagem local
com caractersticas estatsticas. Este mtodo utiliza a tcnica denominada Extended-ShadowCode na qual as operaes de projees so definidas em um grid, ocorrendo simultneas
projees para cada pixel preto nas barras horizontais, verticais e na diagonal. A projeo
contm um conjunto de bits distribudos ao longo de cada barra, os quais so contados. O
mtodo de verificao estatstico e utiliza dois classificadores knn (vizinho mais prximo) e
um classificador de mnimas distncias. Com relao ao uso de uma base de dados Sabourin e
Genest [SABOURIN & GENEST, 1994] utilizam 800 assinaturas, sendo 40 assinaturas
produzidas por 20 autores distintos.
De acordo com Justino [JUSTINO et al., 2002] cada tipo de falsificao requisita um mtodo
de reconhecimento diferente. Mtodos baseados em abordagens estticas so usados para
identificar falsificaes aleatrias e simples. A razo que estes mtodos descrevem melhor
as caractersticas relacionadas forma da assinatura. A abordagem baseada na grafometria
[JUSTINO et al., 2002] supre esta lacuna do uso de mtodos de reconhecimentos diferentes,
em relao escolha do tipo de caractersticas, pois engloba caractersticas que possuem um
tratamento
local,
as
chamadas
pseudodinmicas.
Justino
utiliza
caracterstica
41
42
43
cada regio. Uma outro grupo de caracterstica utilizada a textura com uso da matriz de coocorrncia da imagem em nvel de cinza dividindo em regies para sua extrao. No primeiro
estgio, cada grupo de caracterstica dado entrado em uma rede MLP separadamente e a
distncia euclidiana tambm extrada das caractersticas. O segundo estgio, composto das
sadas das caractersticas do primeiro estgio e da distncia euclidiana das caractersticas,
representa quatro entradas em uma rede RBF baseada na qual a deciso final tomada. A base
de dados composta de 2000 assinaturas de 115 autores. Cada autor prove 15 ou 25
assinaturas.
A Tabela 3.1 abaixo demonstra o resumo das abordagens apresentadas com seus
respectivos diferenciais em termos de tipos de abordagens e caractersticas, que fazem parte
do ponto de partida para este trabalho.
44
Caractersticas
Abordagem global
Wavelet (Como
pseudodinmicas)
Abordagem global
Projeo de momentos verticais e horizontais
Envelope baixo e alto da imagem da assinatura
Abordagem global
Momentos invariantes, inclinao e presso global.
Abordagem local
Uso de distribuio de pixels nas quatro direes Rede Neural MLP
dentro de cada clula de um grid.
Abordagem local
Segmentos grficos do grid e uso de rede Rede Fuzzy ARTMAP
backpropagation como redutor de dimensionalidade
Classificador
caractersticas
estticas
e Medidas de Distncia
Redes
Neurais
MLP,
Cascade-
Abordagem local
Caractersticas geomtricas com uso de um grid
para extrair o ncleo da assinatura, distribuio de Redes Neurais MLP
pixels, fronteiras direcionais e regies de alta
presso.
Abordagem local
Caractersticas estticas com uso de grid na k-NN e classificador de mnimas
contagem de pixels baseado nas projees
distncias
horizontais, verticais e diagonais das clulas.
Abordagem local
Caractersticas
estticas
representadas
por
Quantizao Vetorial e HMM
densidade de pixels e distribuio de pixels
Caracterstica pseudodinmica representado pela
inclinao axial
Abordagem global e local
Caractersticas geomtricas relacionadas altura, Medidas de distncia
largura, ngulo de projeo e inclinao e uso de
um grid
45
A viso crtica proposta busca contribuir para uma abordagem mais consistente e que
possua conotao prtica. Entretanto, uma comparao mais refinada em termos de resultados
estatsticos em cada abordagem torna-se difcil, justamente pela diversidade de bases de dados
e protocolos experimentais existentes, e tambm por no existir nenhuma base de dados
internacional compartilhada, implicando um grande problema para a comparao de
desempenho entre mtodos [FANG et al., 2003] [MURSHED et al., 1995].
Os resultados apresentados por algumas abordagens mostram taxas de erros baixas,
porm quando analisados profundamente demonstram que tratam apenas de alguns tipos de
falsificaes, desconsiderando, por exemplo, as falsificaes simuladas [BALTZAKIS &
PAPAMARKOS, 2000].
comum ter solues combinando diferentes tipos de classificadores, pois cada um
contribui de maneira diferenciada na elaborao do resultado final [BALTZAKIS &
PAPAMARKOS, 2000]. Em outros casos, possvel encontrar soluo combinando um
conjunto do mesmo tipo de classificador [BAJAJ & CHAUDHURY, 1996].
Muitas abordagens baseadas em caractersticas globais [DENG et al., 1999], [BAJAJ
& CHAUDHURY, 1996] e [RIBEIRO & VASCONCELOS, 1999] demonstram ser mais
rpidas no processo de extrao de caractersticas, porm, de acordo com Justino [JUSTINO
et at, 2002], mtodos que utilizam caractersticas locais possuem capacidade discriminatria
maior em relao falsificaes simuladas e simples. Com relao base de dados, muitos
mtodos apresentam quantidades de autores reduzidos para validao estatstica [XIAO &
LEEDHAM, 1999], [BAJAJ & CHAUDHURY, 1996] e [MURSHED et al., 1995]. J a
quantidade de assinaturas genunas usada por autor, no processo de aprendizagem, representa
um problema, caso o nmero extrapole uma quantidade maior do que os normalmente
aplicados em sistemas atuais, e desta forma dificulta a sua aplicao prtica [SANSONE &
VENTO, 2000], [MURSHED et al., 1995], [HUANG & YAN, 1997] [SABOURIN &
GENEST, 1994] e [JUSTINO et al., 2003].
Existem algumas abordagens que utilizam tcnicas de gerao de amostras artificiais
automaticamente [XIAO & LEEDHAM, 1999] e [FAEZ et al., 1997], como tambm a
gerao artificial automtica de amostras de falsificaes [HUANG & YAN, 1997]. Neste
caso, h controvrsias com relao incorporao destes tipos de amostras no processo de
46
47
pseudodinmicas baseadas no uso de tcnicas grafomtricas e uma rede neural MLP como
classificador. No captulo seguinte descrita toda a fundamentao metodolgica aplicada na
abordagem proposta.
Captulo 4
4. Metodologia
4.1. Requisitos
Uma anlise mais profunda sobre a da aplicao da maioria das abordagens para
verificao de assinaturas impe restries, sendo limitada a um problema em especfico. Esta
reduo de escopo contribui para o alcance de resultados desejveis, porm o uso prtico pode
ficar comprometido quando o meio utilizado diferir do meio proposto. Esta abordagem no
pretende acabar com este problema, porm a minimizao faz parte da proposta.
A seguir so apresentados alguns requisitos, que devem ser objeto de um estudo
detalhado em cada etapa do processo:
49
4.2. Recursos
4.3. Grafismo
50
4.3.1. Grafoscopia
perfeitas condies, ocorrendo casos em que existem recobrimentos, falhas devido a dobras
ou desgastes de papel, ou outras anomalias, impedindo o levantamento de elementos tcnicos
suficientes para uma concluso decisiva [JUSTINO, 2001].
Por mais que alguma semelhana nas assinaturas ou escrita de cada autor possa existir,
elementos indicadores de individualidade estaro presentes na seqncia de letras de uma
palavra. So caractersticas discriminantes observadas de perto pelo perito durante uma
percia. A seguir so apresentadas algumas dessas caractersticas individuais.
51
4.3.1.1. Calibre
(a)
(b)
4.3.1.2. Espaamento
52
53
(a)
(b)
(a)
(b)
Figura 4.5: Exemplo de assinatura de segmentos com segmentos angulares (a) e com
segmentos curvilneos (b).
Os mnimos grficos so formados pelos pontos finais, vrgulas, os pingos nos is,
acentos (crase, circunflexo, til e agudo) e cedilhas. Uma pequena poro de escritura como
um mnimo grfico pode, em alguns casos, tornar-se uma caracterstica identificadora
relevante. Os pingos nas letras is podem apresentar diferentes formas, dependendo do estilo
de escrita do autor. Podem possuir um formato curvo e aberto para cima na forma de um trao
(clave) horizontal ou vertical, pode estar inclinado esquerda ou direita, ou apresentar a
forma de um simples ponto, confira na Figura 4.6.
54
4.3.1.7. Velocidade
(a)
(b)
Figura 4.7: Exemplo de assinatura com escrita rpida (a) e lenta (b).
Os elementos seguintes descrevem alguns indicadores de escrita rpida e lenta:
Rpida
Falta de legibilidade;
Lento
55
(a)
(b)
Figura 4.8: Exemplo de assinatura com relao a inicio e fim abrupto: (a) Assinatura
original; (b) Assinatura falsificada.
56
(a)
(b)
Figura 4.9: Exemplo de assinatura relacionada a elevao do objeto de escrita: (a) Assinatura
original; (b) Falsificao com elevao do objeto de escrita.
(a)
(b)
Figura 4.10: Exemplos de assinaturas sem tremores e com tremores: (a) Assinatura
original; (b) Assinatura falsificada com traado trmulo.
57
(a)
(b)
Figura 4.11: Exemplos de assinaturas sem presso e com presso (a) Assinatura original.
(b) Falsificao servil com pontos de presso.
Correes Retrao o processo em que o objeto de escrita repinta uma poro escrita da
linha, normalmente na direo oposta. Um exemplo um movimento descendente seguido
por um movimento ascendente em cima da linha j existente. considerada uma
caracterstica do escritor, enquanto representar um comportamento natural da experincia
de escrita. Por outro lado, se acontecer como uma forma de conserto, para corrigir a forma
de uma letra, pode ser um indicativo de falsificao, conforme Figura 4.12(b).
(a)
(b)
Figura 4.12: Exemplos de assinaturas sem e com correes (a) Assinatura original. (b)
Falsificao servil com pontos corrigidos.
(a) Assinatura original. (b) Falsificao servil com correes circuladas.
importante salientar que alguns desses indicadores podem estar presentes em
assinaturas genunas de pessoas em idade avanadas ou enfermas. A mera presena destes
indicadores no significa que a assinatura analisada no seja genuna, mas dever contribuir
na determinao global da autenticidade. de se esperar que a assinatura de uma pessoa em
idade avanada apresente traos mais trmulos e vacilantes. Porm, se a assinatura
questionada apresentar uma habilidade superior esperada, uma possvel fraude pode estar
presente. Freqentemente, um falsificador, em decorrncia de um nvel de habilidade alta
58
inerente da sua escrita, pode produzir uma assinatura contendo menos indicaes de
falsificaes que uma pessoa com um nvel mais baixo de habilidade.
4.3.2. Grafologia
Mmica: nesta escola, a grafologia comporta dois estudos, o dos sinais e o das
resultantes. Os sinais so tomados no conjunto da escrita, em que se considera a altura,
a largura, a inclinao e a regularidade ou nos pormenores das palavras, das letras e
dos sinais. Sendo assim, deve-se procurar os sinais de superioridade e de inferioridade,
de carter moral (costumes e sentimentos), vontade, senso esttico, idade, sexo e
algumas indicaes patolgicas.
Os sinais usados pela escola mmica e simblica assemelham-se aos utilizados pela
grafoscopia, mas as anlises das resultantes possuem abordagens diferenciadas. As duas
primeiras avaliam a psique do escritor, a fim de estabelecer possveis patologias. J a ltima
avalia a veracidade da autoria da escrita, com a finalidade de identificar possveis fraudes.
So elementos bsicos da grafologia:
Trao: o trajeto que a caneta descreve em um nico gesto executado pelo escritor;
59
Hastes: so todos os traos plenos (movimento de descenso) das letras l,t,b, etc e
do f at a base da zona mdia. Tambm so consideradas hastes os traos verticais
do m e do n maisculo e minsculo;
Bucles: so todos os traos ascendentes (perfis) das hastes e das lanadas inferiores e,
por extenso, todo movimento que ascende cruzando a haste e unindo-se a ela
formando crculo;
Zona superior, rea onde se encontra o ponto mais alto, ocupado pelas hastes, pelos
acentos, pelas barras do t e parte das maisculas;
Zona mdia, rea central, ocupada por todas as vogais minsculas e pelas letras
m,n,r etc. cuja altura torna-se base para medir o nvel da elevao das hastes e o
nvel do descenso das lanadas inferiores;
Zona inferior, zona baixa da escrita a partir da base de todos os ovais descendentes das
maisculas ou de outras letras.
O uso individual ou
algumas caractersticas encontradas tanto na escola mmica quanto na simblica e que esto
relacionadas ao contexto de assinaturas, sendo descritas a seguir.
60
linhas, progresso e proporo. Quase todos esses aspectos do grafismo so mensurveis, isto
, podem ser avaliados grafometricamente a partir de um modelo ou padro. Tudo que exceda
ou fique abaixo deste modelo sintomtico [JUSTINO, 2001].
4.3.2.2. Ordem
A distribuio dos elementos grficos pode ser classificada em: clara, boa separao
indicando uma uniformidade na distribuio de letras e palavras, conforme Figura 4.13(a);
confusa, em que o texto aparece como uma massa no uniforme e embaralhada, conforme
Figura 4.13(b); concentrada, em que na viso do conjunto prepondera o texto sobre os espaos
em branco, Figura 4.13(c) e espaada, em que na viso do conjunto preponderam os espaos
em branco Figura 4.13(d);
(a)
(b)
(c)
(d)
Figura 4.13: Exemplos de assinaturas sob o ponto de vista da ordem, podendo ser uma
assinatura: (a) clara; (b) confusa; (c) concentrada; (d) espaada.
4.3.2.3. Proporo
(a)
(b)
(c)
61
Figura 4.14: Exemplos de assinaturas com relao simetria: (a) Assinatura proporcional; (b)
Assinatura desproporcional; (c) Assinatura mista.
4.3.2.4. Dimenso
(a)
(b)
Figura 4.15: Exemplos de assinaturas com relao a dimenso: (a) Assinatura alta; (b)
Assinatura baixa.
4.3.2.5. Presso
(a)
(b)
62
Figura 4.16: Exemplos de assinaturas com relao a presso: (a) Assinatura tensa; (b)
Assinatura frouxa.
4.3.2.6. Forma
(a)
(b)
(c)
(d)
Figura 4.17: Exemplos de assinaturas sob o ponto de vista da forma: (a) Assinatura
caligrfica; (b) Assinatura arredondada; (c) Assinatura reta vertical; (d) Assinatura reta
horizontal.
4.3.2.7. Gesto caracterstico
Existem em cada indivduo gestos que se repetem a cada instante, espcies de tique ou
atitude que o caracteriza. Na escrita tambm existem modalidades de traos ou letras que
chamam a ateno, porque imprimem ao traado uma fisionomia especial que nenhum outro
poderia reproduzir da mesma maneira. Os elementos grficos que podem formar o gesto
caracterstico em assinaturas so: gancho - consiste no movimento de regresso encontrado
nos finais das letras ou nas barras dos t conforme Figura 4.18(a); clave - carrega todo o
golpe de energia sobre a zona final do traado que fica em forma de ponta quebrada, confira
na Figura 4.18(b); golpe de sabre - o movimento promovido por um impulso da caneta, que
pode afetar as barras dos t e as partes inferiores das letras (lanadas inferiores), confira na
Figura 4.18(c1); inflao - que apresenta um tamanho exagerado, presente nas maisculas,
Figura 4.18(c2); espiral - que est presente nas letras maisculas, conforme Figura 4.18(d);
lao - que uma espcie de movimento de retorno ao ponto de partida, confira na Figura
63
(a)
1
(b)
(c)
(d)
(e)
(f)
(g)
(h)
Figura 4.18: Exemplos de assinaturas do ponto de vista de gestos caractersticos: (a) Gancho;
(b) Clava; (c) Golpe de sabre e inflada; (d) Espiral; (e) Movimento em tringulo e lao; (f)
Bucle; (g) Arco; (h) guirlanda e serpentina.
importante salientar o que foi dito anteriormente: a grafologia oferece um conjunto
de caractersticas que avaliam os aspectos psicolgicos de um escritor, usando como
ferramenta a escrita.
64
Grafologia
(mmica / simblica)
Calibre
Proporcionalidade
Espaamento
Comportamento Base
Presso
Ataque / Remate
Progresso
Inclinao Axial
Valores Angulares e Curvilneos
Mnimos Grficos
Comportamento Pauta
Primitiva Usada
Densidade de pixels
Centro de Gravidade
Pontos de Presso
Incio e Fim Abrupto
Segmentos de Tremor
Inclinao Axial
Curvatura
-
65
66
uma matriz de dados, as abordadas para o trabalho so: Euclidiana, Manhatan, city block ou
bloco-cidade e Euclidiana Quadrtica.
De acordo com Novaes [NOVAES, 2002] a distncia bloco-cidade se aproxima da
distncia euclidiana quando apenas um atributo diferencia dois objetos. Quando mais de um
atributo for usado, a distncia bloco-cidade tende a separar mais os objetos. Um exemplo
hipottico utilizando um atributo nas trs medidas de distncias mostrado na Figura 4.19.
O ato de classificar um padro pode ser considerado como sendo uma tarefa de
definio de pertinncia, em que devemos associar um novo elemento a um dos conjuntos
(classes) existentes, o que faz com que sua representao no espao de caractersticas assuma
a forma de agrupamento de pontos. Este aspecto de proximidade entre os elementos de um
conjunto pode ser utilizado como parmetro para a classificao de padres. A definio de
funes que sejam capazes de indicar uma medida de semelhana ou distncia entre dois
padres constitui um meio de formalizar o processo de classificao.
Euclidiana
x
vetor
Bloco-cidade
Euclidiana quadrtica
y
Figura 4.19: Preciso nas mtricas de distncia euclidiana, euclidiana quadrtica e blococidade.
67
(x
k =1
ik
x jk )
(4.1)
d ij2 = ( xik x jk )2
(4.2)
k =1
d ij = | xik x jk |
(4.3)
k =1
4.5. Dicotomia
68
que cada indivduo possui uma escrita consistente e distinguvel de outro indivduo [CHA,
2001]. Desta forma, a individualidade da assinatura se encaixa neste contexto.
Para a identificao da autoria de escrita ou assinaturas, necessrio determinar a
validade estatstica da individualidade do autor, baseando-se no desempenho das
caractersticas atravs da verificao, quantificao e anlise estatstica.
Considerando o problema de muitas classes, em que o nmero elevado de classes est
relacionado maioria dos mtodos de identificao de padres associados verificao de
assinaturas. Nota-se que os sistemas de verificao de assinaturas so freqentemente
desenvolvidos usando um nmero de classes pequeno e finito, tirado de um universo maior de
classes. Entretanto, de acordo com Cha [CHA, 2001] o agrupamento no subconjunto de
classes no prov a validade da individualidade da escrita. Sem a validade da individualidade
a deduo estatstica questionvel devido ao resultado deste modelo no poder ser deduzido
para a populao inteira. Como o objetivo da abordagem proposta a verificao de
assinaturas atravs de um mtodo com o uso mnimo de amostras por autor, a comparao da
deduo estatstica baseado no universo populacional no ser aprofundada, simplesmente
mencionada a dificuldade de se estabelecer um modelo por classe quando o problema envolve
toda a populao. Por esta razo, proposto um mtodo dicotmico para estabelecer a
distino inerente de classes, diferindo dos mtodos conhecidos como policotmicos.
No mtodo dicotmico utiliza-se um classificador que coloca um padro em uma de
somente duas categorias para estabelecer a individualidade. O problema modelado por duas
classes: autoria ou no-autoria. Dadas duas amostras, a distncia entre as caractersticas de
dois documentos computada e classificada como positiva (autoria) ou negativa (noautoria). Simbolicamente, as variveis de distncia entre caractersticas de amostras do
mesmo autor e as variveis de distncia entre caractersticas de amostras de autores diferentes
podem ser representadas pela notao (+) e (} ) respectivamente.
Uma vantagem do mtodo dicotmico a mltipla integrao de tipos de
caractersticas, as quais podem ter diversas origens. Vrios tipos de caractersticas so
mostrados na Figura 4.20, as quais podem ser integradas utilizando medidas de distncias de
acordo com Cha [CHA, 2001]. Na abordagem proposta somente caractersticas elementares
so abordadas.
69
T ip o s
C a ra c t e rs t ic a s
Elem entares
His togram a
D is c reto
Contnua
Com plexa
Binria
N om inal
O rdinal
S tring
M dulo
Figura 4.20: Hierarquia de tipos de caractersticas de acordo com Cha [CHA, 2001].
70
w1
w2
w3
f2
B
B
W
W
f1
(a)
(b)
Figura 4.21: Transformao de: (a) Domnio das caractersticas (policotomia) para (b)
Domnio das distncias das caractersticas (dicotomia).
O processo demonstrado para trs autores, {w1, w2, w3}. Cada autor prov trs
assinaturas e trs valores escalares de caractersticas so extradas por assinatura. A Figura
4.21(a) mostra as assinaturas no grfico para cada escritor.
Para transformar em espao da distncia, o processo aplicado no vetor de distncia
de cada caracterstica de assinaturas do mesmo autor e o mesmo denotado por x(+) ~ A
amostra da distncia entre autores , em contrapartida, obtida medindo a distncia das
caractersticas entre duas assinaturas de autores diferentes, sendo representada por x(-) dij
representa os i autores de jassinaturas.
x( ) = ( dij d kl ) onde i, k = 1 at n, i ZZ j, l = 1 at m
, /
(4.5)
71
Seja n(+)
x(+) e n(-)
(4.6)
m C 2n
2
(4.7)
C 2mn
(4.8)
72
(dicotomizador(dij,dkl) )
(4.9)
Pr(dicotomizador(dij,dkl) < T | i )
(4.10)
f2
>
AUTOR 1
AUTOR 3
AUTOR 2
(a)
f1
(b)
Figura 4.24: Comparao entre (a) Domnio das caractersticas (policotomia) e (b) Domnio
das distncias das caractersticas (dicotomia) [CHA, 2001].
73
74
docy
( fv , fv ,.., fv )
( fv , fv ,.., fv )
x
1
Extrao de
Caractersticas
x
2
y
1
x
d
y
2
y
d
d ( fv1x , fv1y )
Distncias
Computadas
d ( fv 2x , fv 2y )
.
.
.
.
d fv dx , fv dy
Dicotomizador
Mesmo / Diferente
Autor
( fv1x , fv 2x ,.., fv dx ) e
( fv
y
1
Captulo 5
5. Mtodo Proposto
76
lim ia r de de c is o
C o n ju n t o de V e r if ic a o
w1
a ssin a t ur a s
n o ge n u in a s
w1
A ssin a t ur a s
aut o r
aut o r
aut o r
w2
A ssin a t ur a s n o G e n un a s
F a lsif ic a e s
G e n un a s
1
2
3
w2
d2
(i=1,2,3,,m),
77
A ssinatura G enuina
SK 1
A ssinatura Q uestionada
SQ
SK 2
SK 3
SK 4
SK n
E xtrao de Caractersticas
Di = { fVKi f VQ }
Comparao
Ri (i =1, 2,3,...,m)
m
D = Ri
R elatrio de deciso
pericial
i =1
78
SQ1
SK 1
SQn
..............
..............
SK n
E xtrao de Caractersticas
A q u isi o
P r tra ta m e n to
S e g m e n ta o
E x tra o d e
C a ra c te rstic a s
D ist n c ia s
C o m p u ta d a s
P ro d u o d o
m o d e lo
D e c is o
M o d e lo
Di = { fVKi f VQ }
Com parao
Ri ( i =1, 2 ,3,..., n )
R elatrio de
deciso pericial
D = Ri
i =1
(a)
m e sm o a u to r /
a u to r d ife re n te
(b)
79
Pelo fato da maioria das imagens j terem sido coletadas, adquiridas, tratadas e
estarem armazenadas no LARD (Laboratrio Anlise e Reconhecimento de Documentos) do
PPGIA (Programa de Ps-Graduao de Informtica Aplicada da PUC-PR), o processo de
aquisio resume-se coleta de 560 imagens adicionais, adquiridas conforme os moldes do
trabalho de Justino [JUSTINO, 2001].
80
permita a validao estatstica. Outro fator relevante o nmero de espcimes por autor a ser
utilizado, que deve representar satisfatoriamente as variaes de cada autor.
Na base do LARD, as imagens j esto recortadas em tamanho fixo de (3 x 10 cm),
com 256 nveis de cinza em papel com fundo branco e densidade de 300 dpi, sem
interferncias de rudos ou imagens pr-impressas. Possuindo inicialmente um total de 5200
imagens de assinaturas de 100 autores, em que cada autor cede 40 assinaturas originais e os
60 primeiros, 10 falsificaes simples e 10 simuladas. Com a aquisio de 140 autores base,
cada um provendo 4 assinaturas genunas, um total de 5760 imagens de assinaturas fazem
parte da base de dados atualmente.
Um problema encontrado na confeco da base de dados, a dificuldade de se coletar
um nmero grande de amostras de assinaturas autnticas da mesma pessoa. Segundo Fang
[FANG et al., 2003] uma razo seria devido natureza confidencial de assinaturas pessoais.
Outra razo a variao dos padres de assinaturas manuscritas no decorrer do tempo
[KHOLMATOV, 2003].
De acordo com Fang [FANG et al., 2003] para se obter uma estimativa real das
variaes, as assinaturas deveriam ser coletadas em um nmero de sesses programadas sobre
um longo perodo. Entretanto, isto invivel. Conseqentemente, o nmero de amostras de
treinamento de um escritor freqentemente insuficiente. Na abordagem proposta este
problema no se torna to relevante devido necessidade de um nico treinamento. Desta
forma assinaturas coletadas em perodos regulares ou irregulares tendem a possuir distncias
semelhantes de suas caractersticas iniciais, se comparadas com assinaturas da mesma poca
da coleta, fazendo com que as mesmas sempre se enquadrem na classe das genunas.
O protocolo de diviso da base de dados que ser apresentado nos resultados do
captulo 6 baseado em Cha [CHA, 2001] como visto na seco 4.5. Nesta abordagem, as
amostras passam a ser representadas pelas distncias computadas entre caractersticas de duas
assinaturas e, no mais as caractersticas extradas de cada assinatura. Desta forma, ocorre
uma combinao entre as distncias de caractersticas das assinaturas com o objetivo de obter
um nmero maior de amostras intra e interclasse.
5.2.1.2. Pr-processamento
81
82
(a)
(b)
Assinatura 1 : 16.337 pixels
Assinatura 2 : 16.348 pixels
Assinatura 3 : 16.263 pixels
(c)
Coincidentes : 5.268 pixels
Percentual :
32 %
Figura 5.4: Estratgia de alinhamento a esquerda: (a) Assinatura Original (b) 3 assinaturas
originais sobrepostas (c) Nvel de coincidncia de pixels.
5.2.2. Segmentao
83
Nmero de clulas
verticais
4
4
8
10
10
20
25
Nmero de clulas
horizontais
10
63
20
25
63
20
63
Nmero de pixels
na vertical
100
100
50
40
40
20
16
84
(a)
(b)
(c)
(d)
(e)
(f)
(g)
Figura 5.5: Exemplos de Segmentaes utilizadas no mtodo representando clulas verticais
por horizontais: (a) 4x10; (b) 4x63; (c) 8x20; (d) 10x25; (e) 10x63; (f) 20x20; (g) 25x63.
85
diretamente nos resultados obtidos, pois a robustez do mtodo cresce proporcional qualidade
das mesmas. O estudo apresentado na seo 4.3 fornece subsdios para a escolha das
primitivas relevantes.
As caractersticas estticas referem-se forma, tais como o comprimento e a altura.
Elas so representadas tambm pelo comportamento esttico da escrita, podendo
perfeitamente serem representadas pela densidade de pixels, e pelo centro de gravidade, as
quais incorporam vrias caractersticas da grafoscopia e grafologia como calibre, proporo,
espaamento, altura, largura, dimenso, regularidade e proporo. J as pseudodinmicas,
representam o comportamento dinmico da escrita e portanto esto relacionadas diretamente
com os traos da assinatura. As primitivas efetivamente implementadas desta categoria so:
pontos de presso, incio e fim abrupto, segmentos de tremor, inclinao axial e curvatura.
Uma descrio detalhada da implementao das primitivas apresentada a seguir.
(5.1)
86
clula em que os mesmos so normalizados pelo valor mximo do nvel de cinza que a clula
pode receber, equao (5.2), os quais representam a presso efetiva da clula.
Atravs de um mapeamento da imagem limiarizada sobre a imagem original em nveis
de cinza, resulta uma terceira imagem IRES, esta com fundo branco e segmentos pertencentes
ao traado em nvel de cinza, que usada como base para a extrao da primitiva.
mxn
=
g cel =
g
k =0
(5.2)
Nc
255
(5.3)
A Figura 5.6 demonstra uma imagem original em nveis de cinza, Figura 5.6(a), a
imagem com traado em nveis de cinza e fundo branco plotado no grid, Figura 5.6(b) e o
resultado da presso celular com seus respectivos valores, Figura 5.6(c).
(a)
(b)
(c)
Figura 5.6: Primitiva de pontos de presso (a) imagem original (b) imagem plotada no grid (c)
valores de presso encontrado em cada clula da imagem.
87
88
(a)
(b)
(c)
(d)
Figura 5.7: Primitiva de incio e fim abrupto (a) imagem original (b) imagem esqueletizada
(c) pontos circulados correspondentes a inicio ou fim do segmento no grid (d) pontos de
inicio e fim correspondentes na imagem original plotado no grid.
CT
Cs
(5.4)
89
Cdigo de Cadeia
7
0
1
2
3
5
4
(a)
(b)
Figura 5.8: Primitiva segmentos de tremor (a) processo de extrao dos segmentos mais
longos plotados no grid e utilizao do cdigo de cadeia (b) resultado do nvel de tenso do
segmento.
90
Representa uma caracterstica esttica que abordada por vrios autores como Justino
[JUSTINO, 2001], Baltzakis [BALTZAKIS & PAPAMARKOS, 2000] e Zhang [ZHANG et
al., 1998]. Na abordagem proposta, a estratgia adotada a contagem de pixels pretos Np
dentro de toda extenso de cada clula (m . n) em uma imagem limiarizada.
mn
Cp =
Np
k =0
mn
(5.5)
Figura 5.9: Primitiva densidade de pixels (a) imagem limiarizada (b) imagem plotada no grid
com segmento extrado para a contagem de pixels.
A inclinao axial uma primitiva pseudodinmica que abordada por Qi e Hunt [QI
& HUNT, 1995] e Justino [JUSTINO, 2001] e descreve o aspecto dinmico do traado. De
acordo com Justino [JUSTINO, 2001] uma anlise global da inclinao axial pode induzir a
um processo de generalizao, levando assim ao aumento da taxa de erro da falsa aceitao.
Isso pode ocorrer principalmente envolvendo as falsificaes simuladas.
Na extrao desta primitiva uma anlise local envolvendo cada clula aplicada. O
processo computa o nmero de ocorrncias de cada um dos elementos estruturantes descritos
na Figura 5.10(a). O elemento estruturante de maior ocorrncia, dentro da clula, passa a
representar o smbolo da mesma, Figura 5.10(b). Basicamente o processo representa uma
normalizao discreta dos smbolos que cada segmento forma na aplicao do elemento
estruturante 8-vizinhos.
91
2
3
4
x
5
6
7
8
Conjunto de Smbolos
0
0
0
1
x
1
0
0
0
0
1
0
0
x
0
0
1
0
0
0
1
0
x
0
3
1
0
0
1
0
0
0
x
0
0
0
1
(a)
(b)
Figura 5.10: Primitiva inclinao axial (a) Conjunto de elementos estruturantes que
representam os tipos de inclinao axial da clula (b) Imagem esqueletizada com os valores
correspondentes da inclinao axial.
5.2.3.6. Curvatura
Esta primitiva pode ser implementada sob vrias formas. Em Rigoll e Kosmala
[RIGOLL & KOSMALA, 1998] os ngulos absolutos entre dois pontos (X) )l )
consecutivos da imagem so computados, como tambm a diferena entre estes ngulos
(sen D)l ), conforme figura 5.11:
Figura 5.11: Primitiva implementado por Rigoll e Kosmala [RIGOLL & KOSMALA, 1998]
ngulo absoluto e diferena angular.
92
Cdigo de Cadeia
7
-45
+45
2
3
5
4
93
(a)
(b)
(c)
Figura 5.13: Primitiva centro de gravidade (a) imagem limiarizada plotada no grid e
alinhada a esquerda (b) centro de massa de cada clula (c) distncia euclidiana d do
centro de massa origem.
94
necessidade
de
um mtodo
que
relacione
caractersticas
( i =1, 2 ,...,n )
= ( fi1F , fi 2F ,
fv QF = ( f 1F , f 2F ,
(5.6)
fi dF )
(5.7)
f dF )
(i=1,2,3,,n)
95
Df i
= ( fv kiF fv QF )
Df i
= ( fv kiF fv QF )
Df i
= fv kiF fv QF
( i =1, 2 ,...,n )
F =1
(5.8)
( i =1, 2 ,..., n )
F =1
(5.9)
( i =1, 2,..., n )
F =1
(5.10)
x ),
(DEN1x .....DEN160
pontos de presso
x .... ABR x ) , segmentos de tremor (TRE x ......TRE x ) , inclinao axial (INC x ...... INC x ) ,
(ABR321
480
481
640
641
800
curvatura
x ....CUR x )
(CUR801
960
e centro de gravidade
x .... BAS x ) .
(BAS961
1120
O mesmo procedimento
aplicado na imagem y. No final um vetor de at 1120 posies usado com uma mtrica de
distncia na entrada da produo do modelo, o qual descrito na prxima seo.
x
...
P
R
I
...
M
I
T
I
V
A
S
x )
(DEN1x .....DEN160
x .... PRE x )
(PRE161
320
x
x )
(ABR321.... ABR480
x ......TRE x )
(TRE481
640
x ...... INC x )
(INC641
800
x
x )
(CUR801....CUR960
x
x
(BAS961.... BAS1120 )
y )
(DEN1y .....DEN160
y
y )
(PRE161....PRE320
y
y
(ABR321
.... ABR480 )
y
y
(TRE481
......TRE 640 )
y
y
(INC641
...... INC800 )
y
y
(CUR801
....CUR960 )
y
y
(BAS961
.... BAS1120 )
D
I
S
T
(
)
(
)
(
)
y
x
d (TRE 481 ......TRE 640 )
x ...... INC y )
d (INC 641
800
y
x
d (CUR801 ....CUR960 )
y
x
d (BAS 961 .... BAS1120 )
y
d DEN1x ..... DEN160
x .... PRE y
d PRE161
320
x .... ABR y
d ABR321
480
L
A
S
S
I
...
F
I
C
96
) so
97
Por ser um processo estocstico, a RNA necessita de critrios empricos para escolha
de topologia e arquitetura. Aps os mesmos serem escolhidos, conforme visto nesta seo, a
topologia fixada. Testes com variaes da arquitetura MLP, tais como o termo momentum
no demonstram os melhores resultados. Desta forma o backpropagation padro fixado nos
experimentos.
Com relao camada de sada dois neurnios so usados, uma vez que a abordagem
trata somente duas classes: autoria e no-autoria.
Entretanto, no que se refere camada escondida, a arquitetura varia de uma camada a
duas camadas escondidas. No uso de uma camada escondida, 4 neurnios so usados
baseados na estratgia de Oh e Suen [OH & SUEN, 2000] de duas vezes o nmero de ns da
sada na camada escondida. J com o acrscimo de outra camada escondida, o nmero de
neurnios varia empiricamente de 4 a 80. Pelo melhor desempenho com o uso de duas
camadas escondidas nos experimentos, admite-se que os dados no so linearmente
separveis.
O nmero de neurnios nas camadas escondidas em nenhum dos experimentos excede
50% do nmero de ns da camada de entrada [WALCZAK & CERPA, 1999], o que acarreta
um longo perodo de treinamento.
O mtodo holdout e critrio de parada com conjunto de validao usado para estimar
o erro e ajuste de parmetros. O conjunto de validao serve para ajustar os pesos da rede
MLP, nmero de camadas escondidas, constante de aprendizagem e o nmero de pocas,
sendo o esforo computacional reduzido, pois quando o desempenho da memorizao e
generalizao fica em um patamar aceitvel, isto , quando o erro do conjunto de validao
atinge o menor valor em termos de MSE e comea a subir, o treinamento parado. Neste
ponto o nmero de ciclos varia de 30 at 350 ciclos em todos os experimentos.
98
Com relao aos parmetros livres: a constante de aprendizagem definida entre 0.01
e 0.03, o erro mnimo aceitvel do MSE igual a 0.001 e os pesos so inicializados entre
+0.001 e 0.001.
Para os experimentos, o software simulador SNNS [ZELL et al., 1994] aplicado no
processo de aprendizagem.
99
Vm=
Nclass
+1
2
se Nclass par
Nclass + 1
2
se Nclass impar
(5.11)
(5.12)
Com relao a limiares de rejeio, autores como Qi e Hunt [QI & HUNT, 1994]
desconsideram limiares por acreditarem que os mesmos so utilizados para minimizar a taxa
de erro total de cada funo de verificao, porm menosprezando a taxa de m classificao.
Segundo Qi e Hunt [QI & HUNT, 1994] estes limiares so baseados somente nas amostras de
100
101
Padres
T2
0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5 0,55 0,60 0,65 0,70 0,75 0,80 0,85 0,90 0,95 1,00
Sada do Classificador
(5.13)
(5.14)
102
Captulo 6
104
60 Autores
Conjuntos
Treinamento
Genuna /
Aleatria
800
Validao
400
Teste
400
Genuna
Simples
Simulada
Aleatria
1600
Total
800
400
300
300
300
295
300
Referncia
Total
100 Autores
600
1595
300
300
300
295
3095
Pelo fato da abordagem proposta necessitar de combinao entre valores das distncias
das primitivas de acordo com o mtodo proposto por Cha [CHA, 2001], as 1600 assinaturas
da sub-base de 40 autores so submetidas a combinaes baseadas nas distncias das
primitivas, de acordo com a equaes (4.6) e (4.7), para amostras intraclasse e interclasse
respectivamente. J a sub-base de 60 autores 5 assinaturas questionadas genunas, em relao
s 5 assinaturas de referncia, geram 25 amostras para cada autor, fornecendo um total de
1500 amostras genunas para o teste do voto majoritrio. As falsificaes da mesma forma
rendem 1500 amostras simples, 1500 simuladas e 1475 aleatrias, perfazendo um total de
5975 amostras para teste, conforme a Tabela 6.2. Isto representa o protocolo mximo
utilizado nos experimentos, podendo variar para menos, ou seja, para um nmero menor de
autores e assinaturas por autor dependendo do experimento.
105
40 Autores
Simples
Simulada
Aleatria
100
Autores
Total
Genuna
Aleatria
Treinamento
7.600
312.000
Validao
1.800
78.000
Teste
1.800
78.000
1.500
1.500
1.500
1.475
85.775
Total
11.200
468.000
1.500
1.500
1.500
1.475
485.175
319.600
79.800
60 Autores
Conjuntos
Treinamento
Genuna /
Aleatria
720
Validao
160
Teste
160
Genuna
Simples
Simulada
Aleatria
1040
Total
720
160
300
300
300
295
1355
300
300
295
2535
300
Referncia
Total
240 Autores
600
300
A Tabela 6.4 representa o protocolo mximo com o qual avalia-se o desempenho final
do mtodo. Nos experimentos propostos, existem variaes para uma quantidade menor de
amostras, com objetivo de reduzir o custo computacional.
106
180 Autores
Simples
Simulada
Aleatria
240
Autores
Total
Genuna
Aleatria
Treinamento
1.080
16.110
17.190
Validao
240
780
1.020
Teste
240
780
1.500
1.500
1.500
1.475
6.995
Total
1.560
17.670
1.500
1.500
1.500
1.475
25.205
6.2. Os experimentos
SVM;
O objetivo dos experimentos realizados a reduo das taxas de erro Tipo I e Tipo II,
atravs do uso da matriz de confuso nos conjuntos de teste.
Em todos os experimentos, um teste inicial realizado com o intuito de ajustar os
parmetros livres dos classificadores. Para isto, o conjunto de teste da primeira sub-base
usado.
107
8x20
Falsa Rejeio
Erro Tipo I
(%)
Verdadeiras
22,22
Falsa Aceitao
Erro Tipo II
(%)
Servis
Aleatrias
26,38
2,50
Erro Total
(%)
Simples
2,22
4x10
27,78
1,94
23,33
0,65
13,42
10x25
21,11
4,16
27,50
5,83
14,65
25x63
33,05
4,44
23,33
1,66
15,62
4x63
25,27
3,05
28,05
6,66
15,75
20x20
20,27
5,00
35,55
2,50
15,83
10x63
24,72
5,00
27,77
7,50
16,24
Total
13,33
108
Tipo do Teste
Voto Majoritrio
Falsa Aceitao
Erro Tipo II (%)
Simples Servis
Aleatrias
0,00
18,33
2,03
Erro Total
(%)
Total
7,28
Com base nos estudos da seo 2.5.3.1, que trata do balanceamento das classes,
executado outro experimento com o objetivo de definir melhor a cardinalidade do nmero de
amostras na abordagem. O protocolo da Tabela 6.2 dos experimentos iniciais serve de base
para este experimento, porm selecionado um nmero reduzido de amostras aleatrias. A
tcnica de downsizing [JAPKOWICZ, 2000] empregada conforme Tabela 6.7. Desta
forma o nmero de amostras falsas passa para 253, procurando equiparar o tamanho das
classes. J no upsizing [JAPKOWICZ, 2000] aumentado o nmero de amostras dos
mesmos autores para 840 procurando equiparar as classes. Os resultados demonstram que o
melhor desempenho em termos de taxa de erro total para as classes desbalanceadas, em
especfico para a base de dados testada com 780 amostras falsas e 240 verdadeiras, de acordo
com a Tabela 6.7.
Tabela 6.7: Resultados com variao do nmero de amostras por classe.
Teste
Tcnica
Treinamento
Amostras
Genunas
desbalanceada
240
Amostras
Falsas
780
Falsa Rejeio
Erro Tipo I
(%)
Verdadeiras
11,00
Falsa Aceitao
Erro Tipo II
(%)
Simples
Servis Aleatrias
Erro
Total
(%)
Total
5,33
37,00
5,42
14,68
downsizing
240
253
3,00
9,00
51,33
16,95
20,07
upsizing
840
780
4,33
15,93
54,40
18,03
23,17
109
Nesta etapa so testadas todas as primitivas descritas na Tabela 4.1. Uma seleo das
melhores primitivas mostra-se necessria, desta forma primitivas que no agregam poder
discriminatrio no treinamento so desconsideradas. Para este experimento a tcnica utilizada
a FFS (Forward Feature Selection) [JOSSO et al., 2001], a qual descarta a possibilidade de
se testar todos os subconjuntos ou combinaes de primitivas. Apesar de ser esta a maneira
ideal, o teste com todas as primitivas cria um enorme nmero de combinaes aumentando o
esforo computacional.
A tcnica FFS [JOSSO et al., 2001] consiste em unir as primitivas com melhor
desempenho individual. Este mtodo no garante o melhor conjunto, mas pode ser uma boa
maneira de selecionar algumas primitivas iniciais. Na busca de um melhor aproveitamento,
agrega-se os melhores desempenhos e desta forma seleciona-se a primitiva com melhor
desempenho, a partir da testa-se com todas as demais. O melhor desempenho agrega-se
primitiva j selecionada. Novamente testa-se todas as primitivas restantes com o conjunto
selecionado agregando a primitiva com melhor desempenho, e assim sucessivamente at que
todos os testes sejam efetuados.
O objetivo final avaliar a eficcia das primitivas separadamente e coletivamente.
Para este experimento, o protocolo utilizado o da Tabela 6.2 dos experimentos iniciais,
porm parcialmente, ou seja, utiliza-se um sub-conjunto de 10 autores ao invs dos 40 para o
treinamento, validao e teste. A reduo de autores com o intuito de otimizar o tempo de
resposta para os experimentos iniciais. Os resultados encontram-se ordenados pelos melhores
desempenhos conforme Tabela 6.8.
110
Erro Tipo I
(%)
Dens/Press/Trem/Curv
Dens/Press/Trem/Curv/Par
Dens/Press/Incli
Dens/Press/Trem
Dens/Press
Dens/Press/Trem/Curv/Grav
Dens/Press/Trem/Curv/Incli
Dens/Press/Trem/Curv/Par/Incli
Dens/Press/Trem/Grav
Densidade
Dens/Press/Trem/Inicio/Grav/Incli/Par
Presso
Press/Trem/Curv/Grav/Incli/Par
Dens/Press/Trem/Incli
Dens/Press/Trem/Par
Inclinao
Tremor
Gravidade
Inicio
Curvatura
21,23
26,21
26,01
24,15
26,21
25,55
22,01
22,00
25,00
33,01
26,00
42,03
25,00
24,00
18,67
48,23
49,15
68,00
58,55
97,00
Erro Tipo II
Erro Mdio
(%)
(%)
Simples
Simulada Aleatria
3,00
18,00
1,00
10,81
2,67
16,15
1,00
11,50
5,67
15,01
0,36
11,76
4,33
16,67
2,00
11,78
5,67
13,67
1,67
11,81
2,33
20,67
1,16
12,42
6,67
21,00
2,04
12,93
3,33
23,03
3,90
13,06
2,33
22,33
3 ,64
13,32
3,00
17,70
0,27
13,50
3,00
22,00
3,01
13,50
1,00
12,03
0,36
13,86
2,00
23,67
5,06
13,93
7,33
22,67
2,15
14,03
10,33
30,00
1,33
15,08
2,00
14,00
3,47
16,92
2,33
15,03
1,69
17,05
4,33
12,03
0,44
21,20
2,01
20,03
6,40
21,74
4,00
0,00
2,13
25,78
Testes estatsticos requerem mtua independncia dos dados, porm nos experimentos
realizados esta premissa quebrada, pelo nmero elevado de amostras do mesmo autor que o
processo incorpora. Este excesso de amostras dificulta o poder de generalizao no
treinamento comprometendo os resultados.
A soluo para este problema a diminuio das amostras genunas de cada autor nos
conjuntos de treinamento, como tambm a incorporao de 140 novos autores na base de
dados. Outra soluo diminuir a quantidade de amostras aleatrias, tentando minimizar o
desbalanceamento elevado.
Em experimentos a partir do treinamento com 2 at 7 assinaturas genunas, os
melhores resultados so com 4 assinaturas genunas, gerando 6 combinaes de amostras
genunas.
111
para m = 4.
(6.1)
para m = 1,
(6.2)
Teste
60 autores
Amostras
Treinamento
Autores
Genuna
Aleatria
Genuna
Aleatria
40
50
60
70
80
90
100
110
120
130
140
150
160
170
180
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
240
300
360
420
480
540
600
660
720
780
840
900
960
1.020
1.080
780
1.225
1.770
2.415
3.160
4.005
4.950
5.995
7.140
8.385
9.730
11.175
12.720
14.365
16.110
Erro
Tipo I
(%)
Genuna
12,33
10,33
7,00
6,67
8,00
8,33
8,33
8,00
8,33
6,00
7,00
11,33
11,33
10,67
10,33
Simples
0,33
1,33
4,67
3,33
2,00
2,33
2,00
2,67
3,67
5,00
1,33
1,67
2,00
2,67
1,67
Erro
Tipo II
(%)
Simulada
32,00
30,67
36,33
36,33
32,67
36,67
33,00
33,00
27,00
26,00
25,67
19,00
14,67
16,67
15,67
Aleatria
3,73
6,78
8,14
7,12
6,78
8,14
8,47
9,49
7,80
8,14
6,78
6,10
5,42
5,76
4,41
Erro
Total
(%)
Total
12,09
12,27
14,03
13,36
12,36
13,86
12,95
13,29
11,70
11,28
10,19
9,52
8,35
8,94
8,02
112
De acordo com a figura 5.15, dois limiares de rejeio so encontrados, tendo por base
as probabilidades que o classificador retorna do conjunto de validao. Para o limiar T1,
encontrado o valor de 0,5546, j para o limiar T2, 0,4968. O critrio usado de que todo valor
maior que T2 e menor que T1 que corresponde taxa de rejeio Rt pode ser aplicado no
processo de deciso da abordagem.
Como visto na seo 4.5.1, o desempenho do classificador medido pela mdia da
taxa de erro total, a qual pode ser expressa de acordo com Drouhard [DROUHARD et al.,
1994] por Et em termos de E1 (taxa de erro tipo I), E2 (taxa de erro tipo II) e P[wi]
(probabilidade a priori da classe wi), como :
Et = E1 . P[w1] + E2 . P[w2].
(6.3)
A taxa total de rejeio Rt, obtida com uma equao semelhante equao (6.3), com
a taxa de erro Ei substituda pela taxa de rejeio Ri (R1 rejeio de assinaturas genunas e R2
rejeio de falsificaes aleatrias). Como demonstra Drouhard [DROUHARD et al., 1994], a
taxa de rejeio e o erro total podem ser integrados em um nico parmetro, o fator de
confiabilidade:
RF = 1
Et
100 Rt
(6.4)
113
Falsa Rejeio
Falsa Aceitao
Erro Tipo I
Erro Tipo II
(%)
(%)
Genunas
Simples Servis Aleatrias
9,79
1,33
14,72
4,09
10,33
1,67
15,67
4,41
Erro Total
(%)
Fator
Confiabilidade
Total
7,48
0,9241
8,02
0,9198
6.2.7. SVM
Autores
114
115
Voluntrios
Voluntrio 1
Voluntrio 2
Mdia Geral
Abordagem Proposta
Taxa Erro
Falsa Rejeio
(%)
Genuna
7,77
4,62
6,19
10,33
Taxa Erro
Falsa Aceitao
(%)
Falsificao Simulada
15,18
20,80
17,99
15,67
Taxa Erro
Mdio
(%)
11,48
12,71
12,09
13,00
116
para mais e para menos para taxa de erro estimado. Segundo Guerra [GUERRA &
DONAIRE, 1991], a estimao por intervalos fornece uma probabilidade para o verdadeiro
valor do parmetro. Algumas definies so:
parmetro. O nvel utilizado normalmente varia de 90% a 99%, sendo que o aumento da
confiana no intervalo implica o aumento de sua amplitude. Quanto maior for o nvel de
confiana (ou seja, quanto menor for o nvel de significncia), mais amplo ser o intervalo.
Tomando como base as taxas de erro retornadas pela abordagem f, sendo o nmero de
amostras da classe analisada n, relativamente grande, pressupe uma distribuio normal e um
desvio padro populacional conhecido, sendo z / 2 o valor crtico da tabela de distribuio
normal para o nvel de confiana desejado. O intervalo de confiana para a proporo
populacional p calculado por [GUERRA & DONAIRE, 1991]:
f z / 2
f (1 f )
p f + z / 2
n
f (1 f )
n
(6.5)
Para as melhores taxas de erro encontradas na Tabela 6.11. aplica-se a equao (6.5),
com um nvel de confiana de 95%, ou seja, 9.(l z / 2 1,960 e n = 1195, que representa
o nmero de decises do teste com o voto majoritrio. Os resultados encontram-se na Tabela
6.13.
Tabela 6.13: Estimao por intervalos das taxas de erro do conjunto de teste.
Classificador
MLP
SVM
Intervalo de Confiana
Erro Tipo I
Erro Tipo II
(%)
(%)
6,89 p 0N'
f = 10,33 5,55 p '
f = 7,25
7,74 p %)
f = 11,33 5,06 p
f = 6,70
Erro Total
(%)
6,48 p X
6,33 p X X
f = 8,02
f = 7,86
117
erros mais aceitveis. Baseado nas taxas de erro encontrado na Tabela 6.11, aplicado o teste
de hipteses de duas propores e o teste de McNemar [DIETTERICH, 1998]. Ambos usados
para demonstrar se um algoritmo de classificao possui resultados semelhantes a outro com
certo grau de incerteza.
O teste aplicado comparando a rede MLP com o SVM, levando em considerao a
tabela de contingncia, conforme a Tabela 6.14, necessria para ambos os testes.
A seguinte hiptese testada: H0: indicando que no h diferena significativa entre os
classificadores de rede Neural e SVM na abordagem proposta; e H1: indicando que os
classificadores demonstram desempenhos diferentes para a abordagem proposta.
Tabela 6.14: Tabela de Contingncia 2 x 2.
N00 :Nmero de amostras classificadas N01 : Nmero de amostras classificadas
incorretamente
por
ambos
incorretamente pelo SVM mas no
classificadores
pela rede MLP.
N10 : Nmero de amostras classificadas
N11 : Nmero de amostras classificadas
incorretamente pela rede MLP mas
corretamente por ambos
no pelo SVM
classificadores
O teste de McNemar tem uma distribuio qui-quadrado com 1 grau de liberdade
[DIETTERICH, 1998]. A quantidade de 2 calculado de acordo com:
=
2
(n
n10 1)
01
n01 + n10
(6.6)
118
Outra forma simples de testar a hiptese comparativa dos classificadores que leva em
considerao a falta de independncia dos dados, pelo fato dos resultados serem obtidos a
partir do mesmo conjunto de teste, atravs do uso do teste de diferena de duas propores
[DIETTERICH, 1998]. Seja a probabilidade a posteriori da taxa de erro total da rede MLP e
do SVM representados por PMLP e PSVM, respectivamente, as quais se referem m
classificao de n amostras do conjunto de teste. Como n uma varivel aleatria binomial,
pode-se aproximar uma distribuio normal devido ao valor razovel de n. Pelo fato de PMLP e
PSVM serem dependentes do mesmo conjunto de teste, z que representa o grau de diferena
entre a rede MLP e o SVM, calculado como:
z=
n PMLP PSVM
n01 + n10
(6.7)
o qual tem aproximadamente uma distribuio normal. A hiptese nula ser rejeitada se |z| >
Z0,950 = 1,96, ou seja, se o valor de de acordo com a tabela normal distribuda for menor que
0,05 [GUERRA & DONAIRE, 1991], o qual corresponde a um teste provavelmente
significativo.
O resultado da comparao da rede MLP com o SVM em termos do valor de z gera
0,1387 com valor de 0,8897 sendo superior a 0,05, demonstrando desta forma que a
hiptese nula no pode ser rejeitada e sugerindo desempenhos iguais na rede MLP e no SVM.
119
Captulo 7
7.1. Concluso
121
122
123
8. Referncias Bibliogrficas
[CHA, 2001] CHA, S. Use of Distance Measures in Handwriting Analysis. PhD Thesis, State
University of New York at Buffalo, EUA, 2001.
[CHAN & STOLFO, 1998] CHAN, P.; STOLFO, S. Learning with Non-uniform Class and
Cost Distribuitions: Effects and a Distributed Multi-Classifier Approach. Workshop on
Distributed Data Mining, Notes KDD-98, Technical Report, 1998, 1-9 p.
124
[DENG et al., 1999] DENG, P.; LIAO, H. M.; HO, C. W.; TYAN, H.; Wavelet-based Off-line
Signature Verification. Computer Vision and Image Understanding, Vol.76, no. 3,
1999, 173-190 p.
[DUDA & HART, 1973] DUDA, R. O.; HART, P. E. Pattern Classification and scene
analysis. John Wiley & Sons Inc., 1973.
[FANG et al., 2003] FANG, B.; LEUNG, Y. Y.; TANG, K. W.; TSE, P. C. K; KWOK, Y.
K.; WONG, Y. K. Off-Line Signature Verification by the tracking of feature and stroke
positions. Pattern Recognition, Vol.36, 2003, 91-101 p.
[FUJITA, 1998] FUJITA, O. Statistical Estimation of the Number of Hidden Units for
Feedforward Neural Networks. Neural Networks, Vol. 11, 1998, 851-859 p.
125
[FUMERA et al., 2000] FUMERA, G.; ROLI, F.; GIACINTO, G. Reject Option with
multiple thresholds. Pattern Recognition. Vol. 33, 2000, 2099-2101 p.
[GORI & SCARSELLI, 1998] GORI, M.; SCARSELLI, F. Are Multilayer Perceptrons
Adequate for Pattern Recognition and Verification?. IEEE Transactions on Pattern
Analysis and Machine Intelligence, Vol. 20, No. 11, 1998, 1121-1132 p.
[GUERRA & DONAIRE, 1991] GUERRA, JOS MAURI; DONAIRE, DENIS. Estatstica
Indutiva teoria e aplicaes. Liv. Cincia e Tecnologia, 2.ed., So Paulo, 1992, 129177 p.
[HAYKIN, 2001] HAYKIN, SIMON. Redes Neurais Princpios e prtica. Bookman, 2.ed.,
Porto Alegre, 2001.
[HUANG & YAN, 1997] HUANG, K.; YAN, H. Off-line Signature Verification Based on
Geometric Feature Extraction and Neural Network Classification. Pattern Recognition,
Vol.30, No.1, 1997, 9-17 p.
[JOSSO et al., 2001] JOSSO, B.; BURTON, D.; LALOR, M. Wavelet strategy for surface
roughness analysis and characterisation. Computer Methods in Applied Mechanics and
Engineering, Vol. 191, 2001, 829-842 p.
126
[JUSTINO et al., 2003] JUSTINO, E.; SABOURIN, R .; BORTOLOZZI, FLAVIO. An OffLine Signature Verification Method Based on SVM Classifier and Graphometric
Features. In Proceedings 15th International Conference on Advances in Pattern
Recognition (ICAPR2003), Calcuta, India, aceito para publicao 11 Dezembro, 2003.
[KHOLMATOV, 2003] KHOLMATOV, A. A Biometric Idendtity Verification Using OnLine & Off-Line Signature Verification. Masters Thesis, Sabanci University, 2003.
[LAM & SUEN, 1997] LOUISA, L.; SUEN, C. Application of Majority Voting to Pattern
Recognition: An Analysis of Its Behavior and Performance. IEEE Transactions on
Systems, Man and Cybernetics, Vol.27, No.3, 1997, 553-568 p.
[LAWRENCE et al., 1998] LAWRENCE, I. B.; BACK, A.; TSOI, A. C.; GILES, C. L.
Neural Network Classification and Prior Class Probabilities. Tricks of the Trade,
Lecture Notes in Computer Science State-of-the-Art Surveys, Springer Verlag, 1998,
299-314 p.
[LEE, 1995] LEE, L. L. Neural Approaches for Human Signature Verification. Third
International Conference on Document Analysis and Recognition ICDAR95, Montreal,
Canad, 1995, 1055-1058 p.
127
[MALAVIYA & PETERS, 1997] MALAVIYA, A.; PETERS, L. Fuzzy Feature Description
of Handwriting Patterns. In Pattern Recognition, Vol. 30, No. 10, 1997, 1591-1604 p .
[MARAR et al., 2002] MARAR, J.F.; RODRIGUES, R.F.; COSTA, D.N. Deteco de
Falsificao em Assinaturas Humanas Baseada em Redes Neurais Artificiais. II
Congresso Brasileiro de Computao, Brasil, 2002.
Springer-Verlage,
1994, 147-165 p.
[OH & SUEN, 2002] OH, I.; SUEN, C. Y. A Class-Modular Feedforward Neural Network for
Handwriting Recognition. Pattern Recognition, Vol. 35, 2002, 229-244 p.
[OSUNA et al., 1997] OSUNA, E.; FREUD, R.; GIROSI, F. Support Vector Machines:
Training and Applications. MIT Artificial Intelligence Memo 1602; MIT A. I. Lab,
1997.
[OTSU, 1979] OTSU, N. A Threshold Selection Method from Gray-level Histograms. IEEE
Transactions on Systems, Man and Cybernetics, v. SMC 9, No.1 ,1979, 62-66 p.
128
[QI & HUNT, 1994] QI, Y.; HUNT, B.R. Signature Verification Using Global and Grid
Features, Pattern Recognition, Vol. 27, No. 12, 1994, 1621-1629 p.
[QI & HUNT, 1995] QI, Y.; HUNT, B.R. A Multiresolution Approach to Computer
Verification of Handwritten Signatures, IEEE Transactions on Image Processing, Vol. 4,
No. 6, 1995, 870-874 p.
[RASHA, 1994] RASHA, ABAS. A Prototype System for Off-Line Signature Verification
Using Multilayered Feedforward Neural Networks. Masters Thesis, RMIT Department
of Computer Science, Melbourne, 1994.
129
[SILVA, 2003] Os exterminadores dos cheques, Veja, Editora Abril, No. 36, ed. 1819 2003,
98-99 p.
[SVM, 2003] SVMlight Support Vector Machine, www.cs.cornel.edu/People/tj/svm_light ,
acessado em 1 de Setembro de 2003.
[VELEZ et al., 2003] VELEZ, J. F.; SANCHEZ, A.; MORENO, A. B. Robust Off-Line
Signature Verification Using Compression Networks and Positional Cuttings. IEEE Int.
Workshop on Neural Networks for Signal Processing (NNSP03), Toulouse, France,
2003.
[WALCZAK & CERPA, 1999] WALCZAK, S.; CERPA, N. Heuristic Principles for the
Design Of Artificial Neural Networks. Information and Software Technology. Vol. 41,
No. 2, 1999, 109-119 p.
[WEIS & PROVOST, 2001] WEIS, G. M.; PROVOST, F. The Effect of Class Distribution on
Classifier Learning: An Empirical Study. Technical Report ML-TR-44. Rutgers
University, EUA, 2001.
130
[ZELL et al., 1994] Zell, A. et al. SNNS Stuttgart Neural Network Simulator. User Manual,
Version 4.2, University of Stuttgart, 1994.
[ZHANG et al., 1998] ZHANG, BAI-LING; FU, MIN-YUE; YAN, HONG. Handwritten
Signature Verification based on Neural Gas Based Vector Quantization. Proc. 14th
International Conference on Pattern Recognition, Brisbane, 1998, 1862-1864 p.
Apndice
O uso do classificador SVM testado com kernel linear devido aos resultados
promissores encontrado em Justino [JUSTINO et al., 2003], porm os resultados demonstram
ser inferiores ao kernel polinomial.
Tabela A.1: Resultado comparativo entre SVM com kernel linear e polinomial.
Autores
Erro
Mdio
(%)
Total
12,47
12,14
11,81
10,97
10,29
10,87
11,21
10,97
9,96
9,04
9,04
9,21
9,20
9,37
8,70
132
Teste base 60
Euclidiana
Erro Tipo I
(%)
Genunas
13,33
City-block
12,30
6,29
10,67
1,07
37,67
5,76
13,79
Quadrtica
8,67
10,37
12,67
2,67
39,33
8,81
15,87
Distncia
Erro Tipo II
(%)
Aleatrias
5,06
Erro Tipo I
(%)
Genunas
12,33
Erro Tipo II
Erro Total
(%)
(%)
Simples
Servis Aleatrias
Total
0,33
32,00
3,73
12,09