Escolar Documentos
Profissional Documentos
Cultura Documentos
Localização, Segmentação e
Reconhecimento de Caracteres em
Placas de Automóveis
Adilson Gonzaga
Cent ro de Ciencias Exat as e Tecnologicas Curso de Engenharia de Comput acao Segment aca…
Fabio Conde
Classificação aut omát ica do est ado do t rânsit o baseada em cont ext o global
Andrews Sobral
Neves et al. (Eds.), Avanços em Visão Computacional (2012) DOI: 10.7436/2012.avc.15 ISBN 978-85-64619-09-8
284 Oliveira & Gonzaga
1. Introdução
O crescente interesse pela automatização de processos e introdução de no-
vas tecnologias são fatores motivadores para diversas pesquisas no ramo
de reconhecimento de padrões em imagens. Visão computacional e reco-
nhecimento de caracteres para sistemas de reconhecimento de placas de
automóveis (LPR, do inglês License Plate Recognition) são módulos prin-
cipais para os sistemas inteligentes de infraestrutura, como os de controle
de tráfego e de cobrança de pedágio (Anagnostopoulos et al., 2008).
Na década de 70, quando iniciaram-se os trabalhos no assunto, fatores
computacionais eram limitantes, não permitindo aplicabilidade direta das
técnicas desenvolvidas. Com o avanço da microeletrônica e das arquiteturas
de computadores, técnicas digitais passaram a ser mais empregadas, sendo
fortemente difundidas e ainda estudadas nos dias de hoje (Gonzalez &
Woods, 2008). Atualmente, métodos computacionais inteligentes permitem
a abordagem do problema utilizando lógica fuzzy, redes neurais artificiais
e algoritmos genéticos (de Campos, 2001).
O objetivo de um sistema de reconhecimento automático de placas de
automóveis é fornecer uma saı́da simples para uma entrada complexa. A
entrada é uma imagem estática, contendo diversos elementos desnecessá-
rios e o elemento essencial: a placa do automóvel. Computacionalmente,
essa entrada é uma matriz numérica que contém informações dos pı́xeis da
imagem. A saı́da pode ser, por exemplo, uma sequência de caracteres, uma
string, com os números e letras que compõe a placa.
Este trabalho descreve um método de localização de regiões de in-
teresse (ROI, do inglês Region of Interest) e reconhecimento de padrões
aplicado à identificação de placas de automóveis. O ojetivo é obter um
algoritmo de LPR simples e eficiente que possa ser usado com imagens de
placas em carros brasileiros.
O texto está organizado da seguinte maneira: na Seção 2 são apresen-
tadas técnicas de LPR difundidas, usando-as como base para a formulação
da abordagem proposta, descrita na Seção 3. Na Seção 4 são apresentados
os resultados obtidos com o algoritmo desenvolvido. Na Seção 5 conclui-se
sobre a metotodologia proposta.
2. Técnicas de LPR
São três etapas básicas no processo de reconhecimento de uma placa de
automóvel: (a) Localização e segmentação da placa, (b) Segmentação dos
caracteres e (c) Reconhecimento dos caracteres.
Localização, segmentação e reconhecimento de caracteres em placas de automóveis 285
2.1 Localização
A Localização e segmentação da placa consiste em realizar um rastreamento
em toda a imagem a fim de identificar a exata região que contém somente
a placa do automóvel e segmentá-la.
Grande parte dos trabalhos, no que diz respeito à Localização, baseia-
se em alguma caracterı́stica das placas que a destacam na imagem de um
carro, como a alta frequência de mudança de brilho na região da placa.
Brandão et al. (2004) propõem um algoritmo “baseado em operações mor-
fológicas multi-estágio”. A busca por candidatos a placa em uma imagem
considera três caracterı́sticas básicas, para as quais foram desenvolvidos
estágios independentes: (a) são regiões de alto contraste, (b) possuem
sequência alinhada de objetos (os caracteres) e (c) são retangulares. O
algoritmo percorre os três estágios em busca de regiões de interesse que
obedeçam aos critérios. Os resultados obtidos pelos autores indicam taxa
de sucesso de 89,15% com o uso do estágio (a), 94,21% com o uso dos
estágios (a) e (b) e 97,18% de sucesso com o uso dos três estágios.
Anagnostopoulos et al. (2006) apresentam um estudo acerca das diver-
sas abordagens do tema. Os autores reiteram a observação de que métodos
baseados em detecção de bordas são altamente susceptı́veis a ruı́dos indese-
jados. Eles analisam que os ruı́dos considerados não são somente devido à
má qualidade da imagem ou má iluminação, mas a objetos que têm carac-
terı́sticas semelhantes às placas. Os autores analisam que o uso de técnicas
morfológicas para eliminar bordas indesejadas previamente à aplicação do
método de detecção de bordas resulta em ı́ndices de sucesso relativamente
altos e computacionalmente rápidos se comparados a outros métodos. Dis-
cutem o uso da transformada de Hough (HT, do inglês Hough Transform),
afirmando que ela exige muito esforço computacional. É proposta a com-
binação de duas técnicas: aplicação de algoritmos de detecção de bordas
aliados à HT. O uso daquela técnica torna esta menos dispendiosa compu-
tacionalmente.
Em seguida, os autores propõem um método de análise estatı́stica. A
técnica “Janelas Concêntricas Deslizantes” (do inglês Sliding Concentric
Windows) foi desenvolvida para identificar irregularidades locais na ima-
gem utilizando medidas estatı́sticas como desvio padrão e média. Duas
janelas retangulares concêntricas A e B (de tamanhos diferentes) deslizam
pela figura, obtendo valores estatı́sticos que denunciam a caracterı́stica irre-
gular (alta frequência de mudança de brilho) na localidade: quando a razão
das medidas estatı́sticas das janelas A e B for maior que um valor definido
T , a janela retangular A é considerada uma ROI. Para definir os tamanhos
das janelas A e B e o valor de T os autores realizaram testes, buscando os
melhores resultados. Espera-se que as janelas A e B com proporção igual à
das placas de automóveis sejam as melhores, como os testes comprovaram.
Em relação ao parâmetro T , os autores assumem que não há evidência de
como obtê-lo e portanto a melhor maneira é por tentativa-e-erro.
286 Oliveira & Gonzaga
2.3 Reconhecimento
O Reconhecimento de caracteres é a etapa em que um objeto segmentado
é analisado e associado a um único caractere alfanumérico.
Diversos autores utilizam redes neurais para o processo de Reconheci-
mento. O objetivo básico de sistemas baseados em redes neurais é realizar
um treinamento prévio do programa com um banco de dados especı́fico
para o treinamento, para então fazer a análise das placas de outro banco
de dados.
A análise das projeções vertical e horizontal dos objetos é utilizada
por Belvisi et al. (1999). A comparação é feita pelas projeções verticais e
horizontais das funções f (x, y) e w(x, y) do objeto e da máscara. A medida
de igualdade entre as projeções do objeto e da máscara é dada por meio
de um limite máximo percentual de pontos diferentes. Os autores não
especificam um valor, mas assinalam uma alta taxa de acerto do sistema.
Conci & Monteiro (2004) aplicam o método dos Momentos Invarian-
tes de Hu. Espera-se que cada caractere tenha um valor definido para os
momentos que o diferem dos demais caracteres. Definidos os valores de
momentos para cada caractere de 0 a 9 e de A a Z, e calculados os mo-
mentos do objeto desconhecido, basta estabelecer com qual deles há maior
similaridade. Os autores obtiveram 99% de acerto utilizando um banco de
imagens simples, porém com um longo tempo de processamento, já que os
cálculos dos Momentos de Hu são computacionalmente dispendiosos.
Sancho (2006) utiliza a técnica de correlação-cruzada (cross-
correlation). Basicamente, a imagem de um caractere f (x, y) é comparada
a uma máscara padrão w(x, y) usando correlação 2D.
O valor de saı́da da função de correlação-cruzada será maior de acordo
com a maior semelhança entre a máscara e o objeto analisado. O autor ad-
mite que sı́mbolos semelhantes (por exemplo, as letras O e D) não podem
ser avaliados com segurança pelo método proposto. Para este problema,
aplica-se um Solucionador de Problemas com Restrições Otimizado (COPS,
do inglês Constrained Optimization Problem Solver ). O COPS têm o obje-
tivo de atingir os seguintes objetivos: (a) os candidatos devem ser placas
de automóveis válidas na Espanha, (b) apenas os três sı́mbolos com maior
valor de correlação-cruzada são considerados, (c) sequências maiores de
caracteres têm precedência em relação às menores e (d) a soma dos valores
de correlação-cruzada é considerada. O autor indica uma taxa de 90% de
acerto com menos de um segundo de tempo de processamento.
3. Material e Método
A abordagem proposta se baseia na morfologia e estatı́ticas das imagens
para realizar a Localização e Segmentação das placas, e na Correlação
2D para o Reconhecimento. A análise de histogramas e de caracterı́sticas
morfológicas exige, porém, boa segmentação e processamento prévio da
Localização, segmentação e reconhecimento de caracteres em placas de automóveis 289
Para obtenção das imagens dos bancos BD2, BD3, BD4 e BD5 foi
utilizada uma câmera do modelo Sony Cyber-shot DSC-H10, em modo
automático, sem flash e com resolução mı́nima (640 × 480 pixeis).
O algoritmo foi desenvolvido utilizando MATLAB versão R2008b com
o Image Processing Toolbox (IPT). O software foi desenvolvido em um no-
tebook modelo HP Pavillion dv4000, com processador AMD Turion X2 de
2,1GHz, 4G de memória RAM e sistema operacional Windows 7 Professi-
onal.
Após esta correção de rotação, a imagem pode ser analisada nas etapas
já descritas como se a fotografia tivesse sido obtida frontalmente à placa
do automóvel.
|ARmin −AR|
X AR
para AR < ARmin
HC = X |ARmax
AR
−AR|
para AR > ARmax (1)
0 caso contrário
ARmin
60 para AR ≤ 1,5
ARmin
< AR ≤ AR1,2
20 para 1,5
min
ARmin
10 para < AR ≤ ARmin
X= 1,2 (2)
90 para AR ≥ 1, 5ARmax
30 para 1, 2ARmax ≥ AR < 1, 5ARmax
15 para ARmax ≥ AR < 1, 2ARmax
para A ≤ A2,0
70 min
Amin
5 para 1,5 < A ≤ Amin
X= (5)
70 para A ≥ 2, 0Amax
10 para 2, 0Amax > A ≥ 1, 5Amax
5 para 1, 5Amax > A ≥ Amax
3.4 Reconhecimento
O Reconhecimento é realizado por correlação da imagem obtida de um
caractere com diversas imagens pertencentes a uma base de dados padrão:
as máscaras.
As máscaras foram divididas em dois bancos: o primeiro é formado
por imagens de todos os 10 caracteres numéricos e 26 letras do alfabeto
escritos com a fonte Mandatory, definida oficialmente pelo Conselho Na-
cional de Trânsito (CONTRAN) pela Resolução 231, de 2007; o segundo
é formado por imagens dos 36 caracteres alfunuméricos utilizando a fonte
DIN Mittelschrift, usual nos carros emplacados antes de 2007.
A comparação entre o caractere e as máscaras é feita por Correlação
2D, por meio do Coeficiente de Correlação de Pearson (CCP), uma medida
estatı́stica para comparação linear entre dois conjuntos de dados. Seu valor,
em módulo, varia de 0 a 1. Quanto mais perto de 1 maior é o grau de
dependência estatı́stica linear entre as variáveis. No outro oposto, quanto
Localização, segmentação e reconhecimento de caracteres em placas de automóveis 295
mais próximo de zero, menor é a força desta relação (Figueiredo Filho &
Silva Júnior, 1999). A Equação 6 representa o CCP entre dois vetores.
P
(xi − x̄) · (yi − ȳ)
ρ= P P (6)
(xi − x̄)2 · (yi − ȳ)2
na qual ρ é o CCP, xi e yi são os valores da posição i dos vetores x e y, e
x̄ e ȳ representam a média dos valores dos vetores x e y, respectivamente.
Os gráficos das Figuras 5a, 5b e 5c são exemplos de correlações positiva,
nula e negativa (respectivamente, da esquerda para a direita) entre dois
vetores de valores. Nota-se que valores próximos de x e y levam a uma
correlação positiva dos dados. É o caso de uma análise entre um caractere
e sua máscara correspondente.
4. Resultados
A Tabela 1 apresenta os resultados de desempenho do algoritmo de Loca-
lização da placa dentro das imagens em cada banco.
Apesar da má qualidade das imagens do BD1, foram obtidos ótimos
resultados. A taxa de 97,3% alcançada neste trabalho é extremamente
296 Oliveira & Gonzaga
5. Conclusão
A taxa de acerto de cerca de 80% em tempo de processamento de 2,2 se-
gundos foi considerada razoável. Ressalva-se, porém, que são exigidas me-
lhores taxa de acerto e tempo de processamento para aplicação prática do
300 Oliveira & Gonzaga
algoritmo em tempo real. Gonzalez & Woods (2008) afirmam que o reco-
nhecimento com sucesso será fortemente influenciado por uma segmentação
precisa. Acredita-se que trabalhos futuros devem focar em melhorias no
processo de segmentação para buscar incremento na taxa de acerto e dimi-
nuição do tempo de processamento.
Percebe-se que as taxas de acerto do BD1 são próximas às taxas dos
outros bancos, mesmo com a utilização de imagens visivelmente de menor
qualidade. As imagens do BD1 não apresentam, no entanto, os problemas
de iluminação e sombra que as imagens dos outros bancos apresentam. A
simples combinação de qualidade de fotografia e planejamento de como
obter as imagens, eliminando efeitos de sombra, deve produzir resultados
melhores, próximos à taxa de 95%. Esta afirmação é fundamentada devido
a observações dos resultados acima da média com imagens de boa qualidade
sem problemas de iluminação ao longo do desenvolvimento do sistema.
Os resultados dos bancos BD4 e BD5 merecem destaque negativo, mas
com ressalvas. Apesar do baixo desempenho global, percebe-se que o de-
sempenho abaixo dos demais bancos se deve unicamente a problemas de
correção de rotação, identificados na etapa de Localização. A saı́da muitas
vezes encontradas em sistemas práticos de reconhecimento automático de
placas de automóveis é evitar tais imagens, buscando obter placas de forma
que não necessitem de rotação ou que tenham um ângulo de inclinação co-
nhecido.
O resultado final deste projeto é encorajador, visto que o desenvolvi-
mento de um sistema prático e totalmente aplicável no mundo atual pode
ser realizado com algoritmos relativamente simples.
6. Agradecimentos
Os autores agradecem à Fundação de Amparo à Pesquisa do Estado de São
Paulo (FAPESP) pelo suporte financeiro a esta pesquisa.
Referências
Anagnostopoulos, C.N.; Anagnostopoulos, I.; Loumos, V. & Kayafas, E., A
license plate recognition algorithm for intelligent transportation sys-
tem applications. IEEE Transactions on Intelligent Transportation
Systems, 7(3):377–392, 2006.
Anagnostopoulos, C.N.; Anagnostopoulos, I.; Psoroulas, I.D.; Loumos, V.
& Kayafas, E., License plate recognition from still images and video
sequences: a survey. IEEE Transactions on Intelligent Transportation
Systems, 9(3):377–391, 2008.
Belvisi, R.; Freitas, R.; Figueiredo, R. & Marcovitch, D., Um sistema
de reconhecimento automático de placas de automóveis. In: Anais
Localização, segmentação e reconhecimento de caracteres em placas de automóveis 301
Notas Biográficas
Leonardo Augusto Oliveira é graduado em Engenharia Elétrica com
ênfase em Eletrônica e habilitação em Sistemas Digitais (Universidade de São
Paulo/câmpus São Carlos, 2010).