Utilização de Visão Computacional para Identificação Automática de Placas de Sinalização Vertical de Velocidade

See discussions, stats, and author profiles for this publication at: https://www.researchgate.
net/publication/337012052
Utilização de visão computacional para identiﬁcação automática de placas de

sinalização vertical de velocidade
Article · January 2018
CITATIONS READS
0 39
3 authors, including:
Rafael Mofati Campos Ronan Do Carmo Lopes

Faculdade Novo Milênio Faculdade Novo Milênio
9 PUBLICATIONS 0 CITATIONS 1 PUBLICATION 0 CITATIONS
SEE PROFILE SEE PROFILE
Some of the authors of this publication are also working on these related projects:
Análise de uma Intervenção no Ensino de Engenharia Elétrica por Meio da Metodologia Ativa de Ensino – Aprendizagem Baseada em Equipes View project
Utilização de visão computacional para identificação automática de placas de sinalização vertical de velocidade View project
All content following this page was uploaded by Rafael Mofati Campos on 17 December 2019.
The user has requested enhancement of the downloaded file.

Faculdade Novo Milênio
Curso de Graduação em Engenharia Elétrica com Habilitação em Engenharia de Telecomunicações
Utilização de visão computacional para identificação automática de

placas de sinalização vertical de velocidade
LOPES Ronan C¹; NISHIO Kennedy G¹; CAMPOS Rafael M²
RESUMO
Introdução. A visão computacional é o estudo que transmite para a máquina a capacidade de visão humana e
com sua utilização, é possível que uma máquina execute decisões a partir de instruções de forma autônoma e
sem a necessidade da intervenção humana. A visão computacional pode ser aplicada em diversas áreas de
conhecimento dentre elas, as de sinais de trânsito que representa limites de velocidade. Nessa perspectiva, é
possível que a visão computacional indique a velocidade máxima permitida em uma rodovia ou estrada pública
no instante em que o veículo estiver passando sobre a placa. Objetivo. Desenvolver um sistema de visão
computacional que seja capaz de identificar a velocidade indicada na sinalização vertical de velocidade de vias
brasileiras para auxílio a sistemas de carros autônomos de terceiros. Método. Para o método proposto, foi
utilizado o software MATLAB/SIMULINK® na versão 2018a o qual possibilitou a simulação das instruções. Em
seguida para o projeto, foram utilizados vídeos com tempo pré-determinado no qual simularam o deslocamento
de um veículo em via ou estrada pública. Para detecção da placa de velocidade, utilizou-se a transforma de
Hough para círculos; as redes neurais convolucionais tiveram a função de classificar a imagem detectada; o
coeficiente de correlação e mais 17 imagens numéricas foram utilizadas para o reconhecimento dos algarismos
numéricos. Em diversas situações utilizou-se o redimensionamento de imagens, transformação de imagem
binária, níveis de cinza, filtro morfológico e descritor geométrico. Resultados Na análise do projeto, foram
avaliadas 95 placas de sinalização vertical velocidade, distribuídas em 9 vídeos, perfazendo um tempo total de
75,46 minutos e verificado que delas, 95,78% foram detectadas com a utilização de Hough, nessa sequência,
desse percentual detectado, 93,40% foram classificadas corretamente pela rede e desse percentual classificado
82,35 tiveram sua velocidade identificada efetivamente pelo procedimento proposto. Além disso, foi verificado o
tempo médio de iteração despendido das instruções do projeto, correspondendo 0,196 segundos para todo o
projeto, executando todos os procedimentos, com a configuração de processamento utilizada. Em análise
especifica de partes do projeto o tempo de iteração para transforma de Hough para círculos foi 0,097 segundos,
representando 49,52% do tempo total; da rede foi de 0,082 segundos, 41,78%; identificação dos algarismos
numéricos 7 ms, 3,59 %, redimensionamento da imagem de entrada 1ms e demais tarefas 8 ms, 4,47 %.
Conclusão. Conclui-se que para o sistema de visão computacional proposto, este se fez capaz de identificar as
placas de sinalização vertical de velocidade, podendo estes procedimentos serem avaliados e/ou implementados
em sistemas de carros autônomos de terceiros para variação de velocidade. Outro fator importante é que o
tempo de iteração do projeto mostrou-se bem abaixo, demonstrando a possibilidade de uso em tempo real.
Palavras-chave: Visão computacional. Processamento de imagens. Redes neurais.
INTRODUÇÃO1 Para Gonzalez e Woods[2], não há limitação

clara, entre o processamento de imagens e
Backes e Sá Jr.[1] afirmam que a visão
visão computacional, todavia é utilizado como
computacional é o estudo que transmite para a padrão, três técnicas computacionais, que são
máquina a emulação da visão humana. caracterizados por: processos de baixo nível,
Analisando a visão computacional em etapas, processos de médio nível e processos de alto
ela é decomposta em aquisição, nível, sendo este último responsável por
processamento de imagens, segmentação, funções cognitivas que sobretudo relaciona-se
extração de características e reconhecimento com a visão. Por essa perspectiva, o
de padrões.[1] processamento de alto nível compreende dar
sentido a vários objetos reconhecidos em uma
1Aluno do 10º período do Curso de Graduação em imagem.[2]
Engenharia Elétrica com Habilitação em
O processo de aquisição de imagens é o
Telecomunicações da Faculdade, Novo Milênio, Vila
Velha, ES, Brasil. primeiro passo nas etapas da visão
²Cientista da Computação pela Faculdade Vitoriana de computacional, nela, é utilizado câmeras que
Ensino Superior; Especialista em Engenharia de Controle podem ser do tipo Charge Coupled Device
e Instrumentação pela UCL; Professor da Faculdade Novo (CCD), que traduzido para o português significa
Milênio.
E-mail:rmofati@gmail.com
dispositivo de carga acoplada. O CCD é o
Trabalho de Conclusão de Curso de Engenharia Elétrica equipamento mais utilizado para aquisição de
com Habilitação em Telecomunicações – Faculdade Novo imagens. Sua função consiste em transformar o
Milênio. quadro de imagem real na forma de três
Data de envio para banca
Data do aceite
dimensões ( ) em uma imagem considerada uma das funções mais

bidimensional ( ), ou seja, (2-D). [3] trabalhosas, considerando uma segmentação
Essa imagem bidimensional (2-D) é integralmente autônoma.[5] A segmentação da
formada matematicamente no plano cartesiano imagem deve ser finalizada quando o nível de
de uma função , onde as consoantes e interesse for alcançado.[6]
Na visão computacional, uma das formas
são pontos espaciais nesse plano. Se e
de se extrair informações dos objetos de
apresentarem limitações de valores, se interesse em uma imagem é com a utilização
autodetermina como imagem digital.[2] de descritores geométricos o qual se utiliza de
A imagem digital é constituída por um concepções sobre área, perímetro,
número finito de unidades que representam compacidade e simetria.[7] Na etapa de
pontos no plano 2-D, cada qual, possuindo uma extração de características a entrada é uma
coordenada com um valor especifico . imagem, no entanto, sua saída é um
Essas unidades são conhecidas como pixel, aglomerado de informações acerca da
termo empregado para denotar uma unidade imagem.[8]
de uma imagem digital.[2] Uma vez aplicada as técnicas citadas,
São três os formatos que evidenciam segue-se para última fase. O reconhecimento
imagens digitais, sendo elas binária, grayscale, de padrões possui vida própria e uma
que no português significa níveis de cinza e complexa literatura.[9] Ele tem como
colorida e/ou RGB.[4] funcionalidade na visão computacional,
Conforme Backes e Sá Jr.[4] uma imagem possibilitar uma classificação automática de um
binária é constituída por unidades de pixel, em objeto de interesse em uma imagem. De forma
que cada pixel pode ser representado pela cor análoga, o reconhecimento de padrões permite
totalmente branca que corresponde um valor que as máquinas enxerguem o mundo em
acima de um limiar de intensidade ou de forma nossa volta, fazendo com que, faces humanas,
contrária pela cor preta fazendo o papel do placas, caracteres, dentre outros objetos sejam
fundo de uma imagem, geralmente essa reconhecidos.[10]
intensidade de cor é definido pelo algarismo 0 Nessa sequência, Çağlayan et al[11],
ou 1. desenvolveram um estudo para
De acordo com Backes e Sá Jr.[4] as reconhecimento de sinais de trânsito em tempo
imagens grayscale que no português significa real com base na forma e classificação de cor.
escala de cinza, dispõe de pixels os quais O método consistia em adquirir a imagem
possuem valores que correspondem a pelo processo de aquisição, extrair as
diferentes níveis de cinza, podendo ser 0 para características de cores através da
uma tonalidade totalmente preta e 255, para segmentação nos espaço RGB, aplicar filtros
uma tonalidade totalmente branca, os níveis de para reduzir os efeitos do ruído preservando as
cinza assumem valores inteiros que variam 256 bordas do objeto de interesse e aplicando a
vezes, ou seja, vai do 0 a 255. escala de cinza para retirar a intensidade das
De forma subsequente, a segunda etapa da bordas do objeto de interesse. No projeto, os
visão computacional é analisada pelo autores se limitaram a detectar sinais de
processamento de imagens que trânsito somente de forma circular e triangular.
substancialmente tem a atribuição de melhorar Após a detecção, o sinal era classificado
uma imagem, fazendo a extração do ruído, por um banco de dados que foi treinado. Os
destacando suas bordas, suavizando as autores observaram que com a limitação do
imagens, dentre outras características.[1] poder de processamento da máquina e a
Dependendo do objetivo, o processamento de limitação do banco de dados em 10 imagens
imagens pode ser o final de um trabalho ou ele em forma de círculo e 8 em forma de triângulo
pode ser um caminho para fornecer uma dificultou a classificação correta dos sinais
imagem mais adequada para outras etapas da detectados.
visão computacional.[1] Constituindo uma apreciação a sinais de
Já na fase de segmentação de imagens, ela trânsito, o Conselho Nacional de Trânsito
tem como funcionalidade dividir uma imagem (CONTRAN)[12] define o sinal de
em seções ou objetos de interesse pelos quais regulamentação de velocidade (R-19), como o
dão a formação da imagem.[5] A segmentação que indica o limite máximo de velocidade em
no projeto de visão computacional, é quilômetros por unidade tempo que pode ser
desenvolvida por veículo para uma pista ou Em seguida utilizaram uma rede neural artificial
faixa, compondo-se dessa velocidade de para classificar as imagens. Os testes foram
valores múltiplos de 10. A sua utilização se dá realizados em um computador pessoal com
em locais em que haja a necessidade de implementação de linguagem C/C++ e após os
informar ao usuário, em vias fiscalizadas com testes, os autores observaram que com
equipamentos medidores de velocidade bem procedimento proposto, obtiveram 2462 sinais
como em locais que a engenharia de trânsito corretamente classificados contra 289 sinais
designa a necessidade. não detectados.
Uma das motivações para a Observa-se também que consoante o
regulamentação e uso das placas de Departamento Nacional de Infraestruturas e
velocidade R-19, pode ser visto com o auto Transporte (DNIT),[17] o Brasil é detentor de
índice de ocorrências envolvendo excesso de uma rede rodoviária de quase 1,7 milhões de
velocidade, pois, segundo dados da Polícia Km de extensão, tendo inclusive, uma
Rodoviária Federal (PRF)[13] só no ano de 2017 crescente frota que, só em fevereiro de 2018,
foram registradas nas rodovias federais 10.426 alcançou o patamar de 97 milhões, sendo que
mil ocorrências envolvendo acidentes de desse total, só de automóveis, representava 53
trânsito por velocidade incompatível com a via, milhões, totalizando 54%.[18]
constituindo-se desse total, mais de 7,22% Com base nas informações
acidentes com resultado morte e 92,77% supramencionadas, o objetivo desse projeto
representaram acidentes com vítimas feridas propõe desenvolver um sistema de visão
ou sem vítimas. computacional que seja capaz de identificar a
Nessa mesma linha, os dados do Governo velocidade indicada na sinalização vertical de
do Brasil[14] demonstram que o excesso de velocidade de vias brasileiras para auxílio a
velocidade lidera a posição das infrações mais sistemas de carros autônomos de terceiros.
cometidas por motoristas brasileiros entre os
anos de 2010 e 2017, e que só no ano de 2016
MATERIAIS E MÉTODOS
foram aplicadas 14,9 milhões de multas por Este projeto trata-se de um estudo
excesso de velocidade em vias e estradas do descritivo de caráter qualitativo e de adaptação
Brasil. tecnológica.
Analisando por essa perspectiva e com O projeto foi desenvolvido nos meses que
objetivo de diminuir a frequência de acidentes compreendem julho a agosto de 2018 e sua
de trânsito em estradas e rodovias devido à execução e teste final até o mês de setembro
falta de atenção de motoristas aos sinais de do mesmo ano. Na fase de execução e teste foi
trânsito e possibilitar estudos de pesquisa de utilizado os computadores pessoais dos
controle autônomo de veículos, Reis[15] utilizou autores no qual tiveram a função de simular,
a detecção de sinais de trânsito através do em ambiente virtual, as instruções que foram
método de classificação Adaboost. produzidas. Essas instruções baseadas na
A técnica apresentada identificava durante linguagem MATLAB, foram simuladas e
a captura de vídeo, placas de sinalização de executadas no software MATLAB/SIMULINK®
trânsito do modelo (PARE). Para identificação da companhia MathWorks na versão 2018a.
da placa, foi utilizado um conjunto de imagens Para o objeto de análise, foram
que foram treinadas pelo algoritmo, sendo de consideradas somente as placas de sinalização
25 imagens de placa (PARE) chamadas de de trânsito que compõe as de sinalização
imagens positivas e 300 imagens negativas vertical de limite de velocidade. Essas placas
escolhidas aleatoriamente, ou seja, que não seguiram o modelo R-19, com formato
possuíam a placa (PARE), mas que, no geométrico circular, do Conselho Nacional de
entanto, eram voltadas ao trânsito. Foi Trânsito conforme pode ser visto na figura 1.
observado pelo autor que quanto mais passos Compondo-se a principal variável analisada,
de treinamento do algoritmo menores foram as isto é, as placas de sinalização do modelo R-
generalizações com melhores resultados. 19, elas foram obtidas através de vídeos que
De sentido semelhante e com o propósito foram extraídos da plataforma de
de realizar a detecção de sinais de trânsito, Shi compartilhamento de vídeos YouTube com um
e Lin[16] desenvolveram um estudo de um tempo pré-determinado e diversificado em face
sistema de visão computacional utilizando de cada vídeo. A função desses vídeos era de
vídeos capturados de campo, cidade e estrada. simular o deslocamento de um veículo
automotor em uma via ou estrada pública, e supramencionada, sendo está resolução, (480
para outro fim, utiliza-la em ambiente virtual, vs NaN), ou seja, linhas versus quantidade de
isto é, no projeto que foi desenvolvido. colunas proporcionalmente.
A proporção da entrada de vídeo foi
Placa de velocidade máxima permitida utilizada para não haver distorção na imagem,
deste modo, conseguiu-se manter os aspectos
de geometria dos objetos e principalmente da
placa de sinalização vertical de velocidade.
O princípio de funcionamento do vídeo é
caracterizado pela transformação de cenas
tridimensionais do ambiente real no momento
em que é capturado por câmeras, em cenas
e/ou quadros no formato bidimensional. Essa
imagem bidimensional por sua vez, possui um
número de linhas e colunas que é determinado
pela câmera utilizada, sendo assim, para este
projeto adotou-se o padrão de entrada,
conforme mencionado de 480 linhas.
Observando-se que esta cena adquirida
Figura 1 - Placas de sinalização de velocidade. Fonte:
fibrobecker.com.br
pela câmera de vídeo, trata-se de uma imagem
RGB, ou seja, uma imagem colorida em que
Por outro lado, foram desconsideradas cada pixel dessa imagem possui 8 bits de cada
todas ou qualquer tipo de sinalização de padrão de cor, o vermelho, verde e azul,
trânsito que não fazia parte do modelo R-19, perfazendo combinações de 0 a 255 níveis de
bem como, não foi analisado quadros de cor cada uma, foi utilizado uma maneira de
imagem de vídeo que continham vias ou facilitar as demais etapas do sistema de visão
estradas públicas em horários noturnos, em computacional.
dias chuvosos, com neve, poeira, vegetação Essa imagem RGB de 24 bits foi convertida
que atrapalhasse a visualização da sinalização, em para uma imagem monocromática, ou seja,
com neblina e que tinham duas ou mais placas uma imagem em níveis de cinza. A imagem em
de velocidade em um mesmo quadro de vídeo. níveis de cinza contém somente 8 bits de cor e
A apreciação do projeto na análise de com essa transformação, foi possível obter 256
dados baseou-se na quantificação do número tonalidades de cor que vai do 0 totalmente
de placas de sinalização vertical de velocidade preto ao 255 totalmente branco, diferente dos
que foram e não foram detectadas, 24 bits que poderiam gerar mais de 16 milhões
reconhecidas e identificadas efetivamente de cores, dificultando o processo de visão
pelas instruções que foram desenvolvidas e computacional. O resultado da transformação
teve como objeto para visualização, tabelas pode ser observado conforme demonstra as
criadas no software Microsoft Office Excel figuras 2 e 3.
2013.
Em contrapartida, para o desenvolvimento Imagem de resolução padrão de entrada, 24 bits
do projeto, foi utilizado em sua fase inicial um
computador pessoal da marca Dell, 16 Gb de
memória RAM, com um processador da marca
Intel Core i7, 8ª geração e placa de vídeo
dedicada de 4 Gb. A inserção dos vídeos no
ambiente computacional para simulação foi
realizado através da função Vídeo Reader do
MATLAB.
Para efeitos de resolução, haja vista que os
vídeos analisados em questão, possuírem
diversidades nesse aspecto, foi padronizado
durante a execução do algoritmo uma
resolução inicial que não comprometeu a
capacidade computacional da configuração Figura 2 – Quadro de imagem de vídeo RGB, 24 bits.
Imagem em niveis de cinza, 8 bits Em seguida, foi definido um limiar de

detecção das formas geométricas circulares
com o parâmetro de 0.2. Observa-se que foram
realizados inúmeros testes até a definição
desse valor. Sendo assim, adotou-se esse
parâmetro para todo projeto. Isso foi necessário
para estabelecer um padrão de entrada para
todas as imagens de vídeo, mantendo nesse
aspecto, um padrão para o gradiente de cor.
Um valor próximo a 1 permite somente que
bordas de alto valor de sejam detectadas, isto
é, a função imfindcircles tornasse menos
sensível a detecção de formas geométricas
circulares. De maneira contrária, um valor
Figura 3 – Quadro de imagem de vídeo em níveis de próximo a 0, torna a função mais sensível a
cinza, 8 bits. bordas mais fracas, fazendo a detecção de
mais formas geométricas circulares com o
Fazendo uma análise na imagem em níveis parâmetro de raio definido.
de cinza, percebeu-se que havia várias regiões Tendo propósito de analisar graficamente e
onde não era necessária a aplicação do poder verificar se o objetivo estava sendo
método proposto para o projeto, pois a placa de alcançado, foi utilizada a função viscircles e
sinalização vertical de velocidade sempre era definido a tonalidade de cor verde em que
vista no lado direito ou esquerda da via ou possibilitou na visualização das formas
estrada pública. Além disso, a placa possuía geométricas circulares presentes na imagem. O
uma altura já pré-estabelecida na ordem de 1,2 resultado pode ser verificado, conforme denota
a 2,5 metros com esta variância dependente da a figura 4.
localidade, urbana ou rural. Nesse sentido, foi
delimitada uma região de área de busca para Transformada de Hough para círculos
que o algoritmo percorresse somente as
regiões onde possuía a placa de sinalização
vertical de velocidade. Nesse contexto, foi
criada uma variável que continha coordenada,
número de linhas e número de colunas
definidas previamente da imagem.
O resultado disso, fez com que diminuísse o
tempo que o algoritmo levava para fazer cada
iteração. A região de delimitação pode ser
observada nas linhas tracejadas superiores e
inferiores conforme denota a figura 4. O que
está acima da linha tracejada o algoritmo
desconsidera bem como o que está abaixo da
linha inferior também é desconsiderado.
Uma vez tendo a imagem convertida em Figura 4 – Detecção utilizando a transformada de Hough
níveis de cinza e delimitado uma região de para círculos e linhas tracejadas delimitando a região de
busca, logo após, foi utilizado a função busca.
imfindcircles do MATLAB no qual possibilitou o
encontro de formas geométricas circulares Notadamente, foi percebido que nesse
presentes na imagem de vídeo, baseado na quadro de imagem de vídeo, o objeto de
transformada de Hough circular. interesse começava a ser destacado, ou seja, a
Para o efeito, foi necessária a determinação placa de sinalização vertical de velocidade.
do raio com o qual a transformada de Hough Salienta-se que foram realizados testes
conseguiria detectar em cada imagem e/ou utilizando a transformada de Hough para os
quadro de vídeo os círculos, sendo assim, para métodos de segmentação binária e método
o projeto, foi delimitado um raio mínimo de 10 Canny, no entanto a execução do projeto nesta
pixels contra 29 pixels no máximo. etapa não se mostrou viável, haja vista o
número de falsos positivos detectados. Dessa
forma, o êxito foi obtido utilizando a imagem em Em seguida, o objeto de interesse foi
níveis de cinza conforme já visto na figura 4. redimensionado para (240 vs NaN), ou seja,
Em seguida, foi identificado por meio de para duzentas e quarenta linhas por quantidade
função da transformada de Hough, o parâmetro de colunas proporcionalmente e armazenada
da coordenada do centro do objeto de em uma variável. De modo semelhante, foi
interesse , o que possibilitou, com os utilizada a função imcrop do MATLAB para
parâmetros já definidos inicialmente da obter o objeto de interesse, em três canais de
variação de raio mínimo e máximo, a utilização cor o RGB e armazenada em outra variável. O
de variáveis como raio e diâmetro exatos do fator para redimensionamento foi utilizado para
objeto de interesse, sendo estes dois, se obter uma melhora nas saliências do objeto
apresentados no Workspace do MATLAB e de interesse aumentado nesse aspecto, a
através dessa coordenada, também foi utilizado quantidade de pixels presentes.
outras duas variáveis para o deslocamento da Durante a realização dos testes, como já
coordenada na imagem bidimensional. O previsto, foi observado que em algumas
objetivo para esse deslocamento foi necessário situações onde o quadro e/ou imagem de vídeo
para a utilização da função imcrop do MATLAB não possuía objeto de interesse, a
que por sua vez, proporcionou extração da transformada de Hough para círculos
forma geométrica da placa de sinalização identificava formas geométricas circulares de
vertical de velocidade, isto é, o objeto de outros objetos que não faziam parte do escopo
interesse. do projeto. Sendo assim, para eliminação do
Importante evidenciar que foram realizadas revés, utilizou-se redes neurais convolucionais
inúmeras simulações para chegar o ponto ideal profundas para realizar a classificação dessas
com a função imcrop, haja vista, não ser uma imagens e eliminar as imagens que por ventura
imagem estática e sim em modo dinâmico, ou viesse ser distinta da placa de velocidade R-19.
seja, em cada quadro de imagem era uma Para o método em questão, a variável no
localização de uma coordenada do centro do qual tinha armazenado o objeto de interesse
objeto de interesse diferente, sendo assim, em RGB foi utilizada como variável de entrada
adotou-se para as duas variáveis o na rede. O uso dessa variável fez com que
deslocamento de 19 pixels em cada quadro de diminuísse substancialmente o tempo de
vídeo. Iteração do algoritmo aumentando nesse
Esses 19 pixels foram subtraídos com a sentido, a capacidade computacional, uma vez
coordenada do objeto de interesse que era que a análise da rede neural partiu-se através
composto por um vetor de dois elementos, da imagem RGB já redimensionada conforme
sendo o primeiro representado pela linha e o narrado anteriormente.
segundo representado pela coluna. O resultado Para classificação das imagens e o seu
para o procedimento, fez com que a área não treinamento, foram utilizadas 954 imagens
pertencente ao objeto de interesse fosse divididas em duas classes. Uma classe foi
eliminada, sucedendo somente como análise, o denominada como “VELOCIDADE”,
objeto de interesse, ou seja, a placa R-19, representando imagens positivas de placas de
conforme pode ser visto na direita da figura 5. velocidade que variavam de 10 a 100 km/h, e
Com o objeto de interesse em destaque foi outra classe denominada “IMAGEMFUNDO”,
possível empregar as demais etapas da visão representando imagens negativas, isto é, que
computacional, reduzindo dessa forma, o custo não possuíam o objeto de interesse, o modelo
computacional envolvido e a possibilidade de R-19. Para classe das imagens positivas, foram
erros. utilizadas 316 imagens. E para classe de
Objeto de interesse imagens negativas foram utilizadas 638
imagens que não possuem o modelo de
velocidade R-19, conforme já mencionado.
As imagens foram escolhidas
aleatoriamente em ambientes reais e ideias,
contendo características distintas de cor, brilho,
ângulo, (linhas vs colunas) e local. Uma
amostra do conjunto que foi utilizado para o
treinamento foi executada através da função
Figura 5 - Objeto de interesse a direita em destaque.
randperm do MATLAB e apresentada de forma Em seguida, as 954 imagens foram

arbitrária, conforme pode ser visto na figura 06. treinadas tendo despendido um tempo de
39min38seg para a finalização do treinamento
Imagens do conjunto de treinamento com a configuração de processamento
utilizada. O treinamento obteve uma precisão
de classificação em todo conjunto de 99,58%.
O resultado do treinamento pode ser visto
na figura 07, conforme denota o gráfico gerado
pelo MATLAB, durante o progresso de
treinamento que inicia em 67% e termina em
99,58%. Após o progresso de treinamento,
novamente foi utilizada a função randperm que
gerou de forma aleatória, uma amostra do
conjunto de dados utilizado, agora, indicando a
porcentagem de acerto na classificação. Essa
amostra indicou o que era placa de velocidade
e o que não era. Isso pode ser observado
Figura 6 – Amostra de imagens utilizadas no treinamento conforme a figura 08.
da rede, exibida do MATLAB 2018a.
Progresso do treinamento da rede para conjunto de duas classes
Figura 7 – Progresso de treinamento exibida do MATLAB 2018a, para duas classes.

Porcentagem de acerto na classificação Importante destacar que para chegar a um
resultado esperado, foram realizadas
consideráveis tentativas de treinamentos até
alcançar um resultado satisfatório, sendo que
uma das primeiras tentativas foi de classificar
as imagens por velocidade, ou seja, utilizando
uma classe para cada velocidade. Para esse
conjunto de dados retratado, foram utilizadas
600 imagens, sendo 300 positivas e 300
negativas. Por esse aspecto, o projeto teve um
conjunto de 10 classes para velocidade e uma
classe fazendo a “IMAGEMFUNDO”, ou seja,
imagem sem placa de velocidade.
Para o método apresentado, o resultado
das classificações mostrou-se pouco viável,
haja vista, o conjunto ter obtido uma precisão
de validação de 78,20%. Sendo assim, adotou-
se o método para duas classes. O resultado
para o conjunto de treinamento de 11 classes
Figura 8 – Amostra do conjunto de treinamento, exibindo
porcentagem de acerto na classificação, apresentada no
pode ser visto, conforme denota o progresso de
MATLAB 2018a, para duas classes. treinamento da figura 09.
Progresso do treinamento da rede para conjunto de onze classes
Figura 9 – Progresso de treinamento exibida do MATLAB 2018a, para 11 classes.
Analisando as figuras 7 e 9, percebe-se que velocidade, o objeto de interesse em níveis de

para esse projeto a utilização de um conjunto cinza que estava armazenada na variável foi
de dados com uma quantidade superior de utilizado na etapa seguinte da visão
imagens de positivas e negativas tornou a computacional. Sendo assim, foi utilizado o
precisão de classificação nos dados de método de segmentação binária no qual
validação também superior. Nesse mesma possibilitou a conversão dessa imagem níveis
linha, durante a realização dos testes foi de cinza em uma imagem binária.
observado uma diminuição do número de falso Essa imagem binária é representada pelo
positivo e consequentemente um aumento na algarismo numérico 0 para uma tonalidade de
classificação correta da placa de velocidade. cor totalmente preta e o algarismo numérico 1
Além disso, é Importante destacar que para para totalmente branco. Para seguimento das
o treinamento da rede na figura 7, o parâmetro demais etapas da visão computacional, o
utilizado foi de 18 épocas, isto é, 18 passagens método Canny não se mostrou viável durante
completas do algoritmo no conjunto de dados os testes, sendo utilizada somente a
de treinamento. Nota-se que cada época no segmentação binária.
gráfico das figuras 7 e 9 é constituído pelo Logo após, o objeto de interesse foi
fundo sombreado em contraste com o branco redimensionado para (120 vs NaN), isto é, para
que também representa uma época. Para cento e vinte linhas por quantidade de colunas
essas 18 épocas, o treinamento demandou 252 proporcionalmente. O resultado dos
iterações, a cada três iterações o valor da procedimentos pode ser visto na figura 10.
precisão do conjunto de dados era atualizado e
apresentado no gráfico. Esse valor era Objeto de interesse em imagem binária
representado pela linha traço-ponto.
Já para o treinamento da rede mostrado na
figura 9, foram utilizadas 15 épocas com a
utilização de 135 iterações, sendo despendido
para esse treinamento, um tempo inferior ao de
duas classes, totalizando 14min31seg o que
obteve a precisão de validação do conjunto de
dados já apresentado no decorrer deste
projeto.
O acompanhamento do progresso de
treinamento é importante, pois possibilita a
verificação da evolução da precisão do
conjunto de dados bem como o seu declínio,
sendo neste último caso a indicação que o
parâmetro utilizado não está adequado e/ou o
conjunto de dados não está em sintonia com o
projeto a ser desenvolvido.
Em seguida, após a imagem ser
classificada pela rede neural como
“VELOCIDADE”, isto é, como placa de Figura 10 - Imagem binária com ruídos.
Com o resultado da segmentação binária, O objetivo da inversão de tonalidades do

isto é, na figura 10, percebeu-se durante os objeto de interesse se dá, pela realização de
testes que o objeto de interesse era às vezes identificação dos algarismos numéricos no qual
obtido com alguns ruídos o qual não possuíam foi realizada na última etapa da visão
importância para visão computacional e computacional.
acabavam prejudicando as demais etapas. Novamente foram aplicados os descritores
Nesse sentido, para sanar o problema, foi geométricos, agora, para segmentação dos
utilizada a função bwareaopen do MATLAB em algarismos numéricos. A de se relatar que no
que propiciou a filtragem do objeto de decorrer dos testes foi notado que o descritor
interesse, e por seguinte, eliminando áreas geométrico identificava imagem adversa do
ruidosas especificas. algarismo numérico, dificultando a passagem
Para realização do procedimento, foi para última etapa. Sendo assim, foram criadas
parametrizado no projeto que áreas menores condicionais para que os descritores
ou iguais a 300 pixels fossem descartadas na geométricos tivessem a visualização da
análise. A utilização dessa função para o variável do “descritor imagem” com maior área,
método apresentado nesta etapa se mostrou tendo como sucesso o encontro do algarismo
mais viável à utilização de operadores numérico.
morfológicos de dilatação e erosão, Em seguida, foi criada uma variável para
considerando o tempo de iteração da instrução. receber os algarismos numéricos da placa de
Após a utilização do filtro morfológico foi velocidade que foram identificadas pelo
utilizado descritores geométricos para obtenção descritor geométrico imagem. O resultado da
de área máxima. Isso possibilitou a obtenção identificação dos algarismos numéricos pode
do valor escalar de número real de pixels ser visto, conforme denota a figura 12.
presentes no objeto de interesse. Sendo assim,
utilizou-se a função “regionprops” do MATLAB Algarismos numéricos em imagem binária
com condicionais para eliminação de pequenas
áreas.
Em seguida, foi realizado uma conversão
da imagem binária no qual o pixel 0 se tornou 1
bem como o pixel de valor 1 se tornou 0. O
resultado dos processos foi uma imagem
binária com inversão das tonalidades, mais Figura 12 – Algarismos numéricos em imagem binária.
ajustada geometricamente, com destacamento
dos algarismos numéricos e eliminação de Após o armazenamento das imagens
ruídos, conforme pode ser visto na figura 11. numéricas na variável criada, foram utilizadas
17 imagens binárias de (24 vs 42), isto é, 24
Imagem binária com filtro morfológico linhas por 42 colunas, totalizando uma imagem
de 1008 pixels de área. Essas imagens
representavam algarismos numéricos que
iniciavam em zero e terminavam no algarismo
numérico nove. Em seguida, esses algarismos
numéricos foram salvos em uma matriz de
células, em que cada célula possuía uma
matriz representando o valor numérico.
O objetivo de utilização dessas imagens se
fez necessário para servir como base de
comparação com os algarismos numéricos
detectados da placa de velocidade, no
momento em que era executada em cada
quadro e/ou imagem de vídeo.
Em seguida, foi criada uma função no qual
realizava a comparação desses algarismos
numéricos detectados armazenados na
Figura 11- Objeto de interesse com aplicação de filtros variável, com os algarismos numéricos salvo na
morfológicos, inversão das tonalidades e mais ajustada matriz de células através de coeficiente de
geometricamente.
correlação. Importante destacar, que o o sinal de velocidade que era processado no

algarismo numérico detectado, apresentava momento do processo de aquisição de
quantidade de linhas e colunas diversa do imagens. Essas velocidades foram
armazenada na matriz de células. apresentadas na linha de comando do software
Sendo assim, foi utilizada a função utilizado, isto é, o MATLAB2018a.
“imresize” do MATLAB a qual possibilitou que De modo semelhante, também foi criado
essa imagem fosse redimensionada para um uma condicional para que o projeto
tamanho análogo ao do armazenado na matriz demonstrasse quando o sinal de velocidade
de células. Importante salientar que esse não era reconhecido por algum motivo diverso,
redimensionamento ocorria em modo contínuo, sendo então, retornado como resultado a
ou seja, a função foi executada em cada seguinte frase: “Não consta como placa de
quadro de imagem de vídeo. O resultado para velocidade” para placas de sinalização não
esses procedimentos possibilitaram a pertencentes ao modelo R-19.
identificação da velocidade indicada na placa O resultado final para todos os
R-19. Essa velocidade foi representada como procedimentos do projeto pode ser verificado
sinal numérico e armazenada dentro de uma conforme denota a figura 13. Importante
variável no qual foi denominada salientar que cada velocidade apresentada na
“VELOCIDADE”. linha de comando do MATLAB visualizada na
Em seguida, após o armazenamento da figura 13, representa uma iteração completa do
velocidade na variável, foram utilizadas algoritmo, isto é, representa uma passagem
condicionais para que o projeto demonstrasse completa em todas as instruções do projeto.
Velocidade de 60 Km/h identificada
Figura 13- Velocidade de 60 km/h identificada de forma instantânea e apresentada no “Command Window” do
MATLAB2018a.
RESULTADOS E DISCUSSÃO níveis de cinza, nota-se que o tempo

despendido é extremamente baixo, na ordem
Os resultados apresentados a seguir, foram
de 1 milissegundo (ms).
obtidos através do software
Sendo assim, percebeu-se que trabalhar
MATLAB/SIMULINK® da companhia
com uma imagem redimensionada ajuda
MathWorks na versão 2018a. Com a execução
bastante nas demais fases da visão
do método proposto, descobriu-se que o tempo
computacional, visto que, dependendo da
médio de iteração despendido das instruções
dimensão da imagem de entrada, está poderá
do projeto, passando por todos os processos
causar um custo computacional elevado em
de execução com a configuração de
etapas posteriores.
processamento utilizada foi de 0,196 segundos.
Constatou-se também durante a execução
Por outro lado, o tempo médio de iteração
do projeto que com um aumento na quantidade
das instruções em execução normalizada, isto
de linhas e colunas de um quadro e/ou imagem
é, com a entrada de vídeo de resolução de
de vídeo, aumenta-se consigo a capacidade de
(480 vs NaN), com a delimitação da região de
profundidade para detecção e reconhecimento,
busca, sem a placa de velocidade reconhecida,
haja vista, o aumento na quantidade de pixel
e somente com a busca por círculos com o
presentes, no entanto, consequentemente o
perfil parametrizado pela transforma de Hough,
tempo de iteração do projeto aumenta,
foi de 0,097 segundos, representando um valor
podendo ser um fator desfavorável para
percentual de 49,52% do tempo total.
circunstâncias onde se utiliza a visão
Por essa análise, percebe-se que a
computacional em tempo real.
utilização da transformada de Hough para
De análise semelhante, Luo et al[21]
detecção de formas geométricas circulares no
realizaram um estudo de reconhecimento de
projeto, é responsável por despender metade
sinais de trânsito utilizando uma rede neural
do tempo computacional.
convolucional e observaram que com um
Em um procedimento equivalente realizado
pequeno vídeo de 5 a 20 quadros o tempo
por Souki et al[19] em que demonstram um
médio de execução do projeto a cada quadro
sistema de visão computacional para sinais de
e/ou imagem de vídeo era de 0.366 segundos
trânsito em tempo real, é constatado pelos
para resolução de 1280 vs 512 e 0.45
autores que a transformada de Hough é
segundos na resolução 1280 vs 1024.
responsável por despender cerca de 72,10 %
Ren et al[22] utilizando um método de
do tempo total de processamento.
reconhecimento de imagens baseado em
Para Saputra e Widyantoro[20] o tempo de
correspondência, observaram que o tempo
processamento de um vídeo de resolução 3
despendido utilizando imagens 128x128 eram
vezes maior que outro levou cerca de 0,11
substancialmente mais baixos se comparado a
segundos ao passo que utilizando o de 3 vezes
uma imagem de 1024x768 pixels.
menor levou cerca de 0,015 segundos para
Importante destacar que os resultados dos
detecção utilizando Hough. Para os autores, o
valores de tempo para iteração, foram obtidos
tempo de detecção de cerca de 0,1 segundos é
através do valor médio com observância de 57
aceitável para um sistema em tempo real.
iterações para cada tarefa, exceto para
Analisando as instruções do projeto em
redimensionamento e transformada de Hough
dadas partes, ficou evidente que para rede
no qual foram utilizadas 277 e 484 iterações
neural, a iteração despendida no momento que
respectivamente para obtenção do valor médio.
o primeiro frame RGB redimensionado era
A tabela 1 exemplifica o valor médio do tempo
recebido em sua entrada, até o momento de a
despendido para cada tarefa do projeto e o
sua saída, era 0,336 segundos e na sequência
valor médio de tempo em sua plenitude.
para os demais frames era de 0,082 segundos,
representado um valor percentual de 41,78%. Tempo de iteração e percentual para instrução
Já para identificação dos algarismos
numéricos, o tempo de iteração despendido foi
de 0,007 segundos.
Em relação ao redimensionamento da
imagem de entrada, antes da detecção da
placa de velocidade com a transformada de
Hough e já transformando essa imagem em
Tabela 1 - Tempo de iteração das instruções na totalidade transformada de Hough e para o

e nas partes mais fundamentais com respectivo reconhecimento a rede neural foi utilizada. Para
percentual despendido. Segundo (seg.).
os procedimentos, os autores utilizaram 105
Foi descoberto também durante os testes sinais de trânsito. Após os testes, os autores
que com o aumento do raio na transformada de observaram uma precisão geral do sistema de
Hough, conjuntamente, aumentava a 95,5%. Ainda concluem que as dificuldades na
capacidade de detecção, no entanto, o tempo detecção estavam relacionadas a mudanças de
de iteração de execução nas instruções iluminação, deformação, rotação da imagem e
também aumentava, sendo assim, para esse escalonamento.
projeto delimitou-se o raio fixo que já fora Em seguida após a detecção das placas de
mencionado nos procedimentos. velocidade pela transformada de Hough, a
O procedimento desenvolvido para imagem passava pela rede que por sua vez a
verificação dos resultados, se deu na classificava. Constatou-se que das 91 placas
apreciação de 9 vídeos contendo veículos detectadas no projeto, 85 foram reconhecidas
fazendo o processo de aquisição de imagens pela rede como placa de velocidade,
em vias públicas, ou seja, fazendo a captura de representando uma taxa de reconhecimento de
imagens em modo dinâmico. A quantidade de 93,40%, tendo este resultado como a condição
tempo total somada dos vídeos foi de 75 necessária para demais etapas da visão
minutos e 27 segundos, conforme especifica a computacional e 6 não foram reconhecidas
tabela 02. como placas de velocidade. A tabela 4 denota
os resultados.
Quantidade de vídeos e tempo total
Placas que foram e não foram reconhecidas
Tabela 2 – Vídeos e tempo total utilizado no projeto.
Ademais, dos vídeos examinados, Tabela 4 - Quantidade de placas detectadas que foram
descobriu-se que foram detectadas com a reconhecidas e não reconhecidas pela rede.
utilização da transformada de Hough, 91 placas
de sinalização vertical de velocidade de um Constatou-se que das 85 placas que foram
total de 95 placas analisadas. Isso representou reconhecidas, 70 tiveram sua velocidade
um total de 95,78 %, mostrando-se favorável a identificada efetivamente pela visão
aplicação para método proposto. A tabela 03 computacional, representando uma taxa de
exemplifica o que foi mencionado. 82,35% e 15 não tiveram sua velocidade
identificada o que representou 17,64%.
Detecção utilizando a transformada de Hough Observa-se que esses dois últimos resultados
foram obtidos na última etapa da visão
computacional utilizando a matriz de correlação
que é utilizada para detecção dos algarismos
numéricos. Sendo assim, estes dois últimos
Tabela 3 - Quantidade de placas detectadas e não resultados eram apresentados no Command
detectadas utilizando a transformada de Hough. Window do MATLAB. A tabela 05 denota os
resultados para o que foi mencionando.
De modo equivalente, Rizon et al[23]
desenvolveram um estudo para detectar Velocidade identificada efetivamente
objetos a partir de uma imagem de entrada. Em
um dos métodos propostos, os autores
utilizaram a transformada de Hough para
círculos. Após os testes, os autores concluíram
que das 25 imagens analisadas a taxa de Tabela 5 – Quantidade de placas que foram e não foram
detecção foi de 96% identificadas efetivamente.
Kuo e Lin[24] desenvolveram um método
para detecção e reconhecimento de sinais de Um método para detectar e reconhecer
trânsito usando estratégia de dois estágios. placas de sinalização de trânsito foi proposto
Para detecção os autores utilizaram a por Silva et al[25], em seu experimento, os
autores utilizaram 17 imagens de trânsito que logo em sua fase inicial, o número de falso
foram denominadas como templates e 60 positivo era superior tendo um declínio com o
imagens de resolução (2144 vs 1424) pixels aperfeiçoamento e inclusão de mais imagens
contendo 92 placas de sinalização, que foram no conjunto de dados.
obtidas através de uma câmera instalada em Um aspecto que é importante destacar, é
um veículo. Com o procedimento proposto, os que todos os resultados para o valor médio
autores observaram que 78 placas foram foram obtidos utilizando exclusivamente a
reconhecidas corretamente, representando Central Processing Unit (CPU) e/ou no
uma taxa de acerto de 84,78%, contra 3,26% português, Unidade Central de Processamento
relacionado a erros de identificação e 11,96% (UCP). Observa-se que a utilização da Unidade
de placas não reconhecidas, representando 11 de Processamento Gráfica, comumente
placas. Ainda foi verificado pelos autores que o conhecida do inglês, como Graphics
tempo médio de processamento das 60 Processing Unit (GPU), otimiza
imagens foi de 90 segundos. substancialmente o custo computacional das
Hechri e Mtibaa[26] desenvolveram um tarefas do projeto desenvolvido.
estudo para detecção e reconhecimento de Para Patil et al[27] o benefício de uso da
sinais de trânsito. Para os testes, os autores GPU no processamento de imagens é de
utilizaram dados reais de imagens de vídeo acelerar o desempenho obtido pela sua
coletadas em estradas que representou 144 arquitetura paralela. Por essa análise, os
sinais de trânsito. Os sinais foram obtidos autores realizaram testes de performance,
através de uma câmera que foi instalada sobre utilizando uma CPU Intel core i5 em
um veículo. Por fim, os autores concluem que comparação a uma GPU NVIDIA Geforce
as redes neurais forneceram uma taxa de 940m, aplicando a transformada de Hough. Os
acerto de 97,6% na classificação, com um autores observaram que a CPU despendeu um
tempo de processamento de 0,2 segundos. tempo de execução de 0,54 segundos, em
Importante evidenciar que na execução do contrapartida a GPU demandou 0,09 segundos.
projeto, constatou-se que a transformada de Em uma observação semelhante, Potluri et
Hough para círculos, identificou outros objetos al[28] adotaram um procedimento de verificação
não pertencentes ao padrão R-19, mas que da performance de uma CPU e GPU. Para os
foram em sua maioria, classificados como não testes, os autores utilizaram uma CPU Intel (R)
placas de velocidade e eliminados pela rede Xeon (TM) 3.60 GHz e uma GPU GeForce
neural. Por outro lado, constatou-se que a rede 9500 GT com 256MB de memória. Os autores
reconheceu 5 dessas imagens como sendo verificaram aspectos como detecção de borda,
placas de velocidade, no entanto, nenhuma dilatação, contraste e concluíram que tarefas
apresentou-se como velocidade efetivamente, de processamento de imagens na GPU são
devido a utilização de matriz de correlação bem mais rápidas quando se comparada à
utilizada na última etapa da visão CPU.
computacional. Isso demonstra o quão é efetivo
a técnica apresentada. CONCLUSÃO
Observa-se também que um dos fatores
Conclui-se, portanto que para o sistema de
que podem ter contribuído para a classificação
visão computacional proposto, este se fez
incorreta dessas 5 imagens, como placas de
capaz de identificar as placas de sinalização
velocidade, está vinculado com as suas
vertical de velocidade, podendo estes
características semelhantes a do objeto de
procedimentos serem avaliados e/ou
interesse.
implementados em sistemas de carros
Nessa mesma análise, é o caso das 6
autônomos de terceiros para variação de
placas que não foram reconhecidas pela rede,
velocidade.
um obstáculo que pode ser resolvido
Outro fator importante é que o tempo de
aperfeiçoando o conjunto de dados utilizado,
iteração do projeto mostrou-se bem abaixo,
com mais amostras positivas em diferentes
demonstrando a possibilidade de uso em
ambientes, com características distintas de
tempo real.
incidência de luz e de refletância sobre o objeto
O projeto mostrou-se positivo analisando os
de interesse. Essa análise mencionada foi
dados obtidos pela quantidade de acertos
observável durante a realização dos testes,
apresentados. Por outro lado, um dos
visto que em um dos treinamentos realizados,
problemas enfrentados foi à falta de placas de JJM, Eds. Introdução à visão

velocidade em arquivos de vídeo para computacional usando matlab®. 2016;
realização do teste em larga escala. 1ª ed. Rio de Janeiro: Alta Books. p. 188.
Pretende-se realizar em planejamentos ISBN: 978-85-508-0023-3.
futuros, o aperfeiçoamento do tempo de [8]. MARQUES FILHO O; VIEIRA NETO H.
iteração com a utilização da unidade de Introdução. In: MARQUES FILHO O;
processamento gráfica aliada a CPU para a VIEIRA NETO H, Eds. Processamento
realização de testes em ambiente real. digital de imagens. 1999; 3ª ed. Rio de
Por fim, realizar o reconhecimento do objeto Janeiro: Brasport. p. 10. ISBN:
de interesse na imagem de entrada bem como 8574520098.
dos algarismos numéricos da placa de [9]. BACKES AR; SÁ JR. JJM.
velocidade através das redes neurais artificiais Reconhecimento de padrões. In: BACKES
convolucionais para o aprimoramento dos AR; SÁ JR. JJM, Eds. Introdução à visão
resultados. computacional usando matlab®. 2016;
1ª ed. Rio de Janeiro: Alta Books. p. 225.
REFERÊNCIA ISBN: 978-85-508-0023-3.
[10]. BARELLI FC. Reconhecimento de
[1]. BACKES AR; SÁ JR. JJM. Introdução. In:
padrões. In: BARELLI FC, Eds. Introdução
BACKES AR; SÁ JR. JJM, Eds.
à visão computacional, uma abordagem
Introdução à visão computacional
prática com python e opencv. 2018; 1ª
usando matlab®. 2016; 1ª ed. Rio de
ed. Espirito Santo: Casa do código. p. 187,
Janeiro: Alta Books. p. 1-3. ISBN: 978-85-
ISBN: 978-85-94188-57-1.
508-0023-3.
[11]. ÇAĞLAYAN T; AHMADZAY H;
[2]. GONZALEZ RC; WOODS RE. Introdução.
KOFRAZ G. Real-time traffic sign
In: GONZALEZ RC; WOODS ER, Eds.
recognition based on shape and color
Processamento digital de imagens.
classification. Signal Processing and
2009; 3ª ed. São Paulo: Pearson. p. 1-2.
Communications Applications
ISBN: 978-85-8143-586-2.
Conference (SIU). 2015; [SV], p. 1897-
[3]. MARQUES FILHO O; VIEIRA NETO H.
1900. ISSN: 2165-0608.
Fundamentos de imagens digitais. In:
[12]. CONSELHO NACIONAL DE
MARQUES FILHO O; VIEIRA NETO H,
TRÂNSITO, manual brasileiro de
Eds. Processamento digital de imagens.
sinalização de trânsito. Sinais de
1999; 3ª ed. Rio de Janeiro: Brasport. p.
Regulamentação. In: DEPARTAMENTO
21. ISBN: 8574520098.
NACIONAL DE TRÂNSITO. Sinalização
[4]. BACKES AR; SÁ JR. JJM. Fundamentos
Vertical de velocidade. v. 1, p. 45 – 49.
de imagem. In: BACKES AR; SÁ JR. JJM,
Disponível em:
Eds. Introdução à visão computacional
https://www.denatran.gov.br/images/Educa
usando matlab®. 2016; 1ª ed. Rio de
cao/Publicacoes/Manual_VOL_I_2.pdf
Janeiro: Alta Books. p. 54-55. ISBN: 978-
acessado em 15/04/2018.
85-508-0023-3.
[13]. POLICIA RODOVIÁRIA FEDERAL.
[5]. SOLOMON C; BRECKON T. Segmentação
Acidentes agrupados por ocorrência. In:
de imagens. In: SOLOMON C; BRECKON
MINISTÉRIO DA JUSTIÇA E
T, Eds. Fundamentos de processamento
SEGURANÇA PÚBLICA. Disponível em:
digital de imagens uma abordagem
http://www1.prf.gov.br/arquivos/index.php/s
prática com exemplos em matlab. 2013;
/nqvFu7xEF6HhbAq/download acessado
1ª ed. Rio de Janeiro: LTC. p. 400. ISBN:
em 15/04/2018.
978-85-216-2380-9.
[14]. GOVERNO DO BRASIL. Semana
[6]. GONZALEZ RC; WOODS RE.
nacional de trânsito. Excesso de
Segmentação de imagens. In: GONZALEZ
velocidade lidera ranking das infrações
RC; WOODS ER, Eds. Processamento de
mais cometidas em 2017. Disponível em:
imagens digitais. 2000; 1ª ed. São Paulo:
http://www.brasil.gov.br/cidadania-e-
Edgard Blucher. p. 295. ISBN: 978-85-212-
justica/2017/09/excesso-de-velocidade-
0264-6.
lidera-ranking-das-infracoes-mais-
[7]. BACKES AR; SÁ JR. JJM. Extração das
cometidas-em-2017. Acesso em: 20 abri.
características. In: BACKES AR; SÁ JR.
2018.
[15]. REIS WAD. Detecção de Sinais de Computing New Zealand (IVCNZ 2009),
Trânsito Através do Método de p. 409-414, ISSN 2151-2205.
Classificação Adaboost. Unopar Científica [23]. RIZON M; YAZID H; SAAD PUTEH;
Ciências Exatas E Tecnológicas. 2013; SHAKAFF AYM; SAAD AR, Object
v. 12, n. 1, p. 27-34. ISSN: 1679-088X. detection using circular Hough transform,
[16]. SHI JH; LIN HY. Automatic detection of in: American Journal of Applied
road traffic signs from natural scene Sciences. 2005, p. 1606-1609, ISSN:
images based on pixel vector and central 1546-9239.
projected shape feature. 26th [24]. KUO WJ; LIN CC, Two-stage road sgn
International Symposium on Industrial detection and recognition, in: 2007 IEEE
Electronics (ISIE). 2017; [SV], p. 1596- International Conference on Multimedia
1601. ISSN: 2163-5145. and Expo, 2007, p. 1427-1430, ISSN:
[17]. DEPARTAMENTO NACIONAL DE 1945-7871.
INFRAESTRUTURA DE TRANSPORTES, [25]. SILVA FA; ARTERO AO; PAIVA MSV;
Relatório dos levantamentos funcionais BARBOSA RL, Uma metodologia para
das rodovias federais. In: SISTEMA DE detectar e reconhecer placas de
GERÊNACIA DE PAVIMENTOS. REDE sinalização de trânsito, in: VIII Workshop
RODOVIÁRIA NACIONAL. p. 7. Disponível de Visão Computacional (WVC 2012).
em:http://www.dnit.gov.br/download/planej ISSN: 2175-6120.
amento-e- [26]. MTIBAA A; HECHRI A, Automatic
pesquisa/planejamento/evolucao-da- detection and recognition of road sign for
malha-rodoviaria/relatorio-sgp-2012-2013- driver assistance system, in: 2012 16th
rj.pdf acessado em 18/04/2018. IEEE Mediterranean Electrotechnical
[18]. DEPARTAMENTO NACIONAL DE Conference, ISSN: 2158-8473.
TRÂNSITO, Frota por UF e tipo de [27]. PATIL PR; PATIL MD; VYAWAHARE
veículo. In: DEPARTAMENTO NACIONAL VA, Acceleration of Hough transform
DE TRÂNSITO. [SL] Disponível em: algorithm using graphics processing unit
https://www.denatran.gov.br/images/Estatis (GPU), in: 2016 International Conference
tica/RENAVAM/2018/Marco/Frota_por_UF on Communication and Signal
_e_Tipo-MAR_18.xls acessado em Processing (ICCSP). 2016, ISBN: 978-1-
18/04/2018. 4673-8549-7.
[19]. MA SOUKI; BOUSSAID L; ABID M, An [28]. POTLURI S; FASIH A; VUTUKURU LK;
embedded system for real-time traffic sign MACHOT FA; KYAMAKYA K, CNN based
recognizing. 2008, 3rd, International high performance computing for real time
Design and Test Workshop. 2009, p. image processing on gpu, in: Proceedings
273-276. ISSN: 2162-0601. of the Join INDS’11 & ISTET’11. 2011,
[20]. WIDYANTORO DH; SAPUTRA KI. ISNN: 2324-8335.
Traffic Lights Detection and Recognition
based on
Color Segmentation and Circle Hough
Transform. Data and Software
Engineering (ICoDSE). 2015; [SV], p. 237-
240. ISBN: 978-1-4673-8430-8.
[21]. LUO H; YANG Y; TONG B; WU F; FAN
B. Traffic sign recognition using a multi-
task convolutional neural network. IEEE
Transactions on Intelligent
Transportation Systems. 2018; v. 19, ed.
4, p. 1100-1111. ISSN: 1558-0016.
[22]. REN F; HUANG J; JIANG R; KLETTE
R, General traffic sign recognition by
feature matching, in: 24th International
Conference image and Vision
View publication stats

Utilização de Visão Computacional para Identificação Automática de Placas de Sinalização Vertical de Velocidade

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Utilização de Visão Computacional para Identificação Automática de Placas de Sinalização Vertical de Velocidade

Enviado por

Direitos autorais:

Formatos disponíveis

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

Utilização de visão computacional para identiﬁcação automática de placas de

Article · January 2018

Rafael Mofati Campos Ronan Do Carmo Lopes

SEE PROFILE SEE PROFILE

The user has requested enhancement of the downloaded file.

Utilização de visão computacional para identificação automática de

LOPES Ronan C¹; NISHIO Kennedy G¹; CAMPOS Rafael M²

INTRODUÇÃO1 Para Gonzalez e Woods[2], não há limitação

dimensões ( ) em uma imagem considerada uma das funções mais

Imagem em niveis de cinza, 8 bits Em seguida, foi definido um limiar de

randperm do MATLAB e apresentada de forma Em seguida, as 954 imagens foram

Progresso do treinamento da rede para conjunto de duas classes

Figura 7 – Progresso de treinamento exibida do MATLAB 2018a, para duas classes.

Progresso do treinamento da rede para conjunto de onze classes

Figura 9 – Progresso de treinamento exibida do MATLAB 2018a, para 11 classes.

Analisando as figuras 7 e 9, percebe-se que velocidade, o objeto de interesse em níveis de

Com o resultado da segmentação binária, O objetivo da inversão de tonalidades do

correlação. Importante destacar, que o o sinal de velocidade que era processado no

RESULTADOS E DISCUSSÃO níveis de cinza, nota-se que o tempo

Tabela 1 - Tempo de iteração das instruções na totalidade transformada de Hough e para o

Tabela 2 – Vídeos e tempo total utilizado no projeto.

problemas enfrentados foi à falta de placas de JJM, Eds. Introdução à visão

View publication stats

Você também pode gostar