Você está na página 1de 4

Deteco de Veculos em Movimento Usando Modelo de Misturas Gaussianas e

RNAs

Evandro A. Silva, Adilson Gonzaga
Universidade de So Paulo
Av. Trabalhador Sancarlense, 400 - CEP 13560-970 - So Carlos / SP
evandro_as@yahoo.com.br, adilson@sel.eesc.usp.br

Resumo
Este trabalho apresenta uma abordagem em estudo para controle de trfego de veculos atravs do uso
de tcnicas de viso computacional. Os vdeos capturados so processados frame a frame, onde o
movimento de objetos segmentado utilizando o Modelo de Misturas Gaussianas. Depois,
caractersticas so extradas aplicadas a uma rede neural, para que os objetos segmentados sejam
classificados como veculos e no-veculos e, no caso dos veculos, ainda classific-los de acordo com
o tipo pequeno, mdio ou grande porte.

1. Introduo

O fluxo de veculos em rodovias cada vez mais se torna um problema crtico. Diversos so os
fatores que colaboram para isto, entre eles, o crescente nmero de carros, motoristas que dirigem em
alta velocidade e a falta de planejamento e manuteno das vias de trfego.
O objetivo da abordagem proposta neste artigo , atravs de sequncia de imagens (frames) de
rodovias, capturadas por cmeras filmadoras, aplicar tcnicas de processamento de imagens e viso
computacional para segmentar o movimento dos veculos, classific-los de acordo com tipos pr-
definidos e armazenar estas informaes em uma base dados, dando assim, suporte ao controle de
trfego.

2. Deteco de Veculos

Pesquisas na rea de deteco de veculos baseadas em viso computacional se intensificaram
nos ltimos 15 anos. Entre os trabalhos voltados para deteco de veculos disponveis na literatura
pode-se citar [2] e [3].
Leung [2] aplica diferenas gaussianas em imagens obtendo valores de mxima e mnima,
selecionados como pontos chaves. Para formar um vetor de caractersticas aplicado SIFT (Scale
Invariant Feature Transform) para cada um dos pontos chaves. Leung utilizou em seu trabalho oito
partes de veculos como caractersticas classificadoras: rodas, faris dianteiros, faris traseiros, teto,
pra-choque, espelho retrovisor, pra-brisa e lateral. O vetor de caractersticas usado para treinar um
classificador SVM (Support Vector Machine).
Em [3] estudado um modelo estatstico da aparncia do veculo. As estatsticas de objetos
veculos e objetos no-veculos so representados usando o produto de dois histogramas. Cada
histograma formado, basicamente, por informaes de espao, freqncia e orientao, capturadas
pela wavelet de Haar [8]. Os autores relatam um desempenho de 92% de preciso.
Nas pesquisas realizadas no foram encontradas citaes do uso do Modelo de Misturas
Gaussianas (Gaussian Mixture Model - GMM) para deteco de veculos automotivos em movimento
porm, um trabalho relevante de Sun e Yuan [4], que utiliza o GMM para controlar mudanas em
cenas com objetos em movimento. Em seu trabalho proposto um GMM Hierrquico (HGMM) como
uma soluo genrica que utiliza modelos sem correlao temporal em diferentes escalas.

3. Metodologia

Baseada nas idias de Sun et al. [1], a abordagem proposta neste artigo se divide em duas
etapas: Gerao de Hipteses de Objetos em Movimento da Viso Lateral (GHOMVL) onde as imagens
so processadas para localizar todos os objetos em movimento e Verificao de Hipteses de Objetos
Veculos (VHOV) onde as hipteses do passo anterior so processadas para classificar os objetos
veculos, conforme mostra a Figura 1.
Na etapa GHOMVL, primeiro realizada a capturada do vdeo atravs de uma cmera filmadora
digital (SONY Cyber-Shot 7.2 megapixels). Em seguida um algoritmo GMM aplicado a cada frame
do vdeo para segmentar os objetos em movimento.


Figura 1 Esquema da abordagem proposta.

O GMM uma mistura de K distribuies gaussianas que apontam a mudana de estado de
pixels correspondentes de um frame a outro. O algoritmo desenvolvido aplica misturas gaussianas a
cada frame e transforma as imagens antes coloridas em imagens binrias. Como apresentado na
Figura 2, para os pixels correspondentes que no sofrem mudanas de estado atribudo o valor um
(preto) e para os pixels que sofrem drsticas mudanas de estado atribudo o valor zero (branco).
Desta forma, possvel gerar as localizaes de todos os objetos em movimento no vdeo.
Na segunda etapa, VHOV, so extradas caractersticas referentes geometria do objeto
segmentado como comprimento, altura e rea. As caractersticas so atribudas a uma Rede Neural
Artificial (RNA) para classificao de padres. Nesta etapa duas arquiteturas de redes neurais so
utilizadas: MLP Feedforward (Multi Layer Perceptron) e RBF (Radial Base Function). A MLP
Feedfoward a arquitetura mais utilizada para classificao de padres em trabalhos de deteco
veculos [5], [6] e [7]. Nesta abordagem, a MLP Feedfoward ser aplicada em duas topologias
diferentes e os resultados da classificao sero comparados com os resultados da RBF. A aplicao da
arquitetura RBF justifica-se pelo fato de que ser formado um conjunto grande de frames para
treinamento. A mdia de cada vdeo capturado para testes de 100 frames e para o treinamento sero
aplicados aproximadamente 20 vdeos, cada um contendo mais de um objeto para anlise e
classificao.
Aps a realizao da primeira fase, que compreende a implementao, testes e comparaes das
tcnicas aplicadas nas etapas apresentadas acima, a segunda fase consiste em integrar as tcnicas
desenvolvidas em um ambiente em tempo real.
4. Resultados

Para realizar testes na segmentao dos objetos em movimento foram capturados doze vdeos de
situaes reais de trnsito. Os vdeos adquiridos contm veculos automotivos como carros,
motocicletas, nibus e caminhes mas tambm contm outros objetos em movimento, como pessoas e
o balano de rvores causado pelo vento. Os vdeos foram capturados na resoluo de 640 x 480 pixels,
com quinze frames por segundo.
Os vdeos foram submetidos ao algoritmo baseado no GMM que realiza tambm uma reduo
de dimensionalidade para 200 x 200 pixels. O algoritmo foi implementado com o auxlio da biblioteca
OpenCV (Open source Compuer Vision library) desenvolvida pela Intel Corporation.
O algoritmo foi aplicado duas vezes para cada vdeo, modificando os parmetros principais: K
(nmero de distribuies gaussianas), T (soma de limiar de pesos para teste de fundo) e
init
(peso
inicial). No primeiro teste, os valores para os parmetros eram K=3, T=0.7 e =0.05 e no segundo teste
os parmetros foram alterados para K=5, T=0.9 e =0.01. No primeiro teste foram segmentados objetos
em movimento muito pequenos, considerados rudos, como folhas das rvores em movimento nas
cenas. Aumentando o valor de limiar do fundo (T) e reduzindo o valor do peso inicial () menos rudos
apareceram nas imagens geradas. A Figura 2 exibe frames originais de trs vdeos diferentes (a) e as
imagens resultantes do segundo teste usando o GMM (b).


Figura 2 Segmentao de objetos em movimento. Em (a) frames de 3 vdeos diferentes e em (b) imagens resultantes da
segmentao dos objetos de cada vdeo.

Analisando os resultados iniciais dois problemas foram constatados: a sobreposio de objetos
veculos, trafegando em diferentes direes, o que dificulta a identificao e classificao, e a presena
de objetos estticos como postes e placas na frente dos objetos em movimento, como possvel
observar na segunda e terceira sequncia de frames da Figura 2. Porm, para solucionar estes
problemas todos os frames de cada vdeo so analisados e, portanto, em algum momento os objetos
sobrepostos se distanciam, no mais causando o problema de sobreposio, e os objetos em movimento
saem da regio onde se encontra o objeto esttico.

5. Discusso

Os resultados experimentais obtidos na etapa GHOMVL so promissores, e a segunda etapa da
abordagem proposta neste trabalho, VHOV, est em desenvolvimento. Espera-se que a integrao das
tcnicas aplicadas em um ambiente em tempo real proporcione um prottipo de um software para
auxiliar o controle de trfego em rodovias de maneira eficiente. Um estudo de caso, que ser realizado
aps a concluso da segunda fase, utilizar o prottipo para gerar estatsticas para o planejamento de
manuteno de rodovias.

6. Referncias

[1] Sun, Z.; Bebis, G.; Miller, R. On-Road Vehicle Detection: A Review. IEEE Transactions on Pattern
Analysis and Machine Intelligence, vol. 28, n 5, 2006.

[2] Leung, B. Component-Based Car Detection in Street Scene Images. Technical Report.
Massachusetts Inst. of Technology, 2004.

[3] Schneiderman, H.; Kanade, T. A Statistical Method for 3D Object Detection Applied to Faces and
Cars. Proc. IEEE Intl Conf. Computer Vision and Pattern Recognition, pp. 746-751, 2000.

[4] Sun, Y.; Yuan, B. Hierarchical GMM to handle sharp changes in moving object detection.
Electronics Letters, vol. 40, n 13, 2004.

[5] Noll, D.; Werner, M.; Seelen, W. Real-Time Vehicle Tracking and Classification. Intelligent
Vehicles, pp. 101-106, 1995.

[6] Goerick, C.; Noll, D.; Werner, M. Artificial Neural Networks in Real-Time Car Detection and
Tracking Applications. Pattern Recognition Letters, vol. 17, pp. 335-343, 1996.

[7] Matthews, N. D.; An, P. E.; Charnley, D.; Harris, C. J. Vehicle Detection and Recognition in
Grayscale Imagery. Control Eng. Practice, vol. 4, pp. 473-479, 1996.

[8] Haar, A. Zur Theorie der Orthogonalen Funktionen-Systeme. Math. Ann, 69, pp. 331-371, 1910.

Você também pode gostar