Escolar Documentos
Profissional Documentos
Cultura Documentos
LICHIERY SILVA
FORTALEZA CE
2013
LICHIERY SILVA
FORTALEZA, 2013
LICHIERY SILVA
BANCA EXAMINADORA
_____________________________________
Prof. Dsc. Rodrigo Carvalho Souza Costa
Orientador FLF
_______________________________________
Prof. M.Sc. Tarique Silveira Cavalcante
Faculdade Loureno Filho
____________________________________
Prof. Esp. Anaxgoras Maia Giro
Instituto Federal de Educao, Cincia e Tecnologia IFCE Campus Fortaleza
_____________________________________
Prof. Dr. Carlos Alberto Manso
Coordenador do Curso
ii
AGRADECIMENTOS
Agradeo a Deus por me dar a instruo inicial em todos os meus atos, logo em seguida
minha famlia que me apoiou durante a minha carreira acadmica e propiciou a minha
formao, principalmente a minha Av e Tia que tiveram contribuio fundamental para esta
realizao.
Ao meu Orientador e Mentor, professor Rodrigo Carvalho Souza Costa, que contribuiu muito
tanto nesse trabalho como na minha carreira acadmica e profissional, grande parte do meu
conhecimento se deve a ele.
Por fim, mas no menos importante, aos meus amigos, que tiveram compreenso nos
momentos em que me ausentei para concluso desse trabalho, mas sempre me incentivaram a
termina- lo, uma participao especial ao meu amigo Joo Pedro Capistrano, que me ajudou
com a parte da lngua inglesa, de fundamental importncia para o termino do trabalho.
iii
iv
RESUMO
Um grande diferencial do sistema de viso humano a capacidade de percepo de
distncia, propiciando uma forma de observao tridimensional do mundo. Atravs da viso,
o ser humano realiza tarefas cotidianas do seu dia-a-dia e toma decises a partir do que
enxerga.
Para simular o processo de percepo humana, existe na Cincia da Computao a
rea de Viso Computacional (VC) que extrai informaes de cenas a partir do processamento
de imagens adquiridas, por exemplo, atravs de cmeras.
A rea da VC muito ampla e um de seus setores de estudo a viso estereoscpica
que tem como objetivo realizar a percepo tridimensional a partir do processamento de
imagens de duas cmeras posicionadas de forma adequada. Esta rea tem avanado muito nos
ltimos anos e vrias tcnicas e algoritmos foram desenvolvidos.
O objetivo desta monografia realizar uma avaliaodas caractersticas de algumas
implementaes de tcnicas de viso estrea (VE) em bibliotecas ou Softwares de
processamento de imagens disponveis na internet.
Atravs da aplicao em um mesmo ambiente de testes e hardware possvel avaliar
os fatores, como iluminao e tipos de lentes das cmeras, que podem influenciar na deteco
de profundidade, possibilitando a compreensodos ajustes necessrios para auxiliar a escolha
da tcnica de VEque agregue o menor custo computacional a uma deteco eficiente para
aplicaes em tempo real.
Os algoritmos apresentados foram desenvolvidos em Linguagem C ANSI com a
biblioteca OpenCV, pois so os mais utilizados em sistemas de VE.
Os resultados encontrados ao final da monografia no so satisfatrios, mesmo as
tcnicas funcionando, cada uma apresenta algum problema, como a taxa de processamento
muito alta, a identificao da imagem de resultado no aceitvel, impossvel de realizar
testes com imagens de tamanho grande.
ABSTRACT
A great advantage of the human vision system is the ability to percept distance,
providing a form to observe the three-dimensional world. Through vision, humans can carry
out daily tasks of their daily life and make decisions based on what they see.
To simulate the process of human perception, there is, in the Computer Science, the
Computer Vision (VC) area that extracts information from scenes based on the processing of
images acquired by cameras.
The VC area is very wide and one of its studys sectors is the Stereoscopic Vision
which aims to make a three-dimensional perception from processing images from two
cameras positioned appropriately.This area has made a huge advance in recent years and
many techniques and algorithms have been developed.
The purpose of this monograph is to conduct an assessment for the characteristics of
different implementations of techniques in libraries or Stereo Vision image processing
software available on the internet.
Through the application on the same test and hardware environment, it is possible to
evaluate the factors such as lighting and types of camera lenses, which may influence the
measurement of depth, allowing us to understand the necessary adjustments to assist t he
Stereo Visiontechniques choice that represent the lowest computational cost at an efficient
detection for real-time applications.
The presented algorithms have been developed inlanguage C ANSI with the OpenCV
library, as mostly used in VS systems.
The results at the end of the monograph are not satisfactory, even the technical
functioning, each presents a problem, as the very high rate of processing, image identification
result is not acceptable, impossible to carry out tests with larger-sized images.
vi
SUMRIO
1.
INTRODUO................................................................................................................... 1
2.
2.2.
2.3.
CAPTAO ESTEREOSCOPICA........................................................................... 10
RETIFICAO ......................................................................................................... 16
2.5.
RECONSTRUO 3D ............................................................................................. 17
2.6.
MAPA DE PROFUNDIDADE.................................................................................. 19
4.
OPENCV.................................................................................................................... 22
3.2.
GIMP.......................................................................................................................... 22
3.3.
3.4.
RESULTADOS ................................................................................................................. 26
4.1.
4.2.
4.3.
RETIFICAO ESTREO....................................................................................... 30
5.
6.
vii
LISTA DE FIGURAS
Figura 1: Exemplo de visualizao de objetos no olho humano. ............................................... 1
Figura 2: Mecanismos para captao de imagens com focos visuais coincidentes. ................... 5
Figura 3: Representao Geomtrica Esquemtica de um MCI. ................................................ 7
Figura 4: Representao de uma cmera virtual. ........................................................................ 7
Figura 5: Exemplo de informao de profundidade obtida pela variao de luminosidade. a)
imagem original b) imagem com textura gerada a partir de uma variao de luminosidade.
Fonte: Pinho (2013). ................................................................................................................... 9
Figura 6: Modelo de Cmera Pinhole. ...................................................................................... 11
Figura 7: Representao de Distoro de Lentes. ..................................................................... 12
Figura 8: a) Modelo chessboard utilizado como padro para calibrao de cmeras b) Imagem
adquirida atravs de cmera com distoro. ............................................................................. 14
Figura 9: Relao de sistemas de coordenadas do mundo real com as coordenadas da imagem.
.................................................................................................................................................. 15
Figura 10: Um Par Estreo Retificado. Fonte: Segundo (2007). .............................................. 16
Figura 11: Exemplo de um Mapa de profundidade. Fonte: Bradski (2008). ............................ 19
Figura 12: Webcam Logitech C210.......................................................................................... 23
Figura 13: disposio das cmeras a) cmeras prximas b) cmeras afastadas. ...................... 23
Figura 14: Aquisio de imagens com cmeras prximas. a) Imagem da cmera esquerda e b)
Imagem da cmera direita. Fonte: elaborao prpria. ............................................................. 24
Figura 15: Aquisio de imagens com cmeras distantes. a) Imagem da cmera esquerda e b)
Imagem da cmera direita. Fonte: elaborao prpria. ............................................................. 24
Figura 16: imagem da cmera a) direita b) esquerda e c) resultado do processamento feito
atravs do GIMP. ...................................................................................................................... 26
Figura 17: Resultado depthmap GIMP ..................................................................................... 27
Figura 18: Teste depthmap GIMP com diferentes parmetros. ................................................ 27
Figura 19: Resultado depthmap GIMP, com OpenCV ............................................................. 28
Figura 20: Imagens adquiridas pela cmera (a) direita e (b) esquerda. .................................... 29
Figura 21: Deteco do tabuleiro de xadrez na cmera (a) Direita e (b) Esquerda. ................. 29
Figura 22:Execuo do sistema, Mapa de Profundidade em tempo real .................................. 30
Figura 23: Resultado do mapa de Profundidade com retificao sem informaes da
calibrao. ................................................................................................................................. 31
viii
Centro de Projeo
Distancia Focal
FEH
MP
Mapa de Profundidade
MCI
OPENCV
PDI
PII
VE
Viso Estreo
VC
Viso Computacional
Vetor de Translao 3D
1. INTRODUO
A percepo visual uma ferramenta muito importante para os seres vivos videntes,
pois possibilita um indivduo organizar e interpretar suas impresses sensoriais para atribuir
significado ao meio atravs do sentido da viso. Ela utilizada em tarefas cotidianas do ser
humanopara tomar decises, baseadas nas informaes obtidas pela captura do cenrio, como,
por exemplo, a travessia de uma rua ou escolher frutas em um mercado (SOUTO & LUCAS,
2009; COSTA, 2012).
Ao contrrio do que se pensa o olho no capaz de identificar e separar objetos de um
cenrio, o crebro tem a capacidade de dividir a informao por prioridade de ateno tarefa
sendo realizada, examinando o importante e suprimindo as outras informaesadvindas de
sensores musculares e os outros sentidos, que o ajudam a cruzar essas informaes e tomar
uma deciso (BRADISK, 2008).
A associao entre o olho e o crebro forma o sistema visual humano. Olhos apenas
captam os estmulos luminosos do mundo externo, similar a uma cmera. Atravs dos
elementos que compem a estrutura do olho, a luz focalizada em uma superfcie repleta de
receptores sensoriais (retina) que detectam a luz e converte em estmulos (sinas eltricos) que
so conduzidos ao crebro, gerando caractersticas iniciais de informaes como cor, forma,
tonalidade, entre outras (GONZALEZ, 2011; ALEXANDRE & TAVARES, 2007).
Como o sistema visual humano composto por dois olhos e devido ao seu
posicionamento, as imagens percebidas por ambos os olhos so ligeiramente diferentes,
conforme mostrado na Figura 1.
Na Figura 1 pode ser visto que existe um pequeno deslocamento lateral entre as
imagens adquiridas por ambos os olhos, quase imperceptvel se observado separadamente.
Contudo, esse deslocamento causado pela distncia entre os olhos que permite ao ser
humano ter uma observao tridimensional do mundo externo (BRADISK, 2008).
Devido importncia da percepo visual, o ramo da (VC) est em franca ascenso,
pois, tem como objetivo simular o processo de percepo humana atravs de sistemas que
capturam imagens atravs de cmeras, a processam e com isso, so capazes de identificar e
rastrear objetos de interesse (BOURCHARDT, 2006; DELAI & COELHO, 2010).
Uma subrea da VC, conhecida como Viso Estreo (VE), se dedica a desenvolver
tcnicas para percepo tridimensional de objetos atravs do processamento de imagens
obtidas a partir de duas cmeras posicionadas de forma adequada. Com base nas suas posies
e seus campos de viso, possvel determinar-se a posio de qualquer ponto neste espao,
desde que este ponto esteja presente em ambas asimagens capturadas (CORREA, 2004).
Existem diversos projetos, principalmente na rea da robtica, que utilizam a VE, com
a finalidade de simular a viso e percepo humana e detectar objetos,um exemplo disto o
trabalho de Kelber (2005) que tem como objetivo aplicar as tcnicas desenvolvidas para a VE
para o desenvolvimento de um veculo autmato, podendo detectar eventuais colises ou a
sada de pista(SEGUNDO, 2007; KELBER, 2005; CORRA, 2004).
Um exemplo similar o trabalho de Achtelik et al.(2009) que compara sensores e
cmeras estreo para utilizar na automao da navegao de um helicptero quadrotor,
fazendo-o navegar em ambientes internos estruturados e desconhecidos, mas seu objetivo
final a unio dessas tecnologias para um melhor desempenho do helicptero.
Outro exemplo o trabalho de Dias(2009), que utiliza uma cabea robtica para
simular o movimento da viso humana, juntamente com um mtodo conhecido como
Transformada Generalizada de Hough, desenvolvida originalmente por Hough(1959), que
utiliza uma imagem de referncia pr-determinada com a inteno de retirar informaes de
interesses a serem buscadas, tornando a deteco de objetos invarivel ao seu tamanho e
posio.
Seguindo esta linha de pensamento, no trabalho de Martins (2007) proposta a VE
como uma estratgia para resolver problemas na rea de realidade aumentada. Ela consiste no
alinhamento do mundo virtual com o mundo real atravs da calibrao de cmeras para
corrigir a distoro devido a lentes. Neste trabalho em questo mostrado que possvel
estabelecer uma correspondncia dos cantos do padro no mundo real com os da projeo na
imagem, podendo assim, realizar a estimao de distncia mesmo com cmeras com lentes
esfricas.
Existem tambm pesquisas para desenvolver e implementar novos algoritmos de VE, o
trabalho de Kelle (2012) prope um novo modelo de viso estreo densa, que procura realizar
uma estimao de distncia mais precisa analisando todos os pontos que compes as duas
imagens (KELLE, 2012).
Uma vertente tambm a rea de deteco de pessoas, no trabalho de Yahiaoui (2008)
ele apresenta um sistema para contagem de passageiros de nibus baseado em VE, em sua
pesquisa mostrou que possvel ter uma preciso de contagem de 99%, tendo seus testes
feitos com alguns vdeos em nibus.
Na mesma linha de pesquisa, na tese de Lefloch (2007) demonstrado que o a
deteco de profundidade utilizando cmeras com VE mais preciso que mtodos baseados
em feixe de laser, sensor de infravermelhos e sensor trmico. Contudo, uma desvantagem
deste tipo de abordagem o seu elevado custo computacional.O autor apresenta um sistema
com cmeras de baixo custo e pode detectar que mesmo assim os resultados so satisfatrios.
O trabalho de Oosterhout (2011) apresenta uma tcnica de deteco de pessoas atravs
do achado se suas cabeas com base em VEem trs ambientes distintos, podendo concluir que
mesmo em situaes de aglomerao o desempenho ainda era muito bom.
Pode-se perceber que ultimamente as empresas de cinema tambm utiliza ma VE para
produo de filmes 3D. As empresas utilizam uma tcnica quefilma a cena com uma lente e
utiliza um espelho para captar a mesma cena com o deslocamento necessrio para simular a
profundidade que o espectador percebe ao assistir um filme com esse formato (LANDIM,
2009).
Existem diversas implementaes de tcnicas de Viso Computacional (VC)
disponibilizadas em cdigos abertos ou bibliotecas comerciais. Por exemplo, a biblioteca
OpenCVproduzida pela Intel e implementa diversos algoritmos de VC incluindo tambm
algoritmos de VE. Esta biblioteca possui implementaes com elevada eficincia
computacional associada a eficaz processamento e, por causa disto, so bastante utilizadas em
diversos tipos de sistemas(DROPPELMANN, 2012).
O objetivo principal desta monografia realizar uma avaliaodas caractersticas dos
algoritmos de VE implementados em bibliotecas disponveis na internet para compreenso
dos ajustes necessrios para auxiliar o desenvolvimento de aplicaes que sejam capaz de
extrair informaes de profundidade das imagens adquidas. .
Essa monografia est dividida em seis captulos, este descreve brevementeos objetivos
e trabalhos com tcnicas de Viso Estreo (VE), no segundo captulo apresentada a
fundamentao necessria para compreender as tcnicas de VE que tornam possvel estimar
profundidade utilizando duas cmeras.
O terceiro captulo apresenta a metodologia utilizada para avaliao, bem como as
ferramentas utilizadas para o desenvolvimento do trabalho como, ambiente, tipos de cmera e
as formas de testes utilizadas, no quarto capitulo ser apresentado os resultados obtidos no
ltimo capitulo sero apresentadasas concluses do trabalho e perspectivas de trabalhos
futuros.
2. VISO ESTREO
Segundo Correa (2004), a VE um campo da Viso Computacional (VC) que se
dedica a desenvolver tcnicas para percepo tridimensional e segundo Azevedo e Conci
(2003) uma das formas de se obter essa percepo atravs da estreoscopia.
A estreoscopia consiste na viso de um mesmo foco por dois mecanismos de captura
de imagens (MCI), que combinados formam o chamado par estereoscpico. A captura da
imagem pode ser, posteriormente, reproduzida em softwares de modelagem virtual
(MALARD, 2008).
Em sua definio, a percepo estereoscpica a capacidade de ver uma imagem
tridimensional a partir de duas imagens separadas adquiridas no mesmo ambiente sob pontos
de vista diferentes com um foco em comum, conforme mostrado na Figura 2 (PEREIRA,
2013).
Apesar de cada cmera ter seu campo de viso, a partir da combinao das
informaes em comum de ambas as cmeras, conforme mostrado na regio cinza escura que
torna possvel a identificar a profundidade.
Segundo Pereira (2013), a estreoscopia torna possvel a percepo de profundidade
bem mais precisa que em cmeras monoculares. Contudo, Malard (2008) ressalta que somente
a juno do par estereoscpico no suficiente para a obteno de informaes relativas
distncia, posies e tamanhos de objetos.
Para que seja possvel obter estas informaes alguns fatores devem ser levados em
considerao, como a iluminao e sombras, ou que compreende m a forma e volume do
objeto, bem como a ocluso. Este conjunto de efeitos facilitam a identificao relativa dos
objetos e seu tamanho e otimizam o funcionamento dos algoritmos de VE e(MALARD,
2008).
Segundo Trucco e Verri (1998), a VE deve resolver dois problemas da VC, o primeiro
conhecido por correspondncia que consiste em determinar qual item no MCI esquerdo
corresponde ao mesmo item no MCI direito enquanto que o segundo problema o chamado
reconstruo, que seria o processo de reconstruo da imagem a partir do par estreo. O
primeiro possui dificuldades relacionadas com a existncia de algumas partes da cena em
apenas um dos MCIs, portanto a VE deve ser capaz de identificar as partes da imagem que
no so abrangidas pelo outro MCI.
Com base nas regies existentes em ambas as imagens, detectadas pelo primeiro
processo, computada a diferena da posio dos objetos em cada MCI, conhecida como
disparidade (TRUCCO & VERRI, 1998).
O foco visual, representado pela letra D na Figura 4 o foco visual e geralmente est
localizado sobre o objeto de interesse em primeiro plano. Atravs desses parmetros definida
a orientao da cmera e est relacionada determinao do campo de viso da cmera
(AZEVEDO e CONCI, 2003).
Alm destes parmetros comum definir caractersticas de movimentao da cmera,
apresentadas como as letras A, B e C. Atravs destes pode-se modificar o campo de viso de
uma cmera sem mudar seu posicionamento (x, y, z).
A letra A define o movimento de inclinao, tambm conhecido como tilt, da cmera,
podendo rotacionar o vetor de direo (vector up) da cmera em relao ao eixo y,
similarmente a cabea do ser humano movendo de baixo para cima ou vice-versa.
J a letra B define o movimento panormico, conhecido como pan, podendo rotacionar
o vetor de direo em relao ao eixo z, similar ao movimento da cabea do ser humano ao
movimentar a cabea da esquerda para a direita. A letra C define a movimentao de
aproximao e distanciamento da cmera em relao ao foco visual.
10
Alm disto, possvel ter uma percepo de aproximao e distanciamento devido sua
relao direta com o tamanho visto pela cmera. Ao aproximar um objeto, seu tamanho
aumenta, j quando ele diminui, o tamanho percebido diminui. Fazendo este tipo de anlise, a
percepo de distncia pode ser feita monoscopicamente, de mane ira aproximada (PEREIRA,
2013).
a distncia entre as estaes de exposio das cmeras no deve ser muito grande
em relao distncia objeto/cmera e;
11
Este tipo de cmera no possui uma lente, portanto, a imagem dos objetos gerada
somente a partir convergncia da luz refletida sobre o centro de projeo (O), localizado na
origem do sistema de coordenadas para fins de simplificao da notao, conforme mostrado
na Figura 6.
Segundo Santos (2012), devido inexistncia de lente e por consequente inexistncia
de distoro na formao da imagem, a determinao dos parmetros intrnsecos
simplificada, pois o nico fenmeno que deve ser avaliado a projeo de perspectiva. Este
tipo de projeo possui apenas um parmetro que consiste no comprimento focal (TRUCCO e
VERRI, 1998).
O plano de projeo, tambm conhecido como plano da imagem ou plano focal,
posicionado a frente do centro de projeof (Z = f), onde f a distncia focal. A linha que
passa por O e perpendicular ao plano da imagem chamada de eixo principalou eixo ptico
e o ponto onde o eixo principal encontra o plano da imagem chamado de ponto principal
(SANTOS. 2012).
Ao utilizar esse modelo de cmera e assumir que o centro de projeo est na origem
do sistema de coordenadas no plano tridimensional e o eixo ptico colinear ao eixo Z,
apresentado na equao 1,com isto, tem-se que a projeo de um ponto um ponto no espao
com coordenadas (X, Y, Z)T mapeado para um ponto no plano da imagem (u,v)T e pode ser
obtido atravs de semelhanas de tringulos e que resumidamente apresentado atravs de
(SANTOS, 2012, RUDEK, 2006, TRUCCO e VERRI, 1998):
12
= ,
(1)
(2)
= ,
(3)
= = ,
= = .
(4)
(5)
= ,
(6)
= .
(7)
Segundo Trucco e Verri (1998), em vrios casos, a lente introduz na imagem uma
distoro que pode ser percebida na periferia da imagem, apresentado na Figura 6.
Uma forma para modelar essas distores usando um modelo radial simples. Se
(Xd,,Yd ), representa as coordenadas com distoro radial, tem-se que a correo da posio
definida atravs das equaes:
= 1 + 1 2 + 2 4 ,
(8)
13
= 1 + 1 2 + 2 4 ,
2
em que, r = Xd +
Yd2 ,
(9)
destas equaes, pode-se perceber que a distoro causa um deslocamento de radial dos
pontos da imagem. Estes deslocamentos so nulos nulo no centro da imagem (x d = 0 ou yd
= 0) e vai aumentando conforme a coordenada vai distanciando do centro.
Normalmente, os parmetros k 1 e k 2 so muito pequenos e comumente ignorados, se
uma preciso alta no necessria em toda a imagem ou quando os pixels da periferia so
descartados.Neste caso, k 2 definido como zero e k 1 o nico parmetro a ser estimado no
modelo de distoro radial, sek 2 muito maior que k 1 , a magnitude da distoro geomtrica
depende da qualidade da lente a ser utilizada, como regra geral a mdia de qualidade e
tamanho quinhentos de altura por quinhentos de largura (500 x 500) (TRUCCO e VERRI,
1998).
Segundo Santos (2012), um modelo matricial facilita a representao computacional,
supondo que os pontos em um espao tridimensional e os pontos no plano de uma imagem
so representados por coordenadas equivalentes (Homogneo).
Assumindo assim asequaes necessrias para determinar os parmetros intrnsecos
apresentados na equao 1 podem ser reescrita de forma matricial, levando em considerao
que o fator de escala homogneo (FEH) dado pelo Mapeamento da Cmera Pinhole = Z,
dado por:
= 0
1
0
0
0
0
0
0
1
(10)
0 0
= 0 0 ,
1
0 0 0 1 1
(11)
14
0 0
= 0 0 .
1
0 0 0 1
1
(12)
= 0
1
0 0
0
0
0
1
= | ,
3
(13)
(a)
(b)
Figura 8: a) Modelo chessboard utilizado co mo padro para calibrao de cmeras b) Imagem adquirida
atravs de cmera co m d istoro.
15
= | ,
(14)
16
2.4. RETIFICAO
A retificao simplifica os clculos associados a algoritmos de VE, a imagem obtida
substituda por uma figura equivalente projetada em um plano de imagem comum, paralelo
base de juno dos dois centros ticos, conforme apresentado na Figura 10 (SOUSA
SEGUNDO, 2007).
Neste modelo, a linha que liga os dois centros de Projeo das duas cmeras
denominada linha de base, ou baseline. A interseo da baseline com o plano de imagem
conhecida como epipole, sendo a imagem do centro de projeo de uma das cmeras feita
pela outra cmera (FARIAS, 2006).
17
Este mesmo processo pode ser implementado pela projeo da imagem original em um
novo plano de imagem, considerando os dois planos da imagem e so projetos sobre um
plano comum = , a imagem retificada facilmente construda, considerando que a
imagem de entrada seja um poliedro e usando mapeamento de texturas para renderizar a
projeo dessa rede em um plano = (SOUSA SEGUNDO, 2007).
Existem duas possibilidades relacionadas com a escolha de um plano de imagem
retificado. A primeira consiste na distncia entre esse plano e a linha de base, o que
irrelevante, desde que se modifique somente a escala da imagem. A segunda consiste em um
balano efetivo pela escala invertida dos eixos de coordenadas da imagem e a direo do
plano retificado normal no plano perpendicular base, determinado a partir daescolha de um
plano paralelo linha onde as duas retinas originais intersectam-se, o que minimiza a
distoro associada com o processo de projeo (SOUSA SEGUNDO, 2007).
Trucco e Verri (1998) sugere um algoritmo para tratar a retificao, que possui quatro
etapas; girar a cmera da esquerda, de modo que sua epipole v em direo ao infinito, no
eixo horizontal; aplicar a mesma rotao na cmera da direita, de modo a recuperar a
geometria original; girar a cmera da direita em R(Matriz 3x3); ajustar escala de ambas as
cmeras para o frame desejado.
2.5. RECONSTRUO 3D
A reconstruo 3D consiste em obter as informaes tridimensionais dos objetos
observados em planos de imagens bidimensionais. Por exemplo, o principal problema para se
reconstruir um solido conhecer sua forma geomtrica.A partir de sua projeo no plano da
imagem formada por duas cmeras, pode-se descobrir a interseo no espao de duas retas e
assim, saber o resultado da transformao dos pontos, projetados nas cmeras, tornando
possvel convert-los em pontos do espao tridimensional. (RUDEK, 2006).
A reconstruo 3D pode ser obtida a partir do que se conhece sobre os parmetros
disponveis no sistema, em trs situaes (TRUCCO & VERRI, 1998):
18
19
20
2.6.1. CALIBRAOESTREO
Segundo Badski (2008), a calibrao estreo um processo de clculo da relao
geomtrica entre as duas cmeras no espao, esse clculo depende de encontrar a matriz de
rotao e o vetor de translao de ambas as cmeras. Existem muitas configuraes que
podem ser feitas para a calibragem, o mais comum e simples descobrir os raios principais
que se cruzam no infinito.
Segundo Madalena (2011), com a posio e direcionamento das cmeras conhecidos,
possvel determinar a posio de qualquer ponto nesse espao, desde que esse ponto esteja
localizado em ambas as imagens capturadas pelas cmeras, sugerindo que a triangulao pode
calcular esses pontos.
Segundo Badski (2008) e Madalena(2011), os parmetros de calibrao, matriz de
rotao e vetor de translao, podem ser encontrados ao utilizar um chessboard, e ento
aplicar a cada cmera, Santos (2012) apresenta um modelo matemtico, que pode ser visto no
captulo 2 deste trabalho, para demonstrar o funcionamento e importncia do chessboard para
a calibrao.
21
22
3. MATERIAIS E METODOLOGIA
Neste captulo so apresentados os recursos utilizados para a realizao da avaliao
de implementaes tcnicas de Viso Estreo,desde as descries das ferramentas e
aplicaes, cmeras utilizadas, ambiente de testes e metodologia utilizada para realizao dos
testes.
3.1. OPENCV
Segundo Marengoni (2009), a OpenCV (Open Source Computer Vision) uma
biblioteca de programao, com cdigo aberto, desenvolvida originalmente pela Intel, capaz
de implementar praticamente todas as operaes relacionadas a cinco grupos de funes:
Processamento de Imagens, Analise Estrutural, Analise de Movimente e Rastreamento de
Objetos, Reconhecimento de Padres e Calibrao de Cmera e Reconstruo 3D, est
disponvel na internet juntamente com seu manual de referncia.
Bradski (2008) apresenta em seu livro, Learning OpenCV, a utilidade dessa biblioteca
para a rea de PDI, incluindo alguns exemplos de cdigo, em Linguagem C-ANSI, para
facilitar o entendimento.
3.2. GIMP
O GIMP uma ferramenta de cdigo aberto, que possui caractersticas de
manipulao grfica, desenvolvido para plataforma Linux e mais recentemente para
plataforma Windows (GIMP, 2013).
Segundo Elsamuko (2013), utilizando duas imagens de um mesmo ambiente, seguindo
o modelo de imagem estreo apresentado por Malard (2008), o algoritmo utiliza a primeira
cmera na captura de um pixel e os arredores da imagemprocurando correspondncias na
imagem da segunda cmera, sugerido que no se utilize valores grandes, nos tamanhos dos
frames, pois esse algoritmo no consegue interpretar todo o contedo da imagem demorando
muito para processar e o mapa de profundidade de retorno ter algumas falhas em algumas
reas,.
23
Durante a realizao dos testes foi utilizada aWEBCAM Logitech C210, apresentada na
Figura 12, com as seguintes especificaes: Resoluo de 1.3 megapixels, Resoluo mximo
de Imagem 640x480 pixels, Conexo USB, Clique para Notebook, Led de Iluminao,
Microfone Integrado de dimenses 2,8 cm de altura, 1,5 cm de comprimento e
6,8cmprofundidade (LOGITECH, 2013).
(a)
(b)
24
(a)
(b)
Figura 14: Aquisio de imagens com cmeras prximas. a) Imagem da cmera esquerda e b) Imagem da cmera
direita.Fonte: elaborao prpria.
Figura 15:Aquisio de imagens com cmeras distantes. a) Imagem da cmera esquerda e b) Imagem da cmera
direita.Fonte: elaborao prpria.
Todos os testes foram feitos no mesmo ambiente, para evitar alteraes nas condies
de aquisio.
25
adquiridas cmeras, caso no estejam bem alinhados, posiciona-se as cmeras de modo que
fiquem alinhadas.
Aps essa verificao aplica-se uma funo da biblioteca OpenCV, capaz de verificar
os pontos de correspondncia entre as imagens geradas utilizando uma imagem dochessboard,
apresentada na Figura 8a, esta imagem foi impressa em uma folha de papel A4, em que cada
quadrado do tabuleiro possui uma reade 35 milmetros.
A partir destas informaes, realizado o processo determinao dos parmetros da
cmera, que pode ser utilizada para corrigir a distoro das lentes, para, ento, poder realizar a
calibrao das cmeras.
Aps a realizao da 1 calibrao criado um arquivo que armazena os valores da
matriz de calibrao. Nas prximas execues do sistema, este arquivo utilizado para evitar
a realizao de calibrao novamente, pois, estes parmetros sero sempre os mesmos a no
ser que exista uma modificao da posio relativa entre cmeras. Com base neste conjunto
de informaes so realizados os processamentos devidos para estimar o mapa de
profundidade.
Por fim, na terceira estratgia realizado um processo conhecido como retificao em
conjunto aos demais processos da estratgia anterior, este processo melhora a qualidade da
imagem antes de ser trabalhada para propiciar um melhor resultado do processamento.
Pode-se ser feita aps a calibrao das cmeras, utilizando as informaes da matriz de
calibrao para remover a distoro ptica de cada uma das cmeras eobter um mapa de
profundidade mais preciso e a sem a necessidade dessa calibrao, caso exista alguma
alterao nas posies das cmeras.
Com base nas metodologias apresentadas foram realizados testes e seus resultados
sero apresentados no captulo a seguir.
26
4. RESULTADOS
Neste captulo so apresentados os resultados dos testes realizados segundo a
metodologia descrita no captulo anterior.
(a)
(b)
(c)
Figura 16: imagem da cmera a) d ireita b) esquerda e c) resultado do processamento feito atravs do GIMP.
27
(a)
(b)
Figura 17: Resultadodepthmap GIMP
(a)
(b)
(d)
(c)
(e)
28
Como sugerido por Elsamuko (2008), o desempenho do depthmap foi melhor que o da
implementao feita no GIMP, fornecendo uma noo de distncia superficial, mas a
qualidade do resultado ainda no era satisfatrio para a interpretao da imagem
posteriormente.
29
(a)
(b)
Figura 20: Imagens adquiridas pela cmera (a) direita e (b) esquerda.
(a)
(b)
Figura 21: Deteco do tabuleiro de xad rez na cmera (a) Direita e (b) Esquerda.
30
4.3.
RETIFICAO ESTREO
Apesar do OpenCV possuir duas implementaes da tcnica de retificao, durante os
testes desta monografia foi realizado apenas os testes com a implementao que no utiliza a
calibrao.
O resultado da estimao do mapa de profundidade (obtido a partir das imagens
retificadas) mostrado na Figura 23.Observa-se pelos resultados que o mapa de profundidade
bastante preciso, contudo, a rotina de retificao possui um alto custo computacional (1,2
segundos para processar as 2 imagens).
Neste caso, a realizao de testes em tempo real ficou impossvel devido ao tempo de
processamento que ele necessita. Este alto custo computacional causado devido no
utilizao dos parmetros intrnsecos fsicos das cmeras.
31
Figura 23: Resultado do mapa de Profundidade com retificao sem informaes da calib rao.
Os
algoritmos
imagens
de
teste
fornecidas
pelos
32
5. CONCLUSO FINAL
Nesta monografia foi apresentada a reviso bibliogrfica das tcnicas de viso estreo
e foram realizados diversos testes com implementaes de tcnicas de viso estreo
disponveis em plug-ins do software de processamento de imagem GIMP e disponveis na
biblioteca do OpenCV.
Os resultados do processamento feito atravs do plug- in do GIMP no conseguiu
atingir nenhum resultado positivo enquanto que os algoritmos de Autocalibrao e Retificao
sem Calibrao disponveis no OpenCV se mostraram promissores e visto que em outros
trabalhos so muito utilizados e tem um bom desempenho, apesar de no ter obtido um mapa
de profundidade com a cmera utilizada no teste.
A proposta de implementao de um sistema com Autocalibrao e Retificao se
mostra ser bem interessante, pois se melhorar o sistema de retificao ao ponto proposto no
seu algoritmo, os parmetros salvos pela Autocalibrao aumentaro muito o desempenho,
sendo possvel exibir um mapa de Profundidade de alta preciso para uma cena em tempo
real.
As principais contribuies deste trabalho so:
33
6. REFERNCIAS BIBLIOGRFICAS
AMSTEL, Frederick. Reconceitualizando a Interao. Disponvel em:
http://usabilidoido.com.br/reconceitualizando_a_interacao.html Acesso em: 25/06/2012.
ALMEIDA JUNIOR, Jos Viso Estreo Multiplataforma, Resumo do Projeto Final de
graduao em Engenharia Eletrnica e Computao, UFRJ, 2008.
AZEVEDO, Eduardo, CONCI, Aura,COMPUTAO GRFICA GERAO DE
IMAGENS, Ed. CAMPUS, 8edio, 2003.
BRADSKI, Gary, KAEHLER, Adrian, Learning OpenCV, 2008.
CARVALHO, Delmar. A Hipe rmdia. Disponvel em:
http://www.eps.ufsc.br/disserta98/delmar/cap2.htm Acesso em: 25 jun.2012.
CORRA, Fabiano Rogrio(2004), Grades de Evidncia com Viso Estreo
Omnidirecional para Navegao de Robs Mveis. Projeto de Qualificao de Mestrado
em Engenharia Mecnica da Universidade de So Paulo, So Paulo, 2004
COSTA, R. C. (2009). Desenvolvimento de Mtodos de Interao para Sistemas
Embarcados Utilizando Viso Computacional. Projeto de Qualificao de Doutorado em
Engenharia de Teleinformticada Universidade Federal do Cear, Fortaleza, 2009.
DIAS, Eduardo Tondin Ferreira, NETO, Hugo Vieira, NUNES, Joo Felipe Calvo,
Localizao de Objetos Utilizando Uma Cabea Robtica Com Viso Estreo.Artigo
2009.
ELSAMUKO,
GIMP
PLUGIN
REGISTRY,
http://registry.gimp.org/node/10217, Data de Acesso: 18/10/2013.
Disponvel
em:
34
LEFLOCH, Damien, Real-Time People Counting System using Video Came ra, Projeto de
Qualificao de Mestrado em Cincias da Computao, Imagem e Inteligncia Artificial da
UFR Sciences et Techniques Batiment Mirande Universit de Bourgogne BP 47870.
21078 Cedex France, 2007
LOGITECH, WEBCAM Logitech C210 MANUAL GUIDE, Disponvel em:
http://www.logitech.com/assets/33983/webcam-c210-gsw.pdf, Data de Acesso: 25/11/2013.
LOURAKIS, Manolis, ZABULIS, Xenophon, Accurate Scale Factor Estimation
in 3D Reconstruction, Artigo, Institute of Computer Science, Foundation for Research and
Technology - Hellas (FORTH) Vassilika Vouton, P.O.Box 1385, GR 711 10, Heraklion, Crete,
Greece, 2013.
35