Você está na página 1de 94

MC949 - Visão Computacional

Desafios e Oportunidades

Aula #1

Prof. Dr. Anderson Rocha


Microsoft Research Faculty Fellow
Reasoning for Complex Data (RECOD) Lab.
Instituto de Computação, Universidade Estadual de Campinas (Unicamp)

anderson.rocha@ic.unicamp.br
http://www.ic.unicamp.br/~rocha
Cafe Umbrellas, Angola
Fotografia de Volkmar K. Wentzel, National Geographic

A. Rocha, 2012s1 – Visão Computacional (MC949)


Cloaked Women, Iran
Fotografia de Maynard Owen Williams, National Geographic

A. Rocha, 2012s1 – Visão Computacional (MC949)


Mohawk River, New York
Fotografia de B. Anthony Stewart, National Geographic

A. Rocha, 2012s1 – Visão Computacional (MC949)


Stone Bridge, Scotland
Fotografia de B. Anthony Stewart, National Geographic

A. Rocha, 2012s1 – Visão Computacional (MC949)


Lancashire, England
Fotografia de Clifton R. Adams, National Geographic

A. Rocha, 2012s1 – Visão Computacional (MC949)


Jupiter Temple, Lebanon
Fotografia de Maynard Owen Williams, National Geographic

A. Rocha, 2012s1 – Visão Computacional (MC949)


Storm, Haiti
Fotografia de B. Anthony Stewart, National Geographic

A. Rocha, 2012s1 – Visão Computacional (MC949)


Magnified Sugar Crystals
Fotografia de Victor R. Boswell, Jr, National Geographic

A. Rocha, 2012s1 – Visão Computacional (MC949)


Great Pyramid and Sphinx, Giza
Fotografia de Hans Hildenbrand, National Geographic

A. Rocha, 2012s1 – Visão Computacional (MC949)


Grape Harvest, France
Fotografia de Gervais Courtellemont, National Geographic

A. Rocha, 2012s1 – Visão Computacional (MC949)


A photograph can be an instant of life captured for eternity that will never
cease looking back at you (Brigitte Bardot)

A photograph is a secret about a secret. The more it tells you the


less you know (Diane Arbus)

A photograph is always invisible, it is not it that we see


(Roland Barthes)

A picture is worth a thousand words (Popular Adage)

A. Rocha, 2012s1 – Visão Computacional (MC949)


Agenda
Agenda

‣ Computação Visual ‣ Computação Visual & Recod

‣ Visão Computacional ‣ Timeline

‣ Aplicações Industriais ‣ Video Demos

‣ Aplicações para Consumidores ‣ Conclusões

A. Rocha, 2012s1 – Visão Computacional (MC949) 14


A. Rocha H. Pedrini J. Wainer
E. Valle
– Visão – Computação Gráfica – Inteligência Artificial
– Aprendizado de Máquina
– Aprendizado de Máquina – Proc. de Imagens – Informática Médica
– Rec. de Informação
– Computação Forense – Visualização de Dados – Informática e Sociedade

R. Torres S. Goldenstein
– Bancos de Dados – Visão
– Rec. da Informação – Computação Gráfica
– Proc. de Imagens – Computação Forense

A. Rocha, 2012s1 – Visão Computacional (MC949) 15


Algumas Parcerias

BROWN

A. Rocha, 2012s1 – Visão Computacional (MC949) 16


Computação
Visual
Computação Visual

‣ Novo campo de pesquisas


‣ Inter-disciplinar

A. Rocha, 2012s1 – Visão Computacional (MC949) 18


Paradigma de 4 universos

Físico Quantidades (área, tamanho)

Matemático Números reais 1210

Representação Ponto Flutuante 1.2 x 10

Implementação Padrão IEEE Mantissa/Expoente

© Gomes & Velho (1995)

A. Rocha, 2012s1 – Visão Computacional (MC949) 19


Computação Visual
Modelagem Geométrica

Modelos

Análise de Síntese de
Imagem Imagem

Imagens

Processamento de Imagens
© Gomes & Velho (1995)

A. Rocha, 2012s1 – Visão Computacional (MC949) 20


Adicionando tempo...
Controle de Movimento

Modelos Dinâmicos

Análise de
Animação
Movimento

Imagens em Movimento

Processamento de Vídeos
© Gomes & Velho (1995)

A. Rocha, 2012s1 – Visão Computacional (MC949) 21


Visão holística

‣ Disciplinas correlacionadas
• Imagens e Modelos

A. Rocha, 2012s1 – Visão Computacional (MC949) 22


Visão holística
‣ Utilização
• Visualização Científica
• Engenharia, CAD
• Medicina
• Entretenimento (efeitos especiais)
• Multimídia
• Realidade Virtual
A. Rocha, 2012s1 – Visão Computacional (MC949) 23
Pleno crescimento

‣ Diversos problemas em aberto


‣ Interesse do mercado
‣ Boa remuneração
‣ Área dinâmica
‣ Nessa apresentação, foco em Visão Computacional
A. Rocha, 2012s1 – Visão Computacional (MC949) 24
Visão
Computacional
Visão Computacional

‣ Como humanos, percebemos a estrutura do


mundo 3-D à nossa volta sem dificuldades

‣ Ao analisar imagens, facilmente contamos,


destacamos e reconhecemos pessoas

‣ Podemos até adivinhar sentimentos, emoções


nos indivíduos em uma foto

A. Rocha, 2012s1 – Visão Computacional (MC949) 26


SVH e as variações súbitas de transparência e sombra
© Szeliski (2010)

A. Rocha, 2012s1 – Visão Computacional (MC949) 27


Visão Computacional

‣ Por décadas, pesquisadores tem tentado


entender o SVH

‣ Problema ainda sem solução

A. Rocha, 2012s1 – Visão Computacional (MC949) 28


Ilusões

© Müller-Lyer
© Hany Farid

A. Rocha, 2012s1 – Visão Computacional (MC949) 29


Ilusões

© Ted Adelson

A. Rocha, 2012s1 – Visão Computacional (MC949) 30


Ilusões

A. Rocha, 2012s1 – Visão Computacional (MC949) 31


Visão Computacional

‣ Paralelo às pesquisas de psicólogos e cientistas a


respeito do SVH, pesquisadores de VC tem
pesquisado e desenvolvido
• Técnicas para recuperar informações 3D a
partir de imagens

A. Rocha, 2012s1 – Visão Computacional (MC949) 32


Visão Computacional

‣ Como as máquinas podem entender o mundo


visual?

‣ VC pode ser vista como um processo de


inferência a partir de dados ruidosos e incertos

‣ Inferência utilizando modelos probabilísticos,


estatísticos e baseados em dados

A. Rocha, 2012s1 – Visão Computacional (MC949) 33


Visão Computacional
© Kirkh – DevianArt (2011)

Como fazer as máquinas entenderem o mundo visual?

A. Rocha, 2012s1 – Visão Computacional (MC949) 34


Visão Computacional
‣ Inclui
• Processamento de Imagens (segmentação,
agrupamento, detecção de bordas)
• Reconhecimento e detecção
• Estimação de Movimento
• Estimação de Estrutura a partir de Movimento
A. Rocha, 2012s1 – Visão Computacional (MC949) 35
Visão Computacional
‣ Hoje conseguimos
• Computar o modelo 3D de uma cena a partir de
milhares de imagens
• Criar superfícies 3D densas
• Rastrear pessoas
• Reconhecer objetos, pessoas, cenas
• (...)

A. Rocha, 2012s1 – Visão Computacional (MC949) 36


© Snavely, Seitz, Szeliski (2006) © Goesele, Snavely, Curlessetal (2007)

© Sidenbladh, Black, Fleet (2000) © Sivic, Zitnick, Szeliski (2006)

Exemplo de aplicações e algoritmos presentes em Computação


Visual – SFM, Stereo Matching, Rastreamento, Reconhecimento

A. Rocha, 2012s1 – Visão Computacional (MC949) 37


Visão Computacional

‣ Interpretação de imagens e vídeos

• Criança de 2 anos vs.


computadores

• Por exemplo, contar


objetos em uma imagem

© Naturfoto

A. Rocha, 2012s1 – Visão Computacional (MC949) 38


Visão Computacional
‣ Por que Visão Computacional é tão difícil?
• Problema inverso (buscamos recuperar
variáveis desconhecidas a partir de
informações insuficientes para modelar
totalmente o problema
• Precisamos recorrer a modelos físicos e
probabilísticos para desambiguar possíveis
soluções

A. Rocha, 2012s1 – Visão Computacional (MC949) 39


Visão Computacional
‣ Modelos que usamos se baseiam, por exemplo, em
• Física
‣ Radiometria
‣ Ótica
‣ Sensores

• Computação Gráfica

A. Rocha, 2012s1 – Visão Computacional (MC949) 40


Visão Computacional

‣ Ambos as áreas modelam


• como objetos se movem e animam
• como a luz é refletida de uma superfície,
espalhada em um ambiente, refratada nas
lentes de uma câmera ou olho humano,
projetada em uma superfície etc.

A. Rocha, 2012s1 – Visão Computacional (MC949) 41


Visão Computacional

‣ Em VC, estamos tentando fazer o inverso:


• Descrever o mundo que vemos em uma ou
mais imagens (vídeos) e reconstruir suas
propriedades tais como: forma, iluminação,
distribuição de cor.

A. Rocha, 2012s1 – Visão Computacional (MC949) 42


Visão Computacional
‣ Apesar de difícil, a boa notícia é que Visão Computacional
é utilizada hoje em muitas aplicações industriais

• OCR • Medicina

• Inspeção por Máquina • Segurança Automotiva

• Varejo • Cinema

• Fotogrametria • Vigilância

• Biometria

A. Rocha, 2012s1 – Visão Computacional (MC949) 43


Aplicações
Industriais
Aplicações Industriais

OCR Inspeção Mecânica


© http://yann.lecun.com/exdb/lenet/ © http://www.cognitens.com

A. Rocha, 2012s1 – Visão Computacional (MC949) 45


Aplicações Industriais

Segurança Automotiva Monitoramento de Tráfego


© http://www.mobileye.com/ © http: //www.honeywellvideo.com/

A. Rocha, 2012s1 – Visão Computacional (MC949) 46


Aplicações Industriais

Varejo Imagens Médicas


© http://www.evoretail.com/ © http://www.clarontech.com/

A. Rocha, 2012s1 – Visão Computacional (MC949) 47


Aplicações para
Consumidores
Visão Computacional
‣ Aplicações (para consumidores)
• Stitching • Photo-based Walkthroughs

• Bracketing • Detecção de Faces

• Morphing • Autenticação Visual

• Modelagem 3D • (...)

• Estabilização de Vídeos

A. Rocha, 2012s1 – Visão Computacional (MC949) 49


Aplicações – Consumidores
© Szeliski & Shum (1997)

Stitching de Imagens

A. Rocha, 2012s1 – Visão Computacional (MC949) 50


Aplicações – Consumidores
Extraído de Szeliski (2010)

Exposure bracketing

A. Rocha, 2012s1 – Visão Computacional (MC949) 51


Aplicações – Consumidores
© Gomes, Darsa, Costa et al. (1999)

Morphing

A. Rocha, 2012s1 – Visão Computacional (MC949) 52


Aplicações – Consumidores
© Sinha, Steedly, Szeliski et al. (2008)

Modelagem 3-D

A. Rocha, 2012s1 – Visão Computacional (MC949) 53


Computação Visual
&
Recod
Categorização de Imagens

© Montagem de A. Rocha

A. Rocha, 2012s1 – Visão Computacional (MC949) 55


Categorização de Imagens
Artes vs. Fotografia CGI vs. Fotografia?

Indoor vs. Outdoor?

Arte, Indoor, Outdoor, ou CGI?

© Montagem de A. Rocha

A. Rocha, 2012s1 – Visão Computacional (MC949) 56


Multi-classificação
© Montagem de A. Rocha

A. Rocha, 2012s1 – Visão Computacional (MC949) 57


Multi-classificação
© Montagem de A. Rocha

A. Rocha, 2012s1 – Visão Computacional (MC949) 58


Computação Forense
‣ Evidências Digitais
• Aquisição
• Organização
• Preservação
• Análise
• Apresentação
A. Rocha, 2012s1 – Visão Computacional (MC949) 59
Análise Forense Digital

© Montagem de A. Rocha

A. Rocha, 2012s1 – Visão Computacional (MC949) 60


Análise Forense Digital
i n al
O rig

ls a
F a

Análise Forense de Imagens – Fake or Real?

© Montagem de A. Rocha

A. Rocha, 2012s1 – Visão Computacional (MC949) 61


Análise Forense Digital

+ \
=

Análise Forense de Imagens – Detecção de Mensagens Escondidas

© Montagem de A. Rocha

A. Rocha, 2012s1 – Visão Computacional (MC949) 62


Análise Forense Digital
Fake Fake

© Autodesk © Autodesk © Autodesk

Fake

© Autodesk © Autodesk © Autodesk

A. Rocha, 2012s1 – Visão Computacional (MC949) 63


Análise Forense Digital

© A. Rocha

A. Rocha, 2012s1 – Visão Computacional (MC949) 64


Análise Forense Digital

© A. Rocha

A. Rocha, 2012s1 – Visão Computacional (MC949) 65


Análise Forense Digital

© A. Rocha

A. Rocha, 2012s1 – Visão Computacional (MC949) 66


Reconhecimento de Faces
Classificador 100M Classificador 200M
Região Candidata (RC)
RC com Operador

Extr. de Carac.

Negativo Positivo
Decisão Decisão

Classificador 0.089nits Classificador 0.07nits Classificador SVM

© Montagem de A. Rocha

A. Rocha, 2012s1 – Visão Computacional (MC949)


Reconhecimento de Faces

@200 metros
© A. Rocha et al. (2009)

A. Rocha, 2012s1 – Visão Computacional (MC949) 68


Predição de Falhas e Fusão
Recognition System Generic Predictor

Scores Prediction Done


Success?

Failure
Request Operator
+
Perform Acquire More
...
etc.
Interaction Fusion Data
Re-Start

© Scheirer, Rocha, Michaels, Boult (2011)

A. Rocha, 2012s1 – Visão Computacional (MC949)


Como fazemos?

‣ Duas formas
• Aprendizado de Máquina
• Métodos Estatísticos (EVT) *

* Scheirer, Rocha and Boult, USPTO Patent 61/172,333


A. Rocha, 2012s1 – Visão Computacional (MC949) 70
Recuperação de Informação
Interface

Inserção Especs. da Consulta Visualização

Padrão de Consulta Imagens Similares

Ordenação
Coleção de Imagens
Extração de Vetor
de Características
Medida de Similaridade
Módulo de Proc. de Consulta

Imagens e Vetores de
Características
© Montagem de A. Rocha

A. Rocha, 2012s1 – Visão Computacional (MC949) 71


Medical Informatics

vs.

Projeto: Detecção de Retinopatia Diabética

A. Rocha, 2012s1 – Visão Computacional (MC949) 72


Filogenia de Imagens e Vídeos

‣ Documentos online estão em constante evolução


‣ Podemos
online?
detectar a evolução de um documento

A. Rocha, 2012s1 – Visão Computacional (MC949) 16


Filogenia de Imagens e Vídeos

‣ Aplicações
• Forense
• Segurança
conteúdo)
(direção de distribuição ilegal de

• Copyright

A. Rocha, 2012s1 – Visão Computacional (MC949) 17


Filogenia de Imagens e Vídeos

© Joly et al. (2007)

A. Rocha, 2012s1 – Visão Computacional (MC949) 18


Timeline
Timeline

© Szeliski (2010)

A. Rocha, 2012s1 – Visão Computacional (MC949) 77


+ Abstração

Imagens Geometria Aparência


© Szeliski (2010)

A. Rocha, 2012s1 – Visão Computacional (MC949) 78


Vídeo Demos
© Omerkkk1 – Youtube User (2010)

Demo #1: Rastreamento de Jogadores de Futebol

A. Rocha, 2012s1 – Visão Computacional (MC949)


© Yous & Laga (2010)

Demo #2: Rastreamento e Vigilância

A. Rocha, 2012s1 – Visão Computacional (MC949)


© MB5759 – Youtube User (2007)

Demo #3: Sistemas de Inspeção de Máquinas

A. Rocha, 2012s1 – Visão Computacional (MC949)


© Albrechts (2010)

Demo #4: Structure from Motion (SFM)

A. Rocha, 2012s1 – Visão Computacional (MC949)


© Barnes et al. (2010)

Demo #5: Seam Carving, Retargetting e Reshuffling

A. Rocha, 2012s1 – Visão Computacional (MC949)


© Frahm et al. (2010)

Demo #6: 3-D Reconstruction – Rome

A. Rocha, 2012s1 – Visão Computacional (MC949)


© ProPics

Demo #7: Gigapixel Panoramas

A. Rocha, 2012s1 – Visão Computacional (MC949)


© 360 Cities

Demo #8: Gigapixel Panoramas

A. Rocha, 2012s1 – Visão Computacional (MC949)


© Microsoft

Demo #9: Navegando por Fotografias – Photosynth

A. Rocha, 2012s1 – Visão Computacional (MC949)


© Microsoft

Demo #10: Gaming – Kinect

A. Rocha, 2012s1 – Visão Computacional (MC949)


Conclusões
Conclusões

‣ Como vimos, Computação Visual é uma área com


• diversas aplicações
• muitas oportunidades
• diversos desafios a serem resolvidos
‣ “It’s a lot of fun” :-)
A. Rocha, 2012s1 – Visão Computacional (MC949) 91
Conclusões

‣ Disciplina em 2012s1 no IC/Unicamp


‣ Prof. Anderson Rocha

A. Rocha, 2012s1 – Visão Computacional (MC949) 92


Conclusões
‣ Disciplina em 2012s1 no IC/Unicamp
• Aulas com slides em inglês
• Livro referência em Inglês
• Aulas baseadas em materiais de Derek Hoiem,
Alexei Efros, Steve Seitz, David Forsyth, James
Hayes, Svetlana Lazebnick, Richard Szeliski e
outros

A. Rocha, 2012s1 – Visão Computacional (MC949) 93


© Agarwal, Furukawa, Snavely, Simon, Seitz, Szeliski (2010)

Perguntas?

A. Rocha, 2012s1 – Visão Computacional (MC949) 94

Você também pode gostar