Você está na página 1de 56

COMPUTAÇÃO GRÁFICA

Gabriel Soares de Vasconcelos


Fundamentos de Imagens Digitais

Tsang Ing Ren - tir@cin.ufpe.br


George Darmiton C. Cavalcanti - gdcc@cin.ufpe.br
UFPE - Universidade Federal de Pernambuco
CIn - Centro de Informática

1
Tópicos

 Introdução
 Percepção visual
 Luz e o espectro eletromagnético
 Aquisição de imagens
 Amostragem e quantificação
 Relacionamento básicos entre pixels
 Operações lineares e não-lineares

2
Introdução

 Motivação

– Mundo visual (estudo da percepção humana)


– Várias aplicações científicas e industriais
– Vigilância

 Objetivos

– Melhoramento das informacões visuais para interpretação humana


– Métodos para contagem e medição automática
– Processamento da imagem para interpretação automática

3
Percepção Visual
Estrutura do Olho Humano
 Olho humano é aproximadamente uma esfera com um
diâmetro médio de cerca de 20mm.

 Três membranas envolvem o olho: a córnea e a cobertura


externa da esclerótica, a coróide e a retina.

 A córnea é um tecido resistente e transparente que cobre a


superfície anterior do olho. A escleróitica, contínua à córnea,
é uma membrana opaca que envolve o restante do olho.

 A coróide situa-se abaixo da esclerótica, contém uma rede


de vasos sanguíneos que servem como principal fonte de
nutrição do olho.

 Na extrememidade anterior a coróide é dividida em corpo


ciliar e íris, que contrai e expande de forma a controlar a
quantidade de luz que entra no olho.

 A abertura central da íris, chamada de pupila, varia de 2mm


a 8mm em diâmetro.

 O cristalino e formado pro camadas concêntricas de células.


Ele absorve ~8% da luz visível com absorção relativamente
maior nos comprimentos de onda mais curtos.

 A membrana mais interna do olho é a retina, onde a luz de


um objeto fora do olho se torna uma imagem.

4
Percepção Visual
Estrutura do Olho Humano

 A visão de padrões é viabilizada pela distribuição de receptores discretos de luz sobre a superfície da retina.
Existem duas classes de receptores cones e bastonetes

 Número de cones vária entre 6 a 7 milhões, posicionado na região central da retina, chamada fóvea. Sendo
altamente sensíves a cores. Discernimos pequenos detalhes com esses cones, pois cada um e conectado à
sua própria fibra nervosa.

 Número de bastonetes é muito maior: cerca de 75 a 150 milhões distribuídos sobre a superfície da retina.
Servem para dar visãol geral do campo de visão. Vários bastonetes são conectados a uma única fibra nervosa
reduzem a quantidade de detalhes disceníveis por estes receptores.

 A fóvea é uma depressão circular de cerca de 1.5 mm de diâmetro na retina. Supondo uma matriz sensora
quadrada de tamanho 1.5 X 1.5 mm. A densidade de cones nessa área é de aproximadamente 150.000
elementos / mm2 . Numa aproximação, o número de cones na região é de 337.0000 elementos. Um CCD de
resolução média pode conter esse número de elementos em uma matriz receptora não maior que 7 X 7 mm.

5
Percepção Visual
Formação da Imagem no Olho

 A distância entre o centro focal do cristalino e a retina varia de 17mm a 14mm.

 Podemos cálcular o tamanho da imagem de um objeto na retina. Por exemplo o objevador olhando uma
árvore de 15m a uma distância de 100m.

15 x
=
100 17

x = 2 . 55

6
Percepção Visual
Adaptação ao Brilho e Discriminação

7
Percepção Visual
Adaptação ao Brilho e Discriminação

8
Percepção Visual
Adaptação ao Brilho e Discriminação

9
Luz e o Espectro Eletromagnético

10
Luz e o Espectro Eletromagnético

c
λ=  Onde: λ é o comprimento de onda, C
velocidade da luz e ν a frequência.
υ  E é a energia e h a constante de Planck.

E = hυ

11
Aquisição de Imagem

12
Aquisição de Imagem

13
Aquisição de Imagem

14
Aquisição de Imagem

15
Aquisição de Imagem

16
Aquisição de Imagem
Um Modelo Simples de Imagem

 i(x,y) iluminação - quantidade de luz


0 < f ( x, y ) < ∞ incidindo na cena sendo observada. É
determinada pela fonte de luz.
 r(x,y) reflectância – quantidade de luz
f ( x, y ) = i ( x, y ) r ( x, y ) refletida pelos objetos na cena. É
determinada pelas caractéristicas dos
objetos na cena.

0 < i ( x, y ) < ∞  l é denominado nível de cinza, ou seja a


intensidade de uma imagem
0 < r ( x, y ) < 1 monocromática f nas coordenadas (x,y)

 Intervalo é denomindao escala de cinza,


Lmin ≤ l ≤ Lmax onde l = 0 é considerado negro e l = L é
considerado branco.

[ Lmin , Lmax ]

17
Amostragem e Quantificação

18
Amostragem e Quantificação

19
Amostragem e Quantificação
Representação da Imagem

20
Amostragem e Quantificação
Representação da Imagem

 f (0, 0) f (0,1) L f (0, N−1) 


 f (1, 0) f (1,1) L f (
1 , N −1) 
f (x, y) ≈  
 M M 
 
f (M −1 , 0) f (M −1, 1) L f (M −1 , N − 1)

21
Amostragem e Quantificação
Representação da Imagem

22
Amostragem e Quantificação
Representação da Imagem

23
Amostragem e Quantificação
Representação da Imagem
142 152 152 132
151 212 154 232
121 254 132 215
252 224 121 151
254 181 145 212

010000
011100
011000
111000
001010

24
24
Amostragem e Quantificação
Representação da Imagem

14 15 15 13 15
15 21 54 32 15 C M Y
21 54 32 15 54
52 24 21 51 51
R G B
54 81 45 12 15
0.3212 0.2541 0.4121
0.1312 0.1215 0.3121
0.2115 0.1511 0.0212
0.0215 0.5152 0.3211
0.3551 0.1212 0.3251

25
25
Amostragem e Quantificação
Representação da Imagem

26
Amostragem e Quantificação
Representação da Imagem
n k
N =2 , M =2

m
G =2

b= N ×M ×m
2
se M = N , b= N m

N m-G 1-2 2-4 3-8 4 – 16 5 – 32 6 - 64 7 - 128 8 – 256


32 128 256 512 512 1.024 1.024 1.024 1.024
64 512 1.024 2.048 2.048 4.096 4.096 4.096 4.096
128 2.048 4.096 8.192 8.192 16.384 16.384 16.384 16.384
256 8.192 16.384 32.768 32.768 65.536 65.536 65.536 65.536
512 32.768 65.536 131.072 131.072 262.144 262.144 262.144 262.144
1024 131.072 262.144 393.216 524.288 655.360 786.432 917.504 1.048.576

27
Amostragem e Quantificação
Resolução Espacial e Tons de Cinza

Imagens de tamanhos diferentes porém mesma quantidade de tons de cinza

28
Amostragem e Quantificação
Resolução Espacial e Tons de Cinza

Efeito da redução da resolução espacial, (a) 1024x1024, (b) 512X512,


(c) 256 X 256, (d) 128X128, (e) 64X64, (f) 32X32

29
Amostragem e Quantificação
Resolução Espacial e Tons de Cinza

Efeita da diminuição nos tons de cinza - 265, 128, 64, 32, 16, 8, 4, 2

30
Amostragem e Quantificação
Zoom

31
Relacionamento Básicos Entre Pixels
Vizinhos de um Pixel
 Vizinhança de um pixel

– Um pixel p na coordenada (x,y) tem quatro vizinhos (horizontal e verdical), os quais


tem coordenadas

N4(p) = { (x+1,y),(x-1,y),(x,y+1),(x,y-1)}

– Os quatro vizinhos diagonais é definido por

ND(p) = { (x+1,y+1),(x-1,y-1),(x+1,y+1),(x-1,y-1)}

– A soma destes conjuntos define a 8-vizinhança

N8(p) = N4(p) + ND(p)

32
Relacionamento Básicos Entre Pixels
Conectividade
 Conectividade
– Conectividade entre os pixels é um importante conceito usado para estabelecer as
bordas de um objeto ou componentes de uma região da imagem. Para estabelecer se
dois pixels estão conectados temos que determinar se os pixels são adjacentes.
– Fazamos V o conjuto de valores em tons de cinza que define conectividade; por
exemplo, numa imagem binária, V={1}. Em tons de cinza a conectividade pode ser
definida com uma os valores entre 32 a 64 por exemplo, V={32,33,34,…,63,64}

• 4-conectividade. Dois pixels p e q com valores de V são 4-con, se q pertencer ao


conjuto N4(p).
• 8-conectividade. Dois pixels p e q com valores de V são 8-con, se q pertencer ao
conjuto N8(p).
• m-conectividade (conectiviade mista). Dois pixels p e q com valores de V são
m-con se
– Q esta em N4(p), ou
– Q esta em ND(p) e o conjunto N4(p)  N4(q) é vazio.

33
Relacionamento Básicos Entre Pixels
Medida de Distância
 Medida de distância
– Para os pixels p, q e z, com coordenadas (x,y),(s,t) e (u,v) respectivamente, D é
uma função distância ou métrica se:
• (a) D(p,q) ≥ 0 ( D(p,q) = 0 se e somente se p=q )
• (b) D(p,q) = D(q,p)
• (c) D(p, z) ≤ D(p,q) + D(q,z)

– A distância Euclidiana entre p e q é definida como:


De(p,q) = [(x - s)2 + (y - t)2]1/2

– A distância D4, chamada de distância “quarteirão” (“city block”) entre p e q é


definida como:
D4(p,q)= |x - s| + |y - t|
Exemplo de D4 ≤ 2
2
2 1 2
2 1 0 1 2
2 1 2
2

34
Relacionamento Básicos Entre Pixels
Medida de Distância
 Medida de distância

– A distância D8, chamada de distância xadrez entre p e q é definida como:

D8(p,q)= max(|x - s|, |y - t|)

Exemplo de D8 ≤ 2

2 2 2 2 2
2 1 1 1 2
2 1 0 1 2
2 1 1 1 2
2 2 2 2 2

35
Relacionamento Básicos Entre Pixels
Medida de Distância
 Medida de distância
– Para conectividade-de-m, o valor da distância entre dois pixels depende do valor do
pixels ao longo do caminho e daqueles de seus vizinhos. Considere P, P2 e P4 tenham
valor 1 e que P1 e P3 possam ter valor 0 ou 1

P3 P4
P1 P2
P

(1) Se P1 e P3 forem 0: (2) Se P1 ou P3 for 1:


distância = 2 distância = 3
0 1 1 1 0 1
0 1 0 1 1 1
1 1 1

(3) Se P1 e P3 forem 1:
distância = 4
1 1
1 1
1

36
Relacionamento Básicos Entre Pixels
Operações Lógico-Aritméticas

37
Relacionamento Básicos Entre Pixels
Operações Lógico-Aritméticas

38
Relacionamento Básicos Entre Pixels
Operações Pontuais Adaptativas
 Princípio
– Ao invés de tratar a imagem como um todo, ela é dividida em sub-imagens
e a operação é realizada em cada sub-imagem.
– Muitas vezes, este processo gerará artefatos nas fronteiras entre as sub-
imagens. Para corrigí-los pode-se
• Interpolar valores para gerar transições suaves.
• Utilizar sub-imagens muito pequenas.
• Neste sentido, são operações semelhantes às operações locais.

39
Relacionamento Básicos Entre Pixels
Operações Algébricas e Aplicações

 Operações pontuais com mais que uma imagem de entrada


– Soma, Subtração, Mutliplicação, Divisão
– Operadores lógicos (E, OU, etc...)
– Operadores comparativos (Max, Min)

40
Relacionamento Básicos Entre Pixels
Operação Adição

 Adição para redução de ruído


– Princípio
• Adição de imagens estáticas com ruído aleatório. Por ser aleatório (não ter correlação entre
quadros), a contribuição do ruído não se soma, levando a um aumento na razão sinal/ruído
(signal to noise ratio - SNR).
• O aumento da SNR é proporcional a N, onde N é o número de imagens somadas.
• Aplicações comuns: Imagens de vídeo e de microscopia eletrônica.

41
Relacionamento Básicos Entre Pixels
Operação Subtração

 Subtração na detecção de movimento


– Princípio
– Subtração de imagens em que parte da imagem esteja em movimento ou tenha se
modificado.
– A subtração irá gerar uma clara fronteira entre as regiões que se movem e as regiões
estáticas.

42
Relacionamento Básicos Entre Pixels
Operações Lógicas

 Definição
– Operações pontuais que envolvem mais do que uma imagem binária de entrada, para
gerar uma imagem de saída.

43
Relacionamento Básicos Entre Pixels
Operações Locais

 Operações locais ou de vizinhança (neighbourhood)


– Isaída (x,y) é uma função não só de Ientrada(x,y) mas também da intensidade de pixels
vizinhos.
– A operação equivale a uma média ponderada dos pixels da vizinhança.
– Cada vizinho tem um peso associado, que multiplica sua intensidade.
– Os pesos são definidos por uma matriz denominada “kernel”

44
Relacionamento Básicos Entre Pixels
Operações Locais

45
Relacionamento Básicos Entre Pixels
O Filtro Mediana

 Um filtro sem kernel - o filtro mediana


– Para cada vizinhança, ordena os pixels em ordem crescente de intensidade e escolhe
como saída o valor mediano - aquele que está no centro da sequência.

– Excelente eliminador de ruído localizado com intensidade muito diferente da


vizinhança.

46
Relacionamento Básicos Entre Pixels
Operações Geométricas

 Operações geométricas
– Alteram a relação de posição entre pixels.
– Em geral envolvem duas etapas
• Uma transformação espacial
– Este processo muitas vezes levará a criação de pixels inexistentes na imagem original.
O que leva à necessidade de
• Uma interpolação das intensidades dos pixels
– Replicação (nearest neighbours), bi-linear, sin(x)/x, etc...

47
Relacionamento Básicos Entre Pixels

48
Relacionamento Básicos Entre Pixels

49
Operações Lineares e Não-Lineares

 Seja H um operador no qual as entradas e saídas são imagens. H é um operador


linear se, para quaisquer duas imagens f e g e dois escalares a e b.

H(af + bg) = aH(f) + bH(g)

– Exemplo de operador linear é um operador que calcula a soma de K


imagens.

50
Operações Lineares e Não-Lineares

51
Operações Lineares e Não-Lineares
– Exemplo de operador não-linear é um operador que calcula o valor absoluto
da diferença de duas imagens.

52
Relacionamento Básicos Entre Pixels

53
Relacionamento Básicos Entre Pixels

54
Formatos de Arquivos Gráficos
 Servem para armazena, organizar, e recuperar os dados de uma forma eficiente e lógica.
Informações como tamanho da imagem, resolução, e compressão.
 Tipos de formato gráficos
– Bitmap - mapeamento pixel-por-pixel da imagem
– Vetor - descrição matemática os elementos da imagem
– Metafiles – possuim caracteristicas de ambos bitmap e vetor
 Tipos de arquivos
– TIFF (Tagged Image File Format)
• Robusto, flexível, genérico, multi-plataforma
– PCX
• PC Standard antigo, “problemático”
– BMP (bit map)
• Formato mais comum dentro do Windows
– GIF
• Muito comum para transmissão em rede. Limitado a 256 cores.
– OUTROS: raw, TGA, Sun Raster, formatos próprios (p.ex. Photoshop)
– Formatos comprimidos
• Sem Perdas (lossless) - RLE (PCX, BMP, TGA), LZW (TIFF, GIF), Huffman
• Com perdas (lossy) - JPEG - usar com cuidado em análise quantitativa

55

Você também pode gostar