Fundamentos de Imagens Digitais

FUNDAMENTOS DE IMAGENS
DIGITAIS
Adair Santa Catarina

Curso de Ciência da Computação
Unioeste – Campus de Cascavel – PR
Setembro/2022
Conceito de Imagem
“Uma imagem pode ser definida como uma função
bidimensional, f(x, y), em que x e y são coordenadas
espaciais (plano), e a amplitude de f em qualquer par de
coordenadas (x, y) é chamada de intensidade ou nível de
cinza da imagem nesse ponto”.
Gonzalez e Woods (2010)
“Uma imagem pode ser definida como uma função de

intensidade luminosa, denotada por f(x, y), cujo valor ou
amplitude nas coordenadas espaciais (x, y) fornece a
intensidade ou o brilho da imagem naquele ponto”.
Pedrini e Schwartz (2008)
2
Conceito de Imagem
“A imagem é o resultado de estímulos luminosos
produzidos por um suporte bidimensional”.
Gomes e Velho (1994)
(0, 0) x
f(x, y)
Cratera Webb - Nasa (1966)

3
Paradigmas de Abstração de Imagens
Universo Físico Universo
Matemático
Universo de
f(x, y) = i(x, y).r(x, y)
Representação
i(x, y) = iluminância
r(x, y) = refletância
0 < i(x, y) < 
0 < r(x, y) < 1
Universo de
Teoria de
Implementação Sinais
4
Representação Contínua
Considerando uma função unidimensional, definida por:
f:   
x  f(x)
O computador
trabalha com bits
e bytes.
Como processar
um sinal
contínuo no
computador?
Função contínua
5
Representação Discreta
Através de um processo chamado discretização,
composto por duas etapas: amostragem e quantização.
Amostragem: Tomam-se valores pontuais ao longo do

eixo x, para os quais armazenam-se os valores
correspondentes de f(x).
6
Representação Discreta
Quantização: Divide-se a amplitude de f(x) (|fmax – fmin|)
em intervalos. A quantidade de intervalos depende do no
de bits usados na representação dos valores das
amostras. Por exemplo, n = 8 bits  28 bits = 256 valores.
7
Amostragem
A amostragem mais utilizada na discretização de
imagens digitais consiste em tomar o domínio como um
retângulo.
U = [a, b] x [c, d] = {(x, y)  2; a  x  b e c  y  d}
As amostras [ = (x, y)] são coletadas usando os

pontos de um reticulado bidimensional.
 = {(xj, yk)  U; xj = a + j.x, yk = c + k.y},

com j, k  Z; x, y  
Assim, cada ponto (xj, yk) amostrado da imagem (pixel)

pode ser representado pelas coordenadas inteiras (j, k).
8
Amostragem
a b x
O centro de
cada amostra
y (pixel) está
localizado nas
interseções
do reticulado.
d
y x
Portanto, uma matriz A, de ordem M x N, pode
representar uma imagem. A = (ajk) = f(xj, yk).
Neste exemplo M = 24, N = 16, j = 0 a 23 e k = 0 a 15.
9
Quantização
a b x
d
y
Conclui-se a discretização tomando uma cor, em

representação finita, na imagem da função em f(xj, yk).
Este processo chama-se quantização.
10
Matriz Discreta para a Imagem Discretizada
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
0 D6 C9 70 EA 37 70 4A 1D CF 44 4A 44 44 44 56 15 70 D1 8D 8E 2D 70 AB 00
1 9F E9 CC 46 AB 37 70 47 E0 12 15 4A 3B 4A 6D 6D DC 49 8D 8C 1E DC AB 00
2 E7 7B 7B B5 7F F2 3 A8 D8 1E 4C 3B 4A 15 3B FA 15 47 49 8E C8 48 69 00
3 F5 73 7A 26 06 E9 F9 80 51 A8 4C 44 56 3B D2 D2 65 9B 83 C8 85 37 7E 77
4 4D 2E 3F FC 06 E6 96 90 29 79 A2 44 D9 39 E8 E8 4F 55 5F 0C 15 37 7E 77
5 A6 4D 7A . . . . . . . . . . . . . . . . . 4C C9 37 69
6 3F 7A 73 . . . . . . . . . . . . . . . . . 8F 57 7E 77
7 1C 1C 50 . . . . . . . . . . . . . . . . . 2F FA 7E 77
8 2E B4 28 . . . . . . . . . . . . . . . . . 2F FE F6 77
9 42 0F 0F . . . . . . . . . . . . . . . . . D3 2F 59 4B
10 1F DF 1D . . . . . . . . . . . . . . . . . 21 7D E1 61
11 A7 A5 34 . . . . . . . . . . . . . . . . . B2 F4 59 AE
12 35 1F 1D . . . . . . . . . . . . . . . . . 62 B2 92 AE
13 54 35 54 DC 9E ED 45 6C 3E BB 63 40 2A 75 17 1A 41 04 04 78 D0 2B 08 C3
14 C2 35 CC 24 76 32 F8 F0 AC 2C BB 89 43 6F 74 5B 31 5E BF 38 99 9C 08 07
15 27 27 02 CC 8B 3C 32 6C 81 2C 72 05 0D D7 09 70 F7 0B 0B 0B F3 03 0E 30
11
Resolução
M colunas
N linhas
Resolução Horizontal = no de colunas (M).

Resolução Vertical = no de linhas (N).
Resolução Espacial = M x N.
A resolução é um escalar e não estabelece relação com as
dimensões físicas da imagem.
12
Resoluções Espaciais () Dimensões Físicas (=)
384 192
256
128
96 48
32
64
13
Resoluções Espaciais () Dimensões Físicas ()
384
192 96
64
256
128
48
32
As imagens possuem dimensões físicas distintas,
mas os pixels tem dimensões iguais.
14
Resoluções Espaciais (=) Dimensões Físicas ()
384
384 384
256
256
256
384
256
Resolução espacial, por si só, não determina a qualidade
da imagem. Torna-se necessária outra informação, a
Densidade de Resolução.
A Densidade de Resolução fornece o no de pixels por
unidade linear de medida, geralmente em pontos por
polegada (dpi – dots per inch)
15
Resolução de Cor
Resolução de Cor corresponde ao número de bits
utilizados para armazenar a cor ou intensidade de um
pixel da imagem digital.
4 bits/pixel
24 bits/pixel
8 bits/pixel
16
Resolução de Cor
8 bits/pixel 4 bits/pixel
1 bit/pixel 1 bit/pixel 17
O Pixel
O Pixel (Picture element) é a unidade elementar de uma
imagem digital, ao qual estão vinculadas informações
como intensidade, cor ou profundidade, por exemplo.
As informações vinculadas aos pixels são organizadas em

canais. Assim a imagem digital pode ter um ou múltiplos
canais de informação que podem ser representadas em
diferentes sistemas.
160
Imagem monocromática = 1 canal

18
O Pixel em Imagens Coloridas
Sistema RGB = 3 canais 65 100 31
R G B
Sistema L*a*b* = 3 canais 39 -23 33
L* a* b*
Sistema CMYK = 4 canais 74 -38 100 30
C M Y K 19
O Pixel em Imagens Indexadas
Imagens indexadas possuem um número reduzido de
cores ou intensidades (2 a 256) representados em uma
tabela. No pixel fica armazenado o índice da tabela. O
número de bits no canal depende do tamanho da tabela.
i R G B 
0 0 0 0 0
1 200 10 50 0
⋮ ⋮ ⋮ ⋮ ⋮
2 210 60 128 0
⋮ ⋮ ⋮ ⋮ ⋮
35 65 100 31 0
253 40 200 110 0

35
254 80 170 195 0
255 255 255 255 0
20
Geometria do Pixel
Um pixel pode ter diferentes formas geométricas.
Entretanto, devido à amostragem regular a forma mais
comum é o quadrado.
Quadrado
Hexagonal
21
Vizinhança de um Pixel
Um pixel p, na coordenada (x, y), tem 4 vizinhos
horizontais e verticais, definindo a vizinhança-4 de p.
N4(p) = {(x–1, y), (x+1, y), (x, y–1), (x, y+1)}
Os 4 vizinhos diagonais de p definem a vizinhança-D.

ND(p) = {(x–1, y–1), (x+1, y–1), (x–1, y+1), (x+1, y+1)}
A união da 4-vizinhaça com a D-vizinhança de p define a

vizinhança-8 de p.
N8(p) = N4(p)  ND(p)
N4(p) ND(p) N8(p) 22

Adjacência, Conectividade e Caminho
Para que dois pixels p e q sejam considerados adjacentes
deve-se verificar se são vizinhos, segundo o critério de
vizinhança adotado (N4, ND ou N8), e se satisfazem
determinado critério de similaridade (intensidade, cor
ou textura).
O conjunto de pixels entre A e B

definem um caminho-8, com
comprimento n = 19 (total de
pixels no caminho).
O caminho AB tem
conectividade-8 pois todos os
pixels do caminho apresentam
adjacência-8.
23
Tipos de Adjacência
Considerando os conceitos de similaridade e vizinhança
pode-se definir 3 tipos de adjacência.
Adjacência-4: Dois pixels p e q similares são adjacentes-4

se q estiver no conjunto N4(p).
Adjacência-8: Dois pixels p e q similares são adjacentes-8

se q estiver no conjunto N8(p).
Adjacência-m (mista): Dois pixels p e q similares são

adjacentes-m se:
i) q estiver em N4(p), ou
ii) q estiver em ND(p) e o conjunto N4(p)  N4(q) = ,
considerando sempre o critério de similaridade.
24
A Adjacência-m
Este tipo de adjacência é utilizada para evitar
ambiguidade de caminhos quando se usa a adjacência-8.
Conversão para
conectividade-m
25
Regiões e Componentes Conexos
Definimos região como um subconjunto conexo de
pixels de uma imagem.
Duas regiões Ri e Rj são adjacentes se sua união formar
um conjunto conexo, senão são chamadas de disjuntas.
Ri e Rj são conexas, considerando a

adjacência-8. Nesse caso Ri  Rj formam
um conjunto conexo.
Adjacência-4  3 regiões
Adjacência-8  2 regiões
26
Borda e Interior
Borda, fronteira ou contorno de uma região é o conjunto
de pixels da região que tem pelo menos um vizinho no
fundo da imagem. Interior são os demais pixels da região.
A borda de uma região é sensível à
conectividade especificada.
O ponto circulado na imagem ao lado não
pertence à borda da região se especificada a
conectividade-4.
Bordas
considerando
conectividade-4
Região Borda = Contorno interno Contorno externo

27
Medidas de Distância
Dados os pixels p, q e z, com coordenadas (x, y), (s, t) e
(v,w) respectivamente, D é uma função distância ou
medida de distância se:
i) D(p, q)  0. D(p, q) = 0, se p = q.
ii) D(p, q) = D(q, p) e
iii) D(p, z)  D(p, q) + D(q, z)
A distância euclidiana entre p e q é definida como:
De(p, q)= [(x – s)2 + (y – t)2]1/2
De(p, q)  r para todos os pixels q dentro da
circunferência com centro em (x, y) e raio r.
A distância D4 (city block) entre p e q é definida como:
D4(p, q) = |x - s| + |y - t|
D4(p, q)  r formam um losango centrado em (x, y).
28
A distância D8 (chessboard) entre p e q é definida como:
D8(p, q) = max(|x - s|, |y - t|)
D8(p, q)  r formam um quadrado centrado em (x, y).
2 2 5 2 2
3
5
3 3 3 3 3 3 3 3
2
5 2 2 5
3 2 3 3 2 2 2 2 2 3
1 3 2 1 2 3 3 2 1 1 1 2 3
3 2 1 0 1 2 3 3 2 1 0 1 2 3
2 2
3 2 1 0 1 2 3
5 1 5 3 2 1 2 3 3 2 1 1 1 2 3
2 2 5 2 5 2 2 3 2 3 3 2 2 2 2 2 3
3 3 3 3 3 3 3 3 3
De D4 D8
29
A distância Dm entre p e q é definida como o caminho-m
mais curto entre p e q.
0 1 0 1
0 1 1 1
1 1
p3 p4 Dm(p, p4) = 2 Dm(p, p4) = 3
p1 p2
p 1 1 1 1
V={1} 0 1 1 1
1 1
Dm(p, p4) = 3 Dm(p, p4) = 4
30
Sistemas de Cores
Um sistema de cores (ou modelo de cores) permite a
especificação das cores em uma forma padronizada. Trata-
se de uma representação 3D no qual as cores são
representadas por um ponto neste espaço.
Há inúmeros modelos de cores. Os mais usados são o
XYZ, RGB, CMY, CMYK, YIQ, YUV, YCbCr, HSV, HSL, HSI,
L*u*v* e L*a*b*.
Geralmente, associado a cada sistema de cores, há uma
representação visual do mesmo.
31
O Sistema XYZ
O sistema XYZ foi definido pela Commission
Internationale de l’Écleirage (CIE), em 1931.
É um sistema aditivo que descreve as cores através de 3
estímulos (cores) virtuais X, Y e Z.
Foi criado devido à inexistência de um conjunto finito de

cores primárias que produza todas as cores do espectro
visível.
As cores C podem ser expressas por:

C = XX + YY + ZZ
32
Compreendendo as cores XYZ
A visão humana percebe mais brilho nos tons verdes.
Devido à similaridade entre o estímulo Y e a resposta
espectral dos cones ao verde, Y está associado à
luminância da cor.
A crominância
está associada
aos estímulos X
e Z da cor.
33
Luminância e Crominância (XYZ)
Normalizando X, Y e Z, temos:
X Y Z
x y z
X Y  Z X Y  Z X Y  Z
com x + y + z = 1.
Os valores x e y, por dependerem apenas do matiz e da

saturação, são chamados de coordenadas de
cromaticidade.
34
Luminância e Crominância (XYZ)
Assim, uma cor pode ser descrita por x e y
(cromaticidade) e a intensidade de um dos estímulos
originais, normalmente Y (luminância).
As intensidades X e Z podem ser recalculadas por:

x z
X Y e Z  Y , onde z  1  x  y
y y
Mantendo um valor fixo para Y e variando os valores de

x e y, podemos construir o
Diagrama de Cromaticidade CIE XYZ.
35
O Diagrama de Cromaticidade CIE XYZ
36
O Diagrama de Cromaticidade CIE XYZ
37
Exibição (RGB) vs Impressão (CMY)
38
O Sistema RGB
É um sistema aditivo baseado na teoria tricromática,
também conhecida como teoria dos três estímulos,
proposta por Young-Hemlholtz.
O sistema RGB é device-dependent, pois as primitivas R,

G e B podem ser detectadas ou produzidas em diferentes
comprimentos de onda.
Visão humana: R=575nm, G=535nm e B=445nm.
CIE RGB: R=700nm, G=546,1nm, B=435,8nm.
sRGB é definido em relação ao CIE XYZ, com:
R  x = 0,64; y = 0,33; Y = 0,2126
G  x = 0.3; y = 0.6; Y = 0,7152
B  x = 0,15; y = 0,329; Y = 0,0722
39
O Sistema RGB
As cores C podem ser expressas por:
C = rR + gG + bB
40
Conversão RGB  XYZ
0  R, G, B, X, Y, Z  1
⁄
Branco  X = Y = Z = 1
y ⁄
 Diagrama CIE XYZ
0,49000 0,31000 0,20000

0,17697 0,81240 0,01063 ⋅
0,00000 0,01000 0,99000
2,36461 0,89654 0,46807
0,51517 1,42641 0,08876 ⋅
0,00520 0,01441 1,00920
41
O Sistema CMY
Sistema subtrativo usado em dispositivos de impressão.
Tem como primárias as cores secundárias Ciano,
Magenta e Amarelo.
42
Conversão RGB  CMY
0  R, G, B, C, M, Y  1
Branco  C = M = Y = 0
1 1
1 1
1 1
No modelo CMY obtém-se o preto depositando 3
camadas das primárias (K = 1 – C – M – Y), exigindo o
perfeito alinhamento do papel com o mecanismo de
impressão.
Além disso, K  0 (aproximadamente preto), pois os

pigmentos não são perfeitamente ciano, magenta e
amarelo.
43
O Sistema CMYK. Conversão CMY  CkMkYkK
Resolve-se o problema adicionando a componente Preto
(K) ao sistema CMY.
0  C, M, Y, Ck, Yk, Mk , K  1
Branco  C = M = Y = 0
, ,
Se 1 então ! ! ! 0 (preto puro)
! ⁄ 1
⁄ 1
Senão
!
! ⁄ 1
!⋅ 1
!⋅ 1
!⋅ 1
44
Impressão em CMY e CMYK
45
O Sistema YUV. Conversão RGB  YUV
Utilizado para representar cores nos padrões de televisão
PAL e SECAM. Y corresponde à luminância e U e V
codificam informações de crominância.
0  R, G, B  1
0,299 0,587 0,114
" 0,147 0,289 0,436 ⋅
# 0,615 0,515 0,100
1,000 0,000 1,140
1,000 0,395 0,581 ⋅ "
1,000 2,032 0,000 #
46
O Sistema YUV
Original Y
U V
47
O Sistema Y’CbCr. Conversão RGB  Y’CbCr
O sistema Y’CbCr é usado em vídeos digitais. Confunde-
se com o sistema YUV, usado em sistemas analógicos.
0  R, G, B  1
RGB variando de [0..255]  Y’ [12..235], CbCr [16..240].
Quando os valores de Y’CbCr são escalonados para
[0..255] temos o modelo Y’CbCr full range.
′ 0,299 0,587 0,114

% 0,169 0,331 0,5 ⋅
& 0,5 0,419 0,081
1,000 0,000 1,402 ′
1,000 0,344 0,714 ⋅ %
1,000 1,772 0,000 &
48
O Sistema Y’CbCr
Original Y’
Cb Cr
49
Os Sistemas HSV e HSL
São sistemas que descrevem as cores de modo
mais intuitivo do que a combinação de um
conjunto de cores primárias. Formalmente
descritos por Alvy Ray Smith em 1978.
Assemelham-se ao processo utilizado pelos pintores para

criar cores. Adição de preto e branco as cores básicas,
criando tints, tones e shades.
HSV HSL
H = Hue (Matiz), H = Hue (Matiz),
S= Saturation (Saturação) S= Saturation (Saturação)
V = Value (Brilho ou L = Lightness
Luminância) (Luminosidade)
50
Os Sistemas HSV e HSL
Os sistemas HSV e HSL são representações das cores RGB
em um sistema de coordenadas cilíndricas.
HSV HSL
H = grandeza angular (0 a 360º).
S = 0 a 1; V ou L = 0 a 1.
51
O Sistema HSI
Os sistemas HSV, HSL e HSI diferem, basicamente, na
forma como é computada a informação luminância.
52
O Sistema HSI. Conversão RGB  HSI
0  R, G, B, S, I  1
0  H  360o
), *+ -
' (
360 ), *+ .
1
) cos 23 2
4 3⁄4
3
5 1 min9 , , :
1
; 9 :
3
53
O Sistema HSI. Conversão HSI  RGB
; 1 5
5 cos '
; 1 0< - ' - 120<
cos 60< '
3; 9 :
' ' 120<
; 1 5
5 cos ' 120< - ' - 240<
; 1
cos 60< '
3; 9 :
' ' 240<
; 1 5
5 cos ' 240< - ' - 360<
; 1
cos 60< '
3; 9 :
54
O Sistema HSI
Original H
S I
55
O Sistema CIE L*a*b*
Os sistemas CIE L*a*b* foi criado para ser um sistema de
referência, independente de dispositivo. Nele, cores
percebidas iguais são codificadas da mesma maneira e as
diferenças entre tons são percebidas uniformemente.
=∗ 116 · ℎ 16
A
B∗ 500 ℎ ℎ
A A A, A, A = Branco
%∗ 200 ℎ ℎ no sistema CIE XYZ
A A
onde
x=0,3127 e
E , *+ E . 0.008856
G
y = 0,3290
ℎ E F 16
0,787E , E - 0.008856
116
56
O Sistema L*a*b*
Original L*
a* b*
57
Operações Aritméticas sobre imagens
Sobre imagens podem ser realizadas operações como
Adição, Subtração, Multiplicação e Divisão.
* ,I J ,I K9 , I:
Estas operações são orientadas ao pixel. Por exemplo,
As operações aritméticas podem ser usadas para inserir

elementos em uma imagem, suavizar ruídos, segmentar
regiões de interesse, detectar mudanças entre imagens
ou corrigir o efeito do sombreamento ou da iluminação
não uniforme acontecidos no momento da aquisição das
imagens digitais.
58
Adição de Imagens
Suavização de ruídos pelo cálculo da média de múltiplas
imagens.
1 5 10
20 50 100
59
Subtração de Imagens
Detectar e evidenciar diferenças entre imagens.
60
Multiplicação e Divisão de Imagens
Segmentar regiões de interesse e corrigir iluminação.
61
Operações Lógicas sobre Imagens Binárias
Ao operar sobre imagens

binárias (preto e branco)
podemos obter regiões
de frente e de fundo.
Sobre esses dois
conjuntos podemos fazer
operações lógicas, como
NOT, AND, OR ou XOR.
62
Operações em Conjuntos - Imagens Grayscale
Original Negativo por Original

complemento 
L∪ max B, % |B ∈ L + % ∈
Imagem constante
LM , I, 255 N | , I, N ∈ L
T
63
Referências
GONZALEZ, R. C.; WOODS, R. E. Processamento digital de imagens. 3. ed. São Paulo:
Pearson Prentice Hall, 2010.
PEDRINI, H.; SCHWARTZ, W. R. Análise de imagens digitais: princípios, algoritmos e
aplicações. São Paulo: Thomson Pioneira, 2007.
GOMES, J.; VELHO, L. Computação gráfica: Imagem. Rio de Janeiro : IMPA, 1994.

Fundamentos de Imagens Digitais

Enviado por

Dados do documento

Descrição original:

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Fundamentos de Imagens Digitais

Enviado por

Direitos autorais:

Formatos disponíveis

FUNDAMENTOS DE IMAGENS

Adair Santa Catarina

“Uma imagem pode ser definida como uma função de

Cratera Webb - Nasa (1966)

Amostragem: Tomam-se valores pontuais ao longo do

U = [a, b] x [c, d] = {(x, y)  2; a  x  b e c  y  d}

As amostras [ = (x, y)] são coletadas usando os

 = {(xj, yk)  U; xj = a + j.x, yk = c + k.y},

Assim, cada ponto (xj, yk) amostrado da imagem (pixel)

Conclui-se a discretização tomando uma cor, em

Resolução Horizontal = no de colunas (M).

As informações vinculadas aos pixels são organizadas em

Imagem monocromática = 1 canal

Sistema RGB = 3 canais 65 100 31

Sistema L*a*b* = 3 canais 39 -23 33

Sistema CMYK = 4 canais 74 -38 100 30

253 40 200 110 0

Os 4 vizinhos diagonais de p definem a vizinhança-D.

A união da 4-vizinhaça com a D-vizinhança de p define a

N4(p) ND(p) N8(p) 22

O conjunto de pixels entre A e B

Adjacência-4: Dois pixels p e q similares são adjacentes-4

Adjacência-8: Dois pixels p e q similares são adjacentes-8

Adjacência-m (mista): Dois pixels p e q similares são

Ri e Rj são conexas, considerando a

Região Borda = Contorno interno Contorno externo

D8(p, q)  r formam um quadrado centrado em (x, y).

Foi criado devido à inexistência de um conjunto finito de

As cores C podem ser expressas por:

Os valores x e y, por dependerem apenas do matiz e da

As intensidades X e Z podem ser recalculadas por:

Mantendo um valor fixo para Y e variando os valores de

O sistema RGB é device-dependent, pois as primitivas R,

0,49000 0,31000 0,20000

Além disso, K  0 (aproximadamente preto), pois os

′ 0,299 0,587 0,114

Assemelham-se ao processo utilizado pelos pintores para

As operações aritméticas podem ser usadas para inserir

Ao operar sobre imagens

Original Negativo por Original

Você também pode gostar

Sistema Lab* = 3 canais 39 -23 33