Você está na página 1de 67

Fundamentos da Imagem Digital

por Antonio Escao Scuri


(scuri@tecgraf.puc-rio.br)

Tecgraf/PUC-Rio
Janeiro de 1999

Fundamentos da Imagem Digital

Descrio
Apresentamos aqui os conceitos bsicos envolvidos em Processamento de Imagens
Digitais e procuramos dar uma viso geral da rea. Mas, no sero apresentadas tcnicas de
processamento em profundidade, nem pelo lado matemtico, nem pelo lado computacional.
Por isso mesmo, serve tanto a pessoas da rea tcnica que esto iniciando seu aprendizado
em Processamento de Imagens, ou pessoas de Editorao Eletrnica que queiram aprender os
conceitos que esto por traz de programas como o Adobe PhotoShop e o Corel PhotoPaint.
Assim, qualquer um com conhecimentos bsicos em computadores, pode assistir ao curso.
Mas, o conceito matemtico de funo largamente utilizado e fundamental para o entendimento
de algumas noes.
Os conceitos apresentados servem tambm como uma preparao para um curso mais
avanado de Processamento de Imagens. Inclusive vrios conceitos so tratados superficialmente
por esse motivo e para no tornar o texto ilegvel para pessoas que no sejam da rea tcnica. Mas,
uma das maiores dificuldades aqui definir o que deve realmente ser superficial e o que no deve.
Isso s a evoluo desse material, atravs do retorno de pessoas que tenham acesso a ele, poder
dizer.
No futuro pretendemos criar mais dois textos, um chamado Tcnicas de Processamento de
Imagens Digitais com enfoque matemtico e computacional, e outro Aplicaes de Imagens
Digitais com enfoque prtico envolvendo aplicaes cientficas, incluindo vrios estudos de casos.

Fundamentos da Imagem Digital

Ementa
Dividimos a apresentao em 3 tpicos bsicos, mais 3 tpicos complementares e por fim,
3 tpicos de tcnicas e aplicaes. Sugerimos que sejam vistos inicialmente os trs primeiros
tpicos para melhor compreenso dos demais.
Conceitos Bsicos
Apresentamos alguns dos conceitos bsicos necessrios para o entendimento dos outros
tpicos. Situamos Processamento de Imagens e Computao Grfica, apresentamos o
Paradigma dos Quatro Universos, e mostramos algumas noes de contnuo e discreto.
Resoluo Espacial
Quando realizamos a passagem para o mundo digital, a primeira grande etapa para imagens
a amostragem. Aqui vamos explorar um pouco mais essa questo, assim como seu problema
inverso, o de reconstruo da imagem original. Como veremos reconstruo sinnimo de
interpolao. Veremos tambm uma definio do importante conceito de aliasing.
Cor
O que cor? Como representar cor no computador? Quais os padres estabelecidos? Essas
e outras perguntas sero abordadas aqui de maneira introdutria. Falaremos tambm sobre
Luminncia e Crominncia, assim como outras propriedades de cor, e por fim veremos algumas
tcnicas de quantizao.
Captura
Apresenta alguns dos dispositivos que usamos para passarmos a imagem para o mundo
digital. No caso Scanners, Frame/Vdeo Grabbers e Cmeras Digitais.
Visualizao
Uma vez a imagem tendo sido digitalizada, imediato o desejo de reconstru-la em alguma
superfcie de visualizao. As mais comuns so monitores e impressoras. Sobre estes mostraremos
algumas peculiaridades.

Fundamentos da Imagem Digital


Armazenamento
Embora existam vrios formatos de arquivos de imagem (TIFF, PCX, GIF, JPEG) todos
armazenam a mesma imagem digital. Para falar sobre isso, mostraremos antes como uma imagem
armazenada na memria do computador.
Processamento
As funes de processamento de imagens digitais podem ser classificadas em duas classes,
por escopo ou por resultado. Por escopo, est relacionado com tcnicas de processamento. Por
resultado, est relacionado com os tipos de resultado de cada tcnica.
Software
Aqui procuramos dar uma viso geral de alguns programas de processamento de imagens,
procurando situ-los dentro do contexto dos conceitos apresentados. Tais como Adobe PhotoShop,
Corel PhotoPaint, Paint Shop Pro, Lview Pro, ACDSee, XV, GIMP.

Fundamentos da Imagem Digital

Sumrio
1.

Conceitos Bsicos.......................................................................................................................7
1.1. Computao Grfica e Processamento de Imagens..............................................................7
1.2. Tpicos de Processamento de Imagens ...............................................................................9
1.3. Contnuo x Discreto............................................................................................................9
1.4. O Paradigma dos Quatro Universos ..................................................................................11

2.

Resoluo Espacial...................................................................................................................15
2.1. Topologia de um Pixel ......................................................................................................16
2.2. Reconstruo ....................................................................................................................18
2.3. Aliasing ............................................................................................................................20

3.

Cor............................................................................................................................................22
3.1. Processos de Formao de Cor..........................................................................................23
3.2. Amostragem e Reconstruo de Cor .................................................................................24
3.3. Cor no Paradigma dos 4 Universos ...................................................................................26
3.4. Padronizao para Cor......................................................................................................27
3.5. Sistemas de Cor................................................................................................................32
3.6. Sistemas de Gerncia de Cor.............................................................................................37
3.7. Quantizao com Menos de 24 bits...................................................................................39

4.

Captura ....................................................................................................................................42
4.1. Scanners ...........................................................................................................................42
4.2. Digitalizadores de Sinal de Vdeo .....................................................................................43
4.3. Cmeras Digitais...............................................................................................................44

5.

Visualizao .............................................................................................................................45
5.1. Monitores .........................................................................................................................45

Fundamentos da Imagem Digital

5.2. Impressoras ......................................................................................................................47


6.

Armazenamento.......................................................................................................................48
6.1. Compresso ......................................................................................................................50
6.2. Formatos de Arquivo ........................................................................................................51
6.3. Imagens Grandes e Multiresoluo ...................................................................................52

7.

Processamento..........................................................................................................................54
7.1. Restaurao/Realce...........................................................................................................55
7.2. Segmentao ....................................................................................................................55
7.3. Extrao de Atributos .......................................................................................................55
7.4. Classificao ....................................................................................................................56
7.5. Operaes Pontuais...........................................................................................................56
7.6. Operaes Locais..............................................................................................................58
7.7. Operaes Globais............................................................................................................59

8.

Software ...................................................................................................................................61

9.

Aplicaes.................................................................................................................................64

10.

Internet Links ..........................................................................................................................66

11.

Bibliografia ..............................................................................................................................67

Fundamentos da Imagem Digital

1. Conceitos Bsicos
1.1. Computao Grfica e Processamento de Imagens
Antes de mais nada, precisamos nos situar dentro do contexto de Computao Grfica.
Estamos trabalhando basicamente com dois tipos de informao: Visual e Descritiva. Informao
visual por exemplo a imagem vista na tela do computador. Informao descritiva referente ao
modelo matemtico que representa os objetos visualizados. A rea de Processamento de Imagens
abrange operaes que so realizadas sobre imagens e que resultam em imagens. A rea de
Computao Grfica abrange as operaes de sntese de imagem, ou seja, a gerao de uma
visualizao do modelo. A rea de Viso Computacional abrange as operaes de anlise dos
objetos contidos na imagem e a gerao de modelos matemticos desses objetos.

Processamento
de Imagens
Informaes
Visuais
(Imagem)
Viso
Computacional
(Anlise)

Computao
Grfica
(Sntese)
Informaes
Descritivas
(Modelo)

Aqui iremos ver vrias funes de Processamento de Imagens e um pouco da interface


desta rea com as reas de Viso Computacional e Computao Grfica.
Na rea de Computao Grfica se encaixam programas de arquitetura, design e simulao
grfica, tais como as utilizadas em filmes com animao por computador. Programas comerciais
que representam muito bem esta rea so o AutoCad e o Studio 3D, ambos da AutoDesk, e o Corel
Draw da Corel.

Fundamentos da Imagem Digital


Desta maneira, o modo de encararmos os programas das diversas reas se torna diferente
de acordo com o nosso objetivo. Por exemplo, a planta baixa de uma casa pode ser desenhada a
partir de suas medidas, sem a necessidade de uma fotografia area da casa ou, at mesmo, da
existncia da casa. Por outro lado, para analisarmos uma amostra de bactrias no microscpio
precisamos da imagem da amostra, de onde podemos obter alguma informao, sem a necessidade
de conhecermos a posio exata de cada bactria.
Esta diferena de objetivos vai levar modelos de trabalho diferentes. Em processamento
de imagens usa-se o modelo de matricial e a computao grfica geralmente se baseia no modelo de
objetos vetoriais. Neste modelo os objetos so armazenados apenas a partir da descrio das
coordenadas de seus vrtices, sejam elas espaciais ou planares (trs ou duas dimenses,
respectivamente). Dessa maneira utiliza-se um sistema de coordenadas Cartesiano, onde os objetos
podem ser escalados, rotacionados e transladados com maior liberdade para cada objeto. O modelo
matricial utiliza uma matriz de dados para armazenar a informao de cor em cada ponto da
imagem, onde o sistema de coordenadas obviamente uma grade de nmeros inteiros que
descrevem a posio na matriz. Portanto, no modelo matricial no h distino dos objetos contidos
na imagem. Alm disso, armazenar a matriz que contm a imagem geralmente exige muito mais
memria que armazenar a descrio vetorial.
A diferena de modelos fica explcita quando apresentamos o paradigma dos 4 universos,
que nos ajudar a situarmos todos esses conceitos.

Fundamentos da Imagem Digital

1.2. Tpicos de Processamento de Imagens


Uma vez tendo nos situado no contexto de Processamento de Imagens podemos agora
desdobrar essa rea nos tpicos que sero abordados. O ponto central de discusso ser, claro, a
Imagem Digital. Falaremos sobre dois aspectos importantes que definem a imagem: Resoluo e
Cor. Feito isso, podemos atacar os pontos de Captura e Visualizao, Armazenamento e por fim
Processamento. Esses outros pontos tem por objetivo esclarecer algumas confuses na rea e
preparar o aluno para cursos mais avanados.
A figura a seguir ilustra a relao entre os diversos tpicos.

Captura

Processamento

Imagem
Digital

Compresso /
Armazenamento

Visualizao

1.3. Contnuo x Discreto


Para podermos introduzir o conceito de imagem digital necessrio antes falarmos sobre
funes contnuas e funes discretas. Podemos pensar em uma funo contnua como um corda
sem emendas que se estende indefinidamente (ou seja infinita) e por mais que voc corte essa corda,
sempre poder cort-la um pouco menor indefinidamente (ou seja infinitesimal). Matematicamente
estamos falando de uma funo real definida na reta toda (em ), onde para cada valor de x
fornecido sempre existe um nico valor de f(x) obtido.
Formalmente:

f :
x f ( x)

Fundamentos da Imagem Digital

10

Colocando isso em um grfico:

f(x)

O computador s capaz de armazenar bits, um valor que pode ser 0 ou 1. Para simplificar
as coisas juntou-se 8 bits formando uma palavra chamada de byte. Um byte ento pode assumir 28 =
256 valores diferentes, variando de 0 a 255. Quando falamos de sistemas operacionais de 16 bits e
32 bits, estamos falando da maior palavra que aquele sistema pode processar de uma vez, por isso
sistemas de 32 bits so mais eficientes que os de 16.
Assim, o computador trabalha sempre com nmeros inteiros ou na melhor das hipteses
com uma aproximao de um nmero real, chamada de ponto flutuante (isso porque o nmero de
bits dedicado para as casas decimais flexvel de acordo com o nmero). Por conseqncia, no
possvel representar uma funo contnua no computador. Podemos apenas simula-la.
O processo para trazer uma funo contnua para o computador discretizando-a (ou
digitalizando-a), ou melhor, tomando valores pontuais ao longo de x e guardando o valor de f(x)
correspondente ( claro que o eixo f(x) tambm contnuo, assim tambm precisaremos discretizalo). O processo de discretizao do eixo x (o domnio) chamado de Amostragem, o do eixo f(x) (o
contradomnio) chamado de Quantizao.
Em resumo, a discretizao de qualquer sinal contnuo primeiro passa por uma
amostragem e depois passa por uma quantizao. Alm disso, no podemos armazenar um sinal que
se estenda indefinidamente, portanto o sinal digital tambm limitado a um intervalo do domnio.

Fundamentos da Imagem Digital

11

A amostragem que vemos na figura a mais comum de todas e mais popular,


implementada na grande maioria de dispositivos de captura. chamada de uniformemente
espaada, pois cada amostra tomada em intervalos iguais. Embora existam outras tcnicas de
amostragem que utilizam menos amostras onde a funo montona e mais amostras onde a funo
apresenta mais irregularidades.

Contnuo

Discreto

f(x)

f(x)

Amostragem
f(x)

1.4. O Paradigma dos Quatro Universos


Esse paradigma vai nos ajudar a entender esse processo de sair do mundo real, onde os
sinais so contnuos, e ir para o mundo do computador onde tudo discreto. O paradigma especifica
4 universos. O universo Fsico, onde esto os objetos do mundo real. O universo Matemtico, onde
formulamos descries abstratas desses objetos. O universo de Representao vai permitir trazer
essas descries abstratas para o mundo digital, e onde se dar a discretizao dos sinais
contnuos. O universos de Implementao onde feita a codificao do sinal discretizado na
memria do computador atravs de uma estrutura de dados.
Assim, para estudar um determinado fenmeno, ou objeto da natureza, no computador, ns
precisamos associ-lo a um modelo matemtico e ento encontrar uma representao discreta para
esse modelo que pode ser implementada no computador.

Fundamentos da Imagem Digital

12

A codificao dos dados pode ser decodificada e depois reconstruda para podermos voltar
com o fenmeno estudado para o mundo real.

Universo
Fsico

Objetos do Mundo Real

Universo
Matemtico
Discretizao

Descrio Abstrata dos Objetos


Reconstruo

Universo de
Representao
Codificao

Representao Discreta

Decodificao

Universo de
Implementao

Estruturas de Dados

Para imagens tambm precisamos fazer esses mesmos passos.


A imagem fotogrfica obtida do mundo real atravs de cmeras ou sensores que captam
luz. A imagem capturada em um filme fotogrfico representa bem a imagem real que queremos
transportar para o computador. Repare que o filme define um plano limitado por um retngulo, onde
cada posio nesse plano contm a informao de cor relativa aquela posio, ou seja, a imagem
neste caso um sinal de cor 2D contnuo, onde o domnio o plano e o contradomnio o espao
de cor. A discretizao disso muito simples, segue os mesmos princpios da discretizao de sinais
2D contnuos quaisquer.

Fundamentos da Imagem Digital

13

Imagem
Fotogrfica

Luz, Cmera, Filme

Imagem
Contnua

Sinal de Cor 2D Contnuo

Imagem
Digital

Sinal de Cor 2D Discreto

Imagem
Codificada

Matriz de Cores

A imagem contnua modelada matematicamente pela funo:


f ( x, y ) = Cor no ponto (x, y)
x [0, X ] e y [0, Y ]
, onde x e y so nmeros reais, limitados ao intervalo de 0 a X, e de 0 a Y, respectivamente.
Colocando isso em um grfico:

f(x,y)
y

x
A imagem digital obtida a partir de uma amostragem e de uma quantizao dessa funo,
como j foi visto, e pode ser representada pela mesma funo, s que neste caso, x e y so nmeros
inteiros. Uma vez amostrado o plano temos uma matriz de valores que representam a cor. Cada
elemento dessa matriz chamado de Pixel (abreviao de Picture Element).

Fundamentos da Imagem Digital

14

Mas, ainda no falamos nada sobre a quantizao da cor. Na realidade cor tambm um
fenmeno fsico para o qual precisamos fazer os mesmos passo que fizemos para o plano da
imagem. Precisamos descobrir a definio de cor, suas representaes e como traz-las para o
computador. Por enquanto, vamos deixar essas discusses de lado e atacar a questo de amostragem
do plano 2D onde as cores esto distribudas.
A figura a seguir ilustra o processo de discretizao da imagem e mostra uma possvel
codificao da cor para cada elemento da matriz.

Imagem Contnua

Amostragem

f(x)
Pixel
Quantizao

x
...
3
2
1
0

...
23
27
45
1

...
63
43
32
2

... ... ...


62 5 ...
67 8 ...
54 45 ...
3 4 ...

Codificao

Fundamentos da Imagem Digital

2. Resoluo Espacial
Ao ser digitalizada a imagem assume um tamanho adimensional, em pixels. Mas, pode-se
conhecer uma medida de qualidade da amostragem, conhecendo-se a razo entre o nmero de pixels
obtido e o tamanho da imagem real no filme ou equivalente. A isso chama-se de Resoluo. Em
geral, medida em pontos por polegada ou DPI (dots per inch), mas pode ser tambm em pontos
por centmetro ou DPC, ou ainda em qualquer outra unidade equivalente. Tambm simples
estabelecer a relao: nmero de pixels = resoluo x tamanho real.
Para entender melhor isso, pode-se fazer a seguinte questo: Dado o tamanho da imagem
(em cm, in, etc...), quantos valores discretos vo ser tomados? Escolhendo-se a resoluo a resposta
dada pela equao acima.
Veja algumas resolues tpicas: Monitor Comum - 72 DPI; Scanner - 1200 DPI;
Impressora Jato de Tinta Popular - 600 DPI
Como temos duas dimenses, podemos definir uma resoluo horizontal e uma vertical.
Quando nada se diz a respeito disso, quer dizer que so iguais (a grande maioria das vezes), caso
contrrio so necessrios dois valores. Uma vez que so diferentes, a razo de aspectos da rea entre
um pixel e outro no 1:1 e portanto no um quadrado. Isso gera algumas confuses, pois no
monitor a razo 1:1 e esta imagem quando visualizada aparecer deformada.
Quando duas imagens com tamanhos reais iguais so capturadas com resolues
diferentes, naturalmente tero nmero de pixels diferentes e na tela aparecero com tamanhos
diferentes. Na figura a seguir mostramos um crculo amostrado em duas resolues, mas exibido no
seu tamanho original.

15

Fundamentos da Imagem Digital


Quando duas imagens de tamanhos reais diferentes so capturadas com resolues
diferentes de tal forma que gerem imagens digitais com o mesmo nmero de pixels, quando
visualizadas no monitor aparecero com o mesmo tamanho na tela. No exemplo a seguir mostramos
as imagens proporcionais ao seu tamanho original.

Quando queremos realizar alguma medida sobre os objetos contidos na imagem surge um
outro parmetro, a escala. Pode-se defini-la matematicamente idntica a resoluo s que as
unidades sero as mais variadas possveis. Caso no seja conhecida, fcil de se obt-la. Mede-se
algumas distncias reais na imagem digital e calcula-se a mdia das razes entre distncia e nmero
de pixels, obtendo-se a escala. A partir desse momento outras distncias podem ser feitas na
imagem com qualidade aceitvel. claro que se os objetos no estejam em um mesmo plano, as
medidas so muito mais complexas e envolvem transformaes projetivas.

2.1. Topologia de um Pixel


As amostras do plano so pontuais e adimensionais, mas os dispositivos para reconstruo
no deixam um espao entre uma amostra e outra. Assim, muitas vezes iremos representar o pixel,
no como um ponto, mas como um quadrado preenchido com a cor do pixel, que est no seu centro.
Por sinal, o exemplo anterior j usa essa representao.
Como vimos, pixels so normalmente quadrados, gerando uma grade (grid) regular devido
amostragem uniformemente espaada. Um problema que aparece nesse momento : Quais so os
vizinhos de um determinado pixel? Essa pergunta fundamental para algoritmos de preenchimento
de reas e algoritmos de determinao de continuidade de objetos na imagem.
Nesta grade regular podemos definir dois tipos de vizinhana: 4 conectada (onde os
vizinhos so eqidistantes) ou 8 conectada (onde nem todos so eqidistantes, os vizinhos na

16

Fundamentos da Imagem Digital

17

diagonal so mais distantes que os vizinhos nas laterais). Normalmente usa-se uma combinao das
duas vizinhanas, definindo 4 conectada para os objetos e 8 conectada para o fundo.

Vizinhana 4 Conectada

Vizinhana 8 Conectada

Vizinhos 8 conectados,
mas no 4 conectados

Para criar uma vizinhana onde todos os vizinhos fossem eqidistantes e s houvesse uma
definio, temos que mudar a grade regular para uma grade hexagonal. So poucos algoritmos
implementados com essa vizinhana, pois como a imagem est em geral amostrada em um grade
regular, deve-se converte-la para a grade hexagonal, realizar o processamento e converte-la de volta
para a grade regular.

Vizinhana Hexagonal

J que estamos falando da grade no poderamos deixar de falar sobre a origem do sistema
de coordenadas. Localizada no canto superior esquerdo na grande maioria dos sistemas de
processamento de imagem, pode na realidade ser posicionada em qualquer lugar da imagem, at
mesmo fora dela.

Fundamentos da Imagem Digital

18

Essa localizao preferencial para o canto superior esquerdo, com eixo y invertido em
relao ao padro da matemtica, herdada dos prprios dispositivos de visualizao, onde a
primeira linha a ser redesenhada na tela a do topo da tela, que segue o padro de escrita ocidental,
da esquerda para a direita e de cima para baixo.

Origens Mais Comuns

2.2. Reconstruo
Quando falamos em amostragem imediatamente ns temos o problema inverso: Como
reconstruir? Ou melhor podemos fazer a pergunta: Dados os valores discretos, qual a funo
contnua? Quando estamos no ambiente computacional, tambm estamos querendo resolver um
outro problema que o de re-amostragem. Isto , reconstruir e amostrar novamente com outra
resoluo ou com outro grid regular ou no.
Em matemtica, reconstruo sinnimo de interpolao. O uso desse conceito permite
que dado uma seqncia de amostras obtemos o valor em uma posio qualquer do eixo.
A tcnica mais trivial simplesmente escolher a amostra mais prxima da posio
desejada e tomar o seu valor como valor desta posio. Esta tcnica usada muito para a
visualizao da imagem em maior ou menor proximidade, ou melhor, fazendo Zoom, simulando
uma aproximao ou afastamento da imagem em relao ao observador.
Uma outra tcnica muito utilizada para fazer reconstruo a de interpolao linear
(bilinear no caso de 2 dimenses). Essa tcnica calcula uma mdia ponderada das amostras mais
prximas da posio desejada de acordo com a distncia mesma.

Fundamentos da Imagem Digital

19

Pela figura a seguir podemos perceber que a interpolao linear ir obter resultados bem
melhores que a de vizinho mais prximo. Mas fica claro que podemos obter resultados ainda
melhores usando curvas em vez de retas. Uma tcnica com esse enfoque que se tornou popular a
interpolao bi-cbica, que semelhante a interpolao linear, mas em vez de usar retas, usa
funes cbicas (x3) para realizar a ponderao.
y

x
y

Vizinho + Prximo

Linear

Esta imagem mostra o efeito de uma mudana no tamanho de uma determinada imagem,
usando-se a tcnica de interpolao linear e a tcnica do vizinho mais prximo.

Toda tcnica de deformao da imagem, como rotao ou coisas mais genricas como
Warping so implementados usando interpolao (Obs: Morphing = Warping + Blending). Por que
no fundo estamos reconstruindo, deformando o modelo contnuo e re-amostrando.

Fundamentos da Imagem Digital

20

2.3. Aliasing
Um fenmeno muito comum em amostragem o fenmeno de aliasing. Ele acontece
quando realizamos uma amostragem muito pobre da funo contnua original e quando vamos
reconstrui-la obtemos resultados inconsistentes com o esperado. Matematicamente podemos dizer
que a freqncia de amostragem foi inferior aproximadamente maior freqncia de variao da
funo contnua. Podemos ver o fenmeno de aliasing em outras situaes como ao filmarmos uma
roda de um carro rodando mais rpido do que a cmera capaz de capturar, neste caso vemos a roda
girar para trs, justamente por que a taxa de amostragem est muito baixa, no nosso caso a
resoluo da imagem.

Recostruda
y

Original
Amostra

Para resolver o problema de aliasing temos duas solues, aumentar a taxa de amostragem,
que em geral nem sempre possvel, ou suavizar a funo contnua para que no tenha freqncias
muito altas comparadas com a nossa taxa de amostragem.
Essa soluo, totalmente correta, induziu um erro conceitual que vem se propagando
durante anos na literatura. Muitas tcnicas de suavizao de contornos (para que estes paream mais
suaves na visualizao) so chamadas erradamente de tcnicas de anti-aliasing.

Fundamentos da Imagem Digital


Esta imagem mostra o efeito de aliasing espacial em uma imagem que foi amostrada em
alta e baixa resoluo.

21

Fundamentos da Imagem Digital

22

3. Cor
Quando falamos de cor de um ponto de vista fsico, na realidade estamos falando de Luz.
A luz percorre o espao, ora se comportando como uma onda, ora como uma partcula, isso
caracteriza a natureza dual da luz. Para estudarmos cor iremos observar o comportamento da luz
como uma onda. Podemos dizer que neste caso a luz uma radiao eletromagntica que possui
uma certa energia para cada comprimento de onda. A funo que informa o valor dessa energia
chamada de Distribuio Espectral de Potncia.

Cor Qualquer - C()


Cor Monocromtica Ideal
(cor espectral)

Cor Monocromtica
Real
Violeta

Verde

Vermelho

Na figura podemos ver um exemplo de distribuio, e a diferena entre uma cor


monocromtica ideal (apenas 1 comprimento de onda) e uma cor monocromtica real (onde existe
um comprimento de onda predominante, mas no nico).
Portanto, luz pode ser modelada matematicamente por uma funo unidimensional que
depende do comprimento de onda. Mas ns estamos interessados em cor, e neste caso estamos
falando da sensao humana de diferentes espectros de luz. Ou seja, a definio de cor neste caso
envolve uma caracterstica perceptual da espcie humana. At porque sabido que cada espcie
possui uma percepo de cor diferente. Consequentemente precisamos entender um pouco mais
sobre como o olho humano percebe cor e envia essa informao para o crebro. (A cincia que
estuda cor do ponto de vista fsico chamada de Colorimetria. A cincia que estuda cor do ponto de
vista perceptual chamada de Fotometria.)
No nosso olho existem dois tipos de sensores, cones e bastonetes. Bastonetes so sensveis
a todos os comprimentos de onda ponderadamente, possuem melhor resposta luz (viso noturna),
mas no so capazes de distinguir cor. J os cones so menos sensveis luz (viso direta), mas
permitem a distino de cores por, na realidade, existirem trs tipos de cones, sensveis a

Fundamentos da Imagem Digital

23

comprimentos de onda prximos a 450nm, 550nm, e 600nm (nm=10-9m). Isso caracteriza o


processo de discriminao de cor do olho, chamado de tricromacidade.
Tanto cones quanto bastonetes permitem com que olho perceba luz entre aproximadamente
380nm e 780nm. Luz de 380nm at 500nm parece azul, de 500nm a 600nm parece verde, e de
600nm a 780nm parece vermelho
claro que o resto do espectro eletromagntico ocupado com outros tipos de ondas. A
figura a seguir mostra algumas regies conhecidas e/ou utilizadas por ns.
Visvel

RaiosX

Micro-Ondas

Ultra-Violeta Infra-Vermelho
10-12

10-10

10-8

10-6

10-4

TV FM

10-2

AM
102

104

(m)

Portanto existem duas classes de sensores, uma que percebe a intensidade da luz e outra
que percebe as diferenas de cor. E assim que a informao de cor enviada para o crebro, em
dois canais. Essa decomposio tem o nome de luminncia-crominncia e usada em muitas
representaes de cor.
A cor monocromtica ideal tambm chamada de cor espectral, j que possui apenas um
nico comprimento de onda. A cor prpura no uma cor espectral, ela contm comprimentos de
onda bem prximos a 380nm e outros bem prximos a 780nm. Veremos esse fenmeno da cor
prpura novamente mais adiante. A luz branca possui todos os comprimentos de onda com energia
mxima. A luz branca ideal seria um espectro com uma linha horizontal.
A distribuio de cones e bastonetes ao longo da retina responsvel por diversos aspectos
da nossa viso. Embora esses aspectos sejam muito interessantes vamos procurar nos concentrar
apenas naqueles que nos interessam no momento.

3.1. Processos de Formao de Cor


As cores que ns percebemos so geradas a partir de diversos processos psicoqumicos.
Em geral podemos classific-los em trs grandes grupos: aditivos, subtrativos e por pigmentao.
No processo aditivo (o mais simples), vrios raios de luz so combinados para formar um
novo raio. No processo subtrativo um raio de luz passa por um filtro que elimina alguns

Fundamentos da Imagem Digital


comprimentos de onda resultando numa nova cor. No processo por pigmentao a luz passa por
diversos eventos, sendo refletida, transmitida e absorvida, o resultado dessa interao a nova cor.
Todos os trs processos so comuns na natureza. O processo aditivo usado nos monitores
de computadores e televises. O processo subtrativo aparece quando usamos um projetor para
vermos slides em uma tela. E o processo de pigmentao nos permite ver cores em pinturas e
trabalhos impressos. Em alguns processos industriais como impresso offset, mais de um processo
pode ser utilizado.
Simplificando o que acontece em uma impressora podemos ver a subtrao ocorrendo no
papel branco, onde toda a luz refletida, mas onde existe cor apenas a mesma ser refletida e todo o
resto ser absorvido, ou subtrado da luz branca incidindo sobre o papel.
De qualquer forma temos um sistema receptivo de cor baseado em cones sensveis
vermelhos, verdes e azuis. Na escola primria aprendemos que as cores bsicas so vermelho,
amarelo e azul. Na realidade isso est relacionado com a mistura de tintas que poderia se
aproximada por um processo subtrativo e esse vermelho na realidade era magenta, e o azul era
ciano, cores complementares do vermelho verde e azul.
Ns iremos concentrar nossos estudos sobre o processo aditivo, pois a luz que chega ao
nosso olho se combina aditivamente e todos os estudos de colorimetria tambm usam esse processo.

3.2. Amostragem e Reconstruo de Cor


Observando o modelo de sensores de cor do olho humano, vemos que podemos representar
cor usando um nmero pequeno e finito de sensores, que so responsveis por captar uma parte do
espectro cada um deles. Isso possvel pelo fato de que o olho humano percebe um determinado
conjunto de cores como sendo a mesma cor. Esse fenmeno chamado de metamerismo.
Para podermos representar cor no computador precisamos saber como amostrar e
reconstruir cor. No universo fsico a amostragem de cor est associada aos receptores e a
reconstruo est associada aos emissores.
Usando o mesmo modelo do olho o receptor deve ter um nmero finito de sensores, que
poderiam ser 3, mas vamos apresentar de forma genrica usando N sensores. Matematicamente
podemos modelar o receptor usando a curva de resposta espectral de cada sensor i, como si() e
escrevendo:

24

Fundamentos da Imagem Digital

25
Ci = C ( ) si ( ) d

onde Ci a cor C percebida pelo sensor i.


Para que o emissor possa agora reconstruir a cor C ele dever ter N sensores que
estimulados corretamente produziro a cor C. Matematicamente podemos modelar o emissor
usando a base de primrias de cada sensor (Pk()) e escrevendo:
N

C ( ) = k Pk ( )
k =1

onde k so as componentes primrias da cor C.


O que gostaramos de fazer agora obter os k em funo dos Ci.
Substitui-se C na equao do receptor pela frmula do emissor para cada um dos sensores
do receptor. Isso resulta em:
N

Ci = k Pk ( ) si ( ) d
k =1

S que na prtica, as curvas de resposta espectral si() do receptor so muito complicadas


de se obter, por isso precisamos de uma outra forma de reconstruir cor.
Primeiro, iremos normalizar as componentes k por uma cor de referncia W() com
objetivo de calibrar a escala de cores corretamente para cada sensor. O que resulta em:
N

W ( ) = wk Pk ( )

Tk =

k =1

k
wk

onde Tk so as componentes primrias normalizadas da cor C.


Agora definimos as funes de reconstruo de cor Ck() do emissor em relao ao
receptor de maneira que as componentes Tk so obtidas com:
Tk = C ( ) Ck ( ) d

Fundamentos da Imagem Digital

26

No vamos entrar nos detalhes matemticos (que j foram muitos at agora) da definio
das funes de reconstruo de cor, mas a grande vantagem em us-las que em vrios casos
podem ser facilmente obtidas a partir de experimentos. Podemos interpretar as funes de
reconstruo como sendo as coordenadas das cores puras (espectrais) vistas pelo receptor, escritas
na base de primrias de cada sensor do emissor.
Quando o receptor o olho humano essas funes so chamadas de Color Matching
Functions. Mais tarde veremos um dos experimentos realizados para obteno das funes de
reconstruo de cor para o olho.

3.3. Cor no Paradigma dos 4 Universos


Uma vez que sabemos amostrar e reconstruir cor, podemos finalmente situar cor no
paradigma dos 4 universos. Cor uma onda eletromagntica que matematicamente pode ser
representada por uma funo unidimensional, mas que usamos um nmero finito, pequeno e
discreto de sensores como no olho humano. Cada conjunto de sensores chamado de modelo de
representao, e cada sensor no modelo chamado de componente.

Cor
Fsica

Cor
Contnua

Cor
Digital

Cor
Codificada

Radiao
Eletromagntica

Sinal de 1D Contnuo,
dividida em vrias
componentes
Modelos de Representao por
Componente (RGB, CMYK,...)

Um valor para cada componente

Quando codificamos cor muito comum usarmos 1 byte para cada componente. Um byte
permite 28 = 256 possibilidades, assumindo valores de 0 a 255. Por isso esses nmeros aparecem
tanto em programas de processamento de imagens e no sabamos de onde vinham. Mas, repare que
essa apenas uma possvel representao, por ser a mais comum induz a algumas pessoas pensarem

Fundamentos da Imagem Digital

27

que a nica, e pior, algumas pessoas pensam que cor no computador se resume aos tais valores de
0 a 255.
Se assumirmos que so 3 componentes isso totalizaria 224 bits, ou 16 milhes de
possibilidades. Alguns experimentos mostram que somos capazes de reconhecer aproximadamente
400 mil cores diferentes, o que na prtica resulta em um nmero menor que 219 bits, ou seja 224 est
mais do que suficiente levando em conta os diversos metamerismos.
O modelo de representao de cor que ns vimos completamente genrico e para que os
programas de processamento de imagens possam conversar entre si e interagir melhor com o
usurio preciso estabelecer padres.

3.4. Padronizao para Cor


CIE-RGB
O primeiro padro baseado nesses conceitos foi estabelecido em 1931 pelo comit CIE
(Comission Internacionale de l'clairage). Foi chamado de CIE-RGB pois define as primrias
Pr(), Pg() e Pb() do emissor como sendo 3 cores espectrais. O padro tambm define o branco
como W() =1, e com isso foi realizado um experimento de cor para definir o Observador Padro,
ou seja, obter as funes de reconstruo de cor para esse sistema.

bPb()
C()

gPg()

W()
rPr()

Para tanto, colocou-se 3 luzes monocromticas baseadas nas primrias definidas, acopladas
a um mecanismo que possa variar a intensidade de cada uma delas (rPr(),gPg() e bPb()).
Colocou-se ento uma luz branca de referncia tambm j especificada. Ajustando as trs luzes de

Fundamentos da Imagem Digital


maneira que juntas produzam a luz branca de referncia, guardou-se os valores (wr, wg, wb) para
fazer a normalizao dos ajustes de cada uma das luzes.
Agora, colocou-se uma outra luz monocromtica C() com um mecanismo que permita
variarmos seu comprimento de onda. Para um determinado nmero de comprimentos de onda do
espectro visvel ajustamos a luz a cada comprimento de onda e ajustamos as trs luzes de maneira
que juntas fiquem perceptualmente idnticas cada uma dessas luzes. Os valores obtidos com
cr=r/wr, cg=g/wg, cb=b/wb para cada um dos comprimentos de onda formam exatamente as
funes de reconstruo de cor do sistema CIE-RGB com o receptor sendo o olho humano.
Isso foi feito para um grande nmero de pessoas escolhidas por sua competncia na
distino de cores. Mas durante a experincia descobriram que determinadas cores no conseguiam
ser ajustadas pelas trs luzes. A soluo foi mudar uma das luzes de lugar passando-a para o outro
lado, podemos interpretar isso como uma subtrao ou melhor um coeficiente negativo.
Quando visualizamos todas as cores visveis em 3 dimenses temos o chamado solido de
cor, que neste caso no um cubo, possui a forma semelhante a de um cone de duas pontas.
CIE-XYZ
O fato de existirem valores negativos no padro tem uma srie de desvantagens, alm disso
vrias outras desvantagens desse sistema fez com que o comit criasse um outro sistema, baseado
nos experimentos do CIE-RGB, mas com algumas caractersticas interessantes: todas as
componentes das cores visveis no devem ser negativas, duas primrias devem ter luminncia zero
(uma das componentes ser a prpria luminncia), um maior nmero de cores espectrais deve
possuir pelo menos uma componente zero. A soluo foi buscar uma base de primrias fora do
visvel, ou seja o sistema tambm representa cores que no so visveis, mas tudo bem pois basta
no consider-las.
Fazendo uma transformao das funes de reconstruo de cor do sistema CIE-RGB para
o CIE-XYZ temos o grfico da figura a seguir. Nela vemos tambm um segundo experimento
realizado em 1964 que variou um pouco apenas em relao ao primeiro experimento. Tambm
podemos perceber que a curva de luminncia (Y) muito intensa no verde, mostrando que
percebemos mais variaes de verde do que de outra cor. O calombo na curva da componente X
vem das componentes negativas que haviam no padro CIE-RGB. E por fim reparem que a curva
do Z muito estreita, ou seja podemos usar menos memria para guardar essa componente (isso
ser usado mais tarde quando falarmos de alguns algoritmos de quantizao de cor).

28

Fundamentos da Imagem Digital

Diagrama de Cromaticidade
J que luminncia s referente a intensidade da cor, criou-se uma visualizao das cores
visveis que envolve somente as componentes X e Z de alguma forma. Na realidade como se
pegssemos todas as cores e projetssemos em um plano de luminncia constante Y (Observao:
de fato o diagrama mais fcil de ser entendido por estarmos usando o sistema CIE-XYZ, mas ele
foi originalmente definido para o sistema CIE-RGB).
O resultado a figura a seguir chamada de Diagrama de Cromaticidade. Nele podemos ver
uma srie de propriedades interessantes de cor.

29

Fundamentos da Imagem Digital

30

Regio
Perceptualmente
Uniforme

Comprimento de
Onda Dominante
(Hue)

Cor Branca

Cores Espectrais

S=

Pureza ou
Saturao

C
Cor
Complementar

W = C + C'

WC
WH

Linha Prpura

As cores na borda do diagrama so todas as cores espectrais, cujas componentes so


exatamente as funes de reconstruo de cor. No centro temos o branco W a partir do qual temos
algumas propriedades. Dada uma cor C, a cor pura, ou o comprimento de onda dominante de C, ou
melhor o matiz H de C dado pela projeo de W, passando por C, na borda do diagrama. A
saturao simplesmente a razo entre as distncias de W C e de W a H, ou melhor o quanto uma
cor se aproxima da cor pura ou se afasta da ausncia de cor (se aproxima do branco). A cor C que
somada a C resulta na cor branca chamada de cor complementar de C.
No diagrama os dois extremos do espectro visvel so conectados por uma linha artificial
(que no so cores espectrais) chamada de linha prpura.

Fundamentos da Imagem Digital

31

Podemos observar alguns desses fenmenos diretamente no espectro. J vimos que uma
cor monocromtica possui uma forma estreita. Se transladarmos esta forma de lugar estaremos
modificando o comprimento de onda dominante ou o matiz. Se aumentarmos sua intensidade
estamos aumentando seu brilho. E se alargarmos sua forma estaremos diminuindo sua saturao (se
aproximando do branco, ex: tons pasteis).

Um outro aspecto interessante sobre o brilho que embora este varie de acordo com as
condies de iluminao, o olho possui uma capacidade enorme de se adaptar a essas variaes.
como se ele mudasse a escala de percepo para poder captar o mximo de detalhes com a
luminosidade disponvel. A tabela abaixo mostra valores tpicos de iluminamento em LUX que
variam enormemente e mesmo assim conseguimos enxergar.
Ambiente
Luz do dia (mximo)
Luz de dia nublado
Interior prximo a janela

Valores (lux)
100.000
10.000
1.000

Mnimo p/ trabalho

100

Lua cheia

0,2

Luz das estrelas

0,000.3

Fundamentos da Imagem Digital

32

O olho tambm possui uma resposta no linear intensidade. Isso pode fazer com que a
escala de tons percebida pelo olho seja no linear em determinados casos, ou seja a gama de tons
percebida no corresponde a variaes equivalentes de intensidade. Para compensar esse problema
realiza-se a chamada Correo Gamma, que nada mais faz do que aplicar a funo inversa da
resposta do olho para obter uma escala percebida linearmente. Podemos ver as duas situaes na
figura a seguir.

No Linear

Linear

Um outro experimento de cor verificou que cores prximas perceptualmente se situam em


uma elipse no diagrama de cromaticidade. Isso foi usado para definir um outro sistema de cor com
caractersticas perceptuais.

3.5. Sistemas de Cor


Ns vimos at agora 2 sistemas de cor CIE-RGB e CIE-XYZ, mas existem outros sistemas
padronizados ou no padronizados.
Sistemas Perceptualmente Uniformes
A diferena entre duas cores no sistema CIE-RGB pode ser calculada usando-se a
definio de diferena euclidiana:
d=

(r1 r2 )2 + (g1 g 2 )2 + (b1 b2 )2

Mas duas cores que so metamricas podem possuir uma diferena numrica razovel
entre si. A idia possuir um sistema que usando a mesma equao acima identifique cores

Fundamentos da Imagem Digital


metamricas e no as distingua numericamente. Poderamos ento, deformar o sistema XYZ para
que as elipses sobre o diagrama de cromaticidade, mencionadas anteriormente, se tornem crculos.
Assim, foram criados dois sistemas padro em 1976, o CIE Luv, que estabelece
uniformidade no diagrama de cromaticidade, e o CIE Lab que estabelece uniformidade em um
espao de cor tridimensional. L em ambos os casos est relacionado com a luminncia, mas tambm
de uma forma perceptual, e chamado de Lightness.
Sistemas de Vdeo Componente
So sistemas baseados em uma decomposio das componentes RGB em luminncia e
crominncia, onde as componentes de crominncia so obtidas subtraindo-se a componente Y das
componentes RGB e eliminando-se a componente G pois, como vimos, ela a que mais colabora na
luminncia. Assim as componentes ficam Y, R-Y e B-Y.
Os sistemas Ypbpr (Sony Betacam) e YCbCr (Vdeo Digital) so baseados nessa
decomposio.
Sistemas de Vdeo Composto (NTSC, PAL, ... )
So baseados na mesma decomposio Y, R-Y e B-Y dos sistemas de cor de vdeo
componente, mas para serem transmitidos pelas redes de televiso todas as componentes desses
sistemas precisam ser combinadas em um nico sinal, por isso so chamados de sistemas de vdeo
composto.
Transmisses de vdeo usam os sistemas YUV ou YIQ. Nesses sistemas o sinal de
luminncia compe 95% do sinal e a informao de crominncia apenas 5%. Isso ;e possvel devido
a menor sensibilidade do olho a variaes de crominncia. Alm disso, as televises preto e branco
foram criadas antes das televises coloridas, o uso dessa codificao permitiu que as televises
preto e branco continuassem a receber o mesmo sinal de televiso mesmo sendo includa a
informao de crominncia, que nesse caso ignorada, pois o sinal no aumentou de tamanho. Esse
um dos grandes milagres da indstria de televiso.
Dentro das siglas de sinais de televiso a letra em destaque (M ou G, etc...) informa o
padro de luminncia, a abreviao inicial indica o padro de cor. Porque o sistema americano e o
brasileiro s diferem, essencialmente na cor, possvel reproduzir uma fita de vdeo gravada num
sistema em um aparelho de vdeo cassete de outro, e vice-versa, ficando apenas a cor prejudicada.

33

Fundamentos da Imagem Digital

34

Assim como, fitas europias no conseguem ser reproduzidas aqui no Brasil pois diferem na
codificao de luminncia.
Sistemas de Dispositivos
So os sistemas usados pelos monitores (mRGB) e scanners (sRGB), cada dispositivo
possui o seus prprio sistema. Para permitir a calibrao adequada o fabricante deve fornecer os
valores das primrias dos fsforos do monitor, por exemplo.
Quando dizemos que uma cor possui componentes RGB=(255, 0, 36), isso no est
amarrado a nenhum referencial de cor e perceptualemnte pode estimular completamente diferente o
olho mudando-se de dispositivo. Para que esses valores tenha significado temos que associa-los a
algum sistema de cor padro, em geral o CIE-XYZ. Por isso a necessidade de calibrarmos o monitor
para aplicaes que exigem alta qualidade em editorao eletrnica.
Esses sistemas definem exatamente um cubo, visto a seguir:

Azul
Magenta

Branco
Preto

Vermelho

Ciano

Verde
Amarelo

Por isso, a projeo deles no diagrama de cromaticidade um tringulo, veja em Sistemas


de Gerncia de Cor.
Sistemas Complementares
So sistemas usados para os casos que envolvem os processos de formao de cor de forma
subtrativa. Por isso so chamados tambm de Subtrativos, isso gera uma certa confuso pois na
realidade imitam o processo de formao de cor subtrativo de uma forma aditiva.

Fundamentos da Imagem Digital


A combinao de RGB em quantidades iguais leva ao branco. Se mudarmos os eixos de
referncia de lugar rotacionando-os, temos o sistema CMY. Combinando CMY em quantidades
iguais leva ao preto. Por isso simula o processo subtrativo.
No caso especfico de impressoras combinar CMY para obter preto tem uma srie de
desvantagens, pois precisamos das trs cores ao mesmo tempo sobre o papel, gastando muita tinta e
mesmo assim no conseguindo um preto adequado, alm do que torna o processo de secagem da
tinta mais demorado, enrugando o papel. Como tinta preta muito barata, adiciona-se uma quarta
componente que responsvel somente pelo preto K (black). O clculo dessa componente feito
diretamente a partir das componentes CMY, que posteriormente so alteradas para no conterem
informao de preto. Esse clculo em geral muito complexo, e necessrio para se obter
resultados de alta qualidade grfica.
Sistemas de Interface (por Coordenada)
So usados para especificar cores em programas. Selecionar valores no sistema RGB
muito pouco intuitivo, embora seja como o olho perceba cor. Utilizando as propriedades de Matiz,
Saturao e Brilho (ou alguma grandeza relacionada com a luminncia) muito mais fcil para o
usurio especificar um cor e depois obter o valor RGB.
Para isso criou-se uma abstrao para o cubo RGB deformando-o em um cone com duas
pontas. Essa deformao extremamente no linear, mas uma forma simples de representar juntas
as trs propriedades.
O cone construdo tomando-se o eixo de brilho como o eixo maior do cone, e
perpendicular a esse eixo define-se o plano de crominncia. Neste plano os matizes possveis so
colocados em um crculo, a linha prpura no representada. Quanto mais prximo ao eixo de
brilho menor a saturao, mais afastado maior a saturao. No fundo uma representao
simplificada do que est no diagrama de cromaticidade.

35

Fundamentos da Imagem Digital

36
White

Green

B
S

Red

Blue

Black

Como antigamente precisava-se que a converso HSB-RGB fosse feita muito rpido,
criaram-se aproximaes do sistema HSB, onde o cone substitudo por um hexagono (HSL) e
pode tambm possuir apenas uma ponta (HSV).
A tabela abaixo mostra dois cortes no sistema HLS, repare como a intensidade da cor varia
para um mesmo valor de L (L referente Lightness, mas no tem relao direta com os sistemas
CIE-Lab ou CIE-Luv). Pode-se utilizar um desses cortes, e mais um parmetro escalar para criar a
interface com o usurio para selecionar cor. No primeiro caso o usurio escolhe o valor de L e
depois escolhe os valores de H e S diretamente no plano de L constante. No segundo caso o usurio
escolhe o valor de H e depois os valores de L e S no plano de H constante.
Corte no plano de Lightness = 50%

Corte no plano de Hue = 0

Fundamentos da Imagem Digital


Sistemas de Interface (por Amostra )
So sistemas usados manualmente por usurio para especificar cor, s que so baseados em
conjuntos finitos de amostras de cor, em uma espcie de catlogo.
O primeiro sistema criado foi o de Munsell em 1905, que podemos ver na figura a seguir.
Mas existem vrios outros: Ostwald, Pantone, Truematch ,Focoltone, ...

3.6. Sistemas de Gerncia de Cor


Se ns representssemos todas as cores possveis em um monitor de computador veramos
um tringulo no diagrama de cromaticidade. Se pegssemos um outro monitor do mesmo fabricante
veramos um outro tringulo numa posio ligeiramente diferente do anterior. Se fosse de um outro
fabricante a discrepncia pode ser ainda maior. No caso de uma impressora e um monitor a
diferena enorme, j que a regio da impressora no diagrama possui at um formato diferente.

37

Fundamentos da Imagem Digital

38

Espao de Cores
do Monitor A
Espao de Cores
do Monitor B

Assim vemos que necessrio um mecanismo que nos permita controlar a mudana de um
dispositivo para outro, de forma que possamos representar melhor as cores de interesse em cada um
desses dispositivos.
J que existem diversos padres de cor, ou melhor diversas representaes da mesma cor,
nada mais natural do que existir um meio de converter de um sistema para outro. Os programas
responsveis por isso so chamados de Sistemas de Gerncia de Cor (CMS - Color Management
Systems) e realizam a converso entre os diversos sistemas procurando o mnimo de perdas, ou seja
o maior nmero de correspondncias possveis.
Esses programas esto preocupados justamente com a questo de portabilidade de cor, pois
quando estamos mudando de um sistema para outro em geral porque estamos mudando de um
dispositivo para outro.
Aqui est um dos grandes pontos da questo de manipulao de cor no computador.
Existem diversos desses programas no mercado, mas so caros e precisam de pessoal especializado,
alm de equipamento adequado para medio de cor. Para que o par Captura-Visualizao funcione,
todos os dispositivos no seu ambiente de trabalho precisam estar calibrados.
Poucos sistemas operacionais se preocupam diretamente com isso. O pioneiro na rea o
MacOS (roda em computadores Macintosh), que desde sua criao j se preocupava com isso.
Recentemente, um esforo conjunto de vrias empresas levou a criao do padro ICM (Image
Color Matching) para suporte a gerncia de cor em aplicaes. O Windows 95 j vem com esse
recurso e com o lanamento do Windows 98 ficou ainda mais direto seu uso.

Fundamentos da Imagem Digital


O principio de funcionamento de um sistema de gerncia a criao de perfis de
dispositivo que a partir de informaes do fabricante e do processo de calibrao consigamos obter
resultados timos, independente do dispositivo usando a informao que est no perfil para realizar
a converso para aquele sistema.
Quando estamos no ambiente de editorao eletrnica esse problema fica bvio. Se o
logotipo de uma determinada marca um tal vermelho. Esse vermelho tem que parecer o mesmo
em qualquer mdia que o logo seja impresso ou visualizado.

3.7. Quantizao com Menos de 24 bits


Como vimos bastam 24 bits por pixel (bpp) para visualizarmos uma imagem no
computador com tima qualidade. Mas e se o nosso computador no tiver 24 bpp (16 milhes de
cores)? A grande maioria das impressoras imprime somente com 4 (quatro) cores... Uma outra
motivao para reduzir o nmero de bpp simplesmente para economizar memria, como se fosse
uma tcnica de compresso de dados com perdas.
Mesmo quando existe um nmero reduzido de cores disponveis para visualizao na tela
do computador, a representao de cada cor ainda usa 8 bits por componente. Para reduzir o
tamanho de cada pixel, substitui-se sua cor por um ndice para uma tabela de cores de 8 bits (veja
no tpico de Armazenamento).
Para essa reduo de tamanho ser efetiva o nmero de cores da imagem quantizada deve
ser menor que 8 bpp, ou no mximo 256 cores diferentes. Portanto, precisamos encontrar dentre as
cores existentes na imagem quais so as 256 mais significativas e dada uma cor da imagem qual das
256 vou escolher para substitu-la.
Existem duas tcnicas muito conhecidas. A quantizao Uniforme a mais simples, e usa
uma tabela de cores fixa que subdivide o cubo RGB, em 256 partes igualmente espaadas. Dado
que uma cor est em uma dessas partes trivial encontrar a cor equivalente na tabela. Esse
algoritmo excepcionalmente rpido, mas no possui resultados muito bons quando a imagem
possui muitas cores. A quantizao Adaptativa mais complexa e usa uma tabela de cor adaptada
as cores presentes na imagem. A tcnica mais comum a do corte mediano (Median Cut) que
procura dividir o cubo de maneira que, onde existem mais cores existiro mais divises, ou melhor
procura fazer com que cada diviso tenha aproximadamente o mesmo nmero de cores. Esse
algoritmo um pouco mais lento e produz resultados muito bons.

39

Fundamentos da Imagem Digital


A imagem a seguir mostra as duas tcnicas de quantizao, usando uma palheta de cores
uniforme e usando uma palheta adaptativa. Alm da imagem original e de uma imagem quantizada
com palheta uniforme, mas dessa vez usando tambm a tcnica de dithering vista no prximo
tpico.

Dithering
No caso de impressoras de 4 cores cada componente CMYK de 8 bits quantizada para 1
bit (2 cores, onde h tinta ou onde h o fundo branco do papel). Pode se mostrar que nesse caso
reduz-se o problema de quatro componentes para imprimir uma componente de cada vez.
A idia fazer com que, embora existam apenas 2 cores, o olho perceba meio-tons.
Tcnicas de meio-tons so usados na indstria desde o fim do sculo passado.
No computador a tcnica mais comum, utilizada para esse propsito, a de dithering, cujo
objetivo minimizar perceptualmente os efeitos gerados pela quantizao de contornos. Embora,
essa tcnica possa ser usada em vrias situaes de quantizao (como vimos no exemplo anterior),
ela muito importante no processo de quantizao para 1 bit. Inclusive alguns mtodos de dithering
so baseados em tcnicas de meio-tons da indstria, e por isso dithering tambm conhecido com
meio-tom digital.

40

Fundamentos da Imagem Digital


O funcionamento bsico de um algoritmo de dithering calcular o erro de cor gerado pela
quantizao de um determinado pixel, e quando existe uma mudana abrupta entre dois nveis de
cores quantizadas, substitui-se essa mudana por uma mistura dos dois nveis, com se estivssemos
espalhando o erro de quantizao em uma vizinhana do pixel quantizado.
Existem muitas tcnicas de dithering implementadas, tais como Bayer, Floyd-Steinberg,
difuso de erro, etc.

41

Fundamentos da Imagem Digital

4. Captura
Existem diversos mecanismos de captura de imagens. Os mais conhecidos so o Scanner, o
Digitalizador de Sinal de Vdeo (Frame/Vdeo Grabber) e a Cmera Digital.

4.1. Scanners
Scanners provem as imagens de mais alta resoluo, mas em compensao so mais caros.
Podem capturar diversos tipos de superfcie, as mais importantes so papel e filmes fotogrficos.
Utilizam o sistema de cor RGB e possuem uma calibrao fcil de ser feita. O procedimento de
calibrao requer um modelo impresso, em geral fornecido pelos programas que aceitam calibrao.
Esse modelo contm uma srie de cores, conhecidas ao programa. Assim, quando a imagem
capturada o programa compara os valores obtidos com os valores esperados e pode ento gerar um
perfil de correo para aquele scanner.
Os scanners so muito semelhantes mquinas Xerox (fotocopiadoras). Existem
basicamente trs tipos: manuais, de mesa ou de cilindro. Em qualquer caso o scannner dispe de
uma fonte de luz em forma de uma linha que varre a imagem impressa e mede a quantidade de luz
refletida ou transmitida em cada ponto. A luz captada convertida em um sinal eltrico atravs de
um conjunto de foto-detetores que tambm formam uma linha. O sinal eltrico finalmente
digitalizado e enviado ao computador.
No caso de scanners manuais a varredura feita deslizando o aparelho sobre a imagem a
ser capturada. No de mesa, em processo anlogo ao da Xerox, a varredura realizada
automaticamente pelo aparelho que desloca a fonte de luz e os foto-detetores. No de cilindro tanto a
fonte de luz quanto a imagem se movem para fornecer maior qualidade ao processo. Neste caso a
fonte de luz se move dentro do cilindro enquanto a imagem fixada na sua superfcie que gira
durante o processo.
A escolha da DPI a ser utilizada o fator mais crtico no uso do scanner. A primeira coisa
que se deve ter em mente "Qual o objetivo ao digitalizar a imagem?". Uma soluo encarar trs
tipos de resultados: para visualizao somente em monitores, para edio e impresso futura, e para
anlise cientfica.

42

Fundamentos da Imagem Digital


No primeiro caso, a resoluo mxima em pixels do monitor vai ditar o tamanho mximo
em pixels da imagem. Imagem capturadas para o uso na Internet se encaixam neste caso.
No segundo caso, a maior DPI da impressora a ser utilizada vai ditar a DPI a ser utilizada
no scanner durante a captura. Mas, no caso de impressoras a 2 cores, deve-se compensar o tamanho
da matriz de dithering. Por exemplo, se for 6x6 em 600 DPI, basta enviar uma imagem de 36 tons
de cinza em 100 DPI.
No terceiro caso, onde o objetivo obter medidas na imagem, o que vai indicar a resoluo
a preciso dos valores que se deseja obter no espao da imagem. Esta preciso indicar a menor
distncia entre dois pixels, o que por conseqncia ditar a DPI.

4.2. Digitalizadores de Sinal de Vdeo


Digitalizadores de Sinal de Vdeo dependem do padro de vdeo utilizado, NTSC, PAL-M,
etc. Em geral so de baixa resoluo. Alguns permitem capturar um nico quadro, chamados de
Frame Grabbers, outros permite gravar seqncias inteiras em tempo real, so chamados de Vdeo
Grabbers. Algumas placas grficas j incorporam, alm da sada para o monitor de vdeo, a sada
para vdeo analgico compatvel com os padres conhecidos, e possuem tambm entrada para vdeo
analgico e para RF, ou seja, pode-se ligar o vdeo cassete no computador para capturar e gerar
novos vdeos, assim como usar o computador como sintonizador de TV (sinal de Rdio
Freqncia).
Uma imagem de vdeo gerada por uma cmera ou um videocassete pode ser digitalizada
diretamente a partir do sinal eltrico que a representa, que em geral est disponvel como uma sada
do equipamento.
O sinal de vdeo organizado em linhas de imagem, que contm um sinal analgico cada
uma. Portanto, o nmero de linhas da imagem j praticamente definido pelo prprio sinal de
vdeo; para os sistemas NTSC e PAL-M esse valor 525 e para o sistema PAL-G 625. Dentre
estas apenas aproximadamente 480 so visveis (na realidade somente de 240 a 360 linhas do sinal
de vdeo contm informao relevante).
O nmero de colunas normalmente escolhido de acordo com o nmero de linhas para
manter a razo de aspectos da imagem. A escolha do nmero de colunas tambm limitado pela
banda do canal de vdeo, que para o sinal padro NTSC da ordem de no mximo 750 pixels por
linha. Nas televises comerciais existem cerca de 440 pontos numa linha horizontal.

43

Fundamentos da Imagem Digital


A calibrao em alguns casos feita ajustando-se o nvel de branco e o nvel de preto.
Alm disso, preciso no esquecer de regular a prpria cmera, realizando o que se chama de
"bater o branco", ou seja, para uma determinada luz informar para a cmera o nvel de branco para a
gravao. As cmeras domsticas tentam realizar essa calibrao automaticamente.
Quando se est trabalhando diretamente com o conjunto cmera/digitalizador, aps a
captura da imagem, pode-se tentar melhorar a qualidade da mesma com um mtodo muito simples.
Com a cmera desfocada e/ou com um fundo neutro, como um papel cinza, captura-se uma
imagem, esta imagem ao ser subtrada da imagem normalmente capturada elimina sujeiras que por
ventura estejam na lente ou em um fundo irregular advindo de problemas de alinhamento do
equipamento, etc....

4.3. Cmeras Digitais


Cmeras Digitais usam um dispositivo chamado CCD (Charge Coupled Device) que atua
como se fosse o filme fotogrfico. Alcanam resolues de 640x480 at milhares de pixels. Os Line
Scan CCDs so usados para altas resolues, com alta linearidade, alta banda dinmica e readout
lento e possuem qualidade exceptional. O sistema de cor RGB. A calibrao pode ser feita
exatamente como um scanner, mas a qualidade da imagem agora depende de fatores externos, como
iluminao do objeto.
As cmeras de vdeo domsticas que conhecemos utilizam esse dispositivo. A limitao da
imagem gerada por estas cmeras est associada ao padro de vdeo analgico utilizado para
armazenar o vdeo na fita.
Mais recentemente com a padronizao de vdeo digital, j pode-se armazenar a imagem
capturada com qualidade muito superior a do vdeo tradicional. Inclusive algumas cmeras utilizam
3 CCDs para capturar a imagem, um para cada componente de cor R,G e B.

44

Fundamentos da Imagem Digital

5. Visualizao
H duas formas bsicas de visualizao, o monitor e a impressora, embora existam outros
dispositivos, como por exemplo gravadores de slides.

5.1. Monitores
Atualmente existem diversas tecnologias de monitores, os mais comuns funcionam como
as televises comerciais usando tubo de raios catdicos (C.R.T.). Mas a distncia entre os centros
dos trs fsforos RGB do monitor de 0,21mm e da TV de 0,60mm (essa distncia chamada de
dot pitch). So chamados de dispositivos matriciais de rastreamento, onde a imagem precisa ser reescrita na tela a cada determinado intervalo de tempo (isto um dos motivos das imagens digitais
serem chamadas de raster images). Por conseqncia, a imagem gerada para toda a tela do monitor
precisa ser guardada em algum dispositivo; este dispositivo a placa grfica.
O monitor utiliza o sistema RGB e possui um nmero determinado de pixels na horizontal
e na vertical. Mas a cor contnua, depende apenas das cores fornecidas pela placa grfica. Esta ir
dizer se estamos trabalhando em 640x480 com 256 cores ou 1280x1024 com 24 bits, por exemplo.
Assim, a visualizao no monitor dependente do melhor ajuste entre ele e a placa de vdeo.
Geralmente possuem baixa resoluo, aproximadamente 72 DPI.
Vimos que a imagem formada na tela, est sendo redesenhada a cada instante. Se este
redesenho no rpido o suficiente aparece o fenmeno chamado de flickering. A imagem parece
estar piscando. Isso ocorre porque a freqncia de rastreamento muito baixa para a configurao
escolhida. preciso saber se, tanto o monitor, quanto a placa grfica, suportam uma freqncia
aceitvel para a configurao desejada. Em geral, valores acima de 75Hz so excelentes, e 60Hz
aceitvel.
interessante observar que a razo de aspectos de um pixel na tela 1x1, mas um ajuste
errado do monitor pode provocar distores. As resolues de tela so mltiplos de 4x3 (640x480,
800x600, 1024x768) para que justamente resultem em pixels quadrados. Para verificar isso, veja se
a rea de visualizao no monitor est na razo 4x3 (cabe lembrar que a razo de uma tela de
cinema 2x1 e das novas televises de alta definio (HDTV) de 16x9). Um outra maneira de
fazer a calibrao de aspectos simplesmente desenhar um quadrado em pixels, usando por

45

Fundamentos da Imagem Digital

46

exemplo um programa simples de pintura, e medir esse quadrado com uma rgua na tela do
monitor, se estiver distorcido ento deve ajustar o monitor at que o quadrado esteja correto.
A calibrao de cor de monitores requer um dispositivo que colocado na sua tela e
retorna a informao de cor necessria para o programa de calibrao. Mas neste caso, a calibrao
tambm depende da luz ambiente.
Mesmo no possuindo esse dispositivo pode-se fazer um ajuste mnimo do monitor.
Primeiro, coloque na tela uma figura com uma grande rea preta e outra branca. Coloque o controle
no mnimo. Reduza o controle

at que o fundo preto da tela fique correto e no com um

certo brilho, mas no reduza demais, s o necessrio (se aumentando esse controle, logo acima
deste nvel, a tela ficar com uma cor escura em vez de um cinza escuro, o seu monitor est com um
problema de calibrao de um dos canhes, deve-se lev-lo um tcnico). Agora, ajuste o controle
de maneira que o branco mostrado fique com uma intensidade adequada para voc. Resista
tentao de colocar o brilho do monitor muito alto, isso tem uma srie de desvantagens alm de
piorar a qualidade da imagem.
Os controles

so chamados, para monitores modernos, de Nvel de Preto e

Imagem (Black Level and Picture) , respectivamente. O controle

ajusta o nvel de

preto, que faz com que toda a imagem fique mais clara ou mais escura, mas na realidade est
maximizando o contraste. O controle

ajusta o nvel de branco e por conseqncia todos os

valores intermedirios at o preto, sem modificar o nvel de preto, isso est na realidade est
ajustando o brilho. Por razes histricas, esses smbolos esto associados aos nomes de Brilho e
Contraste, respectivamente, por causa da sua simbologia.
Uma curiosidade sobre monitores e televiso que as TVs possuem qualidade muito
menor que a dos monitores, mas que visualmente as pessoas ficam satisfeitas com o resultado. Isso
acontece porque, quando um ponto impresso na tela da TV, ele na realidade sofre um fenmeno
de espalhamento fazendo com que a imagem fique com contornos mais suaves e consequentemente
agradvel para a vista. Alm do que, a gradao tonal muito mais suave por ser contnua, e no
caso do monitor est limitada pela placa de vdeo.

Fundamentos da Imagem Digital

5.2. Impressoras
Impressoras usam tecnologias muito variadas. Por isso, o processo de calibrao muito
complexo e as vezes no gera bons resultados. Este depende de muitos fatores: papel, tinta, at
umidade do ar. E existem uma grande variedade de dispositivos para faz-lo. Em contra partida,
impressoras chegam a altssimas resolues.
O sistema de cor na maioria das impressoras CMYK, mas existem algumas poucas
impressoras que usam o modelo RGB. Algumas impressoras operam apenas a 4 cores. Neste caso
utilizam resoluo espacial para compensar a baixa resoluo cromtica, com por exemplo tcnicas
de dithering vistas no tpico de Quantizao de Cor.
Por isto existem duas grandes problemticas envolvendo impresso de imagens. A primeira
relacionada a fidelidade da cor impressa, pois necessariamente precisamos converter de RGB para
CMYK. A segunda que a grande maioria das impressoras imprime somente com apenas 4 cores,
que no so combinadas. Assim, calibrao de cor e as tcnicas de dithering so fundamentais para
obtermos resultados de alta qualidade.
As impressoras de jato de tinta possuem resolues espaciais inferiores as das impressoras
laser, mas em contrapartida possuem resoluo cromtica muito melhor, podendo reproduzir at 16
milhes de cores, enquanto que a grande maioria das impressoras laser possuem apenas 2 cores, o
branco do papel e o preto. Neste ltimo caso, para imprimir tons de cinza, a impressora usa
resoluo espacial para simular tons enganando o olho, usando a proximidade entre os pontos
desenhados.
Levando esses fatos em considerao, devemos prestar ateno durante a insero de
imagens em documentos para no utilizarmos tamanhos muito grandes que no vo ser
aproveitados pela impressora e vo aumentar o tamanho do documento, assim como aumentar o
tempo de impresso, desnecessariamente.

47

Fundamentos da Imagem Digital

6. Armazenamento
Uma vez capturada a imagem, esta armazenada na memria do computador como uma
seqncia de bytes, ou melhor um mapa de bits (Bitmap). Este armazenamento feito independente
da resoluo e nmero de cores do monitor (Device Independent Bitmap - DIB), embora alguns
programas simples, como o PaintBrush do Windows 3.1, que usa um bitmap dependente da
configurao de tela.
Como vimos anteriormente, a imagem digital simplesmente uma matriz de pixels, onde
cada pixel um nmero (ou 3, etc...) que representa o valor da cor naquela posio.
Quanto maior o nmero de pixels, maior o tamanho da imagem na memria. Mas qual o
tamanho de cada pixel?
Isso vai depender de obviamente do sistema de cor e do nmero de bits usado para
representar cada componente. Se a imagem monocromtica (tons de cinza) ter apenas 1
componente, se for colorida no sistema RGB ter 3 componentes, e assim por diante.
Cada componente ser quantizada por um determinado nmero de bits. Em geral, usam-se
apenas 8. A partir da verso 4.0 o sistema Photoshop, por exemplo, passou a tratar imagens com 16
bits por componente. Cuidado para no confundir esse nmero com o valor de 16 bits de cor de
algumas resolues de display, neste caso usam-se 5 bits para cada componente RGB, e um bit
flexvel, normalmente usado para dar ao verde 6 bits. J em sistemas de processamento de imagens
cientficas muito comum tratar imagens com nmeros inteiros com 32 bits que incluem valores
negativos, ou at mesmo nmeros de ponto flutuante (valores com vrias casas decimais de
preciso).
Quando falamos de 8 bits, falamos de 28 (256) possibilidades de valores diferentes para
cada componente. Assim, se so 3 componentes temos 28x28x28 = 224 (tambm chamada de
resoluo de cor True Color), totalizando aproximadamente 16 milhes de cores possveis. claro
que imagem alguma usa toda as cores disponveis ao mesmo tempo.
Esta imagem mostra o efeito de reduzirmos a resoluo e/ou reduzirmos o nmero total de
cores de uma determinada imagem.

48

Fundamentos da Imagem Digital

O tamanho em bytes de uma imagem pode ser calculado com:


Tamanho = Largura x Altura x Profundidade x BPC
onde largura e altura so o nmero de pixels na horizontal e vertical, respectivamente; profundidade
o nmero de componentes do sistema de cor (RGB=3, CMYK=4, Tons de Cinza =1, ...); e BPC
o nmero de bits por componente, geralmente 8, mas pode ser 4 ou at mesmo 1. Um outro termo
utilizado BPP, bits por pixel que corresponde a Profundidade x BPC, totalizando o nmero de bits
efetivo que cada pixel ocupa.
Vejamos alguns exemplos do clculo do tamanho ocupado em memria por uma imagem:
Exemplo 1:
Imagem de 1024x768 com 24 Bpp = 2,25 Mb
Exemplo 2:
Imagem 15cm x 10cm capturada com 300 DPI em True Color (24 Bpp)
Largura = 15 x 300 / 2,54 = 1771
Altura = 10 x 300 / 2,54 = 1181
Tamanho = 1771 x 1181 x 3 = ~6 Mb

49

Fundamentos da Imagem Digital

50

Exemplo 3:
A mesma imagem com 600 DPI
Tamanho = ~24 Mb
Exemplo 4:
Pgina A4 com 600 DPI = ~100Mb
Historicamente, computadores no possuam uma interface grfica to poderosa quanto
temos hoje. Assim, foram definidas simplificaes para o modelo RGB, que embora diminuam
significativamente o nmero de cores disponveis, reduz o tamanho da imagem em memria. Essas
imagens so chamadas de indexadas ou coloridas com palheta de cores (indexed images, palette
based images).
Nessas imagens o valor do pixel contm um nico nmero que corresponde a um ndice
para uma tabela, essa tabela que conter o valor da cor em RGB. Imediatamente podemos ver que
as 3 componentes so reduzidas para 1, isso j uma grande economia j que o tamanho da palheta
pequeno perto do tamanho da imagem. As imagens tons de cinza podem ser vistas como um caso
particular onde a palheta contm os valore de R, G e B iguais.
Tabela de Cores
NDICE

Imagem
...

...

...

...

123 ...

...

...

...

123

...

...

...

255

32

128

...

6.1. Compresso
Observando os exemplos anteriores vemos que no h computador que resista a tanto
pixel. Por isso foram criados, e ainda so muito estudados, mtodos de compresso de imagem.
Esse mtodos podem ser classificados em dois tipos, com perdas em sem perdas. Os mtodos com
perdas so baseados no fato de que pequenos detalhes podem ser eliminados que perceptualmente
no sero notados de imediato.
Dentre os mtodos com perdas se destacam o JPEG (Join Photographic Experts Group),
criado a partir de uma composio de vrias tcnicas e adotado amplamente. Um outro mtodo

Fundamentos da Imagem Digital

51

muito bom chamado de Fractal, embora pouco use da matemtica de fractais. Esse mtodo
infelizmente privado de uma empresa que comercializa seus direitos de uso.
Dentre os mtodos sem perdas, podemos enumerar vrios: Cdigo de Huffman, RLE (Run
Lenght Encoding), LZW (Lempel-Ziv & Welch), JBIG (Join Bi-level Image Experts Group). Cada
um desse mtodos utiliza uma tcnica diferente que em geral lhe d o nome.
O mais simples de todos e tambm o mais fcil de entender, o RLE. Esse mtodo usa o
fato de que imagens podem possuir muitos pixels repetidos em seqncia numa mesma linha.
Assim, em vez de armazenar todas essas repeties, armazena-se o valor repetido e o nmero de
repeties. Obviamente esse mtodo s funciona bem para imagens com muitas reas de uma
mesma cor.

6.2. Formatos de Arquivo


Como a memria RAM do computador voltil, precisamos de algum mecanismo de
persistncia para a imagem, ou seja, grav-la em um arquivo. Os detalhes de como gravar imagens
em arquivos no so universais e consequentemente existem vrios padres.
A tabela a seguir mostra os formatos de arquivo padronizados que j esto bem
estabelecidos no mercado:
Formato

Sistema de Cor

Compresso

GIF

RGB 256

LZW

TIFF

RGB*,
CMYK, RLE, LZW, JPEG, JBIG,
YCbCr, Lab, Luv Outros

JPEG

RGB,
YCbCr, JPEG
CMYK, Gray

PCX

RGB*

RLE

BMP

RGB*

RLE

TGA

RGB*

RLE

Repare que o formato TIFF se destaca entre os demais. Atualmente ele o formato mais
recomendado para armazenar imagens que sero usadas em diversos programas, pois praticamente
todos j o reconhecem e sua flexibilidade enorme.

Fundamentos da Imagem Digital


Dois outros formatos so importantes de serem mencionados, o GIF e o JPEG. Isto porque
eles so utilizados como os padres de imagem na Internet.
O formato GIF armazena apenas imagens RGB com 256 cores ou menos, sendo adequado
para imagens de mais baixa qualidade e imagens tons de cinza. Esse formato permite que voc
defina uma cor que ser ignorada pelo Browser, tornando parte da imagem que contm aquela cor,
transparente. Uma outra caracterstica interessante que as linhas no arquivo podem ser gravadas
entrelaadas, fazendo com que o Browser receba algumas linhas de toda a imagem antes de
chegarem todas as linhas, permitindo um efeito de que toda a imagem est sendo recebida em nveis
de qualidade crescentes. Esse formato possui duas verses 87a e 89a, somente a segunda que
permite transparncia. O GIF usa compresso LZW para comprimir a imagem. Essa compresso
muito semelhante a usada no formato de arquivo compactado ZIP e possui timos resultados. Alm
disso, esse formato suporta vrias imagens num mesmo arquivo, formando opcionalmente uma
animao.
O formato JPEG, usa a compresso JPEG que lhe deu o nome, e permite gravar imagens
Tons de Cinza, RGB, CMYK e outros sistemas de cor, mas sempre comprimidas com perdas.
Embora tenha perdas o melhor formato para colocar imagens de alta qualidade. Para Internet o
efeito da imagem sendo recebida com nveis de qualidade crescentes feito atravs de codificao
progressiva (Progressive Encoding). No possui transparncia.
Um outro formato que est sendo padronizado para a Internet o PNG (Portable Network
Graphics). Cuja compresso sem perdas e permite imagens com mais alta qualidade que o GIF.
Alm de no usar a compresso LZW por causa de um problema de direitos autorais com o GIF.
Um erro muito comum tratar formatos de arquivos de imagem como tipos de imagem.
Mas preciso ficar bem claro que tipos de imagem no esto intrinsecamente associados formatos
arquivos, estes se prestam apenas ao armazenamento das mesmas. Portanto no faz sentido falar em
uma imagem TIFF e uma imagem GIF, como imagens diferentes.

6.3. Imagens Grandes e Multiresoluo


Mesmo com os mtodos de compresso, para processarmos as imagens, precisamos
descomprimi-las para a memria do computador. Quando as imagens so muito grandes
comparadas ao tamanho da memria RAM disponvel, temos que utilizar de outros recursos para
poder processar tal imagem.

52

Fundamentos da Imagem Digital


O primeiro deles memria virtual, ou seja, usar disco como se fosse memria RAM.
Como no precisamos de toda imagem ao mesmo tempo, deixamos uma parte dela no disco, quando
esta parte requisitada, carregamos a mesma para a memria e descarregamos para o disco partes
que no esto sendo utilizadas.
Um outro recurso utilizar o conceito de multiresoluo. O que o prprio nome diz que
teremos a mesma imagem em diferentes nveis de resoluo. Dependendo da resoluo que o
usurio estiver trabalhando, somente um nvel afetado. Quando o usurio muda de nvel, as
mudanas realizadas naquele nvel so propagadas para o novo nvel. Somente quando o usurio
chega no ltimo nvel ou pede para salvar as alteraes em disco, que a propagao feita para
todos os nveis.
Esta imagem mostra os nveis de uma imagem em multiresoluo.

Quando possumos muitas imagens grandes comum guardarmos uma verso reduzida
para consulta rpida ao contedo do arquivo, esta verso reduzida chamada de thumbnail.

53

Fundamentos da Imagem Digital

54

7. Processamento
As funes de processamento de imagens digitais podem ser classificadas em duas classes,
por escopo ou por resultado. Por escopo, est relacionado com tcnicas de processamento. Por
resultado, est relacionado com os tipos de resultado de cada tcnica.

Captura/Digitalizao
Pixels
Anlise
Qualitativa

Restaurao/Realce
Pixels
Segmentao
Grupos de Pixels
Extrao de Atributos

Anlise
Quantitativa

Dados
Classificao
Grupos de Dados
Reconhecimento

Atravs do diagrama mostrando uma seqncia tradicional para processamento da imagem,


da captura classificao, podemos ter uma idia melhor das classes de processamento por
resultado.
H um fator comum em todas as classes de processamento, este fator qualidade. Existem
duas subdivises em qualidade de imagem: fidelidade e inteligibilidade. No primeiro caso estamos
preocupados em aproximar a imagem processada da imagem original ou de um padro estipulado
que a melhor represente. No segundo caso, nos preocupamos com a informao que conseguimos
extrair da imagem, seja pelo olho humano, seja por algum processamento.
Programas para editorao eletrnica precisam ter um cuidado muito grande com a
fidelidade na representao da cor da imagem, j programas de processamento de imagens
cientficas em geral no esto preocupados com a fidelidade da cor e sim a informao contida na
imagem.

Fundamentos da Imagem Digital

7.1. Restaurao/Realce
Quando estamos no contexto de editorao eletrnica, ficamos normalmente situados
apenas no escopo de operaes de Realce ou Obscurecimento, e Restaurao ou Deformao.
A restaurao busca compensar distores especficas, normalmente gerada no momento
de aquisio. Quando se pode identificar experimentalmente a funo que representa a deformao
ou construir um modelo matemtico adequado, possvel buscar a funo inversa e aplic-la sobre
a imagem deformada. Por exemplo: Correo de foco, Imagens borradas por movimento. Em todos
os casos, a formulao matemtica envolvida extremamente complexa e o custo computacional
muito alto. Os resultados podem ter conseqncias somente qualitativas.

7.2. Segmentao
Quando estamos no contexto de processamento de imagens cientficas, o mais comum
queremos obter dados relacionados com os objetos presentes na imagem. Ento so necessrias as
operaes de Segmentao que procuraro isolar regies de pixels, e operaes de Extrao de
Atributos que vo olhar para essas regies e calcular uma srie de parmetros que as descrevero.
A operao de segmentao mais comum a limiarizao por um tom de corte. Tudo que
est acima deste tom vira branco, tudo que est abaixo vira preto, obtendo-se uma imagem binria.
A partir desse momento as operaes Morfolgicas so excepcionalmente teis, veja em Operaes
Locais.

7.3. Extrao de Atributos


Utilizando imagens binrias muito simples obter dados relevantes, ou atributos, das
regies segmentadas, tais como:
Nmero total de objetos.
Propriedades geomtricas, do tipo: rea, Permetro, Centro de gravidade, Largura mxima
e mnima
Atributos relacionados forma, tais como: Circularidade, Concavidade
Propriedades de luminncia, tais como: Nvel de cinza mdio de cada regio (1o momento
da distribuio), Desvio padro do nvel de cinza (2o momento da distribuio),
outros momentos estatsticos da distribuio de cada regio (skewness e kurtosis)

55

Fundamentos da Imagem Digital


Propriedades associadas textura
As propriedades geomtricas so medidas diretamente sobre a imagem binria. As de
luminncia so obtidas da imagem original, a partir da informao de posio dos diversos objetos,
fornecida pela imagem binria.

7.4. Classificao
Uma vez com esses parmetros coletados, queremos distinguir objetos na imagem
agrupando esses parmetros de acordo com sua semelhana para cada regio de pixels encontrada.
Feita essa classificao desses parmetros os objetos esto reconhecidos e podemos agora tomar
decises e relatar fatos relacionados com os objetos do mundo real, ponderando sempre atravs uma
medida de erro da classificao.
Este processo muito complexo e existem diversos nveis de automao. Os mais simples
implicam em processos de agrupamento estatstico, para os quais a deciso humana fundamental.
Os mais sofisticados permitem ao computador reconhecer diferentes objetos atravs de tcnicas de
inteligncia artificial com pouca ou nenhuma interveno humana. Os processos que possuem
interveno so chamados de supervisionados.
Aqui, a palavra classificao no denota nenhum juzo de valor, mas apenas o grupamento
em classes dos diversos objetos obtidos na segmentao, cujos atributos j foram medidos.
Em geral, vrios atributos so necessrios para uma correta classificao. Mas, quanto
mais atributos, mais complexo se torna o problema. Desta forma, muito importante realizar uma
seleo adequada dos atributos disponveis, visando otimizar o processo.

7.5. Operaes Pontuais


Operaes pontuais so operaes em que um pixel da imagem resultante depende apenas
do mesmo pixel na imagem original. Neste caso a nica informao que ns temos a cor do pixel,
por isso muitas das operaes pontuais so operaes que alteram caractersticas de cor e
luminncia, tais como: brilho, contraste, nvel de branco e nvel de preto, saturao, correo
gamma, limiar (threshold), posterizao, solarizao, negativo, etc.

56

Fundamentos da Imagem Digital

57

Original

Processada
OpP(f(xi,yi))

Qualquer operao pontual pode ser visualizada como um mapeamento de pixels da


imagem original para a imagem processada. E isso facilmente representado como um grfico que
relaciona as tonalidades disponveis na imagem original com as tonalidades disponveis na imagem
processada. Inclusive algumas operaes bastante conhecidas so visualizadas nesse grfico como
funes muito simples. A operao pontual de identidade simplesmente uma reta que mapea todos
os tons da imagem original nos mesmos tons na imagem processada. Transladando essa reta
estamos simplesmente alterando o brilho na imagem. Alterando sua angulao estamos alterando o
contraste, mas existem outras formas de se alterar o contraste como por exemplo usando uma
funo logartmica que faria com que tons escuros fosse mapeados em um nmero maior de tons,
realando esses tons escuros, ou o inverso, uma funo exponencial onde tons claros seriam
realados.

Preto
Branco
Tonalidades na Imagem Original

Fundamentos da Imagem Digital


At agora estvamos falando de operaes pontuais que envolvem apenas uma imagem
original. Estas so chamadas de unrias. Mas podemos definir operaes que usam mais de uma
imagem original, so chamadas de binrias, ternrias, etc. Por exemplo, uma operao de mdia de
vrias imagens capturadas na mesma posio, uma tcnica comum de eliminao de rudo. Mas as
operaes binrias mais comuns so as operaes aritmticas de soma, subtrao, diviso, etc de
duas ou mais imagens.
Embora as funes pontuais estejam restritas somente ao pixel sendo processado, o
processamento em si pode levar em considerao dados globais da imagem, como por exemplo o
histograma.
O histograma uma funo estatstica da imagem que para cada nvel de tonalidade,
calcula quantos pixels existem naquela tonalidade. Muitas operaes pontuais usam o histograma
como parmetro de deciso para fornecer resultados diferentes para o pixel da imagem processada.

Esta imagem mostra o histograma de uma imagem monocromtica.

7.6. Operaes Locais


Operaes pontuais so operaes em que um pixel da imagem resultante depende de uma
vizinhana do mesmo pixel na imagem original. As operaes locais mais comuns so as operaes
de filtragem que usam uma convoluo com um kernel de dimenso nxn, onde n tipicamente 3, 5,
7 e 9, mas pode assumir qualquer valor. Por exemplo, no caso de n=3 muito fcil de entender.
Cada pixel da vizinhana 3x3 do pixel na imagem original multiplicado por um valor e todos
esses valores so somados resultando no pixel novo. Os valores que ponderamos a vizinhana so

58

Fundamentos da Imagem Digital

59

armazenados em uma matriz chamada, neste caso, de kernel de convoluo. Operaes de Blur,
Sharpen, Deteco de Bordas e muitas outras so implementadas assim.

Original

Processada
OpL( f(xi,yi),
f(xi-1,yi-1),
f(xi+1,yi+1),
f(xi-1,yi+1),
f(xi+1,yi-1),
... )

As operaes que realizam deformaes no grid de pixels utilizam, como vimos, a tcnica
de interpolao para encontrar o novo ponto. A tcnica de interpolao no deixa de ser uma
operao local que depende apenas de uma vizinhana, embora algumas tcnicas de interpolao
muito sofisticadas e em geral muito lentas usam uma vizinhana bem extensa. Dentre as tcnicas
que usam interpolao podemos citar: Warping, Morphing, Resize, Stretch, Rotao, etc.
Um outro conjunto de operaes que tambm podem ser consideradas como locais so as
operaes Morfolgicas. So muito utilizadas por sistemas de processamento de imagens cientficas
para a etapa de segmentao, como j mencionado. Embora muito semelhantes a convoluo com
um kernel, a forma com que os vizinhos so computados ligeiramente diferente, pois usam
operaes lgicas, tais como AND e OR.

7.7. Operaes Globais


Operaes globais so operaes em que um pixel da imagem resultante depende de um
processamento realizado em todos os pixels da imagem original. Neste grupo de operaes esto as
transformadas de domnio, tais como a Transformada de Fourier, a Transformada de Wavelets (que
na realidade so muitas, dependem de que wavelet est sendo usada) e a Transformada de Hough.
Todas essas transformadas nos do informaes muito interessantes sobre a imagem
original. A Transformada de Fourier, por exemplo, base fundamental para toda teoria de

Fundamentos da Imagem Digital


processamento de sinais e com ela pode-se realizar uma srie de operaes muito importantes com
imagens. A Transformada de Wavelets ir decompor a imagem em uma estrutura de multiresoluo,
que muito utilizada para compresso de imagens. A Transformada de Hough procura identificar
formas geomtricas na imagem, tais como retas e crculos.
Esse grupo de operaes visto somente em programas de processamento de imagens
cientfico.

60

Fundamentos da Imagem Digital

8. Software
Existem diversos sistemas de processamento de imagens disponveis no mercado. Eles se
distinguem pela forma de distribuio (Comercial, Shareware, Freeware), pela rea de aplicao
(editorao eletrnica, anlise cientfica, visualizao, edio informal, pesquisa, ), e pelas
plataformas em que esto disponveis (UNIX, Windows, MAC, ).
O programa mais bem sucedido, no importando a categoria, o Adobe Photoshop.
Atualmente na verso 5.0, um dos mais robustos e confiveis sistemas de processamento de
imagens. voltado para editorao eletrnica e no possui funes de anlise de imagens. Possui
verses para MAC, Windows e UNIX.
Seguindo essa mesma linha temos o Corel PhotoPaint e o Fractal Design Painter, mas estes
s rodam no ambiente Windows. O Fractal Design Painter possui mecanismos muito peculiares de
pintura, alm de permitir a criao de animaes usando seqncias de imagens.
Outros programas na mesma linha, mas que ganharam popularidade por serem
Shareware/Freeware e no possurem a complexidade dos sistemas acima, so o Paint Shop Pro e o
LviewPro. Um programa semelhante a esses, mas que realiza apenas a visualizao o ACDSee, se
tornou popular pela facilidade de fazer Slide Shows. Todos esses so somente para Windows.
No UNIX temos o GIMP e o XV, este ltimo muito divulgado na Internet. Ambos so
Freeware.
Quando se trata de anlise de imagem e processamento cientfico, muitos dos programas
mencionados so teis, mas outros assumem um nicho no atacados por estes.
Na linha Freeware temos o NIH Image (MAC) e o Image Tool (Windows). No UNIX
temos ainda dois grandes sistemas o Khorus e o XITE. Sendo que o Khorus abrange muito mais do
que processamento de imagens.
Na linha comercial temos o KS-400 (Windows), e o Digital Micrograph (MAC e
Windows), ambos voltados para anlise de imagens em microscopia tica e eletrnica. Temos
tambm outros mais gerais, como o Image Pro, o Optimas, e o WiT. Este ltimo tem uma
caracterstica muito interessante de permitir a criao de macros usando uma linguagem visual.

61

Fundamentos da Imagem Digital


Adobe PhotoShop
Como este muito difundido, convm comentarmos algumas funes do mesmo
associando-as aos conceitos aqui apresentados. Vamos estar comentando funes da verso 4.01.
No menu Image temos as funes Image Size e Canvas Size, ambas relativas a resoluo
espacial da imagem.
Na funo Image Size quando Resample Image est marcado pode-se mudar o tamanho
em pixels da imagem, quando est desmarcado pode-se mudar apenas o tamanho real da imagem
sem mudar o nmero de pixels. Junto a este controle voc tambm pode escolher o mtodo de
interpolao, quando o nmero de pixels for mudar. Este dilogo bastante verstil permitindo
manter a razo de aspectos da imagem original, e permite tambm mudar o tamanho em pixels
baseado no tamanho real e na resoluo.
A funo Canvas Size ir mudar o nmero de pixels da imagem, mas apenas acrescentar
pixels acima, abaixo ou dos lados de acordo com a posio da imagem original em Anchor.
Tome cuidado ao mudar o tamanho da imagem, pois ao reduzi-la estar sempre perdendo
informao, e ao aument-la corre o risco de ocupar muita memria.
Alguns procedimentos relacionados com calibrao dos sistemas de cor utilizados so
feitos no submenu Color Settings do menu File.
Embora suporte 16 bits por componente, alm dos tradicionais 8, praticamente nenhuma
funo fica habilitada quando muda-se para 16 bits. Ainda no entendi o objetivo do suporte a 16
bits j que quase nada pode ser feito.
No submenu Mode do menu Image voc normalmente ir, e deve, usar o sistema de cor
RGB, junto com suas variaes: Gray Scale e Indexed Color. Em geral mais conveniente
processar a imagem nesses modos e depois converte-la para algum outro, se necessrio. O modo
Bitmap serve para converter a imagem para apenas 1 bit por pixel.
Quando se est trabalhando no modo RGB pode-se visualizar rapidamente como seria sua
imagem em CMYK selecionado a opo CMYK Preview do menu View.
O sistema CMYK usado para criar uma separao de cores para a impresso. Tambm
pode-se us-lo para se trabalhar diretamente sobre imagens CMYK provindas de determinados
dispositivos.

62

Fundamentos da Imagem Digital


O sistema Lab usado quando se quer trabalhar com imagens de PhotoCD ou quando se
quer editar a componente de luminncia independentemente dos valores de cromaticidade. O
sistema Lab tambm usado internamente para converter de um sistema para outro e o
recomendado para o transporte de uma aplicao para outra.
Tambm tenha cuidado ao utilizar o submenu de Mode, pois durante as converses de um
sistema para outro podem ocorrer perdas na imagem. Exceto quando convertendo para
Multichannel que apenas separa cada uma das componentes para serem trabalhadas
independentemente.
Quando a imagem est em tons de cinza, pode-se trabalhar com o modo de Duotone, que
inclui monotone, duotones, tritones e quadtones. Nesses modos a escala de cinzas substituda por
uma escala em um tom, de uma, duas, trs ou quatro cores, respectivamente. Este modo til para a
impresso da imagem quando a tinta preta substituda por uma outra cor (monotone) ou quando
usa-se uma segunda cor (duotone), por exemplo um cinza, para aumentar a escala tonal da imagem
impressa.
Todas as funes do submenu Adjust do menu Image so operaes pontuais e dependem
somente da cor do prprio pixel na imagem original. A funo Calculations do menu Image so
operaes pontuais binrias ou ternrias por precisam de duas ou mais imagens. Quando voc junta
dois ou mais Layers em um nico Layer, est realizando tambm uma operao pontual. J no caso
do menu Filter a grande maioria das funes so operaes locais.

63

Fundamentos da Imagem Digital

9. Aplicaes
Qualquer rea onde se possa capturar uma imagem e dela obter resultados uma rea onde
pode ser usado um sistema de processamento de imagens. Devido a esta vasta amplitude de reas de
aplicao, sistemas de processamento de imagens so, priori, inter-disciplinares. Seguem alguns
exemplos:
- Sensoriamento Remoto
Centenas de fotografias, enviadas por naves espaciais e satlites em torno da terra,
precisam ser avaliadas e catalogadas com fidelidade e eficincia. Fotos de pases podem ser usadas
para a obteno rpida de mapas cartogrficos e estudos geogrficos, tais como anlise do solo e da
safra agrcola.
- Microscopia.
Anlise de imagens provindas de microscpios ticos ou eletrnicos, em reas que variam
desde a medicina at a metalurgia, identificando e classificando partculas.
- Medicina.
Imagens radiogrficas de baixa qualidade podem ser realadas para a obteno de um
diagnstico mais preciso. Com a introduo da tomografia computadorizada e da ressonncia
magntica, imagens volumtricas so utilizadas para diversas aplicaes, tais como planejamento
cirrgico e diagnstico.
- Manuteno de obras de arte.
Evitar a degradao com o tempo de obras de arte no um processo simples, mas
possuindo uma imagem da obra original que pode ser processada para ajudar no processo de
restaurao para se obter um retrato mais fiel o possvel. Alm disso, existem estudos para a
verificao da autenticidade de pinturas atravs da anlise das pinceladas de cada pintor.
- Identificao de impresses digitais.
Atravs de adequada classificao e armazenamento pode-se identificar uma impresso
digital usando um banco de dados associado a um banco de imagens.

64

Fundamentos da Imagem Digital


- Armazenamento de documentos.
comum que grandes quantidades de informao fiquem "encalhadas" devido
dificuldade de acesso a quilos de papel que ficam engavetados e deteriorando. Estes textos podem
ser transferidos para um sistema de hipertexto que permita uma consulta rpida e dinmica. Para
tanto, necessrio capturar as imagens dos textos e depois realizar um reconhecimento de
caracteres, segue ento um processo de integrao ao hipertexto. Muitas vezes estes textos so
documentos oficiais que precisam manter suas caractersticas, portanto as prprias imagens so
armazenadas.
- Medidas de velocidade de escoamento de fluidos.
Atravs de partculas suspensas no lquido, pode-se iluminar um corte no escoamento
atravs de um plano de luz, e utilizando uma exposio lenta obtm-se uma fotografia com traos
correspondentes s trajetrias das diversas partculas. A partir dos comprimentos dos traos pode-se
obter uma medida aproximada da velocidade do fluido.
- Controle de qualidade.
A aplicao de processamento de imagens na rea de controle de qualidade muito vasta.
Praticamente qualquer processo industrial que necessite de alguma monitorao tica ou visual
pode ser automatizado com vantagens. O que pode impedir o grau de dificuldade de interpretar
cada imagem, assim como em qualquer outra aplicao de anlise de imagens.
Uma aplicao comum a verificao de placas de circuito impresso, que possuem uma
geometria simples e regras fixas.
- Outros: Astronomia, Fotografia, Vdeo, Efeitos Especiais, etc.

65

Fundamentos da Imagem Digital

10. Internet Links


Logical Vision Ltd - http://www.logicalvision.com
Synoptics Ltd - http://www.synoptics.co.uk
AccuSoft - http://www.accusoft.com
Media Cybernetics Image Analysis Home Page (Image Pro) - http://www.mediacy.com
Xite - http://www.ifi.uio.no/~blab/Software/Xite
GIMP - http://www.gimp.org
XV - http://www.trilon.com/xv
NIH Image - http://rsb.info.nih.gov/nih-image
ImageTool - http://ddsdx.uthscsa.edu/dig/itdesc.html
Poynton's Colour FAQ http://www.inforamp.net/~poynton/notes/colour_and_gamma/ColorFAQ.html
A Standard Default Color Space for the Internet (sRGB) http://www.w3.org/Graphics/Color/sRGB.html

66

Fundamentos da Imagem Digital

11. Bibliografia
[BAXES 94] G. A. Baxes; "Digital Image Processing (Principles and
Applications)"; John Wiley & Sons, Inc.; 1994.
[CASTLEMAN 95] K. R. Castleman; "Digital Image Processing"; Prentice-Hall,
Inc.; 1995.
[GOMES 97] J. Gomes e L. Velho; "Image Processing for Computer
Graphics"; Springer; 1997.
[CHAVES 91] E. O. C. Chaves; "Multimdia - Conceituao, Aplicaes e
Tecnologia"; People Computao Ltda.; 1991.
[FOLEY 96] J. Foley, A. van Dam, S. Feiner, J. Hughes; "Computer
Graphics: Principles and Pratice"; Addison-Wesley; 1996.
[GONZALEZ 92] R. C. Gonzalez, R. Woods; "Digital Image Processing";
Addison-Wesley; 1992.

67

Você também pode gostar