Escolar Documentos
Profissional Documentos
Cultura Documentos
Tecgraf/PUC-Rio
Janeiro de 1999
Descrio
Apresentamos aqui os conceitos bsicos envolvidos em Processamento de Imagens
Digitais e procuramos dar uma viso geral da rea. Mas, no sero apresentadas tcnicas de
processamento em profundidade, nem pelo lado matemtico, nem pelo lado computacional.
Por isso mesmo, serve tanto a pessoas da rea tcnica que esto iniciando seu aprendizado
em Processamento de Imagens, ou pessoas de Editorao Eletrnica que queiram aprender os
conceitos que esto por traz de programas como o Adobe PhotoShop e o Corel PhotoPaint.
Assim, qualquer um com conhecimentos bsicos em computadores, pode assistir ao curso.
Mas, o conceito matemtico de funo largamente utilizado e fundamental para o entendimento
de algumas noes.
Os conceitos apresentados servem tambm como uma preparao para um curso mais
avanado de Processamento de Imagens. Inclusive vrios conceitos so tratados superficialmente
por esse motivo e para no tornar o texto ilegvel para pessoas que no sejam da rea tcnica. Mas,
uma das maiores dificuldades aqui definir o que deve realmente ser superficial e o que no deve.
Isso s a evoluo desse material, atravs do retorno de pessoas que tenham acesso a ele, poder
dizer.
No futuro pretendemos criar mais dois textos, um chamado Tcnicas de Processamento de
Imagens Digitais com enfoque matemtico e computacional, e outro Aplicaes de Imagens
Digitais com enfoque prtico envolvendo aplicaes cientficas, incluindo vrios estudos de casos.
Ementa
Dividimos a apresentao em 3 tpicos bsicos, mais 3 tpicos complementares e por fim,
3 tpicos de tcnicas e aplicaes. Sugerimos que sejam vistos inicialmente os trs primeiros
tpicos para melhor compreenso dos demais.
Conceitos Bsicos
Apresentamos alguns dos conceitos bsicos necessrios para o entendimento dos outros
tpicos. Situamos Processamento de Imagens e Computao Grfica, apresentamos o
Paradigma dos Quatro Universos, e mostramos algumas noes de contnuo e discreto.
Resoluo Espacial
Quando realizamos a passagem para o mundo digital, a primeira grande etapa para imagens
a amostragem. Aqui vamos explorar um pouco mais essa questo, assim como seu problema
inverso, o de reconstruo da imagem original. Como veremos reconstruo sinnimo de
interpolao. Veremos tambm uma definio do importante conceito de aliasing.
Cor
O que cor? Como representar cor no computador? Quais os padres estabelecidos? Essas
e outras perguntas sero abordadas aqui de maneira introdutria. Falaremos tambm sobre
Luminncia e Crominncia, assim como outras propriedades de cor, e por fim veremos algumas
tcnicas de quantizao.
Captura
Apresenta alguns dos dispositivos que usamos para passarmos a imagem para o mundo
digital. No caso Scanners, Frame/Vdeo Grabbers e Cmeras Digitais.
Visualizao
Uma vez a imagem tendo sido digitalizada, imediato o desejo de reconstru-la em alguma
superfcie de visualizao. As mais comuns so monitores e impressoras. Sobre estes mostraremos
algumas peculiaridades.
Sumrio
1.
Conceitos Bsicos.......................................................................................................................7
1.1. Computao Grfica e Processamento de Imagens..............................................................7
1.2. Tpicos de Processamento de Imagens ...............................................................................9
1.3. Contnuo x Discreto............................................................................................................9
1.4. O Paradigma dos Quatro Universos ..................................................................................11
2.
Resoluo Espacial...................................................................................................................15
2.1. Topologia de um Pixel ......................................................................................................16
2.2. Reconstruo ....................................................................................................................18
2.3. Aliasing ............................................................................................................................20
3.
Cor............................................................................................................................................22
3.1. Processos de Formao de Cor..........................................................................................23
3.2. Amostragem e Reconstruo de Cor .................................................................................24
3.3. Cor no Paradigma dos 4 Universos ...................................................................................26
3.4. Padronizao para Cor......................................................................................................27
3.5. Sistemas de Cor................................................................................................................32
3.6. Sistemas de Gerncia de Cor.............................................................................................37
3.7. Quantizao com Menos de 24 bits...................................................................................39
4.
Captura ....................................................................................................................................42
4.1. Scanners ...........................................................................................................................42
4.2. Digitalizadores de Sinal de Vdeo .....................................................................................43
4.3. Cmeras Digitais...............................................................................................................44
5.
Visualizao .............................................................................................................................45
5.1. Monitores .........................................................................................................................45
Armazenamento.......................................................................................................................48
6.1. Compresso ......................................................................................................................50
6.2. Formatos de Arquivo ........................................................................................................51
6.3. Imagens Grandes e Multiresoluo ...................................................................................52
7.
Processamento..........................................................................................................................54
7.1. Restaurao/Realce...........................................................................................................55
7.2. Segmentao ....................................................................................................................55
7.3. Extrao de Atributos .......................................................................................................55
7.4. Classificao ....................................................................................................................56
7.5. Operaes Pontuais...........................................................................................................56
7.6. Operaes Locais..............................................................................................................58
7.7. Operaes Globais............................................................................................................59
8.
Software ...................................................................................................................................61
9.
Aplicaes.................................................................................................................................64
10.
11.
Bibliografia ..............................................................................................................................67
1. Conceitos Bsicos
1.1. Computao Grfica e Processamento de Imagens
Antes de mais nada, precisamos nos situar dentro do contexto de Computao Grfica.
Estamos trabalhando basicamente com dois tipos de informao: Visual e Descritiva. Informao
visual por exemplo a imagem vista na tela do computador. Informao descritiva referente ao
modelo matemtico que representa os objetos visualizados. A rea de Processamento de Imagens
abrange operaes que so realizadas sobre imagens e que resultam em imagens. A rea de
Computao Grfica abrange as operaes de sntese de imagem, ou seja, a gerao de uma
visualizao do modelo. A rea de Viso Computacional abrange as operaes de anlise dos
objetos contidos na imagem e a gerao de modelos matemticos desses objetos.
Processamento
de Imagens
Informaes
Visuais
(Imagem)
Viso
Computacional
(Anlise)
Computao
Grfica
(Sntese)
Informaes
Descritivas
(Modelo)
Captura
Processamento
Imagem
Digital
Compresso /
Armazenamento
Visualizao
f :
x f ( x)
10
f(x)
O computador s capaz de armazenar bits, um valor que pode ser 0 ou 1. Para simplificar
as coisas juntou-se 8 bits formando uma palavra chamada de byte. Um byte ento pode assumir 28 =
256 valores diferentes, variando de 0 a 255. Quando falamos de sistemas operacionais de 16 bits e
32 bits, estamos falando da maior palavra que aquele sistema pode processar de uma vez, por isso
sistemas de 32 bits so mais eficientes que os de 16.
Assim, o computador trabalha sempre com nmeros inteiros ou na melhor das hipteses
com uma aproximao de um nmero real, chamada de ponto flutuante (isso porque o nmero de
bits dedicado para as casas decimais flexvel de acordo com o nmero). Por conseqncia, no
possvel representar uma funo contnua no computador. Podemos apenas simula-la.
O processo para trazer uma funo contnua para o computador discretizando-a (ou
digitalizando-a), ou melhor, tomando valores pontuais ao longo de x e guardando o valor de f(x)
correspondente ( claro que o eixo f(x) tambm contnuo, assim tambm precisaremos discretizalo). O processo de discretizao do eixo x (o domnio) chamado de Amostragem, o do eixo f(x) (o
contradomnio) chamado de Quantizao.
Em resumo, a discretizao de qualquer sinal contnuo primeiro passa por uma
amostragem e depois passa por uma quantizao. Alm disso, no podemos armazenar um sinal que
se estenda indefinidamente, portanto o sinal digital tambm limitado a um intervalo do domnio.
11
Contnuo
Discreto
f(x)
f(x)
Amostragem
f(x)
12
A codificao dos dados pode ser decodificada e depois reconstruda para podermos voltar
com o fenmeno estudado para o mundo real.
Universo
Fsico
Universo
Matemtico
Discretizao
Universo de
Representao
Codificao
Representao Discreta
Decodificao
Universo de
Implementao
Estruturas de Dados
13
Imagem
Fotogrfica
Imagem
Contnua
Imagem
Digital
Imagem
Codificada
Matriz de Cores
f(x,y)
y
x
A imagem digital obtida a partir de uma amostragem e de uma quantizao dessa funo,
como j foi visto, e pode ser representada pela mesma funo, s que neste caso, x e y so nmeros
inteiros. Uma vez amostrado o plano temos uma matriz de valores que representam a cor. Cada
elemento dessa matriz chamado de Pixel (abreviao de Picture Element).
14
Mas, ainda no falamos nada sobre a quantizao da cor. Na realidade cor tambm um
fenmeno fsico para o qual precisamos fazer os mesmos passo que fizemos para o plano da
imagem. Precisamos descobrir a definio de cor, suas representaes e como traz-las para o
computador. Por enquanto, vamos deixar essas discusses de lado e atacar a questo de amostragem
do plano 2D onde as cores esto distribudas.
A figura a seguir ilustra o processo de discretizao da imagem e mostra uma possvel
codificao da cor para cada elemento da matriz.
Imagem Contnua
Amostragem
f(x)
Pixel
Quantizao
x
...
3
2
1
0
...
23
27
45
1
...
63
43
32
2
Codificao
2. Resoluo Espacial
Ao ser digitalizada a imagem assume um tamanho adimensional, em pixels. Mas, pode-se
conhecer uma medida de qualidade da amostragem, conhecendo-se a razo entre o nmero de pixels
obtido e o tamanho da imagem real no filme ou equivalente. A isso chama-se de Resoluo. Em
geral, medida em pontos por polegada ou DPI (dots per inch), mas pode ser tambm em pontos
por centmetro ou DPC, ou ainda em qualquer outra unidade equivalente. Tambm simples
estabelecer a relao: nmero de pixels = resoluo x tamanho real.
Para entender melhor isso, pode-se fazer a seguinte questo: Dado o tamanho da imagem
(em cm, in, etc...), quantos valores discretos vo ser tomados? Escolhendo-se a resoluo a resposta
dada pela equao acima.
Veja algumas resolues tpicas: Monitor Comum - 72 DPI; Scanner - 1200 DPI;
Impressora Jato de Tinta Popular - 600 DPI
Como temos duas dimenses, podemos definir uma resoluo horizontal e uma vertical.
Quando nada se diz a respeito disso, quer dizer que so iguais (a grande maioria das vezes), caso
contrrio so necessrios dois valores. Uma vez que so diferentes, a razo de aspectos da rea entre
um pixel e outro no 1:1 e portanto no um quadrado. Isso gera algumas confuses, pois no
monitor a razo 1:1 e esta imagem quando visualizada aparecer deformada.
Quando duas imagens com tamanhos reais iguais so capturadas com resolues
diferentes, naturalmente tero nmero de pixels diferentes e na tela aparecero com tamanhos
diferentes. Na figura a seguir mostramos um crculo amostrado em duas resolues, mas exibido no
seu tamanho original.
15
Quando queremos realizar alguma medida sobre os objetos contidos na imagem surge um
outro parmetro, a escala. Pode-se defini-la matematicamente idntica a resoluo s que as
unidades sero as mais variadas possveis. Caso no seja conhecida, fcil de se obt-la. Mede-se
algumas distncias reais na imagem digital e calcula-se a mdia das razes entre distncia e nmero
de pixels, obtendo-se a escala. A partir desse momento outras distncias podem ser feitas na
imagem com qualidade aceitvel. claro que se os objetos no estejam em um mesmo plano, as
medidas so muito mais complexas e envolvem transformaes projetivas.
16
17
diagonal so mais distantes que os vizinhos nas laterais). Normalmente usa-se uma combinao das
duas vizinhanas, definindo 4 conectada para os objetos e 8 conectada para o fundo.
Vizinhana 4 Conectada
Vizinhana 8 Conectada
Vizinhos 8 conectados,
mas no 4 conectados
Para criar uma vizinhana onde todos os vizinhos fossem eqidistantes e s houvesse uma
definio, temos que mudar a grade regular para uma grade hexagonal. So poucos algoritmos
implementados com essa vizinhana, pois como a imagem est em geral amostrada em um grade
regular, deve-se converte-la para a grade hexagonal, realizar o processamento e converte-la de volta
para a grade regular.
Vizinhana Hexagonal
J que estamos falando da grade no poderamos deixar de falar sobre a origem do sistema
de coordenadas. Localizada no canto superior esquerdo na grande maioria dos sistemas de
processamento de imagem, pode na realidade ser posicionada em qualquer lugar da imagem, at
mesmo fora dela.
18
Essa localizao preferencial para o canto superior esquerdo, com eixo y invertido em
relao ao padro da matemtica, herdada dos prprios dispositivos de visualizao, onde a
primeira linha a ser redesenhada na tela a do topo da tela, que segue o padro de escrita ocidental,
da esquerda para a direita e de cima para baixo.
2.2. Reconstruo
Quando falamos em amostragem imediatamente ns temos o problema inverso: Como
reconstruir? Ou melhor podemos fazer a pergunta: Dados os valores discretos, qual a funo
contnua? Quando estamos no ambiente computacional, tambm estamos querendo resolver um
outro problema que o de re-amostragem. Isto , reconstruir e amostrar novamente com outra
resoluo ou com outro grid regular ou no.
Em matemtica, reconstruo sinnimo de interpolao. O uso desse conceito permite
que dado uma seqncia de amostras obtemos o valor em uma posio qualquer do eixo.
A tcnica mais trivial simplesmente escolher a amostra mais prxima da posio
desejada e tomar o seu valor como valor desta posio. Esta tcnica usada muito para a
visualizao da imagem em maior ou menor proximidade, ou melhor, fazendo Zoom, simulando
uma aproximao ou afastamento da imagem em relao ao observador.
Uma outra tcnica muito utilizada para fazer reconstruo a de interpolao linear
(bilinear no caso de 2 dimenses). Essa tcnica calcula uma mdia ponderada das amostras mais
prximas da posio desejada de acordo com a distncia mesma.
19
Pela figura a seguir podemos perceber que a interpolao linear ir obter resultados bem
melhores que a de vizinho mais prximo. Mas fica claro que podemos obter resultados ainda
melhores usando curvas em vez de retas. Uma tcnica com esse enfoque que se tornou popular a
interpolao bi-cbica, que semelhante a interpolao linear, mas em vez de usar retas, usa
funes cbicas (x3) para realizar a ponderao.
y
x
y
Vizinho + Prximo
Linear
Esta imagem mostra o efeito de uma mudana no tamanho de uma determinada imagem,
usando-se a tcnica de interpolao linear e a tcnica do vizinho mais prximo.
Toda tcnica de deformao da imagem, como rotao ou coisas mais genricas como
Warping so implementados usando interpolao (Obs: Morphing = Warping + Blending). Por que
no fundo estamos reconstruindo, deformando o modelo contnuo e re-amostrando.
20
2.3. Aliasing
Um fenmeno muito comum em amostragem o fenmeno de aliasing. Ele acontece
quando realizamos uma amostragem muito pobre da funo contnua original e quando vamos
reconstrui-la obtemos resultados inconsistentes com o esperado. Matematicamente podemos dizer
que a freqncia de amostragem foi inferior aproximadamente maior freqncia de variao da
funo contnua. Podemos ver o fenmeno de aliasing em outras situaes como ao filmarmos uma
roda de um carro rodando mais rpido do que a cmera capaz de capturar, neste caso vemos a roda
girar para trs, justamente por que a taxa de amostragem est muito baixa, no nosso caso a
resoluo da imagem.
Recostruda
y
Original
Amostra
Para resolver o problema de aliasing temos duas solues, aumentar a taxa de amostragem,
que em geral nem sempre possvel, ou suavizar a funo contnua para que no tenha freqncias
muito altas comparadas com a nossa taxa de amostragem.
Essa soluo, totalmente correta, induziu um erro conceitual que vem se propagando
durante anos na literatura. Muitas tcnicas de suavizao de contornos (para que estes paream mais
suaves na visualizao) so chamadas erradamente de tcnicas de anti-aliasing.
21
22
3. Cor
Quando falamos de cor de um ponto de vista fsico, na realidade estamos falando de Luz.
A luz percorre o espao, ora se comportando como uma onda, ora como uma partcula, isso
caracteriza a natureza dual da luz. Para estudarmos cor iremos observar o comportamento da luz
como uma onda. Podemos dizer que neste caso a luz uma radiao eletromagntica que possui
uma certa energia para cada comprimento de onda. A funo que informa o valor dessa energia
chamada de Distribuio Espectral de Potncia.
Cor Monocromtica
Real
Violeta
Verde
Vermelho
23
RaiosX
Micro-Ondas
Ultra-Violeta Infra-Vermelho
10-12
10-10
10-8
10-6
10-4
TV FM
10-2
AM
102
104
(m)
Portanto existem duas classes de sensores, uma que percebe a intensidade da luz e outra
que percebe as diferenas de cor. E assim que a informao de cor enviada para o crebro, em
dois canais. Essa decomposio tem o nome de luminncia-crominncia e usada em muitas
representaes de cor.
A cor monocromtica ideal tambm chamada de cor espectral, j que possui apenas um
nico comprimento de onda. A cor prpura no uma cor espectral, ela contm comprimentos de
onda bem prximos a 380nm e outros bem prximos a 780nm. Veremos esse fenmeno da cor
prpura novamente mais adiante. A luz branca possui todos os comprimentos de onda com energia
mxima. A luz branca ideal seria um espectro com uma linha horizontal.
A distribuio de cones e bastonetes ao longo da retina responsvel por diversos aspectos
da nossa viso. Embora esses aspectos sejam muito interessantes vamos procurar nos concentrar
apenas naqueles que nos interessam no momento.
24
25
Ci = C ( ) si ( ) d
C ( ) = k Pk ( )
k =1
Ci = k Pk ( ) si ( ) d
k =1
W ( ) = wk Pk ( )
Tk =
k =1
k
wk
26
No vamos entrar nos detalhes matemticos (que j foram muitos at agora) da definio
das funes de reconstruo de cor, mas a grande vantagem em us-las que em vrios casos
podem ser facilmente obtidas a partir de experimentos. Podemos interpretar as funes de
reconstruo como sendo as coordenadas das cores puras (espectrais) vistas pelo receptor, escritas
na base de primrias de cada sensor do emissor.
Quando o receptor o olho humano essas funes so chamadas de Color Matching
Functions. Mais tarde veremos um dos experimentos realizados para obteno das funes de
reconstruo de cor para o olho.
Cor
Fsica
Cor
Contnua
Cor
Digital
Cor
Codificada
Radiao
Eletromagntica
Sinal de 1D Contnuo,
dividida em vrias
componentes
Modelos de Representao por
Componente (RGB, CMYK,...)
Quando codificamos cor muito comum usarmos 1 byte para cada componente. Um byte
permite 28 = 256 possibilidades, assumindo valores de 0 a 255. Por isso esses nmeros aparecem
tanto em programas de processamento de imagens e no sabamos de onde vinham. Mas, repare que
essa apenas uma possvel representao, por ser a mais comum induz a algumas pessoas pensarem
27
que a nica, e pior, algumas pessoas pensam que cor no computador se resume aos tais valores de
0 a 255.
Se assumirmos que so 3 componentes isso totalizaria 224 bits, ou 16 milhes de
possibilidades. Alguns experimentos mostram que somos capazes de reconhecer aproximadamente
400 mil cores diferentes, o que na prtica resulta em um nmero menor que 219 bits, ou seja 224 est
mais do que suficiente levando em conta os diversos metamerismos.
O modelo de representao de cor que ns vimos completamente genrico e para que os
programas de processamento de imagens possam conversar entre si e interagir melhor com o
usurio preciso estabelecer padres.
bPb()
C()
gPg()
W()
rPr()
Para tanto, colocou-se 3 luzes monocromticas baseadas nas primrias definidas, acopladas
a um mecanismo que possa variar a intensidade de cada uma delas (rPr(),gPg() e bPb()).
Colocou-se ento uma luz branca de referncia tambm j especificada. Ajustando as trs luzes de
28
Diagrama de Cromaticidade
J que luminncia s referente a intensidade da cor, criou-se uma visualizao das cores
visveis que envolve somente as componentes X e Z de alguma forma. Na realidade como se
pegssemos todas as cores e projetssemos em um plano de luminncia constante Y (Observao:
de fato o diagrama mais fcil de ser entendido por estarmos usando o sistema CIE-XYZ, mas ele
foi originalmente definido para o sistema CIE-RGB).
O resultado a figura a seguir chamada de Diagrama de Cromaticidade. Nele podemos ver
uma srie de propriedades interessantes de cor.
29
30
Regio
Perceptualmente
Uniforme
Comprimento de
Onda Dominante
(Hue)
Cor Branca
Cores Espectrais
S=
Pureza ou
Saturao
C
Cor
Complementar
W = C + C'
WC
WH
Linha Prpura
31
Podemos observar alguns desses fenmenos diretamente no espectro. J vimos que uma
cor monocromtica possui uma forma estreita. Se transladarmos esta forma de lugar estaremos
modificando o comprimento de onda dominante ou o matiz. Se aumentarmos sua intensidade
estamos aumentando seu brilho. E se alargarmos sua forma estaremos diminuindo sua saturao (se
aproximando do branco, ex: tons pasteis).
Um outro aspecto interessante sobre o brilho que embora este varie de acordo com as
condies de iluminao, o olho possui uma capacidade enorme de se adaptar a essas variaes.
como se ele mudasse a escala de percepo para poder captar o mximo de detalhes com a
luminosidade disponvel. A tabela abaixo mostra valores tpicos de iluminamento em LUX que
variam enormemente e mesmo assim conseguimos enxergar.
Ambiente
Luz do dia (mximo)
Luz de dia nublado
Interior prximo a janela
Valores (lux)
100.000
10.000
1.000
Mnimo p/ trabalho
100
Lua cheia
0,2
0,000.3
32
O olho tambm possui uma resposta no linear intensidade. Isso pode fazer com que a
escala de tons percebida pelo olho seja no linear em determinados casos, ou seja a gama de tons
percebida no corresponde a variaes equivalentes de intensidade. Para compensar esse problema
realiza-se a chamada Correo Gamma, que nada mais faz do que aplicar a funo inversa da
resposta do olho para obter uma escala percebida linearmente. Podemos ver as duas situaes na
figura a seguir.
No Linear
Linear
Mas duas cores que so metamricas podem possuir uma diferena numrica razovel
entre si. A idia possuir um sistema que usando a mesma equao acima identifique cores
33
34
Assim como, fitas europias no conseguem ser reproduzidas aqui no Brasil pois diferem na
codificao de luminncia.
Sistemas de Dispositivos
So os sistemas usados pelos monitores (mRGB) e scanners (sRGB), cada dispositivo
possui o seus prprio sistema. Para permitir a calibrao adequada o fabricante deve fornecer os
valores das primrias dos fsforos do monitor, por exemplo.
Quando dizemos que uma cor possui componentes RGB=(255, 0, 36), isso no est
amarrado a nenhum referencial de cor e perceptualemnte pode estimular completamente diferente o
olho mudando-se de dispositivo. Para que esses valores tenha significado temos que associa-los a
algum sistema de cor padro, em geral o CIE-XYZ. Por isso a necessidade de calibrarmos o monitor
para aplicaes que exigem alta qualidade em editorao eletrnica.
Esses sistemas definem exatamente um cubo, visto a seguir:
Azul
Magenta
Branco
Preto
Vermelho
Ciano
Verde
Amarelo
35
36
White
Green
B
S
Red
Blue
Black
Como antigamente precisava-se que a converso HSB-RGB fosse feita muito rpido,
criaram-se aproximaes do sistema HSB, onde o cone substitudo por um hexagono (HSL) e
pode tambm possuir apenas uma ponta (HSV).
A tabela abaixo mostra dois cortes no sistema HLS, repare como a intensidade da cor varia
para um mesmo valor de L (L referente Lightness, mas no tem relao direta com os sistemas
CIE-Lab ou CIE-Luv). Pode-se utilizar um desses cortes, e mais um parmetro escalar para criar a
interface com o usurio para selecionar cor. No primeiro caso o usurio escolhe o valor de L e
depois escolhe os valores de H e S diretamente no plano de L constante. No segundo caso o usurio
escolhe o valor de H e depois os valores de L e S no plano de H constante.
Corte no plano de Lightness = 50%
37
38
Espao de Cores
do Monitor A
Espao de Cores
do Monitor B
Assim vemos que necessrio um mecanismo que nos permita controlar a mudana de um
dispositivo para outro, de forma que possamos representar melhor as cores de interesse em cada um
desses dispositivos.
J que existem diversos padres de cor, ou melhor diversas representaes da mesma cor,
nada mais natural do que existir um meio de converter de um sistema para outro. Os programas
responsveis por isso so chamados de Sistemas de Gerncia de Cor (CMS - Color Management
Systems) e realizam a converso entre os diversos sistemas procurando o mnimo de perdas, ou seja
o maior nmero de correspondncias possveis.
Esses programas esto preocupados justamente com a questo de portabilidade de cor, pois
quando estamos mudando de um sistema para outro em geral porque estamos mudando de um
dispositivo para outro.
Aqui est um dos grandes pontos da questo de manipulao de cor no computador.
Existem diversos desses programas no mercado, mas so caros e precisam de pessoal especializado,
alm de equipamento adequado para medio de cor. Para que o par Captura-Visualizao funcione,
todos os dispositivos no seu ambiente de trabalho precisam estar calibrados.
Poucos sistemas operacionais se preocupam diretamente com isso. O pioneiro na rea o
MacOS (roda em computadores Macintosh), que desde sua criao j se preocupava com isso.
Recentemente, um esforo conjunto de vrias empresas levou a criao do padro ICM (Image
Color Matching) para suporte a gerncia de cor em aplicaes. O Windows 95 j vem com esse
recurso e com o lanamento do Windows 98 ficou ainda mais direto seu uso.
39
Dithering
No caso de impressoras de 4 cores cada componente CMYK de 8 bits quantizada para 1
bit (2 cores, onde h tinta ou onde h o fundo branco do papel). Pode se mostrar que nesse caso
reduz-se o problema de quatro componentes para imprimir uma componente de cada vez.
A idia fazer com que, embora existam apenas 2 cores, o olho perceba meio-tons.
Tcnicas de meio-tons so usados na indstria desde o fim do sculo passado.
No computador a tcnica mais comum, utilizada para esse propsito, a de dithering, cujo
objetivo minimizar perceptualmente os efeitos gerados pela quantizao de contornos. Embora,
essa tcnica possa ser usada em vrias situaes de quantizao (como vimos no exemplo anterior),
ela muito importante no processo de quantizao para 1 bit. Inclusive alguns mtodos de dithering
so baseados em tcnicas de meio-tons da indstria, e por isso dithering tambm conhecido com
meio-tom digital.
40
41
4. Captura
Existem diversos mecanismos de captura de imagens. Os mais conhecidos so o Scanner, o
Digitalizador de Sinal de Vdeo (Frame/Vdeo Grabber) e a Cmera Digital.
4.1. Scanners
Scanners provem as imagens de mais alta resoluo, mas em compensao so mais caros.
Podem capturar diversos tipos de superfcie, as mais importantes so papel e filmes fotogrficos.
Utilizam o sistema de cor RGB e possuem uma calibrao fcil de ser feita. O procedimento de
calibrao requer um modelo impresso, em geral fornecido pelos programas que aceitam calibrao.
Esse modelo contm uma srie de cores, conhecidas ao programa. Assim, quando a imagem
capturada o programa compara os valores obtidos com os valores esperados e pode ento gerar um
perfil de correo para aquele scanner.
Os scanners so muito semelhantes mquinas Xerox (fotocopiadoras). Existem
basicamente trs tipos: manuais, de mesa ou de cilindro. Em qualquer caso o scannner dispe de
uma fonte de luz em forma de uma linha que varre a imagem impressa e mede a quantidade de luz
refletida ou transmitida em cada ponto. A luz captada convertida em um sinal eltrico atravs de
um conjunto de foto-detetores que tambm formam uma linha. O sinal eltrico finalmente
digitalizado e enviado ao computador.
No caso de scanners manuais a varredura feita deslizando o aparelho sobre a imagem a
ser capturada. No de mesa, em processo anlogo ao da Xerox, a varredura realizada
automaticamente pelo aparelho que desloca a fonte de luz e os foto-detetores. No de cilindro tanto a
fonte de luz quanto a imagem se movem para fornecer maior qualidade ao processo. Neste caso a
fonte de luz se move dentro do cilindro enquanto a imagem fixada na sua superfcie que gira
durante o processo.
A escolha da DPI a ser utilizada o fator mais crtico no uso do scanner. A primeira coisa
que se deve ter em mente "Qual o objetivo ao digitalizar a imagem?". Uma soluo encarar trs
tipos de resultados: para visualizao somente em monitores, para edio e impresso futura, e para
anlise cientfica.
42
43
44
5. Visualizao
H duas formas bsicas de visualizao, o monitor e a impressora, embora existam outros
dispositivos, como por exemplo gravadores de slides.
5.1. Monitores
Atualmente existem diversas tecnologias de monitores, os mais comuns funcionam como
as televises comerciais usando tubo de raios catdicos (C.R.T.). Mas a distncia entre os centros
dos trs fsforos RGB do monitor de 0,21mm e da TV de 0,60mm (essa distncia chamada de
dot pitch). So chamados de dispositivos matriciais de rastreamento, onde a imagem precisa ser reescrita na tela a cada determinado intervalo de tempo (isto um dos motivos das imagens digitais
serem chamadas de raster images). Por conseqncia, a imagem gerada para toda a tela do monitor
precisa ser guardada em algum dispositivo; este dispositivo a placa grfica.
O monitor utiliza o sistema RGB e possui um nmero determinado de pixels na horizontal
e na vertical. Mas a cor contnua, depende apenas das cores fornecidas pela placa grfica. Esta ir
dizer se estamos trabalhando em 640x480 com 256 cores ou 1280x1024 com 24 bits, por exemplo.
Assim, a visualizao no monitor dependente do melhor ajuste entre ele e a placa de vdeo.
Geralmente possuem baixa resoluo, aproximadamente 72 DPI.
Vimos que a imagem formada na tela, est sendo redesenhada a cada instante. Se este
redesenho no rpido o suficiente aparece o fenmeno chamado de flickering. A imagem parece
estar piscando. Isso ocorre porque a freqncia de rastreamento muito baixa para a configurao
escolhida. preciso saber se, tanto o monitor, quanto a placa grfica, suportam uma freqncia
aceitvel para a configurao desejada. Em geral, valores acima de 75Hz so excelentes, e 60Hz
aceitvel.
interessante observar que a razo de aspectos de um pixel na tela 1x1, mas um ajuste
errado do monitor pode provocar distores. As resolues de tela so mltiplos de 4x3 (640x480,
800x600, 1024x768) para que justamente resultem em pixels quadrados. Para verificar isso, veja se
a rea de visualizao no monitor est na razo 4x3 (cabe lembrar que a razo de uma tela de
cinema 2x1 e das novas televises de alta definio (HDTV) de 16x9). Um outra maneira de
fazer a calibrao de aspectos simplesmente desenhar um quadrado em pixels, usando por
45
46
exemplo um programa simples de pintura, e medir esse quadrado com uma rgua na tela do
monitor, se estiver distorcido ento deve ajustar o monitor at que o quadrado esteja correto.
A calibrao de cor de monitores requer um dispositivo que colocado na sua tela e
retorna a informao de cor necessria para o programa de calibrao. Mas neste caso, a calibrao
tambm depende da luz ambiente.
Mesmo no possuindo esse dispositivo pode-se fazer um ajuste mnimo do monitor.
Primeiro, coloque na tela uma figura com uma grande rea preta e outra branca. Coloque o controle
no mnimo. Reduza o controle
certo brilho, mas no reduza demais, s o necessrio (se aumentando esse controle, logo acima
deste nvel, a tela ficar com uma cor escura em vez de um cinza escuro, o seu monitor est com um
problema de calibrao de um dos canhes, deve-se lev-lo um tcnico). Agora, ajuste o controle
de maneira que o branco mostrado fique com uma intensidade adequada para voc. Resista
tentao de colocar o brilho do monitor muito alto, isso tem uma srie de desvantagens alm de
piorar a qualidade da imagem.
Os controles
ajusta o nvel de
preto, que faz com que toda a imagem fique mais clara ou mais escura, mas na realidade est
maximizando o contraste. O controle
valores intermedirios at o preto, sem modificar o nvel de preto, isso est na realidade est
ajustando o brilho. Por razes histricas, esses smbolos esto associados aos nomes de Brilho e
Contraste, respectivamente, por causa da sua simbologia.
Uma curiosidade sobre monitores e televiso que as TVs possuem qualidade muito
menor que a dos monitores, mas que visualmente as pessoas ficam satisfeitas com o resultado. Isso
acontece porque, quando um ponto impresso na tela da TV, ele na realidade sofre um fenmeno
de espalhamento fazendo com que a imagem fique com contornos mais suaves e consequentemente
agradvel para a vista. Alm do que, a gradao tonal muito mais suave por ser contnua, e no
caso do monitor est limitada pela placa de vdeo.
5.2. Impressoras
Impressoras usam tecnologias muito variadas. Por isso, o processo de calibrao muito
complexo e as vezes no gera bons resultados. Este depende de muitos fatores: papel, tinta, at
umidade do ar. E existem uma grande variedade de dispositivos para faz-lo. Em contra partida,
impressoras chegam a altssimas resolues.
O sistema de cor na maioria das impressoras CMYK, mas existem algumas poucas
impressoras que usam o modelo RGB. Algumas impressoras operam apenas a 4 cores. Neste caso
utilizam resoluo espacial para compensar a baixa resoluo cromtica, com por exemplo tcnicas
de dithering vistas no tpico de Quantizao de Cor.
Por isto existem duas grandes problemticas envolvendo impresso de imagens. A primeira
relacionada a fidelidade da cor impressa, pois necessariamente precisamos converter de RGB para
CMYK. A segunda que a grande maioria das impressoras imprime somente com apenas 4 cores,
que no so combinadas. Assim, calibrao de cor e as tcnicas de dithering so fundamentais para
obtermos resultados de alta qualidade.
As impressoras de jato de tinta possuem resolues espaciais inferiores as das impressoras
laser, mas em contrapartida possuem resoluo cromtica muito melhor, podendo reproduzir at 16
milhes de cores, enquanto que a grande maioria das impressoras laser possuem apenas 2 cores, o
branco do papel e o preto. Neste ltimo caso, para imprimir tons de cinza, a impressora usa
resoluo espacial para simular tons enganando o olho, usando a proximidade entre os pontos
desenhados.
Levando esses fatos em considerao, devemos prestar ateno durante a insero de
imagens em documentos para no utilizarmos tamanhos muito grandes que no vo ser
aproveitados pela impressora e vo aumentar o tamanho do documento, assim como aumentar o
tempo de impresso, desnecessariamente.
47
6. Armazenamento
Uma vez capturada a imagem, esta armazenada na memria do computador como uma
seqncia de bytes, ou melhor um mapa de bits (Bitmap). Este armazenamento feito independente
da resoluo e nmero de cores do monitor (Device Independent Bitmap - DIB), embora alguns
programas simples, como o PaintBrush do Windows 3.1, que usa um bitmap dependente da
configurao de tela.
Como vimos anteriormente, a imagem digital simplesmente uma matriz de pixels, onde
cada pixel um nmero (ou 3, etc...) que representa o valor da cor naquela posio.
Quanto maior o nmero de pixels, maior o tamanho da imagem na memria. Mas qual o
tamanho de cada pixel?
Isso vai depender de obviamente do sistema de cor e do nmero de bits usado para
representar cada componente. Se a imagem monocromtica (tons de cinza) ter apenas 1
componente, se for colorida no sistema RGB ter 3 componentes, e assim por diante.
Cada componente ser quantizada por um determinado nmero de bits. Em geral, usam-se
apenas 8. A partir da verso 4.0 o sistema Photoshop, por exemplo, passou a tratar imagens com 16
bits por componente. Cuidado para no confundir esse nmero com o valor de 16 bits de cor de
algumas resolues de display, neste caso usam-se 5 bits para cada componente RGB, e um bit
flexvel, normalmente usado para dar ao verde 6 bits. J em sistemas de processamento de imagens
cientficas muito comum tratar imagens com nmeros inteiros com 32 bits que incluem valores
negativos, ou at mesmo nmeros de ponto flutuante (valores com vrias casas decimais de
preciso).
Quando falamos de 8 bits, falamos de 28 (256) possibilidades de valores diferentes para
cada componente. Assim, se so 3 componentes temos 28x28x28 = 224 (tambm chamada de
resoluo de cor True Color), totalizando aproximadamente 16 milhes de cores possveis. claro
que imagem alguma usa toda as cores disponveis ao mesmo tempo.
Esta imagem mostra o efeito de reduzirmos a resoluo e/ou reduzirmos o nmero total de
cores de uma determinada imagem.
48
49
50
Exemplo 3:
A mesma imagem com 600 DPI
Tamanho = ~24 Mb
Exemplo 4:
Pgina A4 com 600 DPI = ~100Mb
Historicamente, computadores no possuam uma interface grfica to poderosa quanto
temos hoje. Assim, foram definidas simplificaes para o modelo RGB, que embora diminuam
significativamente o nmero de cores disponveis, reduz o tamanho da imagem em memria. Essas
imagens so chamadas de indexadas ou coloridas com palheta de cores (indexed images, palette
based images).
Nessas imagens o valor do pixel contm um nico nmero que corresponde a um ndice
para uma tabela, essa tabela que conter o valor da cor em RGB. Imediatamente podemos ver que
as 3 componentes so reduzidas para 1, isso j uma grande economia j que o tamanho da palheta
pequeno perto do tamanho da imagem. As imagens tons de cinza podem ser vistas como um caso
particular onde a palheta contm os valore de R, G e B iguais.
Tabela de Cores
NDICE
Imagem
...
...
...
...
123 ...
...
...
...
123
...
...
...
255
32
128
...
6.1. Compresso
Observando os exemplos anteriores vemos que no h computador que resista a tanto
pixel. Por isso foram criados, e ainda so muito estudados, mtodos de compresso de imagem.
Esse mtodos podem ser classificados em dois tipos, com perdas em sem perdas. Os mtodos com
perdas so baseados no fato de que pequenos detalhes podem ser eliminados que perceptualmente
no sero notados de imediato.
Dentre os mtodos com perdas se destacam o JPEG (Join Photographic Experts Group),
criado a partir de uma composio de vrias tcnicas e adotado amplamente. Um outro mtodo
51
muito bom chamado de Fractal, embora pouco use da matemtica de fractais. Esse mtodo
infelizmente privado de uma empresa que comercializa seus direitos de uso.
Dentre os mtodos sem perdas, podemos enumerar vrios: Cdigo de Huffman, RLE (Run
Lenght Encoding), LZW (Lempel-Ziv & Welch), JBIG (Join Bi-level Image Experts Group). Cada
um desse mtodos utiliza uma tcnica diferente que em geral lhe d o nome.
O mais simples de todos e tambm o mais fcil de entender, o RLE. Esse mtodo usa o
fato de que imagens podem possuir muitos pixels repetidos em seqncia numa mesma linha.
Assim, em vez de armazenar todas essas repeties, armazena-se o valor repetido e o nmero de
repeties. Obviamente esse mtodo s funciona bem para imagens com muitas reas de uma
mesma cor.
Sistema de Cor
Compresso
GIF
RGB 256
LZW
TIFF
RGB*,
CMYK, RLE, LZW, JPEG, JBIG,
YCbCr, Lab, Luv Outros
JPEG
RGB,
YCbCr, JPEG
CMYK, Gray
PCX
RGB*
RLE
BMP
RGB*
RLE
TGA
RGB*
RLE
Repare que o formato TIFF se destaca entre os demais. Atualmente ele o formato mais
recomendado para armazenar imagens que sero usadas em diversos programas, pois praticamente
todos j o reconhecem e sua flexibilidade enorme.
52
Quando possumos muitas imagens grandes comum guardarmos uma verso reduzida
para consulta rpida ao contedo do arquivo, esta verso reduzida chamada de thumbnail.
53
54
7. Processamento
As funes de processamento de imagens digitais podem ser classificadas em duas classes,
por escopo ou por resultado. Por escopo, est relacionado com tcnicas de processamento. Por
resultado, est relacionado com os tipos de resultado de cada tcnica.
Captura/Digitalizao
Pixels
Anlise
Qualitativa
Restaurao/Realce
Pixels
Segmentao
Grupos de Pixels
Extrao de Atributos
Anlise
Quantitativa
Dados
Classificao
Grupos de Dados
Reconhecimento
7.1. Restaurao/Realce
Quando estamos no contexto de editorao eletrnica, ficamos normalmente situados
apenas no escopo de operaes de Realce ou Obscurecimento, e Restaurao ou Deformao.
A restaurao busca compensar distores especficas, normalmente gerada no momento
de aquisio. Quando se pode identificar experimentalmente a funo que representa a deformao
ou construir um modelo matemtico adequado, possvel buscar a funo inversa e aplic-la sobre
a imagem deformada. Por exemplo: Correo de foco, Imagens borradas por movimento. Em todos
os casos, a formulao matemtica envolvida extremamente complexa e o custo computacional
muito alto. Os resultados podem ter conseqncias somente qualitativas.
7.2. Segmentao
Quando estamos no contexto de processamento de imagens cientficas, o mais comum
queremos obter dados relacionados com os objetos presentes na imagem. Ento so necessrias as
operaes de Segmentao que procuraro isolar regies de pixels, e operaes de Extrao de
Atributos que vo olhar para essas regies e calcular uma srie de parmetros que as descrevero.
A operao de segmentao mais comum a limiarizao por um tom de corte. Tudo que
est acima deste tom vira branco, tudo que est abaixo vira preto, obtendo-se uma imagem binria.
A partir desse momento as operaes Morfolgicas so excepcionalmente teis, veja em Operaes
Locais.
55
7.4. Classificao
Uma vez com esses parmetros coletados, queremos distinguir objetos na imagem
agrupando esses parmetros de acordo com sua semelhana para cada regio de pixels encontrada.
Feita essa classificao desses parmetros os objetos esto reconhecidos e podemos agora tomar
decises e relatar fatos relacionados com os objetos do mundo real, ponderando sempre atravs uma
medida de erro da classificao.
Este processo muito complexo e existem diversos nveis de automao. Os mais simples
implicam em processos de agrupamento estatstico, para os quais a deciso humana fundamental.
Os mais sofisticados permitem ao computador reconhecer diferentes objetos atravs de tcnicas de
inteligncia artificial com pouca ou nenhuma interveno humana. Os processos que possuem
interveno so chamados de supervisionados.
Aqui, a palavra classificao no denota nenhum juzo de valor, mas apenas o grupamento
em classes dos diversos objetos obtidos na segmentao, cujos atributos j foram medidos.
Em geral, vrios atributos so necessrios para uma correta classificao. Mas, quanto
mais atributos, mais complexo se torna o problema. Desta forma, muito importante realizar uma
seleo adequada dos atributos disponveis, visando otimizar o processo.
56
57
Original
Processada
OpP(f(xi,yi))
Preto
Branco
Tonalidades na Imagem Original
58
59
armazenados em uma matriz chamada, neste caso, de kernel de convoluo. Operaes de Blur,
Sharpen, Deteco de Bordas e muitas outras so implementadas assim.
Original
Processada
OpL( f(xi,yi),
f(xi-1,yi-1),
f(xi+1,yi+1),
f(xi-1,yi+1),
f(xi+1,yi-1),
... )
As operaes que realizam deformaes no grid de pixels utilizam, como vimos, a tcnica
de interpolao para encontrar o novo ponto. A tcnica de interpolao no deixa de ser uma
operao local que depende apenas de uma vizinhana, embora algumas tcnicas de interpolao
muito sofisticadas e em geral muito lentas usam uma vizinhana bem extensa. Dentre as tcnicas
que usam interpolao podemos citar: Warping, Morphing, Resize, Stretch, Rotao, etc.
Um outro conjunto de operaes que tambm podem ser consideradas como locais so as
operaes Morfolgicas. So muito utilizadas por sistemas de processamento de imagens cientficas
para a etapa de segmentao, como j mencionado. Embora muito semelhantes a convoluo com
um kernel, a forma com que os vizinhos so computados ligeiramente diferente, pois usam
operaes lgicas, tais como AND e OR.
60
8. Software
Existem diversos sistemas de processamento de imagens disponveis no mercado. Eles se
distinguem pela forma de distribuio (Comercial, Shareware, Freeware), pela rea de aplicao
(editorao eletrnica, anlise cientfica, visualizao, edio informal, pesquisa, ), e pelas
plataformas em que esto disponveis (UNIX, Windows, MAC, ).
O programa mais bem sucedido, no importando a categoria, o Adobe Photoshop.
Atualmente na verso 5.0, um dos mais robustos e confiveis sistemas de processamento de
imagens. voltado para editorao eletrnica e no possui funes de anlise de imagens. Possui
verses para MAC, Windows e UNIX.
Seguindo essa mesma linha temos o Corel PhotoPaint e o Fractal Design Painter, mas estes
s rodam no ambiente Windows. O Fractal Design Painter possui mecanismos muito peculiares de
pintura, alm de permitir a criao de animaes usando seqncias de imagens.
Outros programas na mesma linha, mas que ganharam popularidade por serem
Shareware/Freeware e no possurem a complexidade dos sistemas acima, so o Paint Shop Pro e o
LviewPro. Um programa semelhante a esses, mas que realiza apenas a visualizao o ACDSee, se
tornou popular pela facilidade de fazer Slide Shows. Todos esses so somente para Windows.
No UNIX temos o GIMP e o XV, este ltimo muito divulgado na Internet. Ambos so
Freeware.
Quando se trata de anlise de imagem e processamento cientfico, muitos dos programas
mencionados so teis, mas outros assumem um nicho no atacados por estes.
Na linha Freeware temos o NIH Image (MAC) e o Image Tool (Windows). No UNIX
temos ainda dois grandes sistemas o Khorus e o XITE. Sendo que o Khorus abrange muito mais do
que processamento de imagens.
Na linha comercial temos o KS-400 (Windows), e o Digital Micrograph (MAC e
Windows), ambos voltados para anlise de imagens em microscopia tica e eletrnica. Temos
tambm outros mais gerais, como o Image Pro, o Optimas, e o WiT. Este ltimo tem uma
caracterstica muito interessante de permitir a criao de macros usando uma linguagem visual.
61
62
63
9. Aplicaes
Qualquer rea onde se possa capturar uma imagem e dela obter resultados uma rea onde
pode ser usado um sistema de processamento de imagens. Devido a esta vasta amplitude de reas de
aplicao, sistemas de processamento de imagens so, priori, inter-disciplinares. Seguem alguns
exemplos:
- Sensoriamento Remoto
Centenas de fotografias, enviadas por naves espaciais e satlites em torno da terra,
precisam ser avaliadas e catalogadas com fidelidade e eficincia. Fotos de pases podem ser usadas
para a obteno rpida de mapas cartogrficos e estudos geogrficos, tais como anlise do solo e da
safra agrcola.
- Microscopia.
Anlise de imagens provindas de microscpios ticos ou eletrnicos, em reas que variam
desde a medicina at a metalurgia, identificando e classificando partculas.
- Medicina.
Imagens radiogrficas de baixa qualidade podem ser realadas para a obteno de um
diagnstico mais preciso. Com a introduo da tomografia computadorizada e da ressonncia
magntica, imagens volumtricas so utilizadas para diversas aplicaes, tais como planejamento
cirrgico e diagnstico.
- Manuteno de obras de arte.
Evitar a degradao com o tempo de obras de arte no um processo simples, mas
possuindo uma imagem da obra original que pode ser processada para ajudar no processo de
restaurao para se obter um retrato mais fiel o possvel. Alm disso, existem estudos para a
verificao da autenticidade de pinturas atravs da anlise das pinceladas de cada pintor.
- Identificao de impresses digitais.
Atravs de adequada classificao e armazenamento pode-se identificar uma impresso
digital usando um banco de dados associado a um banco de imagens.
64
65
66
11. Bibliografia
[BAXES 94] G. A. Baxes; "Digital Image Processing (Principles and
Applications)"; John Wiley & Sons, Inc.; 1994.
[CASTLEMAN 95] K. R. Castleman; "Digital Image Processing"; Prentice-Hall,
Inc.; 1995.
[GOMES 97] J. Gomes e L. Velho; "Image Processing for Computer
Graphics"; Springer; 1997.
[CHAVES 91] E. O. C. Chaves; "Multimdia - Conceituao, Aplicaes e
Tecnologia"; People Computao Ltda.; 1991.
[FOLEY 96] J. Foley, A. van Dam, S. Feiner, J. Hughes; "Computer
Graphics: Principles and Pratice"; Addison-Wesley; 1996.
[GONZALEZ 92] R. C. Gonzalez, R. Woods; "Digital Image Processing";
Addison-Wesley; 1992.
67