Você está na página 1de 8

FUNDAMENTOS DE IMAGENS DIGITAIS

Elementos de percepo visual


O principal objetivo de muitas das tcnicas discutidas nos captulos seguintes auxiliar
um observador a interpretar o contedo de uma imagem. Assim, antes de prosseguirmos,
importante desenvolvermos uma compreenso bsica do processo de percepo visual.
A estrutura do olho humano
A figura abaixo mostra um corte horizontal do olho humano. O olho
aproximadamente uma esfera com dimetro mdio de cerca de 20 mm. Trs membranas a
crnea, a coroide e a retina
A crnea um tecido resistente e transparente que cobre a superfcie anterior do
olho.
A coroide situa-se diretamente abaixo da esclertica. Essa membrana contm uma
rede de vasos sanguneos que servem como principal fonte de nutrio do olho. Na sua
extremidade anterior a coroide dividida em corpo ciliar e ris. Esta ltima contrai-se ou
expande-se de forma a controlar a quantidade de luz que entra no olho.

Cristalino formado por camadas concntricas de clulas fibrosas, sendo sustentado


por fibras que se conectam ao corpo ciliar. Ele contm de 60% a 70% de gua, cerca de 6% de
gordura e mais protenas do que qualquer outro tecido no olho. O cristalino colorido por
uma pigmentao levemente amarelada, que se intensifica com idade. Ele absorve
aproximadamente 8% da luz visvel com absoro relativamente maior nos comprimentos de
onda mais curtos.
A membrana mais interna do olho a retina, que se estende sobre toda a poro do
olho. Quando o olho est apropriadamente focalizado, a luz de um objeto fora do olho
tornada imagem na retina. Existem duas classes: cones e bastonetes. O numero de cones do
olho varia de 6 a 7 milhes. Os seres humanos podem discernir pequenos detalhes com esses
cones, porque cada um deles conectado sua prpria fibra nervosa. A viso pelos cones
chamada de luz clara.
O numero de bastonetes muito maior: cerca de 75 a 150 milhes so distribudos
sobre a superfcie da retina. Os bastonetes servem para dar uma viso geral do campo de
viso. Eles no esto envolvidos em viso colorida e so sensveis a baixos nveis de
iluminao.
A fvea uma depresso circular de cerca de 1,5 mm de dimetro na retina.
Entretanto, para a finalidade de nossas futuras discurses, mais til falamos em termos de
matrizes circulares ou retangulares de elementos sensores. Considerando-se apenas poder de
resoluo, um chip CCD de media resoluo pode conter esse nmero de elementos em matriz
receptora no maior que 7 mm X 7 mm.
A formao da imagem no olho
A principal diferena entre o cristalino e uma lente ptica comum que a primeira
flexvel. A forma do cristalino controlada pela tenso nas fibras do corpo ciliar. Para focalizar
objetos distantes o msculo controlador faz com que o cristalino fique relativamente
aplanado.
A distncia entre o centro focal do cristalino e a retina varia de aproximadamente 17
mm at cerca de 14 mm, a medida que o poder de refrao do cristalino aumenta do seu
mnimo para o seu mximo. Quando o olho focaliza um objeto que est mais distante do que
cerca de 3 m, o cristalino apresenta o seu mais baixo poder de refrao, sendo que quando o
olho focaliza um objeto prximo, o cristalino est mais fortemente refrativo.
A adaptao ao brilho e discriminao
Como as imagens digitais so exibidas em nveis discretos de brilho, habilidade do olho
para discriminar entre distintos nveis de brilho uma considerao importante na
apresentao de resultados de processamento de imagens.
O ponto crucial ao se interpretar a impressionante escala dinmica que o sistema
visual no pode operar simultaneamente ao longo de tal escala. Pelo contrario, essa grande
variao e conseguida atravs de mudanas na sensibilidade global, um fenmeno conhecido
como adaptao ao brilho.
A habilidade do olho para discriminar mudanas em brilho em qualquer nvel de
adaptao tambm de considervel interesse. Um experimento clssico, usado para
determinar a capacidade do sistema visual humano para a determinao de brilho, consiste
em fazer uma pessoa olhar para uma rea uniforme iluminada que seja suficientemente
grande para ocupar todo o campo visual. Essa rea tipicamente um difusor, tal como um
vidro opaco que iluminado por detrs por uma fonte de luz, cuja intensidade, I, pode ser
variada. A esse campo adicionado um incremento de iluminao, na forma de flash de
curta durao que aparece como um circulo no centro do campo uniformemente iluminado.
A forma geral do grfico de como uma funo de .Essa curva mostra que
a discriminao do brilho pobre para baixos nveis de iluminao e melhora
significativamente com o aumento da iluminao de fundo.
Se a iluminao de fundo for mantida constante e a intensidade da outra fonte puder
agora variar incrementalmente desde imperceptvel at sempre perceptvel, ao invs de piscar,
o observador tpico poder agora discernir um total de uma a duas dzia de mudanas de
intensidade. A grosso modo esse resultado relacionado a um nmero de diferentes
intensidades que uma pessoa pode ver em qualquer ponto de uma imagem monocromtica.
Esse resultado no significa que uma imagem poder ser representada por nmero to
pequeno de valores de intensidade, porque, conforme o olho desloca-se pela imagem, o fundo
mdio varia, permitindo assim que um conjunto diferente de mudanas incrementais seja
detectado a cada novo nvel de adaptao.
O fato de que o brilho percebido no seja uma funo simples claramente
demonstrado por dois fenmenos. O perfil mostra a distribuio de intensidade real, mas o
padro de brilho percebido uma lista mais escura na regio D e uma mais clara na regio B.
O segundo fenmeno, chamado contraste simultneo, relacionado ao fato de que o
brilho percebido de uma regio no depende simplesmente da sua intensidade, todos os
quadrados centrais tem exatamente a mesma intensidade. Um exemplo mais familiar um
pedao de papel que parece claro quando em cima de uma mesa, mas que pode parecer
totalmente negro quando utilizado para sombrear os olhos enquanto se olha diretamente para
um cu brilhante.
Um modelo simples de imagem
O termo imagem refere-se a uma funo de intensidade luminosa bidimensional,
denotada, por f(x,y), em que o valor ou amplitude de f nas coordenadas espaciais (x, y) d a
intensidade da imagem naquele ponto. Como a luz uma forma de energia, f(x,y) deve ser
positiva e finita, isto , ( ) .
As imagens que as pessoas percebem em atividades visuais corriqueiras consistem de
luz refletida dos objetos. A natureza bsica de f(x,y) pode ser caracterizada por dois
componentes: (1) a quantidade de luz incidindo na cena sendo observada e (2) a quantidade
de luz refletida pelos objetos na cena.
AMOSTRAGEM E QUANTIZAO
Amostragem e quantizao uniformes
Para ser adequada para processamento computacional, uma funo f(x,y) precisa ser
digitalizada tanto espacialmente quanto em amplitude. A digitalizao das coordenadas
espaciais (x,y) denominada amostragem da imagem e a digitalizao da amplitude
chamada quantizao em nveis de cinza.
Em certas ocasies, torna-se til exprimir amostragem e quantizao em termos
matemticos mais formais. Sejam Z e R os conjuntos dos nmeros inteiros e reais,
respectivamente.
Esse processo de digitalizao envolve a decises a respeito dos valores para N, M e o
numero de nveis de cinza discretos permitidos para cada pixel. A prtica comum em
processamento de imagens digitais assumir que essas quantidades so potencias de dois:
isto , N = 2n, M = 2k e G = 2m em que G o nmero de nveis de cinza. Nessa seo ser
assumido que os nveis discretos so igualmente espaados entre 0 e L na escala de cinza.
luz dos comentrios anteriores vamos considerar o efeito que variaes em N e m
tero na qualidade da imagem. difcil definir o que seja uma boa imagem, porque a
qualidade de imagens no apenas altamente subjetiva, mas tambm fortemente
dependente dos requisitos de uma determinada aplicao.
Amostragem e quantizao no uniformes
Para um valor fixo de resoluo espacial, a aparncia de uma imagem pode ser em
muitos casos melhorada ao se utilizar um esquema adaptativo, onde o processo de
amostragem depende das caractersticas da imagem. Em geral, uma amostragem mais fina
necessria na vizinhana de transies abruptas de nveis de cinza, ao passo que uma
amostragem mais rude pode ser utilizada em regies relativamente suaves.
A necessidade de identificar as fronteiras, mesmo que apenas aproximadamente,
uma desvantagem concreta do esquema da amostragem no uniforme.
Quanto o nmero de nveis de cinza precisa ser mantido pequeno, o uso de nveis
irregularmente espaados no processo de quantizao geralmente desejvel. Um mtodo
semelhante tcnica de amostragem no uniforme anteriormente discutida pode ser usado
para distribuio de nveis de cinza em uma imagem.
ALGUNS RELACIONAMENTOS BASICOS ENTRE PIXELS
Os vizinhos de um pixel
Um pixel p nas coordenadas(x,y) possui quatro vizinhos horizontais e verticais, cujas
coordenadas so dadas por (x+1,y),(x-1,y),(x,y+1), (x,y-1).
Esse conjunto de pixels, chamados de vizinhaa-de-4 de p, representado por N4(p).
Cada pixel esta a uma unidade de distancia de (x,y), sendo que alguns dos vizinhos de p ficaro
fora da imagem digital se (x,y) estiver na borda da imagem.
Conectividade
A conectividade entre pixels um conceito importante usado no estabelecimento das
bordas de objetos e componentes de regies em uma imagem. Para estabelecer se dois pixels
esto conectados, preciso determinar se eles so de alguma forma adjacentes e se seus
nveis de cinza satisfazem um certo critrio de similaridade.
Consideremos trs tipos de conectividade:
(a) conectividade-de-4. Dois pixels p e q, assumindo valores em V, so
conectados-de-4 se q esta no conjunto N4(p).
(b) conectividade-de-8. Dois pixels p e q, assumindo valores em V, so
conectados-de-8 se q esta no conjunto N8(p).
(c) conectividade-de-m. Dois pixels p e q, assumindo valores em V, so
conectados-de-m se
(i) q esta em N4(p), ou
(ii) q esta em Np(p) e o conjunto ( ) ( ) for vazio.
A conectividade mista uma modificao da conectividade-de-8 introduzida para
eliminar as conexes por mltiplos caminhos, que frequentemente aparecem quando a
conectividade-de-8 usada.
(a) Distribuio de pixels;
(b) Vizinhos-de-8 do pixel central;
(c) Vizinhos-de-m do mesmo pixel.
As linhas tracejadas so
caminhos entre aquele pixel e
os seus vizinhos.
Rotulao de componentes conexos
Vamos considerar que uma imagem seja percorrida pixel por pixel, da
esquerda para direita e de cima para baixo, assumiremos, por enquanto, que estamos
interessados em componentes conectados-de-4. Seja p o pixel em qualquer passo no
processo de varredura e sejam r e t, respectivamente, os vizinhos superior e esquerdo
de p.
A rotulao de componentes conectados-de-8 se faz da mesma maneira, mas
os dois vizinhos diagonais superiores de p, denotados por q e s, devem tambm ser
examinados.
Relaes, equivalncia e fechamento transitivo
Uma relao binaria *R em um conjunto de pares de elementos de A. Se o par
(a,b) est em R, a notao frequentemente utilizada aRb, que, outras palavras
interpretado como a relacionado a b. Tome por exemplo o conjunto de pontos
* * +. Nesse caso, R o conjunto de pares de A que so conectados-de-
4; isto , *( )( )( )( )+. Assim, p1 relacionado a p2 e p1
relacionado a p3, e vice-versa mas p4 no relacionado a outro qualquer ponto sob a
relao conectado-de-4. Diz-se que uma relao binaria R sobre o conjunto A
(a) Reflexiva se para cada a em A, aRa;
(b) Simtrica se para cada a e b em A, a Rb implica bRa; e
(c) Transitiva se para cada a, b e c em A, aRb e aRb implica aRc.
Na pratica assume-se tipicamente que relaes so relaes de equivalncia, em que a
matriz B simtrica, e que todos os termos da diagonal principal so 1 antes do uso da
equao (1.4-1) ou do algoritmo de Warshall para o fechamento transitivo. As classes de
equivalncia dos vrios smbolos do alfabeto, levando matriz B+, podem ento ser
determinadas ao se percorrer a matriz da esquerda para direita e de cima para baixo. Quando
um 1 for encontrado em, digamos linha i e coluna j, associamos j-sima coluna o smbolo
associado com a i-sima linha, zeramos a j-sima e continuamos a percorrer a matriz B+.
Medidas de distncia
Para os pixels p, q e z, com coordenadas (x,y), (s,t) e (u,v) respectivamente, D uma
funo distncia ou mtrica se
(a) ( ) ( ( ) )
(b) D(p,q) = D(q,p), e
(c) ( ) ( ) ( ).
A distncia Euclidiana entre p e q definida como ( ) ,( ) ( ) -
Para essa medida, os pixels tendo uma distncia de (x,y) menor ou igual a algum valor r
so os pontos contidos em um disco de raio r centrado em (x,y).
Operaes lgico-aritmticas
Operaes lgicas e aritmticas entre pixels so extensivamente usada na maioria dos
ramos de processamento d imagens. As operaes aritmticas entre dois pixels p e q so
denotados como segue.
Adio: p + q
Subtrao: p q
Multiplicao: p * q (tambm pq e p x q)
Diviso: p q
Operaes aritmticas em imagens so desempenhadas pixel a pixel. O principal uso
da adio de imagens ocorre ao se fazer media de imagens para reduo de rudos. A
subtrao de imagens uma ferramenta bsica em imagens medicas, onde usada para
remover informaes estticas de fundo. Um dos principais usos da multiplicao(ou diviso)
de imagens para corrigir sombras de nveis de cinza produzidas por no-uniformidades da
iluminao ou sensor utilizado para aquisio da imagem.
As principais operaes lgicas utilizadas em processamento de imagens so E, OU e
COMPLEMENTO, denotadas da seguinte maneira;
E: p E q(tambm, p . q)
OU: p OU q(tambm, p + q)
COMPLEMENTO: NOq(tambm, )
Essas operaes so funcionalmente completas, pois podem ser combinadas para
formar qualquer outra operao lgica. Operaes lgicas so operaes bsicas no
processamento de imagens binarias, sendo usada para tarefas tais como mascaramento,
deteco de caractersticas e anlise de forma. Operaes lgicas em imagens so
desempenhadas pixel a pixel.
GEOMETRIA EM IMAGEAMENTO
Algumas transformaes bsicas
Todas as transformaes so expressas em um sistema de coordenadas cartesiano em
trs dimenses no qual um ponto tem coordenadas denotadas (X,Y,Z). Nos casos envolvendo
imagens 2-D, utilizaremos nossa conveno previa de representao por letras minsculas (x,y)
para denotar as coordenadas de um pixel.
Translao
Suponha que a tarefa transladar um ponto de coordenadas (X,Y,Z) para uma nova
posio usando-se deslocamento (X0,Y0,Z0). A translao facilmente desempenhada atravs
do uso das equaes:

Em que (X*, Y*, Z*) so coordenadas do novo ponto. A equao (2.5-1) pode se expressa forma

matricial escrevendo-se: [ ] [ ][ ]

Mudana de escala
A mudana de escala pelos fatores Sx, Sy e Sz ao longo dos eixos X, y e Z dado pela

matriz de transformao [ ]

Rotao
As transformaes usadas para rotao tridimensional so mais complexas que as
transformaes discutidas at a agora. Trs transformaes so necessrias para rotacional
um ponto em torno um outro arbitrrio no espao: a primeira translada o ponto arbitrrio
para a origem, a segunda faz a rotao e a terceira translada o ponto de volta para a sua
posio original.
Concatenao e transformao inversas
A aplicao de varias transformaes pode se representada por uma nica matriz de
transformao 4 X 4. Essas matrizes geralmente no comutam, de modo que a ordem de
aplicao se faz importante.
Embora a discusso at agora tenha sido limitada a transformaes de um nico
ponto, as mesmas ideias se estendem para transformaes de um conjunto de m pontos
simultaneamente atravs do uso de uma nica transformao.
Transformaes de perspectiva
Uma transformao de perspectiva projeta pontos tridimensionais sobre o plano.
Transformaes de perspectiva desempenham papel chave em processamento de imagens
porque oferecem uma aproximao maneira na qual uma imagem formada ao se olhar
para o mundo tridimensional.
O sistema de coordenadas (x,y,z) da cmera colocado de tal forma que o plano da
imagem coincida com o plano xy e o eixo ptico fique ao longo do eixo z. Ento, o centro do
plano da imagem estar na origem, e o centro da lente estar nas coordenadas (0,0, ).
Representemos as coordenadas do mundo por(X,Y,Z) de qualquer ponto em cena 3-D.
Assumiremos na discusso a seguir que Z > 1; isto , todos os pontos de interesse ficam na
frente da lente.
Essas equaes so no-lineares porque envolvem diviso por uma varivel Z. Embora
possamos us-las diretamente como mostrado, sempre conveniente express-las em forma
de matrizes lineares, translao e mudana de escala.
Modelo de cmera
As equaes (2.5-23) e (2.5-24) caracterizam a formao de uma imagem pela
projeo de pontos tridimensionais sobre um plano de imagem. Essas duas equaes
constituem um modelo matemtico bsico de uma cmera de imageamento. Esse modelo
baseado na hiptese de que a cmera e o sistema de coordenadas do mundo so coincidentes.
Suponhamos que, inicialmente, a cmera estivesse em posio normal, no sentido de
que o centro do mecanismo de sustentao e a origem do plano da imagem estivessem na
origem do sistema de coordenadas do mundo, e todos os eixos estivessem alinhados.
Obviamente, a sequencia desses passos mecnicos no afeta os pontos do mundo,
pois o conjunto de pontos vistos pela cmera depois que ela foi movida da posio normal
bastante diferente. Entretanto, aplicando-se exatamente a mesma sequencia de passos para
todos do mundo, a posio pode ser novamente alcanada.
Calibrao da cmera
Como mostrado nas equaes (2.5-42) e (2.5-43), a implementao dessas equaes
requer conhecimento da distancia focal, deslocamentos e ngulos de pan e inl. Embora
esses parmetros possam ser medidos diretamente, a determinao de um ou mais desses
parmetros, usando-se a prpria cmera como um dispositivo de medida, sempre mais
conveniente. Isso requer um conjunto de pontos de imagem cujas coordenadas do mundo
sejam conhecidas, e o procedimento computacional usado para obter os parmetros da
cmera considerando esses pontos conhecidos sempre so referenciados como calibrao da
cmera.
Com referencia equao (2.5-41, faa A = PCRG. Os elementos de A contm todos os
parmetros da cmera e, da equao (2.5-410, ch = Awh. fazendo-se k = 1 na representao

homognea resulta [ ] [ ][ ] ( )

Imageamento estreo
Recorde-se que o mapeamento de uma cena tridimensional sobre um plano da
imagem uma transformao do tipo muitos para um. Isto , um ponto da imagem no
determina unicamente a posio de um ponto correspondente do mundo. Assume-se que as
cmeras estejam perfeitamente alinhados, diferenciando-se apenas na posio de suas
origens, uma condio usualmente satisfeita na prtica.
A tarefa mais difcil no uso da Equao (2.5-56) para obter Z consiste, de fato, em
encontrar dois pontos correspondentes em imagens diferentes da mesma cena. Quando a
cena contm caractersticas distintas, tal como cantos proeminentes, uma abordagem baseada
na correspondncia, de caractersticas geralmente resulta numa soluo mais rpida para
determinar a correspondncia.
Filme fotogrfico
Filmes fotogrficos so elementos importantes em sistemas de processamento de
imagens. So frequentemente utilizados como meio de gravao de imagens, sendo, de longe,
o meio mais popular para se gravar resultados de sada.
Estrutura do filme e exposio
Ele consiste das seguintes camadas e componentes: (1) uma camada externa de
gelatina usada para proteo contra arranhes e marcas de abraso; (2) uma camada de
emulso de minsculos cristais de sais de prata; (3) uma camada de substrato para promover a
adeso da emulso base do filme; (4) a base do filme ou suporte, feita de triacetato de
celulose ou polmero relacionado; (5) uma camada base para prevenir encurvamento.
Quando um filme exposto luz, os gros de sal de prata absorvem energia ptica e
sofrem uma mudana fsica complexa. Quanto mais luz alcanar uma certa rea do filme, mais
sal de prata tornado processvel e mais denso ser o deposito de prata que ser l formado.
Caractersticas do filme
Parmetros de interesse prtico para o fotgrafo so contraste, velocidade,
granularidade, e poder de resoluo.
Contraste
Filmes de alto contraste reproduzem diferentes tons do objeto de imagem como
diferenas de densidade na fotografia; filmes de baixo contraste traduzem diferenas de tom
como pequenas diferenas de densidade.
A descrio mais usada das propriedades fotossensveis do filme fotogrfico o grfico
da densidade do depsito de prata sobre um filme versus o logaritmo de E. Essas curvas so
chamadas curvas caractersticas, curvas D-log-E, e curvas H & D.
Filmes de uso geral de contraste mdio possuem gamas no intervalo entre 0,7 a 1,0.
Filmes de alto contraste tm gamas de ordem de 1,5 a 10.
Velocidade
A velocidade de um filme determina quanta luz necessria para produzir certa
quantidade de prata no processamento. Quanto mais baixa a velocidade, mais tempo o filme
dever ser exposto para registrar uma dada imagem. Um filme de ASA 200 duas vezes mais
rpido do que um filme de ASA 100. Algumas escalas de velocidades, tal como o sistema DIN
usado na Europa, so logartmicas.
Granularidade
A imagem derivada de cristais de sais de prata possui estrutura descontnua, que d
uma aparncia granular em grandes ampliaes. O efeito mais proeminente em filmes
rpidos, que tem cristais relativamente maiores; emulses mais lentas, com granulao fina,
so, portanto preferveis em aplicaes em que finos detalhes so desejados, ou quando
ampliaes so necessrias.
Poder de resoluo
O nvel de detalhes que um filme poder resolver depende no apenas de sua
granularidade, mas tambm de propriedades de espalhamento de luz da emulso e do
contraste com que o filme reproduz pequenos detalhes. Filmes de granulao fina com
emulses de pouca espessura permitem maior poder de resoluo.
Ajuste do diafragma e obturador
Independente do tipo de filme utilizado, ajustes apropriados da cmera so essenciais
para se obter imagens aceitveis.
No diagrama da lente, uma serie de lminas aumentam ou diminuem o tamanho da
abertura para controlar a quantidade de luz que passa atravs da lente para o filme.
O diagrama e o obturador controlam a quantidade de luz que atinge o filme, atravs
do ajuste da intensidade de luz e do tempo durante o qual ele age. Diferentes combinaes de
abertura e velocidade de obturador podem assim resultar na mesma exposio. Os ajustes do
diafragma foram determinados atravs do uso de um medidor de luz da intensidade de cada
imagem.

Você também pode gostar