Escolar Documentos
Profissional Documentos
Cultura Documentos
VISÃO GERAL
As duas primeiras etapas são características de um sistema simples, de baixo nível, de TRATAMENTO DE
IMAGENS. As duas últimas etapas são mais apropriadamente referidas como ANÁLISE DE IMAGENS, VISÃO
COMPUTACIONAL ou RECONHECIMENTO DE PADRÕES. A etapa 3, Segmentação, constitui-se, por assim
dizer, no elo de ligação dos dois subsistemas (tratamento de imagem e visão computacional).
Um sistema de processamento digital de imagens completo é constituído por um conjunto de etapas capazes
de produzir um RESULTADO a partir do DOMÍNIO DO PROBLEMA. Observe que o domínio do problema não
é a imagem em si, mas o ponto de partida para, inclusive, estabelecer a BASE DE CONHECIMENTO que será
utilizada nas diferentes etapas de processamento da imagem. Ou seja, ELE ANTECEDE a etapa de
AQUISIÇÃO, pois também é ele que determina a forma como a imagem será adquirida. Por exemplo, se
desejamos determinar o número de células sanguíneas presentes em uma imagem digitalizada da amostra de
sangue, o domínio do problema será a própria amostra de sangue e não a sua imagem. Outro exemplo seria a
leitura automática do CEP em envelopes de carta. Neste exemplo, o domínio do problema consiste em
correspondências, pois são elas que serão imageadas para, então, extrair as informações desejadas, ou seja,
o endereço contido em cada uma.
1.1. AQUISIÇÃO
Assim, uma vez estabelecido o DOMÍNIO DO PROBLEMA, o PRIMEIRO PASSO no processo será a
AQUISIÇÃO DA IMAGEM. Os principais dispositivos para aquisição de imagens são câmeras fotográficas, de
vídeo, scanners, tomógrafos e etc. Mas a imagem também pode ser resultado de simulações numéricas de
modelos matemáticos.
No exemplo sugerido de leitura automática de CEP, o primeiro passo no processo é a aquisição de imagens
dos envelopes. Para tanto são necessários um sensor e um digitalizador. O sensor converterá a informação
óptica em sinal elétrico e o digitalizador transformará a IMAGEM ANALÓGICA em IMAGEM DIGITAL. Dentre
os aspectos de projeto envolvidos nesta etapa, pode-se mencionar: a escolha do tipo de sensor, o conjunto de
lentes a utilizar, as condições de iluminação da cena, os requisitos de velocidade de aquisição (assumindo que
os envelopes passariam pela frente da câmera a uma certa velocidade), a resolução e o número de níveis de
cinza da imagem digitalizada, dentre outros. Esta etapa produz na saída uma imagem digitalizada do envelope.
1.3. SEGMENTAÇÃO
Objetivo: Isolar regiões de pontos da imagem pertencentes a objetos para posterior extração de atributos e
cálculo de parâmetros descritivos.
A etapa de segmentação realiza a extração e identificação de áreas de interesse contidas na imagem.
Geralmente se baseia na DETECÇÃO DE DESCONTINUIDADE (bordas) ou SIMILARIDADES (regiões) na
imagem. Talvez seja a etapa mais difícil em todo o processo.
No caso específico do problema das correspondências, é possível que o problema seja dividido em duas
etapas: em um primeiro momento os algoritmos de segmentação tentarão localizar o CEP do restante das
informações para posteriormente, trabalhando sobre esta subimagem, segmentar (destacar, separar) cada
dígito individualmente. Segundo esta linha de raciocínio, este bloco produzirá à saída oito subimagens, cada
qual correspondendo a um dígito do CEP.
2
pela falha) para que esta procurasse segmentar novamente a subimagem 'suspeita' (aquela de maior largura),
buscando dividi-la em duas.
A figura a seguir esquematiza as etapas de um sistema de processamento de imagem a partir do domínio do
problema até o resultado final.
3
1.7. DISPOSITIVOS PARA AQUISIÇÃO
Scanners - dispositivo que possibilita a conversão de uma imagem em papel, por exemplo, ou de uma cena
para uma imagem digital através de um processo óptico-eletrônico. Essa forma de aquisição pode inserir
distorções na imagem original.
Todos os scanners se baseiam no princípio da refletância da luz, que consiste em posicionar a imagem de
forma que uma luz a ilumine. Um sensor capta a luz refletida pela figura, formando assim uma imagem digital.
Os scanners mais simples usam lâmpada fluorescente para iluminar a imagem, enquanto que os mais
sofisticados usam uma lâmpada do tipo catodo-frio. No entanto, um outro fator determinante para a qualidade
de imagens escaneadas, é o sensor. Abaixo há uma descrição dos tipos de sensores mais usados:
Photo Multiplier Tube (PMT): Usado nos scanners de tambor, que são mais sofisticados e caros. Esse tipo de
scanner é usado principalmente na indústria gráfica, para impressões de alta qualidade.
Charge Coupled Device (CCD): Esse sensor é usado em quase todos os scanners domésticos, os mais
comuns. Seu destaque é a boa qualidade e preço baixo. Esse tipo de sensor transforma a luz refletida em
sinais elétricos que por sua vez, são convertidos em bits através de um circuito denominado conversor
analógico-digital. Os scanners de mesa geralmente possuem vários sensores CCD organizados em forma de
linha reta.
Contact Image Sensor (CIS): Esse tipo de sensor usa uma série de LEDs vermelhos, azuis e verdes para
produzir a luz branca e substituir os espelhos e lentes usados nos scanners com sensor CCD. Isso permite um
escaneamento mais leve e que gasta menos energia. No entanto, a qualidade da imagem escaneada não é tão
boa quanto à do CCD, mas o suficiente para aplicações simples. O preço desse tipo de scanner é bem baixo.
4
Os dados das imagens digitais podem ser gravados em sua totalidade ou com auxílio de uma compressão. Os
arquivos de imagens com dados comprimidos utilizam menor área de armazenamento de dados nas memórias.
Existem vários algoritmos de compressão de imagens que serão estudados mais adiante. Em geral, os dados
são escritos linha a linha, e da esquerda para a direita, começando pela linha superior, linha 0 da imagem.
Entre os formatos, de armazenamento de imagens digitais, mais usados podemos destacar
BMP (Windows bitmap): É o formato gráfico nativo do Windows da Microsoft. É capaz de armazenar cores em
até 24 bits, e muito popular em ambiente PC: alguns programas como o Paint aceitam somente este formato.
TIFF (Tagged Image File Format): É um formato de arquivos que praticamente todos os programas de imagem
aceitam. Foi desenvolvido em 1986 pela Aldus e pela Microsoft numa tentativa de criar um padrão para
imagens geradas por equipamentos digital. O TIFF é capaz de armazenar imagens true color (24 ou 32 bits) e
é um formato muito popular para transporte de imagens do desktop para bureaus, para saídas de scanners e
separação de cores. O TIFF permite que imagens sejam comprimidas usando o método LZW e permite salvar
campos informativos (caption) dentro do arquivo. No Photoshop, use o comando File Info do menu File para
preencher tais campos informativos.
GIF (Graphics Interchange Format): É provavelmente o formato de arquivos gráficos mais popular. Foi criado
pela Compuserve para a transmissão de imagens do tipo bitmap pela Internet. A primeira versão do GIF surgiu
em 1987 (GIF87a). Em 1989 a Compuserve lançou a especificação GIF89a, que implementava o recurso da
cor transparente. Imagens GIF são sempre comprimidas e codificadas pela especificação LZW. A sua
característica mais marcante é suportar apenas 8 bits por píxel, no máximo; se você necessitar de 24 ou 32 bits
por píxel, use JPEG ou TIFF.