Você está na página 1de 4

Transformada Discreta do Cosseno Aplicada ao Padro JPEG Instituto Federal de Educao, Cincia e Tecnologia da Paraba / IFPB

Disciplina: Processamento Digital de Sinais Professor: Carlos Danilo M. Regis caro vasconcelos, Leonardo Cartaxo, Witor Raoni A. Ribeiro, Harllan Andry
icaroswim@gmail.com leo.cartaxo@gmail.com raonicefet@gmail.com harllanandrye@gmail.com

Resumo: O presente artigo descreve a aplicao da transformada discreta do cosseno (DCT) em mdias digitais, especicamente em imagens no padro JPEG. A mportncia dessa aplicao se deve a economia de recursos de transmisso, processamento e armazenamento de dados com pouco prejuizo na qualidade.

compresso de imagens e vdeos. Entre os formatos e padres mais amplamente empregados hoje, listamos abaixo alguns que usam esta tcnica: JPEG- para compresso de imagens com perdas (lossy compression). MPEG- para compresso de vdeos. MPEG-4 - para compresso de vdeos, tambm conhecido pelos codecs DivX ou XviD. MP3- para compresso de udio usa a variante MDCT.

Introduo

Atualmente, com a crescente demanda por mdias digitais nas mais diversas reas, tais como: entretenimento, comunicao, medicina, etc. h a necessidade de um proporcional aumento do poder de armazenamento, processamento e transmisso dos sistemas envolvidos. Porm, ao invs de aumentar a capacidade dos sistemas, pode-se comprimir tais mdias, mantendo uma qualidade ainda aceitvel. Na rea de processamento de imagens, vrios fatores so relevantes para conseguir-se uma diminuio da quantidade de bits de informao, mantendo-se uma boa qualidade de imagem. A compresso de imagem visa diminuir a quantidade de bits necessrios para representar a imagem e reconstru-la com pouca distoro visvel. As tcnicas de compresso encontram sua utilidade na diminuio da quantidade de memria para armazenar imagens ou na reduo de largura de banda para a transmisso. Dentre os mtodos com boa capacidade de compresso e com relativa distoro da qualidade, esto aqueles que transformam a imagem do domnio espacial para o domnio da freqncia, que so os chamados mtodos por transformada. A transformada discreta de cosseno uma das tcnicas mais utilizadas na compresso de dados, principalmente para a 1

JPEG

Sigla de Joint Photographic Experts Group, comit formado pelo ISO, ITU-T e IEC queoriginou o padro. Estabelecido em 1991, foi projetado para comprimir imagens naturaiscoloridas ou monocromticas com at 65536 x 65536 pixels.

2.1

Caractersticas do JPEG

O JPEG otimizado para fotograas, guras e imagens naturais (imagens em tom contnuo de cores ou nveis de cinza, sem bordas abruptas). No caso de imagens com poucas cores (linhas, guras simples, caracteres etc.), seu desempenho inferior, por exemplo, ao padro GIF(Graphics Interchange Format ). O JPEG no deve ser usado com imagens bitonais (preto e branco), sendo necessrio existir, no mnimo, 16 nveis

de cinza. Quanto resoluo de cores, o JPEG toma como base uma imagem com 8 bits/amostra,ou seja, 24 bits/pixel para imagens em cores ou 8 bits/pixel para tons de cinza. No caso decompresso sem perdas permitido usar qualquer valor entre 2 e 16 bits/amostra. Apesar de existirem implementaes para compresso sem perdas, o JPEG fundamentalmente uma tcnica de compresso com perdas baseado na DCT (Transformada Discreta de Cossenos). O algoritmo explora as limitaes do olho humano, notadamente o fato de que variaes de cor so menos perceptveis que variaes de brilho. O grau de perda pode ser variado ajustando-se parmetros de compresso. Para imagens coloridas as taxas de compresso podem variar de 10:1 a 20:1 sem perda visvel. Taxas de 30:1 a 50:1 podem ser atingidas com pequenas a moderadas distores. Para imagens de baixa qualidade, taxas de at 100:1 so praticveis. Imagens em tons de cinza no podem ser comprimidas a taxas to elevadas porque, o olho humano mais sensvel a variaes de brilho do que a variaes de cor. Perdas visveis podem surgir quando imagens monocromticas so comprimidas a taxas maiores que 5:1.

onde : C : Transformada Discreta do Cosseno f : Valores da imagem original (nvel de cinza) N : Dimenso da imagem (ou bloco). Para aplicar a DCT em uma imagem, necessrio, para efeito de rapidez nos clculos e para uma melhor taxa de compresso, dividir a imagem original em blocos, 4 x 4, 8 x 8 ou 16 x 16, podendo usar at blocos de 32 x 32 ou 64 x 64. Em geral, usam-se blocos 8 x 8. A imagem dividida em blocos no sobrepostos de 8 x 8 pixels, cada um dos 64 elementos de um bloco apresentar um valor no intervalo [0, 2p 1]. Estes valores so deslocados para o intervalo [(2p 1), (2p 1) 1]. Numa imagem monocromtica na qual p = 8, por exemplo, os valores no intervalo [0, 255] seriam deslocados para [128, 127]. A DCT codicar estes valores, transportando-os do domnio espacial para o domnio de freqncias segundo a equao:
7 7

F (i, j) = onde:

j(2y + 1) i(2x + 1) 1 (i)(j) cos (2 f (x, y)cos 4 16 16 x=0 y=0

Transformada Discreta do Cosseno (DCT)

(i)(j) =

1 2

para i, j = 0

(i)(j) = 0 para i, j > 0 A gura 1 ilustra um esquema bsico de uma codicao e decodicao JPEG sequencial

Apesar de serem relativamente fceis de implementar em qualquer linguagem de computador, a compresso de imagens demanda um grande poder de processamento e por isso precisa ser otimizada ao mximo. O uso da Transformada Discreta de Cosseno (DCT) em imagens grandes, apesar de apresentar timos resultados, exige um processamento muito grande. A DCT converte um bloco de pixels em uma matriz de coecientes, descorrelacionando a informao da imagem. Os coecientes (transformados) iniciais do bloco, contm as informaes mais importantes da imagem, assim, devese garantir o armazenamento de certo nmero de coecientes com baixos ndices de posio. Por outro lado, como a transformada fornece uma srie de cossenos (que no limite convergente), os coecientes diminuem em amplitude conforme os ndices crescem. Pode-se, portanto, quantizar os coecientes por zona, diminuindo-os e mesmo eliminando os menos signicantes, obtendo o principal ganho na taxa de compresso. A Transformada Discreta do Cosseno (DCT) denida por :
N 1 N 1

Figura 1: Esquema bsico de codicao e decodicao JPEG seqencial

Transformada Inversa do Cosseno (IDCT)

C(i, j) = (i)(j)
x=0 x=0

f (x, y)cos(

para i, j = 0, 1...N 1 e (x) = { 1 se x = 0} N (x) = { 2 se x = 1, 2, ...N 1} N

A Transformada Inversa do Cosseno (IDCT) dada por : 2y + 1j 2x + 1i )cos( ) (1) 2N 2N N 1 N 1 2x + 1i 2y + 1j f (x, y) = (i)(j)C(i, j) f (x, y)cos( )cos( 2N 2N x=0 x=0 As imagens 2e 3 ilustram o resultado da DCT aplicada em um bloco 8 x 8 de uma imagem: 2

esquerda para direita. O formato JPEG utiliza a sequencia de varredura zig-zag que apresenta vantagem em relao aos outros devido a uma melhor amostragem das imagens j que ele alterna as direes de mapeamento percorrendo sempre na diagonal, primeiramente de cima para baixo e depois de baixo para cima. Outa vantagem que facilitar a etapa de codicao por entropia. A reordenao coloca os coecientes de baixa frequncia, que tm maior probabilidade de serem diferentes de zero[Marques]. O mtodo de ordenao zig-zag pode ser exemplicada pela gura 4.

Figura 2: bloco de entrada

Figura 3: bloco de saida Estas imagens ilustram uma das principais caractersticas da DCT: o coeciente na posio (0,0) (canto superior esquerdo), apresenta a maior magnitude no bloco. Isto indica que a aplicao da DCT sobre o bloco, concentra a representao mais importante da imagem no lado superior esquerdo, enquanto as informaes menos relevantes, se encontram no lado direito inferior do bloco.

Figura 4: mtodo de ordenao zig-zag

7 5 Quantizao

Codicao por Human

Este processo normalmente aplicado aps o processo de transformada, eliminando coecientes de valores insignicantes prximos a zero e mantendo apenas um nmero reduzido de valores signicativos. equivalente uma diviso seguida por um arredondamento. Este processo dito ser com perdas, uma vez que impossvel recuperar o valor original a partir do valor quantizado. No processo de decodicao, quando esse valor for reconstitudo, sero obtidos valores que diferem dos valores originais. O processo de quantizao no permite a recuperao do valor original exato ele irreversvel. A maior parte da distoro resultante do processo de quantizao.

A tcnica mais popular de codicao para remoo de redundncia o cdigo de Human, desenvolvida em 1952 por D. A. Human. Quando aplicado codicao de cada smbolo da fonte, individualmente, o cdigo fornece o menor nmero inteiro possvel de unidades de informao (bits) por smbolo de fonte. O primeiro passo no algoritmo de Human consiste na criao de uma srie de redues na fonte original, atravs da ordenao das probabilidades de ocorrncia dos smbolos sob considerao, combinando os dois smbolos de menor probabilidade em um nico smbolo que ir substitu-los na prxima etapa de reduo da fonte. A gura 1 ilustra este processo para ocaso de codicao binria. esquerda, aparecem os smbolos originais da fonte hipottica de informao, ordenados em ordem decrescente de probabilidade de ocorrncia. Na primeira reduo, os dois smbolos de menor probabilidade so combinados, formando um smbolo cuja probabilidade 0,06 + 0,04 = 0,1. Este smbolo e sua respectiva probabilidade so posicionados na coluna correspondente primeira reduo de fonte de forma que todos os valores da coluna estejam em ordem decrescente. O processo ento repetido at atingir uma fonte reduzida com apenas dois smbolos. O segundo passo no algoritmo consiste em codicar cada fonte reduzida, iniciando pela menor fonte e caminhando em direo fonte original. O menor cdigo binrio possvel 3

A Sequencia ZIG-ZAG

No formato JPEG depois da aplicada a transformada DCT, e logo a ps quantitizao feita a ordenao em sequencia zig-zag. Existem vrios tipos de ordenao utilizados em varreduras de vdeos, dentre elas as mais comuns so ss de varredura horizontal onde na imagem lida da primeira a ultima linha, onde cada linha percorrida da esquerda para direita. Outra varredura muito utilizada a vertical onde ao invs de percorrer todas as linhas da primeira a ultima esse mapeamento percorre todas as colunas em sequencia, da

port, 1999. ISBN 8574520098. NELSON, Mark. The Data Compression Book: Featuring fast, ecient data compression techniques in C. MT Books, 1991. SANTOS, Ana Cristina. Uma Tcnica por Transformada para Compresso de Imagens. Dissertao de Mestrado, ICMSC - USP So Carlos, 1994. SILVA, Francisco Assis. COMPRESSO DE IMAGENS UTILIZANDO A TRANSFORMADA DISCRETA DO COSSENO. Dissertao de Graduao, Unoeste FIPP,Presidente Prudente, 1998.

Figura 5: Redues de fonte no algoritmo de Human. para uma fonte de 2 smbolos formado pelos smbolos 0 e 1. Como a gura 2 ilustra, estes valores so atribudos aos dois smbolos da direita (neste caso, no qual a probabilidade maior recebe o bit 0). Como o smbolo de probabilidade 0,6 foi gerado a partir da combinao de dois outros smbolos na fonte reduzida sua esquerda, o 0 usado para codic-lo agora atribudo a ambos os smbolos que lhe deram origem, colocando-se um 0 ou 1 direita de cada um para distingui-los. O processo repetido para cada fonte reduzida at se retornar fonte original. O cdigo resultante aparece na terceira coluna da gura 6.

Figura 6: Atribuio de palavras-cdigo no algoritmo de Human. O algoritmo de Human permite a criao de um cdigo timo para um dado conjunto de smbolos e respectivas probabilidades, com a restrio de que os smbolos devem ser codicados um de cada vez. A principal desvantagem prtica do cdigo de Human a necessidade de se armazenar ou transmitir a tabela de smbolos da fonte e respectivas probabilidades juntamente com os dados codicados.

Concluso

A transformada DCT se mostra muito eciente na compresso de imagem e vdeo, sendo largamente utilizada em diversos formatos de imagem como o JPEG e vdeo como MPEG-2 e H.264. A ampla utilizao da transformada discreta do cosseno se deva ao fato da transformada possibilitar alta taxas de compresso reduzindo consideravelmente a perda de dados, dessa forma reduzindo o espao de armazenamento e o tempo de transmisso.

Referencias

MARQUES FILHO, Og; VIEIRA NETO, Hugo. Processamento Digital de Imagens, Rio de Janeiro: Bras4

Você também pode gostar