Você está na página 1de 14

Compresso de Imagem

Os recursos necessrios para armazenar e transmitir imagens so imensos, o que torna atractiva a compresso de imagem A compresso de imagem baseia-se na remoo de informao redundante existente nas imagens Existem duas categorias de compresso de imagem: no destrutiva possvel reconstruir EXACTAMENTE a imagem original antes de ter sido efectuada a compresso destrutiva no processo de compresso so perdidas caractersticas das imagens, o que permite obter graus de compresso mais elevados

Fundamentos

Se n1 e n2 forem duas representaes da mesma informao, o grau de compresso (CR) dado por:

CR =

n1 n2

A redundncia relativa RD pode ser definida por:

RD = 1

1 CR

Existem trs tipos de redundncia nas imagens que so explorados pelos mecanismos de compresso: 1. codificao A forma como a imagem representada (codificada) introduz redundncia 2. inter-pixel A imagem apresenta repeties de padres de pixels 3. psico-visual A imagem inclui informao que visualmente no relevante

Viso por Computador

49

Joo Lus Sobral 2003

Compresso de Imagem
Redundncia de codificao

Se os tons de pixels de uma imagem no ocorrem com a mesma frequncia (probabilidade) os tons mais frequentes podem ser codificados com menos bits O nmero mdio de bits necessrios para codificar uma imagem dado pela soma do nmero de bits utilizados para representar cada tom l(rk) multiplicado pela frequncia desse mesmo tom pr(rk):

Lavg = l (rk ) pr (rk )


k =0
Exemplo:

L 1

L o nmero de tons na imagem

O code 2 requer uma mdia de 2,7 bits/pixel Representao grfica do processo de compresso do exemplo anterior:

O processo de codificao utilizado no exemplo anterior designado por codificao de comprimento varivel, uma vez que cada tom codificado com um nmero de bits diferente.
50 Joo Lus Sobral 2003

Viso por Computador

Compresso de Imagem
Redundncia inter-pixels

Em algumas imagens existem padres de pixels que se repetem, implicando que um pixel introduz pouca informao, relativamente aos seus vizinhos, porque o valor do pixel pode ser previsto a partir do valor dos vizinhos. Neste tipo de imagens a correlao entre blocos de pixels () mais elevada:

Viso por Computador

51

Joo Lus Sobral 2003

Compresso de Imagem
Redundncia inter-pixels (continuao)

A redundncia inter-pixels normalmente removida atravs da transformao para um formato mais eficiente (geralmente no visual), por exemplo utilizando a diferena entre pixels adjacentes da imagem Exemplo Utilizar o tom durao para representar a imagem

os coeficientes C ( nf0 ) da srie so dados por:

C (nf 0 ) =

1 j 2 nf x v( x)e 0 dx T0 T0
+

Como alternativa, pode ser utilizada a forma trigonomtrica:

v( x) = C0 + 2Cn cos(2 n f 0 x + arg(Cn ) )


n =1

O tom 1 aparece 63 vezes, depois, o tom 0 aparece 87 vezes, etc. Neste exemplo, a codificao tom-durao permite codificar uma linha de 1024 bits em apenas 88 bits. Nesta imagem o grau de compresso 2,63 (considerando toda a imagem)

Viso por Computador

52

Joo Lus Sobral 2003

Compresso de Imagem
Redundncia psico-visual

Existe certa informao nas imagens que relativamente menos importante que outra para os sistemas de viso A informao relativamente menos importante pode ser removida da imagem sem que exista uma degradao significativa da qualidade visvel da imagem Ao contrrio dos dois tipos de redundncia anteriores, este tipo no facilmente quantificvel, sendo um critrio subjectivo Exemplo reduo do nmero de tons (i., bits por pixel) utilizados para representar uma imagem os 8 bits por pixel, utilizados na imagem original, foram reduzidos para 4, utilizando duas tcnicas diferentes

Critrio de fidelidade

Um critrio objectivo por ser obtido calculando o erro total entre as imagens ou a raiz do quadrado dos erros mdios:
1

erms
Viso por Computador

1 = MN

M 1 N 1 x =0 y = 0

f ( x, y ) f ( x, y )
2

53

Joo Lus Sobral 2003

Compresso de Imagem
Modelos de Compresso de Imagem

Existe certa informao nas imagens que relativamente menos importante que outra nos sistemas de viso

O mapper converte a imagem num formato diferente, com o objectivo de reduzir a redundncia inter-pixel O quantizer reduz a acuidade do resultado produzido pelo mapper, de acordo com um critrio de fidelidade, com vista reduo da redundncia psico-visual O symbol encoder codifica os smbolos por forma a minimizar a redundncia de codificao. As trs fases de codificao no so obrigatoriamente utilizadas em todos os sistemas de codificao. Por exemplo, na compresso sem perda no utilizado o quantizer. Apenas as operaes realizadas pelo mapper e pelo symbol encoder so reversveis.

Teoria da Informao

Qual a quantidade mnima de dados que necessria para representar determinada informao? A quantidade de informao (entropia ou incerteza) por elemento pode ser calculada a partir da probabilidade de ocorrncia de cada um dos smbolos P(aj). Se a ocorrncia de cada smbolo for independente:

H ( z ) = P(a j ) log( P(a j ))


j =1

Viso por Computador

54

Joo Lus Sobral 2003

Compresso de Imagem
Teoria da informao (continuao)

Exemplo Qual a quantidade de informao existente na seguinte imagem:

21 21 21 21

21 21 21 21

21 21 21 21

95 95 95 95

169 169 169 169

243 243 243 243

243 243 243 243

243 243 243 243

- Se no for removida a redundncia, sero utilizados 8 bits/pixel - A estimativa de primeira ordem (i.., considerando a ocorrncia dos smbolos independente) da entropia : Tom
21 95 169 243

Cont.
12 4 4 12

Probabilidade
3/8 1/8 1/8 3/8

H = - 3/8 x log2(3/8) - 1/8 x log2(1/8) - 1/8 x log2(1/8) - 3/8 x log2(3/8) 1,81 bits /pixel ou 58 bits no total - A estimativa de segunda ordem (i.., considerando a ocorrncia dois smbolos consecutivos interdependente) da entropia : Par de tons
(21,21) (21,95) (95,169) (169,243) (243,243) (243,21)

Cont.
8 4 4 4 8 4

Probabilidade
1/4 1/8 1/8 1/8 1/4 1/8

H = 1,24 bits /pixel As estimativas de ordem superior so extremamente complexas. Utilizando blocos de 5 pixels pode originar (28 ) 5 1012 combinaes A estimativa de primeira ordem da entropia indica o limite que se consegue obter apenas com codificao de comprimento varivel A diferena entre a primeira e segunda estimativas da entropia indica a existncia de redundncia inter-pixels
55 Joo Lus Sobral 2003

Viso por Computador

Compresso de Imagem
Tcnicas de compresso de imagem sem perda

Huffman Esquema de codificao com cdigos de comprimento varivel que obtm o menor nmero mdio de bits por smbolo quando no existe redundncia inter-pixels Fase 1 Os vrios smbolos so ordenados por probabilidade decrescente,

sendo sucessivamente somados os smbolos com menor probabilidade, at restarem apenas duas somas:

Fase 2 So codificados os vrios smbolos, adicionando um bit ao cdigo de

cada smbolo, para cada soma efectuada, por ordem inversa:

Neste exemplo, a codificao de Huffman produziu uma mdia de 2,2 bits/pixel o que um valor prximo da entropia (2,14) A codificao de Huffman atribui um cdigo nico a cada smbolo, o que permite posteriormente efectuar a descodificao, sem perda de informao A codificao de Huffman pouco adequada quando existem muitos smbolos, uma vez que necessrio somar as probabilidades. Existem um esquema modificado que permite truncar os cdigos com mais do que determinado nmero de bits
Viso por Computador 56 Joo Lus Sobral 2003

Compresso de Imagem
Tcnicas de compresso de imagem sem perda (cont.)

LZW (Lempel-ZivWelch) Associa cdigos de comprimento fixo a palavras de

comprimento varivel, permitindo tambm reduzir dependncias inter-pixels Esquema patenteado, actualmente utilizado em GIF, TIFF e PDF Pode ser utilizado para a compresso de informao a qual no se conhece a priori (i.., no possvel determinar a probabilidade de cada smbolo) As palavras reconhecidas so mantidas num dicionrio, construdo dinamicamente Exemplo codificar a seguinte imagem (9 bits por smbolo) 39 39 39 39 39 39 39 39 126 126 126 126 126 126 126 126

Resultado da codificao

Um aspecto delicado do algoritmo a escolha das palavras mantidas no dicionrio e a prpria dimenso do dicionrio.
57 Joo Lus Sobral 2003

Viso por Computador

Compresso de Imagem
Tcnicas de compresso de imagem sem perda (cont.)

Codificao de planos de bits A imagem decomposta em planos de bits,

sendo cada plano comprimido individualmente Uma decomposio alternativa utiliza gray codes, onde dois tons com valores adjacentes apenas diferem num bit. Os planos de bits podem ser codificados atravs de tom-durao ou atravs da codificao de regies de tom constante (diviso da imagem em blocos).

Codificao com previso (sem perda) utilizada uma funo para prever o

tom dos pixels seguintes, em funo dos anteriores, sendo apenas armazenada a diferena entre o valor previsto e o tom efectivo do pixel: en = f n f n A funo de previso na maior parte dos casos uma funo linear dos pixels existentes nessa linha da imagem:
m f n ( x, y ) = round i f ( x, y 1) i =1

Exemplo: f n ( x, y ) = round [ f ( x, y 1)]

Viso por Computador

58

Joo Lus Sobral 2003

Compresso de Imagem
Tcnicas de compresso de imagem com perda

Codificao atravs de transformadas A imagem transformada numa nova

representao (ex. FFT) sendo a quantificao efectuada na nova representao

Geralmente a imagem dividida em blocos, sendo a codificao efectuada isoladamente a cada bloco da imagem. A diviso em blocos pode ser um processo irregular (i.., a diviso adaptativa) O quantizer geralmente elimina valores da transformada (coeficientes) com um impacto visual reduzido (i.. com menor amplitude) o que reduz o espao necessrio para representar a imagem. O symbol encoder codifica os coeficientes que no foram eliminados As transformadas de imagem podem ser interpretadas como um processo em cada imagem representada por uma soma de imagens base, em que cada coeficiente da transformada determina a contribuio de cada uma das imagens base para a imagem original
o Exemplos: Walsh-Hadamard e transformada discreta do coseno (4x4)

Viso por Computador

59

Joo Lus Sobral 2003

Compresso de Imagem
Tcnicas de compresso de imagem com perda (cont)

Codificao atravs de transformadas (cont)

Exemplo: comparao de trs transformadas de imagem (FFT, WHT e DCT), desprezando 50% dos coeficientes (mantendo os de maior amplitude) e subdividindo a imagem em blocos de 8x8 pixels

Os erros rms, para cada uma das transformadas so, respectivamente, 1,28, 0,86 e 0,68 nveis de cinzento As transformadas que concentram mais informao num menor nmero de coeficientes so as mais indicadas para efectuar compresso de imagem (DCT geralmente superior s outras transformadas) A DCT tem a vantagem adicional de minimizar o efeito de blocos que aparece nas imagens aps a compresso
60 Joo Lus Sobral 2003

Viso por Computador

Compresso de Imagem
Tcnicas de compresso de imagem com perda (cont)

Codificao atravs de transformadas (cont)

A imagens so subdivididas em blocos por forma a reduzir a redundncia entre blocos adjacentes. Os blocos geralmente possuem uma dimenso que seja potncia de 2 para reduzir a quantidade de clculos. Dimenses frequentemente utilizadas so 8x8 e 16x16. O grau de compresso e a complexidade dos clculos aumentam com a dimenso dos blocos. Variao do erro em funo da dimenso dos blocos (truncando 75% dos coeficientes):

Wavelet transformada semelhante s anteriores, mas que

computacionalemente mais eficiente e inerentemente local o que torna desnecessria a diviso da imagem em blocos.

Viso por Computador

61

Joo Lus Sobral 2003

Compresso de Imagem
Standards de compresso de imagem

CCITT Group 3

Originalmente utilizado para compresso de FAX transmitidos pela linha telefnica Utilizado para compresso sem perda de imagens binrias, baseado num esquema de compresso tom-durao com cdigos Huffman modificados

JPEG

Standard mais popular de compresso de imagens com perda Baseado na transformada discreta do coseno, aplicada a blocos de 8x8 pixels

JPEG 2000

Extenso ao JPEG para permitir maior flexibilidade na compresso e no acesso a imagens comprimidas Baseado nas tcnicas de codificao com wavelets

Standards de compresso de vdeo

MPEG 1, MPEG 2 e MPEG 4

Abrangem vrias qualidade de vdeo: MPEG 1 qualidade de entretenimento (at 1.5 Mbit/2), MPEG-2 qualidade PAL (2 a 10 Mbit/s) e MPEG-4 flexibilidade acrescida e maior eficincia na compresso Baseado num esquema hbrido com provisores e DCT Explora as redundncias intra-imagem e inter-imagens, possuindo vrios tipos de blocos para codificao: 1. Intra-frame (I-Frame) frame comprimida de forma independente de todas as outras frames . a mais prxima de JPEG 2. Predicitve frame (P-Frame) diferena entre a frame actual e a sua previso baseada na frame anterior 3. Bidirectional frame (B-Frame) diferena entre a frame actual e a sua previso baseada na frame anterior e na prxima P-frame

Viso por Computador

62

Joo Lus Sobral 2003

Você também pode gostar