Escolar Documentos
Profissional Documentos
Cultura Documentos
Compressão de Imagens
Compressão de Imagens
Os recursos necessrios para armazenar e transmitir imagens so imensos, o que torna atractiva a compresso de imagem A compresso de imagem baseia-se na remoo de informao redundante existente nas imagens Existem duas categorias de compresso de imagem: no destrutiva possvel reconstruir EXACTAMENTE a imagem original antes de ter sido efectuada a compresso destrutiva no processo de compresso so perdidas caractersticas das imagens, o que permite obter graus de compresso mais elevados
Fundamentos
Se n1 e n2 forem duas representaes da mesma informao, o grau de compresso (CR) dado por:
CR =
n1 n2
RD = 1
1 CR
Existem trs tipos de redundncia nas imagens que so explorados pelos mecanismos de compresso: 1. codificao A forma como a imagem representada (codificada) introduz redundncia 2. inter-pixel A imagem apresenta repeties de padres de pixels 3. psico-visual A imagem inclui informao que visualmente no relevante
49
Compresso de Imagem
Redundncia de codificao
Se os tons de pixels de uma imagem no ocorrem com a mesma frequncia (probabilidade) os tons mais frequentes podem ser codificados com menos bits O nmero mdio de bits necessrios para codificar uma imagem dado pela soma do nmero de bits utilizados para representar cada tom l(rk) multiplicado pela frequncia desse mesmo tom pr(rk):
L 1
O code 2 requer uma mdia de 2,7 bits/pixel Representao grfica do processo de compresso do exemplo anterior:
O processo de codificao utilizado no exemplo anterior designado por codificao de comprimento varivel, uma vez que cada tom codificado com um nmero de bits diferente.
50 Joo Lus Sobral 2003
Compresso de Imagem
Redundncia inter-pixels
Em algumas imagens existem padres de pixels que se repetem, implicando que um pixel introduz pouca informao, relativamente aos seus vizinhos, porque o valor do pixel pode ser previsto a partir do valor dos vizinhos. Neste tipo de imagens a correlao entre blocos de pixels () mais elevada:
51
Compresso de Imagem
Redundncia inter-pixels (continuao)
A redundncia inter-pixels normalmente removida atravs da transformao para um formato mais eficiente (geralmente no visual), por exemplo utilizando a diferena entre pixels adjacentes da imagem Exemplo Utilizar o tom durao para representar a imagem
C (nf 0 ) =
1 j 2 nf x v( x)e 0 dx T0 T0
+
O tom 1 aparece 63 vezes, depois, o tom 0 aparece 87 vezes, etc. Neste exemplo, a codificao tom-durao permite codificar uma linha de 1024 bits em apenas 88 bits. Nesta imagem o grau de compresso 2,63 (considerando toda a imagem)
52
Compresso de Imagem
Redundncia psico-visual
Existe certa informao nas imagens que relativamente menos importante que outra para os sistemas de viso A informao relativamente menos importante pode ser removida da imagem sem que exista uma degradao significativa da qualidade visvel da imagem Ao contrrio dos dois tipos de redundncia anteriores, este tipo no facilmente quantificvel, sendo um critrio subjectivo Exemplo reduo do nmero de tons (i., bits por pixel) utilizados para representar uma imagem os 8 bits por pixel, utilizados na imagem original, foram reduzidos para 4, utilizando duas tcnicas diferentes
Critrio de fidelidade
Um critrio objectivo por ser obtido calculando o erro total entre as imagens ou a raiz do quadrado dos erros mdios:
1
erms
Viso por Computador
1 = MN
M 1 N 1 x =0 y = 0
f ( x, y ) f ( x, y )
2
53
Compresso de Imagem
Modelos de Compresso de Imagem
Existe certa informao nas imagens que relativamente menos importante que outra nos sistemas de viso
O mapper converte a imagem num formato diferente, com o objectivo de reduzir a redundncia inter-pixel O quantizer reduz a acuidade do resultado produzido pelo mapper, de acordo com um critrio de fidelidade, com vista reduo da redundncia psico-visual O symbol encoder codifica os smbolos por forma a minimizar a redundncia de codificao. As trs fases de codificao no so obrigatoriamente utilizadas em todos os sistemas de codificao. Por exemplo, na compresso sem perda no utilizado o quantizer. Apenas as operaes realizadas pelo mapper e pelo symbol encoder so reversveis.
Teoria da Informao
Qual a quantidade mnima de dados que necessria para representar determinada informao? A quantidade de informao (entropia ou incerteza) por elemento pode ser calculada a partir da probabilidade de ocorrncia de cada um dos smbolos P(aj). Se a ocorrncia de cada smbolo for independente:
54
Compresso de Imagem
Teoria da informao (continuao)
21 21 21 21
21 21 21 21
21 21 21 21
95 95 95 95
- Se no for removida a redundncia, sero utilizados 8 bits/pixel - A estimativa de primeira ordem (i.., considerando a ocorrncia dos smbolos independente) da entropia : Tom
21 95 169 243
Cont.
12 4 4 12
Probabilidade
3/8 1/8 1/8 3/8
H = - 3/8 x log2(3/8) - 1/8 x log2(1/8) - 1/8 x log2(1/8) - 3/8 x log2(3/8) 1,81 bits /pixel ou 58 bits no total - A estimativa de segunda ordem (i.., considerando a ocorrncia dois smbolos consecutivos interdependente) da entropia : Par de tons
(21,21) (21,95) (95,169) (169,243) (243,243) (243,21)
Cont.
8 4 4 4 8 4
Probabilidade
1/4 1/8 1/8 1/8 1/4 1/8
H = 1,24 bits /pixel As estimativas de ordem superior so extremamente complexas. Utilizando blocos de 5 pixels pode originar (28 ) 5 1012 combinaes A estimativa de primeira ordem da entropia indica o limite que se consegue obter apenas com codificao de comprimento varivel A diferena entre a primeira e segunda estimativas da entropia indica a existncia de redundncia inter-pixels
55 Joo Lus Sobral 2003
Compresso de Imagem
Tcnicas de compresso de imagem sem perda
Huffman Esquema de codificao com cdigos de comprimento varivel que obtm o menor nmero mdio de bits por smbolo quando no existe redundncia inter-pixels Fase 1 Os vrios smbolos so ordenados por probabilidade decrescente,
sendo sucessivamente somados os smbolos com menor probabilidade, at restarem apenas duas somas:
Neste exemplo, a codificao de Huffman produziu uma mdia de 2,2 bits/pixel o que um valor prximo da entropia (2,14) A codificao de Huffman atribui um cdigo nico a cada smbolo, o que permite posteriormente efectuar a descodificao, sem perda de informao A codificao de Huffman pouco adequada quando existem muitos smbolos, uma vez que necessrio somar as probabilidades. Existem um esquema modificado que permite truncar os cdigos com mais do que determinado nmero de bits
Viso por Computador 56 Joo Lus Sobral 2003
Compresso de Imagem
Tcnicas de compresso de imagem sem perda (cont.)
comprimento varivel, permitindo tambm reduzir dependncias inter-pixels Esquema patenteado, actualmente utilizado em GIF, TIFF e PDF Pode ser utilizado para a compresso de informao a qual no se conhece a priori (i.., no possvel determinar a probabilidade de cada smbolo) As palavras reconhecidas so mantidas num dicionrio, construdo dinamicamente Exemplo codificar a seguinte imagem (9 bits por smbolo) 39 39 39 39 39 39 39 39 126 126 126 126 126 126 126 126
Resultado da codificao
Um aspecto delicado do algoritmo a escolha das palavras mantidas no dicionrio e a prpria dimenso do dicionrio.
57 Joo Lus Sobral 2003
Compresso de Imagem
Tcnicas de compresso de imagem sem perda (cont.)
sendo cada plano comprimido individualmente Uma decomposio alternativa utiliza gray codes, onde dois tons com valores adjacentes apenas diferem num bit. Os planos de bits podem ser codificados atravs de tom-durao ou atravs da codificao de regies de tom constante (diviso da imagem em blocos).
Codificao com previso (sem perda) utilizada uma funo para prever o
tom dos pixels seguintes, em funo dos anteriores, sendo apenas armazenada a diferena entre o valor previsto e o tom efectivo do pixel: en = f n f n A funo de previso na maior parte dos casos uma funo linear dos pixels existentes nessa linha da imagem:
m f n ( x, y ) = round i f ( x, y 1) i =1
58
Compresso de Imagem
Tcnicas de compresso de imagem com perda
Geralmente a imagem dividida em blocos, sendo a codificao efectuada isoladamente a cada bloco da imagem. A diviso em blocos pode ser um processo irregular (i.., a diviso adaptativa) O quantizer geralmente elimina valores da transformada (coeficientes) com um impacto visual reduzido (i.. com menor amplitude) o que reduz o espao necessrio para representar a imagem. O symbol encoder codifica os coeficientes que no foram eliminados As transformadas de imagem podem ser interpretadas como um processo em cada imagem representada por uma soma de imagens base, em que cada coeficiente da transformada determina a contribuio de cada uma das imagens base para a imagem original
o Exemplos: Walsh-Hadamard e transformada discreta do coseno (4x4)
59
Compresso de Imagem
Tcnicas de compresso de imagem com perda (cont)
Exemplo: comparao de trs transformadas de imagem (FFT, WHT e DCT), desprezando 50% dos coeficientes (mantendo os de maior amplitude) e subdividindo a imagem em blocos de 8x8 pixels
Os erros rms, para cada uma das transformadas so, respectivamente, 1,28, 0,86 e 0,68 nveis de cinzento As transformadas que concentram mais informao num menor nmero de coeficientes so as mais indicadas para efectuar compresso de imagem (DCT geralmente superior s outras transformadas) A DCT tem a vantagem adicional de minimizar o efeito de blocos que aparece nas imagens aps a compresso
60 Joo Lus Sobral 2003
Compresso de Imagem
Tcnicas de compresso de imagem com perda (cont)
A imagens so subdivididas em blocos por forma a reduzir a redundncia entre blocos adjacentes. Os blocos geralmente possuem uma dimenso que seja potncia de 2 para reduzir a quantidade de clculos. Dimenses frequentemente utilizadas so 8x8 e 16x16. O grau de compresso e a complexidade dos clculos aumentam com a dimenso dos blocos. Variao do erro em funo da dimenso dos blocos (truncando 75% dos coeficientes):
computacionalemente mais eficiente e inerentemente local o que torna desnecessria a diviso da imagem em blocos.
61
Compresso de Imagem
Standards de compresso de imagem
CCITT Group 3
Originalmente utilizado para compresso de FAX transmitidos pela linha telefnica Utilizado para compresso sem perda de imagens binrias, baseado num esquema de compresso tom-durao com cdigos Huffman modificados
JPEG
Standard mais popular de compresso de imagens com perda Baseado na transformada discreta do coseno, aplicada a blocos de 8x8 pixels
JPEG 2000
Extenso ao JPEG para permitir maior flexibilidade na compresso e no acesso a imagens comprimidas Baseado nas tcnicas de codificao com wavelets
Abrangem vrias qualidade de vdeo: MPEG 1 qualidade de entretenimento (at 1.5 Mbit/2), MPEG-2 qualidade PAL (2 a 10 Mbit/s) e MPEG-4 flexibilidade acrescida e maior eficincia na compresso Baseado num esquema hbrido com provisores e DCT Explora as redundncias intra-imagem e inter-imagens, possuindo vrios tipos de blocos para codificao: 1. Intra-frame (I-Frame) frame comprimida de forma independente de todas as outras frames . a mais prxima de JPEG 2. Predicitve frame (P-Frame) diferena entre a frame actual e a sua previso baseada na frame anterior 3. Bidirectional frame (B-Frame) diferena entre a frame actual e a sua previso baseada na frame anterior e na prxima P-frame
62