Você está na página 1de 23

INTRODUO MULTIMDIA

Compresso: conceitos gerais

INTRODUO MULTIMDIA

Motivao
Factores relativos ao armazenamento Factores relativos transmisso

INTRODUO MULTIMDIA

Processo
Funo realizada sobre dados antes da operao:
Codificador da Origem (Source Coder) Descodificador do Destino (Destination Decoder)

Usada para reduzir o volume de informao

INTRODUO MULTIMDIA

A redundncia
O objectivo da compresso de reduzir ao mximo o volume de armazenamento e de transferncia de informao, mantendo no entanto a capacidade de restituir a integridade dessa informao. Pelo menos quando trabalhamos em compresso sem perdas. Como reduzir o volume de dados digitais sem degradar a informao ou, pelo menos, s a degradando de forma imperceptvel e controlvel? Constatando que a quase totalidade de dados que tratamos - imagem, texto, som - apresentam uma distribuio no uniforme de smbolos ou de sequencias de smbolos.

INTRODUO MULTIMDIA

A redundncia
Texto:
Os caracteres que utilizamos no apresentam a mesma probabilidade de aparecimento. Todo o texto apresenta uma estrutura interna forte, determinada pelas regras sintticas, semnticas e gramaticais. Regras implicam regularidade e consequentemente formas repetitivas e redundncia.

Som:
Se analisarmos um trecho de musica, constatamos rapidamente que a distribuio das probabilidades de aparecimento de sons no mais uniforme que a das letras num texto. Tambm eles seguem regras ou leis de construo.

INTRODUO MULTIMDIA

A redundncia
Imagem:
Quando manipulamos imagens constatamos evidentemente que elas apresentam regularidades: longas sries de pixeis idnticos, ou quase idnticos: no cu azul, nas nuvens brancas, na relva verde; estruturas repetitivas; composio geral da imagem, etc. Tratam-se neste caso de redundncia espaciais, i.e., motivos repetitivos no mesmo espao.

Vdeo:
Logo que utilizamos sequencias de imagens, as redundncia temporais vem juntar-se as redundncia espaciais. De uma imagem seguinte, e numa ordem de 25 imagens por segundo, muitos dos elementos mantm-se idnticos. Por exemplo, numa entrevista televisiva, uma grande parte da imagem (o fundo) mantm-se idntica durante vrios segundos.

INTRODUO MULTIMDIA

A redundncia
So estas redundncia espaciais e temporais que permitem a compresso dos dados, isto e, a remoo de dados inteis. Para tirar partido destas redundncia podemos usar algoritmos mais ao menos complexos, fundados sobre tcnicas matemticas quase sempre sofisticadas (compresso JPEG, MPEG, Wavelets, fractais, etc.).

INTRODUO MULTIMDIA

Os parmetros da compresso
O parmetro chave de um algoritmo de compresso a taxa de compresso, a qual define a sua performance. Este calculado como a relao entre o tamanho do ficheiro original (Fo) e o tamanho do ficheiro comprimido (Fc) . Utilizamos geralmente para representar esta relao uma noo do tipo N : 1 que indica que o volume dos dados de origem foi dividido por N. Por exemplo 10 : 1 significa que o tamanho do ficheiro original foi dividido por 10. Outros parmetros que caracterizam igualmente um algoritmos de compresso so a sua velocidade e a qualidade de restituio do documento original.

INTRODUO MULTIMDIA

Simetria e assimetria

Um sistema de compresso supe um algoritmo de compresso e um de descompresso (codec) . Estes algoritmos apresentam normalmente uma certa assimetria no que diz respeito ao tempo e a qualidade de compresso. A velocidade, que define o tempo necessrio ao processo de compresso / descompresso, pode ser simtrico quando o tempo necessrio a compresso equivalente ao tempo necessrio a descompresso. Para a maior parte dos medias digitais, a velocidade assimtrica: o tempo de compresso e mais longo do que o tempo de descompresso (para gravar em CDROM, aplicaes de vdeo a pedido, etc) . Note-se igualmente que velocidades assimtricas autorizam em geral um melhor debito, ou taxa de compresso. No caso de aplicaes multimdia em tempo real (vdeo-conferncia, streaming de udio e vdeo em tempo real, etc) temos necessidade de compressores rpidos. O tempo de compresso e nestes casos quase igual ao tempo de descompresso. Em geral, esta velocidade simtrica reduz a taxa de compresso. Assim, simetria e assimetria podem influenciar a qualidade de compresso.

INTRODUO MULTIMDIA

Adaptabilidade
A adaptabilidade refere-se caracterstica do processo/algoritmo de se adaptar aos dados de entrada. possvel identificar segundo este aspecto as seguintes variaes:
No-adaptativos em geral, baseiam-se em dicionrios estticos definidos priori em funo de estatstica de frequncia de dados. Um dicionrio de codificao/compresso na essncia uma tabela que associa smbolos a cdigos de menor tamanho. Adaptativos - no se baseiam em dicionrio predefinidos, construindo o dicionrio em funo dos dados de entrada. Semi-adaptativos em geral efectuado em dois passos. No primeiro efectuada uma estatstica da entrada, gerando um dicionrio. Na segunda fase efectuada a codificao/compresso propriamente dita.

INTRODUO MULTIMDIA

Compresso com perdas e sem perdas


O algoritmo de compresso reversvel (Fd = Fo) . Transferncia de texto, ficheiros binrios, etc.

Compresso sem perdas (lossless) busca reduzir a quantidade de dados, mas no destino uma cpia exacta dos dados originais so recuperados, a compresso reversvel. Compresso com perdas (lossy) busca permitir a recuperao de uma verso dos dados originais que so percebidos pelo utilizador como sendo parecidos o suficiente com o original. PERDA DE DADOS!
Transferncia de imagens digitais, udio, vdeo, pois o olho e ouvido humanos no so capazes de perceber pequena perda de qualidade no sinal. O algoritmo de compresso irreversvel, pois ele no permite a partir do ficheiro descomprimido (Fd), encontrar na integralidade o ficheiro original (Fo =~4 Fd).

INTRODUO MULTIMDIA

Tcnicas de Compresso
Codificao em sequncia (Run-Length Coding - RLC)
Uma tcnica de compresso sem perdas Usada quando o sinal a ser codificado contm uma longa sequncia de bits repetidos. Sequncia de bits substituda pelo bit e indicao de quantidade do mesmo. 000000011111111110000011 0,7,1,10,0,5,1,2

INTRODUO MULTIMDIA

Tcnicas de Compresso
Codificao Estatstica
Modelos de codificao utilizam o mesmo nmero de bits por valor. Alguns smbolos aparecem com maior frequncia que outros. Smbolos que aparecem com maior frequncia podem usar menos bits que aqueles que aparecem com menor frequncia. Num texto a letra A aparece com maior frequncia (probabilidade) que a consoante P,que aparece com maior frequncia que Z Utiliza-se uma codificao com nmero de bits varivel, de modo que na mdia se necessita menos bits para codificar o mesmo contedo.

INTRODUO MULTIMDIA

Tcnicas de Compresso
Codificao Estatstica
Mtodo de Huffman
Codificar com o menor numero de bits os smbolos em que a frequncia de apario e a maior. Os primeiros elementos de uma palavra cdigo (o prefix) no pode constituir uma outra palavra de cdigo (cdigo prefixo) . Exemplo: ABRACADABRA -> 8bits x 11 smbolos = 88 bits A -> 5 -> 0 B -> 2 -> 10 R -> 2 -> 110 C -> 1 -> 1110 D -> 1 -> 1111

Resultado: 01011001110011110101100 -> 23 bits

INTRODUO MULTIMDIA

Tcnicas de Compresso
Codificao Estatstica
Mtodo de Huffman
O algoritmo de Huffman consiste em partir de uma analise estatstica do contedo do ficheiro, atribuir aos smbolos mais frequentes os cdigos binrios o mais curto possvel, reservando os cdigos mais longos aos smbolos que aparecem menos vezes. Este tipo de codificao obriga a criao de tabelas de frequncias que tero de ser transmitidas visto que so necessrias para a descodificao. Para aplicar a um ficheiro o algoritmos de Huffman temos de percorrer as seguintes etapas:
1. Leitura do ficheiro para calculo da frequncia de ocorrncia de cada smbolo. 2. Classificao dos smbolos em funo da sua frequncia de ocorrncia. 3. Reagrupamento sequencial dos pares de smbolos de menor frequncia, voltando a executar a classificao, se necessrio. 4. Atribuio de um cdigo a cada smbolo: atribui-se um 0 ou um 1 a cada elemento antes de reagrupa-lo; O cdigo de cada smbolo ser constitudo pela sequncia (lida da direita para a esquerda) de 0 e 1 que se encontram no caminho de reagrupamento do smbolo. 5. Codificao final.

INTRODUO MULTIMDIA

Tcnicas de Compresso
Codificao Estatstica
Mtodo de Huffman
Codificar a sequencia: AMORE MORE ORE RE O alfabeto ser constitudo por seis smbolos: A, E, M, O, R, Espao. Para comprimir esta sequncia de dados usando o algoritmo de Huffman segue-se cada uma das etapas acima descritas.

INTRODUO MULTIMDIA

Tcnicas de Compresso
Codificao Estatstica
Mtodo de Huffman
Etapa 1: Estabelece a frequncia de ocorrncia de cada smbolo. f (A) = 1; f (E) = 4; f (M) = 2; f (O) = 3; f (R) = 4; f (Espao) = 3 Etapa 2:Classificao dos smbolos por ordem decrescente de frequncia. Smbolo i Frequncia fi E 4 R 4 O 3 Espao 3 M 2 A 1

INTRODUO MULTIMDIA

Tcnicas de Compresso
Codificao Estatstica
Mtodo de Huffman
Etapa 3: Agrupamento das duas frequncias mais pequenas, voltando a executar a classificao anterior, se necessrio.

INTRODUO MULTIMDIA

Tcnicas de Compresso
Codificao Estatstica
Mtodo de Huffman
Etapa 4: Atribuio do cdigo. Para encontrar o cdigo de cada smbolo, identificamos o seu caminho da direita para a esquerda, e recuperamos os 0 ou os 1 que se encontram pelo caminho.

INTRODUO MULTIMDIA

Tcnicas de Compresso
Codificao Estatstica
Mtodo de Huffman
E 01 R 10 O 11 Espao 000 M 0010 A 0011 Etapa 5: Compresso da cadeia: AMORE MORE ORE RE 0011001011100100000101110010001110010001001 Nota: Independentemente da atribuio de 0 ou 1, este mtodo encontra sempre a compresso mnima. Ou seja, quando temos por exemplo 3 smbolos frequncias iguais e mnimas numa dada fase, podemos agrupar os 2 smbolos que entendermos.

INTRODUO MULTIMDIA

Tcnicas de Compresso
Algoritmos do tipo dicionrio
Os mtodos de compresso baseados em dicionrios so caracterizados principalmente por :
No necessitarem de conhecer a estatstica dos dados a N comprimir. No usarem cdigos de comprimento varivel. Utilizarem sequencias de smbolos de comprimento varivel. Muitos dos programas de compresso de dados mais conhecidos baseiamse nestas tcnicas: pkzip, zoo, arj, compress, gzip, ... A sua inveno deveu-se a Jacob Ziv e Abraham Lempel (J. Ziv and A. Lempel, A universal algorithm for sequential data compression, IEEE Trans. on Information Theory, 1977, 23, pp. 337-343), em finais dos anos 70: LZ77 e LZ78. Desde ento, muitas variantes foram propostas: LZH, LZSS,LZW (Lempel, Ziv, Welch). Este ultimo mtodo deve-se a Terry Welch que em 1984 publicou um artigo onde alguns dos problemas associados a compresso LZ78 foram eliminados. Este e o algoritmo de compresso sem perdas mais utilizado. Pode ser usado para comprimir texto, codigo binario, codigo executavel, imagens (GIF, TIFF, PostScript).

INTRODUO MULTIMDIA

Tcnicas de Compresso
Codificao por Diferena
Usado quando a amplitude de um sinal pode assumir valores numa gama larga, porm a diferena de amplitudes de valores sucessivos relativamente pequena. Ao invs de usar um grande numero de bits para representara amplitude do sinal, apenas a diferena para o valor anterior armazenado, com um nmero menor de bits. Pode acarretar compresso com perdas ou sem perdas, dependendo do nmero de bits escolhidos serem suficientes para armazenar a maior das diferenas entre amplitudes sucessivas. Um sinal que requer 12 bits para ser codificado pode ter diferenas com no mais de 3 bits, o que acarreta uma economia de 75% na quantidade de bits resultante da codificao das amostras.

INTRODUO MULTIMDIA

Tcnicas de Compresso
Codificao por Transformadas
Envolve a transformao da informao original de um formato para outro mais apropriado para compresso. No existe perda pela transformao em si. Muito usado para compresso de imagens e vdeo. A taxa de mudana na magnitude dos valores dos pixels na matriz define o que denominamos frequncia espacial, que pode ser horizontal e vertical. O olho humano menos sensvel s componentes espaciais de mais alta frequncia. Seria vantajoso converter os valores espaciais originais em valores baseados em componentes de frequncia espacial, j que pode-se eliminar mais facilmente as componentes que pouco contribuem para a inteligibilidade da imagem, diminuindo a quantidade de informao a ser processada.

Você também pode gostar