Você está na página 1de 27

UNIVERSIDADE FEDERAL DO PARAN SETOR DE TECNOLOGIA DEPARTAMENTO DE ENGENHARIA ELTRICA

COMPRESSO DE VDEO (MPEG)

Curitiba Novembro, 2007

CLIA MARLI TOKARSKI

COMPRESSO DE VDEO (MPEG)

Trabalho de Aproveitamento na Disciplina de Processamento Digital de Sinais, Sob Orientao do Professor Marcelo Rosa, Realizado pela Aluna Clia Marli Tokarski, do 8 Perodo do Curso de Engenharia Eltrica.

Curitiba Novembro, 2007

ndice
INTRODUO............................................................................................................................................4 COMPRESSO ..........................................................................................................................................5 MPEG............................................................................................................................................................5 TRANSFORMADA DISCRETA DE COSSENOS.............................................................................................10 QUANTIZAO.........................................................................................................................................11 CODIFICAO..........................................................................................................................................12 RESUMO DO ALGORITMO.........................................................................................................................14 PADRES..................................................................................................................................................14 PADRO MPEG-1....................................................................................................................................16 MPEG1 udio....................................................................................................................................18 PADRO MPEG-2....................................................................................................................................18 MPEG2 udio....................................................................................................................................20 Modelo psicoacstico, efeito mscara e bandas crticas...................................................................22 PADRO MPEG-4...................................................................................................................................23 PADRO MPEG-7....................................................................................................................................24 PADRO MPEG-21..................................................................................................................................25 CONCLUSO............................................................................................................................................26 REFERNCIAS.........................................................................................................................................27

Introduo
Esse trabalho tem por objetivo apresentar as formas de compresso e descompresso de vdeo padronizados pelo grupo MPEG. Para tal, primeiramente, faz-se uma explanao sobre os conceitos de compresso. Partindo-se deste ponto, comea-se a definir como feita a formatao em MPEG e quais as suas definies, origens e ferramentas que se baseia desde seu surgimento at a atualidade. Com isso, necessrio fazer uma rpida reviso sobre o que e como funciona a transformada discreta dos cossenos, a quantizao e a codificao. Estas ferramentas, somadas aos conceitos de MPEG so ento montadas de forma a definio dos padres da montagem do sistema. Estes padres so divididos em vrios grupos e, cada um deles ser analisado com detalhes. Estes grupos so abreviados por: MPEG-1, MPEG-2 e MPEG-3, MPEG -4, MPEG -7 e MPEG -21.

Compresso
Quando o volume de dados de vdeo muito grande (1 segundo de vdeo na resoluo de 640 x 480 resulta em 27 MB), tornam-se necessrias tcnicas de compresso. Com a crescente utilizao de dados cada vez maiores, se torna essencial uma compactao de vdeo para as aplicaes multimdia. Para tal, existem algumas razes que justificam esta utilizao. So elas: H a necessidade de armazenamento de dados multimdia; Com dados multimdia de tamanho muito grande, a velocidade de armazenamento e de transferncia se torna relativamente baixa; A largura de banda da rede que no permite a transmisso de vdeo em tempo real; Um dos grandes problemas dos vdeos a redundncia de imagem e temporal e a compresso se concentra justamente em eliminar estas redundncias e deixar o vdeo o mais limpo possvel pois, como os humanos so os usurios, existe uma tolerncia razoavelmente boa a erros de informao.

MPEG
O MPEG (Movie Pictures Expert Groups) um grupo da ISO/IEC (International Commission), Standards criado em Organization/International 1988, responsvel em Electrotechnical padronizar a

compresso/descompresso, processamento e representao codificada de vdeo, udio e combinao destes, quando usados para armazenamento e recuperao em Digital Storage Media (DSM). Neste conceito, existem dispositivos de armazenamento convencionais, tais como CD-ROMs, drivers e discos rgidos. O desenvolvimento do MPEG foi baseado no JPEG o qual foi desenvolvido pelo mesmo grupo ISO e possui uma boa base para seu desenvolvimento. Ele utilizou a idia de fotos compactadas separadamente e apresentadas sequencialmente.

A codificao MPEG estatstica e para tal baseia-se na correlao Pixel (inter-pel correlation). Estes algoritmos utilizam as tcnicas de transformada discreta de cossenos em blocos de imagens de 8x8 pixels. Para correlao de pixels prximos na mesma imagem, utiliza-se a codificao DPCM entre quadros. Podemos dizer que o MPEG um cdigo de vdeo hbrido DPCM/DCT. O diagrama de blocos de um sistema de codificao e decodificao de vdeo MPEG mostrado na figura a seguir.

Figura 1: Modelo da parte de vdeo de um sistema MPEG. Fonte [3].

importante dizer que o MPEG separa o udio e o vdeo, fazendo assim a compresso em trs camadas: a camada de sistema, a de udio e a de vdeo. Adicionalmente, ele possui uma parte que determina as caractersticas do bitstreams codificados. Este sistema consegue uma alta taxa de compresso, pois somente captura imagens mudadas. O MPEG utiliza um tipo de compresso com perdas, uma vez que alguns dados so perdidos, mas essa diminuio de dados geralmente imperceptvel ao olho humano.

Figura 2: mostra que o olho humano possui baixa sensibilidade para freqncias espaciais altas. Fonte [2].

Como olho humano mais sensvel a variao no brilho do que variao de cromaticidade, os dados da imagem so primeiro divididos numa componente de luminncia e dois de crominncia, e os componentes de crominncia so sub-amostrados relativamente componente de luminncia. Depois deste passo, o habitual mtodo de compresso com perdas usado na compresso de vdeo digital baseado em DCT e em quantizao. Esta tcnica reduz as componentes espaciais de altas-freqncias da imagem, uma vez que o observador humano mais sensvel a erros de reconstruo de componentes de baixas freqncias. O objetivo do passo de quantizao representar os coeficientes DCT com a preciso que necessria para alcanar a qualidade de imagem pretendida. O passo zig-zag coloca os coeficientes de altas-freqncias no fim da stream e uma vez que a maioria deles se tornaram zero depois da quantificao, o RLE (Run Length Encoding) usado para uma compresso ainda maior. O coeficiente do canto superior esquerdo (da figura) representa o valor mdio do bloco e codificado usando a diferena do bloco anterior (DPCM). O passo final do processo de compresso minimizar a entropia utilizando a codificao aritmtica ou de Huffman. A imagem codificada normalmente chamada I-frame (intra-frame) porque o processo de codificao no utiliza nenhuma informao de outras imagens.

Figura 3: Diagramas de blocos de compresso de vdeo. Fonte [4].

Alm da anterior, outra tcnica de compresso pode ser utilizada: a redundncia temporal entre imagens. O mtodo bsico consiste em calcular o erro de predio entre os blocos correspondentes nas imagens atuais e nas imagens anteriores. Os valores do erro so enviados para o processo de compresso. As imagens comprimidas geradas pela predio so chamadas Pframes. Quando se utiliza tanto as imagens anteriores como as futuras como referncia, a imagem chamada B-frame (bidirectional frame). Quanto predio de movimento so previstos trs diferentes tipos de quadros: Quadro I (Intra coded picture) - codificado sem referncia a outros quadros, proporcionam pontos de acesso onde a decodificao pode iniciar; compresso apenas moderada - similar a uma compresso JPEG.

Quadro P (Predictive coded picture) - utiliza codificao preditiva de compensao de movimento de um quadro I ou P; geralmente usado para outras predies; um tero do tamanho do quadro I.

Quadro B (Bidirectionally predictive coded picture) - codificado a partir da interpolao entre um quadro anterior (I ou P) e um quadro posterior I ou P; prov um alto grau de compresso da ordem de 2 a 5 vezes menor que um quadro P. A figura abaixo apresenta a configurao dos quadros (P,B e I) e o

conceito de predio de movimentos, tcnica que reduz muito a redundncia temporal, propiciando excelente compresso no contedo de um vdeo em formato digital.

Figura 4: Modelo MPEG de compensao de movimento. Fonte [3].

A predio compensada por movimento uma ferramenta para reduzir a redundncia temporal entre imagens. O conceito de compensao de movimento contm uma estimativa de movimento entre imagens de vdeo. O movimento descrito por um pequeno nmero de vetores de movimento que origina uma translao de um bloco de pixels entre as imagens. Os vetores de movimento e os erros de predio comprimidos so ento transmitidos.

Figura 5: Compensao de movimento. Fonte [4].

Num nvel de compresso mais elevado, o bloco baseado numa transformao DCT introduz alguns artifcios bloqueadores. Os mtodos mais recentes j no precisam desta subdiviso da imagem e permitem nveis de compresso mais profundos sem estes artifcios. A transformao wavelet, uma ferramenta poderosa para comprimir informao, representa imagens como ondas que podem ser descritas matematicamente em termos de frequncia, energia e tempo. A matemtica avanada subjacente transformao wavelet muito complexa. A compresso fractal ganhou algum interesse global, mas at agora no apresenta benefcios em relao aos mtodos baseados em DCT.

Transformada Discreta de Cossenos


Para concentrar a energia em poucos coeficientes, no caso dela variar lentamente no espao, pode-se usar uma transformada. O estgio de transformada discreta de cossenos aplicado tanto nos intraframes como nas imagens que representam os erros de predio calculados. A imagem ser dividida em pequenos blocos de 8x8 pixels para simplificar a complexidade da transformada, a partir da aplicado uma DCT (Discrete Cosine Transform) bidirecional. A transformada de cossenos bidirecional a composio das transformadas unidirecionais das linhas e das colunas respectivamente. Uma

frmula explicita para a transformada de cossenos bidimensional 8x8 pode ser escrita em termos dos valores dos pixels, f(i,j), e os coeficientes no domnio da freqncia, F(u,v).
7 7

F(u,v) =

1 C(u)C(v) 4

(2j+1)v f(i,j)cos( (2i+1)u ) cos( ), 16 16


i=0 j=0

onde 1/2 x = 0 C(x) = 1 x0 .

A transformada de cosenos inversa pode ser escrita como:


7 7

1 f(i,j) = 4

(2j+1)v ) cos( ). C(u)C(v)F(u,v)cos( (2i+1)u 16 16


u=0 v=0

Como a Transformada Discreta de Cossenos uma transformao unitria, o valor mximo de cada um dos 64 coeficientes da DCT limitado a um fator de oito vezes o valor original.

Quantizao
Para reduzir a amplitude e aumentar o nmero de coeficientes iguais a zero dos coeficientes da DCT usamos a quantizao. De acordo com a posio do coeficiente, usamos um degrau de tamanho diferente para quantizar os algoritmos MPEG. Os termos DC e AC so quantizados separadamente nos blocos dos intraframes. Esta quatizacao aparece nas seguintes equaes: C(0,0) = (F(0,0) 4) / 8

C(u,v) = ((A(u,v) QF)/ 2QF onde: A(u,v) = ((F(u,v) * 16) Q(u,v)/2) / Q(u,v)

Onde temos: C(u,v): coeficiente quantizado; F(u,v): coeficiente DCT; Q(u,v): tamanho do degrau; QF: parmetro de quantizao (usado para controle de taxa); O sinal depende de F(u,v). A quantizao inversa dada por: F(0,0) = 8 C(0,0)

F(u,v) = C(u,v) QF Q(u,v)/8 Para os blocos preditos e interpolados, o quantizador tem uma zona morta ao redor do zero e o mesmo para os coeficientes DC e AC. A(u,v) = ((F(u,v) * 16) Q(u,v)/2) / Q(u,v) Se QF impar: C(u,v) = A(u,v)/ 2QF e se QF par: C(u,v) = (A(u,v) 1)/ 2QF onde depende de A(u,v). A quantizao o estgio de perdas na codificao MPEG (o estgio de DCT tambm produz perdas, mas em escala muito menor).

Codificao
Dividimos a codificao em duas partes: Rearranjo da disposio dos valores a serem codificados;

Codificao propriamente dita. Os coeficientes DCT quantizados so rearranjados em um padro zig-

zag'' com as baixas freqncias seguidas das altas freqncias. Este padro usado para aumentar o nmero de coeficientes iguais a zero consecutivos em cada bloco. assumido que as baixas freqncias tendem a ter coeficientes maiores e as altas freqncias so, pela natureza da maioria das imagens, predominantemente zero. Como mostrado na Figura 5, os coeficientes AC so escaneados atravs de um zig-zag, da localizao (0,1) localizao (7,7).

Figura 6: O padro zig-zag para transformar o coeficientes DCT em um vetor unidimensional. Fonte [3]

Os coeficientes DC quantizados so codificados pelo nmero de bits significativos, seguido pelos prprios bits. Os coeficientes AC usualmente contm sries de zeros consecutivos. Usando tcnicas de codificao baseadas no nmero de zeros consecutivos entre dois coeficientes no-zero, podemos utilizar o Cdigo Huffman, por exemplo, que um cdigo de compresso baseado na entropia dos dados a serem codificados. Os dados so divididos em smbolos tabelados e so criados cdigos para cada smbolo, para fazer a compresso. Atravs do codificador so

criados pequenos cdigos para os smbolos que ocorrem com maior freqncia e cdigos maiores para aqueles que ocorrem ocasionalmente. Na verdade o codificador MPEG usa tabelas estticas como aquela mostrada no Cdigo Huffman. Na primeira coluna esto os smbolos em hexadecimal e na segunda o cdigo binrio usado para codific-los.

Resumo do Algoritmo
Podemos modular os algoritmos de codificao MPEG. O primeiro quadro da seqncia de vdeo (intraframe) codificado independente dos quadros passado ou futuro. aplicada a transformada discreta de cosenos a cada bloco 8x8 de luminncia e crominncia. Depois, cada um dos 64 coeficientes da DCT so quantizados e codificados de forma uniforme. Nesta etapa o coeficiente DC sofre um tratamento especial em relao aos componentes AC. O algoritmo segue como na figura a seguir:

Figura 7: Diagrama de blocos do codificador.

Fonte [3].

O algoritmo de decodificao simples. Primeiro feita a quantizao inversa, seguido da transformada inversa e da compensao com o uso do vetor de movimento e das imagens previamente reconstrudas. Claramente o codificador deve fazer a decodificao e por isso este mais sofisticado que o decodificador.

Padres
O grupo MPEG teve inicialmente trs itens de trabalho: codificao de vdeos e udios associados sobre 1.5, 10 e 40 Mbps. Estes grupos so abreviados por MPEG-1, MPEG-2 e MPEG-3: A inteno do MPEG-1 (normalizado em 1993) a codificao de vdeo com qualidade VHS: 360x280 pixels com 30 quadros por segundo na taxa de 1.5 Mbps (taxa dos drivers de CD-ROM da

poca). Quando se fala codificao MPEG MPEG-1 que se est referenciando. MPEG-2 (normalizado em 1994) visa codificao de vdeo com qualidade de televiso digital CCIR 601: 720x480 pixels com 30 quadros por segundo na taxa entre 2 a 10 Mbps. MPEG-3 visa codificao de vdeo com qualidade HDTV na taxa de 40 Mbps. Durante o processo de normalizao, viu-se a necessidade da definio de codificao audiovisual a taxas de bits muito baixas, assim o surgiu o MPEG-4 (a ser aprovado em dezembro de 1999). A taxa de bits considerada aqui varia de 4,8 a 64 Kbps. importante notar que os padres MPEG especificam somente a sintaxe, a semntica das seqncias de bits e o processo de decodificao. No entanto, no especificam o processo de codificao, ficando livre a proposta de novas tcnicas de codificao que visem melhorar o desempenho do sistema. As atividades do MPEG cobrem mais que a compresso de vdeo, desde que a compresso do udio associado e a sincronizao audiovisual no podem ser independentes da compresso do vdeo. Assim, a abrangncia dos padres MPEG fica da seguinte maneira: MPEG-1 - DVD, TV a cabo, broadcasting de udio digital, computer based multimedia; MPEG-2 - Tv digital e HDTV; MPEG 3 - foi abandonado, j que as funes planejadas foram includas no MPEG-2; MPEG-4 - padres para multimdia e comunicaes mveis; MPEG-7 - (Multimedia Content Description Interface) padres para descrio e busca de contedo de udio e imagem; MPEG-21 - The Multimedia Framework, define padres abertos para a distribuio e consumo de contedos multimdia.

Padro MPEG-1
O primeiro padro desenvolvido pelo grupo MPEG, apelidado MPEG-1, para codificao de imagens em movimento, foi projetado para comprimir fluxos (streams) de imagens, com resoluo de 352x288 (25 Hz) ou 352x240 (30 Hz), a uma taxa total de, aproximadamente, 1.5 Mbits/s de dados comprimidos, mesma taxa mxima de transferncia de um CD de udio comum. Isto faz com que MPEG-1 seja ideal para gravao de CDs com vdeo e udio, que podem ser transmitidos com a mesma taxa de dados. O algoritmo de compresso do MPEG-1 utiliza as seguintes tcnicas: Reduo da resoluo espacial e sub-amostragem de crominncia; Compensao de movimento - utiliza predio baseada no passado, ou baseada no passado e futuro; Erros de predio so transformados em DCT (Discrete Cosine Transformation), sendo removida a redundncia espacial; A DCT aplicada em blocos de 8 x 8 pixels; Os vetores de movimento so combinados com a informao residual DCT. MPEG-1 foi um padro muito inovador. Pela primeira vez um nico padro audiovisual foi produzido e todas as precaues foram tomadas para que as peas do padro se encaixassem. O sucesso causado pelo padro fez com que vrias empresas que, at ento, possuam departamentos de udio e vdeo independentes se reorganizassem. Alm disso, o padro foi o primeiro em outras coisas: Primeiro padro para processamento de sinais desenvolvido usando cdigo em de linguagem de programao em C; Primeiro cdigo de vdeo independente do formato do vdeo; Primeiro padro a incluir implementao em software.

MPEG-1 um padro que fornece uma apresentao normalizada, o que permite aos que desenvolvem realizar o tradicional paradigma dos sistemas de comunicao. Isto pode ser visto na Figura 8. A informao audiovisual pode ser gerada em tempo real de um acontecimento natural ou vir de um servidor. Nos dois casos, um fluxo de bits multiplexado chega ao

decodificador por meio de distribuio (uma rede de comunicao, um canal de transmisso, etc.). No caso de um disco local, a parte de distribuio do modelo desaparece, mas o restante continua vlido. Os fluxos de udio e vdeo codificados, forados a ter uma base de tempo comum e combinados em um mesmo fluxo pela camada de sistema do MPEG, so extrados e manipulados pelos decodificadores de udio e vdeo apropriados que produzem seqncias de amostras PCM representando informao de som e imagem.

Figura 8: Modelo de Referncia do Padro MPEG-1. Fonte [3].

O padro MPEG-1, formalmente conhecido como ISO/IEC 11172, dividido em 5 partes. As trs primeiras partes so Sistema, Vdeo e udio respectivamente. As outras duas partes so: Teste de Conformidade, que especifica a metodologia para verificao das exigncias de conformidade do padro pelos fabricantes de equipamentos, e Software Simulation, uma implementao na linguagem C do codificador e decodificador do padro MPEG-1. O padro MPEG-1 completamente flexvel quanto configurao dos quadros em um fluxo. Embora tenha sido mostrado que este padro operasse bem em imagens de alta resoluo e a maiores taxas de transmisso, um grande nmero de indstrias tinha o interesse no campo muito mais amplo da televiso digital e se sentiam muito desconfortveis com uma limitao bsica

do vdeo MPEG-1: a limitao das imagens progressivas. Um ganho, eventualmente estimado em cerca de 20%, era esperado se fosse explorado a correlao entre imagens entrelaadas. Esta foi a motivao principal para a criao do padro MPEG-2

MPEG1 udio
O MPEG1 providencia o esquema de compresso para fontes de udio estreo e mono com qualidade semelhante a CD udio. A parte do algoritmo correspondente ao udio dividida em trs camadas: 1. MPEG1 udio Camada 1, que oferece menor taxa de compresso, e usado em sistemas de udio de consumo. A sua vantagem menor custo de implementao; 2. MPEG1 udio Camada 2, que oferece maior taxa de compresso. encontrado em aplicaes profissionais ou em aplicaes de consumo mais sofisticado; e 3. MPEG1 udio Camada 3, que oferece maior taxa de compresso e encontrado em Rede Digital de Servios Integrados (RDSI).O seu custo maior e apresenta maior complexidade de codificao e decodificao. A idia principal que uma aplicao do MPEG1 viabiliza usar a camada que oferece o melhor compromisso entre a necessidade de computao e o desempenho de compresso. O udio pode ser codificado em qualquer uma das camadas. O MPEG1 udio destina-se a transformar sinais de udio amostrados a taxas de 32KHz, 44,1KHz ou 48KHz e codific-los para uma taxa de 32Kbps a 192Kbps.

Padro MPEG-2
A Figura 9 mostra o modelo de referncia para o padro MPEG-2. As funes do decodificador MPEG-2 so semelhantes ao do MPEG-1, mas um importante componente tecnolgico o suporte interao cliente-servidor por meios de um protocolo padro de comunicao.

Figura 9: Modelo de Referncia do Padro MPEG-2. Fonte [3].

MPEG-2 surgiu da necessidade de transmisso em redes com qualidade, o que requeria a definio de um padro para imagens maiores (full size) com resoluo de 704x480 a 29.97 Hz, e 704x576 a 25 Hz. O padro MPEG-2 usado pelos padres de broadcast para TV-Digital ATSC e DVB e tambm o padro utilizado pelo sistema de compresso de DVD. MPEG-2 utilizado por muitas aplicaes devido sua capacidade de transportar streams, inclusive para o transporte de dados MPEG-4 e MPEG-7. A taxa de transmisso de MPEG-2 pode variar de 4 Mbits/s a 300 Mbits/s.

Figura 10: Amostragem e digitalizao de vdeo. Fonte [2]

O primeiro passo do processo fazer a amostragem e a digitalizao dos sinais de vdeo. A digitalizao dos sinais Y, PB, PR de TV analgica

tradicional com formato 4:2:2 ocorreu para a taxa de bits de 270 Mbps. J a digitalizao dos sinais Y, PB, PR de HDTV com formato 22:11:11 pode levar a uma taxa de bits de 1.485Gbps. O processo convencionado de forma que, se houver um erro na transmisso do quadro N, por exemplo, o quadro N + 1 no poder ser formado corretamente. So enviados alguns quadros com informao completa dentro da seqncia de quadros, durante a transmisso, para minimizar esse problema, essa seqncia denominada Group of Pictures (GOP). A semelhana entre as imagens subseqentes a base da compensao de movimentos e permite a transmisso apenas das diferenas . O caminho de realimentao do codificador contm um decodificador funcional que ir subtrair exatamente o sinal que um codificador ter disposio para somar ao sinal recebido, para garantir que esse processo no gere perdas. Alm de introduzir o conceito de estimao de movimentos, o MPEG2 introduz um mtodo para regular a taxa de transmisso atravs do controle do processo de quantificao. Um buffer na sada do codificador permite uma taxa de transmisso. Para o Sistema de TV Digital constante, no caso do buffer se encontrar prximo de exceder sua capacidade de armazenamento, ele ordena que o processo de quantizao diminua a resoluo do vdeo, diminuindo assim o total de dados gerados. Com base nesse conceito fsico de que as altas freqncias podem ser eliminadas sem causar degradaes perceptveis na imagem, a idia do MPEG2 converter a amplitude espacial da imagem em freqncia espacial atravs da DCT (transformada discreta de cosseno).

MPEG2 udio
O MPEG2 udio foi desenvolvido com base no MPEG1, fazendo com que os benefcios deste proporcionassem maior qualidade e maior eficincia, propiciando um padro de qualidade para satisfazer os requisitos necessrios para as redes digitais.

Alm dos canais mono e estreo que o MPEG1 suporta, foi adicionado suporte para mltiplos canais. Assim, o MPEG2 tem a possibilidade de suportar at cinco canais de som (esquerdo, direito, centro e dois canais de surround e mais um canal de graves), ou, em extenso, sete canais mais um canal de graves. Isso possibilita ter em casa o som com o mesmo desempenho de algumas salas de cinema, permitindo a reproduo de som estereofnico mais realista. As figuras 11 e 12 mostram a estrutura de MPEG udio.

Figura 11: Codificador MPEG udio. Fonte [2].

Figura 12: Decodificador MPEG udio. Fonte [2].

O MPEG2 possui outras funes, como a caracterstica multilnge, que permite, por exemplo, que um filme possa ser ouvido em diferentes linguagens, de acordo com a escolha do telespectador. Existem duas formas para efetuar a compresso de udio: 1. Consiste em reduzir a freqncia de amostragem, e 2. Reduzir a resoluo da amostra para um valor inferior. No se pode fazer grandes alteraes na freqncia de amostragem para se obter uma boa qualidade, pois o ouvido humano escuta at 20kHz. Pelo teorema de Nyquist, necessrio ter uma taxa de amostragem equivalente a duas vezes a freqncia que se deseja transmitir, portanto, preciso ir at 44,1K amostras por segundo. Escolher um cdigo de 16 bits deve-se ao fato de obter boa relao sinal-rudo, de quantificao proveniente do processo de digitalizao do sinal. Para cada bit que se adiciona ao cdigo h uma melhoria de 6dB na relao sinal-rudo. Ao se utilizar cdigo de 8 bits por amostra, pode-se ainda perceber rudo de fundo nos momentos de silncio de msica. Mas, para esse nvel de codificao, se o nvel do som elevado, no se ouve nenhum rudo. Esse

efeito chamado de Efeito Mscara, e a chave para o mtodo de codificao utilizado pelo MPEG2. Com o sistema de CD udio consegue-se uma relao sinal-rudo de 90dB, o que est dentro da gama dinmica do ouvido humano, pois nesta faixa no se ouve nenhum rudo.

Modelo psicoacstico, efeito mscara e bandas crticas


O modelo psicoacstico baseia-se no efeito da sensibilidade do ouvido humano, que tem uma gama dinmica de 96dB em nveis de som, cuja freqncia varia de 20Hz a 20kHz. Entretanto, a sensibilidade maior na faixa de 1kHz a 3kHz, ou seja, no uniforme para toda gama de freqncia. Neste modelo, podemos observar a dimenso de banda crtica, a qual de 100Hz para baixas freqncias, que a largura de banda que causa o efeito mscara (efeito o qual o ouvido humano no percebe diferenas de freqncia menores que esta banda) MPEG2 udio Camada 1 O mapeamento tempo-freqncia constitudo por um banco de filtros polifsicos com 32 sub-bandas, os quais tm a caracterstica de combinar a baixa complexidade computacional com opes de implementao flexveis. Neste caso, o modelo psicoacstico utiliza a transformada de Fourier que determina as mscaras as quais produz um limiar de mascaramento que feito para cada sub banda e, combinando-se eles, tem-se o limiar global. Este, comparado com o sinal de cada sub banda, produz a relao sinal mscara (SMR). Este sinal entra no quantizador que examina as amostras e procura o valor mximo absoluto. Assim, estas amostras so linearmente quantizadas, simplificando o trabalho do empacotador. Cada trama comea com uma informao de cabealho que ser usada para sincronizao e contabilizao e um cdigo cclico (CRC), usado para deteco e correo de erros. Cada uma das 32 sub-bandas usa 4 bits para alocao de bits e 6 bits para fator de escala. Os bits restantes da trama so

usados para amostras da sub-banda, com uma cauda adicional para informao extra. MPEG2 udio Camada 2 O mapeamento tempo-freqncia igual ao da Camada 1. A diferena que a transformada rpida de fourier de 2.014 pontos em 32 sub bandas. No caso do quantificador, ele semelhante ao anterior, porm as tramas so trs vezes mais longas resultando em um fator de dois na reduo do dbito binrio para os fatores de escala. O empacotador da trama usa uma estrutura de cabealho e cdigo cclico (CRC) similar ao da Camada 1. O nmero de bits usados para descrever as alocaes de bits varia com a subbanda: 4 para as sub-bandas baixas 3 para as sub-bandas intermedirias 2 para as sub-bandas altas

Os fatores de escala (um, dois ou trs, dependendo dos dados) so codificados em conjunto com um cdigo de 2 bits que descreve qual combinao de fatores de escala se trata. As amostras da sub-banda so quantificadas de acordo com a relao de bits, sendo ento combinadas em grupos de trs denominados grnulos. Cada grnulo codificado com uma palavra de cdigo. Isso permite que a Camada 2 capture muito mais redundncia do sinal que a Camada 1.

Padro MPEG-4
O MPEG-4 um padro criado para suprir as necessidades da internet, pois tramite vdeo com uma qualidade superior, comparada ao MPEG-1, com uma taxa de bits muito menor. Para formar quadro de vdeo, o MPEG-4 suporta uma variedade de elementos transmitidos separadamente e combinados. Ou seja, o MPEG-4 permite a manipulao de objetos dentro do fluxo do vdeo. Inicialmente, a finalidade do MPEG-4 era a codificao de vdeo e udio em baixas taxas, sendo o padro otimizado em trs taxas:

Abaixo de 64 Kbits/s; De 64 a 384 Kbits/s; 384 Kbits/s a 4 Mbits/s.

O MPEG-4 mostrou-se ideal para utilizao em dispositivos mveis devido s baixas taxas, no entanto, taxas de at 38.4 Mbits/s so utilizadas com este padro. O que difere o sistema MPEG-4 do MPEG-2 o conceito dos seus sistemas de transmisso. Isso propicia que o envio de partes diferentes de uma cena, como vdeo e udio, por exemplo, sejam enviados separadamente e reagrupados por um decodificador. Assim, cada objeto pode ser codificado da melhor maneira possvel. A Figura 13 mostra uma generalizao do sistema para codificao de objetos.

Figura 13: Generalizao do sistema de codificao de objetos do MPEG-4. Fonte [5].

Esta diviso em objetos faz com que MPEG-4 seja bastante til para projetistas de jogos. Futuras extenses de MPEG-4 podem prover nveis de qualidade para cinema digital.

Padro MPEG-7
O MPEG-7 um padro para descrio de objetos multimdia. Ele no relacionado compresso de vdeo, uma maneira de descrever elementos em um fluxo multimdia de modo que possa ser acessado via banco de dados.

O problema da definio de MPEG-7 vem da dificuldade de se catalogar e indexar dados e informaes (Informao armazenada til somente se sua existncia conhecida, e se ela pode ser recuperada em tempo hbil quando necessrio), principalmente no contexto do mundo atual, em que informao gerada a todo instante. Com MPEG-7 podem-se descrever praticamente tudo devido a sua estrutura de descritores e esquema de descritores.

Padro MPEG-21
A grande quantidade de informao aliada aos mtodos de indexao e consulta do MPEG-7 demandam sistemas que controlem o acesso, privacidade e transaes comerciais que envolvam essas informaes. Com este pensamento em mente, surgiu a idia do MPEG-21. MPEG-21 ainda no est completamente especificado, porm est baseado nas seguintes premissas, como descreve sua verso preliminar: Deve-se fornecer um esquema aberto e extensvel capaz de descrever qualquer tipo de mdia (vdeo, udio, texto, etc.); MPEG-21 deve codificar os contedos das informaes e prover mecanismos para sincronizar todos os elementos destes contedos; Promoo de um ambiente para identificao e descrio de itens digitais (promovendo uma ligao entre todos os elementos); Definio de interfaces e protocolos para o armazenamento e gerenciamento dos itens digitais a fim de promover mecanismos para catalogar e arquivar o contedo de forma a preservar os direitos autorais; Preocupao com o gerenciamento e proteo da propriedade intelectual; Transmisso de itens por meio de vrios tipos de redes e apresentao do contedo em uma grande quantidade de terminais; Mtricas e interfaces para execuo de todos os eventos que devam retornar algo.

Concluso
Com a crescente demanda do mercado de armazenar e processar vdeos, udio e combinao destes, ficou evidente a necessidade de padronizao desta compresso/descompresso, por isso foi criado o grupo MPEG. A primeira verso (MPEG-1) foi um padro muito inovador e atendeu s necessidades de compresso, a uma taxa de 1,5Mb/s, com resoluo de 352x288 ou 352 x 240, porm teve limitaes em imagens progressivas, ou seja, no pode ser usado em aplicaes de vdeo entrelaado, como em transmisso de televiso, era necessrio a criao de um novo padro. Assim surgiu o MPEG-2, cujas funes so semelhantes ao do MPEG-1, porm com um suporte interao cliente-servidor, com definio de um padro para imagens maiores. O padro MPEG-4 foi desenvolvido com o objetivo de aplicaes baseadas na comunicao multimdia, um padro que melhor se adapta a Internet, pois tem qualidade superior ao MPEG-1, porm com taxa de bits muito menor, e permite a manipulao de objetos dentro do fluxo do vdeo. Em relao ao MPEG-2, o MPEG-4 tem o diferencial de propiciar o envio de partes diferentes de uma cena, ou seja, utiliza o conceito de objetos em seu sistema de transmisso. J o MPEG-7, que no exatamente um formato de codificao de vdeo, uma maneira de descrever elementos em um fluxo multimdia de modo que possa ser acessado via banco de dados. D esta forma, este padro descreve como os recursos de mdia devem ser representados. O MPEG-21 um padro que define uma infraestrutura para distribuio e consumo de dados multimdia. A criao de todos estes padres contribuiu para a consolidao do vdeo digital, porm pode-se perceber que ainda h muito a ser feito nessa rea, cuja evoluo constante.

Referncias
[1] http://www.videam.com.br/pt-br/tecnologia/tecnologia.html, em 10/10/2007 [2] http://www.mackenzie.br/editoramackenzie/revistas/engenharia/06_eng_ comp_processo_compress.pdf, acessado em 10/10/2007 [3] http://homepages.dcc.ufmg.br/~gpereira/mpeg/mpeg.html, acessado em 15/10/2007 [4] http://www.img.lx.it.pt/~fp/cav/ano2005_2006/Trabalho_2/3compressaod evideodigital.htm, acessado em 09/11/2007 [5] http://www.cin.ufpe.br/~tg/2004-2/els2.pdf, acessado em 10/10/2007 [6] http://www.am.hhi.de/mpeg-video/papers/sikora/mpeg1_2/mpeg1_2.htm, 1997, acessado em 22/10/2007 [7] MPEG Moving Picture Experts Group.'' http://www.mpeg.org, acessado em acessado em 06/11/2007 [8] http://www.apple.com/br/quicktime/technologies/mpeg4, 10/10/2007 [9] http://penta3.ufrgs.br/videoconferencia/manual/mpeg.htm, acessado em 21/10/2007 [10] [11] [12] [13] [14] [15] [16] http://pt.wikipedia.org/wiki/MPEG, acessado em 10/10/2007 http://www.gta.ufrj.br/grad/anteriores98/mpeg-anapaula/mpeg.htm, http://www.scribd.com/doc/454950/redes-de-computadores-4http://www.lsi.usp.br/~rcluiz/MPEG2_SVR2004.pdf, acessado em http://www.manlec.com.br/DICAS/materias_especiais_mpeg.php, http://www.infonet.com.br/users/jfonseca/SEMPERDAS.HTM, http://www.larc.usp.br/~cbmargi/pdf/ssi2000-cbm.pdf, acessado acessado

acessado em 18/10/2007 edicao-tanembaum, acessado em 10/10/2007 09/11/2007 acessado em 10/10/2007 acessado em 09/11/2007 em 10/10/2007

Você também pode gostar