Você está na página 1de 9

Artigo: MPEG-4

MPEG (pronuncia-se M-PEG), que significa Moving Picture Experts Group, é o nome
de uma família de padrões utilizados para a codificação de áudio-visual de informação,
por exemplo, filmes, vídeo, música em um formato digital comprimido.

Desde 1993 varias empresas, que desenvolvem tecnologia na área da multimídia,


buscavam trazer o cinema para a Internet, ou seja, permitir que os usuários adquirissem
os filmes ou programas de televisão através da comunicação via rádio freqüência.
Porém, esta nova tecnologia deveria superar a qualidade de imagem do DVD (MPEG-
2) e ao mesmo tempo algo que ainda valesse para as conexões ADSL e de modems
discados. Em 1998 o Motion Picture Experts Group finalizou o projeto desta nova
tecnologia, sendo chamada de MPEG-4 que grava dados em ótima resolução e o
principal faz transmissão pela rede, à internet. Por isso é utilizada para transmissão de
vídeo na internet, conversa estilo videofone, televisão e distribuição de CD. MPEG-4 é
usado em muitos setores da sociedade, e há várias partes do projecto que não são
amplamente divulgados levando a problemas com MPEG-4 de compatibilidade com
vários sistemas. O MPEG-4, também, suporta objetos 3D, sprites, texto e outros tipos de
mídia por isso, ele tornou um padrão internacional para comprimir vídeo digital e dados
de áudio em 2000.

Bom, de acordo com a transmissão dos dados na internet sabe-se que quanto melhor a
imagem, a qualidade maior será o tamanho do arquivo e por isso a transferência torna-se
mais lenta. Porém, este dilema teve fim quando os engenheiros da MPEG compactaram
os frames da imagem, e, também, as informações de como eles se sucedem. As
informações de som e vídeo transmitidas nesta arquitetura são separadas do conteúdo,
fragmentados, na hora da transmissão, ou seja, garante que se houver uma queda na
velocidade da transmissão, a qualidade das imagens não caem de repente. De acordo
com Pércio dos Santos, da produtora de vídeo DVD CareWare, o formato foi concebido
para trafegar a baixas taxas de transferência como 100Kbps e em 1Mbps.

Vale ressaltar, que existem tecnologias para cada tipo de mídia. Por isso diz-se que o
MPEG-1 é dedicado para produtos como Vídeo CD, o MPEG-2 para DVD e TV digital,
o MPEG-3 para MP3 e o MPEG-4 é realmente utilizado para transmissões de alta
qualidade na Internet.

A explicação técnica para existir diversas tecnologias para cada tipo de mídia é que o
MPEG-1 fica numa resolução de 320x240 pixels e o MPEG-4 consegue reproduzir uma
imagem em 4096x4096 sem problemas. E o melhor, toda essa qualidade pode ser
transmitida até mesmo em conexões de 5Kbps.

Na Web, arquivos de vídeo MPEG têm a extensão. MPG e MPEG Audio arquivos
geralmente têm a extensão. Mp2 ou. Mp3. A fim de reproduzir arquivos de vídeo
MPEG ou MPEG Áudio, você deve instalar um player de vídeo MPEG e um MPEG
Audio Player em seu sistema. A extensão Mp4 refere-se especificamente a MPEG-4
Part 14. Um padrão de container de áudio e vídeo que é parte da especificação MPEG-
4. A extensão oficial do nome do arquivo é .mp4, por isso é comum vermos o formato
ser chamado assim.
A principal vantagem do MPEG, em comparação com outro vídeo e formatos de
codificação de áudio é que os arquivos MPEG são muito menores para a mesma
qualidade. Isso acontece porque a compressão MPEG utiliza técnicas muito
sofisticadas.Este possui suporte a legendas embutidas e Melhor suporte ao padrão de
codificação de vídeo H.264, também conhecido como MPEG4 AVC.

A desvantagem é ser uma tecnologia proprietária, isto é,já incorpora as primeiras


ferramentas de direitos autorais. Por isso, deve-se possuir a licença para utilizar o
arquivo com esta extensão. Isso significa que qualquer pessoa que utilizar um vídeo
desta extensão terá que pagar obrigatoriamente para o autor uma determinada quantia.
Para reproduzir ou codificar arquivos em MPEG-4 deve primeiro comprar uma licença
do Licenciamento MPEG Autoridade. Neste momento, existem muitas empresas que
licenciaram a tecnologia, pode–se citar a Canon, General Electric, Mitsubishi,
Microsoft, Samsung, Sony , Toshiba e entre outras.

Vale ressaltar, que a maioria dos problemas comuns associados com o MPEG-4-
surgiram como resultado de divergências na parte 2 e parte 10. MPEG-4 Parte 2,
também conhecido como SP / ASP, é utilizado por vários vídeo e codecs de áudio,
como DivX, QuickTime 6, e Xvid. MPEG-4 Parte 10, também conhecido como
AVC/H.264 é usado por codecs de áudio e vídeo como o QuickTime 7, HD DVD e Blu-
ray Disc.

Apesar do MPEG-4 ser considerado o principal meio para transmitir vídeo e som pela
Internet, porém existe outras tecnologias concorrentes como o DivX. A tecnologia
desenvolvida sobre o MPEG-4 reduz em 10% o MPEG-2, utilizada em DVDs, e
mantém a qualidade de som nos moldes do VHS. O DivX também tem a vantagem de
ser transformado em VCD. Este formato esta mais para filmes e trabalhos em CD. Já a
Real deseja a substituição do MPEG-4 pois este formato é ainda muito confuso para as
companhias. O Advanced Streaming Format (ASF) é a extensão mais utilizada por
provedores de internet pois, ele é excelente para colocar proteçãod e direito autoral e
criptografia nos arquivos. Porém, o MPEG-4 ocupa um espaço bem definido entre as
outras extensões do mercado porque é ocupa um espaço bem definido entre as outras
extensões do mercado.
Referencias:

http://informatica.terra.com.br/interna/0,,OI90143-EI553,00.html
http://pt.wikipedia.org/wiki/Mp4
http://www.apple.com/br/quicktime/technologies/mpeg4/
http://freakall.wordpress.com/2009/08/26/saiba-o-que-e-o-formato-mp4/
http://br.answers.yahoo.com/question/index?qid=20080707114328AA8x0us
http://www.tech-faq.com/mpeg-4.shtml
http://www.mpeg.org/
http://www.chiariglione.org/leonardo/publications/isce96/mpeg-4_scene.gif
Artigo AAC:

O Advanced Audio Coding (AAC), também conhecido como MPEG-2 Part 7 ou


MPEG-4 Part 3, é um formato de áudio, que recorre a compressão com perda de
dados, ou seja, quando a informação obtida após a descompressão é diferente da
original, mas esta diferença não afeta profundamente o arquivo pois, o áudio parece
igual ao original. Foi popularizado pela Apple Computer de seus produtos iPod e iTunes
Music Store. O AAC foi desenvolvido pelo grupo MPEG que inclui Dolby, Fraunhofer
(FhG), AT&T, Sony e Nokia — empresas que também se envolveram na programação
de codificadores de áudio, como MP3 e AC3.

O AAC foi adotado como padrão para grandes organizações, incluindo o ISO MPEG
MPEG-4, 3GPP e 3GPP2, DVB, assim como rádio por satélite XM. Pois, possui uma
ótima qualidade em amplas taxas de transmissão de dados.

O AAC foi projetado como um codec de desempenho melhor em relação ao MP3, sendo
promovido como seu sucessor para codificação de áudio em taxas de bits médias a altas.
Comparados lado a lado, o AAC prova ser a escolha certa para substituir o MP3 como
novo padrão de áudio da Internet. O AAC possui vantagens do sobre o MP3: como por
exemplo, compressão que oferece de alta qualidade em arquivos pequenos, suporte a
múltiplos canais de áudio, oferecendo até 48 canais de freqüência, áudio de alta
resolução, rendendo amostras de taxas de até 96 kHz, eficiência de decodificação
aprimorada, exigindo menor poder de processamento para decodificação.

Vale ressaltar, que o padrão AC3 está sendo substituída com áudio AAC, embora AC3
continuará a viver por muitas décadas, devido ao grande número de sistemas e redes que
atualmente utilizá-lo. AC3 é Audio Coding 3. Este formato de áudio é utilizado pelo
ATSC e II DigiCipher. Lembrando que o ATSC (Advanced Television Systems
Committee) é um grupo que define as normas para a transmissão de televisão digital nos
Estados Unidos e em muitos outros países e incluem as normas para televisão de alta
definição (HDTV), e as normas para TV de definição padrão (SDTV), transmissão de
dados, multi-canal de áudio surround, e via satélite direto para a radiodifusão em casa.
Além dos Estados Unidos, o ATSC é usado também no Canadá, Coreia do Sul,
Argentina e México. Já o DigiCipher II (DCII) é um sistema de distribuição de
propriedade da Motorola de vídeo digital e fornece a compressão, criptografia e
autorização.

Referências:

http://pt.wikipedia.org/wiki/Advanced_Audio_Coding
http://teteraconsultoria.com.br/blog/o-que-e-o-formato-ac3-de-audio/
http://www.tech-faq.com/ac3.shtml
http://www.apple.com/br/quicktime/technologies/aac/
Artigo: JPEG

JPEG é um método comumente usado para comprimir imagens fotográficas. O grau de


redução pode ser ajustada, o que permite a você escolher o tamanho de armazenamento
e de compromisso entre a qualidade da imagem. Geralmente se obtém uma compressão
com pouco perceptível perda na qualidade da imagem. Ele foi desenvolvido por Eric
Hamilton, engenheiro da C-Cube Microsystems, este formato suporte trabalhar com
esquema de cores de até 24 bits, ou seja, 16,8 milhões de cores.
O JPEG aceita diferentes níveis de compressão, quanto maior a compressão menor a
fidelidade com a imagem original, ou seja, perde-se em qualidade, porém o arquivo
resultante é substancialmente menor. Os arquivos em JPEG aceitam as extensões
.jpeg , .jfif , .jpe e .jpg, para internet é normalmente utilizada a extensão .jpg.
O algoritmo de compactação JPEG funciona melhor em fotografias e pinturas de cenas
realistas com variações suaves de tom e cor. Para uso na web, onde a largura de banda
utilizada por uma imagem é importante, JPEG é muito popular. JPEG / Exif também é o
formato mais comum gravado por câmeras digitais.

Porém, existe desvantagens no JPEG, por exemplo a imagem normalmente perde


qualidade a cada vez que o arquivo é salvo para evitar isto, uma imagem que vai ser
alterada no futuro pode ser salva em um formato sem perdas como o PNG, e uma cópia
exportada como JPEG para distribuição. O JPEG, também, não é tão adequado para
desenhos e gráficos textuais ou icônicos, onde o forte contraste entre os pixels
adjacentes causam alterações perceptíveis na imagem, fazendo com que esta perca
qualidade gráfica. Enfim onde a exata reprodução seja necessária este formato não
poderá ser utilizado para isso deve-se utilizar o formatos sem perda ("loseless") como
PNG.

O método de compressão com perdas, utiliza um algoritmo baseado na DCT e o método


de compressão sem perdas, se baseia em métodos preditivos. Existem no total 44
variações do método de compressão JPEG, sendo que algumas destas são utilizadas em
aplicações especificas tais como aplicações médicas, imagens astronômicas entre outras.
Devido a esta quantidade de variações dificilmente será encontrado um software que
processe todas. Podemos dividir todas estas variações do método de compressão JPEG
em quatro grandes grupos, como:

• Baseline / Sequencial Encoding: os componentes da imagem são compactados de


forma seqüencial da esquerda para a direita e de cima para baixo.

• Progressive Encoding: a imagem é compactada em um processo de múltiplas linhas


de varredura. Esta forma é geralmente utilizada em arquivos que são transmitidos pela
Internet, pois possibilita a visualização da imagem inteira, em menor resolução,
enquanto o restante da imagem esta sendo enviada.

• Lossless: neste método não ocorre perda na qualidade da imagem. Existem duas
variações: o original e o novo método JPEG-LS.

• Hierarchical Encoding: outro formato utilizado na Internet. Neste formato a imagem


é comprimida em múltiplas resoluções, sendo que a de menor resolução (menor
tamanho) é codificada e transmitida primeiro e na seqüência são compactadas e
transmitidas as de melhores resoluções (as de maiores tamanhos) em ordem crescente de
tamanho, e por fim é enviada a imagem completa em seu tamanho original. Os
elementos de imagem das resoluções já recebidas são utilizados na próxima resolução,
diminuindo desta forma o tamanho do arquivo.

Algoritmo de compreensão:

A imagem é dividida em 8 blocos de pixel

Como cada bloco é processado sem referência aos


outros, vamos nos concentrar em um único bloco. Em
particular, vamos nos concentrar no bloco de destaque
abaixo.

Aqui é o mesmo bloco expandido de forma que os pixels individuais são mais
evidentes.
Estes pixels são enviados para um conversor analógico / digital, e quantizados, ou seja,
os valores dos componentes fundamentais RGB, que teoricamente poderiam variar de
zero ao infinito, são convertidos para poucos valores inteiros, próximos de 256, o que
possibilita guardar a representação de cada componente em apenas oito bits.

Numa segunda etapa estes componentes “RGB” são convertidos para componentes de
luminância (“Y”) e crominância (“U” e ”V”). A luminância é uma escala de
representação numérica do cinza, enquanto a crominância são duas escalas numéricas,
que juntas representam as cores. As matrizes de conversão entre os componentes
“RGB” e os componentes “YUV” para o sistema PAL (Phase Alternate Line sistema de
TV a cores utilizado na Europa, Brasil e Argentina) são:

Quando aplicamos a transformação em cada pixel dos blocos tem-se imagem a abaixo:

Obtemos três novos blocos, um correspondente a cada


componente. Estes são mostrados a seguir, Os pixels brilhantes
correspondem a valores maiores.

Y Cb
Cr

O algoritmo de compressão JPEG divide a matriz de luminância e as duas matrizes de


crominância, que são as três matrizes que descrevem a imagem, em inúmeras matrizes,
cada uma com o tamanho de 8 x 8 elementos. Com isto teremos varias matrizes
compostas de 64 elementos. Sobre estas matrizes é aplicado o algoritmo DCT
(Transformada Discreta de Coseno), gerando outras matrizes, denominadas cuja maioria
dos elementos tem valor igual a zero. Este algoritmo converte uma matriz numérica em
outra, sendo que, a maior parte dos elementos desta nova matriz, especificamente os do
canto inferior direito, tem valor igual a zero. O valor médio da matriz, que representa a
cor fundamental dos 64 pixels, é chamado de componente DC e está localizado no canto
superior esquerdo da matriz de Coeficientes de DCT. Os outros coeficientes são
denominados coeficientes AC e representam os
valores das pequenas variações de tonalidade e
coloração do bloco.

A maioria destes coeficientes tem valores próximos de zero. A compactação virá a partir
da aplicação do processo denominado Quantização. Neste processo de compressão os
elementos menos importantes da matriz de coeficientes DCT serão descartados. A
matriz de coeficientes DCT é dividida por outra matriz que transforma todos os
elementos em uma nova matriz.

Esta matriz de valores quantizados é lida em zig zag da esquerda para direita e de cima
para baixo, fazendo com que os primeiros elementos lidos sejam valores não zerados.
Ignora-se a leitura a partir do momento em que se encontram elementos com valores
zerados.

Após a leitura em zig zag os coeficientes serão rearrumados para possibilitar uma nova
compressão chamada de codificação de entropia. Esta codificação pode utilizar os
algoritmos de Huffman ou a codificação aritmética. Esta compressão baseia-se em
características estatísticas, ou seja, as informações que são estatisticamente mais
comuns de ocorrerem são codificadas com código de tamanho menor, resultando em
menores taxas de transmissão.

Original:
Vale ressaltar que, o algoritmo de compressão JPEG tem sido bem sucedido, porém
vários fatores criaram a necessidade de um novo algoritmo.Primeiro, o algoritmo JPEG
do DCT leva a descontinuidades nas fronteiras do 8 por 8 blocos. Por exemplo, a cor de
um pixel na borda de um bloco pode ser influenciado por outro pixel em qualquer parte
do bloco, mas não por um pixel adjacente em outro bloco. Mas, isso pode ocorrer nesse
tipo de compressão. Logo, para figuras com precisão na borda este tipod e compressão
não se aplica corretamente.

Referências:

http://info.abril.com.br/forum/viewtopic.php?f=223&t=2518
http://pt.wikipedia.org/wiki/JPEG
http://en.wikipedia.org/wiki/JPEG
http://www.ams.org/featurecolumn/archive/image-compression.html

Você também pode gostar