Você está na página 1de 9

APOSTILA TÉCNICA DE PÓS-PRODUÇÃO AUDIVISUAL

(CURSO DE CINEMA – UFRB – PROF. ADRIANO OLIVEIRA)

SUMÁRIO

COMPAC TAÇÃO DE ARQUIVOS

. Fundamentos

 

..

Digitalização

..

CODEC

..

Formatos de arquivo multimídia

..

Taxa de Bits (bitrate)

..

Compactação

ESPACIAL

..

Compactação

TEMPORAL (GOP)

..

Profundidade de bits (bitdepth)

..

Amostragem (sampling)

..

Sub-amostragem dos canais de cor (chroma subsampling)

APOSTILA TÉCNICA DE PÓS - PRODUÇÃO AUDIVISUAL (CINEMA – UFRB – PROF. ADRIANO OLIVEIRA)

3

 Compactação de arquivos

.

FUNDAMENTOS

Todo e qualquer profissional do audiovisual está frequentemente acessando e produzindo arquivos compactados e portanto precisa dispor de conhecimentos técnicos mínimos que lhe permitam o melhor aproveitamento das possibilidades disponibilizadas pela tecnologia, que infelizmente muda mais rápido do que normalmente conseguimos acompanhar.

COMPACTAÇÃO em informática equivale a aplicação de um conjunto de estratégias com o objetivo de reduzir ao máximo o tamanho final dos arquivos, tendo como horizonte a manutenção de uma qualidade compatível com o uso proposto (registro, edição/manipulação, armazenamento, distribuição final).

Em sua base, a compactação digital implica procedimentos matemáticos extremamente complexos, acessíveis apenas a profissionais altamente especializados. Todavia, tais procedimentos estão relacionados a conceitos gerais e funções com as quais os usuários com conhecimentos restritos podem interagir com um mínimo de esforço.

Os tópicos seguintes apresentam alguns dos conceitos fundamentais sobre digitalização e compactação de material audiovisuais, sem os quais os profissionais da área tornam-se escravos dos seus sowares.

..

Digitalização

O mundo real onde vimemos é um espaço ANALÓGICO cujos sinais físicos perceptíveis pelos seres vivos (luz, sons, cheiros etc.) apresentam intensidades que variam sem descontinuidade. O DIGITAL é uma abstração matemática construída pelo homem através da qual toda e qualquer informação do mundo real pode ser convertida em sequências de sinais binários discretos, popularmente anotadas como uns e zeros — equivalentes a ligado e desligado, no mundo da eletrônica.

DIGITALIZAÇÃO é a transformação de um sinal analógico do mundo físico em informações digitais com fins de armazenamento e transporte. É um processo que necessariamente implica a presença de um código, sem o qual sequências como 0101110101010 não significam absolutamente nada.

APOSTILA TÉCNICA DE PÓS - PRODUÇÃO AUDIVISUAL (CINEMA – UFRB – PROF. ADRIANO OLIVEIRA)

4

A rigor, toda informação digital só pode ser armazenada e transmitida através de meios

analógicos, como ondas eletromagnéticas, sinais visuais etc.: um DVD é um meio físico repleto de inscrições em forma de ranhuras que “representam” os sinais 0 e 1; o sinal de digital de TV é transportado por ondas eletromagnéticas tal qual o sinal analógico.

Por ser uma criatura do mundo físico, o ser humano é incapaz de se relacionar diretamente com informações digitalizadas. A leitura desses dados implica necessariamente em decodificação, ou seja, a transformação da informação digital em uma “nova” fonte analógica que está tão próxima do sinal original quanto mais rico tiver sido o processo de digitalização.

A digitalização implica sempre em algum grau de perda em relação ao original analógico.

Contudo, como a informação digital pode ser copiada e reproduzida indefinidamente sem alteração, ela se torna mais estável e confiável que os registros analógicos, em cuja replicação

introduz-se ruídos que vão degradando cada cópia.

Como as codificações digitais preveem redundâncias de informação, mesmo quando há incidência de certo grau de ruído nas transmissões digitais, os dados podem ser recuperados sem perda significativa. Por isso, o sinal de um transmissão digital de TV não apresenta ruído aparente, mas quando blocos de sinal se perdem (em caso de chuva, por exemplo) o vídeo pode travar (a TV mantém o último quadro íntegro decodificado) ou ficar quadriculado.

A qualidade da digitalização e portanto a fidedignidade ao sinal analógico original dependem de

parâmetros como CODEC, amostragem, profundidade de bits e taxa de bits.

..

CODEC

Todo arquivo digital é em sua base uma longuíssima sequência de zeros e uns. Tal informação (descontínua, discreta) é uma versão matemática de um sinal analógico (natural e contínuo), como o som ou a luz. A digitalização torna o transporte e armazenamento de informações muito eficiente, mas precisa ser “revertida” para que o consumidor possa percebê-la como significativa, pois os sentidos humanos são analógicos.

CODEC é o nome que damos a um conjunto de algoritmos matemáticos responsáveis pela produção (escrita) e reprodução (leitura) de tipos específicos de arquivos digitais, implicando em (a) procedimentos de COdificação a serem empregados na fase de digitalização de um sinal analógico ou recodificação de informações previamente digitalizadas e (b) procedimentos de DECdificação a serem empregados na fase de leitura da informação digital.

Tanto para compactar quanto para reproduzir um arquivo multimídia é preciso dispor de CODECs. Eles podem estar instalados apenas dentro de certos programas (como o VLC) ou disponíveis através do sistema operacional para vários programas ao mesmo tempo. Sowares que usam CODECs para codificar/comprimir arquivos multimídia são nomeados de encoders.

APOSTILA TÉCNICA DE PÓS - PRODUÇÃO AUDIVISUAL (CINEMA – UFRB – PROF. ADRIANO OLIVEIRA)

5

Sowares que usam CODECs para ler arquivos multimídia são chamados de players. Certos sowares, encoders ou players, serão mais eficientes que outros no processamento multimídia, mesmo quando empregam um mesmo CODEC.

A qualidade de um CODEC depende inteiramente de sua aplicação. Por exemplo, o H.264

(vídeo) e o AAC (áudio) são excelentes para distribuição de arquivos audiovisuais para consumidores finais e são o padrão na maioria dos dispositivos hoje, de TVs a celulares. Entretanto, por focarem na qualidade para o consumidor final e descartarem uma enormidade de informações, esses CODECs não são adequados para manipulação avançada em edição e pós- produção. ProRes (vídeo) e PCM (áudio) seriam por sua vez ideias para trabalho profissional, mas excessivamente pesados para o consumidor final.

É importante não confundir CODEC (DIVX, H.264, PCM, AAC, MPEG-2) com formatos de

arquivo multimídia (AVI, WMV, MOV, MP4, MP3, VOB). Frases como “mande o material em arquivos MOV” são causas constantes de erros: o mais correto seria “mande o material em arquivos MOV, nos CODEC H.264 e AAC”.

..

Formatos de arquivo multimídia

Formatos de arquivo multimídia como MP4 ou VOB são “pacotes” que armazenam e relacionam fluxos de dados digitais (streams) codificados em CODECs específicos. Aquilo que normalmente identificamos como sento um arquivo de vídeo é na verdade um pacote que combina um fluxo de dados de imagens em sequência com um fluxo de dados de áudio. Os formatos de arquivo apresentam informações (metadados) em cabeçalhos (headers), tais como como listas dos fluxos de dados neles contidos e seus respectivos CODECs, além de informações que permitem a sincronização desses dados para reprodução 1 .

A

maioria dos formatos corresponde a um arquivo único que integra como um contêiner todos

os

fluxos de dados e as informações descritivas dentro de si, como o AVI e o MOV. Mas há

formatos como o DCP (destinado a exibição em cinemas digitais) nos quais o contêiner não é

um arquivo, mas uma pasta repleta de arquivos soltos.

Por padrão, os formatos estão relacionados a certos tipos de fluxo de dados multimídia e a determinados CODECs. O formato AVI, por exemplo, é bastante limitado e considerado ultrapassado (não permitem legendas embutidas), enquanto formatos como o MP4 e o MKV são mais atuais e versáteis. O MOV (Quicktime) é também bastante flexível (o MP4 deriva de sua

1 Programas gratuitos como o Mediainfo (http://mediaarea.net/pt-BR/MediaInfo) permitem a leitura dos cabeçalhos de arquivos multimídia e são essenciais para a identificação de infoemações técnicas relevantes sobre os mesmos.

APOSTILA TÉCNICA DE PÓS - PRODUÇÃO AUDIVISUAL (CINEMA – UFRB – PROF. ADRIANO OLIVEIRA)

6

estrutura e por isso pode ser renomeado pra MOV), mas é dependente de soware da Apple, que

tem versão intencionalmente mal implementada pra PCs com Windows.

Tabela 1: Formatos e CODECs comuns, segundo determinadas aplicações

   

PRINCIPAIS CODECs

FLUXOS DE DADOS PEMITIDOS

 

APLICAÇÃO

FORMATO

RELACIONADOS

OBSERVAÇÃO

     

Vídeo(s), áudio(s),

Deriva do MOV, mas não está restrito a dispositivos e/ou software Apple

MP4

H.264, AAC

legenda(s), capítulos

Distribuição para o consumidor final

MOV

H.264, AAC

Vídeo(s), áudio(s),

Restrito a dispositivos e/ou software Apple

legenda(s), capítulos

   

H.264, XVID, WebM, AAC,

Vídeo(s), áudio(s),

Formato livre cada vez mais popular

MKV

MP3

legenda(s), capítulos

 

MOV

ProRes, PCM

Vídeo e áudio

Formato ideal para sistemas MAC, é compatível com PC, mas apresenta desempenho ligeiramente menor.

MXF

DNxHD, PCM

Vídeo e áudio

Formato sem restrições usado pela AVID e ADOBE

Edição

WAV

PCM

Áudio, meta-dados

Contêiner PCM típico do sistema Windows, mas compatível com outros

AIFF

PCM

Áudio, meta-dados

Contêiner PCM típico do sistema Apple, mas compatível com outros

..

Taxa de Bits (bitrate)

O tamanho total de um arquivo multimídia é importante para o transporte de dados, mas o fator

que realmente afeta o desempenho na hora de sua execução é a sua taxa de bits (bitrate). Quanto

maior a taxa de bits de um arquivo, maior a demanda de processamento: CPU, GPU, memória,

velocidade de transmissão de dados etc. Quando a taxa de dados de um arquivo ultrapassa o

limite máximo de qualquer entidade de processamento, ele tende a travar durante a execução.

A taxa de bits indica a quantidade de dados digitais processados por unidade de tempo, sendo

geralmente expressa em bits por segundo (bps). Ela pode ser inferida dividindo-se o tamanho

total de uma arquivo multimídia pela sua duração.

Exemplo:

Um arquivo de vídeo com 1Mbyte e 1 segundo de duração, tem taxa de bits equivalente a ou 8.388.608 bps ou 8.192 kbps ou 8 Mbps pois:

1Megabyte/s = 8.388.608 bits (8×1.024×1.024) ou 8.192 kbps (8.388.608 ÷ 1.024) ou 8 Mbps (8.192 ÷ 1.024)

A qualidade final de reprodução de uma arquivo multimídia é derivada da relação entre a taxa de

bits final e o CODEC empregado na compactação. Uma mesma taxa de bits pode produzir

resultados diversos a depender do algoritmo usado. Por exemplo, o mesmo vídeo encodado em

APOSTILA TÉCNICA DE PÓS - PRODUÇÃO AUDIVISUAL (CINEMA – UFRB – PROF. ADRIANO OLIVEIRA)

7

MPEG-2 poderá ter a mesma qualidade com metade do bitrate se encodado em H.264, e ainda a

mesma qualidade com 25% do bitrate inicial se encodado com H.265.

As taxas de bits podem ser constantes ou variáveis, segundo a estratégia de compactação

empregada:

CBR (Constant Bitrate):

VBR (Variable Bitrate):

A taxa de bits é uniforme e constante durante toda a extensão do fluxo de dados.

A taxa de bits final é uma média de taxas que variam conforme a necessidade durante a extensão do fluxo de dados. Em geral os encoders permitem a especificação da taxa média e dos limites máximos e mínimos que podem ser atingidos. Por exemplo, no decorrer de um filme, cenas lentas, cartelas e créditos em geral demandam bitrates menores do que sequências de ação com movimentação rápida de câmera.

Para ser mais eficiente em contextos VBR, os encoders permitem o emprego de “duas passadas” para uma única codificação: na primeira se avalia as demandas do material no decorrer de sua extensão e apenas na segunda passada é aplicada a compactação efetiva. Esse processo potencializa a qualidade final, mas consome o dobro de tempo na compactação.

A taxa de bits total de um arquivo multimídia equivale a somatória das taxas de bits parciais de

cada um de seus fluxos de dados audiovisuais.

..

Compactação ESPACIAL

Forma de restringir o tamanho total do vídeo através da simplificação matemática das

redundâncias de imagem em cada quadro isolado.

Pode ser:

SEM PERDA [lossless]

COM PERDA [lossy]

A compactação é executada sobre a imagem original, sem modificá-la.

Antes da compactação, um algoritmo modifica a imagem original, eliminando variações locais, o que facilita o trabalho posterior de simplificação na codificação. Quando excessiva, essa homogeneização forçada pode ficar aparente na forma de blocos na imagem (como um JPG muito compactado).

..

Compactação TEMPORAL (GOP)

Forma de restringir o tamanho total do vídeo através da simplificação matemática das

redundâncias encontradas entre os quadros. A compactação temporal é executada após a

APOSTILA TÉCNICA DE PÓS - PRODUÇÃO AUDIVISUAL (CINEMA – UFRB – PROF. ADRIANO OLIVEIRA)

8

espacial e necessariamente implica em perda de dados, pois resulta no armazenamento de quadros incompletos, mesmo que sem impacto perceptível.

Essa técnica agrupa os quadros de um arquivo de vídeo em blocos contínuos chamados de GOP (group of frames), segundo semelhanças identificadas. O primeiro quadro e um GOP é identificado como quadro chave e permanece íntegro (I). Os quadros subsequentes são armazenados apenas parcialmente (P), evitando-se reproduzir áreas que podem ser referidas ao quadro chave. Em CODECs sofisticados, há também quadros parciais bidirecionais (B), que omitem áreas codificadas em quadros chave e parciais, anteriores ou posteriores.

Um GOP sempre começa com um quadro I, sucedido por uma sequência de quadros P e B (este último é opcional, mas agrega bastante qualidade). A compactação GOP exige bastante processamento tanto na codificação quando na exibição/edição. Além disso, potencialmente implica em algum grau de perda de qualidade, principalmente em trechos com movimentos rápidos de câmera.

..

********

..

*****

..

Profundidade de bits (bitdepth)

Amostragem (sampling)

Sub-amostragem dos canais de cor (chroma subsampling)

As imagens digitais coloridas são geralmente capturadas e codificadas no sistema de cores RGB, segundo o qual a coloração final é derivada da adição de tons em cada um dos três canais monocromáticos armazenados, correspondentes às cores primárias VERMELHO, VERDE e AZUL.

O sistema RGB estabelece que os três canais devem ter amostragem igual. Eles armazenam tanto

a intensidade da cor (crominância) quanto a intensidade da luminosidade (luminância). Como a luminância se repete nos três canais, o sistema RGB implica numa redundância de dados que não é problemática para imagens isoladas, mas que se torna excessiva no caso dos vídeos. Por isso, mesmo quando capturados em câmeras com sensores RGB, vídeos não são armazenados normalmente neste sistema.

O sistema de cor padrão para compactação de vídeo é YCrCb (ou YUV), onde os dados de

luminosidade (Y) são isolados dos dados de crominância (Cr e Cb). Neste sistema, é possível “sub-amostrar” os canais de cor, armazenando-os com uma fração do tamanho do canal de

APOSTILA TÉCNICA DE PÓS - PRODUÇÃO AUDIVISUAL (CINEMA – UFRB – PROF. ADRIANO OLIVEIRA)

9

luminância. Assim, cada canal de cor pode ter entre 50% a 25% da amostragem do canal de

luminância sem que isso altere a qualidade perceptível em relação a imagens codificadas em

RGB — isso porque o olho humano é mais sensível à luz do que à cor.

O nível de sub-amostragem cromática de um arquivo é registrado com uma codificação de três

números que indicam a relação entre os canais:

4:4:4

Não há sub-amostragem e os canais têm tamanhos equivalentes. Em geral, 4:4:4 é sinônimo de RGB, mas não necessariamente.

4:2:2

Cada canal de cor tem 50% do canal de luminância, sem perda aparente de qualidade. É o chamado padrão broadcast e é o ideal para arquivos audiovisuais provenientes de câmeras sofisticadas (câmeras que gravam em ProRes ou AVC Intra, por exemplo).

4:2:0

Cada canal de cor tem 25% do tamanho do canal de luminância. É o padrão de imagens codificadas em h.264. Apesar da compactação equivalente, apresenta qualidade superior ao 4:1:1 em função da distribuição das informações de cor na área de cada quadro.

4:1:1

Cada canal de cor tem 25% do tamanho do canal de luminância. É o padrão de imagens codificadas em DV (câmeras mini-DV).

Observação:

Um vídeo 4:1:1 que não sofreu alteração tende a apresentar uma qualidade perceptível equivalente a outro em 4:4:4. Entretanto, quanto menos pobre a sub-amostragem, mais flexibilidade temos na manipulação do material na pós-produção de efeitos e correção de cor.