Você está na página 1de 15

No caminho para o nirvana1 do

Loudness
_ nivelamento de áudio com a EBU R128

Original em inglês por: Florian Camerer (Chairman do grupo P/Loud do EBU)

Este artigo descreve uma das mudanças mais fundamentais na história


do áudio na radiodifusão e produção de conteúdos: a mudança do
paradigma de
nivelamento pico para a
normalização pelo
Loudness. Essa mudança é
essencial devido a um
problema que se tornou
uma grande fonte de
irritação para os
telespectadores e ouvintes
em todo o mundo - o da grande variação nos níveis de áudio nos
intervalos dos programas, entre os programas e entre os canais. A
normalização do Loudness é a solução para combater este problema.

A Recomendação EBU R128 estabelece um método bem definido para


medir o nível de Loudness2 para notícias, esportes, publicidade, teatro,
música, promoções, filmes, etc em toda a cadeia de transmissão e,
assim, ajuda os profissionais a criar especificações robustas para ingest,
produção, reprodução e distribuição de conteúdos para uma
infinidade de plataformas.

1- Nirvana é o ápice, ou seja, é o ponto mais alto de meditação, no qual, acreditam os praticantes do
budismo, o espírito se liberta do corpo temporariamente.

2- Loudness se refere à intensidade percebida de uma peça de áudio (música, voz, efeitos sonoros, etc.) A
intensidade depende do nível, frequência, conteúdo e duração do áudio, entre outras coisas.

1
Quatro documentos de apoio foram criados pelo EBU para ajudar a
indústria de áudio a trabalhar com a Recomendação R128. Ela é
inteiramente baseada em padrões abertos e visa harmonizar a nossa
forma de produzir e medir áudio internacionalmente.

Além do Loudness do programa, a


R128 traz mais dois descritores de
áudio: Faixa de Variação de
Loudness (Loudness Range) e Nível
Máximo True-Peak (Maximum True
Peak Level). Os três foram
projetados para trabalhar juntos,
formando um conjunto de
descritores essenciais que
caracterizam um sinal de áudio.

A medição e normalização do Loudness significa uma verdadeira


revolução no nivelamento de áudio (veja a Figura 1). Além disso, esse
paradigma do nivelamento pelo Loudness afeta todas as fases de um
sinal de áudio, desde a captura até a distribuição e transmissão. Assim,
o objetivo principal é harmonizar os níveis de Loudness para um mesmo
canal de conteúdo, bem como entre canais de modo a alcançar um
valor igual e universal, para o benefício dos ouvintes.

Sendo mais claro: o nível de Loudness ainda pode (e deve!) variar de


acordo com as necessidades técnicas e artísticas, dentro de um
programa. Pelo contrário, o método de normalização de Loudness usa o
Loudness médio de um programa, para chegar a um nível consistente
entre os programas e entre os canais.

A experiência de vários membros do EBU tem mostrado que trabalhar


com o paradigma do Loudness ao mesmo tempo que dá liberdade, é
bastante satisfatório. A luta para saber "Quem é o mais alto"
desaparece, as mixagens podem ser mais dinâmicas, há menos
artefatos de compressão dinâmica, como "pumping" e, portanto, há um
aumento geral de qualidade de áudio! Produtores de programas que se
valiam da mixagem dinâmica no passado agora estão isentos de
compromissos potenciais porque seu programa já não parece mais
“soft” que os mais compactados. Com a normalização do Loudness,
este compromisso desaparece. O Nirvana está mais próximo do que
nunca!

2
A origem do problema - a "guerra do Loudness"

A medição de áudio no broadcasting hoje baseia-se normalmente em


medidores de quase-pico de programa (QPPMs - mais conhecidos
como PPM apenas). É "quase" por causa de seu tempo de reação de 10
ms (apesar de também serem encontrados medidores com 5 ms). Na
prática, isso significa que os
picos de sinal inferiores a
este tempo de reação não
serão exibidos corretamente
(por exemplo, transientes
tais como aqueles criados
quando teclas são
comutadas). A fim de
proporcionar espaço para
estes efeitos transitórios, que
não se veriam no medidor,
mas que efetivamente
estão lá contribuindo para a
clareza do sinal de áudio, foi
acordado que o nível
máximo permitido (PML) seria fixado em -9 dBFS.

Este valor foi baseado no familiar - e ainda existente - método de


transmitir o som para os ouvintes via uma portadora FM. O desvio
máximo da portadora para TV foi padronizado em muitos países, em 50
kHz e o PML em 30 kHz de desvio (equivalente a -9 dBFS), o que permitiu
assim 20 kHz, ou 4,4 dB de espaço para expansão.

No entanto, as questões comerciais cresceram e a resposta à pressão


para se destacar da concorrência tem sido a de ter volume mais alto
do que ela. A moderna medição de pico e o forte processamento de
faixa dinâmica permitiu às organizações realinharem o PML de forma a
igualar ao desvio máximo (50 kHz) da transportadora FM (ver Fig. 2).
Todos os transientes têm de ser limitados ao PML para evitar distorções,
mas isto foi estabelecido como um compromisso aceito por aqueles
que têm aplicado este realinhamento.

3
Quando algum espectador muda de canal, entre uma destas estações
e uma outra que não se juntou à "guerra" ou está veiculando um
comercial, com alto volume, num contexto de programa bem
equilibrado, com uma faixa dinâmica maior, o nível de áudio dá um
salto e há uma corrida ao controle remoto para ajustar o som a um nível
mais aceitável. No caso dos comerciais com alto volume, o som então
tem que ser reajustado quando o programa principal retorna. Não é à
toa que tantas queixas são recebidas pelas empresas de radiodifusão.

Outras pessoas resolvem o problema silenciando o aparelho durante os


comerciais, o que não é desejado.

Surge um padrão – e o EBU o desenvolve

A União Internacional das Telecomunicações (ITU) reconhece o


problema e um de seus trabalhos deu origem a ITU-R BS.1770. A
finalidade da norma foi
estabelecer um
algoritmo bem aceito
para a medição do
Loudness e dos níveis de
True-Peak dos
programas. É um padrão
robusto, que tem a
vantagem de ser uma
aplicação simples. Em
resumo, ele define uma
curva com ponderação
K (um filtro passa alta de
segunda ordem
modificado), que
constitui a base para
alcançar uma impressão
subjetiva inerente através
de uma medida objetiva.

Figura 3: Processamento e somatório

dos canais na ITU-R BS.1770

4
Esta curva é aplicada a todos os canais (exceto ao de efeitos de baixa
freqüência (LFE), que é descartado da medição), a energia média
quadrática total é então calculada (com diferentes fatores de ganho
para os canais frontais e os canais surround, ver fig. 3) e o resultado é
exibido como "LKFS" (Loudness, Ponderação-K, referenciado ao Full
Scale digital).

Para as medições relativas, Unidades de Loudness (LU) são utilizadas,


onde 1 LU é equivalente a 1 dB.

Um estudo mais detalhado do algoritmo pode ser encontrado na ITU-R


BS.1770, bem como no EBU Tech Doc. 3343 - "Practical Guidelines" .

A BS.1770 também define e recomenda o uso de um medidor de True-


Peak para medir os picos. Tal medidor funciona com uma taxa de
amostragem maior que a do sinal de áudio (normalmente 4x mais) para
capturar picos entre as
amostras e que
poderiam exceder 0
dBFS e assim provocar,
mais tarde, uma
distorção na cadeia.

A ITU-R BS.1770 fornece a


base para a
Recomendação EBU R128 que estende o padrão ITU definindo
realmente um valor alvo específico para o Loudness (veja abaixo), para
sua normalização, bem como um método de gating para melhorar o
equilíbrio de Loudness nos programas que contenham longos períodos
de silêncio ou falas muito isoladas. O desenvolvimento do EBU foi
necessário para resolver as necessidades dos produtores de conteúdos,
com o objetivo particular de ter um meio de medir mixagens completas
(ao invés de apenas um componente, como o diálogo) e a faixa de
variação de Loudness do conteúdo.

Para fazer isso, o EBU especificou três novos parâmetros:

Loudness do Programa

Faixa de Variação de Loudness

Nível de True-Peak

5
Loudness do Programa

O Loudness do Programa descreve o Loudness de longo período


integrado ao longo da duração do programa. (Em R128, o significado
da palavra "programa" refere-se também aos comerciais, chamadas e
outros intersticiais). O parâmetro é composto por um número (em LUFS3),
com uma casa decimal, que indica "quão alto o áudio do programa é,
em média". Isto é feito com um medidor compatível com a ITU-R BS.1770
e com a adição de uma função de gating. O gate serve para pausar a
medição de Loudness quando o sinal cai abaixo de um certo limite.
Sem essa função de gating, conteúdos com períodos mais longos de
silêncio ou apenas com som de fundo ou ainda um pequeno ruído,
ficariam com um valor muito baixo de Loudness integrado. Estes
programas posteriormente ficariam com volume muito alto quando
transmitidos.

Após uma série de testes, um gate de -8 dB relativo à medição LUFS sem


gating, com um comprimento total de 400 ms, foi introduzido. Os testes
também confirmaram, juntamente com outros resultados, a escolha do
nível alvo para o Loudness segundo o qual todos os sinais de áudio
serão normalizados. Ele é:

–23 LUFS (–8 rel gate)


Um desvio de ± 1 LU é
aceitável para os
conteúdos em que uma
normalização exata para
o nível pretendido de -23
LUFS não é viável na
prática (como em
programas ao vivo). Nos casos em que os níveis dos sinais individuais do
programa são, em grande parte, imprevisíveis, ou quando um conteúdo
é constituído por elementos de fundo apenas (por exemplo, um fundo
musical para um programa de previsão do tempo), essa tolerância
pode ser muito rígida.

3- LUFS indica o valor de Loudness com ponderação K e com referência à escala digital completa. A EBU
recomenda esta unidade para superar uma inconsistência entre a ITU-R BS.1770 e ITU-R BS.1771. Esta unidade
está em conformidade com a norma ISO 80000-8.

6
É, portanto, previsto para esses casos que o nível de Loudness integrado
possa estar fora da tolerância especificada pela R128.

Faixa de Variação de Loudness (Loudness Range – LRA)


Outra consideração importante foi a Faixa de Variação de Loudness
que seria necessária para acomodar todos os programas (desde que
não ultrapassem a faixa de Loudness tolerável para ouvir num ambiente
doméstico). O descritor
da Faixa de Variação de
Loudness (LRA) quantifica
(em LU) a variação da
medida de Loudness de
um programa. É baseado
na distribuição estatística
de Loudness dentro de
um programa, excluindo
os extremos. Assim, por
exemplo, o som de um
tiro não é capaz de influenciar o resultado do cálculo do LRA.

A Recomendação EBU R128 não especifica um valor máximo permitido


para o LRA, pois é dependente de fatores tais como a janela de
tolerância da média dos ouvintes da emissora, a distribuição dos
gêneros (sonoros) da estação, etc. A R128, no entanto, incentiva
fortemente o uso do LRA para determinar se o tratamento dinâmico de
um sinal de áudio é necessário e para adequar o sinal às características
particulares de um canal de transmissão ou de uma plataforma. Mais
detalhes sobre o LRA podem ser encontrados na EBU Tech Doc 3342.

As primeiras experiências em emissoras sugeriram um valor máximo do


LRA em torno de 20 LU para materiais altamente dinâmicos como filmes
de ação ou música clássica. A maioria dos programas não terão
necessidade de utilizar em sua plenitude um valor tão alto de LRA, na
verdade, nem serão capazes de alcançá-lo!

7
Nível True-Peak
O Nível True Peak de um sinal sonoro indica o valor máximo(positivo ou
negativo) da forma de onda do sinal no domínio do tempo contínuo;
esse valor é, na maioria dos casos, maior do que o mostrado por um
medidor de quase-pico4, ou mesmo um medidor de sample-peak, aos
quais faltaria medir os picos que potencialmente se encontram entre
pontos de amostras. O uso de um medidor de oversampling, que seja
aderente à BS.1770,
permite que estes
picos sejam
detectados.

Um medidor de pico
oversampling pode
ainda ler o valor de
pico ligeiramente
abaixo do real
(dependendo da
freqüência de
oversampling) e
assim, o nível máximo True-Peak permitido para Produção é o seguinte:

–1 dBTP
Note que algumas partes da cadeia, como sistemas analógicos de
radiodifusão e os usuários de codificadores de baixa taxa de bits
necessitam de um nível True-Peak menor. As orientações do P/LOUD
para Distribuição (EBU Tech Doc 3344) tem uma cobertura abrangente
deste tema.

4- Quase-pico significa “não é suficientemente de pico ", ou" visando atingir pico, mas na verdade não é
pico”. O termo é comumente usado para se referir aos detectores eletronicos ou retificadores. Apesar da
definição acima, de qualquer maneira o termo quase-pico não deve ser interpretado como vago. Os
detectores de quase-pico para fins específicos, foram padronizados com características dinâmicas
matematicamente precisas, em termos de "tempo de ataque", "tempo de integração" e "tempo de
decaimento" ou “tempo de fall-back".

8
Estratégias para a normalização do Loudness

A Fig. 4 mostra duas abordagens, principalmente para a produção. A


primeira é mais relevante para as fases iniciais da transição, e talvez seja
especialmente útil para aqueles que trabalham em programas ao vivo.
Os medidores, limitadores e práticas de mixagem existentes são
mantidos e é feita uma mudança
de nível na saída da mesa (após
os medidores principais) para
atingir o Loudness alvo de -23
LUFS. Um medidor de Loudness é
colocado num ponto após esta
mudança de nível para permitir
que os operadores percebam sua
variação exatamente (que
inicialmente ainda é um pouco
experimental).

Usando um medidor de Loudness


em programas antigos mas do mesmo gênero, tem-se uma boa
orientação com relação aonde os níveis estão. Experiências iniciais na
NDR, ORF e RTBF5 tem mostrado que certamente é possível mixagens ao
vivo caírem dentro da janela de ± 1 LU permitida pela R 128.

Aqueles que trabalham com arquivos têm uma tarefa mais fácil porque
todo o programa pode ser normalizado rápida e facilmente a -23 LUFS
por meio de alterações de nível.

As entidades que fizerem logo a mudança para a medição de


Loudness poderão colher os benefícios de imediato. Quanto maior a
faixa dinâmica permissível, melhor para o ruído de fundo (background)
em programas de esportes - por exemplo, para aumentar o impacto de
um jogo para os telespectadores e ouvintes.

A EBU Tech Doc 3343 fornece orientações práticas para a nova forma
de trabalhar com níveis de áudio.

5- NDR = Emissora de radiodifusão do Norte da Alemanha ; ORF = Emissora de radiodifusão da Áustria ; RTBF
= Emissora de radiodifusão da Bélgica

9
Também há duas formas de, basicamente, atingir a normalização de
Loudness para o consumidor. Uma delas é a normalização real da fonte
em si, de modo que os programas tem o mesmo Loudness “por projeto”.
O outro método é com o uso de metadados que descrevem o Loudness
de um programa.

Por último, os níveis médios reais de Loudness de um programa não


precisam estar alterados para um valor normalizado e ainda assim
podem variar muito.
Para aqueles que tem
equipamento mais
moderno, a
normalização pode ser
feita no lado do
consumidor, utilizando
os valores dos
metadados de
Loudness individuais
para variar o ganho
dos programas para o mesmo nível de reprodução.

Dentro do paradigma de nivelamento do loudness da EBU R128, é


incentivada a primeira solução devido às seguintes vantagens:

o simplicidade
o potencial ganho de qualidade na fonte

A segunda solução não é proibida (veja também o documento


Diretrizes para Distribuição - EBU Tech Doc 3344), mas ter um único
número (-23 LUFS) tem grande força na divulgação do conceito de
nivelamento de Loudness assim como fica mais fácil de entender e agir
para alcança-lo. Também a normalização da fonte, de uma certa
forma, "castiga" os sinais super-comprimidos e, assim, automaticamente
incentiva as pessoas de produção a pensar sobre outras maneiras, mais
dinâmicas e criativas, de causar impacto com seu conteúdo. Em outras
palavras, a real mudança técnica do nível da fonte, através de uma
normalização ativa, para -23 LUFS tem conseqüências diretas sobre o
processo artístico - e de forma positiva!

Não obstante, deve-se afirmar que ambos os métodos podem se


complementar: eles não devem ser vistos como opostos, ou uma visão

10
preto-branco do mesmo problema. Ambas as abordagens são uma
parte da R128 - mas devido às vantagens listadas acima, a
normalização da fonte é a recomendada.

Trabalhando com medidores de Loudness

Até agora, mixando com QPPMs e normalizando pelos picos foi feito
tendo como referência um nível máximo permitido (normalmente, -9
dBFS) e um limitador de pico que previa um nível de "limite de
segurança", que poderia ser atingido tão intensamente quanto
desejado - em detrimento de um som menos envolvente, é claro.

Em contraste, o paradigma do nivelamento do Loudness mais se


assemelha a uma "flutuação
no espaço", como mostra a
representação esquemática
de um medidor gráfico de
barras da figura 5.

A figura 6 mostra como um


medidor feito em software,
com base em uma "agulha"

poderia parecer.

O EBU deliberadamente não


especificou detalhes gráficos
ou de interface de usuário de
um medidor de Loudness,
mas especificou melhorias do
algoritmo descrito na ITU-R
BS.1770 e duas escalas:

11
o Escala EBU +9 que deve ser adequada para a maioria dos
programas
o Escala EBU +18 que pode ser utilizada para os programas com
larga LRA

Ambas as escalas podem exibir o nível relativo de Loudness em LU, ou o


nível absoluto in LUFS. Os fabricantes de medidores do Grupo PLOUD
concordaram em implementar o conjunto de parâmetros do "modo
EBU", para se certificar que as leituras de seus medidores estarão
alinhadas. Muitos outros fabricantes também adotaram o "modo EBU",
ou estão em vias de fazê-lo.

Um medidor de Loudness no " Modo EBU", tal como definido na EBU Tech
Doc 3341 oferece três escalas de tempo distintas:

o Loudness Momentâneo (abreviadamente “M”) – janela de tempo


de 400 ms
o Loudness de Curto Período (abreviadamente “S”) – janela de
tempo de 3 s
o Loudness Integrado (abreviadamente “I”) – do “início” até o “fim”

As janelas de tempo6 M e S devem ser usadas para o nivelamento e


mixagem imediatos dos sinais de áudio. A definição do nível inicial pode
ser melhor executada com o medidor de Loudness Momentâneo,
ajustando o nível de elementos chave ou âncoras (como voz, música
ou efeitos sonoros) para ficar em torno do nível meta de -23 LUFS. É
aconselhável definir níveis com um pouco de cautela, inicialmente,
porque é mais fácil aumentar gradualmente o nível de Loudness
Integrado durante uma mixagem do que diminuí-lo. Geralmente, um
ligeiro aumento no decurso de um programa é também mais natural - e
uma estratégia inicialmente "defensiva" deixa o operador de áudio livre
para manobras em caso de sinais ou eventos inesperados ou
imprevisíveis.

Uma vez que os níveis estejam definidos, o operador de som pode variar
a mixagem só de ouvido.

6- "M" e "S" são comumente usados em estereofonia para "Médio" e "Lateral". Para distinguir dos tempos de
integração "Momentâneo" e "Curto Período", as versões "MLK" e "SLK" (assim como "ILK) podem ser usadas. "LK"
significa "Level, K-ponderado", e está em conformidade com a Norma de Nomenclatura Internacional ISO
80000-8.

12
Observando o Loudness Momentâneo ou Loudness de Curto Período, e
tendo um olhar ocasional no valor do Loudness Integrado, é possível se
ter confirmação de que a mixagem está dentro da tolerância permitida
em torno do nível de referência. Com uma leitura numérica do valor I,
com precisão de uma casa decimal, ou uma tela gráfica de resolução
semelhante, tendências podem ser antecipadas e medidas corretivas
apropriadas poderão ser tomadas.

Resumindo ... melhorar a medição de áudio, substituindo o PPM pelo


medidor de Loudness é mais um passo para nos aproximarmos da
melhor ferramenta de medição - o ouvido humano.

O Loudness na cadeia de distribuição

O EBU Tech Doc 3344 especifica as definições relevantes e o


processamento de áudio depois dele ter deixado o centro de
transmissão e segue o paradigma do Loudness por todo o caminho até
os equipamentos dos consumidores, incluindo set-top boxes e
receptores de áudio e vídeo. Assim fazendo, também incentiva as
transmissões não-conformes a se tornarem compatíveis com a EBU R128.
Transmissão digital, transmissão analógica, retransmissão, anúncios
comerciais localmente inseridos, serviços adicionados e muitos outros
são abordados neste abrangente documento.

Ao invés de medir o volume de conteúdos individualmente, pode-se


monitorar o serviço por 24 horas, com especial cuidado a ser tomado
quando se faz comutações ou serviços partilhados. Bem como os
programas, os metadados de Loudness fornecidos com os serviços
digitais devem ser monitorados para que o nível de Loudness real do
serviço possa ser comparado com o nível indicado, sendo que ambos
devem ser -23 LUFS é claro! Os dados são analisados e quando um
serviço está mais de 0,9 LU distante de seu nível alvo (o valor exato e o
método ainda estão em discussão), uma unidade controladora aplica
um fator de correção para que a média de longo prazo do áudio
permaneça no nível pretendido ± 1 LU.

13
Consequências para o negócio

Como o paradigma de nivelamento de Loudness afeta todas as fases


de um sinal de transmissão de áudio, desde a aquisição até a
distribuição e transmissão e, porque o objetivo final é harmonizar os
níveis de Loudness do áudio nos canais de radiodifusão, bem como
entre os canais, para atingir um nível de Loudness igual e universal, para
benefício dos ouvintes, todos os profissionais de áudio e equipamentos
de medição de áudio, em todos os elos da cadeia, serão afetados por
essa mudança.

Para muitos, uma grande questão é saber se todos os medidores QPPM


existentes terão que ser substituídos e se todo o pessoal envolvido
necessitará de treinamento para se adaptar à nova forma de trabalhar.
A resposta é " No longo prazo, sem dúvida, sim ", mas essa transição não
precisa acontecer de uma só vez embora, pelo menos alguns
medidores de Loudness devam ser postos em funcionamento o mais
rapidamente possível, para ficarem “em paralelo” com os QPPMs. A
substituição dos medidores pode acontecer em consonância com os
ciclos de atualização técnica de outros equipamentos, reforma de
instalações de produção ou como projetos passo-a-passo isolados (o
que é viável em um tempo razoavelmente curto), e as pessoas podem
ser treinadas no tempo adequado.

Os responsáveis pelas especificações e compra dos equipamentos


devem estar cientes de que os limitadores de segurança para evitar
excesso de modulação também deverão ser capazes de trabalhar no
modo True-Peak e eles terão que ser ajustados para o máximo nível de
True-Peak permitido na produção, bem como na saída do controle
mestre, no head-end de distribuição e no transmissor.

14
Conclusões

A EBU R128 e os quatro documentos de suporte são um caminho para


acabar com a "Guerra do Loudness" -
finalmente! O uso da dinâmica do áudio
torna-se uma arte criativa novamente. Ainda
há coisas para aprender e as pessoas vão
demorar um pouco para se acostumar com
as novas formas de trabalhar, mas vai valer a
pena o esforço.

Mais de 230 participantes aderiram ao grupo


EBU PLOUD (até Agosto de 2010) e a
circulação de e-mails têm mostrado um nível
Logo da EBU R128
de atividade nunca antes visto.

Agora é hora de colocar a R128 em ação!

Referências do autor

EBU Technical Recommendation R 128: Loudness normalisation and


permitted maximum level of audio signals

ITU-R BS.1770: Algorithms to measure audio programme loudness and


true-peak audio level

EBU Tech Doc 3342: Loudness Range: A descriptor to supplement


loudness normalization in accordance with EBU R 128

EBU Tech Doc 3341: Loudness Metering: ‘EBU Mode’ metering to


supplement loudness normalisation in accordance with EBU R 128

Tradução e adaptação para português feita por


Elipse Engenharia

15

Você também pode gostar