TV Digital PDF

Manual de TV DIGITAL
Televisão Digital
NOTA DO AUTOR
Este manual destina-se a ser utilizado como documento de apoio a cursos

de TV DIGITAL.
Alguns dos conceitos e circuitos aqui apresentados obrigam a
conhecimentos básicos nas áreas de electricidade e electrónica, mas não é
necessária formação avançada nessas áreas.
Não se desenvolvem os temas exaustivamente, antes se faz uma súmula
tão clara e concisa quanto possível, que permita ao formando ter uma
ideia genérica de como é produzido, transmitido e recebido o sinal de TV
Digital.
A parte de interpretação de circuitos de TV é sobretudo baseada em
diagramas de blocos por ser menos complexa e mais didáctica.
Muita da terminologia técnica utilizada encontra-se em inglês, não se
tendo considerado nem lógico, nem adequado, fazer a sua tradução para
português quer por os termos ainda não se encontrarem generalizados
entre nós, quer sobretudo pelo facto de que a maioria dos manuais e
páginas Web, independentemente do seu idioma, também usarem os
termos ingleses como referenciais.
A utilização da terminologia inglesa permite assim, pelo menos nesta fase,
uma muito maior facilidade na consulta de outros manuais, de páginas de
Internet e das normas MPEG e DVB que regulamentam todo o processo da
TV digital.
Dado que o grafismo deste manual faz uso intensivo da cor, aconselha-se
a que sejam feitas cópias em cor, ou que na sua impossibilidade, sejam
distribuídas cópias em CD. O tamanho da letra utilizado, permite a
impressão de duas páginas por folha.
Paulo Azevedo
Manual de TV Digital Pág. 1

CINEL – Centro de Formação Profissional da Indústria Electrónica
Manual de Televisão Digital
ÍNDICE
Capítulo 1 - Introdução ao DVB 6
1.1. Do Analógico ao Digital 6

1.1.1. Informação Analógica 6
1.1.2. Informação Digital 7
1.1.3. Porquê Digital 7
1.2. Digitalização de sinais 8
1.3. Converter Analógico em Digital 9
1.3.1. AMOSTRAGEM 10
1.3.2. QUANTIFICAÇÃO 12
1.3.3. CODIFICAÇÃO 16
1.4. Converter digital em analógico. 18
1.5. As Normas MPEG 20
1.5.1. Compressão MPEG 20
1.5.2. A norma de compressão MPEG-2 e o DVB 21
1.5.3. Os Standards DVB 22
1.6. SISTEMAS DE TV 23
1.6.1. Cadeia analógica de imagem 23
1.6.2. Cadeia digital da imagem 25
1.7. Questionário 1 28
Capítulo 2 - Compressão 29
2.1. Introdução à Compressão 29

2.1.1. O que é comprimir? 29
2.1.2. Porquê comprimir? 31

2.1.3. Tipos de compressão 32
2.2. Compressão de vídeo 34
2.2.1. Técnicas de compressão 34
2.2.1.1. Redundância Temporal 35
2.2.1.2. Redundância Espacial 36
2.2.1.3. Redundância Estatística 40
2.2.2. Estrutura da codificação 42
2.2.3. Estrutura da compressão 43
2.2.4. Levels e Profiles 46
2.2.5. Codificador MPEG-2 48
2.2.6. Descodificador MPEG-2 50
2.3. A Compressão Áudio MPEG 51
2.3.1. O mecanismo da audição 52
2.3.2. Codificador áudio 53
2.3.3. Descodificador 53
2.3.4. Camadas (Layers) 54
2.3.5. Áudio multicanal 54
Capítulo 3 - Multiplexagem MPEG 58
3.1. Introdução à multiplexagem 58

3.2. O Fluxo Elementar (ES) 61
3.2.1. Fluxo elementar de vídeo (vídeo ES) 62
3.2.2. Fluxo elementar de áudio (áudio ES) 63
3.3. O PES (Packetized Elementary Stream) 65
3.3.1. Estrutura do PES 65
3.4. PS e TS 67
3.5. Transport Stream (TS) 69
3.5.1.1. Packet Identifier (PID) 70
3.5.2. As tabelas PSI 71
3.5.3. Estrutura das tabelas 72
3.5.4. As tabelas SI 73
3.5.5. As tabelas privadas 75
3.5.6. Exemplo de utilização 75
3.6. Evolução do MPEG (MPEG4 e VC1) 75
Capítulo 4 - DVB 79

4.1. Introdução 79
4.1.1. BER (Bit Error Rate) 81
4.1.2. Transmissão digital 81
4.2. Transmissão DVB-S 82
4.2.1. Emissor DVB-S 82
4.2.1.1. Baseband Interface and Sync 83
4.2.1.2. Inversão de sincronismo e Dispersão de Energia 84
4.2.1.3. Código Reed-Solomon (Outer coding) 85
4.2.1.4. O Entrelaçamento (Convolutional interleaving) 86
4.2.1.5. Código convolucional (Inner coding) 88
4.2.1.6. Filtro de Nyquist (baseband shaping) 90
4.2.1.7. MODULAÇÃO QPSK 91
4.2.2. Receptor DVB-S 96
4.3. Transmissão DVB-C 97
4.3.1. Modulação QAM 97
4.3.1.1. Cálculo do débito útil 99
4.3.2. Diagrama de Blocos DVB-C 100
4.3.2.1. Head-End DVB-C 101
4.3.2.1.1. Mapeamento Byte para Símbolo 101
4.3.2.2. Receptor DVB-C 102
4.3.2.3. Transmodulação 102
4.4. Transmissão DVB-T 102
4.4.1. Características do canal 103
4.4.2. Codificador DVB-T 104
4.5. COFDM 105
4.5.1. Partição do canal OFDM 105
4.5.2. Inserção de Sub-portadoras 106
4.5.3. Inserção de intervalos de guarda 107
4.5.4. Sincronização do Canal 108
4.6. Constelações 109
4.6.1. Constelação Básica 109
4.6.2. Constelação Hierárquica 109
4.7. As redes de frequência única (SFN) 110
4.7.1. Sincronização no tempo 111
4.7.2. Sincronização na frequência 112
4.7.2.1. Alguns números 112
4.7.2.2. Vantagens e desvantagens do DVB-T 113
4.8. Transmissão DVB-IPTV 114
4.9. Transmissão DVB-H 116

Capítulo 5 - Standards, Glossário, Links, e Bibliografia 121
5.1. STANDARDS 121

5.2. GLOSSÁRIO 124
5.2.1. DVB 126
5.3. LINKS Internet (activos em 11/11/2007) 128
5.3.1. MPEG Video Overview 128
5.3.2. MPEG Video FAQs 130
5.3.3. MPEG Video Resources 130
5.3.4. MPEG Video Software 132
5.3.5. MPEG Video Test Bitstreams 133
5.3.6. MPEG Normas 134
5.4. BIBLIOGRAFIA 135

Capítulo
Capítulo 1 - Introdução ao DVB

Durante 50 anos a televisão analógica foi o meio de
entretenimento favorito em todo o mundo. Mas o seu reinado
chegou ao fim. A sigla DVB (Digital Video Broadcast) já aparece
na maioria dos novos equipamentos de recepção de TV terrestre e
por cabo e começa agora também a aparecer nos sistemas IPTV..
Este capítulo introduz os conceitos elementares da tecnologia
digital e explica porque razão a TV digital vai destronar a TV
analógica.
1.1. Do Analógico ao Digital
O grande público tomou pela primeira vez contacto com as vantagens da tecnologia
digital, aquando do aparecimento do CD de música. Em menos de 10 anos, os antigos discos
de vinil, praticamente desapareceram do mercado e isso ficou a dever-se a que a técnica
digital permitiu ao utilizador passar a dispor de muito melhores especificações (melhor som,
ausência de ruídos, etc) e de uma muito maior facilidade de utilização (escolha directa da
música, identificação de pistas e de duração de pista, etc), sem que o preço de todas as
vantagens fosse impeditivo.
1.1.1. Informação Analógica
Dizemos que uma informação é Analógica quando há uma variação contínua das
grandezas em jogo (brilho, som, cor, etc.).
Tudo o que vemos, tudo o que ouvimos são grandezas analógicas.

Um relógio em que o ponteiro dos segundos roda continuamente, podendo tomar
qualquer posição dá uma informação analógica. Da mesma forma, a fotografia, onde as
cores e a luminosidade podem tomar qualquer valor é também uma informação analógica.
1.1.2. Informação Digital
Um relógio em que o ponteiro dos segundos salta de segundo em segundo, em vez de

rodar continuamente, é um relógio digital porque, ao contrário da informação analógica, a
Informação Digital, varia por níveis bem distintos uns dos outros e corresponde sempre a um
código que é necessário conhecer para a decifrar.
A lista de “zeros” e “uns” que se indica na Figura 1-1, é uma Informação Digital em
Código Binário. Nos circuitos electrónicos, estes “zeros e “uns” são representados por níveis
de tensão diferentes que variam ao logo do tempo.
Código 0 0 1 1 1 0 1 1 0 0 0 0 1 1 1 1 0 0 1 1 0 0
“1”
Tensões “0”
tempo
Figura 1-1 – Informação Digital
1.1.3. Porquê Digital
A pergunta é inevitável, então... porquê digital se tudo ao nosso redor é analógico?

Existem várias e poderosas razões:
 PREÇO: com a tecnologia actual, os sistemas digitais, são regra geral,

muito mais baratos que os seus antepassados analógicos. Por exemplo,
no mesmo emissor onde antes se emitia um só programa de TV
analógico, podem agora transmitir-se até 10 programas de TV digital, ou
seja, os custos de emissão por programa foram reduzidos em 1/10).
 QUALIDADE: o sinal digital é extremamente fiável porque apesar de se
degradar durante a transmissão, é possível restituir exactamente o sinal
original desde que a degradação não tenha sido excessiva. Além disso e
como é do conhecimento geral, o sinal digital não se degrada por cópia,
ao contrário do que ocorre com o sinal analógico.
 FUNCIONALIDADE: os sinais digitais permitem a inclusão de uma
variada gama de serviços ou de opções adicionais que seriam difíceis ou
mesmo impossíveis de obter com sinais analógicos (codificação,

interactividade, pay-per-view, etc.)
 MODULARIDADE: possibilidade de construção de sistemas por meio de
módulos independentes interagindo facilmente entre si (de que são
exemplo os modernos televisores digitais) ou grandes sistemas,
totalmente controláveis à distância sendo assim possível em Lisboa, em
tempo real, saber quando e qual a avaria que ocorreu no transmissor de
Bragança.
1.2. Digitalização de sinais
Dado que as grandezas da nossa vida real (som, imagem, etc) são analógicas, para
que a partir delas se obtenham sinais digitais é sempre necessário proceder a uma
conversão de analógico para digital (ADC). Contudo, como os nossos sentidos são apenas
sensíveis a grandezas analógicas, no final do processo, será sempre necessária uma nova
conversão, agora de digital para analógico (DAC), tal como indicado na Figura 1-2.
Conversão PROCESSAMENTO Conversão

A/D DIGITAL DO SINAL D/A
Vin Vout
(ADC) (DSP) (DAC)
MICROPROCESSADOR
Figura 1-2 – Digitalização de sinais analógicos
Podemos assim dizer que o sinal analógico original, embora processado e transmitido
na forma digital, terá sempre que ser, no final, reconvertido para analógico, pois só dessa
forma será compreendido pelo utilizador.
Na prática, estas 3 fases, podem actualmente ser executadas com grande rapidez e
eficiência em um só circuito integrado e estão resumidas na Figura 1-3.
Repare que na conversão ADC o sinal analógico original não vai ser todo digitalizado.
Apenas alguns dos seus pontos (amostras) vão ser medidos e só esses valores serão
convertidos para digital.
O valor de tensão obtido em cada uma das amostras é comparado com níveis de
amplitude possível e incluído dentro de um desses níveis (quantização). Na Figura 1-3
existem 8 níveis (0 a 7) e como em digital oito níveis se podem representar por 3 bits, então

cada amostra pode ser representada pelos 3 bits do nível onde se situa (codificação),
obtendo-se assim um sinal digital que será utilizado no DSP.
Quando for necessário converter o sinal digital para analógico (DAC) o processo é
inverso. Na descodificação, os bits são de novo convertidos em níveis e estes reconstituirão
o sinal original.
Figura 1-3 – Processo completo de digitalização de sinais
A seguir analisaremos cada uma destas fases em pormenor.
1.3. Converter Analógico em Digital
O processo de conversão A/D tem as três fases já mencionadas, e que se resumem na

Figura 1-4:
 Amostragem
 Quantificação
 Codificação

Conversão A/D
01001110
Vin AMOSTRAGEM QUANTIFICAÇÃO CODIFICAÇÃO Vout
Figura 1-4 – Processo de conversão A/D
1.3.1. AMOSTRAGEM
Um sinal analógico é contínuo no tempo e portanto contém uma infinidade de valores.

Para transformar este sinal em digital, seria também necessária uma infinidade de bits o que
tornaria impossível a sua transmissão nos canais normais.
Contudo, demonstrou-se que, para converter um sinal analógico em digital, basta

medir (amostrar) o sinal analógico a intervalos regulares, convertendo depois para digital
apenas os valores de tensão obtidos nessas amostras (Figura 1-5)
(a)
(b)
(c)
Figura 1-5 - Amostragem

A Figura 1-5 ilustra o princípio da amostragem: um sinal analógico (a) é amostrado
(medido) a intervalos regulares (b) e apenas as tensões medidas nesses instantes (c) serão
utilizadas para serem transformadas em digital.
Repare que os pontos obtidos em (c) são impulsos do tipo PAM, (Pulse Amplitude
Modulation) e serão suficientes para reproduzir o sinal original (a) com boa fidelidade.
Quando maior for o número de amostras, mais fiel será a reprodução do sinal, mas em
contrapartida mais informação (mais “0” e “1”) será necessário transmitir e processar.
Qual deve então ser a frequência de amostragem correcta?
Verifica-se que, para que um sinal amostrado possa mais tarde ser reconstituído
fielmente, a frequência de amostragem fa tem que ser superior ao dobro da frequência
máxima presente no sinal fmáx..
fa  2fmáx
Como exemplos, um sinal de áudio (frequências de 20 a 20 KHz) terá que ser

amostrado pelo menos a 40 KHz e um sinal de vídeo (frequências de 0 a 5 MHz) terá que
ser amostrado pelo menos a 10 MHz.
(a) fa>2fm
(b) fa=2fm
(c) fa<2fm
Figura 1-6 - Aliasing
Se a taxa de amostragem for menor que a frequência máxima do sinal que se está a

capturar, o sinal reconstruído pode nem sequer se assemelhar à forma de onda inicial. Este
fenómeno é chamado aliasing e está bem evidenciado na Figura 1-6
Em (a) a frequência de amostragem é maior que duas vezes a do sinal. Há amostras

suficientes (pontos azuis) para que o sinal possa ser reproduzido sem erro.
Em (b) a taxa de amostragem é igual a duas vezes a frequência do sinal. Não é

possível a sua reprodução, a não ser que por coincidência os pontos caíssem nos picos da
sinusóide, donde a necessidade do "maior que o dobro" no teorema da amostragem.
Em (c) a frequência de amostragem é menor que o dobro da frequência do sinal. A

quantidade de amostras é insuficiente e o sinal reproduzido (a vermelho) estará errado.
A Figura 1-7 mostra mais claramente a influência da frequência de amostragem.
Figura 1-7 – Efeito da frequência de amostragem
Quanto maior for a frequência de amostragem mais perfeito vai ser o sinal
reconstituído na saída. Contudo uma frequência muito alta obrigará a mais amostras e
consequentemente a muitos mais bits para serem transmitidos, o que é inconveniente.
Por isso adoptam-se sempre frequências de amostragem ligeiramente acima do dobro

da frequência mais alta presente no sinal a ser amostrado.
Os circuitos que geram a frequência de amostragem no processo de conversão A/D

devem estar sincronizados (ter a mesma frequência) que os circuitos que irão fazer a
conversão D/A (rever Figura 1-2)
1.3.2. QUANTIFICAÇÃO
Depois da amostragem segue-se o processo de quantificação (ou quantização).
Quantificar (quantizar) consiste em medir o valor da tensão obtida em cada amostra

PAM e transformar esse valor de tensão num determinado número binário.

O número de bits utilizado determinará o número de níveis possíveis.
Com 2 bits há possibilidade de representar quatro valores (00, 01, 10, 11)
Com 3 bits representam-se oito valores (000, 001, 010, 011, 100, 101, 110, 111)
Quanto mais bits forem utilizados maior será a precisão do processo.
Repare na Figura 1-8 onde se representa um sinal analógico que varia de –4V a +4V
e que é amostrado apenas a dois bits (4 níveis).
Cada intervalo corresponde a 2V e portanto tanto um sinal de 0,2V como um sinal de

1,9V serão considerados iguais pois estão no mesmo nível e serão ambos representados
pelos mesmos dois bits (10). Em relação ao valor médio do intervalo, há um erro máximo de
1V ou seja, metade do intervalo.
Como se pode constatar, uma quantificação a 2 bits produz erros enormes.
Volts
+4
+3,2V
+3 nível 3 11
Valor do sinal analógico em Volts
+2,2V
(qualquer valor entre -4V e +4 V)
(com 2 bits só há 4 valores possíveis)
+2
Valor digital das amostras
+1,9V
+1 nível 2 10
+0,8V +0,2V
+0,7V
0
-0,7V -0,2V
-1 01
nível 1 -1,3V
-2
-3 nível 0 00
-3,2V
-4
a1 a2 a3 a4 a5 a6 a7 a8 a9 a10 Tempo
Amostras
Figura 1-8 – Amostragem a 2 bits (4 níveis)
Contudo, se em vez de 2 bits a amostragem for feita a 4 bits, (Figura 1-9) haverá
agora 16 níveis.
Repare que os 0,2V do exemplo anterior caem agora no intervalo (“1000”) e os 1,9V
no intervalo (“1011”), sendo portanto diferentes. Cada intervalo é agora de 0,5 V e o erro
máximo em relação ao centro do intervalo é de 0,25V.

Volts
+4
nível 15 1111
Valor do sinal analógico em Volts
+3
+3,2V nível 14 1110
nível 13 1101
1100
(com 4 bits já há 16 valores possíveis)

+2,2V nível 12
(qualquer valor entre -4V e +4 V)
+2
Valor digital das amostras

+1,9V nível 11 1011
+1 nível 10 1010
+0,8V nível 9 +0,7V
1001
0 nível 8 +0,2V 1000
nível 7 -0,2V 0111
-1 nível 6 -0,7V 0110
nível 5 -1,3V 0101
-2 nível 4 0100
nível 3 0011
-3 nível 2 0010
nível 1 -3,2V 0001
-4 nível 0 0000
a1 a2 a3 a4 a5 a6 a7 a8 a9 a10 Tempo
Amostras
Figura 1-9 – Amostragem a 4 bits (16 níveis)
Como se pode constatar, com quatro bits os erros são ainda muito grandes.
Numa amostragem a 8 bits teríamos 28 níveis (256 níveis) o que para o exemplo
anterior daria para cada intervalo 8V/256níveis = 38,25 mV por nível, valor que introduz um
erro já totalmente aceitável.
A Figura 1-10 resume qual a influência do número de bits na aquisição dos sinais.
Figura 1-10 – Influência do número de bits na amostragem
Quanto maior for o número de bits, maior é a precisão da forma de onda na saída,
porque cada bit adicional duplica o número de níveis possíveis e diminui o erro para metade.
Contudo, quanto mais bits forem utilizados para representar as amostras PAM, maior será a
quantidade de informação a transmitir, obrigando a maiores tempos de transmissão (maior
largura de banda) e a circuitos mais complexos.

Qual é então o número de bits ideal com que se deve amostrar um sinal?
Demonstra-se matematicamente que a relação sinal/ruído de quantificação para n bits

é da ordem de
S / N  6 n (dB)
Em televisão, uma relação S/N = 48 dB é muito boa enquanto que para uma
gravação áudio em CD já será preciso uma S/N = 96 dB.
Assim sendo, um sinal de vídeo precisa de ser amostrado com pelo menos 8 bits
(porque 8 bits x 6dB = 48dB) e um sinal de áudio em CD precisa de ser amostrado a 16 bits
(porque 16 bits x 6dB = 96dB)
Analisemos o caso de n=8 bits. Com 8 bits é possível representar 256 níveis
diferentes (0 a 255).
Normalmente os sinais analógicos têm valores positivos e negativos. Para exemplificar,

vamos supor que os impulsos PAM têm tensões entre -128V e +128V.
Como se torna mais complicado representar sinais negativos em binário, usa-se o

truque representado na Figura 1-11.
O eixo vertical tem os 256 níveis mas o eixo de tensão, 0V, é deslocado para o nível
128. Podemos assim representar valores de tensão negativos (de -1 a -128V) e positivos (de
0 a 127V) sem necessidade de indicar o sinal.
Figura 1-11 – Quantificação de tensões negativas
Os valores amostrados na forma de onda da Figura 1-11 são:
118,135,130,138,151,165,179,179,182,195,179,144,109,78,51,37,39,62,97,123.

A que correspondem os seguintes valores quantificados de tensão (em V),
-10,+7,+2,+10,+23,+37,+51,+51,+54,+67,+51,+16,-19,-50,-77,-91,-89,-66,-31,-5 .
1.3.3. CODIFICAÇÃO
Depois da quantificação tal como descrito anteriormente, é agora necessário fazer a

codificação.
A cada nível obtido, deverá fazer-se corresponder o respectivo sinal digital, tal como se
exemplifica na Figura 1-12.
Aí se representam quatro amostras, e se indica o valor real, o valor quantizado e o

correspondente código binário que será enviado para a linha.
Figura 1-12 – Codificação de amostras quantificadas
Os valores quantizados são codificados em sequências de bits. Em binário puro, a

codificação seria como mostra a figura acima, que é um exemplo de um sinal digital PCM
(Pulse Code Modulation), onde cada impulso PAM de amplitude variável é transformado
numa sequência de bits (8 bits no caso deste exemplo), tal que represente o valor da
amplitude do impulso PAM original, arredondado pelo erro de quantificação.
A Figura 1-13 mostra outro exemplo: o conteúdo hexadecimal e ASCII de um arquivo

áudio no formato *.wav.
Observe o cabeçalho padrão de 44 bytes, que contem uma série de informações, como
formato, quantidade de amostras, etc...

Figura 1-13 – Exemplo de Codificação a 8 bits
Após o cabeçalho, estão as amostras quantificadas, byte a byte (porque o formato é

PCM de 8 bits): por ex., a primeira vale 80h=128. Como se trata de um arquivo no formato
PCM de 8 bits, 128 equivale a um nível de tensão do sinal igual a zero (off-set de 128).
A Figura 1-14 também representa a parte inicial de um arquivo *.WAV mas agora com
16 bits e com um código diferente do da figura anterior.
Figura 1-14 – Exemplo de codificação a 16 bits
Cada amostra ocupa dois bytes (16 bits), e é usada a notação sinal complemento de 2,
onde o bit mais significativo representa o sinal 0=positivo e 1=negativo.
A amplitude de um número negativo, é obtida invertendo-se todos os seus bits e

somando-se 1.

1.4. Converter digital em analógico.
A partir do sinal digital é possível obter o sinal analógico original por meio de uma
conversão D/A, feita em duas etapas:
 Descodificação dos bits e sua conversão em amostras PAM.

 Filtragem do sinal PAM num filtro passa baixo com frequência de corte
igual à frequência de Nyquist (ou seja, metade da frequência de
amostragem).
A conversão dos bits em impulsos é feita por um conversor digital-analógico (DAC),

que transforma cada grupo de n bits num impulso PAM com nível analógico igual ao valor
quantificado aquando da conversão A/D.
A Figura 1-15 é um exemplo de um sinal PAM a ser convertido em sinal analógico:
Figura 1-15 – Impulsos PAM
Como preencher os espaços vazios entre as amostras PAM? Ou seja, como completar
correctamente a infinidade de pontos que estão faltando entre os Impulsos PAM?
Esta é a função do filtro passa baixo. Quando um filtro passa-baixo ideal (roll-off =
zero) é excitado na sua entrada por um impulso, o sinal na sua saída tem a forma sen x / x,
como mostra a Figura 1-16:
Figura 1-16 – Resposta do filtro ideal ao sinal PAM

Características importantes na resposta a impulsos de um filtro passa baixo ideal, com
frequência de corte fo :
 O impulso de entrada é um impulso de curta duração t tal que t << 1/2fo.

 A amplitude do sinal de saída é proporcional à energia do impulso de entrada,
portanto proporcional à amplitude do impulso, desde de que sua duração t seja fixa
e dentro do critério acima.
 O sinal de saída tem forma sen x / x , portanto passa por zero em tempos múltiplos
inteiros de T=1/2 fo, excepto no ponto de máxima amplitude. O tempo T é
independente da duração t do impulso de entrada, se t<< 1/2fo.
Se em vez de um único impulso, excitamos o filtro com uma sequência de impulsos
PAM, com cadência exactamente igual a T=1/2 fo, então estes impulsos não interferirão
entre si, pois cada um cairá num ponto zero da resposta impulsional dos seus antecessores
e/ou dos seus sucessores.
Se o intervalo entre os pulsos PAM não for exactamente T, teremos interferência no

nível de qualquer impulso pelas respostas individuais dos impulsos anteriores ou posteriores,
chamada interferência intersimbólica (IIS).
A frequência fundamental dos impulsos PAM, que é a frequência de amostragem, deve

ser igual ao dobro da banda passante fo do filtro passa baixo.
Portanto, o nível de saída do filtro, nos citados pontos de zero, será exactamente
proporcional ao nível de cada um dos respectivos impulsos de entrada, não introduzindo
nenhum erro nos níveis dos impulsos PAM. Nos intervalos entre os pontos zero da resposta
sen x / x, o sinal de saída do filtro será o somatório de todos os níveis positivos e negativos
das respostas dos impulsos presentes neste intervalos, reconstituindo exactamente a forma
de onda analógica original que está faltando entre as amostras (mantendo o erro de
quantificação que foi introduzido na geração do sinal digital, e que evidentemente não tem
mais jeito de ser compensado).
No caso de reconstituição de sinal, já que a frequência de amostragem foi definida na

geração e não podemos mais alterá-la, podemos concluir que a frequência de corte do filtro
passa baixo ideal deve ser exactamente igual a metade da frequência de amostragem, para
que os pulsos PAM possam ser transformados numa onda analógica contínua e sem
interferência intersimbólica. (fo = ½ fa)
A Figura 1-17 mostra como um sinal PAM, é transformado no sinal analógico original
(S).

Figura 1-17 – Reconstituição de impulsos PAM
A cores, representa-se cada impulso PAM e a respectiva resposta do filtro, para cada
impulso tomado individualmente, sem os outros. A sinusóide S (a preto) é a resultante do
somatório, a cada instante, das curvas coloridas.
Na saída do filtro, temos assim a onda analógica contínua original (embora com ruído
de quantificação).
1.5. As Normas MPEG
O sinal digital de áudio ou de vídeo que se obtém à saída de um converso A/D, tem
um débito binário altíssimo, que o tornaria impossível de transmitir utilizando os actuais
circuitos de comunicações. Um sinal de Vídeo PAL pode atingir um débito de 216 Mbits/s,
quando no máximo um canal (transponder) de satélite não consegue transferir mais que 30
a 40 Mb/s.
A TV DIGITAL só é possível hoje em dia porque se utilizam técnicas de compressão

que permitem reduzir, dramaticamente, a taxa de compressão bruta. A título de exemplo,
actualmente, um programa de TV por cabo ou um programa de TV satélite podem ter
apenas entre 3 a 6 Mb/s em vez dos 216 Mb/s anteriormente referidos. Isto dá bem a ideia
de como as técnicas de compressão permitem resultados surpreendentes.
1.5.1. Compressão MPEG
É um standard aceite a nível mundial, definido especificamente para a compressão de

vídeo, e que está a ser largamente utilizado para a transmissão de imagens em vídeo digital.

No Capítulo 2, analisaremos esta complexa técnica em pormenor, mas por agora convém
conhecer o nome das diferentes opções MPEG.
 MPEG-1 ----- Vídeo-CD: qualidade VHS com som digital.

 MPEG-2 ----- DVD (Digital Video Disk). DVB (Digital Vídeo Broadcast).
 MPEG-3 ---- Não é utilizado em vídeo porque o MPEG-2 conseguiu suprir
todas as necessidades previstas para o MPEG-3.
 MPEG-4 (part 2) ----- Sistemas multimédia globais.
 MPEG-4 (part10) H.264p ----- Evolução do MPEG4 com taxas de
compressão maiores e sistema mais eficiente (vídeo HD)
 VC1 (WMV)p ----- Sistema proprietário da Microsoft (utilizado no
Windows media player 11) é semelhante ao MPEG4 (H.264) mas obtém
taxas de compressão superiores e com menos esforço de
processamento.
 MPEG-7 ----- Sistemas complexos e interactivos, (em desenvolvimento).
1.5.2. A norma de compressão MPEG-2 e o DVB
Fundado em Setembro 1993, o Projecto DVB (Digital Vídeo Broadcast) é um consórcio

de empresas públicas e privadas compreendendo mais de 225 organizações de mais de 30
países e tem como objectivo definir as normas para o sistema de transmissão digital de
sinais de TV.
O DVB, não regulamenta a forma como os sinais são produzidos, mas apenas a forma
como são difundidos.
Quanto à forma do sinal antes de ser difundido, o projecto DVB adoptou o formato
MPEG-2 para o vídeo e o MPEG-1 layer 2 para o áudio. O MPEG comprime (elimina) a toda a
informação que os sentidos da vista e do ouvido do espectador não podem detectar. A
utilização de sinais sob a forma MPEG, permite:
 Transmitir muito mais programas de TV para a mesma largura de banda.

(Um transponder satélite usando DVB pode emitir 6 a 10 programas de
TV enquanto no sistema analógico transmitiria um só programa).
 Utilizar todos os processos interactivos ou de informação (Guias de
programação, Internet, data broadcasting, TV interactiva, etc.)
actualmente disponíveis

1.5.3. Os Standards DVB
Para transmissão de sinais DVB, foram definidos os seguintes standards:
Standard Descrição Norma
DVB-S Difusão por satélite. ETSI EN 300 421
DVB-C Difusão pelas redes de TV Cabo ETSI EN 300 429
DVB-T Difusão terrestre ETSI EN 300 744
DVB-H Sistema de difusão para portáteis. Baseia-se no DVB-T ETSI EN 302 304
DVB-IPTV Difusão pelas redes baseadas em IP ETSI TS 102 104
DVB-MDC Sistema de difusão multiponto por feixes abaixo dos ETSI EN 300 749
10GHz. Baseia-se no DVB-C
DVB-MDS Sistema de difusão multiponto por feixes acima dos ETSI EN 300 748
10GHz. Baseia-se no DVB-S
DVB-CS Televisão digital sobre redes SMATV (Satellite Master ETSI EN 300 473
Access TV).
DVB-PI Interface de Head-end para as redes CATV /SMATV ETSI EN 50083-9
DVB-SI sistema de informação de serviço, que permite ao ETSI ETR 211

utilizador navegar através do mundo DVB.
DVB-TXT Formato de teletexto ETSI EN 300 472
DVB-CI Interface comum para os sistemas de controle de acesso. ETSI EN 50221
DVB-CA Um sistema de codificação comum. ETSI ETR 289
DVB-RC Canal de retorno para TV cabo ETSI EN 300 800
DVB-NIP Protocolos para a televisão interactiva ETSI ETS 300 802
DVB-PDH Interface para as redes PDH ETSI ETS 300 813
DVB-SDH Interface para as redes SDH ETSI ETS 300 814
DVB-M Medidas nos sistemas DVB ETSI ETR 290
Os documentos descrevendo estes standards em pormenor, foram elaborados pelo

grupo DVB e é possível fazer o seu carregamento a partir do site do European
Telecomunications Standard Institute (http://www.dvb.org/technology/standards/index.xml).
Também neste sítio se encontra a lista completa de todos os protocolos DVB.
Os 3 standards DVB mais importantes são DVB-S, DVB-C e DVB-T. A breve prazo, os

standards DVB-H e DVB-IPTV tornar-se-ão igualmente importantes
O primeiro a ser utilizado foi o DVB-S, depois o DVB-C e finalmente o DVB-T. Isto
deve-se a razões de complexidade, pois embora todos os sistemas usem a norma MPEG-2, a
forma de transmitir os sinais entre emissor e receptor, é diferente entre eles. O mais
complexo tecnologicamente é o DVB-T e daí ter sido o último a ser implementado.
A Figura 1-18 mostra precisamente que estes sistemas, embora diferentes quanto ao
meio de transmissão, são idênticos na forma como os dados são originados e fornecidos.
Figura 1-18 – Sistemas DVB
1.6. SISTEMAS DE TV
Antes de abordar no próximo capítulo a questão da tecnologia da compressão, convém

explicar como os sinais de TV são encaminhados desde a produção até ao espectador.
1.6.1. Cadeia analógica de imagem
O diagrama da Figura 1-19 mostra de forma simplificada as operações efectuadas nos

diferentes níveis da cadeia de imagem no contexto analógico.
A produção engloba o conjunto de operações de preparação de um programa de

televisão:
 A obtenção dos componentes de programa, imagem e som. Na saída da

câmara o sinal vídeo apresenta-se na forma dos 3 componentes RGB
analógicos. O som, apresenta-se em mono ou estéreo, analógico e em
banda base.

 Os tratamentos de produção tais como montagem, mistura ou a
incrustação de vários sinais de vídeo. Estes tratamentos podem aplicar-
se a sinais produzidos localmente ou a sinais à distância tais como
reportagens ou sinais provenientes de outros estúdios. Convém então
assegurar a transmissão destes sinais externos.
 A codificação dos componentes áudio e vídeo sobre uma forma que seja
"transportável" e "transmissível". Os processos NTSC, PAL e SECAM
permitem realizar a codificação e a multiplexagem dos três componentes
vídeo RGB com o sinal áudio. O sinal "composto" resultante transporte
um programa de televisão pronto a ser difundido.
Produção Transporte Difusão Recepção

Vídeo
Composto
RGB
Vídeo
Camera
Tratamento Composto
post Sinal Sinal RGB
Reportag.
produção Composto Composto
externa
Codificador
Descodificador
Modulador Tuner Vídeo
NTSC NTSC
Emissor Desmodulador PAL
PAL
SECAM SECAM
Fonte Áudio
sonora Tratamento
post
produção
Figura 1-19 - Cadeia analógica da imagem
Outras operações tais como a inserção de dados (teletexto) ou a codificação do sinal

nos sistemas a pagar podem ser realizados no estúdio de produção.
O transporte assegura o encaminhamento dos programas para os pontos de difusão.

Diferentes suportes de transmissão tais como o cabo, a fibra óptica ou os feixes hertzianos
são utilizados. Este segmento transporte pode reduzir-se a uma simples ligação local se os
locais de produção e difusão estiverem juntos ou próximos.

A difusão cobre o conjunto das operações de condicionamento dos sinais compostos
antes da sua difusão sobre os suportes terrestres, cabo e satélite.
Nos sistemas terrestres e em cabo, os programas são difundidos nas bandas VHF e
UHF onde um canal de 7 MHZ em VHF ou de 8 MHZ em UHF é atribuído a cada programa.
Por satélite, cada programa ocupa um "transponder" cuja largura de banda é de 27, 33
ou 36 MHz. As operações seguintes são realizadas sobre os sinais compostos antes da
difusão:
 Modulação de amplitude em banda lateral vestígial (cabo e terrestre) ou

modulação de frequência (satélite),
 Transposição na frequência da banda base para a banda do canal
atribuído, amplificação e filtragem.
É preciso salientar que o sistema de TV analógica atribui a cada programa um canal de

transmissão.
Há pois uma diferença entre programa (conteúdo) e canal (meio de transmissão) mas
na linguagem comum é habitual dizer canal em vez de programa (Ex: a RTP-1 é um canal de
TV). Esta confusão deve ser evitado na perspectiva digital.
Enfim, no outro extremo da cadeia, o receptor realiza as operações inversas para

fornecer aos equipamentos de visualização (cinescópio, écran plano, etc. ...) e de restituição
dos sinais analógicos de cada componente RGB e da componente sonora.
Estas operações são as seguintes:
 Selecção do sinal difundido no canal que lhe foi atribuído.

 Transposição de frequência em banda base, desmodulação e
descodificação NTSC, PAL ou SECAM,
 Amplificação dos componentes vídeo RGB e da componente de som
dirigida ao cinescópio e aos altifalantes.
1.6.2. Cadeia digital da imagem
A digitalização do sinal vídeo tem lugar na esfera de produção onde é possível efectuar
tratamentos mais complexos sem degradação do sinal. As técnicas digitais foram em seguida
aplicadas à troca de programas de televisão entre estúdios nas ligações chamadas de
contribuição. (Figura 1-20).

É aqui que se torna necessário comprimir os sinais vídeo digitais com o débito bruto de
216 Mbit/s para os transmitir nas artérias de telecomunicações com débitos de 140 a 34
Mbit/s. Para tal, foram construídos dois tipos de equipamentos: o codificador/descodificador
de fonte e o multiplexador de componentes de programas.
Se é difícil, ao nível da produção, comprimir a débitos inferiores a 34 Mbit/s por causa

da qualidade exigida pelas operações de tratamento de imagem pelos operadores de
programas, em contrapartida, depois das operações de tratamento efectuadas, as exigências
de qualidade são mínimas e é então possível aumentar ainda mais as taxas de compressão
até atingir débitos de apenas 2 a 8 Mbit/s, utilizando a norma MPEG-2.
Produção Transporte Difusão

Vídeo Sinal
Sinal MPEG-2 MPEG-2
Composto Digital DVB
Digital TS TS
RGB Comprimido
A
Câmera D Tratamento
C pós
Codificador
produção 1
Vídeo
Reportagem A (montagem)
exterior D Mux Mux
(gravação) C de de
Modulador
Data componentes 2 programas Emissor
Digital
(1 programa) (n programas)
Tratamento
A pós
Fonte Codificador
D produção n
sonora Áudio
C
(montagem)
Recepção
Vídeo
MPEG-2 Descodificador Vídeo
TS Video Composto
(DAC) RGB
Desmodulador Demux
Tuner de
Digital Áudio
Programas
Descodificador
Analógico
Audio
(DAC)
Digital
Figura 1-20 - Cadeia digital da imagem
É então possível encaminhar os programas sob forma digital até ao espectador. A

segunda etapa consiste em difundir os programas digitais utilizando os canais já existentes.
Para isso, técnicas ditas de modulação digital próprias a cada um dos suportes de difusão
foram estudados e desenvolvidas.
São estas técnicas que permitem hoje em dia difundir sinais de TV com baixo débito

binário, nomeadamente:
 20 a 45 Mbit/s num canal satélite,

 25 a 40 Mbit/s num canal cabo,
 8 a 25 Mbit/s num canal terrestre.
Repare que é possível encaminhar vários programas por cada canal, graças a um
multiplexador de programas encarregado de os agrupar.
Estes novos equipamentos que são o codificador fonte, o multiplexador de

componentes, o multiplexador de programas e o modulador digital vêm assim completar a
cadeia de imagem digital. Os diferentes componentes desta cadeia serão descritos nos
capítulos que se seguem.

1.7. Questionário 1
1. Qual a diferença entre uma grandeza analógica e uma grandeza digital?
2. Indique 4 razões que tornam os sistemas digitais mais interessantes que os

analógicos.
3. Quais as três fases de um processo de digitalização?
4. Qual deve ser a frequência de amostragem de um sinal?
5. No processo de conversão A/D, qual deve ser o número de bits a utilizar?
6. A codificação de um sinal quantificado é feita em PCM ou em PAM?
7. Quais as duas etapas para converter um sinal digita em analógico?
8. Faça um cálculo muito rápido para determinar quantos bits/s tem um sinal de áudio
(mono) amostrado a 44,1KHz com 16 bits por amostra.
9. Faça um cálculo muito rápido para determinar quantos bits/s tem um sinal de vídeo
amostrado a 8 bits por amostra com a frequência de amostragem de 13,5MHz para a
componente de luminância e de 13.5 MHz para as componentes de crominância.
10. Quais são os cinco sistemas DVB mais importantes?

Capítulo
Capítulo 2 - Compressão
O fluxo de bits obtido pela conversão A/D, tal como descrito no
Capítulo 1, é tão grande que seria tecnicamente impossível transmitir
imagens vídeo ou áudio Hi-Fi. Torna-se assim imprescindível proceder à
redução desse débito binário mas de uma forma tal que não afecte a
qualidade final da imagem e do som. Este capítulo analisa as técnicas de
compressão utilizadas para produzir um sinal comprimido, obedecendo
às normas MPEG-2.
2.1. Introdução à Compressão
Quantos bits são precisos para transmitir um minuto de áudio digital? Quanto tempo
de um sinal de vídeo digital é possível armazenar num CD-ROM?
Se tentarmos guardar um sinal de vídeo digital contendo todos os bits que foram
obtidos após a conversão A/D, um CD-ROM ficará cheio com apenas cerca de 30 segundos
de imagem e som.
É evidente que necessitamos comprimir ou seja, reduzir o fluxo binário antes de o sinal
digital ser transmitido ou armazenado. Comprime-se para POUPAR dinheiro. A poupança
pode estar na capacidade de armazenamento, na largura de banda de transmissão ou na
quantidade de fita necessária.
2.1.1. O que é comprimir?
Comprimir é eliminar o que não faz falta.

Um bom exemplo de compressão é a linguagem utilizada nas mensagens SMS. Frases
como “o ké que tb keres fz hj?” são perfeitamente compreendidas embora lhe faltem
letras ou algumas letras tenham sido substituídas por outras mas abreviadas.
A eficiência de um esquema de compressão é indicada pela sua taxa de compressão

que é calculada dividindo o número total de bits inicial pelo número final de bits depois da
compressão. No exemplo da SMS anterior, a frase original tinha 37 caracteres (letras e
espaços) enquanto a frase comprimida tem apenas 24 caracteres. A taxa de compressão é
de 37/24= 1,54 ou dito de outro modo, é de 1,54:1
Da mesma forma, um sinal de TV de 200Mb/s, que tenha sido reduzido para 20Mb/s,
teve uma taxa de compressão de 10:1
Não é necessário receber toda a mensagem para que ela seja compreendida; o nosso
cérebro actua como um descodificador e repõe as partes em falta, distinguindo entre
informação e redundância.
Considera-se INFORMAÇÃO tudo aquilo que o descodificador não pode obter a partir
dos dados que já lhe chegaram, estão chegando ou chegarão.
Tudo o que pode ser obtido a partir de dados passados presentes ou futuros, não é
informação, é REDUNDÂNCIA.
A diferença entre informação e redundância é a ENTROPIA, ou seja, a quantidade de

informação que uma imagem contém é a sua entropia. Se uma imagem tem os pontos todos
iguais, a sua entropia tem valor 0. Se os pontos forem todos diferentes a entropia é de 1.
Na Figura 2-1, representam-se duas imagens. A imagem do rosto tem menos entropia
que a imagem da paisagem, pois a quantidade de objectos (pormenores únicos -
informação) é bastante menor.
Figura 2-1 – Exemplos de Entropia

Em conclusão, comprimir consiste em separar e eliminar a REDUNDÂNCIA que todo o
sinal (vídeo ou áudio) contém e deixar ficar só a INFORMAÇÃO.
2.1.2. Porquê comprimir?
Para compreender a necessidade dos formatos de compressão vamos exemplificar com

o processo de digitalização do vídeo analógico cujas normas constam da ITU-R BT.601-2,
uma recomendação definida pelo organismo que rege os standards de telecomunicações a
nível mundial (ITU).
O vídeo analógico tem no sistema PAL, 25 imagens por segundo e 625 linhas por
imagem, das quais apenas 576 linhas contêm informação vídeo. As restantes linhas são
utilizadas para sincronismo e teletexto e portanto não fazem falta quando se converte o sinal
analógico em digital.
A norma ITU-R BT.601-2 estabelece que o formato a digitalizar é de 576 x 720 isto é,
576 linhas horizontais, com 720 pontos (pixels) por linha.
O processo de digitalização é indicado na Figura 2-2.

Clock
Sinc
Filtros 6,75 13,5
Amplifi. MHz
passa-baixo MHz
Y Y 8 bits
R ADC Y
R-Y 13,5
Matriz
R-Y
Comutador
G MHz
8 bits
B-Y ADC
B-Y Cr e Cb
B
Figura 2-2 – Digitalização de um sinal vídeo PAL
O sinal da câmara de filmar, tem na sua saída o formato RGB (red-green-blue). Por
meio de uma matriz de resistências é possível converter este formato RGB para o formato
YUV, que caracteriza a transmissão da TV a cores. A componente Y é a luminância (escala
de cinzentos), sendo as componentes U=R-Y e V=B-Y as componentes de crominância.
Embora não seja transmitida a componente G (green) ela pode mais tarde ser obtida a
partir das componentes Y, U e V.

Cada amostra de cor codificada em Y-U-V é amplificada e em seguida filtrada para
eliminar as componentes de frequências superiores.
A componente Y é amostrada a 13,5MHz e as componentes U e V são amostradas a

6,75MHz, cada. O valor de 13.5MHz foi escolhido por ser o menor múltiplo comum
(2.25MHz) entre os sistemas PAL e SECAM (625 linhas/25 quadros) e o sistema NTSC (525
linhas/30 quadros).
Cada amostra é depois codificada (digitalizada) a 8 bits e as componentes digitalizadas

passam a designar-se por Y-Cr-Cb.
É agora possível calcular a fluxo binário correspondente a 1 segundo de vídeo:
 Luminância (Y): 13.500.000 amostras/s x 8 bits = 108.000.000 bits/s

 Crominância red (Cr): 6.750.000 x 8 = 54.000.000 bits/s
 Crominância blue (Cb): 6.750.000 x 8 = 54.000.000 bits/s
Um segundo de vídeo digitalizado tem a soma destas três componentes:
108.000.000  54.000.000  54.000.000  216.000.000 bits / s

Como um CD pode conter 650 Mbytes x 8 bits = 5.200.000.000 bits, ele pode
armazenar.... apenas..... 24 segundos de vídeo!!!
5 .200 .000 .000  216 .000 .000  24 segundos de vídeo

Deste exemplo é fácil concluir que se não fossem as técnicas de compressão, ainda
hoje não haveria Televisão Digital! A TV DIGITAL só é possível porque essas técnicas de
compressão PERCEPTIVA, (assim chamada porque a perda de informação sofrida durante o
processo de compressão, não será perceptível pelo sentido de Visão Humana), permitem
reduzir, dramaticamente, o enorme fluxo binário obtido à saída dos conversores A/D.
2.1.3. Tipos de compressão
Curiosamente, toda a compressão se baseia em princípios matemáticos. Muito antes da

electrónica utilizar técnicas de compressão, já os matemáticos tinham feito estudos e obtido
os algoritmos necessários. Por isso, até talvez mais do que à electrónica, a TV Digital deve a
sua existência à matemática e aos matemáticos.
Actualmente, com tanta pesquisa feita na compressão de sinais vídeo e áudio, existem
dezenas de técnicas de compressão e torna-se realmente difícil inventar algo novo neste

campo. Contudo, curiosamente, não há um tipo ideal de compressão, pelo que para cada
caso específico se escolhe o mais indicado.
Basicamente há dois tipos genéricos de algoritmos de compressão:
 sem perdas
 com perdas
Como os nomes sugerem, um algoritmo sem perdas reconstituirá o sinal bit a bit no
processo de descompressão enquanto que usando um algoritmo com perdas, não será mais
possível obter o sinal original. De um modo geral, na compressão com perdas, quanto maior
for a taxa de compressão, menor será a qualidade final da imagem.
A Figura 2-3 mostra como a um sinal de vídeo, já sob a forma binária Y-Cr-Cb, são
aplicados algoritmos de compressão. Repare-se que um mesmo sinal pode ser sujeito a
vários tipos de compressão em sequência.
Técnicas de Compressão
com e sem perdas
1 2 n
Vídeo Bitstream
IN Algoritmos de OUT
Y, Cr, Cb alinhamento
Compressão
(s/ compressão) (c/ compressão)
Figura 2-3 – Compressão de um sinal vídeo
Depois da compressão, os bits são alinhados em série (Bitstream) segundo uma

determinada sequência que possa ser, mais tarde, facilmente interpretada no descodificador.
Os bits são sempre alinhados em série nos sinais MPEG, e isso tem a ver com o facto de que
os vários canais de transmissão de sinal (cabo coaxial, antenas, etc) apenas permitem sinais
em série.
Embora a Figura 2-3 se refira apenas à compressão de um sinal de vídeo, o sinal de

áudio também tem que ser sujeito a técnicas de compressão, embora diferentes daquelas
que são utilizadas para o sinal de vídeo.
A explicação dessas diferenças baseia-se em que os nossos sentidos são muito mais
exigentes na reprodução do som do que na reprodução da imagem, ou dito de outro modo,
é muito mais difícil “enganar” o ouvido do que a visão.

2.2. Compressão de vídeo
A compressão ideal é obtida quando se elimina apenas a redundância. Contudo, junto

com a redundância, pode também ser eliminada informação, em maior ou menor grau,
dependendo das técnicas de compressão que se utilizem e do débito binário final que se
pretende obter.
2.2.1. Técnicas de compressão
Em termos de sinais de vídeo, existem três tipos de redundância:
 Redundância TEMPORAL (ou interframe): qualquer imagem (frame)

tende a ser parecida com as imagens anterior e posterior no tempo.
Assim, em vez de transmitir a nova imagem na íntegra, basta transmitir
apenas as diferenças.
 Redundância ESPACIAL (ou intraframe): qualquer ponto de uma
imagem (pixel) tem alta probabilidade de ser igual aos pontos vizinhos.
Neste caso em vez de transmitir todos os pixels, transmite-se apenas a
informação de que não houve variação. Por outro lado, grandes
variações entre pixels vizinhos podem ser eliminadas porque o olho
humano é pouco sensível a variações de alta-frequência (como por
exemplo sequências de pixels branco-preto-branco-preto…)
 Redundância ESTATÍSTICA: Num sinal que vai ser constituído por
sequências de “0” e “1”’, determinados sequências tendem a repetir-se
ou a terem maior probabilidade de ocorrência e podem portanto ser
representadas de forma simples (utilizando menos bits).
No sistema MPEG-2, o esquema genérico de eliminação de redundância (ou seja, o

processo de compressão), pode ser descrito pela Figura 2-4.
Redundância Temporal Redundância Espacial Redundância Estatistica
DPCM DCT VLC e RLC

OUT
IN + Codificador de
 DCT
Entropia
Imagem a
comprimir
-
Imagem para
comparação
Figura 2-4 – Compressão MPEG-2

Os dois primeiros tipos de compressão têm perdas e o último é sem perdas.
Repare que primeiro vem a redundância temporal porque se primeiro alterássemos

uma imagem quando ela fosse comparada com a seguinte já seria uma comparação falsa
No final deste capítulo mostra-se o diagrama de blocos completo de um codificador

MPEG-2, mas por agora, analisemos apenas cada uma das partes da Figura 2-4
2.2.1.1. Redundância Temporal
A eliminação da redundância temporal é o processo que mais comprimirá a imagem.

Utiliza a comparação com imagens anteriores e/ou posteriores e mediante técnicas de
estimação do movimento, deduz-se qual é a posição do pixel na imagem actual. A técnica
mais utilizada para fazer esta compressão é a DPCM (Diferential PCM) e o esquema do
codificador DPCM é o indicado na Figura 2-5.
IN + OUT
 QUANTIFICADOR
Imagem a Imagem
comprimir - comprimida
PREDITOR 
Figura 2-5 – Codificador DPCM
O codificador é composto por duas partes principais:
 Quantificador: faz a quantificação do sinal, isto é, atribui um

determinado valor binário ao sinal.
 Preditor: faz a comparação entre a imagem actual e as imagens
anteriores, de forma a prever a nova posição de cada um dos pixéis.
Assim, em vez de transmitir os bits da imagem, transmitem-se apenas
vectores com a informação de qual a posição futura dos pixéis, o que é
muito mais rápido e necessita menos bits (estimação de movimento).
A estimação do movimento (ou predição de movimento como por vezes é designada),

é a parte mais importante da compressão MPEG-2 porque o máximo factor de compressão é
obtido aqui. Não é pois de admirar que muito do esforço das equipas que trabalham com o
MPEG-2 se concentrem no aperfeiçoamento das técnicas de estimação de movimento,
tentando descobrir preditores cada vez mais eficientes, quer em termos de resultados

(minimização da informação a transmitir) quer em termos de tempos de execução das
operações.
Existem vários tipos de preditores cada um com vantagens e desvantagens, mas o

objectivo é sempre o mesmo: obter um erro mínimo e no menor tempo possível.
2.2.1.2. Redundância Espacial
O método utilizado para eliminar a redundância espacial (os pixels adjacentes serem
muito semelhantes entre si) recorre a um artifício matemático bastante pesado, (mas
extremamente eficiente) designado por DCT (Discrete Cosinus Transform ).
Na prática, a imagem é dividida em pequenas regiões, que se designarão por blocos.

Cada bloco é composto por 8x8 pixels que são analisados globalmente.
Mediante a DCT, é possível analisar se há ou não variações de intensidade luminosa

entre pixels adjacentes e transformar essas variações de intensidade em variações de
frequência para em seguida eliminar as frequências mais altas aproveitando o facto de que
o olho humano é pouco sensível a variações de alta-frequência.
A Figura 2-6 mostra uma imagem de TV e alguns exemplos de blocos DCT em

diferentes zonas da imagem e representa também um bloco 8x8 ao qual foi aplicada a DCT e
onde os coeficientes de intensidade luminosa foram reorganizados em frequência.
Frequência mais
baixa (DC)
Frequência mais
alta
Figura 2-6 – Altas e baixas frequências obtidas na DCT
Para melhor compreender este processo observe o exemplo da Figura 2-7 onde, para
maior facilidade, em vez dos blocos de 8x8 (64 células) que se utilizam na realidade,

utilizaremos blocos de apenas 4x4 (16 células).
Iremos considerar o caso da luminância (Y), mas a crominância teria um tratamento

exactamente igual.
Figura 2-7 – Princípio geral da DCT – fundo uniforme
A imagem mostra um comboio e o bloco que vai ser analisado contém apenas céu.
Trata-se de uma zona uniforme em que não há variação entre pixels adjacentes pois todos
são iguais.
A cada um desses pixels atribui-se um número representando a sua intensidade

luminosa (luminância) média. Neste caso vamos admitir que a luminância de cada pixel é de
16 e portanto todas as células terão o valor 16 nas coordenadas de espaço.
Para passar das coordenadas de espaço para as de frequência procuram-se as

variações de intensidade entre pixels adjacentes. Como não há variação entre pixels, então
as correspondentes coordenadas de frequência terão todas o valor 0.
O coeficiente DC (célula superior direita) que representa a média da luminância do

bloco será neste caso de 256, valor obtido multiplicando o número de pixels (16) pelo valor
da luminosidade de cada um (16).
Contudo o caso mais habitual é haver variações entre pixels de um bloco, tal como
indicado na Figura 2-8.
A parte inferior dessa região, onde se encontra a parte de cima da chaminé da

locomotiva, mais escura do que resto, é a causa dos quatro valores numéricos relativamente
fracos da linha inferior da tabela (49, 33, 9 e 0). Do mesmo modo, os valores mais elevados

da parte alta correspondem ao fundo mais claro (149, 120, 79, 49).
Figura 2-8 – Princípio geral da DCT – fundo variável
A DCT aplica-se então aos dois conjuntos de valores digitais; dois porque o cálculo se
efectuará tanto no sentido vertical como horizontal. Tal consistirá em transformar sequências
de números adjacentes noutras sequências que deverão traduzir a maior ou menor
velocidade (frequência) de variação da luminância de um pixel para o pixel vizinho.
Para ser exacto, é preciso especificar bem que com essa nova representação, se for
ordenada segundo uma tabela, como a das luminâncias, não se trata mais duma questão de
pixels segundo a DCT; são apenas números ordenados designados por coeficientes de saída.
De assinalar que o coeficiente situado no canto superior esquerdo, com o seu valor de
120, contém uma informação importante. Esse coeficiente representa a média da luminância
da região que observamos, a colecção de pixels situados próximo da chaminé.
O termo "médio" é utilizado aqui para descrever com a menor imprecisão possível o
que se passa realmente. Para ser mais rigoroso, o algoritmo matemático utilizado para
calcular os termos da DCT faz a soma das luminâncias dos pixels, pois fornece como
resultado um número inteiro proporcional à média. Neste exemplo, cada valor de saída foi
reduzido por um factor de 8, e não de 16, como poderia sugerir o número de casas da
tabela, de modo a conservar como resultados um conjunto de números inteiros, mas de
grandeza razoável. É por isto que este primeiro número parece, à primeira vista, um pouco
elevado para um valor médio.
Por outro lado, na parte baixa da tabela podem observar-se coeficientes de fraco valor
absoluto, 1 e -1, por exemplo. A interpretação que pode ser feita, no quadro deste tipo de

codificação, é a ausência, relativa, da mudança brusca de luminâncias nessa parte da
imagem, dum pixel para outro. Naturalmente que há mudança, mas pequena ou a um fraco
ritmo espacial.
Assim, a representação por DCT fornece uma ferramenta para a etapa seguinte de
codificação. No entanto, a DCT não reduziu o número de dados, subsistindo 128 bits (8 bits
x 16 pixels na rede da esquerda, contra 8 bits x 16 células na da direita). Pelo menos tem-se
a certeza de que este processo não degrada a imagem...
Figura 2-9 – Quantificação das componentes DCT
Agora, trata-se de requantificar os coeficientes encontrados anteriormente, de modo a

minimizar os erros que poderiam ser visíveis pelo sistema de visão humana.
Neste exemplo isso será relativamente simples; aplica-se um simples factor de

quantificação (redução) da ordem de 12 à DCT. Neste caso, o número chave que determina
o passo de requantificação aceitável é a média da luminância, contida na primeira célula DCT
(120). Notar o número crescente de resultados zero à medida que nos afastamos do canto
superior esquerdo.
Este processo ajuda, efectivamente, à redução do débito, sendo dividido por dois o
número de bits atribuídos à descrição desta parte da imagem; são necessários 4 bits para a
codificação do valor DCT máximo (10) em vez dos 8 requeridos para a codificação do valor
original de 120.

2.2.1.3. Redundância Estatística
A base da eliminação da redundância estatística recai no facto de que há símbolos

(agrupamentos de bits) que se repetem constantemente. Portanto, a intenção é a de
enviar estas sequências que se repetem com o menor número possível de bits.
Como se consegue isso? Com o uso do código de comprimento de segmento (Run

Lenght Code (RLC) e com códigos de comprimento variável (VLC), como por exemplo o
código. Estas duas técnicas comprimem as imagens por um factor menor que nos passos
anteriores mas têm a vantagem de serem totalmente reversíveis.
a) Codificação RLC
Os coeficientes provenientes da matriz obtida pela DCT, em vez de serem transmitidos

por linha a linha como seria previsível, são "varridos" segundo um caminho em ziguezague e
colocados em série (ver Figura 2-10)
Figura 2-10 – Eliminação de redundância estatística por RLC e VLC
Este processo de análise oblíqua da matriz DCT pode parecer bizarro mas é muito útil
porque as células do bloco que ficam mais junto do canto inferior direito têm normalmente
valor de zero porque representam as componentes de alta-frequência que o olho não
detectará.
O movimento em ziguezague é assim um método de deslocamento que, partindo do

valor médio (DC) origina longas sequências de zeros.
No nosso exemplo, o valor obtido depois do zigzag é:

10, 5, 5, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0
Repare que no final da sequência há 11 zeros seguidos. A técnica RLC não vai
transmitir estes zeros mas sim apenas uma instrução EOB (end of block) que informará o
descodificador que a partir desse momento todos os coeficientes da matriz são zero.
A transmissão utilizando a VLC será feita aos pares da seguinte forma:
10
0, 5
0, 5
1, 1
EOB
O primeiro termo (a vermelho) indica o número de zeros que há entre o dado anterior
e a que aparece no segundo termo. Como a maioria dos coeficientes a transmitir é zero, isto
reduz substancialmente o número de dados e origina uma enorme economia no tempo de
transmissão.
b) Codificação VLC – código Huffman
No exemplo anterior (Figura 2-10) o coeficiente “5” aparece duas vezes enquanto o
coeficiente “10” ou o coeficiente “1” só aparece uma vez.
A VLC é um processo de compressão que utiliza uma técnica parecida com a do código
morse. No morse, as letras mais utilizadas são representadas por apenas 1 ou dois traços e
pontos. As letras menos utilizadas são as mais compridas podendo ter até 6 traços ou pontos
O que se faz é estudar qual a probabilidade de ocorrência de um determinado símbolo.

Quanto mais provável de ocorrer menos bits serão utilizados para a sua transmissão.
Existem vários códigos que fazem esta operação mas o mais utilizado em TV digital é o
código de Huffman a partir do qual se poderia fazer a tabela seguinte.
Probabilidade de
Símbolo Palavra Codificada
ocorrência
S0 0,41 0
S1 0,25 100
S2 0,14 110
S3 0,10 111
S4 0,08 1010
S5 0,07 1011
Na Figura 2-10 o nosso exemplo, como o símbolo “5” aparece 2 vezes seria o de maior
probabilidade transmitido apenas como “0”. Os outros símbolos (10 ou 1) teriam menor

probabilidade e necessitariam de mais bits.
2.2.2. Estrutura da codificação
A norma MPEG, define uma estrutura hierárquica para que na hora de

enviar as imagens, se possa estabelecer uma certa ordem na transmissão. A
Figura 2-11 mostra a estrutura básica para codificar um sinal de vídeo.
Figura 2-11 – Estrutura da codificação
A unidade elementar de informação é o Bloco (8x8 pixels) podendo ser Y, Cr ou Cb

(Figura 2-11). Coincide com os coeficientes da DCT.
Os blocos agrupam-se para formar o Macrobloco que constitui a unidade

fundamental de uma imagem e que podem se objecto da estimação de movimento. São a
base de cálculo dos vectores de movimento.
Os macroblocos podem ser constituídos por vários blocos Y, Cr e Cb. Na codificação

mais utilizada e que é designada por 4:2:0, cada macrobloco comporta quatro blocos Y
(luminância) e dois blocos de crominância (Cr e Cb). Para tornar possível a identificação do
seu conteúdo (Y, Cr ou Cb), os blocos são emitidos por uma ordem particular.
O agrupamento de vários macroblocos constitui um GOB (group of blocks) ou Slice

(fatia) representando sempre as linhas horizontais que fazem a imagem da esquerda para a

direita. Em MPEG-2, todas as sequências de macroblocos têm que começar e acabar, com,
no mínimo um slice.
O agrupamento de vários slices constitui uma Imagem que é a parte activa de uma
trama (frame). A imagem é a unidade de codificação básica. Conforme veremos a seguir,
as imagens podem ser do tipo I (intraframe), tipo P (predição) ou do tipo B (bidireccionais).
Um conjunto de imagens forma um GOP (Group Of Pictures). Embora não seja

obrigatório, um GOP contém normalmente de 12 a 15 imagens. É a base para realizar a
codificação temporal das imagens.
Finalmente, vários GOPs, formam uma Sequência que basicamente é a unidade

estruturada do sinal MPEG.
2.2.3. Estrutura da compressão
A Figura 2-12 mostra os vários passos da compressão de toda a estrutura.
O Slice pode começar não importa onde e ter um tamanho qualquer. É a unidade
fundamental de sincronização para VLC e DPCM. Os primeiros vectores do slice são emitidos
integralmente enquanto que os outros são transmitidos em modo diferencial.
Um conjunto de slices forma uma Imagem e esta é a unidade de codificação básica

do MPEG-2.
Nível
Tempo Perfil
Vectores
Vector de Globais Aberto / Vectores Matrizes
Sincro IPB Globais Quantização
movimento Fechado
Blocos Macro
de Slice Imagem GOP Sequência
Coeficientes bloco de vídeo
Tamanho da
Tipo de Cor
Imagem
Progressivo Proporções
Entrelaçado da Imagem
Figura 2-12 – Compressão MPEG
As imagens podem ser do tipo I (Intraframe), do tipo P (Predição) e do tipo B

(Bidireccionais).

 Imagens I. São as que se utilizam no início de um GOP. São as imagens onde se
aplicam apenas as técnicas de compressão de redundância espacial e estatística
(ver Figura 2-4). Evidentemente serão as que têm menos compressão mas tem que
ser assim para evitar a propagação de erros. Além disso são imprescindíveis porque
sempre que um utilizador muda de canal, o descodificador vai procurar a referência
de uma imagem I para começar a descodificar a partir dela.
 Imagens P. São obtidas a partir de uma imagem I ou uma outra imagem P de um

dos frames anteriores. Nestas imagens aplicam-se os três tipos de compressão
explicados.
 Imagens B. A razão pela qual o MPEG é um óptimo sistema de compressão é

precisamente por causa das imagens B. Estas imagens que se obtêm a partir da
predição bidireccional (imagens I e P anteriores e futuras) têm um tamanho
reduzido (alta compressão) e melhoram bastante a qualidade do sinal final.
Contudo, isto tem um preço que é o de necessitar buffers maiores e fazer mais
cálculos (o que provoca atrasos).
A Figura 2-13 mostra como as imagens I, P e B estão relacionadas entre si e dá

também uma ideia do factor de compressão que se associa a cada uma.
Figura 2-13 – Relação entre imagens e sua compressão
As imagens podem ser combinadas para constituírem um Grupo de Imagens (GOP

= Group Of Pictures) que começa sempre por uma imagem I.
O GOP é a unidade fundamental para realizar a codificação temporal da imagem. No

MPEG standard a utilização do GOP é opcional mas ela é praticamente imprescindível.
É normalmente constituído por 12 a 15 imagens. Se o número de imagens fosse maior,

os erros de predição seriam cumulativos e seria impossível reconstituir a informação original.
Por isso, há que incluir uma imagem I, normalmente a cada 12 imagens.
A Figura 2-14 mostra como as imagens se relacionam em termos de predição e em

termos de tamanho. Em valores aproximados, uma imagem I tem cerca de 100KB, a
imagem P cerca de 30KB e a imagem B cerca de 10KB.

Não é necessário seguir esta ordem nem ter este número de imagens I, P e B, mas,
em codificação, um GOP começa sempre por uma imagem I e na descodificação pode
começar por uma B ou I mas tem que acabar sempre com uma I ou P.
GOP 1 Predição de movimento para a frente GOP 2
II I
tempo
P P P
B B B B B B B B
Predição de movimento bidireccional
Figura 2-14 – Organização de um GOP
Mas um problema se levanta aqui pois a ordem com que as imagens entram no
codificador não vai ser igual à ordem de saída.
Há imagens que se enviam antes do tempo (quando na realidade se apresentam

depois. Por isso o descodificador terá que as reordenar.
Voltaremos a este problema no Capítulo 3 mas para já, a Figura 2-15 evidencia a
forma como as imagens se ordenam antes e depois da codificação.
Figura 2-15 – Sequência de GOPs no codificador e no descodificador
Um GOP pode ser aberto ou fechado.
Nos GOP fechados, as imagens são descodificadas sem recurso a imagens de outros
GOP, enquanto que, nos abertos, pelo contrário, são necessárias imagens de outros GOP.
De um modo esquemático, o processo é o indicado na Figura 2-16.

Figura 2-16 – GOP fechado e GOP aberto
Sem um cabeçalho, um descodificador não pode interpretar a trama de bits e é por

isso que os cabeçalhos se tornam os pontos de referência onde os descodificadores podem
iniciar correctamente a sua operação. O espaçamento entre pontos de referência influencia
directamente o tempo que o descodificador leva até operar correctamente depois da
mudança de um canal para outro. Este tempo é normalmente muito mais demorado do que
a comutação de canal em televisão analógica.
Vários GOPs podem ser combinados para produzirem uma Sequência de vídeo. A
sequência começa por um código de início de sequência seguido por um cabeçalho e
termina por um código de fim de sequência. No decurso da sequência podem ser colocados
outros cabeçalhos suplementares.
Esta disposição permite começar a descodificação não importa onde tal como acontece
na leitura de um CD por exemplo. O cabeçalho da sequência define o tamanho vertical e
horizontal da imagem, o formato de sub amostragem da cor, a frequência da imagem, o tipo
de varrimento (progressivo ou entrelaçado), o perfil, o nível e o débito de bits bem como as
matrizes de quantificação utilizadas nas imagens intra-codificadas e inter-codificadas.
2.2.4. Levels e Profiles
O MPEG-2 permite a representação de imagens de vários formatos (4:3 ou 16:9),

entrelaçadas ou progressivas, de várias resoluções (4:2:0 ou 4:2:2) e com vários modos de
codificação. Estes aspectos estão contemplados nos chamados níveis e perfis do sistema
MPEG-2.
A norma MPEG-2 prevê seis tipos de Profiles (perfis) que indicam o sistema de
compressão a empregar consoante o tipo de utilização a que se destinam :

 Simple (SP): Videoconferência (pequeno atraso de transmissão)
 Main (MP): Radiodifusão de vídeo
 SNR (SNRP): permite múltiplos graus de qualidade
 Spacially scalable (SSP) : permite múltiplos graus de qualidade e
resolução espacial
 High (HP): Permite múltiplos graus de qualidade, resolução espacial e
formatos de cor
A norma MPEG prevê também quatro Levels (níveis) que são os possíveis formatos
fonte para a codificação e que vão desde a Televisão de baixa definição (LDTV), até à
televisão de alta definição (HDTV), passando pela televisão de definição standard (SDTV) e
pela EDTV (16:9 PALplus), cada uma delas com uma certa margem de bitrates possível.
 Low: Low definition TV (LDTV)

 Main: SDTV
 High-1440: EDTV
 High: HDTV (high definition TV)
A Figura 2-17 mostra as várias combinações possíveis de perfis e níveis tal como
definidos pelo MPEG-2.
MP@HL HP@HL
4:2:0 4:2:0,4:2:2
HIGH 1920x1152 1920x1152
80Mb/s 100Mb/s
I,P,B I,P,B
MP@H14 SSP@H14 HP@
4:2:0 4:2:0 4:2:0,4:2:2
HIGH
L 720x756 1140x1152 1440x1152
1440 15Mb/s 60Mb/s 80Mb/s
E
I,P,B I,P,B I,P,B
V SP@ML MP@ML SNR@ML HP@ML
E 4:2:0 4:2:0 4:2:0 4:2:0,4:2:2
MAIN 422P@ML
L 720x576 720x576 720x576 720x576
15Mb/s 15Mb/s 4:2:0 15Mb/s 15Mb/s
I,P I,P,B 720x576 I,P,B I,P
MP@LL 15Mb/s SNR@LL
4:2:0 I,P,B 4:2:0
LOW 352x288 352x288
4Mb/s 4Mb/s
I,P,B I,P,B
SIMPLE MAIN SNR SPATIAL HIGH

4:2:2
PROFILE
Figura 2-17 – Levels e profiles em MPEG-2
Em paralelo, perfis e níveis determinam pontos de conformidade aos quais os

desenhadores de descodificadores têm que aderir.

Repare que nem todas as combinações de perfis e níveis são possíveis pois apenas as
representadas na figura são viáveis. Qualquer perfil, é sempre compatível com os de nível
inferior.
O perfil simples (SP) e o perfil principal (MP) são os que estão destinados a vídeo não
escalável com qualidade boa a alta.
O SP não utiliza imagens B e portanto não tem predição nem necessita de

reordenação de imagens. Torna-se assim um sistema onde o processamento é muito rápido
e portanto é o sistema ideal para aplicações onde os tempos de atraso sejam muito críticos,
como por exemplo em vídeo-conferência.
O Main Profile (MP), está destinado às aplicações onde o atraso das comunicações não
é muito crítico e tem melhor qualidade que o SP, por ser mais elaborado na técnicas de
compressão (predição bidireccional por exemplo). O MP, em conjunto com o Main Level
(ML), forma o MP@ML, que se utiliza actualmente em televisão. O MP também permite a
emissão HDTV (MP@HL).
Os perfis escaláveis (SNR e SS) saem fora do âmbito deste manual. Genericamente
permitem que o sinal de vídeo seja partido em duas ou mais qualidades o que permite
melhorar a relação sinal ruído (SNR) ou a resolução espacial, passando de SDTV para HDTV.
Estes perfis são muito complicados de realizar tecnicamente e como tal seriam demasiado
caros para o mercado pelo que a televisão digital não os considera.
Apesar da norma MPEG-2 já estar definida, continua a trabalhar-se para a adaptar aos
novos requisitos como por exemplo a emissão de filmes em 3D e que poderia ser também
aplicado por exemplo em electromedicina.
2.2.5. Codificador MPEG-2
Até este momento, vimos o processo de compressão de imagens por separado. Agora
é o momento adequado de resumir tudo o que se explicou.
A Figura 2-18 mostra o diagrama de blocos de um codificador MPEG-2
No primeiro bloco, (bloco 1) realiza-se a compressão interframe, eliminando-se assim

a redundância temporal. O primeiro processo é passar do sinal 4:2:2 da recomendação ITU-
R 601 (a 270Mbps) para um sinal 4:2:0. A partir deste sinal, entram no preditor de

movimento, que, juntamente com uma imagem de referência (formada por imagens I e P),
produzirá os vectores de movimento da imagem. Estes, juntamente com a imagem de
referência, produzirão a imagem de predição que se armazena num buffer. A diferença entre
o frame 4:2:0 e a imagem estimada cria um sinal de mais bits que será transformado em um
de menos bits (compressão de 1:2). Se o valor quadrático médio dos pixels de entrada é
inferior ao da imagem de predição, a compressão interframe não se realizará e passar-se-á
directamente para a compressão intraframe. O precditor de movimento enviará o tipo de
movimento da imagem estimada para o descodificador ou lhe dirá que é do tipo intraframe.
O bloco 2 é a compressão intraframe, isto é, a eliminação da redundância espacial.

Como se pode ver, primeiro efectua-se a DCT e posteriormente a quantificação dos
coeficientes da matriz resultante com a matriz de ponderação. Os coeficientes da matriz de
ponderação são enviados ao receptor sempre que variem.
1 2 3 4
Control de Fluxo
Matriz Quantificação
4:2:2 +
IN a  DCT Q
Codificador de
Entropia
MUX Buffer
4:2:0
- Quantificador Dados
Comprimidos
Q-1
Imagem
estimada
DCT-1
Armazenamento 
de imagens
Control e
Vectores de Armazenamento
Movimento de imagens de
referência
Armazenamento Vectores de Movimento
de imagens
estimadas Control do Grupo de Imagens
Figura 2-18 – Codificador MPEG-2 MP@ML
No bloco 3 efectua-se a eliminação da redundância estatística. O codificador envia

para o receptor a informação sobre a matriz de coeficientes transformados e quantificados, a
informação dos símbolos utilizados pela VLC, etc.
Por último, no bloco 4 faz-se a multiplexagem da sequência de vídeo comprimido, dos

vectores de quantificação e dos coeficientes da matriz de quantificação. A saída do Mux vai
para um buffer para dar ao sinal um bitrate constante. O Buffer controla o quantificador e
também controla o tipo de imagem que se vai produzir.
2.2.6. Descodificador MPEG-2
A Figura 2-19 mostra o diagrama de blocos de um descodificador MPEG-2 (MP).
Os bits que chegam ao bloco 1 são os que provêem da desmultiplexagem do sinal no

receptor e estão sob a forma de bitstream MPEG-2. Passam para um buffer para assim dar
um bitrate constante ao descodificador. A seguir encontram um desmultiplexer e um
descodificador de entropia.
O desmultiplexer será encarregado de separar os dados de vídeo dos que dados

referentes à descompressão (vectores de movimento, tipo de imagem e sua compressão e
matriz de quantificação, etc). A seguir os dados passam para o descodificador de entropia
(VLC e RLC).
1 Tipo de
Imagem
Inter
Intra
2
IN
Descodificador
Buffer Desmultiplexer
de Entropia
Q-1 DCT-1
Saída de
Vídeo
Info para o Preditor Inter
Intra
Escala
Quantificador 
3 Armazenamento da
Info do Desmultiplexer
SW
imagem futura Inter
Intra
Tipo de
Preditor de
Imagem
SW Compensação de
Movimento
Armazenamento da
imagem anterior
Figura 2-19 – Descodificador MPEG-2 (MP@ML)

No bloco 2 realiza-se a desquantificação e a DCT inversa.
No bloco 3 realiza-se a compensação de movimento. O sistema armazena as imagens

anteriores e posteriores para poder realizar a estimação das imagens B e P a partir das
imagens I ou P.
2.3. A Compressão Áudio MPEG
Até agora falámos apenas de compressão de vídeo, mas claro que o som também
tem a sua quota-parte neste processo. O sinal de áudio, depois de digitalizado, e ao
contrário do que se possa pensar, ocupa uma largura de banda muito grande. Por exemplo,
um sinal áudio estéreo, amostrado a 44,1KHz por canal e em seguida quantificado a 16 bits
por amostra (qualidade CD), dá um fluxo de:
44.100 x 16 x 2  1.411.200 bits / s

Este valor é anormalmente alto, se comparado com a largura ocupada por um sinal de
vídeo depois de comprimido (apenas 2 a 6 Mb/s) e seria muito maior se em vez de 2 canais
estéreo fossem transmitidos sinais Dolby surround (5 canais).
É portanto necessário comprimir mas manter um áudio de qualidade (a melhora de

qualidade é uma das razões de ser da TV digital).
O grupo MPEG, aceitou 14 propostas para sistemas de codificação de áudio,

seleccionou 4 e no final escolheu o sistema “MUSICAM” que depois de testes e
melhoramentos, foi aceite como norma MPEG de áudio monofonico e estereofónico em
1993. A partir daí, o standard MPEG desenvolveu vários standards de compressão áudio e o
comité DVB decidiu utilizar as normativas ISO/IEC 11172-3 (MPEG-1 áudio) e ISO/IEC
13818-3 (MPEG-2 áudio).
A união internacional de telecomunicações (ITU) criou uma normativa que definiu 3

camadas para o MPEG áudio. As 3 camadas têm uma qualidade similar mas o que as
diferencia é a complexidade do descodificador. A camada 1 (layer I), tem uma baixa
complexidade. A camada 2 (layer II) é mais complexa e acabou por ser a adoptada nas
transmissões de vídeo. A camada 3 (layer III) é a base do popular formato MP3 (não
confundir com MPEG-3). Tudo isto se compilou na recomendação ITU-R BS.1115 que é a
que se aplica directamente ao sinal DVB.

Mais tarde, no ano 1997, o MPEG-2 melhorou as suas prestações, criando uma
compatibilidade com o sistema AC-3 (dolby prologic) que os americanos entretanto
adoptaram.
2.3.1. O mecanismo da audição
O grande princípio da compressão áudio: "Nunca transmitir o que não se pode ouvir"
É surpreendente constatar que a audição humana e particularmente em estéreo tem

um poder de descriminação muito superior ao do vídeo pois enquanto que no vídeo uma
gama dinâmica de 48dB era mais que suficiente, no áudio, a gama dinâmica é de 96dB. Por
isso a compressão áudio tem que ter mais alguns cuidados que não eram necessários na
compressão vídeo.
Felizmente, o sentido auditivo também pode ser enganado. A compressão do áudio

elimina sons que a resposta psicoacústica do ouvido não distinguiria.
Na audição, chama-se mascaramento ao efeito pelo qual, um tom que é muito próximo
a outro mas de menor amplitude, não será ouvido. O tom de menor intensidade é portanto
“mascarado”, desde que fique na zona de mascaramento do tom principal (Figura 2-20)
Nível Tom
dB mascarador
Tom
mascarado
Limiar de
mascaramento
0,5 1 1,5 2 4 KHz
Figura 2-20 – Efeito de mascaramento
Este fenómeno existe para todos os tipos de sinais de áudio, e cada som tem a sua
respectiva curva de limiar de mascaramento que faz com que os sons dentro dessa curva
não sejam ouvidos. Estamos assim perante um sistema totalmente dinâmico pois o som está
sempre a mudar ao largo do tempo e portanto só as frequências mais intensas serão ouvidas
já que as outras ficam mascaradas. É precisamente este efeito que vai ser utilizado para
comprimir o débito binário de áudio.

2.3.2. Codificador áudio
Como se pode ver na Figura 2-21 que representa um codificador de áudio MPEG
simplificado, o sinal de entrada (na forma PCM) é trabalhado num modelo psico-acústico que
determina os limiares de mascaramento de cada banda espectral.
Em paralelo com esta informação, o sinal passa através de um filtro onde todo o
espectro audível (de 18 Hz a 22 KHz aproximadamente) é dividido em 32 bandas. Cada uma
destas bandas será quantificada e codificada segundo a curva de resposta do modelo psico-
acústico calculado.
Filtro Factor de
IN separador escala e
32 bandas quantificação
OUT
Codificação e MUX
atribuição
Limiares de dinâmica dos
mascaramento factores de
escala e de
bits
x32
Figura 2-21 – Codificador áudio Mpeg-2 Layer II
Posteriormente o sinal assim obtido vai a um multiplex onde lhe são adicionadas as
informações de transmissão (qual a camada, frequência de amostragem, preenfase utilizada,
etc.).
2.3.3. Descodificador
A finalidade dos descodificadores áudio é que, tal como para os descodificadores de

vídeo, tenham uma complexidade baixa para que sejam economicamente acessíveis ao
grande público. Desta maneira, os codificadores e os descodificadores podem ser feitos em
separado e as melhoras no campo da compressão que se possam introduzir nos
codificadores serão perfeitamente compatíveis com os descodificadores.
Na Figura 2-22 mostra-se um exemplo de um descodificador que vai fazer as

operações inversas das que tinham sido feitas no codificador.
Detector 32 factores de escala

de
IN Sincron. Filtro de
MPEG x32 32 OUT
layer 1 entradas
DEMUX
32 tramas áudio
X
Afectação dos bits
Figura 2-22 – Descodificador áudio MPEG layer 1
A palavra de sincronismo é detectada pela base de tempos que deserializa os bits de

afectação e os dados do factor de escala. Dá-se então a desmultiplexagem das tramas de
áudio.
A requantificação inversa e a multiplicação pelo inverso do factor de compressão são

aplicadas de forma a levar o nível de cada banda ao seu valor correcto. As 32 bandas são
em seguida reagrupadas num filtro de recombinação para restabelecer a saída áudio.
2.3.4. Camadas (Layers)
Como se disse anteriormente o áudio MPEG, está normalizado segundo 3 camadas

(layers 1, 2 e 3)). Estes números indicam a ordem crescente de complexidade do
codificador, em termos de nível de compressão, sensibilidade a erros e o atraso na
produção do sinal codificado. Os débitos binários que se conseguem são de 32 a 192 kb/s
para o áudio mono e de 64 a 384 kb/s para o áudio estéreo.
O DVB adoptou a utilização das camadas 1 e 2 para a codificação do som estere e

normalizou as seguintes frequências de amostragem: 32 KHz, 44.1 KHz e 48 kHz.
A camada 3, tem um grau de compressão maior, mas não está a ser utilizada no DVB
por não se justificar. A sua utilização tem sido restringida à Internet onde o MP3 teve (e
tem) o sucesso que todos conhecemos sobretudo por em média reduzir em cerca de 20x o
tamanho original de uma música em CD e sem perda aparente de qualidade.
2.3.5. Áudio multicanal
Os sistemas modernos de som começam a fazer cada vez mais utilização do som

envolvente em detrimento do habitual estéreo. Por isso não é de estranhar que também no
mundo digital do DVB se caminhe nesse sentido. A norma que rege o áudio 5.1 (5 canais
elementares + 1 subwoofer) é a recomendação ITU-R 775.
A aplicação deste sistema abrange, além dos 5 canais de áudio e subwoofer, 7 canais
de comentários, que podem ser utilizados para versões multilingues isto é, versão original de
um filme e versões dobradas noutros idiomas.
Em linhas gerais, a Figura 2-23 mostra um codificador e descodificador MPEG-2.
O codificador MPEG-2 funciona da seguinte maneira. Os 5 canais de áudio juntam-se

para formar um sinal estéreo normal mais 3 de informação extra (centre, surround esquerda
e surround direita) que são introduzidas, juntamente com a informação de subwoofer no
campo de dados auxiliares do MPEG-1 que será ignorado no descodificador MPEG-1. Um
descodificador MPEG-2 receberá toda a informação e separará os canais de áudio
estereofónicos dos de dados auxiliares recuperando assim a codificação original 5.1
Figura 2-23 – Codificador e descodificador MPEG-2
- Para som multicanal, DVB adoptou unicamente o MPEG-2 layer II.
- MPEG-1 apresenta compatibilidade com a codificação Dolby Pro-Logic. Isso é

devido a que la informação do canal central está somada em fase aos sinais esquerdo e
direito. A informação de surround está presente como uma soma desfasada com os sinais
esquerdo e direito. Para que possa haver compatibilidade MPEG-1 / Dolby Pro-Logic, o
codificador MPEG tem que preservar a fase e a amplitude dos sinais esquerdo e direito ao
longo de todo o processo de codificação. Isso é assegurado na codificação MPEG que se
limita acima dos 8 KHz, já que toda a informação surround está contida até aos 7 KHz.
A compatibilidade está assegurada em som estereofónico e som multicanal 5.1 tal

como exemplificado na Figura 2-24.
Figura 2-24 – Compatibilidade MPEG-1/Pro-Logic
O áudio MPEG suporta duas opções de transmissão multilingue do som:
 Enviar cada versão em separado, o que gera um bitrate para cada canal
de 384 kbps. O MPEG garante o perfeito sincronismo entre os dois canais
 Há a possibilidade de codificar 7 idiomas a 64 kb/s cada sobre um áudio
multicanal de 384 kb/s.
Actualmente apareceu uma nova normativa: O MPEG-2 AAC (Advanced Áudio Coding)
que proporciona som multicanal de alta qualidade a 64 kb/s. É mais eficiente que o MP3 mas
tem o inconveniente de não ser compatível com MPEG-1. Tem a capacidade de 48 canais de
áudio principais, 15 canais LFE (Low Frequency Enhancement), 15 streams de dados e tem
capacidade multilingue. Este sistema tem a 96 Kb/s a mesma qualidade que o MP3 a 128
Kb/s e que o MPEG-2, layer 2 a 192Kb/s. A sua utilização actual está ainda restrita ao
download de ficheiros de música na Internet (tal como o MP3) mas poderá no futuro vir a
ser aplicado ao DVB.

1. O que é Informação?
2. O que é a entropia?
3. O que são algoritmos sem perdas?
4. Quais os tipos de redundância num sinal de vídeo?
5. Qual a técnica para eliminar a redundância temporal?
6. Qual a técnica para eliminar a redundância espacial?
7. Em que consiste a técnica RLE?
8. Qual a estrutura de um sinal MPEG-2?
9. Quantas imagens tem um GOP?
10. Como se consegue a compatibilidade do MPEG-2 áudio com o MPEG-1 áudio?
11. Como se consegue a compatibilidade do MPEG-2 áudio com o Dolby Pro-Logic?

Capítulo
Capítulo 3 - Multiplexagem MPEG

O MPEG é um pouco como as bonecas russas. Depois de
os sinais vídeo e áudio terem sido comprimidos e formado um
fluxo binário, vão ser fraccionados para serem misturados entre si.
Depois cada programa já multiplexado, volta a ser misturado com
os sinais de outros programas para assim poderem viajar, sob a
forma de bits em série. Cada uma destas camadas de
multiplexagem possui a sua própria sintaxe e pode transportar em
simultâneo, áudio, vídeo e todo o tipo de dados. Este capítulo
destina-se a mostrar como a norma MPEG regulamenta todo o
complexo processo de multiplexagem.
3.1. Introdução à multiplexagem
No capítulo anterior, foi descrita a forma como os sinais de vídeo e áudio podem ser
comprimidos, reduzindo para um débito aceitável, o enorme débito binário obtido na
conversão A/D dos sinais originais.
As normas MPEG definem a forma como esse sinal, que é apenas uma sequência
ordenada de bits em série, deve ser estruturado para que, qualquer RECEPTOR, o possa
interpretar, com facilidade.
O sinal MPEG tanto pode levar um só programa de televisão como conter em

simultâneo programas de TV, de rádio e conjuntos de dados (teletexto, legendas, etc.). Se
não houvesse uma definição perfeita de qual a ordem pela qual os bits são recebidos e qual
o significado de cada um desses bits, ainda hoje não haveria televisão digital...
As normas MPEG, não indicam a forma como o operador deve fazer a compressão nem

o limitam na possibilidade de inventar novas técnicas que permitam melhorar a qualidade de
sinal. As normas estabelecem apenas directivas quanto à forma como os bits se devem
organizar para que possam ser compreendidos pelo receptor, em casa do utilizador final.
Esta é talvez a maior virtude do MPEG e a razão da sua aceitação universal.
A estrutura dos sinais MPEG-2 está regulamentada pela norma ISO/IEC 13818 que
se subdivide em 9 partes das quais as mais importantes são:
 ISO/IEC 13818-1 - Define a estrutura da multiplexagem entre áudio,

vídeo e dados, assim como a sincronização entre codificador e
descodificador (Program Stream e Transport Stream)
 ISO/IEC 13818-2 - Define a sintaxe do sinal de vídeo comprimido (Video
Elementary Stream)
 ISO/IEC 13818-3 - Define a sintaxe do sinal de áudio comprimido (Audio
Elementary stream)
Segundo estas normas, o diagrama funcional do MPEG-2 é o indicado na Figura 3-1
Video data Video ES PES

Packetizer Program Stream
Encoder PS
Mux PS
Audio data Audio ES PES
Packetizer
Encoder
TS Transport Stream
Mux TS
Figura 3-1 – Diagrama funcional do MPEG-2
Repare que os sinais de vídeo e áudio são inicialmente comprimidos/codificados em

separado, conforme já descrito no capítulo anterior.
O resultado desta operação é uma sequência de bits, que o MPEG designa por
ELEMENTARY STREAMS (ES). Existe um ES de vídeo e um ES de áudio.
Cada ES é em seguida “empacotado” (do inglês “packetized”). Esta operação consiste

em adicionar um cabeçalho ao ES, com informações que vão permitir identificá-lo facilmente
porque ele vai ser misturado com outros ES. O ES depois de empacotado designa-se por
PES (Packetized Elementary Stream).

Os PES de vídeo e de áudio são misturados (multiplexados) para se obter uma trama
binária que contém a informação completa.
A multiplexagem pode ser feita de duas formas distintas, dependendo do meio em que
o sinal vai ser utilizado
 PS (Program Stream) – para meios de transmissão livres de ruído ou

erros e quando se pretende transmitir apenas um programa – é o
sistema ideal para armazenamento ou processamento de software
(Exemplo: DVD, HD, CD)
 TS (Transporte Stream) – Para meios de transmissão ruidosos e quando
se pretende transmitir um ou mais programas. (Exemplo: transmissão de
vários programas de TV e rádio via satélite, utilizando o mesmo
transponder)
O Program Stream (PS), está um pouco fora do âmbito deste manual, pois não é
utilizado na transmissão de TV digital. Pelo contrário, o Transport Stream (TS) constitui a
espinha dorsal da Televisão digital e será analisado em detalhe.
A Figura 3-2 mostra em maior detalhe, a criação de um TS de vários programas.
ES PES TS TS
(Transport Stream) (Transport Stream)
(Elementary Stream) (Packetized
SPTS MPTS
Elementary Stream)
VÍDEO
Codificação
Packetizer
vídeo
4Mb/s
3Mb/s
(Vários programas)
(Um só programa)
Transport MUX
ÁUDIO
Program MUX
Codificação 21Mb/s
Packetizer
áudio
192Kb/s
DADOS
Packetizer
01111011
18Kb/s
192Kb/s
PMT PAT
(Program (Program
Map Table) Association
SCR Table)
PCR
(System Clock (Program Clock
Reference) Reference)
Figura 3-2 – Criação do Transport Stream (TS)
Repare que o TS pode conter um só programa (SPTS – single program TS) ou conter
vários programas (MPTS – Multiple Program TS).

Durante a multiplexagem podem ser adicionados sinais de dados, de sincronismo e de
informação, sem os quais o receptor não poderia descodificar o sinal.
A forma como todo este processo se efectua será analisada a seguir, mas convém
chamar a atenção para o facto de que o MPEG-2, com este tipo de estrutura, deixa a
flexibilidade total aos operadores para incluírem no PES e no TS toda a informação adicional
que desejarem, tal como acesso condicional, legendagem, etc.
Com esta filosofia MPEG-2, garante-se que o sinal que o receptor vai ler é sempre a
mesma (embaratecendo o preço dos receptores devido à normalização) mas deixa-se na
mão do operador, toda a flexibilidade necessária para que ele melhore o seu serviço sempre
que houver inovações técnicas.
Em resumo: receptores baratos e simples e codificadores que podem estar

constantemente em evolução e a melhorarem a qualidade de sinal que vai ser transmitido,
sem que contudo seja necessário modificar ou substituir receptores antigos.
3.2. O Fluxo Elementar (ES)
Primeira camada da sintaxe do MPEG, o Fluxo elementar (ES) é o sinal binário (quer
de áudio, quer de vídeo), obtido à saída da codificação/compressão (Figura 3-3).
VÍDEO Codificação e
Compressão Vídeo ES
vídeo
ES
(Elementary Streams)
ÁUDIO Codificação e
Compressão Áudio ES
áudio
Figura 3-3 – O fluxo elementar (ES)
Os dados que entram no codificador, como por exemplo as imagens, são chamados de
unidades de apresentação (Presentation Units). Os dados comprimidos à saída do
codificador são chamados de unidades de acesso (Acess Units). Na Figura 3-4 pode ver-se
a diferença entre estes dois tipos de unidades e ficar com uma ideia dos níveis de

compressão das imagens I, P e B numa sequência de vídeo.
Unidade de
Apresentação
Imagem Imagem Imagem Imagem

(830 Kbytes) (830 Kbytes) (830 Kbytes) (830 Kbytes)
Unidade de
Acesso
Imagem I Imagem B Imagem B Imagem P

comprimida comprimida comprimida comprimida
(100 KBytes) (12 KBytes) (12 KBytes) (33 KBytes)
Figura 3-4 – Unidades de apresentação e unidades de acesso
Repare que uma imagem original, (depois do conversor A/D e no formato PCM),
contém cerca de 830 KBytes. Depois da compressão, uma imagem tipo I fica reduzida a
cerca de 100 MBytes, uma imagem tipo P fica com cerca de 33 KBytes e as imagens tipo B
ficam com cerca de 12 KBytes. É claro que estes valores são apenas indicativos pois
dependem de factores como a complexidade original da imagem.
O resultado da codificação de uma sequência de vídeo é uma sucessão de

Unidades de Acesso e são elas que formam o fluxo elementar de vídeo (video
ES).
Tal como o vídeo, também para o áudio se transformam as unidades de

apresentação em unidades de acesso, que irão formar o fluxo elementar de áudio
(audio ES).
Define-se um programa como sendo um conjunto de fluxos elementares (ES) que

partilham a mesma referência temporal.
3.2.1. Fluxo elementar de vídeo (vídeo ES)
Conforme explicitado no capítulo anterior, (Figura 2-11), o processo para codificar

e comprimir uma imagem baseia-se na estrutura:
Bloco  Macrobloco  Slice  Imagem  GOP  Sequência

A unidade fundamental de informação é o BLOCO (8x8 pixels) podendo ser Y, Cr ou
Cb.
Os blocos agrupam-se em MACROBLOCOS que constituem a unidade fundamental de

uma imagem. Na codificação 4:2:0 cada macrobloco é constituído por quatro blocos Y e
dois blocos de diferença de cor (Cr e Cb).
Os macroblocos ao longo de uma linha constituem um SLICE (fatia).
Um conjunto de slices forma uma PICTURE (imagem), um conjunto pictures forma

um GOP (group of pictures) e finalmente, um conjunto de GOPs forma uma SEQUENCE
(sequência).
A Figura 3-5 Mostra a estrutura hierárquica da trama elementar de vídeo (vídeo ES).
(optional) SEQUÊNCIA
Start Sequence Profile and Picture Picture Picture Contém p
quantisation weighting ----
code parameters level 0 1 p-1 Imagens
matrix)
Start Sequence Slice Slice Slice IMAGEM

---- Contém n
code parameters 0 1 n-1
Slices
SLICE
Start Quantisation Macrobloc Macrobloc Macrobloc
Slice adress ---- Contém m
code values 0 1 m-1
Macroblocos
MACROBLOCO
Macrobloc (optional) Motion Coded block Contém 4 blocos de
Mode Luminance blocks Chrom Blocs luminância e 2 blocos
adress quantisation value vectors pattern
de crominância para
video 4:2:0
Coeficientes DCT quantizados para um bloco 8x8 pixéis em VLC

BLOCO
Figura 3-5 – Fluxo elementar de vídeo (vídeo ES)
3.2.2. Fluxo elementar de áudio (áudio ES)
Vários tipos de áudio (camada 1, 2 ou 3 do MPEG) podem ser inseridos num

Transport Stream MUX. O tipo de codificação utilizado tem que ser incluído num indicador
que o descodificador irá ler para utilizar a descodificação adequada.

Conforme já anteriormente referido, o processo de compressão áudio é muito diferente
do processo de compressão vídeo. As tramas de áudio são transmitidas pela sua ordem
natural e contêm sempre a mesma quantidade de dados. Em MPEG-2 áudio, o indicador de
sequência do cabeçalho contem o número da camada utilizada para a compressão e o tipo
de compressão utilizado (estéreo por exemplo) bem como a frequência de amostragem
inicial. A sequência áudio é organizada em unidades de acesso (AU = Access Units) que
constituirão as tramas de áudio codificadas.
Uma sucessão de unidades de acesso forma o Audio Elementary Stream Cada

unidade de acesso contém umas dezenas de milisegundos de áudio comprimido.
A Figura 3-6 mostra um bitstream áudio MPEG layer 1.
Afectação de Factores de Dados

Cabeçalho CRC Amostras das sub-bandas
bits escala Auxiliares
22 bits sistema
4 bits 6 bits
12 bits sincronismo GR0 GR1 GR2 ---- GR11
0 1 2 3 --- 31
Figura 3-6 – Bitstream audio MPEG layer 1
Depois da palavra de sincronismo e do cabeçalho, há 32 códigos de afectação de bits

de 4 bits cada um. Estes códigos descrevem o comprimento das palavras dos frames em
cada sub-banda.
Vêm a seguir os 32 factores de escala utilizados para a compressão em cada banda.

Estes factores de escala são indispensáveis para restabelecer o bom nível da descodificação.
Os factores de escala são seguidos dos dados áudio de cada banda.
A Figura 3-7 mostra a trama de áudio tal como definida pelo standard MPEG-2
(ISO/IEC 13818-3)

Figura 3-7 – Trama de áudio MPEG-2
3.3. O PES (Packetized Elementary Stream)
Tal como definido pelas normas MPEG, e por razões de conveniência, os fluxos
elementares (ES) de áudio, vídeo e dados são divididos, sendo depois associados entre si,
em pacotes (packets) formando assim os PES (Packetized Elementary Streams).
Estes pacotes são de tamanho variável. O tamanho pode atingir várias centenas de
Kilobytes e varia em função da aplicação mas normalmente ronda os 64 KB.
Cada pacote é precedido por um cabeçalho que contêm a informação necessária para
que o receptor o sincronize e descodifique a informação nele contida.
3.3.1. Estrutura do PES
A Figura 3-8, indica a estrutura da trama de um PES.
A semântica dos principais campos é a seguinte:
 Packet_start_code_prefix (24 bits) – campo de 23 “0” e um “1”

(“000001” em hexadecimal) que identifica o inicio de um pacote PES
 Stream_ID (8 bits) – define o tipo de pacote (de vídeo, de áudio, de
dados,…)

Packet PES Optional Stuffing
Stream
start code packet PES bytes PES packet data bytes
ID
prefix Lenght header (FF)
24 8 16
PES
PES Data
PES Original header Optional
10 scrambling alignement Copyright Flags
priority or copy data fields
control control
2 2 1 1 1 1 8 lenght 8
ES Previous
DSM trick Aditional PES
PTS / DTS Clock Ref. ES rate PES
mode copy info extension
(ESCR) CRC
33 42 22 8 7 16
Flags Opcional fields

5
Program
Pack PES
PES packet P-STD
header extension
private data sequence buffer
field field
128 8 counter 8 16 7
Figura 3-8 – Estrutura da trama de um PES
 PES_packet_lenght (16 bits) – Indica o número de bytes que se seguem

ao último (byte) deste campo.
 PES_Scrambling_control (2 bits) –
 PES_priority (1 bit) –
 Data_alignment_control (1 bit) –
 Copyright (1 bit) –
 Original_or_copy (1 bit) –
 FLAGS :
 PES_header_data_lenght (8 bits) – indica o número de bytes ocupados
pelos campos opcionais e possíveis bytes de enchimento (stuffing bytes)
contidos no cabeçalho do PES.
 Presentation time stamp (PTS) / Decoding_Time_Stamp (33 bytes)
– fornece informação sobre a base de tempos da apresentação ou da
descodificação dos GOP
 Elementary_Stream_Clock_Reference ESCR (42 bits) – fornece infor-
mação sobre a base de tempo do ES
 TRick control mode
 Aditional_copy_info (7 bits) – Contém informação referente ao copyright
 Previous_PES_packet_CRC (16 bits) –
 PES_private_data (16 bits) – contém dados privados

 Pack_field_lenght
 Program_packet_sequence_counter
 P_std_buffer
 PES_Extension_field_lenght (7 bits) -
É importante salientar que se a informação contida no cabeçalho for corrompida, o PES

inteiro se perde. De uma forma geral, quanto mais alto se sobe na estrutura protocolar do
MPEG, maior é o dano que os potenciais erros podem causar.
O próximo passo é multiplexar muitos PES para criar um fluxo binário contendo um ou
vários programas de TV. Por si só, o PES é simplesmente uma informação em bruto, embora
descodificável, mas que não contém nenhuma indicação que diga ao descodificador como a
descodificar. Por isso, a partir dos PES, é necessário criar os Fluxos de Programas (PS –
Program Streams) ou os fluxos de transporte (TS – Transport Streams) como já
indicado na Figura 3-1.
3.4. PS e TS
Tanto o Program Stream (PS) como o Transport Stream (TS) são obtidos a partir de
pacotes PES de áudio, vídeo e dados (Figura 3-9). mas apresentam grandes diferenças.
Packetized elementary stream (PES)

Cabeçalho Dados úteis (PAYLOAD)
Comprimento variável
Program Stream (PS) Transport Stream (TS)

Cabeçalho Pacote PES Pacote PES Cabeçalho Dados útéis (payload)
Pacote de Comprimento variável 188 Bytes

Figura 3-9 – Program Stream e Transport Stream
O PS é constituído ou por um programa de vídeo e respectivo(s) áudio(s) ou então por

vários programas de áudio. A sua estrutura comporta um cabeçalho e pacotes PES de
comprimento variável. Como o PS contém apenas informação referente a um programa de
vídeo, é o método ideal para ser utilizado na gravação de sinais digitais em DVD, CD, disco,

etc., não sendo utilizado para a transmissão de sinais de TV digital e portanto não será aqui
detalhado.
Pelo contrário, o TS pode conter informação de vários canais vídeo, vários canais de
áudio e vários canais de rádio, pelo é o método ideal para a transmissão de sinais de TV
digital. A sua estrutura comporta um cabeçalho e uma carga útil (payload) com comprimento
fixo de 188 Bytes.
O bom funcionamento de um equipamento de TV digital depende enormemente da

distribuição de um sistema de relógio estável para a sincronização. Enquanto que no
Program Stream (PS), o áudio e o vídeo estão sempre associados a uma referência comum,
no TS, como ele contém diferentes programas, tudo é mais complicado.
Num fluxo de transporte (TS), os programas podem ter tido diferentes origens que não
são necessariamente síncronas. Par conseguinte, o TS deve ser capaz de fornecer os meios
de sincronismo para cada um dos programas. Este sincronismo tem o nome de PCR
(Program Clock Reference) e permite reconstituir uma referência de relógio estável a partir
da qual, por divisão, se cria a frequência que vai permitir no descodificador utilizar
convenientemente os marcadores temporais em cada ES.
Figura 3-10 – Etapas na obtenção do sinal DVB
A Figura 3-10, mostra um exemplo das várias componentes que intervêm no processo
de TV digital, desde a origem até à emissão.

A cada PES vídeo, pode estar associado um certo número de PES áudio e PES de
dados. Apesar de isto ser já por si complexo, o receptor deverá ser capaz de passar de um
programa para outro e seleccionar convenientemente os canais de áudio e de dados.
Certos programas são protegidos e devem ser acedidos apenas pelos subscritores pelo
que o TS deve incluir informação de acesso condicional para gerar esta protecção. O TS
contém as Informações específicas de programa (PSI = Program Specific Information) que
permitirão as operações anteriormente mencionadas e outras.
O TS pode conter vários programas diferentes, utilizando cada um, débitos binários e
factores de compressão susceptíveis de variarem dinamicamente, mesmo que o débito final
resultante, seja constante. A esta propriedade chama-se multiplexagem estatística e permite
a um programa com muito débito (uma corrida automóvel por exemplo) ir retirar bits a um
programa mais estático (p.ex. um debate).
3.5. Transport Stream (TS)
A Figura 3-11 mostra a estrutura de um pacote TS.
188 Bytes
Header Payload
4 Bytes
Sync Transport Start Transport PID Scrambling Adaptation Continuity

Byte Error Indicator Priority Control Field Counter Adaptation
PES 1 PES 2 ------- PES N
Indicator Control Field
8 2 1 1 13 2 2 4
Lenght Discontinuity Random PES Flags

Stuffing
Indicator Acess Priority Opcional
Bytes
Indicator Fields
8 1 1 1 5
PCR OPCR Splice Private Private Adaptation Flags Opcional

Countdown Data Data Field fields
Lenght Extension
42 42 8 8 ------- Length 8 3
Figura 3-11 – Estrutura da trama de um Transport Stream (TS)
Cada PES tem um comprimento constante de 188 bytes repartidos entre um cabeçalho

(header) e uma carga útil (payload).
As informações mais importantes do cabeçalho (normalmente 4 bytes), são:
 Byte de Sincronismo (Sync Byte)

Este byte é reconhecido pelo descodificador e serve para ele poder sincronizar com o
sinal e poder assim deserializar correctamente o cabeçalho e a carga útil (Payload).
 O indicador de erro de transporte (Transport Error Indicator)

Este indicador é validado se o sistema de correcção de erros detecta uma taxa de bits
errados demasiado elevada para poder ser corrigida. Indica que o pacote tem
possibilidade de ter erros.
 A identificação do pacote (PID – Packet IDentifier)

Este código de 13 bits serve para fazer a distinção entre os diferentes tipos de pacotes.
Contem toda a informação de navegação necessária para descobrir, identificar e
reconstruir programas. Os valores do PID estão contidos nas tabelas PSI de que
falaremos adiante.
 O contador de continuidade (Continuity Counter)

O seu valor (em 4 bits) é incrementado pelo codificador cada vez que um novo pacote
tendo o mesmo PID é emitido. Serve para determinar se um pacote particular se
perdeu, está a ser repetido ou está fora de sequência.
 O campo de adaptação (Adaptation Field)

O cabeçalho tem por vezes necessidade de mais informações e, se for esse o caso, os
bits de controle do campo de adaptação são colocados para indicar que o tamanho do
cabeçalho é superior ao normal. A Figura 3-11 mostra que o comprimento suplementar
está definido pelo comprimento do campo de adaptação. Se o cabeçalho for aumentado,
a carga útil (payload) é diminuída para conservar o tamanho constante do pacote.
3.5.1.1. Packet Identifier (PID)
No cabeçalho do TS, um campo de 13 bits contêm o código de identificação de pacote

(PID). O PID é utilizado pelo descodificador para fazer a distinção entre os pacotes contendo
diversos tipos de informação. O débito binário do TS deve ser constante, ainda que a soma
dos débitos de todos os diferentes fluxos possa variar. Este imperativo é realizado pela

inserção de bits “nulos” (contendo zeros) na parte útil (payload). Se o débito útil diminui,
mais pacotes “nulos” são adicionados.
Os pacotes nulos têm sempre a mesma identificação. Num dado fluxo de transporte,
todos os pacotes pertencendo a um dado PES têm a mesma identificação. Os pacotes
pertencentes a outro ES terão uma identificação diferente.
O desmultiplexer pode assim facilmente seleccionar todos os dados de um dado ES

aceitando somente os pacotes com a identificação certa. Pode seleccionar-se a informação
completa de um programa graças aos seus PID’s de áudio, vídeo e dados.
O desmultiplexer só conseguirá seleccionar os pacotes certos se os puder associar ao

TS ao qual pertencem e só pode executar esta tarefa se conhecer os PIDs. Para isso, é
imprescindível a existência da informação específica de programa (PSI – Program Specific
Information)
3.5.2. As tabelas PSI
Em analógico, um canal de transmissão transporta um programa de televisão sempre

com as mesmas características, por isso o receptor só tem que memorizar a frequência da
estação.
No caso do digital é muito diferente. Um canal de transmissão transporta vários

serviços de natureza diferente e que podem variar. E pois necessário fazer transportar no
sinal as informações que irão permitir ao terminal conhecer a natureza e a composição dos
serviços presentes no TS de um SCTS (Single Channel Transport Stream). No caso de um
MCTS (Multi Channel Transport Stream) é necessário incluir as informações de todos os
canais presentes. As tabelas transportam informações relativas às redes, aos fluxos de
transporte, aos serviços. Cada um destes elementos deve poder ser identificado de forma
única.
Todas estas informações são genericamente designadas por PSI (Program Specific
Information) e são incluídas em tabelas difundidas regularmente, cada uma com uma
frequência julgada suficiente pelo operador para refrescar as informações ao nível do
terminal. Em função do tipo de tabela, isso pode ir de 100ms a 30s.
O MPEG-2 define as seguintes quatro tabelas PSI.

PAT Programme Association Table
PID = 0 e a TableID = 0. Para cada serviço fisicamente presente no TS, ela
associa o serviço, de acordo com o seu Program Number a um PID da PMT.
PMT Program Map Table

O seu PID é escolhido pelo operador e a TableID = 2. Tem uma para cada
serviço fisicamente presente no TS. Descreve as características do serviço e dos
seus componentes
CAT Control Access Table

Tem o PID = 1 e a TableID =1. Permite ao terminal conhecer os PID’s das vias
EMM que estão presentes no TS. Os EMM’s transportam os direitos para cada
cartão de assinante.
NIT Network Information Table

PID = 16 e a TableID de 64 ou 65. Esta tabela permite identificar e juntar o
conjunto dos transponders e dos serviços disponibilizados pelo operador aos
seus assinantes. Todas as informações necessárias para a sintonia dos
programas estão contidas nesta tabela (frequência, polarização, FEC, SR,
posição, etc). A TableID = 64 se a tabela descreve a rede do operador que emite
a tabela (NIT actual) e =65 se a tabela descreve a rede de um outro operador
(NIT Other).
3.5.3. Estrutura das tabelas
A Figura 3-12 mostra a estrutura das tabelas que vão ser utilizadas pelo receptor para
reconstituir a informação original. Para reconstruir o PES, o PSI usa uma série de
identificadores conhecidos como PID (Packet Identifier)
• Logo que o programa a seleccionar seja conhecido, o receptor procura pela tabela
Programme Association Table (PAT) que tem sempre o PID = 0.
• A PAT contém os PID's de todas as PMT's para os programas contidos. Neste

exemplo, vamos assumir que o programa 1 foi o escolhido.
• A PMT para o programa 1 é identificada pelo seu PID (22), extraído dos pacotes do
TS que o contém e descodificada.
• A PAT do programa 1 contém todos os PID's para os pacotes (packets) de vídeo,

áudio e dados do programa 1. Eles vão ter que ser agora extraídos do TS e de novo
reagrupados para se reconstruir o PES original.
• A informação do clock (PCR) do programa 1, necessária para a descodificação, está

contida num pacote de transporte, identificado pelo PCR PID (31). Cada programa tem um
PCR.

PMT para o programa 1
Stream 1 PCR 31
Stream 2 Video 1 54
Stream 3 Audio1 48
Stream 4 Audio 2 49
PAT (sempre PID=0) ------ --- ---
Program 0 PID=16 Stream N Data N 66
Program 1 PID=22
PROGRAM MANAGMENT TABLES
Program 2 PID=33
---- --- PMT para o programa 2
Program 4 PID=55 Stream 1 PCR 41
Stream 2 Video 1 19
PROGRAM ASSOCIATION TABLE
Stream 3 Audio 1 81
Stream 4 Audio 2 82
------ --- ---
Stream N Data N 88
0 PAT 22 Prog 1 PMT 33 Prog 2 PMT 99 Prog 1 EMM 31 Prog 1 PCR 48 Prog 1 audio 1 54 Prog 1 video 1 109 Prog 2 EMM
etc.
CAT (sempre PID=1) NIT (sempre Program 0)
CA Section 1 (Program 1) EMM PID (99) Private section 1 NIT info
---- --- ---- ---
CA Section N (program N) EMM PID (N) Private section N NIT info
CONDITIONAL ACCESS TABLE NETWORK INFORMATION TABLE
Figura 3-12 – Estrutura das Tabelas (PSI)
• O PID=1 é sempre utilizado para identificar a CAT. Ela é necessária para determinar
se o receptor está ou não autorizado a descodificar o programa em causa (neste caso o
programa 1).
• A CAT contém todos os PID's que identificam os EMM's de todos os programas.
• A NIT, contém informação acerca dos serviços possíveis de seleccionar pelo

utilizador, tais como frequência do canal, número do transponder, etc. A NIT está sempre
associada com a PID = 0 dos programas. Por princípio, uma tabela é lida uma vez e depois o
terminal apenas verifica o seu número de secção. Se ele mudar, então sim, o terminal lê
novamente a tabela.
3.5.4. As tabelas SI
O DVB por necessidade, acrescentou mais algumas tabelas às quatro tabelas definidas
pelo MPEG-2. Estas tabelas são as SI (Service Information) que podem ser utilizadas pelo

terminal e pelo utilizador para navegar através dos serviços recebidos.
 Tabelas obrigatórias
SDT Service Description Table
PID = 17 e TableID = 66 se os serviços se apresentam no mesmo transponder
(SDT actual) e TableID = 70 se a secção descreve serviços presentes noutro
transponder. (SDT Other).
EIT Event Information table

PID = 18. Dá informação sobre os acontecimentos em curso ou seguintes
(nome da emissão, hora de início, duração, nome dos intervenientes, etc....)
acerca dos serviços disponíveis no(s) multiplexer(s) de um operador.
TableID =78 se a secção descreve acontecimentos de um programa do TS
(EIT Actual) e =79 se a secção descreve os acontecimentos de um programa de
um outro transponder.
TDT Time and Date Table

PID = 20 e TableID = 112. Dá a data e a hora universais.
 Tabelas opcionais
BAT Bouquet Association Table
PID = 17 e TableID = 74. Esta tabela permite agrupar os serviços de
outra forma que não só pela notação da rede (NIT). Um serviço pode
pertencer a vários bouquets. Assim, podem-se fazer bouquets por temas ou
por zonas geográficas de recepção.
EIT Event Information table

PID = 18 e TableID = 80 a 95 e 96 a 111. Dá informação sobre os
acontecimentos da próxima semana em relação aos serviços do multiplex ou
multiplexers do operador. Isto permite construir um EPG (Electronic Program
Guide) ou seja um guia electrónico de programas.
RST Running Status Table

PID = 19 e TableID = 113. Permite modificar rapidamente a informação de um
acontecimento actual (uma emissão por exemplo).
ST Stuffing Table
PID = 19 e TableID = 114. Esta tabela serve para “encher” substituindo não
importa qual secção de outras tabelas para as invalidar e o receptor não as
procurar.
TOT Time Offset Table

PID = 20 e TableID = 115. Transporta a data e hora universais e corrige com o
desvio relativo ao fuso horário da difusão.

3.5.5. As tabelas privadas
Todas as secções de tabelas que tenham um PID superior a 20 e um TableID

compreendido entre 128 e 255 são secções privadas cujo conteúdo é definido pelo operador.
É neste tipo de estrutura que são transportadas as informações das aplicações interactivas
tipo Open TV ou MediaHighway.
3.5.6. Exemplo de utilização
No caso de um monotransponder, o terminal sintoniza a frequência do transponder. O

receptor lê a PAT que lhe permite conhecer o ServiceID e o PID da PMT de cada serviço
disponível.
Em seguida, por cada serviço encontrado, ele lê a SDT para encontrar o respectivo
nome e o seu tipo (televisão, rádio...).
Assim, constitui-se a lista de todos os programas disponíveis no transponder.
Agora, se escolher um dos serviços, o terminal vai ler a PMT que referencia as
componentes do dito serviço e afixa as informações contidas na EIT do serviço para
descrever o acontecimento em curso.
No caso de um multitransponder, para construir a sua lista dos canais o terminal vai ler
a NIT actual do TS sobre o qual está sincronizado. Esta NIT referencia todos os
transponders disponíveis na oferta. Para cada transponder, vai agora encontrar a frequência,
o symbol rate e a FEC do TS, (para permitir o zapping), uma lista dos serviços presentes
bem como o seu tipo.
Esta lista de serviço (que contém todos os serviços disponíveis) vai ser completada
pela leitura dos SDT Actual e Other que forneceram os nomes, etc...
3.6. Evolução do MPEG (MPEG4 e VC1)
As taxas de compressão obtidas no MPEG-2 satisfazem operadoras e público para

distribuição de sinais TV de definição standard através das redes de cabo e das redes de
satélite. Mesmo em termos de vídeo doméstico, o DVD é considerado como “uma imagem
excelente” pela maioria dos utilizadores, a verdade é que é manifestamente insuficiente em

termos de novas aplicações com alta definição (HD) ou a emergente distribuição de sinais
por técnicas como o IPTV (que detalharemos no final deste manual) e que consiste em
distribuir sinal TV pela linha telefónica ou como o DVB-H que consiste em distribuir televisão
para telemóveis.
Antes de analisar as novas técnicas de compressão, é interessante mostrar um gráfico

resumo da evolução (Figura 3-13).
Figura 3-13 – Evolução das técnicas de compressão (SD)
Para codificações MPEG-2 a taxa de transmissão necessária para obter uma qualidade
aceitável situa-se entre os 3 e os 5 Mbps, como foi dito anteriormente, para qualidade SDTV.
A solução MPEG-4 (parte 2) permitiu baixar para cerca de metade os débitos de um

canal de TV MPEG-2.
Recentemente, melhorias introduzidas nas técnicas de compressão, levaram à adopção

das normas de terceira geração MPEG-4 (parte 10) mais conhecida por H.264/AVC e VC-1
(propriedade da Microsoft e utilizada nos filmes WMV).
O H.264/AVC atinge cerca de 2x a compressão face a sistemas de MPEG-2 e MPEG-4 e

apresenta novas funcionalidades face ao MPEG-2 e MPEG-4 que permitem obter estes
números. Estas funcionalidades são:
 Aumento das “ferramentas” de predição entre as tramas:

 É possível ter até 32 tramas B, ao contrário das soluções anteriores, em que no
máximo se usavam uma ou duas. Esta ferramenta permite um melhor
aproveitamento dos bits disponíveis, e consequentemente obtenção de melhor

qualidade.
 Blocos dinâmicos (VBSMC) com tamanhos que podem ir desde os 4x4 até aos
16x16, operando de uma forma compensatória.
 Precisão de um-quarto-de-pixel, ao contrário dos codecs anteriores que só
permitiam precisões de meio-pixel. Útil para a compensação do movimento.
 Predições ponderadas, que permitem que os codificadores especifiquem escalas e
offsets quando fazem compensação de movimento. Útil para a performance em
situações de transições de imagens (fade-to-black, fade-in e cross-fade).
 Novas ferramentas de codificação sem perdas, de macroblocos.
 Novas ferramentas de entrelaçamento.
Para além de todas estas ferramentas, o H.264 também apresenta uma nova solução
de coeficientes, semelhante aos conhecidos DCT, que permitem contornar o problema da
função transcendente que calcula a DCT, apresentando valores exactos derivados das
funções inversas realizadas para cada coeficiente. A quantetização também é feita de uma
forma diferente, mais eficiente, assim como as técnicas de entropia, entre outras novas
funcionalidades apresentadas por este codec.
O VC1 é um sistema proprietário da Microsoft, utilizado mo Windows Media Player e

está neste momento a ser generalizado em muitas aplicações por apresentar melhorias na
compressão em relação ao H.264, mas a sua grande vantagem sobre o H.264 reside
sobretudo no facto de ser muito mais leve em termos de processamento portanto mais
barato no hardware. Em HD o VC-1 consegue excelente prestação com apenas 6 a 8 Mb/s.
A titulo de curiosidade, a Figura 3-14 mostra a diferença de qualidade entre MPEG-4 e

H.264, para a mesma taxa de transmissão, 1,2Mb/s.
Figura 3-14 – MPEG-4 vs H.264

1. Um codificador MPEG-2 começa a trabalhar com sinais de vídeo analógicos ou

digitais?
2. Actualmente, o tamanho do data stream e a qualidade da imagem resultante _____

directamente correlacionados.
a. são
b. Não são
3. Faça um esquema do diagrama funcional do MPEG-2 (ES, PES, TS, PS)
4. para que serve o PCR?
5. O PID identifica?.
a. video streams
b. audio streams
c. PSI tables
d. Todos acima
6. Os valores do PID são únicos ou são atribuídos ao acaso?
7. Que tipos de tabelas existem na estrutura MPEG-2
8. Qual a finalidade do PTS/DTS?
9. O processo de descodificação das tabelas PSI é realizado ___________.
a. De trás para a frente

b. Da frente para trás
10. Indique quais as novas versões MPEG.

Capítulo
Capítulo 4 - DVB
Depois de se codificarem e multiplexarem os diferentes sinais de
vídeo, áudio e dados, utilizando as normas MPEG, é agora necessário
transmiti-los até ao utilizador final. Este capítulo descreve o sistema DVB
tal como é utilizado para a transmissão desses sinais através de satélite,
cabo ou terrestre.
4.1. Introdução
As normas DVB (Digital Video Broadcasting), já enumeradas no Capítulo 1, definem,

entre outras, a forma como um sinal digital de áudio, vídeo e dados deve ser transmitido,
desde o emissor até ao utilizador final, via satélite (DVB-S), cabo (DVB-C) ou terrestre
(DVB-T), tal como se mostra na Figura 4-1
Figura 4-1 – DVB-S, DVB-C e DVB-T
Devido às suas normas serem normas extremamente flexíveis e abertas, compatíveis

com os desenvolvimentos tecnológicos actuais e futuros, o DVB tem tido adoptado em quase

todos os países, excepção aos E.U.A. e o Japão que estão a utilizar diferentes variantes e
que impedirão a utilização universal do sistema DVB.
Os standards produzidos pelo projecto DVB, foram já enumerados no capítulo 1, mas

os que iremos abordar ao longo deste capítulo serão o DVB-S, DVB-T e DVB-C.
O DVB, adoptou o MPEG-2 (vídeo) como sinal de banda base antes de ser distribuído.
Esta opção teve em conta que a estrutura do sinal MPEG:
 Permite sincronização fácil e a mistura de todos os componentes (vídeo,

áudio e dados) num só TS;
 É passível de ser armazenado (gravado) no receptor visto que a trama
de bits contém toda a informação necessária para posterior recuperação
do sinal;
 É o sistema que melhor cobre as exigências dos diferentes meios de
transmissão (satélite cabo e terrestre)
A Figura 4-2 mostra qual a parte MPEG-2 e qual a parte DVB do sinal. Repare que só
após a criação do Tranport Stream (TS) se inicia o processo DVB.
MPEG-2 Video MPEG-2 DVB-S DVB-C DVB-T MPEG-2 MPEG-2 Video

MPEG-2 Audio Systems Systems MPEG-2 Audio
Video IN ES TS ES Video OUT

Video Video
Desmutiplexagem e
Encoder Encoder
sincronização e
Canal TX
despacketização
multiplexagem
Packetização,
Audio IN Modulação e Desmodulação Audio OUT

Audio protecção de e correcção de Audio
Encoder erros erros Encoder
User data IN User data OUT

DVB Service Information
Utilizador
DVB SI
Figura 4-2 – Diagrama geral de uma transmissão DVB
A transmissão digital de um sinal, desde a fonte analógica até ao utilizador analógico,

pode ser dividida nas seguintes áreas (Figura 4-2):
 Digitalização do sinal analógico, com codificação e multiplexagem para

obter o MPEG TS
 Protecção de erros e Modulação do sinal TS antes de ser emitido.
 Canal de transmissão (sat, terrestre ou cabo).
 Desmodulação e Correcção de erros na recepção.
 Desmultiplexagem e descodificação do MPEG TS, para obter o sinal
analógico.
O DVB mantém para os canais digitais exactamente a mesma largura de banda que a

utilizada pelos canais analógicos (27 a 36MHz para satélite e 8 MHz para cabo e terrestre).
4.1.1. BER (Bit Error Rate)
Uma das melhores formas de medir a performance de um sistema digital é calcular a

sua taxa de erro binário (em inglês BER – Bit Error Rate)
Numa transmissão digital, a BER é o número total de bits errados dividido pelo número
total de bits que foram transmitidos, recebidos ou processados durante um certo período de
tempo. Se existir um bit errado em cada 1.000 bits recebidos, diz-se que taxa de erro binária
foi de BER = 1/1000 = 10-3. Da mesma forma, se houver 4 bits errados em 100.000 bits
transmitidos teremos uma BER = 4/100.000 =4*10-5.
Mas a BER também pode ser expressa em termos de probabilidade ter um bit errado
num determinado intervalo de tempo. Nos sistemas DVB, um bit errado por hora é
equivalente a uma BER de 10-11.
Considera-se que para se receber um sinal digital correctamente, é aconselhável uma

BER melhor que 10-4 isto é, menos do que 1 bit errado por cada 10 mil bits recebidos à
entrada do receptor.
Usando as mais avançadas técnicas de correcção consegue-se que sinais com elevados
níveis de erro à entrada do receptor (BER de 10-4 ou maior), possam ser corrigidos para
valores de apenas 10-11.
O DVB define que o número de erros no final do processo de recepção deve ser
“quasi-error-free” (QEF), isto é, não pode ultrapassar 1 erro em cada hora de emissão o
que para taxas da ordem de 40Mb/s corresponde a uma BER de aproximadamente 10-11.
Grosso modo, pode dizer-se que a BER é o equivalente digital à relação sinal-ruído nos
sistemas analógicos.
4.1.2. Transmissão digital
Os sistemas DVB-C, DVB-S e DVB-T são muito semelhantes quanto à sua estrutura
geral pois todos vão transmitir/receber sinais MPEG-TS. As diferenças que apresentam,
dependem exclusivamente das características, relativas ao meio de transmissão a utilizar:

 Satélite: largura de banda do canal entre 27MHz e 36MHZ. Um sinal
proveniente de um satélite sofre uma atenuação de cerca de 200dB.
Recebe-se assim um sinal muito fraco e extremamente ruidoso. Requer
uma protecção contra erros muito sofisticada e uma modulação robusta
(QPSK) embora pouco eficiente.
 Cabo: largura de banda do canal muito reduzida, apenas 8 MHz
(relembramos que o débito de saída de um multiplexador é de cerca de
40 MBit/s), mas em contrapartida é um meio muito protegido de
interferências. Requer pouca protecção de erros e aceita uma modulação
pouco robusta mas mais eficiente (QAM).
 Terrestre: Largura de banda muito reduzida, 8 MHz. O sistema a
escolher deve ser insensível aos ecos (fantasmas) e deve poder ser
utilizado em recepção móvel. É o sistema mais complexo de todos.
Requer uma protecção contra erros muito sofisticada e uma modulação
extremamente robusta e de alto débito (COFDM).
Tendo em vista estas características e a necessidade do DVB-S, DVB-T e DVB-C serem

tão compatíveis entre si quanto possível, o DVB definiu para cada um deles, normas para:
 Tratamento: dispersão de energia, entrelaçamento e filtro de Nyquist

 Correcção de erros:código Reed-Solomon e código convolucional
 Modulação: QPSK (DVB-S), QAM (DVB-C) e COFDM (DVB-T)
São precisamente estas normas que iremos analisar a seguir.
4.2. Transmissão DVB-S
O sistema de televisão digital por satélite foi o primeiro a aparecer para o grande
público. É natural que assim tenha sido pois a emissão por satélite permite distribuir sinal
por áreas enormes (toda a Europa, por exemplo) e por baixos custos tanto para a emissão
(cerca de 1/10 mais barato que uma emissão analógica) como para a recepção, pois o
utilizador só tinha que adquirir um receptor digital visto que todo o restante equipamento
(LNB, antena parabólica, rede de distribuição, etc.) é igual ao do sistema analógico.
4.2.1. Emissor DVB-S
O sistema DVB-S utiliza a banda Ku de emissão satélite, sub-bandas FSS (Fixed

Satellite Service) e DBS (Direct Broadcast Service), que correspondem às frequências entre
10 e 12 GHz. Normalmente, os operadores de satélite emitem os sinais de TV digital nas

frequências mais altas (12GHZ) pois como estas frequências são os que mais se atenuam
antes de chegar à terra, o sinal digital é preferido porque pode aceitar menores níveis de
sinal que o analógico.
A normativa para sinais DVB-S consta no documento do ETSI EN 300 421.
Comecemos por analisar o diagrama de blocos da emissão DVB-S (Figura 4-3).
Figura 4-3 – DVB-S (emissão)
4.2.1.1. Baseband Interface and Sync
O sinal que vai ser utilizado é um TS do MPEG-2 com a trama já indicada na

188 Bytes
Header Payload
4 Bytes
Sync Transport Start Transport PID Scrambling Adaptation Continuity

Byte Error Indicator Priority Control Field Counter Adaptation
PES 1 PES 2 ------- PES N
Indicator Control Field
8 2 1 1 13 2 2 4
Lenght Discontinuity Random PES Flags

Stuffing
Indicator Acess Priority Opcional
Bytes
Indicator Fields
8 1 1 1 5
PCR OPCR Splice Private Private Adaptation Flags Opcional

Countdown Data Data Field fields
Lenght Extension
42 42 8 8 ------- Length 8 3
Figura 3-11. O cabeçalho (header) tem 4 bytes dos quais o primeiro byte é de

sincronismo (47hex).
4.2.1.2. Inversão de sincronismo e Dispersão de Energia
O TS é uma sequência de “0” e “1”. Se não houver uniformidade ao longo do tempo e

acontecerem longas sequências de “0” e “1” ou rápidas variações de “0” e “1”, isso irá criar
raias fortes no espectro e grande interferência inter-simbólica (IIS).
Para evitar esse inconveniente, é necessário repartir a energia por igual ao longo de
todo o canal, e o DVB regulamenta um processo de dispersão (uniformização) que obedece
ao esquema indicado na Figura 4-4.
Para isso basta multiplicar o sinal TS pela saída de um gerador pseudo-aleatório,

(PRBS). Este gerador tem a sequência de inicialização “10010101000000” armazenada num
shift register de 15 células. Os bits 14 e 15 passam por um Exclusive OR e o bit resultante é
aplicado à célula 1 obrigando a que todos os bits se desloquem para a direita e é também
aplicado a outro Exclusive OR onde se mistura com o TS.
Sequência de Inicialização
Saída de dados
ENABLE
Entrada de TS MPEG-2
Entrada de data (MSB primeiro)

Sequência PBRS
Figura 4-4 – Dispersão de Energia
Esta sequência desenvolve-se continuamente, mas de 8 em 8 TS e para garantir um

perfeito sincronismo no receptor, o byte de sincronismo do primeiro TS é invertido (B8hex) e
a sequência de inicialização volta ao seu valor inicial. A Figura 4-5 mostra a inversão do byte
de sincronismo e evidencia que o período de repetição do processo PRBS é de 1503 bytes.
Repare que há uma porta AND onde a sequência PRBS pode ser activada (ENABLE) ou
desactivada. A desactivação é feita só durante o byte de sincronismo para que ele possa

passar sem ser modificado.
Figura 4-5 – Inversão do byte de sincronismo
Com este processo, a energia do TS fica repartida igualmente por todo o espectro, e
mesmo que não haja sinal na entrada, haverá dispersão da energia evitando-se uma longa
sequência de zeros.
Na recepção utiliza-se o mesmo circuito. Quando se detecta um byte contendo a

palavra de sincronismo invertido inicia-se o processo inverso do que teve lugar na emissão.
4.2.1.3. Código Reed-Solomon (Outer coding)
É um código que vai adicionar 16 bytes de redundância a cada TS que já passou pelo
processo de dispersão de energia (Figura 4-6).
Este código tem a notação RS (188,204,t=8), o que quer dizer que tem 188 bytes
na entrada, 204 bytes na saída e 8 bytes em 188 podem ser corrigidos.
Figura 4-6 – TS com código R-S
Para compreender o funcionamento deste código, vamos dar um exemplo muito

simples.

Imaginemos que os pacotes TS têm 3 bytes de comprimento e que se transmite o
seguinte pacote:
03 10 15
Adicionamos dois pacotes de redundância. O primeiro é a soma dos 3 dados, isto é,
28, e o segundo é a soma ponderada dos 3 bytes em que cada byte é multiplicado pela sua
posição: 3*1 + 10*2 + 15*3 = 68.
O pacote, à saída do codificador passa então a ser:
03 10 15 28 68
Depois da transmissão e recepção com ruído, o receptor recebe o pacote com erro:
03 12 15 28 68
Refaz-se a soma simples 03+12+15=30 e a soma ponderada 3*1+12*2+15*3=72.
A diferença das somas simples (28-30) dá-nos o valor do erro e a diferença das somas
ponderadas dividida pelo erro dá-nos a posição do erro ((72-68)/2=2). Pode-se assim
corrigir o erro do pacote.
No receptor, a correcção de erros R-S pode aceitar dados com uma BER de 10-4 (1 erro
em cada 10.000 bits) e corrigi-los para níveis de erros de apenas 10-10 (1 erro em cada 10
biliões de bits) ou ainda menor. É assim possível cumprir a condição QEF (quasi-error-free)
estipulada pelas normas DVB.
4.2.1.4. O Entrelaçamento (Convolutional interleaving)
Com o código R-S, se forem detectados mais do que 8 bytes errados dentro de um TS,
o sistema perde todo o TS pois é incapaz de saber onde está o erro.
De uma forma geral, as perturbações que introduzem erros no canal de transmissão

são de curta duração, mas por mais curto que esse intervalo possa ser, afectará certamente
uma sequência com mais do que os 8 bytes que o código R-S permite corrigir em cada TS.
Para evitar este tipo de erro, usa-se o entrelaçamento convolucional (convolutional

interleaving) que consiste em distribuir (entrelaçar) os bytes de um pacote TS, por outros
pacotes. Assim, caso haja um erro que destrua 10 bytes consecutivos, como esses bytes
pertencem a pacotes diferentes será fácil reconstituir o sinal original utilizando o código R-S.
O nome convolucional deriva de que estas operações estão matematicamente associadas a

uma convolução de matrizes.
A título de exemplo, considere que 5 pacotes de 5 bytes (aqui representadas por 5

palavras de 5 letras) são transmitidos e que a transmissão introduz um erro de 5 bytes
seguidos. O descodificador já não identificará as palavras CAÇAM e RATOS pois elas foram
severamente truncadas.
GATOS CAÇAM RATOS NOITE CLARA pacotes originais

GATOS CA TOS NOITE CLARA idem com erro de 5 bytes
Contudo, se os pacotes originais forem entrelaçados, será fácil recuperar o sentido das
palavras originais mesmo depois dos erros.
GCRNC AAAOL TÇTIA OAOTR SMSEA pacotes entrelaçados

GCRNC AA TIA OAOTR SMSEA idem com erro de 5 bytes
GAOS CAAM RTOS NITE CARA pacotes depois de desentrelaçados
O entrelaçamento permitiu repartir os erros distribuindo-os por vários pacotes. Apenas

um byte em cada pacote foi afectado e o código Reed-Solomon já explicado, pode facilmente
corrigir esses erros. Sem entrelaçamento, seriam as palavras completas que teriam sido
afectadas sem qualquer hipótese de recuperação posterior.
Tecnicamente, o DVB utiliza um entrelaçamento convolucional com profundidade I=12,

quer dizer, os bytes de cada pacote são distribuídos por 12 pacotes vizinhos. Os pacotes
depois de entrelaçados mantêm os 204 bytes obtidos na codificação R-S.
Como se pode ver na Figura 4-7, o entrelaçador (do tipo Forney) é composto por 12
ramos (I=12) ligados ciclicamente à trama de dados de entrada pelo interruptor de entrada.
Cada ramo (j) utiliza um registo de deslocamento FIFO, de profundidade (j x M) células,
sendo M=17 =N/I, já que N = 17*12= 204.

Figura 4-7 – Sistema de entrelaçamento e des-entrelaçamento
Os interruptores de entrada e de saída têm que estar sincronizados.
Para que o receptor não perca a sincronização dos pacotes de 204 bytes, os bytes de
sincronismo e de sincronismo invertido não são alterados, pois passam sempre pelo ramo
directo (ramo 0).
Por último convém salientar que a ordem dos ramos, no receptor é inversa da do
emissor.
4.2.1.5. Código convolucional (Inner coding)
Dado que as ligações satélite e terrestre são muito ruidosas, convém reforçar ainda
mais as medidas de protecção contra erros dos dados a transmitir. Uma dessas medidas é o
código convolucional.
Se olharmos para os bits um a um, nada os liga entre si. Cada bit é rigorosamente
independente. A ideia do código convolucional é a de ligar um bit a um ou mais bits da sua
sequência, para que, no caso de esse bit se perder, ser possível recuperá-lo correctamente.
A Figura 4-8 mostra o codificador convolucional utilizado pelo DVB-S. Cada bit
incidente vai gerar dois bits de saída (1 bit em X e outro bit em Y). Repare que os bits ficam
correlacionados entre si pois o bit da saída X é a soma em módulo 2 dos bits nas posições
1,2,3,4 e 7 enquanto que o bit na saída Y é a soma módulo 2 dos bits nas posições 1,3,4,6 e
7.

Figura 4-8 – Código convolucional
O código obtido em X e Y (código "trellis") vai permitir encontrar o valor mais provável
de um bit por comparação com os outros bits anteriormente recebidos. Não é fácil de
explicar como, porque se trata de um processo matemático puro, mas é um sistema muito
eficiente na prática para corrigir erros.
Este processo tem contudo um grande inconveniente: duplicamos o débito binário do

TS. O rendimento do codificador descrito é de η=1/2, porque para cada bit na entrada
resultarão 2 bits na saída. É um rendimento muito baixo porque se duplicam os bits originais
sem que se acrescente informação ao sinal. Vai portanto ser necessário melhorar este
rendimento não transmitindo alguns dos bits que saem do codificador convolucional.
O processo de eliminação de bits tem o nome de “Puncturing” (perfuração) e é

indicado na tabela seguinte.
Nº de bits Nº de bits Nº de bits Bits na saída Bits eliminados C/N mínima

FEC
na entrada na saída transmitidos (depois do puncturing) pelo puncturing para QEF
1 2 2 1/2 X1Y1 - 9
2 4 3 2/3 X1Y1Y2 X2 10
3 6 4 3/4 X1Y1Y2X3 X2 Y 3 11
5 10 6 5/6 X1Y1Y2X3Y4X5 X2X4 Y3Y5 12
7 14 8 7/8 X1Y1Y2Y3Y4X5Y6X7 X2X3X4X6 Y5Y7 13
Analise a 3ª linha da tabela: para 3 bits na entrada do codificador, haverá 6 bits na

saída mas desses 6, serão transmitidos apenas 4. O rendimento é de η=3/4.
Em linguagem técnica usa-se o termo FEC (Forward Error Correction) em vez de

rendimento. Uma FEC de 3/4 significa que por cada 3 bits entrados saem 4, ou dito de outro
modo, em cada 4 bits, 1 é para posterior correcção de erros.

O DVB determina que a FEC, tenha os valores normalizados de 1/2, 2/3, 3/4, 5/6
ou 7/8.
Na tabela indicam-se também quais os bits nas saídas X e Y que são transmitidos e os
que são eliminados pelo puncturing.
Repare que na última coluna da tabela se indicam as relações C/N (carrier/noise)

mínimas para garantir uma recepção QEF com determinada FEC. Os operadores de TV
satélite escolhem a FEC para as suas emissões dependendo da potência de sinal que
chegará à superfície da terra e da qualidade desse sinal. A maioria das emissões actuais está
em 3/4 ou 5/6.
A FEC será escolhida pelo operador, em função de critérios técnicos e económicos. Em

geral, um transponder menos potente terá uma FEC da ordem de 2/3 ou 3/4 enquanto que
um transponder mais potente já pode utilizar uma FEC de 3/4 ou 5/6. Uma FEC de 7/8,
requer transponders de alta potência ou antenas de maiores diâmetros.
Económicos, porque atendendo ao alto preço do aluguer de um transponder, é sempre

desejável que o transponder seja utilizado com o maior bitrate possível.
4.2.1.6. Filtro de Nyquist (baseband shaping)
Estamos no fim do processo de protecção contra erros e antes do sinal entrar no

modulador digital. Subsiste contudo um problema: o sinal digital tem a forma rectangular e
se o modularmos assim, obteremos um espectro de frequência infinito. Para resolver este
problema, tem que se colocar um filtro para reduzir a banda ocupada. O filtro escolhido é o
filtro de Nyquist.
Define-se roll-off como a zona em que o filtro passa de passante (on) para o corte (off)
tal como indicado na Figura 4-9. Por definição, o roll-off R é igual a R = x / B e pode
variar de zero (pendente vertical) até 1 ou 100% quando x = B. O roll-off também se aplica
a filtros passa banda.

Figura 4-9 – Características do filtro de Nyquist
Um filtro com roll-off maior que zero, diminui o débito útil do sinal que passa por ele,
tanto mais quanto maior for o roll-off por isso largura ed banda e débito útil estão sempre
relacionados pelo roll-off pela fórmula BW = Débito útil x (1+Roll Off)
Para o DVB-S foi adoptado o roll-off de 0,35 (35%) por razões que serão explicadas
mais tarde.
4.2.1.7. MODULAÇÃO QPSK
Para transportar um sinal digital, utiliza-se normalmente uma onda electromagnética

sinusoidal de frequência muito elevada, capaz de se propagar em distâncias razoáveis,
através de antenas ou por cabo. Esta onda sinusoidal vai ser a portadora do sinal digital.
A variação de um sinal sinusoidal ao longo do tempo s(t), tem a forma:
s(t) = A sin ω.t + φ (A-amplitude; ω-pulsação/frequência; φ-fase na origem)

e pode ser graficamente representado no domínio do tempo, no domínio da frequência ou
no domínio da fase Figura 4-10.
Representação no domínio do tempo Representação no domínio da frequência Representação no domínio da fase
Variação da amplitude (de –Ap a Uma frequência constante fp com Um vector de amplitude Ap gira
+Ap) em função do tempo. amplitude Ap à velocidade angular Ω
A
A +Ap A Ap Ap ωt+φ
t fp φ
-Ap f
Figura 4-10 – Representação de uma portadora

Modular uma portadora sinusoidal consiste em fazer variar uma das suas
características (amplitude, frequência ou fase) ao ritmo do sinal que se quer transportar.
Nas modulações de sinais digitais, são utilizadas as três modulações da Figura 4-11.
(a) Modulação ASK (amplitude)) (b) Modulação FSK (frequência) (c) Modulação PSK (fase)
Figura 4-11 – Modulações digitais
Cada uma destas modulações tem vantagens e desvantagens, consoante a aplicação a

que se destina. Assim, a escolha da modulação a utilizar para determinado caso específico, é
sempre a opção que permita transmitir o maior número de bits possível, na menor largura
de banda possível e com o menor número de erros possível.
Na transmissão de sinais via satélite, os sinais digitais sofrem grande número de erros
devido aos cerca de 74.000Km que o sinal percorre entre terra-satélite-terra e ao facto dos
sinais chegarem muito fracos às antenas receptoras e serem facilmente interferidos por
ruídos industriais ou atmosféricos.
Para satélite, a melhor solução é uma modulação de fase, designada por PSK (Phase
shift keying – modulação por comutação de fase) e que se indica na Figura 4-11-(c).
Repare que nesta modulação cada vez que o sinal digital passa de “0” para “1” ou de
“1” para “0”, a portadora inverte a fase. O receptor ao identificar valor de fase da portadora
(0º ou 180º), pode assim obter o sinal digital que ela transporta, ou bit “0” ou bit “1”.
Como se podem identificar dois valores de fase, esta modulação é designada por
BPSK ou seja Binary Phase Shift Keying.
Em vez de se transmitir uma só portadora com informação de 2 fases, é possível

transmitir duas portadoras em simultâneo (ortogonais) e enviar informação de 4 fases, o que
permite identificar 2 bits de cada vez. Esta modulação chama-se QPSK (Quaternary Phase
Shift Keying) e é obtida a partir do transporte stream TS do MPEG-2 depois dos processos
inner-coding e puncturing já anteriormente descritos mas agora resumidos na Figura 4-12.

Figura 4-12 – obtenção de sinais I e Q
Os bits X e Y são transformados em bits I (In phase) e Q (in Quadrature) que vão
modular uma de duas portadoras desfasadas de 90º e o resultado final é a soma dessas
duas modulações (Figura 4-13).
s (t )  X cos (wt)  Y sen (wt)
Figura 4-13 – Modulador QPSK
Obtêm-se assim dois bits à saída (“00”, “01”, “10” ou “11”) e que podem estar posicio-
nados com fases de +45º, +135º, +225º e +315º (Figura 4-14).
QPSK Q
Figura 4-14 – Constelação QPSK
A este conjunto de bits identificável na fase, chama-se constelação. Repare que na

modulação QPSK se podem transmitir 2 bits de cada vez ou seja o dobro dos que se
transmitem na modulação BPSK.

Define-se eficácia como o número de bits por símbolo (b/Sy) e define-se símbolo
(Sy) como sendo o número de bits que é transmitido de cada vez.
Assim, em BPSK há um bit por símbolo enquanto que em QPSK há 2 bits por símbolo.
Numa transmissão QPSK a 10MSy/s estão a ser transmitidos 20Mb/s enquanto
que numa comunicação BPSK com os mesmos 10MSy/s apenas estão a ser
transmitidos apenas 10Mb/s.
Por vezes aparece a antiga unidade Baud, cujo sentido é o de “símbolos por
segundo”. Assim, um repetidor satélite de 36 MHz de largura de banda pode suportar um
débito bruto total de 60 Mbit/s, ou seja, um débito de símbolos igual a 30 MBaud.
A modulação QPSK é muito imune ao ruído mas na prática é impossível conseguir a

perfeição da constelação da Figura 4-14. Devido ao ruído de fase, os símbolos não caem nas
coordenadas exactas, mas formam uma constelação em torno delas (Figura 4-15).
Na Figura 4-15-(a) os símbolos têm pouco ruído e não há erros pois caem no
quadrante certo. Na Figura 4-15-(b) há muito ruído de fase e alguns dos símbolos ficam já
na fronteira entre quadrantes o que corresponde a erros. Na Figura 4-15-(c), os símbolos
têm tanto ruído que caem nos quadrantes indevidos (intermodulação) produzindo muitos
erros que inviabilizarão a reconstituição do sinal.
(a) Constelação QPSK com (b) Constelação QPSK com (c) Constelação QPSK com
pouco ruído e sem erros muito ruído e alguns erros intermodulação e muitos erros
Figura 4-15 – Constelação QPSK ruidosa
 CÁLCULO DO DÉBITO ÚTIL
A largura de banda de um canal satélite é normalmente de 36 MHz. Já vimos

anteriormente que o débito total do sinal binário que vai ser possível transportar é igual a:

Largura de banda
Débito bruto 
1  Rolloff
O DVB-S utiliza a modulação QPSK (cada símbolo transporta 2 bits) e adoptou o roll-off
de 0.35 (35%) por ser o melhor compromisso entre uma boa eficácia do filtro e um bom
rendimento. Assim, e como exemplo, num transponder com 36 MHZ de largura de banda,
36 MHz
Débito bruto (Msy/s)   26,6 Msy/s  53,2 Mbit/s
1  0,35
Na prática, adopta-se uma largura de canal ligeiramente maior, o que permite obter o
débito bruto de 27.5 MSy/s ou seja 55 Mbit/s.
Repare que neste valor estão incluídos os bits de redundância acrescentados tanto
pelo código Reed-Solomon como pelo código convolucional (FEC), por isso, para calcular o
débito útil (TS do MPEG-2) será necessário retirar estes bits adicionais.
Débito útil  Débito bruto x  Código RS x FEC
Pode então calcular-se uma tabela de valores de débito útil para um débito bruto de
27.5 MSy/s (55Mbit/s) num transponder de 36MHz de largura de banda, para cada um
dos valores de FEC e tendo em conta que o rendimento do código RS é de (η = 188/204).
FEC Débito útil (Mbit/s) Eficiência (bit/s/Hz)
1/2 25.34 0,69

Largura de Banda:
36MHz 2/3 33.79 0,94
Débito bruto: 3/4 38.01 1,05
27,5 MSy/s 5/6 42.24 1,17
55 Mbit/s
7/8 44.35 1,23
Define-se eficiência espectral como sendo a relação entre o débito útil e a largura de
banda, permitindo assim relacionar bits/s com Hz. Repare que a eficiência espectral do
DVB-S é da ordem de 1bit/s/Hz o que quer dizer que para uma largura de banda de 27MHz
se poderiam transmitir cerca de 27Mb/s úteis. Este valor é muito mais baixo do que o que se
obtém em DVB-C e DVB-T.

4.2.2. Receptor DVB-S
No receptor DVB-S procede-se ao inverso de todas as operações que foram

mencionadas anteriormente para a emissão e que são agora intuitivas (Figura 4-16)
Figura 4-16 – Diagrama de blocos do receptor DVB-S
Para melhor compreensão das partes constituintes dum receptor DVB-S analise a
Figura 4-17. É interessante reparar que o “coração” do sistema é um microprocessador
responsável por todo o controle e gestão do processo de recepção e descodificação do sinal.
Figura 4-17 – Receptor DVB-S

A tendência actual é fazer o receptor DVB-S com um único circuito integrado (one chip
receiver) que efectua todas as funções. Estes integrados podem ter mais do que 200 pinos e
são o resultado da miniaturização que a electrónica hoje permite.
4.3. Transmissão DVB-C
Nas redes de cabo, a problemática é diferente da transmissão satélite. Há o

inconveniente da largura de banda do canal DVB-C ser menor que no satélite (7 ou 8 MHz
por canal em vez dos 27 a 36 MHz dos transponders satélite) mas em contrapartida há a
vantagem de que o meio de transmissão para o DVB-C (cabo coaxial) ser, de todos os meios
de transmissão, o mais protegido contra ruídos. A modulação indicada para DVB-C deve por
isso ser do tipo AM (por a largura de banda ser reduzida) e não ter necessidade de grande
protecção contra erros (por o meio não ser ruidoso). A modulação QAM é a mais adequada
QAM por satisfazer essas condições e ter também, uma excelente eficiência espectral.
4.3.1. Modulação QAM
Em DVB-C utiliza-se a modulação QAM (Quadrature Amplitude Modulation), composta

por duas modulações de amplitude com portadora suprimida e em quadratura de fase. A
equação da modulação QAM, é: s (t )  X cos (wt)  Y sen (wt)
Em QAM podem transmitir-se desde 2 até 8 ou mais bits/símbolo aumentando muito o

rendimento em relação à modulação QPSK (Figura 4-18). A Figura 4-19 mostra um exemplo
QAM em que há possibilidade de transmitir 16 símbolos diferentes e por isso se designa por
16-QAM.
QPSK Q
Figura 4-18 – Constelação QPSK

16-QAM
Q
IkQk = 10 IkQk = 00
IkQk = 11 IkQk = 01
Figura 4-19 – Constelação 16-QAM
Repare que em QAM também existem 4 quadrantes e os eixos são representados por I
(infase) e Q (quadrature) tal como em QPSK. Se utilizarmos 5 bits por símbolo, obtemos
uma 32-QAM (Figura 4-20).
32-QAM
IkQk = 10 IkQk = 00
IkQk = 11 IkQk = 01
Utilizando um código de 6 bits/símbolo, obteremos uma 64-QAM (Figura 4-21).

64-QAM
IkQk = 10 IkQk = 00
IkQk = 11 IkQk = 01
Poder-se-ia continuar, aumentando o número de símbolos, (128-QAM, 256-QAM, etc)

mas quanto mais bits se utilizam, mais próximos os símbolos ficam uns dos outros e
portanto mais susceptíveis a erros e ao ruído porque um determinado símbolo pode ser
facilmente confundido com o símbolo vizinho. As redes de TV cabo em Portugal, trabalham
em 64-QAM, mas nos E.U.A. por exemplo, trabalham a 128-QAM e a 256-QAM.
4.3.1.1. Cálculo do débito útil
Nas redes de cabo, a largura de banda do canal de transmissão é de 8 MHz (largura

dos canais analógicos de TV em UHF). Já vimos que, devido ao filtro de Nyquist, o débito de
sinal binário que se vai poder transportar é igual a:
L argura do Canal
Débito útil 
1  RollOff
O RollOff escolhido para DVB-C é de =0.15 (meio protegido e banda estreita).
Portanto, para uma largura de 8MHz, o débito útil é de 6,96 Msy/s. Se utilizarmos uma
modulação de 64-QAM, como cada símbolo tem 6 bits, o débito bruto à saída do multiplexer
será de 6 x 6,96 = 41.76 Mbit/s já incluindo a codificação Reed-Solomon.

Como no DVB-C não há FEC, o débito útil final será, no máximo de:
188
Débito útil  41,76 x  38,48 Mb/ s
204
A eficiência espectral da 64-QAM será de 38,48 Mbit/s : 8MHz = 4,8 bit/s/Hz. Repare
que agora a eficiência espectral é cerca de 4 vezes maior do que a que se obtinha em DVB-S
(aproximadamente 1bit/s/Hz).
4.3.2. Diagrama de Blocos DVB-C
A Figura 4-22 mostra o diagrama de blocos de um sistema DVB-C, tanto na parte de

emissão (head-end) como na parte de recepção (IRD).
DVB-C Head-end
Sync Detect,
Invert &
MPEG-2 energy Convolutional
Outer Coder I
TS Baseband dispersal Interleaver Byte to m-tuple Diferential
8 8 8 m m Baseband
Interface conversion encoding
shapping Modulador
Detecção e I = 12
Código Reed n-QAM
CLOCK Interface inversão de Mapeamento Codificação
Solomon Delimitação da Q
Banda base sincronismo Entrelaçamento de bytes para Diferencial
(188,204,8) Banda base
e convolucional símbolos
Dispersão de
energia
DVB-C IRD – Integrated Receiver Decoder
Sync invert & MPEG-2

I energy TS
Convolutional dispersal
Matched filter Diferential Symbol to byte Baseband
deinterleaver Outer decoder remover
& equalizer Decoder mapping Interface
Desmodulador
n-QAM Q Descodific. Remoção de
Band Base Descodific. Mapeamento Interface CLOCK
desentrelaça/ Reed Solomon dispersão de
shapping diferencial de símbolos Banda base
convolucional energia e
para bytes
inversão de
sincronismo
Figura 4-22 – Diagrama de blocos de um sistema DVB-C

Repare que a maioria dos diagramas de blocos é idêntica à que se utilizava em DVB-S,
mas há realmente algumas diferenças que detalharemos a seguir ao longo da explicação de
funcionamento de cada um dos blocos.
4.3.2.1. Head-End DVB-C
Os primeiros blocos do Head-end de DVB-C são exactamente iguais aos do DVB-S

(rever Figura 4-3). Baseband Interface, Sync invert & energy dispersal, outercoder (RS) e
interleaver (I=12) funcionam exactamente como anteriormente descrito para o DVB-S.
No DVB-C não vai haver FEC por isso não existe o inner coder que existia no DVB-S.
Em contrapartida os dois blocos que se seguem (Byte-to-m Conversion e Diferential

Encoding) vão ser diferentes do DVB-S porque o modo de modulação também é.
4.3.2.1.1. Mapeamento Byte para Símbolo
Depois do convolutional interleaving, um mapeamento exacto de bytes para símbolo

tem que ser efectuado. Em cada caso, o bit mais significativo (MSB) do símbolo Z é retirado
do MSB do byte V. Correspondentemente, o bit mais significativo do símbolo será retirado do
bit mais significativo seguinto do byte. Para o caso da modulação 2m-QAM, o processo vai
mapear K bytes para n símbolos, de tal forma que: 8k = n x m
A Figura 4-23 mostra o caso de 64-QAM (com m=6, K=3 e n=4). Tenha em atenção
que b0 é o bit menos significativo (LSB) de cada byte
Figura 4-23 – Mapeamento byte para m-símbolo (64-QAM)
Uma melhor compreensão deste processo pode ser obtida analisando a Figura 4-24.

Figura 4-24 – Mapeamento de símbolos em QAM
4.3.2.2. Receptor DVB-C
No receptor DVB-C procede-se ao inverso de todas as operações que foram

mencionadas anteriormente para a emissão e que são agora intuitivas (Figura 4-22).
4.3.2.3. Transmodulação
Para um operador de TV por cabo, torna-se por vezes muito interessante difundir para
os seus assinantes, transponders completos provenientes de satélite (DVB-S). Para isso,
desmodula-se o sinal QPSK e volta a modular-se o Transport Stream (TS) do MPEG-2 mas
agora em 64-QAM efectuando também uma mudança das tabelas SI. O único factor a ter em
conta é que o débito útil do transponder seja inferior a 38.5 Mbit/s, o que é o mesmo que
dizer que para os transponders actuais, a FEC deve ser inferior ou igual a 3/4.
A título de exemplo, se um transponder tiver uma FEC de 2/3, o seu bitrate será de
33.79 Mbit/s. Depois da aplicação do código Reed-Salomon, o bitrate passa para 33.79 x
(204/188)=36.66 Mbit/s. Como a modulação 64-QAM transporta 6 bits por símbolo, então o
débito útil final será de 36.66/6=6.11 MSymbol/s. A largura de banda ocupada no cabo será
então de 6.11 x (1+Roll Off), quer dizer 6.11 x 1.15=7.03 MHz o que cabe perfeitamente
num canal UHF de 8MHz.
4.4. Transmissão DVB-T
Transmitir uma trama binária por via hertziana não é tarefa fácil e isso explica a razão
pela qual a tecnologia DVB-T foi a última a aparecer.

Há 3 tipos de recepção terrestre:
 Recepção fixa - é o modo tradicional, através das antenas individuais,

colectivas ou similares instaladas nos telhados dos edifícios.
 Recepção portátil – é a que se faz em qualquer local do edifício ou ao
ar livre sem necessidade que o receptor esteja ligado a uma antena fixa
ou a uma tomada de corrente fixa.
 Recepção móvel – em equipamentos de recepção instalados em
veículos em movimento. Antes da TV digital, este tipo de recepção era
impensável em condições minimamente aceitáveis. Com a TV digital
(DVB-T) as provas realizadas até agora demonstraram que a recepção
móvel é perfeita mesmo a altas velocidades (até cerca de 120Km/h).
4.4.1. Características do canal
Caracteriza-se pelos seguintes fenómenos físicos:
 A refracção do sinal sempre que atravessa um meio de índice diferente

daquele de onde provém.
 a difracção e a reflexão devida a obstáculos.
Todos estes fenómenos produzem ecos (propagação por trajectos múltiplos devido à
presença de obstáculos) e as somas e diferenças de fase entre esses sinais provocam
“fading” (desvanecimentos) que são fenómenos que podem mesmo anular chegar a anular a
intensidade de sinal num dado instante e numa dada frequência.
Quando se está em recepção fixa, portátil ou móvel, a probabilidade de receber

unicamente a onda directa proveniente de um emissor, é nula. Receber-se-á sempre o sinal
directo do emissor mas também muitos outros sinais atenuados e atrasados provenientes de
diferentes ecos.
A resposta de frequência num dado canal, é sempre a resultante de uma propagação

com trajectos múltiplos, com ecos e reflexões entre emissor e receptor e portanto não é
uniforme ao longo das frequências do canal, apresentando máximos e mínimos ao longo do
espectro do canal (Figura 4-25).

Amplitude
T1
T2
Canal 8MHZ Frequência
Figura 4-25 - Fading nos sinais TV terrestre
Para além da resposta de frequência não ser constante ao longo da frequência,

também pode variar ao longo do tempo (T1 e T2).
Como os canais de TV têm uma largura de banda elevada, a perda de informação em

algumas das frequências e ao longo do tempo, não senso crítica em TV analógica, é no
entanto extremamente nociva em DVB-T pois a perda de grandes sequências binárias
inviabiliza a recepção de qualquer sinal.
Para tentar resolver este problema, nasceu a idéia de repartir a informação sobre
milhares de portadoras criando assim sub-canais de largura de banda muito estreita, para
que a resposta de frequência do canal possa ser considerada como constante. Assim sendo,
esses pequenos sub-canais ficam menos sujeitos às variações de amplitude devidas ao
fading e mediante técnicas de correcção de erros (código convolucional), o sistema pode
mesmo tornar-se quase que livre de erros.
Foi assim inventado um tipo de modulação que de designa por COFDM (Coded
Ortogonal FDM) e que resolve os problemas inerente à propagação de sinais DVB-T.
“FDM” (Frequency Division Multiplex) porque se utilizam milhares de portadoras, cada

uma contendo informação separada. “ORTOGONAL” porque as portadoras estão separadas
entre si e “CODED” porque os sinais utilizam códigos convolucionais de protecção de erros.
4.4.2. Codificador DVB-T
Um Transport Stream (TS) proveniente de um multiplex MPEG-2 vai passar pelas

etapas indicadas na Figura 4-26.

Figura 4-26 – Codificador DVB-T
4.5. COFDM
Nos anos 60, os laboratórios Bell descobriram a modulação OFDM (Orthogonal

Frequency Division Multiplex) que desde então, começou a ser utilizada para aplicações
militares.
No início dos anos 80, o laboratório de pesquisa francês CCETT - Centre Commun
d’Etudes en Télédiffusion et Télécommunication - fez algumas alterações à modulação
OFDM e introduziu a COFDM que se tornou desde logo como o único meio verdadeiramente
robusto para transportar informação digital de TV terrestre.
Os seus trabalhos contribuíram para o estabelecimento de dois standards que irão

estar presentes no futuro tanto em rádio como em TV:
 DAB - Digital Audio Broadcasting system

 DVB-T - Terrestrial Digital Video Broadcasting system - DVB-T
4.5.1. Partição do canal OFDM
Para implementar a modulação COFDM, é necessário fazer a partição do canal de

transmissão tanto no domínio do tempo como no domínio da frequência.
O COFDM divide o canal em células segundo o eixo dos tempos e o eixo das

frequências (Figura 4-27).
l da
C a Ba n
Tempo
na
do de
ra
rg u
La
sub-banda
frequência
c ia
ên
qu
segmento
F re
tempo
Figura 4-27 – Partição OFDM
 O domínio da frequência é dividido num conjunto de pequenas “sub-bandas de

frequência”
 O domínio do tempo é dividido num conjunto de pequenos “segmentos de
tempo” contíguos.
4.5.2. Inserção de Sub-portadoras
Cada partição frequência/tempo, é utilizada para transportar uma sub-portadora

dedicada (Figura 4-28).
Símbolo OFDM
al
tempo
a d r a de
an
oc
ba a r g u
L
nd
ia
nc
uê
Símbolo OFDM Sub-portadoras

eq
Fr
Figura 4-28 – Domínio tempo/frequência do sinal OFDM
Durante o período que cada segmento de tempo demora, as sub-portadoras são

moduladas com alguns bits de dados codificados. O número de bits a transmitir por sub-
portadora depende do tipo de modulação a utilizar, por exemplo: 2 bits se for utilizada 4-
QAM, 4 bits para 16-QAM, 6 bits para 64-QAM, etc.)

Ao conjunto de sub-portadoras que existem num segmento de tempo chama-se
símbolo OFDM.
Dentro de cada símbolo OFDM, e para evitar a interferência entre portadoras, as sub-
portadoras são espalhadas ortogonalmente entre si, pelo que o espaçamento entre
portadoras é igual ao inverso da duração do símbolo.
4.5.3. Inserção de intervalos de guarda
O problema seguinte que é preciso resolver, são as interferências inter símbolos,

devidos aos atrazos introduzidos no sinal por causa das reflexes em obstáculos (fantasmas).
Estes sinais, têm que ser identificados e ignorados, evitando assim que eles possam ir
interferer com a recepção de sinais que foram emitidos depois deles.
Para evitar este efeito, um intervalo de guarda é inserido entre cada símbolo OFDM
(Figura 4-29).
DADOS ÚTEIS
DADOS CODIFICADOS
INSERÇÃO do INTERVALO de GUARDA
1 Intervalo de
Parte utilizada
0 Guarda
1 do Símbolo
1
0
Tempo
ia
nc
uê
DURAÇÃO do
eq
SÍMBOLO OFDM
Fr
Figura 4-29 – Duração do símbolo COFDM
Durante o período do intervalo de guarda, correspondendo a uma interferência

intersímbolo, os receptores têm que ignorar o sinal recebido: este período de tempo
tempo é constituído por uma mistura do actual símbolo o sinal principal e as réplicas
atrasadas do anterior símbolo OFDM.
Como todos os códigos de protecção que se adicionam aos dados úteis, também o

período do intervalo de guarda (durante o qual o canal não é utilizado), constitui uma perda
na capacidade de transmissão do canal.
Para aumentar ainda mais a robustez da modulação COFDM, é necessário mitigar

algumas das lacuna dos códigos de protecção. Geralmente, estes códigos não conseguem
corrigir longass sequências (bursts) de bits errados.
Para evitar isso, espalham-se bits contíguos, por várias portadoras afastadas. Este
processo é chamado de “frequency interleaving” e está também ilustrado na Figura 4-29.
Tal como indicado na Figura 4-26, o sinal digital é primeiro codificado com recurso a
códigos convolucionais. A seguir é inserido um intervalo de guarda. Finalmente dados
contíguos são separados por portadoras distantes (frequency interleaving).
4.5.4. Sincronização do Canal
O sistema DVB-T utiliza portadoras piloto, que vão servir para a sincronização dos
sinais como se fossem markers.
DVB-T Transmission Frame
Boosted pilot
time
Channel
Bandwidth
ncy
que
f re
Figura 4-30 – Portadoras piloto
Existem 3 tipos de portadoras piloto: Continual pilots (para sincronização da

frequência), scattered pilots (para estimação de canal) e Transmission parameter signalling
(TPS) que transmitem informação sobre o code rate, intervalo de guarda, modulação etc.etc.

4.6. Constelações
4.6.1. Constelação Básica
Mapear dados nos símbolos OFDM significa que cada subportadora irá ser
individualmente modulada de acordo com uma das 3 constelações DVB-T e que se indicam
na Figura 4-31.
Figura 4-31 – Constelações QAM
Dependendo da constelação escolhida, 2 bits (4-QAM), 4 bits (16-QAM) or 6 bits (64-

QAM) são transportados de cada vez em cada subportadora, mas cada constelação tem uma
robustez própria, atendendo à minima C/N requerida para a modulação ser viável. A
modulação 4-QAM é 4 a 5 vezes mais tolerante ao ruído que a modulação 64-QAM.
4.6.2. Constelação Hierárquica
A modulação hierárquica constitui uma utilização alternativa às constelações 16-QAM e

64-QAM básicas.
Como se mostra na Figura 4-32, a modulação hierárquica pode ser vista como uma
separação em dois circuitos virtuais do canal de radiofrequência, cada um com o seu bitrate
específico, uma robustez específica e igualmente, com áreas de cobertura também

diferentes.
HP LP
10
HP LP 10
1101
01
4QAM over 4QAM 16QAM over 4QAM
10 1101
1001
Figura 4-32 – Constelação hierárquica DVB-T
4.7. As redes de frequência única (SFN)
As vantagens da modulação COFDM são muitas, mas o que a torna realmente única é
a sua imunidade aos ecos (fantasmas). Estes ecos podem ser produzidos quer por reflexões
em obstáculos (montes, edifícios, etc.), quer por vários emissores vizinhos operando no
mesmo canal de RF.
Graças às suas características, o COFDM consegue aproveitar os ecos construtivos (os

que aumentam a potência recebida) e ignorar os efeitos negativos dos outros ecos. Assim
sendo, o COFDM oferece aos operadores de radiodifusão, pela primeira vez, a possibilidade
inovadora de poderem utilizar a mesma frequência de emissão em todos os emissores da
rede, (mesmo que estejam muito próximos), aumentando assim a área de cobertura sem
aumentar a utilização do espectro.
A este tipo de redes dá-se o nome de Redes de Frequência Única (ou do inglês SFN –

Single frequency networks)
Para realizar uma rede de frequência única, é preciso que os emissores operem:
 Na mesma frequência (sincronização em frequência)

 No mesmo instante (sincronização no tempo)
 Transportando exactamente os mesmos bits de informação
Todos os emissores da rede têm que, obrigatoriamente, estar perfeitamente

sincronizados quer no tempo quer na frequência. Para conseguir este objectivo (bem difícil),
recorre-se à grande precisão da base de tempos do sistema GPS.
4.7.1. Sincronização no tempo
As limitações no domínio do tempo constituem um novo desafio para os operadores de

difusão:
É OBRIGATÓRIO QUE CADA EMISSOR TRANSMITA O MESMO SÍMBOLO OFDM

EXACTAMENTE NO MESMO INSTANTE.
O valor do intervalo de guarda escolhido para a rede SFN tem uma grande
importância para o bom funcionamento da rede. Como a duração do intervalo de guarda dita
qual o tempo máximo de eco admissível pelo sistema, é ele que influencia a máxima
distância entre emissores trabalhando na mesma frequência. (Figura 4-33).
Figura 4-33 – Sincronização no tempo

O intervalo de guarda deve ser considerado globalmente como um “tempo
indispensável”. Será neste intervalo não utilizado que será possível compensar um mau
sincronismo temporal de um emissor da rede.
Na prática, o operador da rede utiliza 1 impulso por segundo (1PPS) fornecido pelo
receptor GPS. Esta referência de tempo autoriza a inserir um marcador de tempo no
multiplex, à entrada da rede de distribuição primária, para permitir, em cada emissor, ao
processador COFDM de retardar o multiplexer a entrar até que um instante comum de
tempo de difusão se produza.
4.7.2. Sincronização na frequência
A frequência de cada sub portadora do canal será rigorosamente controlada por todos
os emissores da rede.
Figura 4-34 –Sincronização na frequência
4.7.2.1. Alguns números
O DVB-T, definiu os parâmetros seguintes:
 O intervalo de guarda (Delta) pode ser igual a: 7, 14, 28, 56, 112 ou 224 µs.
Quanto maior for o intervalo de guarda mais protegido está o símbolo.
 A duração de um símbolo é igual a: 4, 8, 16, 32 vezes Delta
 A modulação das portadoras pode ser: QPSK, QAM 16 ou QAM 64.

Débito útil (Mbit/s) em função da relação
Modulação FEC Delta/Duração de um símbolo
1/4 1/8 1/16 1/32
1/2 4.98 5.53 5.85 6.03
2/3 6.64 7.37 7.81 8.04

QPSK 3/4 7.46 8.29 8.78 9.05
5/6 8.29 9.22 9.76 10.05
7/8 8.71 9.68 10.25 10.56
1/2 9.95 11.06 11.71 12.06
2/3 13.27 14.75 15.61 16.09

16-QAM 3/4 14.93 16.59 17.56 18.10
5/6 16.59 18.43 19.52 20.11
7/8 17.42 19.35 20.49 21.11
1/2 14.93 16.59 17.56 18.10
64-QAM 2/3 19.91 22.12 23.42 24.13
3/4 22.39 24.88 26.35 27.14
5/6 24.88 27.65 29.27 30.16
7/8 26.13 29.03 30.74 31.67
4.7.2.2. Vantagens e desvantagens do DVB-T
 Total compatibilidade com as instalações de recepção analógicas actualmente em

utilização (antenas, distribuições colectivas, etc)
 O sistema é insensível aos ecos (fantasmas)
 Deixa de haver saturação do espectro pois vários emissores podem utilizar a mesma
frequência.
 Com 25 Mbit/s úteis por canal, é possível difundir 6 a 8 programas digitais onde
agora apenas se transmite um só programa analógico.
 Possibilidade de interromper canais nacionais para transmitir programas locais.
 Possibilidade de recepção em interiores e em movimento com grande qualidade.
As únicas desvantagens são o custo das infra estruturas e dos novos emissores
terrestres e a complexidade e preço alto dos desmoduladores

4.8. Transmissão DVB-IPTV
A mais recente e promissora técnica para transmissão de televisão digital, é a

tecnologia DVB-IPTV. Com uma oferta recente mas crescente e já bastante divulgada no
mercado português, este sistema leva TV digital (+ internet e telefone) a casa do cliente
pela linha telefónica ADSL2+.
A designação IPTV vem do facto de a transmissão de TV se fazer utilizando a rede IP

(internet). A internet é uma rede aberta mas o sinal IPTV é distribuído como rede privada.
É justamente esta a diferença, pois IPTV não é televisão na internet (isso é TVIP), mas
sim televisão distribuída pela rede IP.
A Figura 4-36 mostra o sistema IPTV típico para 2 canais de TV, voz e internet
Figura 4-35 – Diagrama do Serviço IPTV (PTComunicações)

A Figura 4-36 mostra o espectro de frequências dos sinais ADSL2+.
Figura 4-36 –Espectro ADSL2+
Repare que o sinal de telefone está separado dos sinais de TV e de Internet e que
estes têm duas vias distintas e assimétricas, upload e download através das quais é possível
a interactividade.
À saída da tomada de telefone é instalado um filtro (splitter) para separar os sinais de

telefone dos sinais de TV e Internet. Os sinais IP de TV e de Internet, são encaminhados por
um router que os distribui para as Set Top Boxes (STB) e para eventuais computadores.
A STB tem como funcionalidade receber o sinal IP e transformá-lo em sinal de

televisão para poder ser visto nos televisores. Normalmente serão instaladas apenas duas
STB porque a instalação de mais é altamente condicionada pelo débito binário actual do
ADSL2+ que depende muito da distância à central telefónica.
Figura 4-37 – Distâncias em ADSL
Repare que no máximo o débito ideal poderia atingir os 24Mb/s mas o normal devido
às distâncias, anda pelos 8Mb a 16 Mb/s.

Com as técnicas de compressão H.264 e VC-1, é possível transmitir um bom sinal de
TV digital com apenas 2 a 3Mb/s para televisão standard (SD) e cerca de 6 a 8Mb/s para
televisão de alta definição (HD).
Por norma o serviço IPTV não se instala em clientes com menos do que 8Mb/s.
Garantem-se assim dois canais de TV (cerca de 6 Mb/s e ainda internet a cerca de 2 Mb/s.
Utilizadores com cerca de 12 Mb/s terão já possibilidade de maiores velocidades de

internet (cerca de 8Mb/s) quando estiverem a ver dois programas SD ou de cerca de 4 Mb/s
se estiverem a ver um programa SD e outro HD.
Repare que a velocidade de internet fica dependente dos canais de TV e não o

contrário.
Utilizadores próximos da central (20-24Mb/s) terão serviços de TV e de internet com as

velocidades máximas que esta tecnologia permite.
4.9. Transmissão DVB-H
A próxima e realmente promissora técnica em termos de DVB, já em período

experimental em alguns países, é o DVB-H que permitirá receber canais de TV em
receptores móveis nomeadamente, telemóveis (Figura 4-38), notebooks e PDA.
Figura 4-38 – equipamento protótipo DVB-H
A tecnologia DVB-H não é a que actualmente se utiliza para ver alguns programas de
TV nos telemóveis. Actualmente é utilizada uma tecnologia baseada em IP e o sinal de TV é
transmitido como parte do sinal de internet. Este sistema deixará de ter interesse real, com o

advento do DVB-H.
DVB-H vai trabalhar nas bandas VHF e UHF já utilizadas em TV (mas que
progressivamente ficarão cada vez mais livres com o final das emissões analógicas. Utilizará
também se necessário a banda L.
VHF-III (170-230 MHz)

UHF-IV/V (470-862 MHz)
L (1.452-1.492 GHz)
Os sinais DVB-T e DVB-H coexistirão nos mesmos multiplexers na emissão de sinal.
A tecnologia DVB-H é ideal para a recepção móvel de TV porque responde aos dois
maiores desafios que aí se colocam e que são:
 a grande perda de dados por condições de recepção adversas

 e o curto tempo de duração das baterias dos equipamentos.
O DVB-H assegura recepção estável mesmo em locais difíceis porque incorpora uma
correcção de erros adicional, chamada MPE-FEC que não existe em DVB-T e que opera ao
nível IP permitindo recuperar o sinal mesmo que muitos pacotes se percam.
O DVB-H permite aumentar a duração das baterias do equipamento, porque reduz o

consumo de potência em cerca de 90% comparado com o DVB-T. Para fazer isso emprega a
tecnologia “time-slicing” que transmite apenas impulsos em vez de transmitir continuamente,
permitindo ao receptor desligar entre esses impulsos.
Figura 4-39 – a) Time slicing
Outra diferença em relação ao DVB-T é o modo de modulação 4K (Figura 4-40). Este

compromisso entre o modo 8K (que permite recepção a grandes distâncias ao emissor mas a
velocidade limitada) e o modo 2K (que permite boa velocidade mas só a curta distância do
emissor), permitirá recepção estável a alta velocidade.
Figura 4-40 – a) Modos 2k, 4K e 8K
O TPS (Transmission parameter signaling) utilizado pelo DVB-T pode aqui ser utilizado
para indicar ao receptor se é uma recepção DVB-H e em caso afirmativo, quais as
características que estão a ser utilizadas (Figura 4-41)
Figura 4-41 – TPS
O DVB-T e o DVB-H são muito semelhantes, o que pode ser observado na Figura 4-42.
O multiplexer do TS aceita os sinais de TV mas a novidade agora é que pelo menos um dos
TS venha de um encapsulador DVB-H IP por forma a o empacotar no TS.
O TS originado no multiplexer é aplicado ao modulador/transmissor que suporte o

modo 4K e os bits do TPS específicos do DVB-H. Os operadores podem combinar serviços
DVB-T e DVB-H na mesma rede e no mesmo multiplexer poupando assim custos acrescidos
o que incrementará a curto prazo a difusão de serviços DTH.

Figura 4-42 – Sinais DVB-T e DVB-H combinados

1. O que é o BER?
2. Indique os 5 principais tipos de DVB.
3. Qual o tipo de modulação utilizada em DVB-S e porquê?
4. Qual o tipo de modulação utilizada em DVB-C e porquê?
5. Qual o tipo de modulação utilizada em DVB-T e porquê?
6. Na transmissão IPTV de que depende o débito final em casa do cliente?
7. Dê uma ideia resumida de quais os dois obstáculos que foram vencidos pelo DVB-H

Capítulo
Capítulo 5 - Standards, Glossário, Links,

e Bibliografia
.Fornecem-se as referêcias dos documentos contendo as normas
MPEG e DVB, bem como glossário e os principais links de internet, e
bibliografia. Os termos utilizados são predominantemente em inglês mas
são a cópia do original o que facilita a pesquisa e análise.
5.1. STANDARDS
GERAL
DVB-Cook A guideline for the use of DVB specifications and standards TR 101 200
TRANSMISSÃO
DVB-S Digital broadcasting systems for television, sound and data EN 300 421
services; Framing structure, channel coding and modulation for
11/12 GHz satellite services
Digital Video Broadcasting (DVB); Implementation of Binary Phase TR 101 198

Shift Keying (BPSK) modulation in DVB satellite transmission
systems
DVB-C Digital broadcasting systems for television, sound and data EN 300 429
cable system
DVB-CS Digital broadcasting systems for television, sound and data EN 300 473
services; Satellite Master Antenna Television (SMATV) distribution
systems
DVB-MS Digital broadcasting systems for television, sound and data EN 300 748

Multipoint Video Distribution Systems at 10 GHz and above
DVB-MC Digital broadcasting systems for television, sound and data EN 301 749
Multipoint Video Distribution Systems below 10 GHz
DVB-T Digital broadcasting systems for television, sound and data ETS 300 744
digital terrestrial television
Digital broadcasting systems for television, sound and data EN 300 744
digital terrestrial television
Implementation guidelines for DVB terrestrial services; TR 101 190

Transmission aspects
DVB-SFN Specification of a Mega-frame for SFN Synchronisation TS 101 191
DVB-DSNG Framing structure, channel coding and modulation for Digital EN 301 210
Satellite News Gathering (DSNG) and other contribution
applications by satellite
Co-ordination channels associated with Digital Satellite News EN 301 222

Gathering (DSNG)
User guidelines for Digital Satellite News Gathering (DSNG) and TR 101 221
other contribution applications by satellite
MPEG
DVB-MPEG Digital broadcasting systems for television; Implementation ETR 154

guidelines for the use of MPEG-2 systems; Video and audio in
satellite and cable broadcasting applications
MULTIPLEXAGEM
DVB-SI Digital broadcasting systems for television, sound and data ETS 300 468
services; Specification for Service Information (SI) in Digital Video
Broadcasting (DVB) systems
Guidelines on implementation and usage of service information ETR 211
Digital broadcasting systems for television, sound and data ETR 162
services; Allocation of Service Information (SI) codes for Digital
Video Broadcasting (DVB) systems
DVB-TXT Digital broadcasting systems for television, sound and data EN 300 472
services; Specification for conveying ITU-R System B Teletext in
Digital Video Broadcasting (DVB) bitstreams
DVB-DATA Specification for the transmission of data services in DVB EN 101 192
bitstreams
Specification for the transmission of data services in DVB EN 101 192

bitstreams

Implementation guidelines for Data Broadcasting TR 101 202
SUBTITLING
DVB-SUB Digital broadcasting systems for television, sound and data ETS 300 743
services; Subtitling systems
INTERFACING
DVB-CI Common Interface Specification for Conditional Access and other EN 50221
Digital Video Broadcasting Decoder Applications
Guidelines for Implementation and Use of the Common Interface for R 206 001
DVB Decoder Applications
Digital Video Broadcasting (DVB); Extensions to the Common TS 101 699

Interface Specification (EN 50221)
DVB-PI Interfaces for CATV/SMATV Headends and similar Professional EN 50083-9

Equipment
DVB-IRDI Interface for DVB-IRDs EN 50201
Interface for DVB Integrated Receiver Decoder (DVB-IRD) TS 102 101
DVB-PDH DVB interfaces to PDH networks ETS 300 813
DVB-SDH DVB interfaces to SDH networks ETS 300 814
DVB-ATM DVB interfaces to ATM networks TR 300 815
HOME NETWORKS
DVB-HAN Home Access Network (HAN) with an Active Telco Network TS 101 224
Termination
INTERACTIVITY
DVB-NIP Network Independent Protocols for DVB Interactive Services ETS 300 802
Guidelines for the use of the Network Independent Protocols for TR 101 194)
DVB Interactive Services
DVB-RCC DVB interaction channel for Cable TV distribution system (CATV) ETS 300 800
DVB interaction channel for Cable TV distribution system (CATV) ES 200 800
Guidelines for the implementation and usages of the specification TR 101 196
for DVB interaction channel for Cable TV distribution systems
(CATV)
DVB-RCP DVB interaction channel through the Public Switched ETS 300 81
Telecommunications System (PSTN) / Integrated Services Digital

Network (ISDN)
DVB-RCD DVB interaction channel through Digital Enhanced Cordless EN 301 193
Teleommunications (DECT)
DVB-RCL DVB interaction channel for LMDS distribution systems EN 301 199
DVB interaction channel for LMDS distribution systems EN 301 199
DVB-RCG Interaction channel through the Global System for Mobile EN 301 195
communications (GSM)
DVB-RCCS DVB Interaction Channel for Satellite Master Antenna Television TR 101 201
(SMATV) system; Guidelines for version based on satellite and
coaxial sections
DVB-RCS Interaction channel for Satellite Distribution Systems EN 301 790
MULTIMEDIA HOME PLATFORM
DVB-MHP Multimedia Home Platform (Version 1.0)
MEASUREMENT
DVB-M Measurement guidelines for DVB systems ETR 290
Usage of the DVB test and measurement signalling channel (PID TR 101 291
0x001D) embedded in an MPEG-2 Transport Stream (TS)
5.2. GLOSSÁRIO
Adaptation Ancillary program data (especially PCR) which are uncoded and are
Field transmitted at least every 100ms acc. to MPEG2 or 40 ms acc. to DVB
specifications
BAT Bouquet Association Table describing a bouquet of programs offered by a

broadcaster
Block 8x8 pixel block, MPEG2 coded
CA Conditional Access Information of whether the program is scrambled
CAT Conditional Access Table (PID=1): Reference to scrambled programs
CIF Common Intermediate Format Picture format
CRC Cyclic Redundancy Check
DCT Discrete Cosine Transform
DCT-' / IDCT Inverse Discrete Cosine Transform
DFD Displaced Frame Difference Differential picture if there is motion
DPCM Differential Pulse Code Modulation

DTS Decoding Time Stamp Stamp for decoding time, only transmitted if not
identical with PTS; reference to PID
EIT Event Information Table TV guide
ES Elementary Stream Compressed data stream for video, audio or data.

Preliminary stage to PES
GOP Group of Pictures I, P, and B pictures. Intra-coded pictures (I), predicted

pictures (P) and bidirectional prediction pictures (B)
IRD Integrated Receiver Decoder Receiver with (MPEG) decoder
MPEG Motion Picture Experts Group

sometimes called Moving Picture Experts Group
MUSICAM Masking Pattern Adapted Universal Subband Integrated Coding and

Multiplexing Compression method for audio coding
NIT Network Information Table Information about orbit, transponder etc.
PAT Program Association Table (PID=O):

List of all the programs contained in TS Multiplex with reference to PID of
PMT
Pay Load Useful data in TS
PCM Pulse Code Modulation PCR Program Clock Reference Reference in TS

for the 27-MHz clock recovery. Transmitted at least every 0.1 sec
PES Packetized Elementary Stream

Video and audio data packets and ancillary data of definable length
PES Header Ancillary data for an elementary stream
PID Packet Identification.

Identification of programs in the transport stream
PMT Program Map Table:

Reference to packets with PCR. Name of programs, copyright, reference of
the data streams with PI Ds etc. belonging to the relevant program
Prediction Prediction of a picture (P or B) with indication of a motion vector
Profile Subdivision of video coding into different resolutions
PS Program Stream Multiplex of several audio and video PES using the same
clock.
PSI Program Specific Information

Data transmitted in TS for the demultiplexer in the receiver (eg PAT, PMT,
CAT)
PTS Presentation Time Stamp Time stamp for vision and sound, transmitted at
least every 0.7 sec. Integrated into PES
Q Quantization
Q -' Inverse quantization
QS Quantization scaling

RLC Run Length Coding Coding of data with different number of bits. Frequently
reoccurring data has the smallest number of bits, data seldom reoccurring
have the highest number of bits.
RST Running Status Table Accurate and fast adaptation to a new program run if
time changes occur in the schedule
Section A table is subdivided into several sections. If there is a change, only the
section affected is transmitted
SI Service Information All the data required by the receiver to demultiplex and
decode the various programs in the TS
SIF Source Input Format
SCR System Clock Reference Reference in ES for synchronizing the system

demultiplex clock in the receiver, transmitted at least every 0.7 sec.
Integrated into PES
SDT Service Description Table Description of programs offered
STC System Time Clock 27-MHz clock, regenerated from PCR for a jitter-free
readout of MPEG data
SYNC (byte) Synchronization byte in TS header value 0x47
TS Transport Stream
TS Header The first 4 bytes of each TS packet contain the data (PID) required for the
demultiplexer in addition to the sync byte (0x47). These bytes are never
scrambled
TDT Time and Date table UTC time and date
TOT Time Offset Table UTC time and date with indication of local time offset
UTC Universal Time, Coordinated Greenwich meantime
VBR Variable Bit Rate
VLC Variable Length Coding Coding of data with

variable number of bits (also see RLC)
ZigZag Scan Zigzag scan of quantized DCT coefficient matrix. This gives an efficient run
length coding (RLC
5.2.1. DVB
ADSL Asymmetric digital subscriber line

A COFDM-coded digital data stream with a rate up to 8 Mbit/s (down
stream) and 1 Mbit/s (up stream) is transmitted via ATSC telephone lines,
mainly for video on demand.
CNR Carrier to Noise Ratio. (relação portadora/ruído) Indica quantos db’s a

portadora está acima do ruído
COFDM Coded Orthogonal Frequency Domain Multiplex

Up to 6817 single carriers 1.116 kHz apart are QAMmodulated with
up to 64 states.

"Coded" means that the data to be modulated has error control.
Orthogonality means that the spectra of the individual carriers do
(almost) not influence each other as a spectral maximum always
coincides with a spectrum zero of the adjacent carriers.
A single-frequency network is used for the actual transmission.
Constellation Way of representing the I and Q components for OAM or OPSKmodulation.

Diagram The position of the points in the constellation diagram provides information
about distortions in the OAM
or OPSK modulator as well as about distortions after the transmission of
digitally coded signals.
DVB Digital Video Broadcasting
DVB-C Digital Video Broadcasting - Cable

Sinal de TV digital para redes de cabo
DVB-S Digital Video Broadcasting - Satellite

Sinal de TV digital para recepção via satélite
DVB-T Digital Video Broadcasting - Terrestrial

Sinal de TV digital para recepção via antenas terrestres
Convolutional The data stream to be transmitted via satellite and terrestrial (DVB-S, DVB-
Coding T) is loaded bit by bit into shift registers. The data which is split and delayed
as it is shifted through different registers is combined in several paths. This
means that double the data rate (2 paths) is usually obtained. Puncturing
follows to reduce the data rate: the time sequence of the bits is predefined
by this coding and is represented by the trellis diagram.
FEC Forward Error Correction Error control bits added to useful data in the
OAMIOPSK modulator for DVB-C, -S and DVB-T.
Single- Transmitter network in which all the transmitters use the same frequency.
frequency The coverage areas overlap. Influece of echoes are minimized by guard
network intervals. The transmitters are separated by up to 60 km. The special
feature of these networks is efficient frequency utilization
Guard additional safety margin between two transmitted symbols in the COFDM
interval standard. The guard interval ensures that echoes occurring in the single-
frequency network are eliminated until the received symbol is processed.
Interleaver The RS-protected transport packets are reshuffled byte by byte by the 12-
channel interleaver. (RS FEC Reed Solomon FEC) Due to this reshuffle
what were neighbouring bytes are now separated by a maximum of 2244
bytes from other TS packets. The purpose of this is the burst error control
for defective data blocks
Mapping Conversion of bytes (8 bits) to 2n-bit wide symbols.

n is thus the bit width for the I and Q quantization; eg at
64 GAM the symbol width is 2n = 6 bit, n = 3, ie
I and Q are subdivided into 23 = 8 amplitude values each
Puncturing Puncturing (DVB-S and -T) follows to reduce the increased data rate after
convolutional coding: Various registers are not used. The additional
redundancy is used for error control. The two data streams after puncturing
are directly applied as I and Q input signals to the QAM or OPSKmodulator
after filtering to fulfil the first Nyquist criterion.

QAM Quadrature Amplitude Modulation
Type of modulation for digital signals (DVB-C and -T). Two signal
components I and Q are each quantized and modulated onto two orthogonal
carriers as appropriate for the GAM level (4, 16, 32, 64, 128, 256). The
constellation diagram is obtained by plotting the signal components with I
and Q as the coordinate axes. Therefore, 2, 4, 5, 6, 7 or 8 bits of a data
stream are transmitted with one symbol, depending on the GAM level (4, 16,
32, 64,128, 256). This type of modulation is used in cable systems and for
coding the COFDM single carriers
QEF Quasi Error Free Less than one uncorrected error per hour at the input of
the MPEG2 decoder.
(BER <_10-")
QPSK Quadrature Phase Shift Keying Type of modulation for digital signals (DVB-
S and -T). The digital, serial signal components I and Q directly control
phase shift keying. The constellation diagram with its four discrete states is
obtained by representing the signal components using the I and Q signals
as coordinate axes. Due to the high nonlinear distortion in the satellite
channel, this type of modulation is used for satellite transmission: The 4
discrete states all have the same amplitude that is why nonlinear amplitude
distortions have no effect.
RS Protection RS(204,188,8) (RS = Reed Solomon) 16-byte long error control code added
Code to every transport packet consisting of 187 (scrambled) bytes +1 syncbyte
with the following result:
The packet has a length of 204 bytes and the decoder can correct up to T =
8 errored bytes. This code ensures a residual Bit Error ratio BER of approx.
1x10-" (QEF) at an input error ratio of 2x10-4.
SFN Single Frequency Network
Trellis The time sequence of the bits (DVB-S and -T) is predefined by convolutional
Diagram coding and, like the state diagram of a finite automaton, is represented as a
trellis diagram.
Viterbi Viterbi decoding makes use of the predefined time sequence of the bits
Decoding through convolutional coding (DVB-S and -T). Thanks to a series of logic
decisions, the most probably correct way is searched for through the trellis
diagram and incorrectly transmitted bits are corrected.
5.3. LINKS Internet (activos em 11/11/2007)
5.3.1. MPEG Video Overview
 MPEG Video Webpage at Heinrich-Hertz-Institut Berlin

An overview on past and present activities of the MPEG video group.
 MPEG-1 and MPEG-2 Digital Video Coding Standards at Heinrich-Hertz-Institut

Berlin

An overview of the MPEG-1 and MPEG-2 video coding algorithms and standards and
their role in video communications.
 An Introduction to MPEG Video Compression by John Wiseman

A very nice presentation of MPEG Video.
 MPEG Overview at C-Cube

A short overview of MPEG Video.
 Video Compression Overview at Simon Fraser University

A good overview of MPEG Video and other video compression algorithms.
 MPEG Compression Algorithm by Woobin Lee

An overview of the MPEG Video compression algorithm.
 Understanding MPEG for Video Compression at Vela

 MPEG Background at UC Berkeley (mirror at YONSEI University, Seoul, Korea)

 DSS and MPEG Technical Notes by Chad Fogg
 Annex D of the MPEG-2 Video standard at Fraunhofer Institute

An overview of the features supported by the MPEG-2 Video standard.
 Some parts of the MPEG-2 Video standard at Fraunhofer Institute

This gives some idea of what is in the MPEG-2 Video standard document. The
technical chapters of the standard are not available on-line.
 MPEG-2 Fundamentals for Broadcast and Post-Production Engineers at Tektronix

A very good overview of the representation of video in MPEG-2 and a discussion on
the newly adopted 4:2:2 profile at main level.
 A/54 Guide to the Use of the ATSC Digital Television Standard at ATSC
Look for the document called A/54. Section 5 of this large document is an introduction
and overview of the subset of the MPEG-2 Video standard used for HDTV.
 Toward Digital Video Compression Part III of III at tsc news

An overview of Discrete Cosine Transform (DCT) and entropy encoding which form
the basis for JPEG and MPEG compression.
 MPEG-2 Kompression für Videosequenzen (in German) at Universität Würzburg

An overview of MPEG-2 Video.
 Was ist MPEG ? (in German) at Cybersite

An overview of MPEG Video.
 Digitale Video Beschreibung (in German) at Phade Software

 MPEG Datenformate (in German) at Institut für Betriebs und Dialogsysteme

A detailed presentation of MPEG-1 Video, part of a larger Multimedia-Datenformate
document.
 Exposé sur MPEG (in French) at ENSIMAG, France


 MPEG-1 Overview (in Korean) at YONSEI University, Seoul, Korea
5.3.2. MPEG Video FAQs
 MPEG FAQ by Chad Fogg at UC Berkeley (mirror at BYU)

The best MPEG FAQ, by a member of the MPEG committee. Emphasis on Video.
 MPEG-1 Video Questions and Answers by Luigi Filippini

This FAQ is part of the Moving Picture Expert Group Information Page.
 MPEG FAQ by Peter Gubanov
 MPEG-4 Video FAQ by The MPEG Video Subgroup

Official MPEG-4 Video FAQ from the MPEG Committee.
 YCbCr Color Space (Powerpoint format) by Keith Jack

A FAQ about the Color Space used by MPEG Video.
 Color FAQ and Gamma FAQ by Charles A. Poynton
5.3.3. MPEG Video Resources
 Test Model 5 (aka TM5) at MPEG.ORG

A document originating from the MPEG committee. TM5 served as a cook book for
creating video bitstreams during the collaborative co-exerpimental phase of the
development of MPEG-2 video. It contains lots of very useful technical informations
about MPEG-2 Video encoding techniques.
 MPEG2, Video Mixers and Moles by Adrian Rawlings
 Generic Quantiser For Transcoding Of Hybrid Video by O H Werner

A paper from the ACTS ATLANTIC project.
 Real-time transcoding of MPEG-2 video bit streams by P N Tudor

 Flexible switching and editing of MPEG-2 video bitstreams by P J Brightwell & M J

Knee
 Vision Model-Based Assessment Of Distortion Magnitudes In Digital Video by the

Sarnoff Corporation
This paper describes the operation and general structure of the Just-Noticeable
Difference (JND) Model is described, and discusses its performance in a range of
video applications.
 Search for University Papers about MPEG

Numerous MPEG-related publications from various universities.

 Digital Video, MPEG and Associated Artifacts at Imperial College of London
Comparison of a competing standards, discussion on applications of digital video,
possible artifacts caused by video compression.
 Introduction to Digital Video Coding and Block Matching Algorithms by Colin Manning
at University College, Cork, Ireland
An overview of Video Compression techniques and an interesting presentation of the
various Block Matching algorithms used for Motion Estimation in MPEG encoders.
 MPEG QoS Filtering for Multipeer Communications at Lancaster University

An interesting presentation of simple MPEG Video bitstream filters that can be used
to change the bitrate and QoS (Quality of Service) on the fly without transcoding
them. Source code available.
 MPEG Video in Software: Representation, Transmission, and Playback at Berkeley

Multimedia Research Center
This paper describes the MPEG-1 video file representation and the mechanisms
required to support full-function playback.
 Distributed Real Time Interactive (DiRTI) Video (v 2.0) at Carnegie Mellon University.
An Implementation of a Highly Available, Distributed, Real Time Video Server
supporting MPEG Aware Parity Encoding (MAPE). See also An Implementation of a
Distributed Video Server supporting MPEG Aware Parity Encoding (MAPE).
 Multiprocessor Architectures and Algorithms for Real-time MPEG-2 Video Coding at

Washington University
 MPEG-2 Video Decoding on Programmable Processors: Computational and

Architectural Requirements at Washington University
 Real-time MPEG Video Codec on a Single-chip Multiprocessor at Washington

University
 DCT-Based Video Codec Overview at DSPLAB, Univ. of Maryland
 DCT-Based Motion estimation at DSPLAB, Univ. of Maryland
 MPEG Compliance Bistream Design at Sarnoff Corporation
 Performance of a Software MPEG Video Decoder by Lawrence A. Rowe et al.
 Digital Video, MPEG and Associated Artifacts by Shanawaz A. Basith and Stephen R.
Done at Imperial College, London
 MPEG Facts and Infos by Eric Young at Cornell University - Infos about using UC
Berkeley's MPEG-1 encoder mpeg_encode
 An Algorithm for Lossless Smoothing of MPEG Video (postscript) by Simon S. Lam

and Simon Chow and David K. Y. Yau
 Lexicographically Optimal Rate Control for Video Coding with MPEG Buffer
Constraints (postscript) by Dzung T. Hoang and Elliot Linzer and Jeffrey S. Vitter
 Modeling Bit Rate Variations in MPEG Sources (postscript) by Marwan Krunz and
Satish K. Tripathi

 Impact of Synchronization on the Allocation of Bandwidth for Multiplexed MPEG
Streams (postscript) by Marwan Krunz and Satish K. Tripathi
 MPEG Video in Software: Representation, Transmission, and Playback by Lawrence

A. Rowe, Ketan D. Patel, Brian C. Smith and Kim Liu
 Real-Time Parallel MPEG-2 Decoding in Software by Angelos Bilas, Jason Fritts and
Jaswinder Pal Singh
 Optimal Parallel MPEG Encoding by Jeffrey Moore, William Lee, Scott Dawson and
Brian Smith
 RD-OPT: An Efficient Algorithm for Optimizing DCT Quantization Tables by Viresh

Ratnakar and Miron Livny
 Implementation of fast IDCT using IDFT by J.Anders
 On the extraction of DC sequence from MPEG Compressed Video by Boon-Lock Yeo

and Bede Liu
5.3.4. MPEG Video Software
 MPEG Software Simulation Group (MSSG)

Home of mpeg2play, mpeg2decode, vmpeg etc.
 MPEG Research at U.C. Berkeley

Home of mpeg_play, mpeg_encode and other tools.
 Stony Brook Video Server project (with source code) by Andrew Shuvalov
A distributed video server application that provides indexing, searching and video
streaming to clients over a network (overview).
 MPEG-1 Video Player JAVA APPLET by J.Anders

The first MPEG-1 Video player ever written entirely in Java (with source code).
Rather slow as you can imagine, but it works! Can play Systems streams, but drops
audio.
 MPEG-1 Video Player JAVA APPLET by Carlos Hasan

A minimalist MPEG-1 Video player written entirely in Java (with GPL source code).
Can only play video elementary streams.
 MPEG2Tool by University of Pennsylvania

MPEG-1/MPEG-2 video software encoder with Motif interface supporting SNR
scalable coding, data partitioning, spatial scalability and temporal scalability (with
source code).
 MPEG-2 Video decoder and verifier (mpeg2decode) at CSTV (mirror at UC Berkeley)

This is the reference source code software verifier produced by the MPEG Committee
as draft of the Technical Report (Part-5 of the MPEG-1 and MPEG-2 standards).
 MPEG Stuffs and Documents at Transmission Technology Research Labs of Korea

Telecom (KT TTRL)
A large repository of public-domain MPEG utilities.

 MPEG Video Player (with audio) for various Unix Platforms at MpegTV
Also plays VCDs.
 LSX MPEG-2 Video Player and Encoder (with audio) at Ligos

Beta versions are free.
 Elecard MPEG-2 Player at Elecard (new)

Free MPEG-2 Video Player for Windows.
 MPX Player for Solaris at Sun

Yes, Sun is now giving away its famous "Mpeg Expert" Player (aka MPX)! You can
find it burried in this free Java Client package, available on Sun's anonymous ftp site.
Look for a file called mpx.
 MPEG-1 Video analysis and edit program (mpegUtil) by Phillip Lougher
 MPEG-1 Video encoder (MPEGTool) at University of Pensilvania, mirror at University

of Waikato
 MPEG-1 Video encoder (Stanford PVRG-MPEG) at Ircam, mirror at Stanford

University
 MPEG-2 Video encoder (mpeg2codec) at UC Berkeley
 MPEG Plot (with source code) at ADVENT
 MPEG-1 encoding library (MPEGe Lib) by Alex Knowles
 MPEG-1 Grabber for X displays (XMG) by Chris Thornton
 The Xanim Home Page - useful but does not do too good with MPEG
5.3.5. MPEG Video Test Bitstreams
 MPEG-2 Video official conformance testing bitstreams at CSTV (mirror at UC

Berkeley, mirror at sunet.se, mirror at Tektronix)
Those conformance bitstreams are the official test bitstreams provided by the MPEG
committee.
 MPEG-2 Video test bitstreams at Tektronix

Lots of them, with bitrate from 1.5 to 40 Mbps.
 Compliance Bitstreams at Sarnoff Corporation

Commercial package includes MPEG-1 and MPEG-2 video bitstreams designed for
visual conformance tests (i.e. tell if decoder is compliant just by playing the streams
and looking at the display). Try some of their demo compliance bitstreams.
 MPEG Video Compliance Bitstreams at HP

Those are the Sarnoff Compliance Bitstreams, sold by HP.

5.3.6. MPEG Normas
ISO/IEC 13818-1:2000 Information technology -- Generic coding of moving pictures and

associated audio information: Systems (available in English only)
associated audio information: Video (available in English only)
associated audio information -- Part 3: Audio (available in English only)
associated audio information -- Part 4: Conformance testing (available in English only)
ISO/IEC 13818-4:1998/Cor 2:1998 (available in English only)
ISO/IEC 13818-4:1998/Amd 1:1999 Advanced Audio Coding (AAC) conformance testing
(available in English only)
ISO/IEC 13818-4:1998/Amd 2:2000 System target decoder model (available in English only)
ISO/IEC 13818-4:1998/Amd 3:2000 Additional audio conformance bitstreams (available in
English only)
ISO/IEC TR 13818-5:1997 Information technology -- Generic coding of moving pictures and
associated audio information -- Part 5: Software simulation (available in English only)
ISO/IEC TR 13818-5:1997/Amd 1:1999 Advanced Audio Coding (AAC) (available in English
only)
associated audio information -- Part 6: Extensions for DSM-CC (available in English only)
ISO/IEC 13818-6:1998/Amd 1:2000 Additions to support data broadcasting (available in
English only)
ISO/IEC 13818-6:1998/Amd 2:2000 Additions to support synchronized download services,
opportunistic data services and resource announcement in broadcast and interactive
services (available in English only)
associated audio information -- Part 7: Advanced Audio Coding (AAC) (available in English
only)
associated audio information -- Part 9: Extension for real time interface for systems decoders
(available in English only)
associated audio information -- Part 10: Conformance extensions for Digital Storage Media
Command and Control (DSM-CC) (available in English only)

5.4. BIBLIOGRAFIA
· Digital broadcasting systems for television, sound and data services;

Allocation of Service Information (SI) codes for Digital Video Broadcasting
(DVB) systems (ETR 162). - European Telecommunications Standards Institute
(ETSI), 1995.
· Digital Video Broadcasting (DVB); DVB SimulCrypt; Part 1: Head-end
architecture and syncronization (TS 101 197-1). - European Telecommunications
Standards Institute (ETSI), 1997.
· Digital Video Broadcasting (DVB); Framing structure, channel coding and
modulation for 11/12 GHz satellite services (EN 300 421). - European
Telecommunications Standards Institute (ETSI), 1997.
modulation for cable systems (EN 300 429). - European Telecommunications
modulation for digital terrestrial television (EN 300 744). - European
Telecommunications Standards Institute (ETSI), 2001.
· Digital Video Broadcasting (DVB); DVB mega-frame for Single Frequency
Network (SFN) synchronization (TS 101 191). - European Telecommunications
· Digital Video Broadcasting (DVB); Guidelines on implementation and usage of
Service Information (SI) (ETR 211). - European Telecommunications Standards
Institute (ETSI), 1997.
· Digital Video Broadcasting (DVB); Implementation guidelines for the use of
MPEG-2 Systems, Video and Audio in satellite, cable and terrestrial
broadcasting applications (ETR 154). - European Telecommunications Standards
Institute (ETSI), 1997.
· Digital Video Broadcasting (DVB); Measurement guidelines for DVB systems
(ETR 290). - European Telecommunications Standards Institute (ETSI), 1997.
· Digital Video Broadcasting (DVB); Specification for Service Information (SI)
in DVB systems (EN 300 468). - European Telecommunications Standards Institute
(ETSI), 1998.
· Digital Video Broadcasting (DVB); Interaction channel for Cable TV
distribution systems (CATV) (ETS 300 800). - European Telecommunications
· Digital Video Broadcasting (DVB); Support for use of scrambling and
Conditional Access (CA) within digital broadcasting systems (ETR 289). -
European Telecommunications Standards Institute (ETSI), 1996.
· Cable modem termination system – network side interface specification. –
Stuart Lipoff. 1996.
· Cable return path – the evolution to digital. – C.J. Appleton. 1999.
· Digital Video: M-JPEG, MPEG-2, DVC and DVD. – Charles Poynton. 1998.
· MPEG-2: The basics of how it works. - Hewlett-Packard Company. 1997.
· Protecting MPEG-2: FEC schemes in DVB-C, S, T. - Hewlett-Packard Company.
1997.
· Varis Autors – Introducción a la televisión por satélite. – Publicaciones Televés.
1997.
· Estudi i anàlisi de les trames de televisió digital. – TFC d’Enginyeria i
Arquitectura La Salle. Edgar Romero. 2000.
· Estudio de sistemas de recepció de televisión digital terrestre (DVB-T). TFC
d’Enginyeria i Arquitectura La Salle. Carlos Subías. 2001.


TV Digital PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

TV Digital PDF

Enviado por

Direitos autorais:

Formatos disponíveis

Manual de TV DIGITAL

Este manual destina-se a ser utilizado como documento de apoio a cursos

Manual de TV Digital Pág. 1

Capítulo 1 - Introdução ao DVB 6

1.1. Do Analógico ao Digital 6

2.1. Introdução à Compressão 29

Manual de TV Digital Pág. 2

Capítulo 3 - Multiplexagem MPEG 58

3.1. Introdução à multiplexagem 58

Manual de TV Digital Pág. 3

Manual de TV Digital Pág. 4

5.1. STANDARDS 121

Manual de TV Digital Pág. 5

Capítulo 1 - Introdução ao DVB

1.1. Do Analógico ao Digital

1.1.1. Informação Analógica

Tudo o que vemos, tudo o que ouvimos são grandezas analógicas.

Manual de TV Digital Pág. 6

1.1.2. Informação Digital

Um relógio em que o ponteiro dos segundos salta de segundo em segundo, em vez de

Figura 1-1 – Informação Digital

1.1.3. Porquê Digital

A pergunta é inevitável, então... porquê digital se tudo ao nosso redor é analógico?

 PREÇO: com a tecnologia actual, os sistemas digitais, são regra geral,

Manual de TV Digital Pág. 7

1.2. Digitalização de sinais

Conversão PROCESSAMENTO Conversão

Figura 1-2 – Digitalização de sinais analógicos

Manual de TV Digital Pág. 8

Figura 1-3 – Processo completo de digitalização de sinais

A seguir analisaremos cada uma destas fases em pormenor.

1.3. Converter Analógico em Digital

O processo de conversão A/D tem as três fases já mencionadas, e que se resumem na

Manual de TV Digital Pág. 9

Vin AMOSTRAGEM QUANTIFICAÇÃO CODIFICAÇÃO Vout

Figura 1-4 – Processo de conversão A/D

Um sinal analógico é contínuo no tempo e portanto contém uma infinidade de valores.

Contudo, demonstrou-se que, para converter um sinal analógico em digital, basta

Figura 1-5 - Amostragem

Manual de TV Digital Pág. 10

Qual deve então ser a frequência de amostragem correcta?

Como exemplos, um sinal de áudio (frequências de 20 a 20 KHz) terá que ser

Figura 1-6 - Aliasing

Manual de TV Digital Pág. 11

Em (a) a frequência de amostragem é maior que duas vezes a do sinal. Há amostras

Em (b) a taxa de amostragem é igual a duas vezes a frequência do sinal. Não é

Em (c) a frequência de amostragem é menor que o dobro da frequência do sinal. A

A Figura 1-7 mostra mais claramente a influência da frequência de amostragem.

Figura 1-7 – Efeito da frequência de amostragem

Por isso adoptam-se sempre frequências de amostragem ligeiramente acima do dobro

Os circuitos que geram a frequência de amostragem no processo de conversão A/D

Depois da amostragem segue-se o processo de quantificação (ou quantização).

Quantificar (quantizar) consiste em medir o valor da tensão obtida em cada amostra

Manual de TV Digital Pág. 12

Quanto mais bits forem utilizados maior será a precisão do processo.

Cada intervalo corresponde a 2V e portanto tanto um sinal de 0,2V como um sinal de

Como se pode constatar, uma quantificação a 2 bits produz erros enormes.

(com 2 bits só há 4 valores possíveis)

Figura 1-8 – Amostragem a 2 bits (4 níveis)

Manual de TV Digital Pág. 13

(com 4 bits já há 16 valores possíveis)

Valor digital das amostras

Figura 1-9 – Amostragem a 4 bits (16 níveis)