Escolar Documentos
Profissional Documentos
Cultura Documentos
TEKTRONIX
www.tektronix.com.br
MPEG
Editora SENAI
Rio de Janeiro
2009
© 2009. TEKTRONIX
Direitos da obra original em inglês.
Tradução e impressão autorizadas para o SENAI Departamento Nacional.
Tradutor
Dalton Vilella Camilher
Revisora Técnica
Nelia Caetano
T 235 m Tektronix.
MPEG / Tektronix ; tradução Dalton Vilella Camilher. - Rio
de Janeiro : Ed. SENAI, 2009.
224 p. : il. ; 23 cm. - (Coleção TV Digital)
Tradução de: MPEG fundamentals and protocol analysis
including DVD and ATSC
Inclui glossário
ISBN 978-85-99002-15-5
1. Engenharia eletrônica e comunicação. 2. MPEG. I. SENAI
Departamento Nacional. II. Título.
CDD: 621.3880028
Editora SENAI
Rua São Francisco Xavier, 417 - Maracanã
20550-010 - Rio de Janeiro - RJ
Tel.: (0XX21) 3978-5314
editorasenai@rj.senai.br
SUMÁRIO
1.1 Convergência
11
Seção 1
12
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
13
Seção 1
14
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
Algumas das técnicas no mundo digital são bastante diferentes, mas prin-
cípios similares se aplicam. Por exemplo, o MPEG transforma sinais em um
domínio diferente para permitir a isolação da informação irrelevante. A
transformação para sinais de diferença de cor ainda é empregada, mas as
técnicas digitais permitem filtrar o sinal de diferença de cor para reduzir
a resolução vertical para outras aplicações.
15
Seção 1
16
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
17
Seção 1
18
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
19
Seção 1
20
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
21
Seção 1
A figura 1-3 mostra que um vídeo PES e um número de áudio PES podem ser
combinados para formar um programa stream, desde que todos os codifica-
dores sejam controlados por um clock comum. A marcação de time em cada
PES pode ser usada para assegurar o sincronismo labial entre o vídeo e o
áudio. Programas stream têm pacotes de tamanhos variáveis de cabeçalhos.
Eles são usados em transferência de dados em discos óticos e HDs (Hard
Disk), os quais são essencialmente livres de erros e dos quais são esperados
arquivos de tamanhos arbitrários. Os DVDs usam programa stream.
Para transmissão e radiodifusão digital, vários programas e seus PES as-
sociados podem ser multiplexados em um simples transporte stream. Um
transporte stream difere de um programa stream onde os pacotes PES são
subdivididos mais adiante em pequenos pacotes de tamanho fixo e onde
múltiplos programas codificados com diferentes clocks podem ser trans-
portados. Isto é possível porque um transporte stream tem um mecanismo
de programa de referência de clock (PCR) que permite a transmissão de
múltiplos clocks, um dos quais é selecionado e restaurado no decoder. Um
programa único de transporte stream (SPTS) também é possível e isto
pode ser encontrado entre um codificador e um multiplexador. Desde que
um transporte stream possa sincronizar (genlock) o clock do decoder com
o clock do encoder, o SPTS é mais comum que o Programa stream.
Um transporte stream é mais que um simples multiplexador de áudio e
vídeo PES. Além do áudio, vídeo e dados comprimidos, um transporte
stream inclui metadados descrevendo o bit stream. Isto inclui a tabela de
associação de programa (PAT) que lista todos os programas no transporte
stream. Cada entrada na tabela PAT aponta para uma tabela de mapa de
programa (PMT) que lista os streams elementares complementando cada
programa. Alguns programas serão abertos, mas alguns poderão estar su-
jeitos a acesso condicional (criptografados) e esta informação é também
carregada nos metadados.
O transporte stream consiste de pacotes de dados de tamanho fixo, cada
um contendo 188 bytes. Cada pacote leva um código identificador de
programa (PID). Os pacotes no mesmo stream elementar têm todos os
mesmos PID, de tal forma que o decoder (ou o demultiplexador) pode se-
lecionar stream(s) elementar que quiser e rejeitar o restante. A contagem
22
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
23
Seção 1
24
A única solução para estes problemas é reduzir o fator de compressão.
Conseqüentemente, o usuário de compressão terá de fazer um julgamento
de valor entre a economia de um alto fator de compressão e o nível de
artefatos.
Além de aumentar o delay da codificação e da decodificação, a codifica-
ção temporal também causa dificuldade na edição. De fato, o bit stream
MPEG não pode ser editado arbitrariamente. Esta restrição ocorre porque,
na codificação temporal, a decodificação de uma imagem pode requerer o
conteúdo de uma imagem anterior e o conteúdo pode não estar disponível
após uma edição. O fato de que as imagens podem ser enviadas fora de
seqüência complica a edição.
Se a codificação apropriada estiver sendo usada, as edições podem ser
feitas, mas somente em pontos de emendas que sejam relativamente es-
paçosos. Se for necessária uma edição arbitrária, o stream MPEG precisa
ser submetido a um processo de decodificar-modificar-recodificar, o que
resultará em perda de geração.
Seção 2
Compressão de Vídeo
29
Seção 2
30
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
31
Seção 2
2.3 Ponderação
A figura 2-4 mostra que a percepção humana aos ruídos de imagens não
é uniforme, mas é em função da freqüência espacial. Mais ruído pode ser
tolerado em altas freqüências espacial. Também, ruído no vídeo é efetiva-
mente mascarado por detalhes finos na imagem, enquanto que em áreas
maiores é altamente visível. O leitor esteja ciente de que medidas tradi-
cionais de ruído são freqüentemente ponderadas de tal forma que medidas
técnicas relatam mais precisamente os resultados subjetivos.
32
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
33
Seção 2
34
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
35
Seção 2
Não obstante o uso da varredura, coeficientes zero irão ainda aparecer en-
tre valores significantes. A codificação Run lenght (RLC) permite que estes
coeficientes sejam trabalhados mais eficientemente. Onde estão presentes
valores repetidos, tal como uma linha de zeros, o RLC simplesmente trans-
mite o número de zeros em vez de cada bit individualmente.
36
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
37
Seção 2
38
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
39
Seção 2
A solução para estes problemas é usar um sistema que não seja comple-
tamente diferencial. A figura 2-10 mostra que imagens completas são
periodicamente enviadas.
Estas são chamadas imagens Intra-codificadas (ou imagens I), e são obtidas
somente pela compressão espacial. Se um erro ou uma troca de canais ocor-
rer, será possível reiniciar a decodificação correta na próxima imagem I.
40
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
41
Seção 2
42
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
2.10 Imagens I, P e B
Em MPEG, três tipos diferentes de imagens são necessários para dar supor-
te às codificações diferencial e bidirecional, minimizando a propagação
do erro.
Imagens I são imagens Intracodificadas que não necessitam de informação
adicional para decodificação. Elas exigem grande quantidade de dados em
comparação com outros tipos de imagens, e por isso elas não são transmi-
tidas freqüentemente mais do que o necessário. Consistem primariamente
de coeficientes transformados e não têm vetores. Imagens I são decodifi-
cadas sem referências a nenhuma outra imagem, assim elas permitem ao
observador mudar de canais, e elas impedem a propagação do erro.
43
Seção 2
44
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
Existem dois tipos de GOP, aberto e fechado. Um GOP fechado não requer
referência externa. Na ordem de exibição, pode começar com uma imagem
I e terminar com uma imagem P. Na ordem de transmissão usualmente
ocorrerão imagens B seguindo a última imagem P, mas estas são imagens
que serão exibidas antes daquela última imagem P.
É possível começar e/ou terminar um GOP fechado com imagens B (em
ordem de exibição), mas neste caso, a imagem B inicial ou final tem que
ser codificada usando apenas uma única direção de predição. Imagens B
no início de um GOP fechado têm que usar somente predição atrasada.
Imagens B no final de um GOP fechado podem usar somente predição
adiantada – similar à imagem P, mas as regras de imagens B seriam usadas
para requantização, etc.
Um GOP aberto não tem estas restrições nos vetores de predição. Por
exemplo, Imagens B no final do GOP podem usar predição adiantada da
última imagem P e predição atrasada da primeira imagem I do próximo
GOP. Esta estrutura é levemente mais eficiente, mas as predições podem
ultrapassar quaisquer limites da imagem. É muito mais difícil unir bit stre-
ams; e eventos como mudança de canais são mais prováveis de causarem
erros de imagens.
45
Seção 2
46
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
47
Seção 2
48
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
49
Seção 2
2.12 Pré-Processamento
50
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
51
Seção 2
2.13 Wavelets
52
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
53
Seção 2
54
Seção 3
Compressão de Áudio
57
Seção 3
58
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
59
Seção 3
60
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
A figura 3-6 mostra bit stream de áudio em MPEG camada 1. Após o padrão
de sincronização e o cabeçalho, há códigos de alocação de 32 bits de
quatro bits cada. Estes códigos descrevem o comprimento da palavra das
amostras em cada sub-banda. Logo após vem os 32 fatores de escala usa-
dos no “companding” de cada banda. Estes fatores de escala determinam
o ganho necessário ao decoder para retornar o áudio em seu nível correto.
Os fatores de escala são seguidos, por sua vez, pelos dados do áudio em
cada banda.
61
Seção 3
A figura 3-8 mostra que quando o filtro separador de bandas é usado para
conduzir o modelo de mascaramento, a análise espectral não é muito
precisa, desde que há somente 32 bandas e a energia poderia estar em
qualquer lugar da banda. O piso de ruído não pode ser muito elevado
porque, no pior caso mostrado, o mascaramento pode não funcionar. Uma
análise espectral mais acurada permitiria um fator de compressão mais
alto. No MPEG camada 2, a análise espectral é executada por um processo
separado. Uma FFT (Fast Fourier Transform) de 1024 pontos trabalhando
diretamente na entrada é usada para conduzir o modelo de mascaramento.
Para analisar freqüências mais precisamente, o tempo de varredura da
transformação tem que ser aumentado, o que é feito pelo aumento do
tamanho do bloco para 1152 amostras.
Como o esquema de “companding” dos blocos é o mesmo da camada 1,
nem todos os fatores de escala são transmitidos, desde que contêm um
grau de redundância em material de programa real. O fator de escala de
blocos sucessivos na mesma banda difere de 2dB, menos de dez por cento
62
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
63
Seção 3
64
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
65
Seção 3
66
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
3.9 AC-3
67
Seção 3
68
Seção 4
Os Padrões
71
Seção 4
72
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
73
Seção 4
74
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
- Nitidez de vídeo;
- Objetos visuais como “chuvisco” ou “fantasma”;
- Fidelidade de cores;
- Sincronização de áudio/vídeo;
- Suavidade dos movimentos.
4.3.2 Licenciamento
75
Seção 4
4.4 MPEG-1
76
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
4.5 MPEG-2
77
Seção 4
tos integrados em larga escala, significava que o MPEG-2 poderia ser usa-
do em um vasto número de aplicações. O sucesso do MPEG-2 é mais bem
realçado pelo fim do MPEG-3, direcionado para televisão de alta definição.
O MPEG-3 foi rapidamente abandonado quando ficou claro que o MPEG-2
poderia conciliar esta aplicação com facilidade. O MPEG-2 é, obviamente,
a base para ambos os padrões de transmissão ATSC e DVB, e o sistema de
compressão usado pelo DVD.
78
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
Com pequenas exceções, o MPEG-1 foi projetado com uma tarefa: a co-
dificação de imagens de tamanho fixo e áudio associado a um bit rate
conhecido de 1,5 Mbits/s. As ferramentas e a sintaxe do MPEG-1 podem
e têm sido usadas para outros propósitos, mas tal uso é fora do padrão e
requer encoders e decoders proprietários. Há somente um tipo de decoder
que condiz com o padrão do MPEG-1.
No princípio, havia um propósito similar para o MPEG-2. Ele foi destinado
à codificação para transmissão de som e imagens, nominalmente em sis-
temas de televisão entrelaçado de 525/60 e 625/50. Entretanto, à medida
que os projetos progrediam, ficou claro que as ferramentas desenvolvidas
eram capazes de lidar com muitas dimensões de imagens e uma grande
faixa de bit rate. Além disso, ferramentas mais complexas foram desen-
volvidas para codificação de sistemas escalonáveis. Isto significa que, na
prática, não poderia haver um simples decoder MPEG-2. Se um decoder
fosse capaz de manusear bit streams de alta velocidade codificados usan-
79
Seção 4
80
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
81
Seção 4
4.6 MPEG-4
82
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
- Abaixo de 64 Kbits/s;
- De 64 a 384 Kbits/s;
- De 384 Kbits/s até 4 Mbits/s.
A performance em baixo bit rate foi mantida como objetivo maior e al-
gumas idéias muito criativas contribuíram para este fim. Grande atenção
também foi dada à capacidade de recuperação a erros, tornando o MPEG-4
muito útil para emprego em ambientes propícios a erros, tais como trans-
missão para dispositivos de manuseio pessoal. Entretanto, outros profiles
e níveis usam bit rate de até 38,4 Mbits/s, e ainda há trabalhos em anda-
mento sobre profiles e níveis de alta qualidade que usam taxas de dados
de até 1,2 Gbits/s.
O mais importante é que o MPEG-4 se tornou muito mais que apenas mais
um sistema de compressão – ele evoluiu para um conceito totalmente novo
de codificação multimedia com ferramentas poderosas para interatividade e
um vasto campo de aplicações. Um “resumo” oficial deste padrão abrange
67 páginas, então apresentaremos aqui uma breve introdução ao sistema.
83
Seção 4
84
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
Estas capacidades não têm que ser usadas – o MPEG-4 proporciona codi-
ficação tradicional de áudio e vídeo, e aperfeiçoa o MPEG-2 pela possibi-
85
Seção 4
4.6.4 Escalabilidade
86
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
87
Seção 4
88
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
89
Seção 4
90
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
91
Seção 4
loop para reduzir estes artefatos, que podem afetar múltiplos quadros se
usados como blocos de predição em quadros futuros.
Uma técnica de suavização por superposição é também empregada para
reduzir as descontinuidades indesejáveis nos contornos dos blocos. Esta
usa transformada que sobrepõem levemente os contornos dos blocos para
minimizar as margens dos artefatos.
A figura 4-7 mostra que o VC-1 tem três profiles: Simples, Principal e Avan-
çado. Os profiles Simples e Principal precisam ser encapsulados dentro de
um envelope ASF, enquanto que os Avanced profile streams podem existir
como streams elementares independentes.
O Avanced profile alcança muitos aspectos associados à indústria bro-
adcast visto que dá suporte tanto ao entrelaçado quanto à codificação
progressiva. É também facilmente encapsulado em formatos de contêiner
e de transporte.
Os três profiles têm entre dois e cinco níveis que correspondem amplamente
à escala de vídeo em ambos os termos bit rate e resolução. Isto proporciona
uma faixa adequada para aplicações móveis de Vídeo de Alta Definição.
92
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
- Interoperabilidade;
- Capacidade de extensão;
- Plataforma Independente;
93
Seção 4
4.9 MPEG-21
94
Seção 5
Fluxos Elementares
96
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
97
Seção 5
98
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
99
Seção 6
Empacotamento de Fluxos
Elementares (PES)
103
Seção 6
6.3 PTS/DTS
104
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
105
Seção 7
Programa Stream
109
Seção 7
110
Seção 8
Transporte Stream
113
Seção 8
8.2 Pacotes
114
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
115
Seção 8
A figura 8-2 mostra como o PCR é usado pelo decodificador para recriar
uma versão remota do clock de 27-MHz para cada programa. Os clocks do
codificador mantêm um contador binário constantemente funcionando, e
o valor destes contadores são periodicamente testados e colocados nos
campos de adaptação do cabeçalho como PCR. O PCR é um número de 42-
bits que é representado por uma base PCR de 33-bits, mais uma extensão
PCR de 9-bits para prover uma alta resolução. (A base PCR, como o PTS
é um número de 33-bits que é uma amostra de um contador guiado por
um clock de 90-KHz). Aos pacotes gerados por cada codificador é dado
um PID. O decodificador reconhece os pacotes com o PID correto para o
programa selecionado e ignora os outros. No decodificador uma tensão
controlada do oscilador (VCO) gera um clock nominal de 27-MHz e este
guia um contador local de PCR. O PCR local é comparado com o PCR do
cabeçalho do pacote e a diferença é um erro de fase de PCR. Este erro é
filtrado pelo controle de VCO que eventualmente trará o contador local em
cada etapa com o cabeçalho PCRs. Uma forte filtragem de VCO assegura
que a oscilação na transmissão PCR não modula o clock. O indicador de
116
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
O PSI é carregado nos pacotes que têm PIDs únicos, alguns dos quais
são padronizados e outros são especificados pela tabela de associação
do programa (PAT), tabela de acesso condicional (CAT) e pela tabela de
117
Seção 8
118
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
seu próprio PID, mas no MPEG-2 isto não é obrigatório. O número do pro-
grama dentro de cada PMT definirá de modo único cada PMT.
Uma dada tabela de informação de rede NIT contém mais detalhes do que
apenas sobre o carregamento de fluxo de transporte. São incluídos tam-
bém detalhes de outros fluxos de transporte que podem estar disponíveis
para o mesmo decodificador, por exemplo, ajustando para um canal de RF
diferente ou direcionando uma antena para um satélite diferente. O NIT
pode listar um número de outros fluxos de transporte e cada um deve ter
uma descrição que especifique a freqüência de rádio, posição orbital, e
assim por diante. Em DVB, Metadata adicional, conhecido como DVB-SI, é
incluído e o NIT é considerado como uma parte do DVB-SI. Esta operação
é discutida na sessão 10 - introdução para DVB e ATSC, quando trataremos
o assunto de modo geral, o termo PSI/SI é usado.
Primeiramente recebendo um fluxo de transporte, o demultiplexador deve
olhar para os PIDs 0 e 1 no cabeçalho do pacote. Todo pacote PID 0 con-
tém o PAT. Todo pacote PID 1 contém dado CAT.
Através da leitura do PAT, o demultiplexador pode encontrar os PIDs no
NIT, e cada tabela do mapa do programa (PMT). Encontrando os PMTs, o
demultiplexador pode encontrar os PIDs de cada stream elementar.
Consequentemente se for exigida a decodificação de um programa particu-
lar, em referência ao PAT, então o PMT é tudo que é necessário para encon-
trar os PIDs de todos os streams elementar no programa. Se o programa
é codificado, o acesso para o CAT também será necessário, à medida que
a demultiplexação é impossível sem um PAT, a velocidade de lock é em
função de como frequentemente os pacotes de PAT são enviados. O MPEG
especifica um intervalo máximo de 0.5 segundos para os pacotes PAT e os
pacotes PMT, que são remetidos para aqueles pacotes PAT. Em DVB e ATSC,
o NIT pode residir nos pacotes que têm um PID específico.
119
Seção 9
Modulação Digital
122
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
Uma portadora contínua não conduz informação a menos que isso seja
modificado de alguma forma pela informação que será transmitida. Uma
portadora pode ser modificada de três formas, mudando sua amplitude,
freqüência ou fase. A freqüência e a fase naturalmente estão relacionadas
entre si, embora seja tratadas em separado por tipos de modulação, a
diferença tornar-se muito obscura, alguns sistemas de “modulação em
freqüência” são implementados por “moduladores em fase”, após ter exe-
cutado a integração no sinal modulante. Geralmente estes tipos de modu-
ladores são chamados de “moduladores de ângulo” e são úteis quando for
desejado que no sinal modulado a potência do envelope seja constante.
123
Seção 9
A figura 9-2 mostra como nós podemos modular uma portadora com dois
sinais diferentes, usando a conhecida técnica “modulação em quadratura”.
Uma única portadora é dividida em duas partes, e uma dessas partes é
atrasada em 1/4 de tempo de ciclo da portadora ou deslocado em fase de
90 graus para criar duas portadoras em quadratura de fase. As duas porta-
doras são cada amplitude modulada por um sinal apropriado e as duas por-
tadoras moduladas são somadas. Isto gera um único sinal com amplitude e
fase determinadas pelas amplitudes dos dois sinais modulantes.
A demodulação é conseguida por um processo quase idêntico, pois o sinal
recebido é emitido a dois demoduladores, em cada demodulador o sinal
é multiplicado por um sinal do oscilador local, sincronizado a um sinal
recebido. Os dois sinais do oscilador local estão separados de 90º e cada
demodulador recupera um eixo da modulação de quadratura.
124
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
125
Seção 9
126
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
estados possíveis foi transmitido para cada símbolo. Entretanto, eles não
usam o espectro eficientemente, pois a largura de faixa pode ser muito
grande para taxa de bit requerida. Estes sistemas são usados em trajetos
de transmissão muitos difíceis, tais como a telemetria de profundidade
de espaço onde o sinal ruído, melhor que largura de faixa, é o fator de
limitação.
127
Seção 9
128
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
9.5.2 DVB S2
129
Seção 9
130
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
As Figuras 9-7 e 9-8 também ajudam a mostrar a relação entre o bit rate e
a robustez. Na presença do ruído ou jitter, o afastamento mais próximo dos
estados em 32QAM (potência transmitida igual) fará mais provavelmente er-
ros de decodificação. Colocando de outra forma, mais estados possíveis por
símbolo, melhora-se a relação sinal ruído exigida para uma dada taxa de erro.
Quando uma boa relação sinal ruído é garantida, podem ser usadas grandes
densidades de constelação. O 64QAM usa oito valores em cada eixo e trans-
porta seis bits por símbolo. O 64QAM é o esquema de modulação em sistema
de cabos mais extensivamente usado no mundo, como ele fornece uma boa
relação entre a robustez e compatibilidade com o legado de infra-estrutura de
cabos. O 256QAM é usado em alguns dos mais recentes sistemas de televisão
a cabo, permite 16 valores para cada eixo de modulação e transporta oito bits
por símbolo.
131
Seção 9
132
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
133
Seção 9
134
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
135
Seção 9
136
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
plo, para fornecer simultaneamente uma recepção de baixo data rate sob
condições móveis excepcionalmente difíceis, data rate intermediário (de-
finição padrão) para recepção de área menos importante, e alto data rate
(talvez para HDTV) para condições de boa recepção.
Há quatro sistemas de modulação ISDB em uso hoje no Japão:
137
Seção 9
138
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
139
Seção 9
140
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
9.11.1 DVB-H
Transmissão de Vídeo Digital – DVB-H Portátil foi definida pelo DVB como
padrão de transmissão para terminais móveis, e permite larguras de banda
de até 14 Mbits/s para ser recebido por terminais móveis alimentados por
bateria. É possível recepção robusta em velocidades móveis de até muitos
100 KM/h.
O padrão desenvolveu uma série de técnicas para reduzir a potência e
aumentar a robustez da recepção, incluindo o corte de tempo de trans-
missões e um link de transmissão baseada em IP com um Encapsulamento
Multiprotocolo de Forward Correção de Erro (MPE-FEC). Suas característi-
cas técnicas são:
- Corte de tempo.
141
Seção 9
9.11.2 T-DMB
142
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
9.11.3 DAB IP
143
Seção 9
9.11.4 FLO
144
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
145
Seção 10
Introdução a DVB e ATSC
149
Seção 10
10.2 Remultiplexação
150
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
151
Seção 10
152
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
153
Seção 10
enquanto poucos bits podem estar com erro devido a ruído, há ocasiões
em que um grande número de bits, conhecidos como um “Burst”, todos
podem estar corrompidos. Essa corrupção pode ser provocada por raio ou
interferência de equipamento elétrico e irá saturar o bloco de dados codi-
ficados R-S e facilmente excederá o número de bytes (N/2) corrigíveis.
Não é econômico proteger cada palavra de código contra tais Bursts, por-
que eles não ocorrem com muita frequência. A solução é utilizar uma
técnica conhecida como intercalamento. A Figura 10-2 mostra que quando
o intercalamento é utilizado, a fonte de dados é codificada em FEC, mas
antes da transmissão, eles alimentam um buffer RAM. A Figura 10-3 mos-
tra uma técnica possível em que os dados entram na RAM em fileiras e
são então lidos em colunas. Os dados reordenados são agora transmitidos.
Na recepção, os dados são colocados de volta em sua ordem original, ou
desintercalados, utilizando uma segunda RAM. O resultado do processo
de intercalamento é que um Burst de erros no canal após o desintercala-
mento torna-se grande número de erros de bytes únicos em cada bloco de
dados R-S abrangendo um grande número de blocos de dados R-S, o que é
mais prontamente corrigido.
154
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
155
Seção 10
156
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
Esse processo interativo continua até que os decoders alcancem uma solu-
ção voltada para m ou na qual eles aceitem ser corrigidos. Uma caracterís-
tica de alguns decoders Turbo é que a BER correta pode ter um piso onde
a BER não aumenta com o aumento no S/N, mas essa BER é tipicamente
projetada para ser muito melhor do que a BER exigida.
Dados binários seriais naturais são inadequados para transmissão por vá-
rias razões. Execuções de bits idênticos causam deslocamentos DC e falta
de bit clock. Não há controle do espectro e a largura de banda necessária
é muito grande. Na prática em sistemas de transmissão e a cabo, é ne-
cessário um esquema de modulação chamado código de canal. Esquemas
de modulação digital são discutidos na Secção 9. A Figura 10-6 mostra a
aplicação desses princípios para um modulador 64QAM.
157
Seção 10
158
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
159
Seção 10
160
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
161
Seção 11
Transmissão de Dados
11.1 Aplicações
165
Seção 11
166
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
11.1.4 TV Aprimorada
11.1.5 TV Interativa
167
Seção 11
168
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
169
Seção 11
11.2.1.5 Carrosséis
170
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
171
Seção 11
172
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
173
Seção 11
174
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
175
Seção 11
176
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
177
Seção 11
178
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
179
Seção 11
180
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
181
Seção 11
182
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
183
Seção 11
184
Seção 12
Teste de MPEG
187
Seção 12
188
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
189
Seção 12
190
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
191
Seção 12
192
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
193
Seção 12
194
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
195
Seção 12
196
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
197
Seção 12
198
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
199
Seção 12
200
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
201
Seção 12
202
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
203
Seção 12
204
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
205
Seção 12
O decoder MPEG gera um clock contínuo utilizando o clock simples dos da-
dos PCR para conduzir um phase-locked loop. O loop precisa de filtragem
e amortecimento para que o jitter no tempo de chegada de dados PCR não
cause instabilidade no clock.
Para testar o desempenho do phase-locked loop, é necessário um sinal
com imprecisão conhecida; de outra forma, o teste não tem sentido. O
Gerador MTX100 gera inexatidões simuladas para esse propósito. Porque
ser um gerador de referência, o Gerador MTX100 possui circuitos de clock
altamente estáveis e o jitter de saída é muito pequeno. Para criar o efeito
de jitter, o tempo dos dados PCR não muda. Ao invés disso, os valores de
PCR são modificados para que o calculo PCR seja ligeiramente diferente
do ideal. Os valores modificados resultam em erros de fase no decoder que
são não são reconhecidos como jitter real.
206
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
207
Seção 12
- Tempo
- Bit rates
- Sinalização e Ligações de Componentes (referências)
208
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
ponto onde o STB pode executá-lo. Isto é muito importante para anúncios
interativos, onde os anúncios ao qual o carrossel é associado podem durar
apenas 20 segundos.
O analisador de Carrossel incorpora muitos métodos de tempo, um deles
é o Cold Boot Time. Que medi o tempo gasto para sinalizar o carrossel e
o download do gateway de serviço, a classe de boot e todos os utensílios.
Isso é repetido em intervalos regulares no bitstream.
209
Seção 12
210
Glossário
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
213
BPSK – Fase Binária “Shift Keying”. CA – Acesso Condicional. Informação
indicando se um programa está embaralhado.
Buquê – Um grupo de fluxos de transporte nos quais os programas são inde-
finidos pela combinação da rede de trabalho ID e PID (parte de DVB-SI).
CAT – Tabela de Acesso Condicional. Pacotes tendo códigos PID (veja a
secção 8 – Fluxos de Transporte) de 1 e esses contendo informação sobe
o sistema de embaralha mento. Veja ECM e EMM.
CD – Disco Compacto.
CELP – Código Excited Linear Predictive.
CIF – Formato de permuta Comum. Um formato de pixel de 352x240 por
conferência de vídeo de 30 fps.
C/N – Portadora para razão de ruído
Codificação Huffman – Um tipo de fonte de codificação que utiliza códi-
gos de diferentes comprimentos para representar símbolos que possuem
probabilidades desiguais de ocorrência.
Código de Canal – Uma técnica de modulação que converte data raw em
um sinal que pode ser recordado ou transmitido por razão ou cabo.
Coeficiente – Um número especificando a amplitude de uma freqüência em
particular ou função de base em uma transformação.
COFDM – Multiplex de Divisão de Freqüência Ortogonal Codificado, uma
forma modificada de OFDM. Um esquema de modulação digital utilizando
um número muito grande de portadoras, cada uma transportando uma
taxa de dados muito baixa. Utilizado por DVB-T.
CORBA – Common Object Request Broker Architecture.
Compressão – Redução no número de bits utilizados para representar um
item de dado.
CRC – Verificação Cíclica de Redundância.
DAB – Transmissão de áudio Digital.
DAB-IP – Transmissão de Áudio Digital – Protocolo de Internet
214
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
215
ECM – Entitlement Control Message. Informação de acesso condicional
especificando palavras de controle ou outro fluxo específico embaralhando
parâmetros.
ECS – Especificação de Conteúdo Aprimorada.
EIT – Tabela de Informação de Evento. Parte de DVB-SI.
EMM - Entitlement Management Message. Informação de acesso condicio-
nal especificando o nível de autorização ou serviços de decodificadores
específicos. Um decodificador individual ou um grupo de decodificadores
pode ser endereçado.
Enchimento – dados sem significância adicionados para manter a taxa de
bit constante.
ENG - Electronic News Gathering. Termo utilizado para descrever o uso da
representação digital de um sinal para reduzir a redundância.
EOB – Fim do Bloco.
EPG – Guia de Programa Eletrônico. Um guia de programa fornecido pela
transferência de dados ao invés de um papel impresso.
Estrutura “Archor” – Uma estrutura de vídeo que é utilizada para prognós-
tico. Estruturas I e estruturas P são geralmente utilizadas como estruturas
“Archor”, mas estruturas B nunca serão estruturas Archor.
ETSI – Instituto de Padrões de Telecomunicação Europeu.
FEC – Correção de Erro Forward. Sistema no qual a redundância é adicio-
nada à mensagem para que os erros sejam corrigidos dinamicamente no
receptor.
FFT – Fast Fourier Transform.
Figuras I – Figuras Intra-codificadas.
Fluxo de Programa – Um fluxo de bit contendo vídeo comprimido, áudio e
informação de tempo.
Fluxo de Transporte (TS) – Um multiplexe de vários fluxos de programa que
são transportados em pacotes. A denultiplexação é achieved por diferen-
tes pacotes Ids (PIDs). Veja PSI, PAT, PMT e PCR.
216
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
217
JPEG – Joint Photographic Experts Group.
JTC1 – Joint Technical Comitê do IEC.
JVT – Joint Vídeo Team.
LDPC – Código de Verificação de Paridade de Bixa Densidade
Limite Shannom – Estabelecido por Claude Shannom em 1948, o teorema
descreve a eficiência máxima possível de métodos de correção de erros
vesus níveis de interface de ruído e corrupção de dados.
Modo de Transferência Assíncrona (ATM) – Um protocolo de sinal digi-
tal para transporte eficiente de ambas as informações de bursty e taxa
constante em redes de trabalho digital de banda larga. O fluxo digital
ATM consiste em pacotes de comprimento fixo chamados de “cells”, cada
um contendo 53 8 bits bytes – um cabeçalho de 5 bytes e uma carga de
informação de 48 bytes.
MAC – Controle de Acesso de Mídia.
Macrobloco – A área na tela representada por vários blocos de luminância
e de diferença de cor DCT que são todos direcionados por um vetor de
movimento.
Mascaramento – Um fenômeno psíquico acústico que certos sons não po-
dem ser ouvidos na presença de erros.
MDCT – Modified Discreet Cosine Transform.
MGT – Tabela Guia Máster
Motion Vector – Um par de números que representam o deslocamento
horizontal e vertical de uma região de uma figura de referência para prog-
nóstico.
MP@HL – Perfil principal em alto nível.
MP@LL – Perfil Principal em nível baixo.
MP@ML – Perfil principal no nível principal.
MPE – Encapsulamento em protocolo múltiplo.
218
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
219
amostras numéricas periódicas. PCM é um sinal digital não comprimido.
PCR – Referência de Clock de Programa. A amostra do clock count do de-
codificador que é enviada no programa de cabeçalho para sincronizar o
clock do decodificador.
Perfil – Especifica a sintaxe de código utilizada.
PES – Fluxo Elementar Empacotado.
PID – Identificador de Programa.Um código de 13 bits no cabeçalho de
pacote de transporte. PID 0 indica que o pacote contém um PAT PID. (Veja
a Secção 8 – Fluxo de Transporte.) PID 1 indica um pacote que contém
CAT. O PID 8191 (todos 1) indica pacotes nulos (enchimento). Todos os
pacotes pertencentes ao mesmo fluxo elementar possuem o mesmo PID.
Pixel – Elemento de Figura (algumas vezes pel). A menor unidade de uma
imagem, representada por uma amostra, ou um conjunto de amostras tais
como GBR ou YcrCb.
PLL – Phase Locked Loop.
PMT – Tabelas de Map de Programas. As tabelas em PAT que apontam para
o conteúdo de dados, vídeo e áudio de um fluxo de transporte.
Pré-processamento – O processamento do sinal de vídeo que ocorre antes da
codificação MPEG. Redução de ruído, “Down Sampling”, identificação “Cut-
Edit” e identificação “Pulldown” 3:2 são exemplos de processamentos.
PS – Estéreo Paramétrico.
PS – Fluxo de Programa.
PSI – Informação Específica de Programa. Informação que keeps track dos
programas diferentes em um fluxo de transporte MPEG e no fluxo elemen-
tar em cada programa. PSI inclui PAT, PMT, NIT, CAT, ECM e EMM.
PSI/SI – Um termo geral para MPEG PSI e DVB-SI combinado.
PSIP – Protocolo de Informação de Programa e Sistema.
PTS – Presentation Time Stamp. O tempo no qual uma unidade de apresen-
tação é para ser disponibilizada ao observador.
220
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
221
SDT – Tabela de Descrição de Serviço. Uma tabela listando os fornecedores
de cada serviço em fluxo de transporte.
SDTV – Televisão de Definição Padronizada.
SI – Veja DVB-SI.
SIF – Formato de Entrada de Fonte. Sinal de entrada de meia resolução
utilizado por MPEG-1.
Síndrome – Resultado inicial de um cálculo de verificação de erro. Geral-
mente, se a síndrome é zero, é assumido que não há erro.
Slice – Uma sequência de macroblocos consecutivos.
SMPTE – Sociedade de Motion Picture e Engenheiros de Televisão.
SNR – Razão de Sinal-Ruído.
SP@ML – Perfil Simples no Nível Principal.
SPTS – Fluxo de Transporte de Programa Único.
ST – Tabela de Enchimento.
STB – Set Top Bos.
STC – Clock de Tempo de Sistema. O clock comum utilizado para codificar
vídeo e áudio no mesmo programa.
STT – Tabela de Tempo de Sistema.
Taxa de Bit – A taxa na qual o fluxo de bit comprimido é fornecida do canal
para a entrada de um decodificador.
TCP/IP – Protocolo de Controle de Transmissão/Protocolo de Internet.
TDAC – Cancelamento Aliasing no Domínio do Tempo. Uma técnica de co-
dificação utilizada em compressão de áudio AC-3.
T-DBM – Transmissão de Multimídia Digital. Terrestre.
TDT – Tabela de Dados e Tempo. Utilizada em DVB-SI.
TOT. Tabela de Deslocamento de Tempo.
Truncation – Shortening o comprimento da palavra de uma amostra ou
coeficiente removendo bits de ordem baixa.
222
Um Guia para Fundamentos de
MPEG e Análise de Protocolo
223
Este livro foi impresso em papel offset 90g/m2
tipologia ITC Officina Sans Std, corpo 11, pela Gráfica FIRJAN.
Editora SENAI
Rua São Francisco Xavier 417, Maracanã
CEP 20550-010 - Rio de Janeiro, RJ
Tel: (0XX21) 3978-5314
editorasenai@rj.senai.br