Escolar Documentos
Profissional Documentos
Cultura Documentos
Televisão Digital
NOTA DO AUTOR
Paulo Azevedo
ÍNDICE
Capítulo 2 - Compressão 29
Capítulo 4 - DVB 79
O grande público tomou pela primeira vez contacto com as vantagens da tecnologia
digital, aquando do aparecimento do CD de música. Em menos de 10 anos, os antigos discos
de vinil, praticamente desapareceram do mercado e isso ficou a dever-se a que a técnica
digital permitiu ao utilizador passar a dispor de muito melhores especificações (melhor som,
ausência de ruídos, etc) e de uma muito maior facilidade de utilização (escolha directa da
música, identificação de pistas e de duração de pista, etc), sem que o preço de todas as
vantagens fosse impeditivo.
Dizemos que uma informação é Analógica quando há uma variação contínua das
grandezas em jogo (brilho, som, cor, etc.).
A lista de “zeros” e “uns” que se indica na Figura 1-1, é uma Informação Digital em
Código Binário. Nos circuitos electrónicos, estes “zeros e “uns” são representados por níveis
de tensão diferentes que variam ao logo do tempo.
Código 0 0 1 1 1 0 1 1 0 0 0 0 1 1 1 1 0 0 1 1 0 0
“1”
Tensões “0”
tempo
Dado que as grandezas da nossa vida real (som, imagem, etc) são analógicas, para
que a partir delas se obtenham sinais digitais é sempre necessário proceder a uma
conversão de analógico para digital (ADC). Contudo, como os nossos sentidos são apenas
sensíveis a grandezas analógicas, no final do processo, será sempre necessária uma nova
conversão, agora de digital para analógico (DAC), tal como indicado na Figura 1-2.
MICROPROCESSADOR
Podemos assim dizer que o sinal analógico original, embora processado e transmitido
na forma digital, terá sempre que ser, no final, reconvertido para analógico, pois só dessa
forma será compreendido pelo utilizador.
Na prática, estas 3 fases, podem actualmente ser executadas com grande rapidez e
eficiência em um só circuito integrado e estão resumidas na Figura 1-3.
Repare que na conversão ADC o sinal analógico original não vai ser todo digitalizado.
Apenas alguns dos seus pontos (amostras) vão ser medidos e só esses valores serão
convertidos para digital.
O valor de tensão obtido em cada uma das amostras é comparado com níveis de
amplitude possível e incluído dentro de um desses níveis (quantização). Na Figura 1-3
existem 8 níveis (0 a 7) e como em digital oito níveis se podem representar por 3 bits, então
Quando for necessário converter o sinal digital para analógico (DAC) o processo é
inverso. Na descodificação, os bits são de novo convertidos em níveis e estes reconstituirão
o sinal original.
Amostragem
Quantificação
Codificação
01001110
1.3.1. AMOSTRAGEM
(a)
(b)
(c)
Repare que os pontos obtidos em (c) são impulsos do tipo PAM, (Pulse Amplitude
Modulation) e serão suficientes para reproduzir o sinal original (a) com boa fidelidade.
Quando maior for o número de amostras, mais fiel será a reprodução do sinal, mas em
contrapartida mais informação (mais “0” e “1”) será necessário transmitir e processar.
Verifica-se que, para que um sinal amostrado possa mais tarde ser reconstituído
fielmente, a frequência de amostragem fa tem que ser superior ao dobro da frequência
máxima presente no sinal fmáx..
fa 2fmáx
(a) fa>2fm
(b) fa=2fm
(c) fa<2fm
Se a taxa de amostragem for menor que a frequência máxima do sinal que se está a
Quanto maior for a frequência de amostragem mais perfeito vai ser o sinal
reconstituído na saída. Contudo uma frequência muito alta obrigará a mais amostras e
consequentemente a muitos mais bits para serem transmitidos, o que é inconveniente.
1.3.2. QUANTIFICAÇÃO
Com 2 bits há possibilidade de representar quatro valores (00, 01, 10, 11)
Com 3 bits representam-se oito valores (000, 001, 010, 011, 100, 101, 110, 111)
Repare na Figura 1-8 onde se representa um sinal analógico que varia de –4V a +4V
e que é amostrado apenas a dois bits (4 níveis).
Volts
+4
+3,2V
+3 nível 3 11
Valor do sinal analógico em Volts
+2,2V
(qualquer valor entre -4V e +4 V)
+2
Valor digital das amostras
+1,9V
+1 nível 2 10
+0,8V +0,2V
+0,7V
0
-0,7V -0,2V
-1 01
nível 1 -1,3V
-2
-3 nível 0 00
-3,2V
-4
a1 a2 a3 a4 a5 a6 a7 a8 a9 a10 Tempo
Amostras
Contudo, se em vez de 2 bits a amostragem for feita a 4 bits, (Figura 1-9) haverá
agora 16 níveis.
Repare que os 0,2V do exemplo anterior caem agora no intervalo (“1000”) e os 1,9V
no intervalo (“1011”), sendo portanto diferentes. Cada intervalo é agora de 0,5 V e o erro
máximo em relação ao centro do intervalo é de 0,25V.
+2
-4 nível 0 0000
a1 a2 a3 a4 a5 a6 a7 a8 a9 a10 Tempo
Amostras
Como se pode constatar, com quatro bits os erros são ainda muito grandes.
Numa amostragem a 8 bits teríamos 28 níveis (256 níveis) o que para o exemplo
anterior daria para cada intervalo 8V/256níveis = 38,25 mV por nível, valor que introduz um
erro já totalmente aceitável.
A Figura 1-10 resume qual a influência do número de bits na aquisição dos sinais.
Quanto maior for o número de bits, maior é a precisão da forma de onda na saída,
porque cada bit adicional duplica o número de níveis possíveis e diminui o erro para metade.
Contudo, quanto mais bits forem utilizados para representar as amostras PAM, maior será a
quantidade de informação a transmitir, obrigando a maiores tempos de transmissão (maior
largura de banda) e a circuitos mais complexos.
S / N 6 n (dB)
Em televisão, uma relação S/N = 48 dB é muito boa enquanto que para uma
gravação áudio em CD já será preciso uma S/N = 96 dB.
Assim sendo, um sinal de vídeo precisa de ser amostrado com pelo menos 8 bits
(porque 8 bits x 6dB = 48dB) e um sinal de áudio em CD precisa de ser amostrado a 16 bits
(porque 16 bits x 6dB = 96dB)
Analisemos o caso de n=8 bits. Com 8 bits é possível representar 256 níveis
diferentes (0 a 255).
O eixo vertical tem os 256 níveis mas o eixo de tensão, 0V, é deslocado para o nível
128. Podemos assim representar valores de tensão negativos (de -1 a -128V) e positivos (de
0 a 127V) sem necessidade de indicar o sinal.
118,135,130,138,151,165,179,179,182,195,179,144,109,78,51,37,39,62,97,123.
-10,+7,+2,+10,+23,+37,+51,+51,+54,+67,+51,+16,-19,-50,-77,-91,-89,-66,-31,-5 .
1.3.3. CODIFICAÇÃO
A cada nível obtido, deverá fazer-se corresponder o respectivo sinal digital, tal como se
exemplifica na Figura 1-12.
Observe o cabeçalho padrão de 44 bytes, que contem uma série de informações, como
formato, quantidade de amostras, etc...
A Figura 1-14 também representa a parte inicial de um arquivo *.WAV mas agora com
16 bits e com um código diferente do da figura anterior.
Cada amostra ocupa dois bytes (16 bits), e é usada a notação sinal complemento de 2,
onde o bit mais significativo representa o sinal 0=positivo e 1=negativo.
A partir do sinal digital é possível obter o sinal analógico original por meio de uma
conversão D/A, feita em duas etapas:
Como preencher os espaços vazios entre as amostras PAM? Ou seja, como completar
correctamente a infinidade de pontos que estão faltando entre os Impulsos PAM?
Esta é a função do filtro passa baixo. Quando um filtro passa-baixo ideal (roll-off =
zero) é excitado na sua entrada por um impulso, o sinal na sua saída tem a forma sen x / x,
como mostra a Figura 1-16:
Portanto, o nível de saída do filtro, nos citados pontos de zero, será exactamente
proporcional ao nível de cada um dos respectivos impulsos de entrada, não introduzindo
nenhum erro nos níveis dos impulsos PAM. Nos intervalos entre os pontos zero da resposta
sen x / x, o sinal de saída do filtro será o somatório de todos os níveis positivos e negativos
das respostas dos impulsos presentes neste intervalos, reconstituindo exactamente a forma
de onda analógica original que está faltando entre as amostras (mantendo o erro de
quantificação que foi introduzido na geração do sinal digital, e que evidentemente não tem
mais jeito de ser compensado).
A Figura 1-17 mostra como um sinal PAM, é transformado no sinal analógico original
(S).
A cores, representa-se cada impulso PAM e a respectiva resposta do filtro, para cada
impulso tomado individualmente, sem os outros. A sinusóide S (a preto) é a resultante do
somatório, a cada instante, das curvas coloridas.
Na saída do filtro, temos assim a onda analógica contínua original (embora com ruído
de quantificação).
O sinal digital de áudio ou de vídeo que se obtém à saída de um converso A/D, tem
um débito binário altíssimo, que o tornaria impossível de transmitir utilizando os actuais
circuitos de comunicações. Um sinal de Vídeo PAL pode atingir um débito de 216 Mbits/s,
quando no máximo um canal (transponder) de satélite não consegue transferir mais que 30
a 40 Mb/s.
O DVB, não regulamenta a forma como os sinais são produzidos, mas apenas a forma
como são difundidos.
Quanto à forma do sinal antes de ser difundido, o projecto DVB adoptou o formato
MPEG-2 para o vídeo e o MPEG-1 layer 2 para o áudio. O MPEG comprime (elimina) a toda a
informação que os sentidos da vista e do ouvido do espectador não podem detectar. A
utilização de sinais sob a forma MPEG, permite:
DVB-H Sistema de difusão para portáteis. Baseia-se no DVB-T ETSI EN 302 304
DVB-MDC Sistema de difusão multiponto por feixes abaixo dos ETSI EN 300 749
10GHz. Baseia-se no DVB-C
DVB-MDS Sistema de difusão multiponto por feixes acima dos ETSI EN 300 748
10GHz. Baseia-se no DVB-S
DVB-CS Televisão digital sobre redes SMATV (Satellite Master ETSI EN 300 473
Access TV).
Os 3 standards DVB mais importantes são DVB-S, DVB-C e DVB-T. A breve prazo, os
O primeiro a ser utilizado foi o DVB-S, depois o DVB-C e finalmente o DVB-T. Isto
deve-se a razões de complexidade, pois embora todos os sistemas usem a norma MPEG-2, a
forma de transmitir os sinais entre emissor e receptor, é diferente entre eles. O mais
complexo tecnologicamente é o DVB-T e daí ter sido o último a ser implementado.
A Figura 1-18 mostra precisamente que estes sistemas, embora diferentes quanto ao
meio de transmissão, são idênticos na forma como os dados são originados e fornecidos.
1.6. SISTEMAS DE TV
Vídeo
Camera
Tratamento Composto
post Sinal Sinal RGB
Reportag.
produção Composto Composto
externa
Codificador
Descodificador
Modulador Tuner Vídeo
NTSC NTSC
Emissor Desmodulador PAL
PAL
SECAM SECAM
Fonte Áudio
sonora Tratamento
post
produção
Nos sistemas terrestres e em cabo, os programas são difundidos nas bandas VHF e
UHF onde um canal de 7 MHZ em VHF ou de 8 MHZ em UHF é atribuído a cada programa.
Por satélite, cada programa ocupa um "transponder" cuja largura de banda é de 27, 33
ou 36 MHz. As operações seguintes são realizadas sobre os sinais compostos antes da
difusão:
Há pois uma diferença entre programa (conteúdo) e canal (meio de transmissão) mas
na linguagem comum é habitual dizer canal em vez de programa (Ex: a RTP-1 é um canal de
TV). Esta confusão deve ser evitado na perspectiva digital.
A digitalização do sinal vídeo tem lugar na esfera de produção onde é possível efectuar
tratamentos mais complexos sem degradação do sinal. As técnicas digitais foram em seguida
aplicadas à troca de programas de televisão entre estúdios nas ligações chamadas de
contribuição. (Figura 1-20).
Recepção
Vídeo
MPEG-2 Descodificador Vídeo
TS Video Composto
(DAC) RGB
Desmodulador Demux
Tuner de
Digital Áudio
Programas
Descodificador
Analógico
Audio
(DAC)
Digital
São estas técnicas que permitem hoje em dia difundir sinais de TV com baixo débito
Repare que é possível encaminhar vários programas por cada canal, graças a um
multiplexador de programas encarregado de os agrupar.
8. Faça um cálculo muito rápido para determinar quantos bits/s tem um sinal de áudio
(mono) amostrado a 44,1KHz com 16 bits por amostra.
9. Faça um cálculo muito rápido para determinar quantos bits/s tem um sinal de vídeo
amostrado a 8 bits por amostra com a frequência de amostragem de 13,5MHz para a
componente de luminância e de 13.5 MHz para as componentes de crominância.
Capítulo 2 - Compressão
O fluxo de bits obtido pela conversão A/D, tal como descrito no
Capítulo 1, é tão grande que seria tecnicamente impossível transmitir
imagens vídeo ou áudio Hi-Fi. Torna-se assim imprescindível proceder à
redução desse débito binário mas de uma forma tal que não afecte a
qualidade final da imagem e do som. Este capítulo analisa as técnicas de
compressão utilizadas para produzir um sinal comprimido, obedecendo
às normas MPEG-2.
Quantos bits são precisos para transmitir um minuto de áudio digital? Quanto tempo
de um sinal de vídeo digital é possível armazenar num CD-ROM?
Se tentarmos guardar um sinal de vídeo digital contendo todos os bits que foram
obtidos após a conversão A/D, um CD-ROM ficará cheio com apenas cerca de 30 segundos
de imagem e som.
É evidente que necessitamos comprimir ou seja, reduzir o fluxo binário antes de o sinal
digital ser transmitido ou armazenado. Comprime-se para POUPAR dinheiro. A poupança
pode estar na capacidade de armazenamento, na largura de banda de transmissão ou na
quantidade de fita necessária.
Da mesma forma, um sinal de TV de 200Mb/s, que tenha sido reduzido para 20Mb/s,
teve uma taxa de compressão de 10:1
Não é necessário receber toda a mensagem para que ela seja compreendida; o nosso
cérebro actua como um descodificador e repõe as partes em falta, distinguindo entre
informação e redundância.
Considera-se INFORMAÇÃO tudo aquilo que o descodificador não pode obter a partir
dos dados que já lhe chegaram, estão chegando ou chegarão.
Tudo o que pode ser obtido a partir de dados passados presentes ou futuros, não é
informação, é REDUNDÂNCIA.
Na Figura 2-1, representam-se duas imagens. A imagem do rosto tem menos entropia
que a imagem da paisagem, pois a quantidade de objectos (pormenores únicos -
informação) é bastante menor.
O vídeo analógico tem no sistema PAL, 25 imagens por segundo e 625 linhas por
imagem, das quais apenas 576 linhas contêm informação vídeo. As restantes linhas são
utilizadas para sincronismo e teletexto e portanto não fazem falta quando se converte o sinal
analógico em digital.
A norma ITU-R BT.601-2 estabelece que o formato a digitalizar é de 576 x 720 isto é,
576 linhas horizontais, com 720 pontos (pixels) por linha.
Sinc
Filtros 6,75 13,5
Amplifi. MHz
passa-baixo MHz
Y Y 8 bits
R ADC Y
R-Y 13,5
Matriz
R-Y
Comutador
G MHz
8 bits
B-Y ADC
B-Y Cr e Cb
B
O sinal da câmara de filmar, tem na sua saída o formato RGB (red-green-blue). Por
meio de uma matriz de resistências é possível converter este formato RGB para o formato
YUV, que caracteriza a transmissão da TV a cores. A componente Y é a luminância (escala
de cinzentos), sendo as componentes U=R-Y e V=B-Y as componentes de crominância.
Embora não seja transmitida a componente G (green) ela pode mais tarde ser obtida a
partir das componentes Y, U e V.
Actualmente, com tanta pesquisa feita na compressão de sinais vídeo e áudio, existem
dezenas de técnicas de compressão e torna-se realmente difícil inventar algo novo neste
sem perdas
com perdas
Como os nomes sugerem, um algoritmo sem perdas reconstituirá o sinal bit a bit no
processo de descompressão enquanto que usando um algoritmo com perdas, não será mais
possível obter o sinal original. De um modo geral, na compressão com perdas, quanto maior
for a taxa de compressão, menor será a qualidade final da imagem.
A Figura 2-3 mostra como a um sinal de vídeo, já sob a forma binária Y-Cr-Cb, são
aplicados algoritmos de compressão. Repare-se que um mesmo sinal pode ser sujeito a
vários tipos de compressão em sequência.
Técnicas de Compressão
com e sem perdas
1 2 n
Vídeo Bitstream
IN Algoritmos de OUT
Y, Cr, Cb alinhamento
Compressão
(s/ compressão) (c/ compressão)
A explicação dessas diferenças baseia-se em que os nossos sentidos são muito mais
exigentes na reprodução do som do que na reprodução da imagem, ou dito de outro modo,
é muito mais difícil “enganar” o ouvido do que a visão.
Imagem para
comparação
IN + OUT
QUANTIFICADOR
Imagem a Imagem
comprimir - comprimida
PREDITOR
O método utilizado para eliminar a redundância espacial (os pixels adjacentes serem
muito semelhantes entre si) recorre a um artifício matemático bastante pesado, (mas
extremamente eficiente) designado por DCT (Discrete Cosinus Transform ).
Frequência mais
baixa (DC)
Frequência mais
alta
Para melhor compreender este processo observe o exemplo da Figura 2-7 onde, para
maior facilidade, em vez dos blocos de 8x8 (64 células) que se utilizam na realidade,
A imagem mostra um comboio e o bloco que vai ser analisado contém apenas céu.
Trata-se de uma zona uniforme em que não há variação entre pixels adjacentes pois todos
são iguais.
Contudo o caso mais habitual é haver variações entre pixels de um bloco, tal como
indicado na Figura 2-8.
A DCT aplica-se então aos dois conjuntos de valores digitais; dois porque o cálculo se
efectuará tanto no sentido vertical como horizontal. Tal consistirá em transformar sequências
de números adjacentes noutras sequências que deverão traduzir a maior ou menor
velocidade (frequência) de variação da luminância de um pixel para o pixel vizinho.
Para ser exacto, é preciso especificar bem que com essa nova representação, se for
ordenada segundo uma tabela, como a das luminâncias, não se trata mais duma questão de
pixels segundo a DCT; são apenas números ordenados designados por coeficientes de saída.
De assinalar que o coeficiente situado no canto superior esquerdo, com o seu valor de
120, contém uma informação importante. Esse coeficiente representa a média da luminância
da região que observamos, a colecção de pixels situados próximo da chaminé.
O termo "médio" é utilizado aqui para descrever com a menor imprecisão possível o
que se passa realmente. Para ser mais rigoroso, o algoritmo matemático utilizado para
calcular os termos da DCT faz a soma das luminâncias dos pixels, pois fornece como
resultado um número inteiro proporcional à média. Neste exemplo, cada valor de saída foi
reduzido por um factor de 8, e não de 16, como poderia sugerir o número de casas da
tabela, de modo a conservar como resultados um conjunto de números inteiros, mas de
grandeza razoável. É por isto que este primeiro número parece, à primeira vista, um pouco
elevado para um valor médio.
Por outro lado, na parte baixa da tabela podem observar-se coeficientes de fraco valor
absoluto, 1 e -1, por exemplo. A interpretação que pode ser feita, no quadro deste tipo de
Assim, a representação por DCT fornece uma ferramenta para a etapa seguinte de
codificação. No entanto, a DCT não reduziu o número de dados, subsistindo 128 bits (8 bits
x 16 pixels na rede da esquerda, contra 8 bits x 16 células na da direita). Pelo menos tem-se
a certeza de que este processo não degrada a imagem...
Este processo ajuda, efectivamente, à redução do débito, sendo dividido por dois o
número de bits atribuídos à descrição desta parte da imagem; são necessários 4 bits para a
codificação do valor DCT máximo (10) em vez dos 8 requeridos para a codificação do valor
original de 120.
a) Codificação RLC
Este processo de análise oblíqua da matriz DCT pode parecer bizarro mas é muito útil
porque as células do bloco que ficam mais junto do canto inferior direito têm normalmente
valor de zero porque representam as componentes de alta-frequência que o olho não
detectará.
Repare que no final da sequência há 11 zeros seguidos. A técnica RLC não vai
transmitir estes zeros mas sim apenas uma instrução EOB (end of block) que informará o
descodificador que a partir desse momento todos os coeficientes da matriz são zero.
10
0, 5
0, 5
1, 1
EOB
O primeiro termo (a vermelho) indica o número de zeros que há entre o dado anterior
e a que aparece no segundo termo. Como a maioria dos coeficientes a transmitir é zero, isto
reduz substancialmente o número de dados e origina uma enorme economia no tempo de
transmissão.
No exemplo anterior (Figura 2-10) o coeficiente “5” aparece duas vezes enquanto o
coeficiente “10” ou o coeficiente “1” só aparece uma vez.
A VLC é um processo de compressão que utiliza uma técnica parecida com a do código
morse. No morse, as letras mais utilizadas são representadas por apenas 1 ou dois traços e
pontos. As letras menos utilizadas são as mais compridas podendo ter até 6 traços ou pontos
Probabilidade de
Símbolo Palavra Codificada
ocorrência
S0 0,41 0
S1 0,25 100
S2 0,14 110
S3 0,10 111
S4 0,08 1010
S5 0,07 1011
Na Figura 2-10 o nosso exemplo, como o símbolo “5” aparece 2 vezes seria o de maior
probabilidade transmitido apenas como “0”. Os outros símbolos (10 ou 1) teriam menor
O agrupamento de vários slices constitui uma Imagem que é a parte activa de uma
trama (frame). A imagem é a unidade de codificação básica. Conforme veremos a seguir,
as imagens podem ser do tipo I (intraframe), tipo P (predição) ou do tipo B (bidireccionais).
O Slice pode começar não importa onde e ter um tamanho qualquer. É a unidade
fundamental de sincronização para VLC e DPCM. Os primeiros vectores do slice são emitidos
integralmente enquanto que os outros são transmitidos em modo diferencial.
Blocos Macro
de Slice Imagem GOP Sequência
Coeficientes bloco de vídeo
Tamanho da
Tipo de Cor
Imagem
Progressivo Proporções
Entrelaçado da Imagem
II I
tempo
P P P
B B B B B B B B
Mas um problema se levanta aqui pois a ordem com que as imagens entram no
codificador não vai ser igual à ordem de saída.
Voltaremos a este problema no Capítulo 3 mas para já, a Figura 2-15 evidencia a
forma como as imagens se ordenam antes e depois da codificação.
Nos GOP fechados, as imagens são descodificadas sem recurso a imagens de outros
GOP, enquanto que, nos abertos, pelo contrário, são necessárias imagens de outros GOP.
Vários GOPs podem ser combinados para produzirem uma Sequência de vídeo. A
sequência começa por um código de início de sequência seguido por um cabeçalho e
termina por um código de fim de sequência. No decurso da sequência podem ser colocados
outros cabeçalhos suplementares.
Esta disposição permite começar a descodificação não importa onde tal como acontece
na leitura de um CD por exemplo. O cabeçalho da sequência define o tamanho vertical e
horizontal da imagem, o formato de sub amostragem da cor, a frequência da imagem, o tipo
de varrimento (progressivo ou entrelaçado), o perfil, o nível e o débito de bits bem como as
matrizes de quantificação utilizadas nas imagens intra-codificadas e inter-codificadas.
A norma MPEG-2 prevê seis tipos de Profiles (perfis) que indicam o sistema de
compressão a empregar consoante o tipo de utilização a que se destinam :
A norma MPEG prevê também quatro Levels (níveis) que são os possíveis formatos
fonte para a codificação e que vão desde a Televisão de baixa definição (LDTV), até à
televisão de alta definição (HDTV), passando pela televisão de definição standard (SDTV) e
pela EDTV (16:9 PALplus), cada uma delas com uma certa margem de bitrates possível.
A Figura 2-17 mostra as várias combinações possíveis de perfis e níveis tal como
definidos pelo MPEG-2.
MP@HL HP@HL
4:2:0 4:2:0,4:2:2
HIGH 1920x1152 1920x1152
80Mb/s 100Mb/s
I,P,B I,P,B
MP@H14 SSP@H14 HP@
4:2:0 4:2:0 4:2:0,4:2:2
HIGH
L 720x756 1140x1152 1440x1152
1440 15Mb/s 60Mb/s 80Mb/s
E
I,P,B I,P,B I,P,B
V SP@ML MP@ML SNR@ML HP@ML
E 4:2:0 4:2:0 4:2:0 4:2:0,4:2:2
MAIN 422P@ML
L 720x576 720x576 720x576 720x576
15Mb/s 15Mb/s 4:2:0 15Mb/s 15Mb/s
I,P I,P,B 720x576 I,P,B I,P
MP@LL 15Mb/s SNR@LL
4:2:0 I,P,B 4:2:0
LOW 352x288 352x288
4Mb/s 4Mb/s
I,P,B I,P,B
PROFILE
O perfil simples (SP) e o perfil principal (MP) são os que estão destinados a vídeo não
escalável com qualidade boa a alta.
O Main Profile (MP), está destinado às aplicações onde o atraso das comunicações não
é muito crítico e tem melhor qualidade que o SP, por ser mais elaborado na técnicas de
compressão (predição bidireccional por exemplo). O MP, em conjunto com o Main Level
(ML), forma o MP@ML, que se utiliza actualmente em televisão. O MP também permite a
emissão HDTV (MP@HL).
Os perfis escaláveis (SNR e SS) saem fora do âmbito deste manual. Genericamente
permitem que o sinal de vídeo seja partido em duas ou mais qualidades o que permite
melhorar a relação sinal ruído (SNR) ou a resolução espacial, passando de SDTV para HDTV.
Estes perfis são muito complicados de realizar tecnicamente e como tal seriam demasiado
caros para o mercado pelo que a televisão digital não os considera.
Apesar da norma MPEG-2 já estar definida, continua a trabalhar-se para a adaptar aos
novos requisitos como por exemplo a emissão de filmes em 3D e que poderia ser também
aplicado por exemplo em electromedicina.
Até este momento, vimos o processo de compressão de imagens por separado. Agora
é o momento adequado de resumir tudo o que se explicou.
1 2 3 4
Control de Fluxo
Matriz Quantificação
4:2:2 +
IN a DCT Q
Codificador de
Entropia
MUX Buffer
4:2:0
- Quantificador Dados
Comprimidos
Q-1
Imagem
estimada
DCT-1
Armazenamento
de imagens
Control e
Vectores de Armazenamento
Movimento de imagens de
referência
Armazenamento Vectores de Movimento
de imagens
estimadas Control do Grupo de Imagens
1 Tipo de
Imagem
Inter
Intra
2
IN
Descodificador
Buffer Desmultiplexer
de Entropia
Q-1 DCT-1
Saída de
Vídeo
Info para o Preditor Inter
Intra
Escala
Quantificador
3 Armazenamento da
Info do Desmultiplexer
SW
imagem futura Inter
Intra
Tipo de
Preditor de
Imagem
SW Compensação de
Movimento
Armazenamento da
imagem anterior
Até agora falámos apenas de compressão de vídeo, mas claro que o som também
tem a sua quota-parte neste processo. O sinal de áudio, depois de digitalizado, e ao
contrário do que se possa pensar, ocupa uma largura de banda muito grande. Por exemplo,
um sinal áudio estéreo, amostrado a 44,1KHz por canal e em seguida quantificado a 16 bits
por amostra (qualidade CD), dá um fluxo de:
O grande princípio da compressão áudio: "Nunca transmitir o que não se pode ouvir"
Na audição, chama-se mascaramento ao efeito pelo qual, um tom que é muito próximo
a outro mas de menor amplitude, não será ouvido. O tom de menor intensidade é portanto
“mascarado”, desde que fique na zona de mascaramento do tom principal (Figura 2-20)
Nível Tom
dB mascarador
Tom
mascarado
Limiar de
mascaramento
Este fenómeno existe para todos os tipos de sinais de áudio, e cada som tem a sua
respectiva curva de limiar de mascaramento que faz com que os sons dentro dessa curva
não sejam ouvidos. Estamos assim perante um sistema totalmente dinâmico pois o som está
sempre a mudar ao largo do tempo e portanto só as frequências mais intensas serão ouvidas
já que as outras ficam mascaradas. É precisamente este efeito que vai ser utilizado para
comprimir o débito binário de áudio.
Como se pode ver na Figura 2-21 que representa um codificador de áudio MPEG
simplificado, o sinal de entrada (na forma PCM) é trabalhado num modelo psico-acústico que
determina os limiares de mascaramento de cada banda espectral.
Em paralelo com esta informação, o sinal passa através de um filtro onde todo o
espectro audível (de 18 Hz a 22 KHz aproximadamente) é dividido em 32 bandas. Cada uma
destas bandas será quantificada e codificada segundo a curva de resposta do modelo psico-
acústico calculado.
Filtro Factor de
IN separador escala e
32 bandas quantificação
OUT
Codificação e MUX
atribuição
Limiares de dinâmica dos
mascaramento factores de
escala e de
bits
x32
Posteriormente o sinal assim obtido vai a um multiplex onde lhe são adicionadas as
informações de transmissão (qual a camada, frequência de amostragem, preenfase utilizada,
etc.).
2.3.3. Descodificador
A camada 3, tem um grau de compressão maior, mas não está a ser utilizada no DVB
por não se justificar. A sua utilização tem sido restringida à Internet onde o MP3 teve (e
tem) o sucesso que todos conhecemos sobretudo por em média reduzir em cerca de 20x o
tamanho original de uma música em CD e sem perda aparente de qualidade.
Os sistemas modernos de som começam a fazer cada vez mais utilização do som
A aplicação deste sistema abrange, além dos 5 canais de áudio e subwoofer, 7 canais
de comentários, que podem ser utilizados para versões multilingues isto é, versão original de
um filme e versões dobradas noutros idiomas.
Enviar cada versão em separado, o que gera um bitrate para cada canal
de 384 kbps. O MPEG garante o perfeito sincronismo entre os dois canais
Há a possibilidade de codificar 7 idiomas a 64 kb/s cada sobre um áudio
multicanal de 384 kb/s.
Actualmente apareceu uma nova normativa: O MPEG-2 AAC (Advanced Áudio Coding)
que proporciona som multicanal de alta qualidade a 64 kb/s. É mais eficiente que o MP3 mas
tem o inconveniente de não ser compatível com MPEG-1. Tem a capacidade de 48 canais de
áudio principais, 15 canais LFE (Low Frequency Enhancement), 15 streams de dados e tem
capacidade multilingue. Este sistema tem a 96 Kb/s a mesma qualidade que o MP3 a 128
Kb/s e que o MPEG-2, layer 2 a 192Kb/s. A sua utilização actual está ainda restrita ao
download de ficheiros de música na Internet (tal como o MP3) mas poderá no futuro vir a
ser aplicado ao DVB.
1. O que é Informação?
2. O que é a entropia?
No capítulo anterior, foi descrita a forma como os sinais de vídeo e áudio podem ser
comprimidos, reduzindo para um débito aceitável, o enorme débito binário obtido na
conversão A/D dos sinais originais.
As normas MPEG definem a forma como esse sinal, que é apenas uma sequência
ordenada de bits em série, deve ser estruturado para que, qualquer RECEPTOR, o possa
interpretar, com facilidade.
As normas MPEG, não indicam a forma como o operador deve fazer a compressão nem
A estrutura dos sinais MPEG-2 está regulamentada pela norma ISO/IEC 13818 que
se subdivide em 9 partes das quais as mais importantes são:
TS Transport Stream
Mux TS
O resultado desta operação é uma sequência de bits, que o MPEG designa por
ELEMENTARY STREAMS (ES). Existe um ES de vídeo e um ES de áudio.
A multiplexagem pode ser feita de duas formas distintas, dependendo do meio em que
o sinal vai ser utilizado
O Program Stream (PS), está um pouco fora do âmbito deste manual, pois não é
utilizado na transmissão de TV digital. Pelo contrário, o Transport Stream (TS) constitui a
espinha dorsal da Televisão digital e será analisado em detalhe.
ES PES TS TS
(Transport Stream) (Transport Stream)
(Elementary Stream) (Packetized
SPTS MPTS
Elementary Stream)
VÍDEO
Codificação
Packetizer
vídeo
4Mb/s
3Mb/s
(Vários programas)
(Um só programa)
Transport MUX
ÁUDIO
Program MUX
Codificação 21Mb/s
Packetizer
áudio
192Kb/s
DADOS
Packetizer
01111011
18Kb/s
192Kb/s
PMT PAT
(Program (Program
Map Table) Association
SCR Table)
PCR
(System Clock (Program Clock
Reference) Reference)
Repare que o TS pode conter um só programa (SPTS – single program TS) ou conter
vários programas (MPTS – Multiple Program TS).
A forma como todo este processo se efectua será analisada a seguir, mas convém
chamar a atenção para o facto de que o MPEG-2, com este tipo de estrutura, deixa a
flexibilidade total aos operadores para incluírem no PES e no TS toda a informação adicional
que desejarem, tal como acesso condicional, legendagem, etc.
Com esta filosofia MPEG-2, garante-se que o sinal que o receptor vai ler é sempre a
mesma (embaratecendo o preço dos receptores devido à normalização) mas deixa-se na
mão do operador, toda a flexibilidade necessária para que ele melhore o seu serviço sempre
que houver inovações técnicas.
Primeira camada da sintaxe do MPEG, o Fluxo elementar (ES) é o sinal binário (quer
de áudio, quer de vídeo), obtido à saída da codificação/compressão (Figura 3-3).
VÍDEO Codificação e
Compressão Vídeo ES
vídeo
ES
(Elementary Streams)
ÁUDIO Codificação e
Compressão Áudio ES
áudio
Os dados que entram no codificador, como por exemplo as imagens, são chamados de
unidades de apresentação (Presentation Units). Os dados comprimidos à saída do
codificador são chamados de unidades de acesso (Acess Units). Na Figura 3-4 pode ver-se
a diferença entre estes dois tipos de unidades e ficar com uma ideia dos níveis de
Unidade de
Apresentação
Unidade de
Acesso
Repare que uma imagem original, (depois do conversor A/D e no formato PCM),
contém cerca de 830 KBytes. Depois da compressão, uma imagem tipo I fica reduzida a
cerca de 100 MBytes, uma imagem tipo P fica com cerca de 33 KBytes e as imagens tipo B
ficam com cerca de 12 KBytes. É claro que estes valores são apenas indicativos pois
dependem de factores como a complexidade original da imagem.
A Figura 3-5 Mostra a estrutura hierárquica da trama elementar de vídeo (vídeo ES).
(optional) SEQUÊNCIA
Start Sequence Profile and Picture Picture Picture Contém p
quantisation weighting ----
code parameters level 0 1 p-1 Imagens
matrix)
SLICE
Start Quantisation Macrobloc Macrobloc Macrobloc
Slice adress ---- Contém m
code values 0 1 m-1
Macroblocos
MACROBLOCO
Macrobloc (optional) Motion Coded block Contém 4 blocos de
Mode Luminance blocks Chrom Blocs luminância e 2 blocos
adress quantisation value vectors pattern
de crominância para
video 4:2:0
22 bits sistema
4 bits 6 bits
12 bits sincronismo GR0 GR1 GR2 ---- GR11
0 1 2 3 --- 31
A Figura 3-7 mostra a trama de áudio tal como definida pelo standard MPEG-2
(ISO/IEC 13818-3)
Tal como definido pelas normas MPEG, e por razões de conveniência, os fluxos
elementares (ES) de áudio, vídeo e dados são divididos, sendo depois associados entre si,
em pacotes (packets) formando assim os PES (Packetized Elementary Streams).
Estes pacotes são de tamanho variável. O tamanho pode atingir várias centenas de
Kilobytes e varia em função da aplicação mas normalmente ronda os 64 KB.
Cada pacote é precedido por um cabeçalho que contêm a informação necessária para
que o receptor o sincronize e descodifique a informação nele contida.
PES
PES Data
PES Original header Optional
10 scrambling alignement Copyright Flags
priority or copy data fields
control control
2 2 1 1 1 1 8 lenght 8
ES Previous
DSM trick Aditional PES
PTS / DTS Clock Ref. ES rate PES
mode copy info extension
(ESCR) CRC
33 42 22 8 7 16
Program
Pack PES
PES packet P-STD
header extension
private data sequence buffer
field field
128 8 counter 8 16 7
O próximo passo é multiplexar muitos PES para criar um fluxo binário contendo um ou
vários programas de TV. Por si só, o PES é simplesmente uma informação em bruto, embora
descodificável, mas que não contém nenhuma indicação que diga ao descodificador como a
descodificar. Por isso, a partir dos PES, é necessário criar os Fluxos de Programas (PS –
Program Streams) ou os fluxos de transporte (TS – Transport Streams) como já
indicado na Figura 3-1.
3.4. PS e TS
Tanto o Program Stream (PS) como o Transport Stream (TS) são obtidos a partir de
pacotes PES de áudio, vídeo e dados (Figura 3-9). mas apresentam grandes diferenças.
Pelo contrário, o TS pode conter informação de vários canais vídeo, vários canais de
áudio e vários canais de rádio, pelo é o método ideal para a transmissão de sinais de TV
digital. A sua estrutura comporta um cabeçalho e uma carga útil (payload) com comprimento
fixo de 188 Bytes.
Num fluxo de transporte (TS), os programas podem ter tido diferentes origens que não
são necessariamente síncronas. Par conseguinte, o TS deve ser capaz de fornecer os meios
de sincronismo para cada um dos programas. Este sincronismo tem o nome de PCR
(Program Clock Reference) e permite reconstituir uma referência de relógio estável a partir
da qual, por divisão, se cria a frequência que vai permitir no descodificador utilizar
convenientemente os marcadores temporais em cada ES.
A Figura 3-10, mostra um exemplo das várias componentes que intervêm no processo
de TV digital, desde a origem até à emissão.
Certos programas são protegidos e devem ser acedidos apenas pelos subscritores pelo
que o TS deve incluir informação de acesso condicional para gerar esta protecção. O TS
contém as Informações específicas de programa (PSI = Program Specific Information) que
permitirão as operações anteriormente mencionadas e outras.
O TS pode conter vários programas diferentes, utilizando cada um, débitos binários e
factores de compressão susceptíveis de variarem dinamicamente, mesmo que o débito final
resultante, seja constante. A esta propriedade chama-se multiplexagem estatística e permite
a um programa com muito débito (uma corrida automóvel por exemplo) ir retirar bits a um
programa mais estático (p.ex. um debate).
188 Bytes
Header Payload
4 Bytes
Cada PES tem um comprimento constante de 188 bytes repartidos entre um cabeçalho
Os pacotes nulos têm sempre a mesma identificação. Num dado fluxo de transporte,
todos os pacotes pertencendo a um dado PES têm a mesma identificação. Os pacotes
pertencentes a outro ES terão uma identificação diferente.
Todas estas informações são genericamente designadas por PSI (Program Specific
Information) e são incluídas em tabelas difundidas regularmente, cada uma com uma
frequência julgada suficiente pelo operador para refrescar as informações ao nível do
terminal. Em função do tipo de tabela, isso pode ir de 100ms a 30s.
A Figura 3-12 mostra a estrutura das tabelas que vão ser utilizadas pelo receptor para
reconstituir a informação original. Para reconstruir o PES, o PSI usa uma série de
identificadores conhecidos como PID (Packet Identifier)
• Logo que o programa a seleccionar seja conhecido, o receptor procura pela tabela
Programme Association Table (PAT) que tem sempre o PID = 0.
• A PMT para o programa 1 é identificada pelo seu PID (22), extraído dos pacotes do
TS que o contém e descodificada.
0 PAT 22 Prog 1 PMT 33 Prog 2 PMT 99 Prog 1 EMM 31 Prog 1 PCR 48 Prog 1 audio 1 54 Prog 1 video 1 109 Prog 2 EMM
etc.
CAT (sempre PID=1) NIT (sempre Program 0)
CA Section 1 (Program 1) EMM PID (99) Private section 1 NIT info
CA Section 2 (Program 2) EMM PID (109) Private section 2 NIT info
CA Section 3 (Program 3) EMM PID (119) Private section 3 NIT info
---- --- ---- ---
CA Section N (program N) EMM PID (N) Private section N NIT info
• O PID=1 é sempre utilizado para identificar a CAT. Ela é necessária para determinar
se o receptor está ou não autorizado a descodificar o programa em causa (neste caso o
programa 1).
3.5.4. As tabelas SI
O DVB por necessidade, acrescentou mais algumas tabelas às quatro tabelas definidas
pelo MPEG-2. Estas tabelas são as SI (Service Information) que podem ser utilizadas pelo
Tabelas obrigatórias
SDT Service Description Table
PID = 17 e TableID = 66 se os serviços se apresentam no mesmo transponder
(SDT actual) e TableID = 70 se a secção descreve serviços presentes noutro
transponder. (SDT Other).
Tabelas opcionais
BAT Bouquet Association Table
PID = 17 e TableID = 74. Esta tabela permite agrupar os serviços de
outra forma que não só pela notação da rede (NIT). Um serviço pode
pertencer a vários bouquets. Assim, podem-se fazer bouquets por temas ou
por zonas geográficas de recepção.
ST Stuffing Table
PID = 19 e TableID = 114. Esta tabela serve para “encher” substituindo não
importa qual secção de outras tabelas para as invalidar e o receptor não as
procurar.
Em seguida, por cada serviço encontrado, ele lê a SDT para encontrar o respectivo
nome e o seu tipo (televisão, rádio...).
Agora, se escolher um dos serviços, o terminal vai ler a PMT que referencia as
componentes do dito serviço e afixa as informações contidas na EIT do serviço para
descrever o acontecimento em curso.
No caso de um multitransponder, para construir a sua lista dos canais o terminal vai ler
a NIT actual do TS sobre o qual está sincronizado. Esta NIT referencia todos os
transponders disponíveis na oferta. Para cada transponder, vai agora encontrar a frequência,
o symbol rate e a FEC do TS, (para permitir o zapping), uma lista dos serviços presentes
bem como o seu tipo.
Esta lista de serviço (que contém todos os serviços disponíveis) vai ser completada
pela leitura dos SDT Actual e Other que forneceram os nomes, etc...
Para codificações MPEG-2 a taxa de transmissão necessária para obter uma qualidade
aceitável situa-se entre os 3 e os 5 Mbps, como foi dito anteriormente, para qualidade SDTV.
Para além de todas estas ferramentas, o H.264 também apresenta uma nova solução
de coeficientes, semelhante aos conhecidos DCT, que permitem contornar o problema da
função transcendente que calcula a DCT, apresentando valores exactos derivados das
funções inversas realizadas para cada coeficiente. A quantetização também é feita de uma
forma diferente, mais eficiente, assim como as técnicas de entropia, entre outras novas
funcionalidades apresentadas por este codec.
a. são
b. Não são
3. Faça um esquema do diagrama funcional do MPEG-2 (ES, PES, TS, PS)
5. O PID identifica?.
a. video streams
b. audio streams
c. PSI tables
d. Todos acima
6. Os valores do PID são únicos ou são atribuídos ao acaso?
Capítulo 4 - DVB
Depois de se codificarem e multiplexarem os diferentes sinais de
vídeo, áudio e dados, utilizando as normas MPEG, é agora necessário
transmiti-los até ao utilizador final. Este capítulo descreve o sistema DVB
tal como é utilizado para a transmissão desses sinais através de satélite,
cabo ou terrestre.
4.1. Introdução
O DVB, adoptou o MPEG-2 (vídeo) como sinal de banda base antes de ser distribuído.
Esta opção teve em conta que a estrutura do sinal MPEG:
A Figura 4-2 mostra qual a parte MPEG-2 e qual a parte DVB do sinal. Repare que só
após a criação do Tranport Stream (TS) se inicia o processo DVB.
Encoder Encoder
sincronização e
Canal TX
despacketização
multiplexagem
Packetização,
O DVB mantém para os canais digitais exactamente a mesma largura de banda que a
Numa transmissão digital, a BER é o número total de bits errados dividido pelo número
total de bits que foram transmitidos, recebidos ou processados durante um certo período de
tempo. Se existir um bit errado em cada 1.000 bits recebidos, diz-se que taxa de erro binária
foi de BER = 1/1000 = 10-3. Da mesma forma, se houver 4 bits errados em 100.000 bits
transmitidos teremos uma BER = 4/100.000 =4*10-5.
Mas a BER também pode ser expressa em termos de probabilidade ter um bit errado
num determinado intervalo de tempo. Nos sistemas DVB, um bit errado por hora é
equivalente a uma BER de 10-11.
Usando as mais avançadas técnicas de correcção consegue-se que sinais com elevados
níveis de erro à entrada do receptor (BER de 10-4 ou maior), possam ser corrigidos para
valores de apenas 10-11.
O DVB define que o número de erros no final do processo de recepção deve ser
“quasi-error-free” (QEF), isto é, não pode ultrapassar 1 erro em cada hora de emissão o
que para taxas da ordem de 40Mb/s corresponde a uma BER de aproximadamente 10-11.
Grosso modo, pode dizer-se que a BER é o equivalente digital à relação sinal-ruído nos
sistemas analógicos.
Os sistemas DVB-C, DVB-S e DVB-T são muito semelhantes quanto à sua estrutura
geral pois todos vão transmitir/receber sinais MPEG-TS. As diferenças que apresentam,
dependem exclusivamente das características, relativas ao meio de transmissão a utilizar:
O sistema de televisão digital por satélite foi o primeiro a aparecer para o grande
público. É natural que assim tenha sido pois a emissão por satélite permite distribuir sinal
por áreas enormes (toda a Europa, por exemplo) e por baixos custos tanto para a emissão
(cerca de 1/10 mais barato que uma emissão analógica) como para a recepção, pois o
utilizador só tinha que adquirir um receptor digital visto que todo o restante equipamento
(LNB, antena parabólica, rede de distribuição, etc.) é igual ao do sistema analógico.
Header Payload
4 Bytes
Figura 3-11. O cabeçalho (header) tem 4 bytes dos quais o primeiro byte é de
Para evitar esse inconveniente, é necessário repartir a energia por igual ao longo de
todo o canal, e o DVB regulamenta um processo de dispersão (uniformização) que obedece
ao esquema indicado na Figura 4-4.
Sequência de Inicialização
Saída de dados
ENABLE
Entrada de TS MPEG-2
Repare que há uma porta AND onde a sequência PRBS pode ser activada (ENABLE) ou
desactivada. A desactivação é feita só durante o byte de sincronismo para que ele possa
Com este processo, a energia do TS fica repartida igualmente por todo o espectro, e
mesmo que não haja sinal na entrada, haverá dispersão da energia evitando-se uma longa
sequência de zeros.
É um código que vai adicionar 16 bytes de redundância a cada TS que já passou pelo
processo de dispersão de energia (Figura 4-6).
Este código tem a notação RS (188,204,t=8), o que quer dizer que tem 188 bytes
na entrada, 204 bytes na saída e 8 bytes em 188 podem ser corrigidos.
03 10 15
Adicionamos dois pacotes de redundância. O primeiro é a soma dos 3 dados, isto é,
28, e o segundo é a soma ponderada dos 3 bytes em que cada byte é multiplicado pela sua
posição: 3*1 + 10*2 + 15*3 = 68.
03 10 15 28 68
Depois da transmissão e recepção com ruído, o receptor recebe o pacote com erro:
03 12 15 28 68
Refaz-se a soma simples 03+12+15=30 e a soma ponderada 3*1+12*2+15*3=72.
A diferença das somas simples (28-30) dá-nos o valor do erro e a diferença das somas
ponderadas dividida pelo erro dá-nos a posição do erro ((72-68)/2=2). Pode-se assim
corrigir o erro do pacote.
No receptor, a correcção de erros R-S pode aceitar dados com uma BER de 10-4 (1 erro
em cada 10.000 bits) e corrigi-los para níveis de erros de apenas 10-10 (1 erro em cada 10
biliões de bits) ou ainda menor. É assim possível cumprir a condição QEF (quasi-error-free)
estipulada pelas normas DVB.
Com o código R-S, se forem detectados mais do que 8 bytes errados dentro de um TS,
o sistema perde todo o TS pois é incapaz de saber onde está o erro.
Como se pode ver na Figura 4-7, o entrelaçador (do tipo Forney) é composto por 12
ramos (I=12) ligados ciclicamente à trama de dados de entrada pelo interruptor de entrada.
Cada ramo (j) utiliza um registo de deslocamento FIFO, de profundidade (j x M) células,
sendo M=17 =N/I, já que N = 17*12= 204.
Para que o receptor não perca a sincronização dos pacotes de 204 bytes, os bytes de
sincronismo e de sincronismo invertido não são alterados, pois passam sempre pelo ramo
directo (ramo 0).
Por último convém salientar que a ordem dos ramos, no receptor é inversa da do
emissor.
Dado que as ligações satélite e terrestre são muito ruidosas, convém reforçar ainda
mais as medidas de protecção contra erros dos dados a transmitir. Uma dessas medidas é o
código convolucional.
Se olharmos para os bits um a um, nada os liga entre si. Cada bit é rigorosamente
independente. A ideia do código convolucional é a de ligar um bit a um ou mais bits da sua
sequência, para que, no caso de esse bit se perder, ser possível recuperá-lo correctamente.
A Figura 4-8 mostra o codificador convolucional utilizado pelo DVB-S. Cada bit
incidente vai gerar dois bits de saída (1 bit em X e outro bit em Y). Repare que os bits ficam
correlacionados entre si pois o bit da saída X é a soma em módulo 2 dos bits nas posições
1,2,3,4 e 7 enquanto que o bit na saída Y é a soma módulo 2 dos bits nas posições 1,3,4,6 e
7.
O código obtido em X e Y (código "trellis") vai permitir encontrar o valor mais provável
de um bit por comparação com os outros bits anteriormente recebidos. Não é fácil de
explicar como, porque se trata de um processo matemático puro, mas é um sistema muito
eficiente na prática para corrigir erros.
1 2 2 1/2 X1Y1 - 9
2 4 3 2/3 X1Y1Y2 X2 10
3 6 4 3/4 X1Y1Y2X3 X2 Y 3 11
Na tabela indicam-se também quais os bits nas saídas X e Y que são transmitidos e os
que são eliminados pelo puncturing.
Define-se roll-off como a zona em que o filtro passa de passante (on) para o corte (off)
tal como indicado na Figura 4-9. Por definição, o roll-off R é igual a R = x / B e pode
variar de zero (pendente vertical) até 1 ou 100% quando x = B. O roll-off também se aplica
a filtros passa banda.
Um filtro com roll-off maior que zero, diminui o débito útil do sinal que passa por ele,
tanto mais quanto maior for o roll-off por isso largura ed banda e débito útil estão sempre
relacionados pelo roll-off pela fórmula BW = Débito útil x (1+Roll Off)
Para o DVB-S foi adoptado o roll-off de 0,35 (35%) por razões que serão explicadas
mais tarde.
Variação da amplitude (de –Ap a Uma frequência constante fp com Um vector de amplitude Ap gira
+Ap) em função do tempo. amplitude Ap à velocidade angular Ω
A
A +Ap A Ap Ap ωt+φ
t fp φ
-Ap f
Nas modulações de sinais digitais, são utilizadas as três modulações da Figura 4-11.
(a) Modulação ASK (amplitude)) (b) Modulação FSK (frequência) (c) Modulação PSK (fase)
Na transmissão de sinais via satélite, os sinais digitais sofrem grande número de erros
devido aos cerca de 74.000Km que o sinal percorre entre terra-satélite-terra e ao facto dos
sinais chegarem muito fracos às antenas receptoras e serem facilmente interferidos por
ruídos industriais ou atmosféricos.
Para satélite, a melhor solução é uma modulação de fase, designada por PSK (Phase
shift keying – modulação por comutação de fase) e que se indica na Figura 4-11-(c).
Repare que nesta modulação cada vez que o sinal digital passa de “0” para “1” ou de
“1” para “0”, a portadora inverte a fase. O receptor ao identificar valor de fase da portadora
(0º ou 180º), pode assim obter o sinal digital que ela transporta, ou bit “0” ou bit “1”.
Como se podem identificar dois valores de fase, esta modulação é designada por
BPSK ou seja Binary Phase Shift Keying.
Os bits X e Y são transformados em bits I (In phase) e Q (in Quadrature) que vão
modular uma de duas portadoras desfasadas de 90º e o resultado final é a soma dessas
duas modulações (Figura 4-13).
Obtêm-se assim dois bits à saída (“00”, “01”, “10” ou “11”) e que podem estar posicio-
nados com fases de +45º, +135º, +225º e +315º (Figura 4-14).
QPSK Q
Assim, em BPSK há um bit por símbolo enquanto que em QPSK há 2 bits por símbolo.
Numa transmissão QPSK a 10MSy/s estão a ser transmitidos 20Mb/s enquanto
que numa comunicação BPSK com os mesmos 10MSy/s apenas estão a ser
transmitidos apenas 10Mb/s.
Por vezes aparece a antiga unidade Baud, cujo sentido é o de “símbolos por
segundo”. Assim, um repetidor satélite de 36 MHz de largura de banda pode suportar um
débito bruto total de 60 Mbit/s, ou seja, um débito de símbolos igual a 30 MBaud.
Na Figura 4-15-(a) os símbolos têm pouco ruído e não há erros pois caem no
quadrante certo. Na Figura 4-15-(b) há muito ruído de fase e alguns dos símbolos ficam já
na fronteira entre quadrantes o que corresponde a erros. Na Figura 4-15-(c), os símbolos
têm tanto ruído que caem nos quadrantes indevidos (intermodulação) produzindo muitos
erros que inviabilizarão a reconstituição do sinal.
(a) Constelação QPSK com (b) Constelação QPSK com (c) Constelação QPSK com
pouco ruído e sem erros muito ruído e alguns erros intermodulação e muitos erros
O DVB-S utiliza a modulação QPSK (cada símbolo transporta 2 bits) e adoptou o roll-off
de 0.35 (35%) por ser o melhor compromisso entre uma boa eficácia do filtro e um bom
rendimento. Assim, e como exemplo, num transponder com 36 MHZ de largura de banda,
36 MHz
Débito bruto (Msy/s) 26,6 Msy/s 53,2 Mbit/s
1 0,35
Na prática, adopta-se uma largura de canal ligeiramente maior, o que permite obter o
débito bruto de 27.5 MSy/s ou seja 55 Mbit/s.
Repare que neste valor estão incluídos os bits de redundância acrescentados tanto
pelo código Reed-Solomon como pelo código convolucional (FEC), por isso, para calcular o
débito útil (TS do MPEG-2) será necessário retirar estes bits adicionais.
Pode então calcular-se uma tabela de valores de débito útil para um débito bruto de
27.5 MSy/s (55Mbit/s) num transponder de 36MHz de largura de banda, para cada um
dos valores de FEC e tendo em conta que o rendimento do código RS é de (η = 188/204).
Define-se eficiência espectral como sendo a relação entre o débito útil e a largura de
banda, permitindo assim relacionar bits/s com Hz. Repare que a eficiência espectral do
DVB-S é da ordem de 1bit/s/Hz o que quer dizer que para uma largura de banda de 27MHz
se poderiam transmitir cerca de 27Mb/s úteis. Este valor é muito mais baixo do que o que se
obtém em DVB-C e DVB-T.
Para melhor compreensão das partes constituintes dum receptor DVB-S analise a
Figura 4-17. É interessante reparar que o “coração” do sistema é um microprocessador
responsável por todo o controle e gestão do processo de recepção e descodificação do sinal.
QPSK Q
Q
IkQk = 10 IkQk = 00
IkQk = 11 IkQk = 01
Repare que em QAM também existem 4 quadrantes e os eixos são representados por I
(infase) e Q (quadrature) tal como em QPSK. Se utilizarmos 5 bits por símbolo, obtemos
uma 32-QAM (Figura 4-20).
32-QAM
IkQk = 10 IkQk = 00
IkQk = 11 IkQk = 01
IkQk = 10 IkQk = 00
IkQk = 11 IkQk = 01
L argura do Canal
Débito útil
1 RollOff
O RollOff escolhido para DVB-C é de =0.15 (meio protegido e banda estreita).
Portanto, para uma largura de 8MHz, o débito útil é de 6,96 Msy/s. Se utilizarmos uma
modulação de 64-QAM, como cada símbolo tem 6 bits, o débito bruto à saída do multiplexer
será de 6 x 6,96 = 41.76 Mbit/s já incluindo a codificação Reed-Solomon.
188
Débito útil 41,76 x 38,48 Mb/ s
204
A eficiência espectral da 64-QAM será de 38,48 Mbit/s : 8MHz = 4,8 bit/s/Hz. Repare
que agora a eficiência espectral é cerca de 4 vezes maior do que a que se obtinha em DVB-S
(aproximadamente 1bit/s/Hz).
DVB-C Head-end
Sync Detect,
Invert &
MPEG-2 energy Convolutional
Outer Coder I
TS Baseband dispersal Interleaver Byte to m-tuple Diferential
8 8 8 m m Baseband
Interface conversion encoding
shapping Modulador
Detecção e I = 12
Código Reed n-QAM
CLOCK Interface inversão de Mapeamento Codificação
Solomon Delimitação da Q
Banda base sincronismo Entrelaçamento de bytes para Diferencial
(188,204,8) Banda base
e convolucional símbolos
Dispersão de
energia
No DVB-C não vai haver FEC por isso não existe o inner coder que existia no DVB-S.
A Figura 4-23 mostra o caso de 64-QAM (com m=6, K=3 e n=4). Tenha em atenção
que b0 é o bit menos significativo (LSB) de cada byte
Uma melhor compreensão deste processo pode ser obtida analisando a Figura 4-24.
4.3.2.3. Transmodulação
Para um operador de TV por cabo, torna-se por vezes muito interessante difundir para
os seus assinantes, transponders completos provenientes de satélite (DVB-S). Para isso,
desmodula-se o sinal QPSK e volta a modular-se o Transport Stream (TS) do MPEG-2 mas
agora em 64-QAM efectuando também uma mudança das tabelas SI. O único factor a ter em
conta é que o débito útil do transponder seja inferior a 38.5 Mbit/s, o que é o mesmo que
dizer que para os transponders actuais, a FEC deve ser inferior ou igual a 3/4.
A título de exemplo, se um transponder tiver uma FEC de 2/3, o seu bitrate será de
33.79 Mbit/s. Depois da aplicação do código Reed-Salomon, o bitrate passa para 33.79 x
(204/188)=36.66 Mbit/s. Como a modulação 64-QAM transporta 6 bits por símbolo, então o
débito útil final será de 36.66/6=6.11 MSymbol/s. A largura de banda ocupada no cabo será
então de 6.11 x (1+Roll Off), quer dizer 6.11 x 1.15=7.03 MHz o que cabe perfeitamente
num canal UHF de 8MHz.
Transmitir uma trama binária por via hertziana não é tarefa fácil e isso explica a razão
pela qual a tecnologia DVB-T foi a última a aparecer.
Todos estes fenómenos produzem ecos (propagação por trajectos múltiplos devido à
presença de obstáculos) e as somas e diferenças de fase entre esses sinais provocam
“fading” (desvanecimentos) que são fenómenos que podem mesmo anular chegar a anular a
intensidade de sinal num dado instante e numa dada frequência.
T1
T2
Para tentar resolver este problema, nasceu a idéia de repartir a informação sobre
milhares de portadoras criando assim sub-canais de largura de banda muito estreita, para
que a resposta de frequência do canal possa ser considerada como constante. Assim sendo,
esses pequenos sub-canais ficam menos sujeitos às variações de amplitude devidas ao
fading e mediante técnicas de correcção de erros (código convolucional), o sistema pode
mesmo tornar-se quase que livre de erros.
Foi assim inventado um tipo de modulação que de designa por COFDM (Coded
Ortogonal FDM) e que resolve os problemas inerente à propagação de sinais DVB-T.
4.5. COFDM
No início dos anos 80, o laboratório de pesquisa francês CCETT - Centre Commun
d’Etudes en Télédiffusion et Télécommunication - fez algumas alterações à modulação
OFDM e introduziu a COFDM que se tornou desde logo como o único meio verdadeiramente
robusto para transportar informação digital de TV terrestre.
O COFDM divide o canal em células segundo o eixo dos tempos e o eixo das
l da
C a Ba n
Tempo
na
do de
ra
rg u
La
sub-banda
frequência
c ia
ên
qu
segmento
F re
tempo
Símbolo OFDM
al
tempo
a d r a de
an
oc
ba a r g u
L
nd
ia
nc
uê
Dentro de cada símbolo OFDM, e para evitar a interferência entre portadoras, as sub-
portadoras são espalhadas ortogonalmente entre si, pelo que o espaçamento entre
portadoras é igual ao inverso da duração do símbolo.
Para evitar este efeito, um intervalo de guarda é inserido entre cada símbolo OFDM
(Figura 4-29).
DADOS ÚTEIS
DADOS CODIFICADOS
1 Intervalo de
Parte utilizada
0 Guarda
1 do Símbolo
1
0
Tempo
ia
nc
uê
DURAÇÃO do
eq
SÍMBOLO OFDM
Fr
tempo é constituído por uma mistura do actual símbolo o sinal principal e as réplicas
atrasadas do anterior símbolo OFDM.
Como todos os códigos de protecção que se adicionam aos dados úteis, também o
Para evitar isso, espalham-se bits contíguos, por várias portadoras afastadas. Este
processo é chamado de “frequency interleaving” e está também ilustrado na Figura 4-29.
Tal como indicado na Figura 4-26, o sinal digital é primeiro codificado com recurso a
códigos convolucionais. A seguir é inserido um intervalo de guarda. Finalmente dados
contíguos são separados por portadoras distantes (frequency interleaving).
O sistema DVB-T utiliza portadoras piloto, que vão servir para a sincronização dos
sinais como se fossem markers.
Boosted pilot
time
Channel
Bandwidth
ncy
que
f re
Mapear dados nos símbolos OFDM significa que cada subportadora irá ser
individualmente modulada de acordo com uma das 3 constelações DVB-T e que se indicam
na Figura 4-31.
Como se mostra na Figura 4-32, a modulação hierárquica pode ser vista como uma
separação em dois circuitos virtuais do canal de radiofrequência, cada um com o seu bitrate
específico, uma robustez específica e igualmente, com áreas de cobertura também
HP LP
10
HP LP 10
1101
01
10 1101
1001
As vantagens da modulação COFDM são muitas, mas o que a torna realmente única é
a sua imunidade aos ecos (fantasmas). Estes ecos podem ser produzidos quer por reflexões
em obstáculos (montes, edifícios, etc.), quer por vários emissores vizinhos operando no
mesmo canal de RF.
A este tipo de redes dá-se o nome de Redes de Frequência Única (ou do inglês SFN –
Para realizar uma rede de frequência única, é preciso que os emissores operem:
O valor do intervalo de guarda escolhido para a rede SFN tem uma grande
importância para o bom funcionamento da rede. Como a duração do intervalo de guarda dita
qual o tempo máximo de eco admissível pelo sistema, é ele que influencia a máxima
distância entre emissores trabalhando na mesma frequência. (Figura 4-33).
Na prática, o operador da rede utiliza 1 impulso por segundo (1PPS) fornecido pelo
receptor GPS. Esta referência de tempo autoriza a inserir um marcador de tempo no
multiplex, à entrada da rede de distribuição primária, para permitir, em cada emissor, ao
processador COFDM de retardar o multiplexer a entrar até que um instante comum de
tempo de difusão se produza.
A frequência de cada sub portadora do canal será rigorosamente controlada por todos
os emissores da rede.
O intervalo de guarda (Delta) pode ser igual a: 7, 14, 28, 56, 112 ou 224 µs.
Quanto maior for o intervalo de guarda mais protegido está o símbolo.
A duração de um símbolo é igual a: 4, 8, 16, 32 vezes Delta
A modulação das portadoras pode ser: QPSK, QAM 16 ou QAM 64.
É justamente esta a diferença, pois IPTV não é televisão na internet (isso é TVIP), mas
sim televisão distribuída pela rede IP.
A Figura 4-36 mostra o sistema IPTV típico para 2 canais de TV, voz e internet
Repare que o sinal de telefone está separado dos sinais de TV e de Internet e que
estes têm duas vias distintas e assimétricas, upload e download através das quais é possível
a interactividade.
Repare que no máximo o débito ideal poderia atingir os 24Mb/s mas o normal devido
às distâncias, anda pelos 8Mb a 16 Mb/s.
Por norma o serviço IPTV não se instala em clientes com menos do que 8Mb/s.
Garantem-se assim dois canais de TV (cerca de 6 Mb/s e ainda internet a cerca de 2 Mb/s.
A tecnologia DVB-H não é a que actualmente se utiliza para ver alguns programas de
TV nos telemóveis. Actualmente é utilizada uma tecnologia baseada em IP e o sinal de TV é
transmitido como parte do sinal de internet. Este sistema deixará de ter interesse real, com o
DVB-H vai trabalhar nas bandas VHF e UHF já utilizadas em TV (mas que
progressivamente ficarão cada vez mais livres com o final das emissões analógicas. Utilizará
também se necessário a banda L.
A tecnologia DVB-H é ideal para a recepção móvel de TV porque responde aos dois
maiores desafios que aí se colocam e que são:
O TPS (Transmission parameter signaling) utilizado pelo DVB-T pode aqui ser utilizado
para indicar ao receptor se é uma recepção DVB-H e em caso afirmativo, quais as
características que estão a ser utilizadas (Figura 4-41)
O DVB-T e o DVB-H são muito semelhantes, o que pode ser observado na Figura 4-42.
O multiplexer do TS aceita os sinais de TV mas a novidade agora é que pelo menos um dos
TS venha de um encapsulador DVB-H IP por forma a o empacotar no TS.
1. O que é o BER?
7. Dê uma ideia resumida de quais os dois obstáculos que foram vencidos pelo DVB-H
5.1. STANDARDS
GERAL
DVB-Cook A guideline for the use of DVB specifications and standards TR 101 200
TRANSMISSÃO
DVB-S Digital broadcasting systems for television, sound and data EN 300 421
services; Framing structure, channel coding and modulation for
11/12 GHz satellite services
DVB-C Digital broadcasting systems for television, sound and data EN 300 429
services; Framing structure, channel coding and modulation for
cable system
DVB-CS Digital broadcasting systems for television, sound and data EN 300 473
services; Satellite Master Antenna Television (SMATV) distribution
systems
DVB-MS Digital broadcasting systems for television, sound and data EN 300 748
services; Framing structure, channel coding and modulation for
DVB-MC Digital broadcasting systems for television, sound and data EN 301 749
services; Framing structure, channel coding and modulation for
Multipoint Video Distribution Systems below 10 GHz
DVB-T Digital broadcasting systems for television, sound and data ETS 300 744
services; Framing structure, channel coding and modulation for
digital terrestrial television
Digital broadcasting systems for television, sound and data EN 300 744
services; Framing structure, channel coding and modulation for
digital terrestrial television
DVB-DSNG Framing structure, channel coding and modulation for Digital EN 301 210
Satellite News Gathering (DSNG) and other contribution
applications by satellite
User guidelines for Digital Satellite News Gathering (DSNG) and TR 101 221
other contribution applications by satellite
MPEG
MULTIPLEXAGEM
DVB-SI Digital broadcasting systems for television, sound and data ETS 300 468
services; Specification for Service Information (SI) in Digital Video
Broadcasting (DVB) systems
Digital broadcasting systems for television, sound and data ETR 162
services; Allocation of Service Information (SI) codes for Digital
Video Broadcasting (DVB) systems
DVB-TXT Digital broadcasting systems for television, sound and data EN 300 472
services; Specification for conveying ITU-R System B Teletext in
Digital Video Broadcasting (DVB) bitstreams
DVB-DATA Specification for the transmission of data services in DVB EN 101 192
bitstreams
SUBTITLING
DVB-SUB Digital broadcasting systems for television, sound and data ETS 300 743
services; Subtitling systems
INTERFACING
DVB-CI Common Interface Specification for Conditional Access and other EN 50221
Digital Video Broadcasting Decoder Applications
Guidelines for Implementation and Use of the Common Interface for R 206 001
DVB Decoder Applications
HOME NETWORKS
DVB-HAN Home Access Network (HAN) with an Active Telco Network TS 101 224
Termination
INTERACTIVITY
DVB-NIP Network Independent Protocols for DVB Interactive Services ETS 300 802
Guidelines for the use of the Network Independent Protocols for TR 101 194)
DVB Interactive Services
DVB-RCC DVB interaction channel for Cable TV distribution system (CATV) ETS 300 800
DVB interaction channel for Cable TV distribution system (CATV) ES 200 800
Guidelines for the implementation and usages of the specification TR 101 196
for DVB interaction channel for Cable TV distribution systems
(CATV)
DVB-RCP DVB interaction channel through the Public Switched ETS 300 81
Telecommunications System (PSTN) / Integrated Services Digital
DVB-RCD DVB interaction channel through Digital Enhanced Cordless EN 301 193
Teleommunications (DECT)
DVB-RCL DVB interaction channel for LMDS distribution systems EN 301 199
DVB-RCG Interaction channel through the Global System for Mobile EN 301 195
communications (GSM)
DVB-RCCS DVB Interaction Channel for Satellite Master Antenna Television TR 101 201
(SMATV) system; Guidelines for version based on satellite and
coaxial sections
MEASUREMENT
Usage of the DVB test and measurement signalling channel (PID TR 101 291
0x001D) embedded in an MPEG-2 Transport Stream (TS)
5.2. GLOSSÁRIO
Adaptation Ancillary program data (especially PCR) which are uncoded and are
Field transmitted at least every 100ms acc. to MPEG2 or 40 ms acc. to DVB
specifications
PS Program Stream Multiplex of several audio and video PES using the same
clock.
PTS Presentation Time Stamp Time stamp for vision and sound, transmitted at
least every 0.7 sec. Integrated into PES
Q Quantization
QS Quantization scaling
RST Running Status Table Accurate and fast adaptation to a new program run if
time changes occur in the schedule
Section A table is subdivided into several sections. If there is a change, only the
section affected is transmitted
SI Service Information All the data required by the receiver to demultiplex and
decode the various programs in the TS
STC System Time Clock 27-MHz clock, regenerated from PCR for a jitter-free
readout of MPEG data
TS Transport Stream
TS Header The first 4 bytes of each TS packet contain the data (PID) required for the
demultiplexer in addition to the sync byte (0x47). These bytes are never
scrambled
TOT Time Offset Table UTC time and date with indication of local time offset
ZigZag Scan Zigzag scan of quantized DCT coefficient matrix. This gives an efficient run
length coding (RLC
5.2.1. DVB
Convolutional The data stream to be transmitted via satellite and terrestrial (DVB-S, DVB-
Coding T) is loaded bit by bit into shift registers. The data which is split and delayed
as it is shifted through different registers is combined in several paths. This
means that double the data rate (2 paths) is usually obtained. Puncturing
follows to reduce the data rate: the time sequence of the bits is predefined
by this coding and is represented by the trellis diagram.
FEC Forward Error Correction Error control bits added to useful data in the
OAMIOPSK modulator for DVB-C, -S and DVB-T.
Single- Transmitter network in which all the transmitters use the same frequency.
frequency The coverage areas overlap. Influece of echoes are minimized by guard
network intervals. The transmitters are separated by up to 60 km. The special
feature of these networks is efficient frequency utilization
Guard additional safety margin between two transmitted symbols in the COFDM
interval standard. The guard interval ensures that echoes occurring in the single-
frequency network are eliminated until the received symbol is processed.
Interleaver The RS-protected transport packets are reshuffled byte by byte by the 12-
channel interleaver. (RS FEC Reed Solomon FEC) Due to this reshuffle
what were neighbouring bytes are now separated by a maximum of 2244
bytes from other TS packets. The purpose of this is the burst error control
for defective data blocks
Puncturing Puncturing (DVB-S and -T) follows to reduce the increased data rate after
convolutional coding: Various registers are not used. The additional
redundancy is used for error control. The two data streams after puncturing
are directly applied as I and Q input signals to the QAM or OPSKmodulator
after filtering to fulfil the first Nyquist criterion.
QEF Quasi Error Free Less than one uncorrected error per hour at the input of
the MPEG2 decoder.
(BER <_10-")
QPSK Quadrature Phase Shift Keying Type of modulation for digital signals (DVB-
S and -T). The digital, serial signal components I and Q directly control
phase shift keying. The constellation diagram with its four discrete states is
obtained by representing the signal components using the I and Q signals
as coordinate axes. Due to the high nonlinear distortion in the satellite
channel, this type of modulation is used for satellite transmission: The 4
discrete states all have the same amplitude that is why nonlinear amplitude
distortions have no effect.
RS Protection RS(204,188,8) (RS = Reed Solomon) 16-byte long error control code added
Code to every transport packet consisting of 187 (scrambled) bytes +1 syncbyte
with the following result:
The packet has a length of 204 bytes and the decoder can correct up to T =
8 errored bytes. This code ensures a residual Bit Error ratio BER of approx.
1x10-" (QEF) at an input error ratio of 2x10-4.
Trellis The time sequence of the bits (DVB-S and -T) is predefined by convolutional
Diagram coding and, like the state diagram of a finite automaton, is represented as a
trellis diagram.
Viterbi Viterbi decoding makes use of the predefined time sequence of the bits
Decoding through convolutional coding (DVB-S and -T). Thanks to a series of logic
decisions, the most probably correct way is searched for through the trellis
diagram and incorrectly transmitted bits are corrected.
A/54 Guide to the Use of the ATSC Digital Television Standard at ATSC
Look for the document called A/54. Section 5 of this large document is an introduction
and overview of the subset of the MPEG-2 Video standard used for HDTV.
Introduction to Digital Video Coding and Block Matching Algorithms by Colin Manning
at University College, Cork, Ireland
An overview of Video Compression techniques and an interesting presentation of the
various Block Matching algorithms used for Motion Estimation in MPEG encoders.
Distributed Real Time Interactive (DiRTI) Video (v 2.0) at Carnegie Mellon University.
An Implementation of a Highly Available, Distributed, Real Time Video Server
supporting MPEG Aware Parity Encoding (MAPE). See also An Implementation of a
Distributed Video Server supporting MPEG Aware Parity Encoding (MAPE).
Digital Video, MPEG and Associated Artifacts by Shanawaz A. Basith and Stephen R.
Done at Imperial College, London
MPEG Facts and Infos by Eric Young at Cornell University - Infos about using UC
Berkeley's MPEG-1 encoder mpeg_encode
Lexicographically Optimal Rate Control for Video Coding with MPEG Buffer
Constraints (postscript) by Dzung T. Hoang and Elliot Linzer and Jeffrey S. Vitter
Modeling Bit Rate Variations in MPEG Sources (postscript) by Marwan Krunz and
Satish K. Tripathi
Real-Time Parallel MPEG-2 Decoding in Software by Angelos Bilas, Jason Fritts and
Jaswinder Pal Singh
Optimal Parallel MPEG Encoding by Jeffrey Moore, William Lee, Scott Dawson and
Brian Smith
Stony Brook Video Server project (with source code) by Andrew Shuvalov
A distributed video server application that provides indexing, searching and video
streaming to clients over a network (overview).
The Xanim Home Page - useful but does not do too good with MPEG