Escolar Documentos
Profissional Documentos
Cultura Documentos
% Porcentagem
∆ Intervalo de guarda
Α Alfa
@ Arroba
µ Micro
N Número de símbolos por palavra código (Reed Solomon)
K Número de símbolos por mensagem (Reed Solomon)
M Número de bits por símbolo (Reed Solomon)
P Numero de portadoras (OFDM)
D Razão de guarda
T Duração do símbolo OFDM
R Taxa de código
I Variável de atraso entre as portadoras dos segmentos
I Número da portadora
J Posição de transmissão dentro de cada portadora
SP Portadoras piloto espalhadas
CP Portadoras piloto contínuas
AC Parâmetros auxiliares
TMCC Parâmetros de transmissão, multiplexação, controle e configuração
ABn Bloco de áudio
SI Campo de sincronização
BSI Campo de informação
V Número de bits por estado da portadora
LISTA DE SIGLAS E ABREVIATURAS
CAPÍTULO 1 – INTRODUÇÃO
Desde seu advento, a televisão faz parte do cotidiano da sociedade, tendo uma alta
penetração em todas as camadas da população. Especialmente no caso do Brasil, onde a
penetração chega a 90% dos lares. A televisão é um fator de formação de opinião muito
importante, além disso, seja por razões culturais ou financeiras, a televisão é uma das
principais formas de entretenimento da maior parte da população.
As primeiras pesquisas sobre HDTV (ainda com tecnologia analógica) realizaram-se
na década de 70, nos laboratórios da NHK, a emissora de TV pública do Japão. Os sistemas
de TV digital começaram a ser pesquisados em meados da década de 80. Porém, foi somente
na década de 90, com o advento do MPEG, que ocorreram grandes avanços [10].
Atualmente são três os sistemas de TV digital mais importantes e difundidos, sendo
eles, o ATSC – T (Advanced Television System Committee Terrestrial) [14], DVB - T (Digital
Vídeo Broadcasting Terrestrial) [4] e o ISDB – T (Integrated Services Digital Broadcasting
Terrestrial) [7]. O padrão DVB – T é utilizado em um número maior de países que os outros
padrões, porém, em termos populacionais (dos países que são utilizados) o ATSC e DVB têm
resultados semelhantes. O ISBT – T é utilizado somente no Japão e passará a ser usado
também no Brasil [4].
Um breve histórico para demonstrar as evoluções individuais dos sistemas, começando
pelo ATSC, seguido pelo DVB e finalizando com o ISDB será descrito abaixo.
A partir de 1990, começa a fase de realizações de grandes esforços da América do
Norte para o estabelecimento de um sistema HDTV que utilizasse 6 MHz de largura de banda
por canal, largura já utilizada pelas emissoras de TV em operação (NTSC). O padrão
americano surgiu da união de quatro propostas concorrentes submetidas ao Advisory
Committee on Advanced Television Service (ACATS) [9]. Uma vez que todas apresentaram
excelente desempenho, motivou os proponentes a se unirem, formando-se assim a Grande
Aliança (GA), que definiu um novo padrão baseado nas melhores características obtidas de
cada sistema [6].
Na Europa, o desenvolvimento iniciou-se em setembro de 1993, sendo que, os padrões
para HDTV e SDTV foram desenvolvidos por um consórcio de indústrias e governo chamado
de Digital Vídeo Broadcasting (DVB). Esse grupo também estabeleceu padrão para as
transmissões digital via satélite e via cabo e depois completou o padrão da transmissão digital
terrestre, conhecido como DVB – T. Esse padrão tem sido utilizado principalmente para a
19
1.1 PROBLEMA
Com a criação da TV digital surgiram debates acerca de vários detalhes técnicos, com
relação aos diversos blocos funcionais que a compõem e com relação aos modelos de
exploração mais relevantes atualmente, que são o modelo Americano (ATSC – Advanced
Television Systems Committee), o modelo Europeu (DVB – Digital Vídeo Broadcasting) e o
modelo Japonês (ISDB – Integrated Services Digital Broadcasting). Cada sistema possui
20
Cada sistema possui seus méritos e limitações devido às escolhas feitas, levando-se em
conta fatores técnicos, econômicos e aplicabilidade. Devido as suas diferenças torna-se
possível uma avaliação quanto aos desempenhos quando confrontados um a um,
principalmente em etapas tão importantes para o sucesso da TV digital como os subsistemas
de codificação e modulação.
1.2 OBJETIVOS
A seguir, serão descritos os objetivos que se pretendem alcançar ao fim deste trabalho.
1.3 JUSTIFICATIVA
A TV digital é sem dúvida um dos assuntos mais importantes do momento nos meios
tecnológicos. Vários países estão implementando essa tecnologia, seja através de estudos para
um novo sistema, ou a implementação em seu país de um já existente. Pela diversidade de
opções (pelo menos três até o momento), questões comparativas sempre vêem a tona, seja
para verificar qual o melhor de todos, como para apontar deficiências, ou para acrescentar
melhorias.
Os sistemas ATSC, DVB e ISDB apresentam diferenças em seus estágios de
desenvolvimento, dessa forma, sempre que uma concorrência é estabelecida para a
implementação de um desses sistemas, seja numa região, país ou continente, estudos
comparativos acabam sendo desenvolvidos.
A TV digital possibilita a aplicação de conhecimentos adquiridos ao longo do curso de
Tecnologia, sendo que, pela complexidade cada subsistema que a compõe poderia ser
analisado de forma individual e extensa. Optou-se pelos subsistemas de codificação de áudio
e vídeo e pelo subsistema de modulação não só por abranger as disciplinas cursadas, mas
também por ser uma oportunidade de estudar mais a fundo as técnicas de cada um deles,
relembrando velhos conceitos aprendidos, além de acrescentar novos conhecimentos. Os
processos acima citados são muito importantes na TV digital, por exemplo, sem uma boa
23
O meio de pesquisa mais utilizado foi a Internet, através de visitas a sites oficiais dos
respectivos sistemas tecnológicos, a sites do governo, do CPqD, da Anatel, e através de
consulta da bibliografia oficial sugerida por cada uma das fontes oficiais de pesquisa.
Houve encontros periódicos com o professor orientador para avaliação do progresso
adquirido e para discussão de dúvidas.
24
A análise das tecnologias é realizada a partir de uma arquitetura genérica comum aos
sistemas de TV digital. A arquitetura proposta baseia-se no modelo de referência da IUT
(União Internacional de Telecomunicações) [11].
Um sistema de TV digital pode ser representado por dois subsistemas simétricos: Um
referente ao lado da transmissão e outro, referente ao lado do usuário, quando há recepção e o
consumo da informação. Esses dois blocos são chamados respectivamente de difusão e acesso
e terminal de acesso. A difusão e acesso refere-se a todas as funcionalidades necessárias para
a geração e transmissão de programas televisivos. Já a entidade terminal de acesso concentra
todas as funcionalidades para a recepção e reprodução adequadas dos programas. Ela pode ser
vista como uma URD (Unidade Receptora Decodificadora) acoplada a um aparelho de TV
analógica convencional ou um aparelho de TV digital com receptor integrado [11].
O bloco de difusão e acesso é constituído pelos módulos necessários à codificação e ao
empacotamento das informações a serem transmitidas para aos receptores digitais. Para que os
sinais de áudio e vídeo e os dados, originados na produção de conteúdo possam ser
transmitidos pela plataforma de TV digital terrestre, estes precisam ser adequadamente
codificados, logo, os sinais são processados pela camada de transporte, que os empacota e
reúne em um único sinal de transporte. Na etapa seguinte, o sinal gerado na camada de
transporte passa por um processamento adicional no módulo de codificação de canal,
modulação e transmissão e é transmitido [11].
A parte do terminal de acesso é responsável pelo processamento reverso ao da difusão
e acesso, reconstituindo as informações originais de áudio, vídeo e dados. O sinal recebido
pelo terminal de acesso, através de antenas receptoras, no módulo de recepção, demodulação
e decodificação de canal, passa por um processo de demodulação e de decodificação de canal,
de onde resulta o sinal de transporte que será enviado ao demultiplexador. Ele separa os sinais
codificados de áudio, vídeo e dados, que são então submetidos aos decodificadores de áudio,
de vídeo e ao middleware, respectivamente. Os decodificadores de áudio e vídeo reconstituem
os sinais originais, para que possam ser corretamente exibidos. O middleware, por outro lado,
além de decodificar os dados recebidos, é responsável por tratar as instruções, funcionando
como uma plataforma de execução de software. Como resultado final, tem-se as aplicações
interativas sendo utilizadas pelos usuários [11]. A Figura 2.1 demonstra o diagrama em blocos
de um sistema de TV digital.
26
Esse bloco funcional tem como objetivo a redução da taxa de bits, pois, para a
implementação de um sistema de TV digital, tem-se a necessidade de reduzir essa taxa para
que o conjunto de sinais de áudio, vídeo e dados possam ser transmitidos dentro da largura de
banda limitada pelo espectro de freqüência, que é de 6 MHz.
Para um estudo mais minucioso, esse bloco foi dividido em três subsistemas:
codificação de áudio, codificação de vídeo e de dados [11].
Esse bloco é composto por um codificador de áudio no lado da difusão e acesso, que
tem a função de compressão do sinal de áudio, para que o mesmo seja transmitido pelo canal
de radiodifusão, e pelo decodificador de áudio, no lado do terminal de acesso, sendo
responsável pela descompressão do sinal de áudio, fazendo com que este seja a reprodução do
sinal enviado antes de haver o processo de compressão [12].
O codificador de áudio recebe um sinal de áudio PCM (Pulse Code Modulation) não
comprimido proveniente do bloco de produção de conteúdo, realiza sua compressão e gera um
feixe de informação - Elementary Stream (ES) - que é repassado para a camada e transporte,
para que seja feita sua junção com os feixes de vídeo e dados, transformando-os em um único
sinal de transporte. Sendo assim, pode-se concluir que dependendo da eficiência do padrão de
codificação de áudio que será escolhida e dos esquemas de canais de áudio que será utilizado
(estéreo ou multicanal), afetará na taxa de bits que será disponibilizada para os outros fluxos
que não o de áudio [11].
O decodificador de áudio recebe o feixe de informação de áudio (ES) da camada de
transporte, realiza a sua descompressão, cedendo ao bloco de aplicações interativas uma
réplica do sinal de áudio não comprimido (PCM), enviado pela produção de conteúdo [11].
29
Este bloco tem o objetivo de reduzir a taxa de bits de vídeo, proveniente do bloco de
produção de conteúdo, para que o mesmo possa ser transmitido junto com os sinais de áudio e
dados, dentro da banda disponível [12].
Ele é composto pelo bloco de codificação de vídeo, no lado de difusão e acesso, e pelo
decodificador de vídeo no lado do terminal de acesso.
O codificador de vídeo recebe um sinal de vídeo digital PCM não comprimido do
bloco de produção de conteúdo, realiza sua compressão, e gera um feixe de informação
- Elementary Stream (ES) - que é repassado para a camada de transporte, para que seja feita
sua junção com os feixes de áudio e dados [10].
O decodificador de vídeo recebe o feixe de informação de vídeo (ES), do
demultiplexador, localizado na camada de transporte, realizando a sua descompressão,
cedendo ao bloco de aplicações interativas uma réplica do sinal de vídeo não comprimido
(PCM) enviado pela produção de conteúdo [10].
Esse bloco, diferentemente dos blocos de áudio e vídeo, é composto apenas pelo
codificador de dados, no lado de difusão e acesso, sendo que as informações provenientes
desse bloco serão encaminhadas e tratadas por um outro subsistema denominado middleware,
que não tem apenas a função de decodificação de dados.
Esse bloco organiza e fragmenta os dados a serem transmitidos pela camada de
transporte [10]. Utiliza independentemente do protocolo a ser adotado, a transmissão através
de datagramas. Um datagrama é uma estrutura lógica que contém toda a informação de
definição sobre os dados, isto é, seu tamanho e conteúdos, o destino e como deve chegar [10].
Na camada de transporte, estes dados são transmitidos dentro dos pacotes do feixe de
transporte (TS) MPEG-2, que têm um comprimento fixo de 188 bytes (payload de até 184
bytes). Por isso, os datagramas devem ser usualmente fragmentados no lado da transmissão
(Difusão e Acesso) e remontados no terminal de acesso [11].
30
2.4 MIDDLEWARE
3.1 MODULAÇÃO
Onde:
• AM do inglês “Amplitude Modulation” ou Modulação em Amplitude;
• ASK do inglês “Amplitude Shift Keying Modulation” ou Modulação por Chaveamento
de Amplitude;
• FM do inglês “Frequency Modulation” ou Modulação em Freqüência;
• FSK do inglês “Frequency Shift Keying Modulation” ou Modulação por Chaveamento
de Freqüência;
• PAM do inglês “Pulse Amplitude Modulation” ou Modulação por Amplitude de Pulso;
• PCM do inglês “Pulse Code Modulation” ou Modulação por Código de Pulso;
• PM do inglês “Phase Modulation” ou Modulação em Fase;
• PPM do inglês “Pulse Position Modulation” ou Modulação por Posição de Pulso;
• PSK do inglês “Phase Shift Keying Modulation” ou Modulação por Chaveamento de
Fase;
• PWM do inglês “Pulse Width Modulation” ou Modulação por Largura de Pulso;
• QAM do inglês “Quadrature Amplitude Modulation” ou Modulação em Quadratura de
Amplitude.
A seguir serão abordados alguns tipos de modulações utilizadas nos sistemas de DTV.
3.1.2.1 QAM
3.1.2.2 PSK
A modulação PSK (Phase Shift Keying – Modulação por Desvio de Fase) varia a fase
da portadora de acordo com os dados a serem transmitidos.
O QPSK é uma modulação derivada do PSK, porém, neste caso são utilizados
parâmetros de fase e quadratura da onda portadora para modular o sinal de informação [17].
Como agora são utilizados dois parâmetros, pode-se ter um número maior de símbolos
na constelação e um maior número de bits por símbolo. Por exemplo, se há necessidade de
transmitir 2 bits por símbolo, utiliza-se quatro tipos de símbolos possíveis, a portadora pode
assumir quatro valores de fase diferentes, cada um deles correspondendo a um dibit, por
exemplo 45º, 135º, 225º e 315º.
A modulação DQPSK [17] é uma forma particular da modulação QPSK, na qual ao
invés de ser enviado um símbolo correspondente a um parâmetro puro de fase, este símbolo
representa uma variação de fase. Neste caso, cada conjunto de bits representado por um
símbolo provoca uma variação de fase determinada no sinal da portadora.
3.1.2.3 AM-DSB-SC
Este tipo de modulação consiste no fato de que o sinal modulante interfere exclusiva e
diretamente na amplitude da portadora. A modulação AM - DSB/SC surgiu como uma forma
de se economizar a potência utilizada pela portadora no sistema AM-DSB, que é no mínimo
67% da potência total do sinal modulado [20]. O sistema AM-DSB/SC tem por princípio para
economia de potência, a supressão da portadora, fazendo com que a potência do sinal
modulado seja destinada às raias de informação.
35
Nos tópicos a seguir, serão descritos os modos utilizados pelos sistemas de TV digital
implementados atualmente.
3 bits. Cada pacote de 188 bytes resulta logo após a etapa de codificação em 828 símbolos
8-VSB. Cada seqüência de 828 símbolos, ao passar pelo multiplexador, recebe mais uma
seqüência de 4 símbolos que são adicionados ao pacote, sendo que, esses 4 símbolos são
denominados de sincronismo de segmento. Assim sendo, a seqüência de 828 símbolos com
os 4 símbolos de sincronismo de segmento é denominado segmento de dados, contendo no
total 832 símbolos. No início de uma série de 312 segmentos de dados, o multiplexador
acrescenta uma seqüência de 832 símbolos, sendo os 4 primeiros os de sincronismo de
segmento e os outros 828 os de sincronismo de campo. O sincronismo de segmento mais o
sincronismo de campo, acrescentado dos 312 segmentos de dados constituem um campo,
portanto, cada campo é formado por 313 seqüências de 832 símbolos. O conjunto de dois
campos é denominado quadro [6].
A seguir de forma sucinta descrever-se-á funcionalidade e características de cada
bloco que compõem o transmissor 8-VSB.
3.2.1.1 Codificador
0 0 0 0 0 0 0 1 1 0 0 0 1 1 1 1
D0 D1 D4 D5 D6 D7
D3
D A D O S D E S A ÍD A
DADOS DE ENTRADA
C O D IF IC A D O R 2 1 .4 5 M b p s
R EE D S O LO M O N
Este macrobloco [21] é composto pelo bloco multiplexador e pelo insersor de piloto,
que serão descritos a seguir.
40
Cada quadro é formado por dois campos, que possuem 313 seqüências de 832
símbolos, sendo 312 seqüências de segmentos de dados e uma seqüência de sincronismo
de segmento, que contém 4 bits, e sincronismo de campo, formado pelos 828 bits
restantes. A primeira seqüência de um quadro será a de sincronismo, logo após virão as
312 seqüências de segmentos de dados, conforme Figura 3.6
4 828 SÍMBOLOS
SINCRONISMO DE CAMPO
313
SINCRONISMO DE SEGMENTO
24,2ms
SEGMENTOS DADOS + FEC
SINCRONISMO DE CAMPO
1 SEGMENTO
• Geração do sinal OFDM utilizando FFT: Nessa forma de geração do sinal OFDM [13]
não é necessária a geração individual de cada subportadora utilizada. Isto permite o
uso de um número maior de portadoras sem um aumento significativo da
complexidade do sistema, mas com aumento da carga computacional.
Esse método é formado por duas fases. A primeira parte desse método é idêntica à
primeira fase do método da força bruta, gerando os sinais paralelos que representam as
amplitudes das portadoras complexas no domínio da freqüência. A segunda parte do
processo realiza-se a Transformada Rápida de Fourier Inversa (IFFT), para obter o
sinal OFDM no domínio do tempo. A Figura 3.11 demonstra um transmissor OFDM
utilizando o método da FFT.
3.2.2.1 Codificador
Estes pacotes sofrem uma aleatorização de seus bytes, evitando energia concentrada no
espectro de freqüências do sinal modulado, devido a repetição de padrões de dados. Logo
após esses pacotes são destinados ao bloco de codificação externa [20].
• Codificador externo: possibilita a detecção e correção de erros na recepção. É um
FEC (Forward Error Correction) do mesmo tipo que o 8VSB A única diferença é que
o codificador externo aumenta 16 bytes de redundância ao invés de 20 bytes
acrescentados pelo 8VSB. Isso diminui a robustez do sistema a interferências.
• Entrelaçador externo: este bloco embaralha os bytes do canal de entrada. Esse
embaralhamento permite que no desembaralhador, localizado no receptor, espalhe
uniformemente os erros causados por ruído (impulsivo, por exemplo). Esse processo
não introduz alterações de bits do sinal.
• Codificador interno: sua função é a de permitir ao receptor detectar e corrigir erros
provenientes de interferências no meio de transmissão. Esse codificador pertence a
família dos códigos convolucionais e está baseado em um código-mãe cuja a taxa de
código é R=1/2, isto significa que para cada bit de entrada haverá 2 bits na saída. É
48
Onde:
v = Número de bits por estado da subportadora;
Nbits/s = Número de bits por segundo.
Esse bloco tem como principais funções, mapear o sinal de entrada dentro de uma
estrutura de quadro adequada, inserindo nessa estrutura os sinais que terão a responsabilidade
de enviar as configurações ao receptor, ou Transmission Parameter Signals (TPS), como
também as informações transportadas pelos pilotos para o sincronismo de quadro,
sincronismo de freqüência, estimação de canal e identificação do modo de transmissão.
O estruturador [21] é constituído por dois blocos: mapeador e estruturador de quadro,
sendo esses descritos a seguir.
• Mapeador: é responsável por estabelecer uma relação entre os “v” bits oriundos do
bloco entrelaçador de símbolos e os estados de fase e amplitude das subportadoras.
Pode-se evidenciar isso através da Figura 3.15, que utiliza o código de Gray para
mapear os “v” bits nos respectivos estados da modulação 16QAM.
50
3
1000 1010 0010 0000
Quadratura 1
0011 0001
1001 1011
0
-1
1101 1111 0111 0101
-2
-3
1100 1110 0100
0110
-3 -2 -1 0 1 2 3
EM FASE
É possível verificar que nos 4 bits que identificam um estado, os dois primeiros bits
identificam o quadrante em que de encontra o estado e os outros dois identificam a posição
dentro do quadrante.
• Estruturador de quadro: depois de mapeados, são acrescentados os sinais de piloto e
TPS, assim sendo composto o quadro COFDM.
Verifica-se que através dos parâmetros onde o número de portadoras total é maior que
o número de portadoras para se transmitir a informação útil. Isso ocorre ao fato de que
algumas portadoras são utilizadas como pilotos.
O sinal de transmissão é organizado em quadros [20]. Cada quadro possui uma
duração de Ts, e consiste de 68 símbolos OFDM, numerados de 0 a 67. Quatro quadros
constituem um superquadro. Cada símbolo ou bloco é constituído de um conjunto de um
conjunto de p=6817 portadoras no modo 8k ou p=1705 portadoras no modo 2k, transmitidos
com uma duração Ts. O período de símbolo é composto por duas partes: uma parte útil (Tu) e
um intervalo de guarda (∆).
Com isso, o sinal OFDM será composto pelo símbolo útil OFDM (Tu) e o intervalo de
guarda (∆), conforme a Figura 3.17.
Um intervalo de guarda poderia ser criado apenas por uma ausência de sinal, mas as
subportadoras deixariam de ser ortogonais, dando origem ao problema de interferências entre
subportadoras (ICI).
Quando o receptor tentar demodular a primeira subportadora, irá encontrar
interferência da segunda subportadora. Isto ocorre devido a diferença entre o número de ciclos
das duas subportadoras dentro do intervalo de cálculo da FFT (T) não ser um número inteiro.
Para que o problema de interferências entre subportadoras seja eliminado, o símbolo
OFDM é estendido ciclicamente no intervalo de guarda. Assim sendo, sempre terá no inicio
de cada símbolo amostras da parte final de outra subportadora.
Se o valor do retardo for um valor menor que o intervalo de guarda, garante-se que as
réplicas retardadas do símbolo OFDM terão sempre um valor inteiro de ciclos dentro do
intervalo de cálculo da FFT [20].
No receptor OFDM, as subportadoras serão ortogonais somente se a freqüência da
portadora do sinal recebido for igual ao do oscilador local [20]. Se estas duas freqüências não
coincidirem, haverá um problema conhecido como ruído de fase.
Este problema está diretamente ligado a outro que acontece com grande freqüência em
um oscilador prático, que é o desvio de freqüência, que decorre da variação da freqüência
gerada pelo mesmo. Contando com essa variação da freqüência do oscilador transmissor, o
mesmo não estará sincronizado com o oscilador de recepção, tendo como conseqüência, o
ruído de fase. Esses dois tipos de problemas geram uma interferência entre subportadoras
54
(ICI) na recepção, causada pela perda de ortogonalidade dos subcanais, como dito
anteriormente.
O COFDM permite a utilização de quatro valores distintos para a razão de guarda (d),
que é a razão entre o intervalo de guarda (∆) e o tempo útil (Tu), ou seja: d= ∆/Tu.
Todas as operações feitas anteriormente para a obtenção do sinal OFDM são feitas
através de sinais digitais. Existe após o processo de inserção do intervalo de guarda, um sinal
modulado em OFDM, sendo este digital. Agora é necessária a conversão desse sinal digital
para um sinal analógico, a fim de obter um sinal compatível com a banda de 6MHz disponível
para a TV digital. O responsável por essa conversão é o conversor digital/analógico (D/A),
sendo que a partir dessa conversão, há uma transferência do sinal em torno da freqüência de
FI (Freqüência Intermediária), que é de 41 MHz a 47 MHz.
Isso só é possível por causa do bloco divisor de sinais que faz a separação desses
blocos com diferentes configurações, e a duplicação dos blocos adaptação de mux, dispersor
de energia, codificador externo, entrelaçador externo e codificador interno, já descrito
anteriormente.
Feito isso, é possível ter dois sinais, cada um com uma taxa de código específica para
o codificador interno. O mapeamento desses dois feixes faz possível a junção dos dois feixes
em um único feixe, podendo utilizar modulações distintas entre os dois feixes. Essas
modulações não podem ser arbitrárias, podendo existir apenas duas possibilidades: a primeira
seria a utilização da modulação QPSK para os dois feixes e a segunda a utilização de QPSK
para um dos feixes, sendo que o segundo utilizaria a modulação 16QAM [21].
No primeiro caso, com os dois feixes sendo QPSK, o que apresenta maior robustez
tem uma prioridade maior, e indicado nos dois primeiros bits da palavra de 4 bits, sendo o de
menor robustez o de menor prioridade [21].
No segundo caso, em que se um feixe sendo modulado em QPSK e outro sendo
modulado em 16QAM, o feixe QPSK é considerado de alta prioridade, e indicado nos dois
primeiros bits da palavra de 6 bits, e o 16 QAM o de baixa prioridade.
A taxa de bits na entrada do modulador DVB-T para os dois canais hierárquicos é
dependente da taxa de código escolhida para os feixes e o intervalo de guarda, que tem que ter
o mesmo valor para os dois feixes.
Existe também o BST - OFDM para modulação, sendo esse sistema do tipo
multiportadora, contendo um intervalo de guarda. É muito semelhante ao COFDM, então, nos
tópico a seguir serão comentadas somente as peculiaridades dessa modulação [3].
O BST - OFDM pode trabalhar com 3 modos de multiportadoras: 2k, 4k e 8k.
Outra inovação que aparece nesse sistema é a segmentação de banda, que divide a
banda de 6 MHz do canal em 13 segmentos. Dependendo da modulação escolhida, o sistema
utiliza um ou mais segmentos para uma camada, possibilitando a transmissão de 3 feixes de
dados utilizando tipos de modulação diferentes entre si [21]. Essa segmentação pode ser
visualizada na Figura 3.18.
56
Este bloco tem ainda a função de mapear os pacotes de dados de entrada para suas
respectivas camadas no estágio de codificação de canal. Para que este mapeamento possa
ocorrer é necessária à inserção de um sinal de controle no bloco remultiplexador. O tamanho
do quadro TS remultiplexado pode variar, dependendo do intervalo de guarda utilizado. A
seguir é mostrada na Tabela 3.3 as configurações do quadro remultiplexado.
Intervalo de guarda
MODO 1/4 1/8 1/16 1/32
2k 1280 1152 1088 1056
4k 2560 2304 2176 2112
8k 5120 4608 4352 4224
A saída do remultiplexador é formada por pacotes de 188 bytes. Desses 188 bytes, 1
byte é de sincronismo e 187 bytes são de informação útil [4].
• Codificação de canal: o macrobloco de codificação de canal é dividido em dois
blocos: codificação interna e codificação externa. A Figura 3.21 ilustra o diagrama do
codificador de canal do sistema ISDB-T.
No ISDB-T, tem-se 188 bytes de entrada no codificador e na sua saída 204 bytes,
sendo esses 16 bytes adicionados aos bytes de entrada, bytes de paridade, que proporcionarão
a correção de erros no receptor. Pode-se observar na Figura 3.22 a inserção dos bytes de
paridade no pacote de dados provenientes do codificador MPEG-2.
O bloco mapeador é responsável por estabelecer uma relação entre os “v” bits
oriundos do bloco entrelaçador de bit e os estados de amplitude/fase das subportadoras. Nas
Figuras 3.27, 3.28, 3.29 e 3.30 serão demonstrados os blocos de modulação do sistema QPSK,
DQPSK, 16QAM e 64QAM respectivamente.
O mapeamento [9] feito na etapa anterior gera uma série de símbolos complexos que
formam os segmentos de dados. Um conjunto de 96 símbolos complexos em 204 símbolos
OFDM forma um segmento de dados no modo 2k. O conjunto de 192 símbolos complexos em
204 símbolos OFDM forma um segmento de dados no modo 4k e o conjunto de 384 símbolos
complexos em 204 símbolos OFDM forma um segmento de dados no modo 8k.
O bloco de síntese de camada hierárquica faz a junção de vários segmentos de dados,
formando um único segmento de dados. Isso ocorre logo após a etapa de codificação de canal
e mapeamento, conforme Figura 3.31.
O entrelaçador temporal [21] tem como finalidade inserir atrasos entre as portadoras
dos segmentos, para evitar a transmissão de mais de uma seqüência de dados num mesmo
momento, mesmo sendo em portadoras diferentes. Tomando essa medida, evitam-se
desvanecimentos em rajadas. O valor assumido no atraso é definido no inicio da transmissão,
através da variável “I”, que assumi alguns valores predeterminados, dependentes do modo de
transmissão adotado e do grau de proteção escolhido. Quanto maior o valor de “I”, mais
protegido o sinal a ser transmitido. Os valores de atraso podem ser verificados na Tabela 3.5.
Número de Nº de Nº de
Tamanho símbolos Atraso Tamanho símbolos Atraso Tamanho símbolos Tamanho
(I) OFDM (ms) (I) OFDM (ms) (I) OFDM (I)
atrasados atrasados atrasados
0 0 0 0 0 0 0 0 0
Verifica-se no diagrama acima, que logo após o estágio de divisão dos segmentos, há
um bloco responsável pelo entrelaçamento de segmentos. Logo após o entrelaçamento de
segmentos, há um entrelaçamento que ocorre dentro dos segmentos. Esse entrelaçamento
ocorre em duas etapas: rotação de fase e aleatorização de portadoras. A aleatorização de
portadoras no modo 2k trabalha conforme a Tabela 3.6. [21].
intervalo de guarda (∆), que consiste em uma continuação cíclica da informação das
portadoras (Tu), logo após seu envio. Um símbolo OFDM com 13 segmentos ocupa a banda
de 5.571 MHz (aproximadamente 6 MHz). No sistema ISDB-T existe apenas um tipo de
modulação diferencial, que é a modulação DQPSK. Para a modulação diferencial, tem-se uma
estrutura de quadro formada por 108 portadoras para o modo 2k, 216 para o modo 4k e 432
para o modo 8k, conforme Figura 3.33.
Existem dentro do quadro OFDM [9], algumas portadoras que são utilizadas como
informações de referência conhecidas pelo receptor. As diferenças dessas portadoras para as
portadoras de dados são que as portadoras de referência possuem uma potência superior com
relação à de dados. Essas portadoras de referência são chamadas de pilotos [20], e podem ser
contínuas ou espalhadas. O número de portadoras usado para pilotos é constante em cada
modo utilizado, sendo de 96 para o modo 2k, 192 para o modo 4k e 384 para o modo 8k. Uma
portadora piloto contínua, coincide com as pilotos espalhadas a cada 4 símbolos. Essas
portadoras podem ser dos seguintes tipos: espalhadas (SP), contínuas (CP), parâmetros
auxiliares (AC) e parâmetros de transmissão, multiplexação, controle e configuração
(TMCC). As portadoras de referência são utilizadas para sincronização do quadro,
sincronização de freqüência, sincronização de tempo, estimação do canal, identificação do
modo de transmissão e correção do ruído de fase. Essas portadoras de referência, tanto as
contínuas quanto as espalhadas, são moduladas de acordo com a seqüência PRBS. A
seqüência PRBS é inicializada com a primeira portadora e incrementada a cada portadora
transmitida, podendo ser piloto ou de dados. A seguir na Figura 3.35, apresenta-se o gerador
PRBS [20].
68
Para que o sinal de TV digital possa ser inserido na faixa de 6 MHz usado na TV
analógica, é necessária uma compressão de grande desempenho do sinal de áudio [20]. Apesar
dessa compressão, o sinal de áudio tem que ter um alto nível de fidelidade e naturalidade [5].
O sistema Dolby AC-3 [5] suporta a transmissão dos sinais através de cinco canais de
áudio, além de um canal de baixas freqüências, sendo este canal considerado como 0.1.
Assim, o sistema terá 5.1 canais de áudio, criando um melhor desempenho dos sons
fores como explosões e efeitos especiais.
Tendo em vista que, para se transmitir os 5.1 canais de áudio [5] é necessária uma taxa
de aproximadamente 5 Mbps (considerando 48 kHz como freqüência de amostragem para
cada canal) e que esse sinal será adicionado a informação de vídeo, que tem uma taxa de
aproximadamente 18.2 Mbps (ATSC), é necessária a compressão do sinal de áudio para que a
informação final (áudio e vídeo) possa caber dentro do canal de 6 MHz (aproximadamente
20 Mbps disponível).
O sistema AC-3 oferece um sistema de compressão que se baseia na sensibilidade do
ouvido humano, verificando as diferenças de sensibilidade entre as diversas componentes de
freqüências que formam o espectro da audição. Analisando as componentes, podem-se
designar os níveis de quantização adequados, de acordo com o nível de percepção da
componente em um determinado instante de tempo. Através dessa ferramenta, o sistema
Dolby AC-3 consegue a redução da taxa de bits para transmissão do sinal de áudio para
384 kbps, ainda mantendo os níveis de qualidade exigidos pelo HDTV [5].
71
O sistema Dolby AC-3 [5] trabalha com até seis canais de áudio, geralmente citado
como 5.1 canais de áudio, pois o canal de baixas freqüências é considerado 0.1. Cada canal
tem uma largura de faixa mostrada na Tabela 4.1.
Cada canal de entrada no codificador Dolby AC-3 pode ser amostrado a uma
freqüência de 32 kHz (FM Broadcasting), 44.1 kHz ou 48 kHz (HDTV).
Essas duas últimas freqüências, (44.1 kHz e 48 kHz) são utilizadas para áudio com
acompanhamento de vídeo, sendo necessário o compromisso entre as freqüências de
varredura de quadro e de campo, assim assegurando um número inteiro de amostras de áudio
por quadro ou campo.
A freqüência utilizada pelo HDTV [21] é a de 48 kHz, gerado por um oscilador de
27 MHz, sincronizando assim o codificador de áudio, o codificador de vídeo e o sistema de
transporte. Cada amostra de áudio pode ser quantizada com uma precisão de 16 bits a 24 bits.
Assim, haverá na saída do conversor analógico digital amostras PCM (Pulse Code
Modulation) quantizadas nessa faixa de precisão.
A filtragem e conversão analógico-digital são mostradas na Figura 4.1.
72
O frame de sincronização [5] é formado por seis blocos codificados de áudio, com
campos adicionais de sincronização, sinalização e detecção de erros. O formato do frame de
sincronização é mostrado na Figura 4.2, onde de AB0 até AB5 são os blocos de áudio,
acompanhados do campo de sincronização (SI), de Informação (BSI) e de detecção de erros
(CRC).
O sistema Dolby AC-3 tem como finalidade oferecer ao usuário maiores facilidades e
vantagens no áudio decodificado, sendo que essas facilidades são classificadas em dois
serviços principais e seis serviços associados, onde cada serviço associado é sempre
reproduzido junto a um serviço principal.
Os serviços principais se classificam em dois grupos: o serviço normal (CM), que contém
todos os tipos de sons que estão dentro de um programa de TV (transmitido pelos sistemas de
TV convencionais), e o serviço de música e efeitos especiais que produz todos os tipos de som
do programa, com exceção do som de diálogo. Ambos os serviços podem utilizar os seis
canais de áudio e serem transmitidos a uma taxa de 320 kbps até 384 kbps.
Os serviços associados, por outro lado, são serviços adicionais que oferecem algumas
facilidades para pessoas com problemas na vista e com problemas na audição. Além disso,
oferecem alguns serviços de informação importantes para o ouvinte. Existem seis tipos de
serviços associados: serviço para pessoas com visão diminuída (VI), que utiliza um único
canal de áudio; o serviço para pessoas com audição deficiente (HI), que também utiliza um
único canal de áudio; o serviço de diálogo (D), que provê o diálogo que vai ser misturado com
o serviço principal (CM), para a formação de um serviço completo de áudio e para facilitar a
transmissão multi-linguagem; o serviço de comentário (C), que é similar ao serviço de diálogo
75
e oferece comentários adicionais sobre o programa atual que está sendo decodificado; o
serviço de emergência (E), que é um tipo de serviço orientado à transmissão de avisos de
emergência, pois tanto o sistema de transporte quanto o receptor dão prioridade a transmissão
e recepção desse tipo de serviço; o serviço voice-over (V0), que é um tipo de serviço similar
ao serviço de emergência.
A diferença está no fato de que os serviços atuais não são apagados quando a
reprodução é feita no receptor. Cada serviço de áudio é codificado através de uma seqüência
de frames (quadros) que constitui uma elementary bit stream, os quais posteriormente são
multiplexados pelo sistema de transporte junto com o sinal de vídeo, para serem transmitidos
dentro de um determinado programa de TV.
Conta também com novas freqüências de amostragem, novas taxas de bits, podendo
ter até 24 bits/amostra/canal, novas tabelas de quantização, melhoria em codificação de
fatores de escalonamento, canais surround e suporte a múltiplos idiomas [19].
Para haver compatibilidade entre esse dois padrões, os sinais dos 5 canais do MPEG-2
são combinados formando dois canais denominados L0 e R0. Essa conversão é chamada de
matrixing. Essa compatibilidade recebe o nome de MPEG-2 BC (Backward Compatible) [20].
Através desse processo, o decodificador MPEG-1 interpreta os sinais L0 e R0 como
canais esquerdo e direito, respectivamente, proporcionando o som estéreo. Já no MPEG-2, o
decodificador faz o dematrixing, recuperando os 5 canais [20].
Uma evolução da norma ISO 13818-3 foi o padrão MPEG-2 AAC (Advanced Audio
Coding), também conhecido como codificação MPEG-NBC (Non-Backward-Compatible).
Trata-se de um sistema sem compatibilidade regressiva com o MPEG-1 áudio, ou seja, nem
todo bit-stream MPEG-2 pode ser codificado por um decodificador MPEG-1, sendo o
diferencial desse padrão o melhor desempenho com relação ao MPEG-2 BC (Backward
Compatible) [20].
Os algoritmos de compressão utilizados pelo MPEG áudio conseguem obter
uma boa compressão explorando a limitação perceptiva do sistema auditivo humano, que
apresenta a característica de não ouvir determinadas freqüências na presença de outras. Essa
característica é chamada de propriedade de mascaramento [21].
O MPEG-1 áudio destina-se a transformar sinais de áudio amostrados a taxas de
32 kHz, 44.1 kHz ou 48 kHz e codificá-los a uma taxa de 32 kbps a 192 kbps.
Tanto o MPEG-1 quanto o MPEG-2 possibilitam três camadas de compressão. Para
cada camada (layer), é especificado o formato do bit-stream (seqüência de bits). Essas
camadas são compatíveis hierarquicamente, fazendo com que o decodificador do layer N
possa decodificar seqüências codificadas no layer N ou inferiores (N=1,2,3).
Cada layer tem suas características, mudando a complexidade do
codificador/decodificador, o atraso do codificador/decodificador e a eficiência de codificação
[16].
O MPEG-1 layer 1 oferece menor taxa de compressão e é usado em sistemas de áudio
de consumo, sendo sua vantagem é o baixo custo para sua implementação.
O MPEG-1 layer 2 comparado a layer 1, é capaz de remover mais sinal redundante e
capaz de aplicar os modelos psico-acústico mais eficientemente, sendo encontrado em
aplicações profissionais de consumo mais sofisticado [16].
77
O filtro de análise polifásico está presente em todos os layers MPEG áudio [21]. É
responsável por dividir o sinal de áudio em 32 sub-bandas com larguras de banda iguais
através de um filtro passa-baixas. Essas 32 bandas não representam com precisão as bandas
críticas do ouvido humano, sendo essas muito largas para as baixas freqüências.
O banco de filtros de análise que se encontra no codificador, não é exatamente o
inverso do filtro de síntese que se encontra no decodificador. Por esse fato, são gerados alguns
erros na recuperação do sinal, sendo esses erros pequenos e inaudíveis.
Tem-se outro problema gerado que é o de sobreposição de freqüências entre bandas
adjacentes, sendo que um sinal pode afetar a saída de duas bandas adjacentes [20].
O banco de filtros de análise recebe a seqüência de amostras do sinal de áudio, desloca
essa seqüência em 32 amostras e a armazena em um buffer de 512 amostras. Com isso, em
cada processo de análise, as 512 amostras do processo anterior são deslocadas em 32 amostras
para que haja a entrada das 32 novas amostras. Em seguida, o conteúdo do buffer é
78
multiplicado por uma janela C (analysis window) de 512 amostras. O resultado dessa
multiplicação é armazenado em um buffer intitulado de buffer Z. O conteúdo do buffer Z é
dividido em 8 vetores de 64 elementos. Esses 8 vetores são somados formando um único
vetor chamado de vetor Y. Esse vetor Y é transformado nas amostras correspondentes as 32
sub-bandas através da MDCT (Modified Discrete Cosine Transform).
Na fase de síntese, as amostras das 32 sub-bandas são transformadas no seu vetor
original, agora intitulado de “vetor V”, de 64 amostras, utilizando para isso a IMDCT (Inverse
Modified Discrete Cosine Transform). O vetor V é colocado dentro de um buffer FIFO (First
Input First Output), que tem a capacidade de armazenamento de 16 vetores V. Logo Após, é
formado o vetor U pela extração de blocos de 32 amostras do buffer FIFO. Esse novo vetor é
multiplicado por uma janela D (window synthesis), gerando o vetor W. Após esse processo há
uma decomposição do vetor W em 16 vetores de 32 elementos cada um. Esses 16 vetores são
somados para gerar as amostras de áudio reconstruídas [21].
16 kHz, 22.05 kHz e 24 kHz para o MPEG-2. A taxa de bits também é restrita a certos
números. Cada layer e freqüência de amostragem tem disponível várias taxas de bits, sendo
que, de acordo com a qualidade do áudio e o modo (mono ou estéreo), menor ou maior será a
• Main Profile: todas as ferramentas disponíveis são utilizadas, permitindo haver uma
qualidade elevada, mas em contrapartida requer muita memória e alta capacidade de
processamento.
• Low Complexity: é o mais simples e mais utilizado. Ele utiliza pouco processamento e
RAM, mas em contrapartida tem a taxa de compressão diminuída e a qualidade final
comprometida.
• Scaleable Sample Rate Profile: é o modo de menor complexidade, tem como
característica se adaptar a diversas larguras de banda.
• Long Term Predition – É o main profile aperfeiçoado.
Ao ser captada por uma câmera de vídeo, a imagem é convertida no transdutor óptico
elétrico (ou mosaico), passando de tridimensional para bidimensional plana, então, é enviada
ao receptor (tela da TV).
Neste processo certas características visuais humanas são exploradas, uma vez que
graças ao fenômeno da acuidade visual, que é o fenômeno no qual a retina retém a imagem
por uma fração de segundos (cerca de 1/24), faz com que não seja necessária a transmissão
das infinitas imagens que compõem uma cena em movimento, e sim um número finito de
imagens separadas por um tempo menor que o tempo de retenção da imagem na retina
humana. Este é um fator muito importante, pois, graças a isso se pode transmitir um número
menor de informação [21].
Deve-se considerar também que todos os sistemas reprodutores de imagem possuem
limitações. O menor detalhe capaz de ser reproduzido por um determinado sistema é
denominado elemento de imagem, ou pixel (picture element). A resolução de um sistema é
especificada pelo número de pixels que ele reproduz. Por exemplo, o antigo cinema de 16
mm, do qual se originou a TV em preto-e-branco, possui uma resolução de 125 mil pixels. No
caso da televisão, o menor detalhe capaz de ser reproduzido na vertical seria correspondente à
espessura de uma linha. O espaçamento vertical deve ser o menor que o mínimo detalhe
perceptível pelo observador [21].
A transmissão deve considerar a forma da tela da televisão, A tela padronizada é
retangular e a relação entre a largura da tela e a altura é chamada de aspecto. Os pontos
escolhidos para a transmissão situam-se sobre as linhas horizontais espaçadas uniformemente
no sentido vertical, sendo chamadas de “linhas de varredura”.
84
Existem dois modos de varredura (processo eletrônico que permite transformar uma
informação bidimensional em um sinal elétrico dependente apenas de uma variável, o tempo)
de imagem: o modo progressivo e o modo entrelaçado [21].
• Modo Progressivo: neste modo o feixe eletrônico varre a tela do receptor de forma
contínua até o fim do quadro (varre a tela inteira de uma vez), sendo que ao fim uma
nova varredura se inicia. É uma técnica mais moderna, que utiliza circuitos mais
complexos que melhoram a qualidade de imagem tanto para cenas em movimento,
quanto para pequenos objetos. Atualmente utilizada em televisores, aparelhos de
DVD e equipamentos de captação de imagem. Graças a isso, equipamentos com
resolução menor podem ter qualidade igual a equipamentos que usem o modo
entrelaçado.
• Modo Entrelaçado: no modo de varredura entrelaçada um quadro é dividido em dois
campos. Um primeiro campo é formado varrendo-se com o feixe eletrônico somente
metade das linhas que compõem o quadro e o segundo campo é formado varrendo-se
o mesmo com as linhas restantes. No padrão brasileiro, há 30 quadros por segundo,
ou seja, nesse modo são necessários 60 campos por segundo para compor cada
imagem [20]. A Figura 5.1 mostra o modo de varredura entrelaçado.
A resolução vertical [21] está relacionada com o número de linhas de varredura usadas
para representar cada quadro da seqüência de vídeo (linhas ativas) no sistema. Nos sistemas
convencionais de televisão utiliza-se em geral 525 e 625 linhas de varredura horizontais.
85
Nem todas as linhas carregam informação de vídeo ativo, sendo que o intervalo de
tempo correspondente a algumas delas é reservado para o intervalo de apagamento vertical,
usado para transportar o sinal de sincronismo vertical, VITS (Vertical Interval Test Signals), e
outras informações nos sistemas convencionais. O termo “ativo” serve para designar
informação de vídeo correspondente à imagem que se deseja transmitir.
perda de detalhes [18]. A Figura 5.2 mostra a comparação entre os diversos formatos
existentes.
5.1.4 Sincronismo
Nos sistemas analógicos atuais, indicam ao receptor o início e o fim de cada linha de
varredura (sincronismo horizontal) e de cada quadro ou campo (sincronismo vertical).
Nos sistemas digitais é utilizado a fim de indicar o inicio e o fim do grupo de amostras de
vídeo que serão codificadas e transmitidas
5.1.5 Amostragem
A norma CCIR 601 estabelece que uma fonte de sinal de vídeo colorido deve ter 3
componentes: uma componente de luminância Y (intensidade luninosa) e duas componentes
de crominância (Cr e Cb), que combinadas definem a tonalidade de cor.
Um grande espectro de cores pode ser representado por um conjunto de três cores
primárias, vermelho, verde e azul. Este espaço de cores é conhecido como RGB (Red, Green
and Blue). Um espaço, usado em alguns padrões de televisão (PAL, SECAM) é o YUV ou
87
utilizada pelos sistemas analógicos atuais, ou seja, 6 MHz para Brasil, Japão e Estados Unidos
e 6 MHz a 8 MHz para alguns países da Europa e Ásia [20].
Outro fator impulsionador foi à possibilidade de aumentar a diversificação na
programação, graças à implementação de três resoluções distintas, conforme Tabela 5.1:
conjunto de cores reproduzidas e pela mudança da relação (razão) de aspecto, que passa a ser
mais próxima daquela utilizada nos filmes de cinema [20].
Existe também a resolução LDTV (LOW DEFINITION TELEVISION): sistema de
televisão de baixa definição que apresenta qualidade inferior a TV convencional. Usualmente
aplicada a transmissões móveis ou portáteis, por exigirem dispositivos de exibição com telas
relativamente pequenas. É usado, por exemplo, nas transmissões de TV para celulares [21]. A
Tabela 5.2 mostra as características do LDTV para recepção em celulares.
A taxa de bits para representar um sinal de vídeo digitalizado sem compressão [20]
pode chegar aos valores de 270 Mbps e 1.5 Gbps para os sinais de SDTV e HDTV
respectivamente, sendo que a taxa de bits disponibilizada por um canal de 6 MHz é de
aproximadamente 19 Mbps. Para viabilizar a transmissão de um sinal de vídeo digital dentro
da limitada banda disponível, torna-se necessária a utilização de avançadas técnicas de
compressão.
A resolução de vídeo exige taxas que variam de 10 Mbps a 18 Mbps no modo HDTV e
taxas de 2 Mbps a 5 Mbps no modo SDTV, valores estes que dependem do padrão e
codificação utilizados.
A codificação de vídeo busca reduzir a taxa de bits necessária para a transmissão de vídeo
através da remoção de redundâncias (espacial, temporal e estatística) e aproveitando as
limitações do sistema visual humano.
60 Mbps, mas acabou tendo a taxa reduzida para 40 Mbps. Pesquisas comprovaram o
excelente desempenho do MPEG-2 para compressão de taxas superiores a 10 Mbps.
Graças a sua grande flexibilidade e eficiência, o padrão MPEG-2 foi escolhido como o
compressor de vídeo dos padrões americano, japonês e europeu.
O MPEG-2 baseia-se em conceitos de perfis e níveis, que permitem sua configuração
de modo a adaptá-lo a necessidade de determinada aplicação, sendo importante citar que
graças a essas características pode-se limitar sua complexidade, tornando-o menos complexo.
O MPEG-2 não foi desenvolvido para uma aplicação específica, característica que
permite sua utilização para as mais diversas aplicações como, por exemplo, transmissão de
TV em broadcasting, satélite ou cabo, sistemas de informação e multimídia (vídeos em
computadores), vídeos armazenados digitalmente (CDs, DVDs), entre outros. Com tantas
possibilidades uma não segmentação desse padrão implicaria em sistemas muito complexos e
consequentemente inviáveis de acordo com o que se pretendia implementar. Para solucionar
este problema o padrão foi dividido em subconjuntos que restringem as funcionalidades e
limitam os parâmetros utilizados pelo sistema [21].
Esta divisão foi realizada através da introdução dos conceitos de perfis “Profiles” e
níveis “Levels”, para estipular um padrão de conformidade entre equipamentos que não
suportam o padrão completo. Os perfis definem restrições de sintaxe que correspondem à
utilização de um subconjunto de algoritmos dentro do conjunto completo de algoritmos
estabelecidos no padrão. Os níveis estabelecem limitantes superiores para os parâmetros
utilizados por esses algoritmos.
Com isso, os codificadores e decodificadores podem restringir-se a implementação de
um determinado perfil, utilizando um subconjunto de ferramentas de codificação, e a um
determinado nível, limitando assim o grau de flexibilidade e complexidade, suportando assim
apenas uma determinada gama de valores para os parâmetros de codificação [20].
92
Deve-se citar que um decodificador compatível com MP (Main Profile) deve ser capaz
de decodificar um fluxo codificado em SP (Simple Profile) e assim sucessivamente, ou seja,
os perfis mais altos suportam todas as funcionalidades dos perfis mais baixos.
A Tabela 5.4 apresenta os níveis suportados pelo padrão MPEG-2, onde os valores
apresentados são limitantes superiores dos parâmetros.
93
Torna-se necessário citar que se um codificador produz um fluxo binário que supere,
ainda que por pouco, os limites pré-definidos para um determinado perfil e/ou nível, lhe é
atribuído o perfil e/ou nível imediatamente superior. Este princípio vale para o decodificador,
ou seja, se o mesmo apresenta capacidade aquém ao perfil e/ou nível designado,
imediatamente é classificado com perfil e/ou nível imediatamente inferior.
A identificação do perfil e nível utilizados é enviada junto ao fluxo de vídeo enviado pelo
sistema.
94
utiliza uma estrutura denominada slice restrita (restricted slice struture) que segmenta todo o
quadro. Os quadros também são divididos em grupos denominados GOP (Group of Pictures).
O GOP é uma seqüência de quadros que possibilita acesso aleatório [17].
Tipos de quadros:
Os quadros podem ser de três tipos:
• Quadro I (intracodificado): é codificado de maneira independente dos outros quadros.
• Quadros P (predito): este quadro é codificado utilizando-se o quadro de referência
anterior como preditor. Possuem uma alta compressão.
• Quadros B (bidirecional): este quadro possui informação sobre a diferença entre um
quadro anterior e um quadro atual.
Os quadros P e B são codificados tendo como referência a diferença entre um quadro
original e sua estimativa, calculada através da seguinte forma:
Quadros P: utiliza o quadro anterior utilizando a compensação de movimento e a
estimativa de movimento (transmissão das diferenças entre as imagens otimizando a
codificação, poupando bits transmitidos).
Quadros B: semelhante ao processo utilizado no quadro P, porém, toma como
referência um quadro anterior e um posterior, executando, então, a estimativa e compensação
de movimento nesses quadros que são finalmente interpolados formando um quadro estimado.
A Figura 5.4 demonstra de forma completa a seqüência de vídeo do MPEG-2 com
todas as suas divisões, ou seja, a seqüência de vídeo, o GOP (Group of Pictures), a imagem
(picture) o slice, o macrobloco e o bloco.
Nos tópicos a seguir serão descritos de forma sucinta os elementos que compõem o
codificador MPEG-2, de acordo com a Figura 5.6.
nos inúmeros quadros que formam uma imagem. Através de algoritmos especiais, consegue
uma grande eficiência no que diz respeito a retirada de informação descartável, conseguindo
assim diminuir a taxa de bits necessária para enviar determinada informação. A divisão da
Nesta etapa, após receber passar pelo quantizador, o sinal é codificado no processo
RLC (Run Lenght Code) que verifica repetição de caracteres numa determinada informação,
agrupando-os e enviando-os em seqüência de acordo com seu posicionamento. Após isso,
aplica-se o VLC (Variable Lenght Code) ou código de Huffman, como também é conhecido,
que atribui símbolos de menor comprimento as informações mais freqüentes. Este bloco faz
um tratamento em seqüências repetidas de caracteres, conseguindo assim diminuir ainda mais
a taxa de bits necessária para o envio de determinada informação.
5.5.6 Buffer
Neste capítulo serão apresentados detalhes específicos dos três sistemas de TV digital
implementados atualmente, sendo o americano ATSC – T, o europeu DVB – T e o japonês
ISDB – T.
Também será descrito o modelo brasileiro de TV digital, descrevendo-se
características e a situação atual no que diz respeito a sua implementação no país.
Será finalizado com uma sucinta descrição sobre o IPTV.
6.1 ATSC
6.1.1 Histórico
Baseado nos testes de laboratório dos sistemas digitais propostos, em março de 1993,
foram desenvolvidas as recomendações relativas ao sistema digital pelo “Advisory Committee
on Advanced Service” (ACATS)
Posteriormente foi formada a Grande Aliança (GA), a fim de se estabelecer um padrão
HDTV único a partir das melhores características dos sistemas inicialmente testados pelo
ACATS. Os membros da GA são: AT&T, General Instrument Corporation (GI),
Massachusetts Institute of Technology (MIT), Philips Eletronics North America Corporation,
David Sarnoff Research [6]
O início das transmissões de TV digital nos Estados Unidos ocorreu em outubro de
1998 com 42 afiliadas das seis maiores redes ABC, CBS, NBC, Fox, PBS e WB em 25
grandes cidades americanas nas faixas de VHF e UHF.
A FCC (Federal Communications Commission) definiu em 1997 um cronograma de
implantação a ser seguido pelas emissoras/programadoras determinando que as afiliadas das
quatro redes principais iniciassem suas transmissões digitais nos trintas principais mercados
de televisão até novembro de 1999. Os demais mercados deveriam ser atendidos por todas
emissoras/programadoras até maio de 2002 enquanto que as emissoras educativas e não
comerciais teriam um prazo até mio de 2003.
Em julho de 2004, de um total de 1722 emissoras afiliadas nos EUA, cerca de 80%
estavam no ar. Todas as emissoras afiliadas nos trinta principais mercados televisivos já
estavam operando. Com esse nível de implementação cerca de 100% dos domicílios dos EUA
recebiam as transmissões de pelo menos uma emissora/programadora de TV digital terrestre,
80% de pelo menos cinco e 50% de no mínimo oito [6].
Um dos principais objetivos da implementação da TV digital terrestre nos Estados
Unidos é a otimização do uso do espectro de radiofreqüência. As freqüências que serão
liberadas devem ser alocadas para outros usos, tais como serviços de emergência e de
telecomunicações. Os canais de freqüência 2 a 51 foram reservados para a TV digital terrestre
e são conhecidos como core spectrum. Na etapa atual de transição algumas
emissoras/programadoras estão sendo alocadas em canais de freqüência fora do core
spectrum. Na próxima etapa eles serão realocados e os canais de 52 a 59 liberados.
O modelo de exploração adotado é o de monoprogramação em alta definição, mas não
é exclusiva já que a multiprogramação tem sido utilizada pela PBS (emissora pública
americana).
101
O padrão ATSC foi também adotado pelo Canadá, Coréia do Sul e está sendo
fortemente considerado por muitos outros países [6].
pela notação MP@HL (“Main Profile” e “High Level”), para SDTV utiliza a combinação
MP@ML (Main Profile e Main Level ).
O padrão da Grande Aliança utiliza a modulação 8-VSB (8-level Vestigial Side Band),
conforme descrito no capítulo 3, foi proposto para substituir o sistema NTSC analógico para a
transmissão terrestre de sinais de televisão numa banda de 6 MHz. O 8-VSB apresenta
desempenho muito superior quando comparado ao sistema analógico, principalmente no que
diz respeito as degradações que o sinal está sujeito no canal de transmissão, como por
exemplo, interferência, surtos de ruído,etc..
A modulação adotado pelo sistema americano de TV digital é chamado SCM (Single
Carrier Modulation), pois utiliza uma única portadora, onde os símbolos digitais são
transmitidos serialmente.
6.2 DVB
6.2.1 Histórico
também estão no ar com DVB-T, DVB-S [14] e DVB-C [14], incluindo dados em sistemas
móveis e Internet de banda larga transmitida pelo ar.
O DVB caracteriza-se por ser um padrão muito flexível com relação aos modos de
configuração, conforme especificado no capítulo 5, permitindo transmitir diversas qualidades
de vídeo numa banda de 6 MHz, 7 MHz ou 8 MHz.
Assim como o padrão americano, utiliza o MPEG-2 como codificador de vídeo, o que
possibilita uma vasta combinação de acordo com os perfis e níveis adotados. A Tabela 6.4
demonstra as resoluções utilizadas no padrão europeu de TV digital para alta definição [13].
25 progressivo, 25 entrelaçado
720 16:9 ou 4:3 50 progressivo
25 progressivo, 25 entrelaçado
544 16:9 ou 4:3
576
25 progressivo, 25 entrelaçado
480 16:9 ou 4:3
25 progressivo, 25 entrelaçado
352 16:9 ou 4:3
23.976 progressivo, 24 progressivo
29.97 progressivo, 29.97 entrelaçado
720 16:9 ou 4:3 30 progressivo, 30 entrelaçado
59.94 progressivo, 60 progressivo
23.976 progressivo, 24 progressivo
29.97 progressivo, 29.97 entrelaçado
480 640 4:3 30 progressivo, 30 entrelaçado
59.94 progressivo, 60 progressivo
23.976 progressivo
544 16:9 ou 4:3 29.97 progressivo
29.97 entrelaçado
23.976 progressivo, 29.97 progressivo
480 16:9 ou 4:3 29.97 entrelaçado
352 16:9 ou 4:3 23.976 progressivo, 29.97 progressivo
29.97 entrelaçado
288 352 16:9 ou 4:3 25 progressivo
352 16:9 ou 4:3 23.976 progressivo
240 29.97 progressivo
para tal, e tem como objetivo permitir que os deficientes auditivos possam acompanhar os
programas transmitidos. As legendas ficam ocultas até que o usuário do aparelho acione a
função na televisão através de um menu ou de uma tecla específica [14].
6.3 ISDB – T
6.3.1 Histórico
Com relação à transmissão, apresenta uma evolução com relação a utilizada no padrão
europeu. Utiliza a modulação BST-COFDM [4], que foi apresentado no capítulo 3, sendo este
um sistema multiportadora. Cada subportadora pode ser modulada utilizando QPSK, DQPSK,
16QAM ou 64QAM. No ISDB a banda é fragmentada utilizando o método BST-COFDM,
em 13 segmentos distintos que podem ser configuradas de 3 modos distintos. Cada um destes
modos, que são denominadas camadas do sistema pode ser modulado de forma independente,
através de modulações multiníveis.
O MPEG-2: AAC (Advanced Audio Coding) é o sistema adotado pelo padrão japonês
ISDB. Este sistema foi apresentado no capítulo 4. Uma das características desse sistema é a
propriedade de análise da redundância da informação entre vários fluxos, isso não ocorre, por
exemplo, no sistema MPEG-2 utilizado no padrão DVB. Também permite acomodar até 48
fluxos de áudio e até 15 programas distintos [3].
112
O AAC foi desenvolvido pelo grupo MPEG, que inclui empresas tais como a Dolby,
Fraunhofer, AT&T, Sony e Nokia (companhias que foram também responsáveis pelo
desenvolvimento das ferramentas áudio MP3 e AC-3).
Devido a sua excelente qualidade a várias taxas, o uso da norma AAC está a
começando a ser adotado em larga escala [4].
O AAC é o formato de áudio usado no sistema de Digital Broadcast japonês, o ISDB
(Integrated Services Digital Broadcasting), sendo também utilizado em vários sistemas
portáteis de som e é suportado pela maioria dos softwares reprodutores de áudio usados
atualmente.
6.4.1 Histórico
Através do decreto nº. 4.901 de 26 de novembro de 2003 o presidente Luis Inácio Lula
da Silva instituiu o Sistema Brasileiro de Televisão Digital (SBTVD), fortemente baseado na
inclusão social promovendo a diversidade cultural no país.
A partir deste decreto, iniciou-se no Brasil testes com os três sistemas implementados
mundialmente (ATSC – T, DVB – T e ISDB – T). Estes testes foram realizados pela SET
(Sociedade Brasileira de Engenharia de Televisão), ABERT (Associação Brasileira de
Emissoras de Rádio e Televisão), e Instituto Mackenzie, com acompanhamento e metodologia
da Anatel/CPqD.
A partir disso, diversas universidades brasileiras, através de seus centros de pesquisa,
desenvolveram testes em áreas distintas como terminal de acesso, canal de retorno,
modulação, transporte, compressão de sinal, middleware e aplicativos, que, em conjunto,
proporcionariam a configuração dos resultados do SBTVD. Também participaram indústrias e
emissoras agrupadas em 22 consórcios com trabalhos técnicos coordenados pelo CPqD [10].
113
6.4.2 Inovações
Para os receptores, foram definidos alguns requisitos mínimos e outros opcionais. Será
obrigatório, por exemplo, suportar o formato de vídeo especificado para o padrão nacional.
Na questão de segurança foram definidas três normas: uma com criptografia do
conteúdo transmitido (não possibilitando a cópia do conteúdo exibido), que só será adotada
caso haja uma legislação específica; outra para interfaces, permitindo que as pessoas assistam
ao conteúdo ao vivo com resolução máxima, mas que só possam gravar com 480 linhas; e
outra para ferramentas adicionais, como cartões de segurança, mas que ainda não foi
aprovada.
116
O canal de retorno poderá se dar por qualquer plataforma existente. Os set-top boxes
poderão ter portas de rede, modem, ou ainda WI-FI, GPRS, conforme a opção do fabricante.
Outra novidade é o middleware Ginga. A grande diferença da tecnologia nacional é no
uso memória e de processamento do sistema brasileiro, muito mais racional que os modelos
internacionais, pois segundo pesquisas o middlewares adotados nos três sistemas
internacionais são mais pesados, pois agregaram diferentes linguagens de programação,
muitas vezes duplicando funções.
No dia 09 de abril de 2007, dez emissoras de TV de São Paulo, entre elas a Record, o
SBT e a Rede Globo, receberam autorização do Ministério das Comunicações para digitalizar
o sinal de transmissão. A partir da assinatura do termo de consignação dos canais do Sistema
Brasileiro de Televisão Digital (SBTVD), as emissoras receberam permissão para instalar os
equipamentos necessários transmissão digital comercial.
117
Até o fim do ano de 2007, no mês de dezembro pretende-se realizar em São Paulo as
primeiras transmissões digitais.
6.5 IPTV
básicos como broadcast de canais e vídeo sob demanda para serviços avançados, que podem
incluir HDTV, replay de vídeo, visão multiângulo, além de possibilitar a gravação de vídeo.
As teles devem aproveitar ainda sua rede já estruturada para oferecer serviços que se
tornam simples para elas, como canal de interatividade para TV de alta velocidade, além da
capacidade exclusiva de permitir a realização e recepção de chamadas de voz pela TV.
Percebe-se que devido a utilização do protocolo IP para transmissão de vídeo, a IPTV
abre um grande leque de possibilidades para a nova geração de TV digital, já que os demais
serviços de comunicação (como voz e dados) também já migraram para o IP. Torna-se
possível então à convergência de múltiplos serviços para a TV, capacidade que ainda não é
explorada em sua magnitude.
Mais do que um serviço adicional, a IPTV representa uma nova esperanças as teles,
que estavam em decadência por terem seus serviços substituídos por serviços equivalentes.
Com isso podemos ter a certeza de um grande investimento no IPTV, fazendo com que não
seja apenas um modismo passageiro ou uma tendência que nunca será estabelecida para uma
tecnologia que está avançando paralelamente a digitalização da TV.
O set-top box, equipamento responsável pela conversão do sinal digital para sinal
analógico para TVs analógicas, que estava com seus dias contados, para a voltar com a IPTV;
servindo não só como interface entre a rede IP e a TV, mas como um concentrador de
serviços de comunicação doméstica, com capacidade de oferecer serviços que não são
possíveis para o esquema de transmissão de TV digital convencional. Há também a
possibilidade do envio agregado de aplicações, da mesma forma dos modelos convencionais
de TV digital, possibilitando interatividade com o usuário.
6.5.1 Tecnologias
Como requisições de QoS podem não ser reconhecidas quando pacotes IPs atravessam
diferentes redes, um sistema de IPTV em que o provedor detenha toda a estrutura de
transmissão já conta com uma vantagem, justamente devido ao tráfego QoS que seria
aplicado; essa é uma vantagem principalmente das teles. O set-top box para um sistema de
IPTV deve ter funções específicas para o serviço, como autenticação, requisição de troca de
canal, tarifação, requisições de vídeo sob demanda, entre outros.
No serviço de IPTV podem ser incluídos serviços de broadcast de TV, bem como
vídeo sob demanda (VoD). Geralmente para entrega do fluxo de vídeo, usa-se MPEG-2.
O fluxo de vídeo incluído no TS (Trasport Stream) geralmente é codificado em
MPEG-2 ou H.264. Para sinalização de troca de canal (no caso de serviço de TV broadcast)
usa-se o protocolo IGMP, utilizado para realocar o usuário em grupos Multicast. RTSP
também é utilizado para serviços de VoD.
CONCLUSÃO
O padrão japonês foi idealizado de forma a transmitir sinais de vídeo não só para
aparelhos de TV tradicionais, mas também para celulares e demais equipamentos móveis,
unindo a qualidade da transmissão em alta definição à portabilidade.
Por ter sido o último padrão desenvolvido, possui características técnicas um pouco
superiores aos citados anteriormente. É também o mais próximo da transmissão de
informações multimídia, uma das características que o padrão escolhido para o Brasil deverá
atender, mas é também o mais caro em investimentos.
Analisados de forma geral, os sistemas possuem muitas semelhanças, uma vez que
utilizam, por exemplo, o MPEG-2 como codificador de vídeo em seus subsistemas de vídeo, a
diferença se faz no uso dessa ferramenta, nas configurações escolhidas para atender as
escolhas de multiprogramação e monoprogramação, por isso, pode-se dizer que cada sistema
é ideal para seu idealizador, onde cada consórcio buscou-se aperfeiçoar ao máximo as
vantagens, tentando sobrepor as desvantagens (geográficas, econômicas, sociais) tendo como
produto final um sistema de qualidade acessível a todas as parcelas da população.
Para o Brasil, um padrão de televisão digital deve contemplar as reais necessidades da
sociedade brasileira, tendo em vista o perfil de renda da população e as novas possibilidades
abertas através da interatividade.
É necessário que a TV digital brasileira possua baixo custo e robustez na recepção,
flexibilidade, de modo que as emissoras possam escolher esquemas de programação e
modelos de negócio de acordo com sua conveniência e dos consumidores, interatividade e
promoção de novas aplicações à população, proporcionando educação e cultura, para
contribuir com a formação de uma sociedade apta a enfrentar os desafios de um mundo onde a
informação e o conhecimento são cada vez mais importantes para alcançar o progresso
econômico e o bem-estar social.
A escolha do sistema japonês pelo governo brasileiro acabou sendo uma decisão mais
política do que técnica ou econômica, pois, cedeu as pressões das emissoras de televisão, que
vêem o sistema nipônico como o que melhor atende aos seus interesses, uma vez que
praticamente descartam a possibilidade de entrada de novas emissoras, sem contar que elas
(as emissoras) irão controlar também as transmissões para equipamentos móveis (celular, por
exemplo), ou seja, as emissoras de televisão não terão novos concorrentes e de quebra
ganharam um novo mercado para explorarem que é o de transmissões para equipamentos
móveis.
122
REFERÊNCIAS
[2] Advanced Television Systems Committee. ATSC Document A/52B. Digital Audio
Compression Standard AC-3. Revision B, Washington, D.C., Jun. 14, 2005.
[3] ARIB Standard. STD-B31. Transmission System for Digital Terrestrial Television
Broadcasting. Ver. 1.5. Jul. 2003.
[5] ATSC, ATSC Stardard A/52. Digital Áudio Compression (AC-3). 1995.
[6] ATSC, ATSC Stardard A/53. ATSC Digital Television Standard. 1995.
[8] BRETL, Wayne, et al. Proceeding of IEEE. ATSC, Modulation and Transmission Vol.
94, January 2006.
[13] DVB PROJECT. Digital Vídeo Broadcasting (DVB). DVB document. 2001.
[19] SEYMOUR, Shlien. Guide to MPEG-1 Audio Standard Vol. 4. Nº. 4. 2002.
[22] Whitaker, J.C. DTV: The Revolition in Digital Vídeo Second Edition McGraw-Hill,
New York, 1999.