Escolar Documentos
Profissional Documentos
Cultura Documentos
Rio de Janeiro
2016
Mareio Marinho Baptista
Orientador:
Rio de Janeiro
2016
Mareio Marinho Baptista
The following work deals with the codecs for real-time video
transmission. ln the course of it, will be set out and explained the main difficulties in
the computar network for the transmission of these videos. The main developments
and descriptions of coding and compression standards such as, for example, known
also as HEVC standard H.265 codec. A description of the new standard HEVC
(H.265) containing the improvements presented in this new standard was made.
There will be a comparison of the new standard H.265, which obtained a reduction of
bandwidth utilization in the transmission and reception of video approximately 40%
compared to its predecessor, the H.264 codec, and will also be addressed
developments H. 265 codec, which has evolved for the development of codecs for
transmission of 3D video and the possibility of increased quality anda greater sense
of reality in the transmission and reception of video in real time.
LISTA DE FIGURAS
Página
Figura 2.1 - Comparação entre latência ejitter 19
Figura 2.2 - Definição do Skew entre mídias diferentes 20
Figura 2.3 -Transmissão Multimídia 21
Figura 2 .4 - Estrutura de um Datagrama 23
Figura 2.5 - Modelo OSI 24
Figura 3.5 - Construção do bitstream por variante em zig--zag 35
Figura 4.6 -Arquitetura de blocos do decodificador HEVC 38
Figura 4.7 - Divisão recursiva da UC 39
Figura 5.8 - Ilustração da divisão de uma CTU em CUs 43
Figura 5.9 - PSNR x BitRate - BlowingBubbles - 416x240 PSNR x 44
BitRate - Basketbal/Drill - 832x480
LISTA DE TABELAS
Página
Tabela 5.2- Comparação de desempenho entre Codec H.264 e H.265 45
LISTA DE ABREVIATURAS E SIGLAS
CB Bloco de Codificação
Codec Codificação e Decodificação
CTB Bloco de Árvore de Codificação
CTU Unidade de Árvore de Codificação
cu Unidade de Codificação
DTC Transformada Discreta de Cos-seno
HD Alta Definição
HE Alta Eficiência
HECV Alta Eficiência de Codificação de Vídeo
Modo Intra
IP Protocolo de Internet
JITTER Variação Estatística do Retardo
Kbps Kilobytes por Segundo
LC Baixa Complexidade
LD Baixo Atraso
Mbps Megabytes por Segundo
OSI Organização Internacional para a Normalização
P2P Pessoa para Pessoa
PB Bloco de Predição
QoE Qualidade de Experiência
QoS Qualidade do Serviço
RA Acesso Aleatório
RAM Memória de Acesso aleatório
RPT Protocolo de Transporte em Tempo Real
RTCP Protocolo de Controle em Tempo Real
TB Bloco da Transformada
uc Unidade de Codificação
UHD Ultra-Alta Definição
UP Unidade de Predição
UT Unidade de Transformada
VLC Método de Redução na Taxa de Bits
SUMÁRIO
Página
1 INTRODUÇÃO 12
2.TRANSMISSÃO MULTIMÍDIA NAS REDES DE COMPUTADORES 15
2.1 TRANSMISSÃO DE VÍDEO NAS REDES DE COMPUTADORES 15
2.2 TRÁFEGO DE VÍDEO 16
2.2.1 Latência 17
2.2.2 J itter 18
2.2.3 Skew 19
2.3 QUALIDADE DA EXPERIÊNCIA QoE 20
2.4 QUALIDADE DO SERVIÇO QoS 21
2.5 TRANSMISSÃO MULTIMÍDIA 21
2.6 PROTOCOLOS DE TRANSFERÊNCIA 22
2.6.1 RTP 22
2.6.2 RTCP 23
2.7 STREAMING DE VÍDEO 25
2. 7.1 Buffer 26
3. OS CODECS E A SUA RELEVÂNCIA 28
3.1 CONCEITOS BÁSICOS DE CODECS 28
3.2 CODIFICAÇÃO DE VÍDEO 29
3.2.1 Redundâncias Espaciais ou Temporais 30
3.2.2 Redundância Estatística 30
3.2.3 Exploração do Sistema Visual Humano 30
3.3 CODEC H.264 31
3.4 CODEC H.265 32
3.5 EFICIÊNCIA DOS CODECS 33
3.5.1 Compensação de Movimento 33
3.5.2 Transformada Discreta de Co-seno (DCT) 34
3.5.3 Quantificação e Codificação por VLC 35
3.5.4 Organização do Bitstream 36
4. O PADRÃO HEVC 37
4.1 Conceito de HEVC e suas Características 37
4.2 Estrutura do Codec HEVC 38
4.2.1 Unidade de Codificação (UC) 39
4.2.2 Unidade de Predição (UP) 40
4.2.3 Unidade de Transformada (UT) 40
4.2.4 Unidade Árvore de Codificação (CTU) 40
4.3 Quadros 41
5. COMPARAÇÃO DO H.265 COM O SEU ANTECESSOR 42
5.1 Comparação dos Codecs de Padrões Atuais com os Novos 42
5.2 Condições de Restrição 43
5.2.1 Random Access (RA) 43
5.2.2 Low Delay (LD) 44
6. PERSPECTIVAS DE EVOLUÇÃO DO H.265 47
6.1 O Potencial do H.265 47
7. CONCLUSÃO 50
8 TRABALHOS FUTUROS 52
REFERÊNCIAS 53
12
1. INTRODUÇÃO
atingiram 64% do tráfego de rede e com previsão de chegar até 80% no final de
streaming de vídeo em tempo real, Por exemplo: Youtube, NetFlix entre outros, não
qualidade do seu conteúdo original. Estes são os fatores que exigem uma análise
do arquivo de mídia.
também outros processos internos relevantes tais como: Latência, Jitter, Skew.
uma sequência lógica organizada, no qual cada um dos elementos acima citados,
Foi descrita a estrutura dos codecs a partir dos princípios da análise temporal
Sendo assim, citamos a estrutura hierárquica das unidades e blocos que compõem o
que geram uma transmissão de vídeo com falhas são detalhados no capítulo 2.
codec que atenda essa demanda com taxas de compressão elevadas ocupando
Efficiency Video Coding), também conhecido como H.265, esse padrão de codec foi
Para melhor entendimento das vantagens do novo padrão HEVC, foi feito
codec H.265 chega a ter uma economia de banda de até 40% em relação ao
estudos que estão sendo feitos para adicionar extensões ao HEVC para transmissão
na rede também têm efeitos sérios sobre o tráfego de tempo real (TSCHÔKE, 2001).
tempo real, será a transferência que levará mais tempo para completar. Entretanto,
um buffer de tamanho limitado. Se nenhuma medida for tomada para regular o fluxo
de dados, ele pode gerar uma sobrecarga (ou um fluxo leve demais) no buffer da
(TSCHÔKE, 2001 ).
16
suportar um jitter S30ms e uma perda de pacotes S1 %. Já para tele presença, a rede
IP deve tratar um tráfego ainda mais sensível, com jitter S1 Oms, a perda de pacotes
A infraestrutura de rede, por sua vez, deve ser pensada de forma que a
requerimentos de banda podem variar de 200kbps a até 3,5 Mbps (CISCO, 2014).
requerimentos de rede são mais leves, com uma boa infraestrutura de rede o delay e
jitter, na maior parte das vezes, não são problemas. Porém, a perda de pacotes
que numa arquitetura de rede IP ideal, deve-se controlar: o retardo fim-a-fim, a taxa
2006).
envolvidos:
17
• Latência
• Jitter
• Skew
2.2.1 Latência
Para Brun (2002), a Latência é o tempo que um pacote leva desde origem até
o seu destino final. A conversação através da rede se prejudica, caso esse atraso
pacote.
explicados como:
destino. Esse tempo envolve uma série de fatores, como por exemplo:
roteadores e switches.
sinais, respectivamente.
2.2.2 Jitter
com que o vídeo recebido apresente pequenas pausas. Uma solução é usar um
buffer maior para compatibilizar a chegada dos dados, com taxa variável, com a
exibição a uma taxa constante. O problema aqui é que o uso do buffer maior
O mesmo contabiliza o atraso total sofrido por um pacote até atingir seu
destino final a rede. Este parâmetro de medida leva em conta o tempo que os
19
N.de
Pacotes
•
- - - - - - - - jai
2.2.3 Skew
. ......áu.diD
'
.'•.
t
receptores).
Aplicações Multimídia
Por outro lado, Para transportar dados multimídia em tempo real, são
necessários protocolos capazes de levar consigo sincronia e tempo, neste caso nos
2.6.1 RTP
uma sessão em andamento, como por exemplo, uma conferência de áudio entre
diversos participantes.
para cada sessão, e o receptor precisa um nome canônico para identificar a origem
RTCP;
RTP, depois esse pacote é encapsulado num segmento UDP e então entregue ao
IP. O lado cliente extrai do UDP o pacote RTP, de onde extrai o pedaço da mídia e
passa para o media player. O RTP não provê mecanismos para certificar de que o
dado chegará dentro da data prevista ou outra qualidade de serviço. Nem garante a
23
ordem da chegada dos dados, e nem mesmo a entrega deles. Os roteadores não
Certamente o falD das aplicaçiões RTP serem feitas na maioria das vezes em
UDPnP não significa que RTP requer UDP e IP. AD passar para camada de
carregados nos paoollBs RTP para envio e caso sejam muilD grande eles poderão
ser fragmentados em vários paoot&s. Após o pacote ter sido enviado o transmissor
não poderá descartar esses dados, pois talvez seja neoessério para possfveis
correç6es de erros.
2.l.2RTCP
Aplicação
Encapsulamento de
mídia
1 RTP 1I RTCP 1
dados I oomro!e
•
UDP
t
1Pv4 f!P116
Unic&"1: ou muhicast
•
Ethernet
25
pacotes, tais pacotes serão remontados em trechos (Streams) pedaços que podem
as imagens do vídeo assim como os áudios capturados por dispositivos digitais são
streaming leva a transmissão para uma aplicação que tem como função adaptar a
empacotada pelos protocolos para seu transporte pela rede IP, a máquina receptora
real. Precisamos garantir um mínimo de largura de banda, como isso não acontece,
(retentor).
2. 7.1 Buffer
que normalmente usam a memória RAM mais rápida para armazenar dados
28
redundâncias das imagens que a compõem quadro a quadro, assim como também,
comprimir arquivos de vídeo, áudio e imagens, a fim de garantir que eles possuam
um tamanho inferior à sua fonte original, para permitir que dessa forma, eles sejam
Geralmente são utilizados codecs que comprimem com uma certa perda de
muito bem escalado desde que foi apresentado pela primeira vez e é capaz de lidar
destas tecnologias, mas o próprio codec H.264 é capaz de lidar com eles.
fora estendido de várias outras formas de 2003 à 2009. O padrão H.264/AVC é uma
tecnologia que possibilita aplicações de vídeo digital em áreas que não eram antes
cobertas pelos seus antecessores, entre eles, o MPEG-2. Ele tem sido usado em
além da alta definição (Ultra High Definition - UHD) estão criando uma demanda de
Entretanto, o problema com o H .264, é que, enquanto ele pode lidar com
blocos: Desde o típico 16x16 até o mínimo de 4x4 com uma série de
Ao contrário de H.264, que pode estender-se a cobrir a televisão 4K, mas não
maior problema nas transmissões em tempo real. Como exemplo, se não for feito
a 25 imagens por segundo no formato 4:2:0, que necessita de 124 Mbps por
condições da rede, tornaria a aplicação em tempo real inviável. Por isso, é grande a
diferentes tipos. Essas estruturas servem tanto para a subdivisão dos blocos como
(BELTRÃO, 2011 ).
• Organização do bitstream
um trecho de vídeo. A partir desse fundamento que surgiu a idéia de reduzir tal
imagem anterior.
Assim, esta técnica idealiza a criação de um codec cada vez mais eficiente
que permita construir a próxima imagem tendo como base a imagem anterior,
Outro aspecto relevante é que os novos dados devem exigir menos espaço
ao mesmo tempo em que o algoritmo para obtê-los seja o mais eficiente possível. A
posição. Por outro lado, como a transformada fornece uma série de cossenos (que
Sequências.
circulam nesses fluxos, sendo fornecidos dados de localização temporal, mas que
4. O PADRÃO HEVC
Experts Group) e a ISO/IEC MPEG (Moving Picture Experts Group como JCT-VC
llil
IP modc strean1
MV. idx
IME
blocos:
blocos:
Transformada). Ela passa a ser subdividida em quatro blOClOS idênticos, até a Clltima
UMAOI. • 0. N-. 04
~ EJ o
2
1
3
JN
/
/
lpW "4119 •O ·~11-. 1
~· EJ
CAM.a.o. -=- 1 N =- 3:2 o 1
2 ' 3
2N /
•• ••• /
•
transformada e quantização.
um modo DC, a depender do tamanho da PU. Para 4x4, 8x8, 16x16, 32x32 e 64x64,
imagens já decodificadas e as toma como referência. Pode ser usar mais de uma
(CB). O seu tamanho pode ser escolhido de forma adaptativa usando uma
um bloco de codificação (CB - CodingBlock) ainda pode ser dividido nos chamados
4.3 Quadros
Um quadro é composto por Slices, que por sua vez são fatias do quadro, tais
fatias independem uma da outra, sendo que um defeito numa, não terá afetado as
Sendo assim, o codificador pode optar por não utilizar todos os Slices,
qualidades ao vídeo.
42
necessários para analisar e comparar os codecs H.265 com o codec mais utilizado
HEVC as CTUs podem ter tamanho de 8x8, 16x16, 32x32 ou 64x64, uma CTU
64
!12
1i
10
16
8 •
HEVC. 86o duee ccn io;Oee de reebiçlo - que FelQ..n.m deis cerulrioe de
5.2.t RlindomAçcc•(RA)
Para api•8\i6N de bnalm1t. per exemplo, com ponlDe de eceeeo eleat6rio
• Alta eficiência (H E)
LC, LD HE e LD LC).
dB de ganho.
Fig. 5.9
LowDelay INTRA.
Fonte: mediaentertainmentinfo.com/2013
etc.
Suporta Até 59 .94 fps 21 Perfis; Suporta ATE 300 fps3 Perfis
níveis
47
anteriormente codificado pelo H.264 com melhor qualidade e menores taxa de bits.
áreas, incluindo aceleração da demanda e popularização de telas 4K, que tem sido
antecessor H.264.
48
Sendo assim, num futuro próximo pensa-se que o recurso a serviços Pay Tv
deixe de ser procurado pelas vantagens demonstradas nos serviços OTT. O elevado
uso de sistemas móveis também obriga a que num futuro próximo se uniformize os
Por isso, outra ideia de evolução passa pela interatividade com o utilizador,
mesmo tempo, serviço multi-view. Os planos distintos são captados por diferentes
Numa transmissão em tempo real, tende ser garantido que mesmo quando o
servidor está trocando de plano, o áudio continua a ter uma transmissão contínua.
Logo, a seleção dos planos que cada utilizador pretende visualizar é efetuada
7. CONCLUSÃO
recebendo uma demanda muito grande, os arquivos a serem transferidos pela rede
ofertas dos links xDSL). Isso vem se tornando um agravante para aplicações em
tempo real, que precisam evitar ao máximo o atraso na chegada dos pacotes
rede para se manter uma bem sucedida transmissão em tempo real. Foram
descritas características do padrão atual de codec de vídeo, o novo padrão e foi feita
uma comparação do novo com o seu antecessor, para se ter uma real noção da
qualidade conseguida.
nos codecs estão relacionadas com a vontade dos usuários de se obter mais
tempo.
O live streaming também tornou-se cada vez mais popular dando novas
do modelo P2P, torna-se necessário adaptar a rede para uma rede de distribuição
51
com menos lacunas. Prevê-se que o protocolo MPEG-DASH venha a ser adotado
que o melhorem e por consequência seja este que será adotado globalmente.
52
8 TRABALHOS FUTUROS
também outra tendência: a dos serviços de videoconferência pela nuvem que, assim
licenças.
MPEG LA, fabricantes de hardware e software, como a própria Cisco (que é parceira
codec de vídeo não pode ser considerado um formato universal como foi seu
antecessor.
codecs de vídeo open source e livre de pagamento de royalties que estão sendo
REFERÊNCIAS
GOPALAKRISHNA, S.; Hannuksela, M.M.; Gabbouj, M., "Flexible Coding Order for
30 video extension of H.265/HEVC," Picture Coding Symposium (PCS), 2013,
vol., no., pp.253, 256, 8-11 Dez. 2013. Disponível em:
http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber-6737731&isnumber-6737
661. Acessado em 15 dezembro 2015.
HERSENT, O.; Guide, D.; Petit, J. P. Telefonia IP: comunicação multimídia baseada
em pacotes. Prantice Hall, 2002, São Paulo, Brasil.
http:l/www.teleco.com.br/tutoriais/tutorialqosqoe/pagina_5.asp Acessado em 15
janeiro de 2016.
http:l/www.mediaentertainmentinfo.com/2015/06/5-reason-2015-is-the-year-of-
ott.html/ Acessado em 24 de janeiro de 2016.
http:l/www.inf.ufes.br/-pdcosta/ensino/2009-1-estruturas-de-
dados/material/CodificacaoHuffman.pdf - Acessado em 24 de janeiro de 2016.