Você está na página 1de 6

UNIVERSIDADE FEDERAL DE PELOTAS

CENTRO DE DESENVOLVIMENTO TECNOLÓGICO


PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO

Princípios de Codificação de Vídeo

Trabalho 3

Nome: Anna Gabriele Marques de Oliveira e Geovana Silveira


Proposta: Comparar a eficiência de codificação e o tempo de codificação do software VTM (VVC)
quando a seleção de múltiplas transformadas (MTS - Multi Transform Selection) está ligada e
desligada.
Parâmetro de configuração: MTS : {0,1} # Multiple Transform Selection 1:On, 0:Off

ANEXO 1 - FORMULÁRIO PARA ENVIO DE RELATÓRIO

Experimento: Avaliação da eficiência e tempo de processamento com diferentes


configurações do codificador ( ) AV1 (X) VVC.
1) Rodar o codificador com a configuração 1.
2) Rodar o codificador com a configuração 2.
3) Observações:
a. Número de quadros a codificar = 10.
b. Para o codificador VTM, usar a configuração de base encoder_low_delay.cfg.
c. Procurar fazer as codificações com dedicação exclusiva do processador (sugestão:
deixem rodando de madrugada) para medir o tempo de forma mais confiável.
4) Gerar um gráfico de linhas que relaciona quantidade de bits (bit rate) e qualidade (PSNR Y)
para comparar as duas configurações. No exemplo abaixo, cada linha representa uma
configuração do codificador e cada ponto representa um parâmetro de quantização (QP)
utilizado nos testes (22, 27, 32, 37).
Figura 1 — Gráfico de linhas da codificação do vídeo BasketballPass
Tabela 1 — Resultados da codificação da sequência BasketballPass

PSNR (dB)
Codificação Bit rate
QP Tempo (s)
(Kbps)
Y U V

22 43.4295 45.4364 45.8148 1493.1600 259.192


Configuração 1
27 39.9525 42.7710 42.7744 827.4000 249.875

32 36.5699 40.1181 39.9027 431.6400 199.928

37 33.4870 37.9686 37.7431 218.2400 134.317

22 43.4244 45.4310 45.7984 1491.0400 285.507


Configuração 2
27 39.9659 42.7147 42.8465 827.2400 274.467

32 36.5941 39.8515 39.8229 428.0800 205.222

37 33.4645 37.9531 37.8829 216.2400 136.801

Figura 2 — Gráfico de linhas da codificação do vídeo FourPeople


Tabela 2 — Resultados da codificação da sequência FourPeople

PSNR (dB)
Codificação Bit rate
QP Tempo (s)
(Kbps)
Y U V

22 44.1356 47.4064 48.7367 6420.0960 1884.404


Configuração 1
27 41.7337 45.7547 46.9337 2643.5520 973.815

32 39.1777 43.7470 44.6945 1420.2720 621.856

37 36.2298 41.4785 42.7534 817.8240 424.903

22 44.1529 47.4343 48.7405 6360.0480 2024.604


Configuração 2
27 41.7358 45.7825 46.9004 2563.2000 1046.347

32 39.1895 43.8034 44.7352 1383.0240 655.516

37 36.2259 41.5611 42.7161 803.2800 442.319

Figura 3 — Gráfico de linhas da codificação do vídeo RaceHorsesC


Tabela 3 — Resultados da codificação da sequência RaceHorsesC

PSNR (dB)
Codificação Bit rate
QP Tempo (s)
(Kbps)
Y U V

22 42.9899 43.1441 44.0041 10991.0640 2635.739


Configuração 1
27 39.0354 40.0692 41.4021 5223.9120 1903.895

32 35.2515 37.6395 39.1757 2366.4480 1294.916

37 31.7480 35.9171 37.1257 1080.9360 1105.140

22 42.9919 43.1332 44.0188 10943.3760 2813.955


Configuração 2
27 39.0380 40.0661 41.4080 5197.7520 2026.728

32 35.2620 37.6456 39.1464 2336.3520 1369.993

37 31.8180 35.9536 37.1672 1082.7360 1145.160

RESULTADOS OBTIDOS
A metodologia utilizada para obter os resultados consistiu na alteração do parâmetro de
configuração Low Delay da seleção de múltiplas transformadas (MTS - Multi Transform
Selection) do codificador VVC para as avaliações. Cada vídeo utilizado na avaliação foi
codificado quatro vezes em cada configuração, a primeira configuração com o parâmetro do
MTS inativo em 0 e a segunda com o parâmetro ativado em 1. Cada vídeo teve 10 quadros
codificados durante a execução, além disso, foram utilizados parâmetros de quantização (QP)
diferentes para cada configuração, sendo estes 22, 27, 32 e 37.

O software VVC Test model (VTM) na versão 16.2 foi utilizado nos testes. Os experimentos
foram realizados no sistema operacional Ubuntu na versão 20.04.4 LTS e a CPU utilizada foi o
Processador Intel Pentium Gold 5405U. Foram utilizados para as análise três sequências de
vídeos com diferentes resoluções como mostrada na Tabela 4.

Tabela 4 — Sequências de vídeos utilizadas nos experimentos e suas configurações.

Vídeo Resolução FrameRate Quadros

BasketballPass 416x240_50 50 500

FourPeople 1280x720_60 60 600

RaceHorsesC 832x480_30 30 300

A configuração ‘Multi Transform Selection’ é uma nova variante de transformação de cosseno


implementada no VVC. A MTS traz mais dois tipos de transformação de seno/cosseno em
comparação com o HEVC, e tem como objetivo a melhor precisão da quantização em matrizes
já transformadas. Para que assim, seja preservada sua ortogonalidade.
A figura 1 apresenta, de forma gráfica, os resultados de PSNR obtidos para o componente Y
(luminância) e a taxa de bits transmitidos durante a codificação para as duas configurações na
sequência do vídeo BasketballPass. É possível observar que as duas configurações apresentam
valores de PSNR-Y e Bit-rate muito próximos, o que faz com que a representação gráfica tenha
linhas muito próximas uma das outras. Mas ainda assim é possível observar pela tabela 1 que a
execução com o MTS ativado na configuração 2 foi mais eficiente na codificação em
comparação ao MTS desativado em metade dos QPs no parâmetro PSNR. Já em relação ao bit
rate, a configuração 1 foi mais eficiente.

A sequência FourPeople, como podemos observar pelo gráfico da figura 2 mostra que a
configuração 1 com o parâmetro MTS desativado obteve valores menores de PSNR-Y em
comparação a configuração 2, ou seja, a execução com o MTS ativado foi mais eficiente na
codificação. Em compensação a execução da configuração 1 apresentou uma taxa de bits maior
nos quatro QPs sendo assim mais eficiente. A configuração 2 apresenta valores de tempo de
codificação superiores à configuração 1 como mostrado na tabela 2.

Os resultados da sequência RaceHorsesC indicam que a execução da configuração 2 foi mais


eficiente do que a configuração com o parâmetro desativado como mostrado na figura 3. Na
tabela 3, é possível observar que o tempo de codificação com o parâmetro ativado foi maior em
comparação com a configuração 1.

CONCLUSÕES FINAIS
A configuração MTS utiliza, por padrão, diferentes tipos de transformadas a serem avaliadas e
comparadas pelo codificador, com o objetivo de utilizar a transformada com menor distorção
aplicando-a em cada bloco codificado. Assim, sua utilização é vantajosa para melhorar a taxa de
compressão dos vídeos, ao mesmo tempo que esse adicional de complexidade computacional
gera um tempo de execução maior, o que pode ser observado nos resultados apresentados.

Além disso, podemos observar que, dentre os vídeos testados, a MTS obteve um maior
aumento de tempo no vídeo FourPeople. Além de obter também, a redução mais significativa de
Bit rate e PSNR-Y, principalmente para as resoluções mais avançadas. O que é condizente com
o esperado uma vez que o vídeo apresenta uma mudança de cenário mínima, onde a maior
parte do mesmo permanece estática enquanto apenas a porção que apresenta as quatro
pessoas possui mudança devido ao movimento das mesmas.

Nos vídeos BasketballPass e RaceHorsesC, que possuem maior diferenciação espacial entre
quadros, as distinções entre as configurações são mais sutis. Isso se dá pela similaridade dos
resultados dos três tipos de transformadas na MTS testados pelo codificador. Como os vídeos
terão uma maior estimação de movimento, as taxas de distorção entre os tipos de transformadas
também serão análogas.

Podemos concluir que a configuração MTS é melhor utilizada para o aumento da taxa de
compressão, levando-se em consideração o tempo empregado para a execução. E, retorna
resultados parcialmente vantajosos se tratando de taxas de Bit rate e PSNR.

Você também pode gostar