Você está na página 1de 3

Avaliação da Qualidade de Codecs de Código Aberto para

Transmissão VoIP
Thiago Brito Bezerra Leandro S. G. Carvalho Edjair de Souza Mota Edson Nascimento

Universidade Federal do Amazonas


Av. Gen. Rodrigo Octávio Jordão Ramos, 3000, Coroado I
69077-000 – Manaus – AM – Brasil
{tbb,galvao,edjair,edson}@dcc.ufam.edu.br

ABSTRACT Além da função básica de codificação e compressão, os codecs


One of the main components of voice over IP technology is voice mais modernos implementam outras funcionalidades que visam
coding algorithm, known as vocoders. There is a wide variety of atenuar os efeitos das degradações inseridas pelo sistema de
vocoders and some have better quality than others. This work comunicação. Por exemplo, vários codecs costumam implementar
aims to evaluate the quality of some open source vocoders, and as algum mecanismo de detecção de silêncio (VAD) e transmissão
starting point the implementation of evaluation procedure defined descontínua da fala (DTX), evitando o envio desnecessário de
by ITU-T Recommendation P.834 for thus obtain the parameter of pacotes quando o usuário está em silêncio. Outro mecanismo
impairment factor at 0% of packet loss (Ie). This parameter, comumente implementado por codecs é a compensação de perdas
specific to each vocoder, it is used by the E-Model (ITU-T Rec. de pacotes (PLC), pela qual tenta-se amenizar a perda de um ou
G.107 [6]) for evaluation of the quality of speech on VoIP calls. mais pacotes que não chegam a tempo de serem reproduzidos no
receptor. A depender da técnica empregada (substituição por
RESUMO silêncio, substituição pelo último pacote tocado, interpolação,
Um dos principais componentes da tecnologia de voz sobre IP são etc.), da quantidade de pacotes perdidos em seqüência e da
os algoritmos de codificação da fala, conhecidos como codecs. duração do(s) pacote(s) perdido(s), algumas técnicas de PLC
Existe uma grande variedade de codecs e alguns apresentam mostram-se mais eficientes que outras, determinando um melhor
melhor qualidade que outros, a depender do grau de perda de ou pior desempenho do codec.
informação proporcionada pelas técnicas de compressão Por um lado, tais funcionalidades contribuem para a oferta de um
empregadas. Este trabalho tem por finalidade avaliar a qualidade serviço VoIP de melhor qualidade para o usuário final. Por outro,
de alguns codecs de código aberto, tendo como ponto de partida a a tarefa de medição da qualidade da fala torna-se não trivial,
implementação do procedimento de avaliação definido pela Rec. devido às minúcias a serem aferidas.
ITU-T P.834 [4] para derivação do parâmetro de degradação da
fala a 0% de perda de pacotes (Ie). Este parâmetro, específico para Entre os métodos de medição da qualidade da fala mais utilizados,
cada codec, é utilizado pelo Modelo E (Rec. ITU-T G.107 [6]) temos o Modelo E [6]. Seu procedimento de medição consiste na
para avaliação da qualidade da fala. coleta de parâmetros do fluxo de voz, os quais servem de entrada
para um conjunto de equações que devolvem como resultado o
fator R, cujo valor varia de 0 (ruim) a 100 (ótimo) como medida
Palavras-Chaves da qualidade da fala avaliada. Normalmente, o resultado do
VoIP, Codecs, Qualidade de fala, Medição, Modelo E Modelo E é transformado para a escala de 1 (péssimo) a 5
(excelente) do MOS (Mean Opinion Score) [2].
1.INTRODUÇÃO Dois dos parâmetros utilizados no cômputo do Modelo E refletem
A Internet vem experimentando um crescimento considerável nos
diretamente a qualidade do codec utilizado na fala avaliada: o
últimos anos, devido à sua capacidade de compartilhamento dos
fator de degradação a 0% de perda de pacotes (Ie) e do fator de
mais diversos tipos de dados (texto, áudio, vídeo) e também por
robustez à perda de pacotes (Bpl). A Rec. ITU-T G.113 [5]
ter se tornado um meio de comunicação global de baixo custo se
apresenta valores desses parâmetros para apenas alguns codecs
comparado a outros meios de comunicação, como por exemplo a
(G.711, GSM, G.726 e G.729), de forma que não é possível medir
telefonia convencional. Isso despertou o interesse para o
a qualidade da fala segundo o Modelo E para os codecs que não
desenvolvimento de novas tecnologias de comunicação de voz
estão listados nessa recomendação (Speex, AMR e iLBC).
que possam aproveitar a infra-estrutura da Internet e a sua
flexibilidade na transmissão de dados. A obtenção dos valores de Ie e Bpl para novos codecs é realizada
de maneira off-line, antes do momento da medição do fluxo de
No processo de envio de pacotes de voz em um sistema VoIP, os
voz baseado no codec estudado. A Rec. ITU-T P.834 [4]
codecs desempenham o papel básico de codificação/
especifica o procedimento de obtenção do parâmetro Ie, mas não
decodificação do sinal analógico de voz em um sinal digital.
para o Bpl. Contudo, uma metodologia para a derivação deste
Durante esse processo, os codecs realizam a compressão dos bits
último pode ser facilmente definida com base na do primeiro.
que representam o sinal de voz, o que normalmente se dá por
meio de perda de informação. O tempo de processamento dessa Este trabalho tem por objetivo aplicar a metodologia definida na
tarefa e a quantidade de perda que efetivamente afeta a percepção Rec. ITU-T P.834 para derivação do parâmetro de degradação da
do sistema auditivo humano determina a qualidade de um codec. fala a 0% de perda de pacotes (Ie) dos codecs iLBC (15,2 kbps) e

167
© 2008 Brazilian Computer Society
Speex (diversas taxas). A definição e execução de uma independe do protocolo de sinalização empregado para
metodologia para a derivação de Bpl estão fora do escopo, no estabelecer a chamada, uma vez que o fluxo de voz é controlado
momento, ficando reservados para a continuação deste trabalho. pelo protocolo RTP, o qual é utilizado tanto pelo H.323 como
pelo SIP para transporte de mídia.
O presente artigo está organizado da seguinte forma. Na próxima
seção, apresentaremos brevemente a metodologia descrita na Rec. Para que o nosso experimento não sofresse interferência da rede
P.834. Na seção 3, será apresentado o cenário de testes utilizado. de dados da UFAM, esses dois computadores foram colocados em
Os resultados obtidos serão apresentados e analisados na seção 4 uma rede isolada, evitando competição com outros serviços. O
e, na seção 5, serão expostas as conclusões e indicados alguns ambiente pode ser visto na Figura 1.
trabalhos futuros.

2.METODOLOGIA
Aqui apresentaremos brevemente a metodologia defina na rec.
ITU-T P.834. Os leitores interessados podem encontrar em mais
detalhes a respeito em [4]. Basicamente, ela consiste em realizar
experimentos com codecs cujo valor de Ie é conhecido, a fim de
retirar o viés (bias) do ambiente de experimentação, e por fim Figura 1. Ambiente utilizado para geração de chamadas.
determinar o valor de Ie do codec desejado.
Nesse ambiente favorável, utilizamos a ferramenta de medição da
O valor de Ie é determinado de forma reversa ao processo de qualidade da fala desenvolvida em [9] e verificamos que a taxa de
determinação da qualidade da fala: utiliza-se um método de perda de pacote foi nula (Ppl = 0). Apesar de não especificado na
medição diferente do Modelo E para determinar a qualidade da Rec. P.834, observamos ser necessária a medição do atraso de
fala das amostras; converte-se o valor obtido para a escala do fator transmissão fim a fim para a determinação correta do valor de Ie,
R; aplica-se as equações do Modelo E para encontrar o parâmetro pois a qualidade da fala também é afetada por esse parâmetro, que
desconhecido, nesse caso, o fator Ie. É importante notar que no Modelo E é expresso pelo fator Id.
quando a taxa de perda de pacotes é zero, o fator Bpl não
influencia na qualidade da fala, de forma que, nessas condições, o A partir do computador gerador de chamadas, foram executados
parâmetro Ie é realmente o único fator desconhecido. scripts que estabeleciam chamadas seqüenciais com intervalos de
3 segundos de uma para a outra. No receptor, com o auxílio do
A Rec. ITU-T P.834 estabelece os seguintes passo para a OpenAM, foi possível a gravação do sinal degradado.
determinação do fator Ie:
Os dois arquivos de áudio contendo os sinais original e degradado
1. Determinação dos valores brutos do fator R para codecs foram comparados utilizando-se o método PESQ (Perceptual
conhecidos. Neste passo, vários arquivos de voz codificados Evaluation of Speech Quality), definido na Rec. ITU-T P.862 [3].
com codecs conhecidos (i.e. cujos valores de Ie e Bpl são Seu resultado é um valor entre 0 e 4,5, o qual deve ser convertido
conhecidos). para a escala MOS (1 a 5). Utilizou-se a versão acadêmica do
2. Cálculo da linha de interpolação. Realizando uma PESQ disponibilizada no próprio site da ITU-T. A instalação foi
regressão linear entre os valores teóricos de Ie com os testada e homologada segundo testes recomendados pelo manual
valores obtidos no passo anterior (valores brutos), determina- que acompanha o software.
se uma reta de interpolação, que será utilizada no próximo
passo para ajustar o valor de Ie do codec sob teste. Os arquivos de voz utilizados nas chamadas geradas foram os
3. Determinação do valor definitivo de Ie para o codec sob mesmos que acompanham a Rec. ITU-T P.834. São um total de
teste. Segue-se o mesmo procedimento do passo 1, mas desta 392 arquivos de 8 segundos de duração contendo frases faladas na
vez para o codec cujo valor de Ie deseja-se determinar. língua inglesa. Metade das frases é falada por duas vozes
4. Teste de aditividade. Tem a finalidade de verificar se o masculinas e a outra metade por duas vozes femininas.
efeito de vários processos de codificação/decodificação em Para calibração do ambiente de testes (retirada do viés), a Rec.
seqüência utilizando-se o codec estudado tem efeito aditivo ITU-T P.834 define 14 condições de testes de referência, baseadas
com relação ao fator Ie ou não. Este passo não foi realizado nos codecs cujos valores de Ie e Bpl são conhecidos. Destas,
neste trabalho. pudemos reproduzir onze, devido a problemas de propriedade
intelectual do algoritmo de codec. Para melhorar a precisão,
3.DESCRIÇÃO DOS EXPERIMENTOS acrescentamos como uma décima segunda condição de teste o
Para gerar as chamadas de voz, foram utilizados dois codec iLBC 13,33 kbps, cujo valor de Ie foi determinado em [1],
computadores, um como gerador e o outro como gravador das posteriormente à definição da metodologia P.834 [4].
chamadas. Em ambos os computadores foram instaladas as
bibliotecas PwLib e Openh323 que são de código aberto e podem Com o ambiente montado, procedeu-se os três primeiros passos
ser encontradas em [7]. das metodologia ITU-T P.834, conforme exposto na seção
anterior, para determinar o valor de Ie do codec iLBC (15,2 kbps)
No computador gerador de chamadas foi instalado o programa e do Speex (24,6; 18,2; 15 e 11 kbps).
Callgen, um softfone de código aberto baseado no protocolo de
sinalização H.323. Já no computador receptor foi instalado o
programa OpenAM, que é uma secretária eletrônica que grava as 4.RESULTADOS OBTIDOS E ANÁLISES
chamadas VoIP. Ambos podem ser encontrados em [8]. É Com os resultados das medições realizadas utilizando-se o PESQ
importante observar que o estudo da qualidade do codec foi feito o cálculo da regressão linear para que se pudesse obter o

168
nível de erro inserido pelo ambiente nas medições, esse nível de através de testes com codecs que já tem seus valores de Ie
erro pode ser verificado no gráfico da Figura 2. definidos comprovam que o ambiente segue as normas da ITU-T.
Esse gráfico apresenta a relação entre o valores K e Ie, onde K
pode ser obtido da seguinte fórmula: com essa relação pudemos 5.CONCLUSÕES
calibrar o nosso ambiente de testes e passar para a fase de Através deste trabalho, derivou-se o parâmetro de degradação da
avaliação dos codecs selecionados. qualidade da fala a 0% de perda de pacotes (Ie) para os codecs
iLBC (15,3 kbps) e Speex (24,6; 18,2; 15 e 11 kbps). Como eles
não possuem seu valor de Ie listados na Rec. ITU-T G.113 [5], até
a conclusão deste trabalho, não era possível determinar a
qualidade da fala através do Modelo E de chamadas de voz
baseadas nesses codecs. A metodologia para derivação do
parâmetro Ie está definida na Rec. ITU-T P.834 [4].
Os valores do parâmetro Ie obtidos para os codecs de código
aberto aqui avaliados mostraram-se coerentes com o fato de que
taxas de transmissão pequenas implicam em alto grau de
compressão dos pacotes de voz, o que se reflete em valores
maiores do parâmetro Ie.
Como o ambiente apresentado neste trabalho foi completamente
implementado em ferramentas de código aberto, poderá ser usado
por qualquer desenvolvedor de vocoders para avaliar a qualidade
de seu projeto e ter como modificá-lo baseando nos resultados
apresentados pelo ambiente que seguem as normas definidas nas
Figura 2. Gráfico da reta de erro do ambiente Rec. ITU-T P.834 e G.113.
Depois da geração das amostras para os codecs de código aberto
selecionados, cada uma dessas amostras foi analisada pelo método Mais detalhes sobre este trabalho podem ser obtidos no relatório
PESQ que obtém a nota MOS e com essa nota foram derivados os final de PIBIC [10]. Alguns trabalhos que se encontram em
parâmetros de qualidade. andamento são a implementação de codecs definidos na Rec.
P.834 da ITU-T para uma melhor calibração do ambiente,
Neste projeto foram avaliados três codecs de código aberto: iLBC sabendo que alguns possuem versões acadêmicas; a derivação do
e o Speex. O Speex e o iLBC possuem mais de uma taxa de parâmetro de robustez a perda de pacotes em chamadas VoIP
transmissão. Portanto, foi derivado o parâmetro Ie para cada uma (Bpl); e também a submissão dos novos valores de Ie e Bpl para
dessas taxas de transmissão. apreciação da ITU-T, a fim de atualizar a Rec. ITU-T G.113.
Os resultados obtidos com as medições neste trabalho para cada
um desses codecs podem ser observados na Tabela 1. 6.REFERÊNCIAS
[1] A. Raake. Speech quality of VoIP: Assesment and Prediction. John
Tabela 1. Tabela do fator de perda (Ie) dos novos codecs Wiley & Sons, 2006.
Taxa de [2] ITU-T Rec. P.800: Methods for subjective determination of transmission
Codec Ie
transmissão (kbps) quality. Genebra (Suíça), 1996.
iLBC 15,2 4,5
[3] ITU-T Rec. P.862: Perceptual Evaluation os Speech Quality (PESQ): An
SpeexNarrow 11,0 18 objective method for end-to-end speech quality assessment of narrow-
SpeexNarrow 15,0 6 band telephone networks and speech codecs. Genebra (Suíça), 2001.
SpeexNarrow 18,2 6
[4] ITU-T Rec. P.834: Methodology for derivation of equipment impairment
SpeexNarrow 24,6 0 factors from instrumental model. Genebra (Suíça), 2003.
Com esses resultados pode-se averiguar que, à medida que a taxa
de transmissão de um codec aumenta, a sua qualidade tende a [5] ITU-T Rec. G.113: Transmission impairments due to speech processing.
Genebra (Suíça), 2001.
aumentar proporcionalmente, visto que quanto maior a quantidade
de informações que uma amostra digital carrega melhor será a sua [6] ITU-T Rec. G.107: The E-model, a computational model for use in
qualidade quando esta for decodificada em uma amostra transmission planning. Genebra (Suíça), 2002.
analógica. [7] VOXGRATIA. Open source Voice-over-IP. www.voxgratia.org Último
acesso em: 14/06/2007.
Pode-se notar também que, quanto maior a taxa de transmissão
para um codec, menor é seu valor de Ie. Isso se deve ao fato de [8] OPENH323. Openh323 Project. www.openh323.org Último acesso em:
que uma quantidade maior de informações a respeito da amostra 14/06/2007.
original permite reconstruí-la de uma forma mais precisa, o que se [9] Carvalho, L.S.G. Uma Implementação do Modelo E para Avaliação
traduz em uma pontuação MOS melhor e, proporcionalmente, em Objetiva da Qualidade da Fala em Redes de Comunicação VoIP.
uma valor de Ie mais baixo. Dissertação de mestrado. Universidade Federal do Amazonas (UFAM).
2004.
Os resultados apresentados na Tabela 1 são coerentes visto que os [10] Brito, T. Avaliação da Qualidade de Vocoders de Código Aberto para
dados obtidos obedecem a regra acima e os resultados obtidos Transmissão VoIP UFAM. Relatório de PIBIC. Universidade Federal do
Amazonas, 2007.

169

Você também pode gostar