Você está na página 1de 26

Monitoração de Desempenho de Voz sobre IP (VoIP)

Este tutorial apresenta uma abordagem para a verificação de Qualidade Conversacional em


Telefonia para a tecnologia VoIP, com base na recomendação G.107 do ITU-T, que descreve o
modelo computacional E-model.

Fabiano Nunes Machado de Abreu e Souza

Graduado em Engenharia Elétrica e de Telecomunicações pela Pontifícia Universidade Católica


do Rio de Janeiro. Especializações em diferentes redes (fabricantes) BSS GSM. Experiência
de 4 anos como Analista de Sistemas, Suporte e Gerenciamento de Redes Windows.
Atualmente como Engenheiro de RF no Planejamento e Otimização em grande operadora no
Brasil.

E-mail: abreuesouza@yahoo.com

Mateus Cunha Pereira Bueno

Graduado em Engenharia Elétrica, Telecomunicações e Sistemas de Apoio a Decisão pela


Pontifícia Universidade Católica do Rio de Janeiro. Experiência de 3 anos e meio na área de
Vendas Corporativas. Atualmente como Consultor de Soluções em Vendas em grande empresa
de telecomunicações no Brasil.

E-mail: mateus_bueno@hotmail.com

Duração estimada: 20 minutos

Publicado em: 01/05/2006

www.teleco.com.br 1
Desempenho VoIP: Introdução

A rede telefônica comutada, administrada pelas grandes empresas operadoras, ainda é a maior
rede pública de telecomunicações, embora a Internet esteja rapidamente caminhando para mudar
este quadro.

Esta rede que já evoluiu muito no sentido da digitalização da voz e de sua transmissão digital,
ainda permanece com a estrutura de uma rede de circuitos, ou seja, uma rede onde cada conexão
dispõe de um circuito próprio full-duplex durante todo o tempo em que durar a conexão.

Isto faz com que a rede telefônica tradicional seja ineficiente na utilização dos recursos de
transmissão, comparado com a transmissão de pacotes, onde o canal pode ser usado por pacotes
de diferentes conexões, aproveitando as pausas de conversação.

Desde que o protocolo IP se tornou o padrão de fato para encaminhamento em redes de pacotes,
a transmissão de voz em pacotes usando IP (VoIP) tende a substituir progressivamente a atual
forma da rede telefônica. E isto pode ser feito, aproveitando a estrutura da rede existente seja
uma rede pública ou uma rede corporativa.

Hoje, em uma rede corporativa com uma plataforma IP para sua rede de computadores não há
sentido em se construir uma infra-estrutura paralela para ligações telefônicas locais,
interurbanas ou internacionais, pois a utilização da tecnologia VoIP pode proporcionar, neste
caso, uma diminuição de custos considerável.

Como as conversações telefônicas têm características de tempo-real faz-se necessário utilizar


mecanismos para garantir a Qualidade de Serviço (QoS). A QoS oferecida das aplicações de
VoIP é dependente da qualidade oferecida pelos serviços de comunicação em geral e envolvem
diversos aspectos como fidelidade da voz, disponibilidade da rede, disponibilidade de funções
do telefone, e os recursos disponíveis para transmissão.

Porém o mais crítico é garantir a entrega de dados dentro de um prazo razoável e limitado, o que
se mede através de parâmetros como o atraso e a variação do atraso na transferência dos
pacotes. Em redes de grande porte existe ainda o problema da escalabilidade, ou seja, a
capacidade de implementar a tecnologia de QoS em larga escala.

Neste tutorial estaremos dando ênfase na apresentação dos aspectos técnicos, teóricos e
matemáticos definidos na recomendação G.107 do ITU-T, que descreve o modelo
computacional chamado E-model. Este modelo avalia os efeitos combinados de variações em
diversos parâmetros de transmissão, que afetam a qualidade conversacional na telefonia.

O E-model é recomendado para avaliar a qualidade da chamada VoIP. O desrespeito dos limites
impostos pelas recomendações sobre atraso e perda gera degradações da qualidade da voz que
se tornam perceptíveis ao usuário.

A seção Tecnologia VoIP tratará dos aspectos gerais de uma rede que pretende implantar um
sistema de Voz sobre IP. Conceituaremos os protocolos utilizados nas aplicações com
sensibilidade, aspectos gerais dos codificadores e seus respectivos métodos de codificação.
Citaremos o padrão H.323 do ITU-T, aplicação em serviços com DiffServ e os protocolos de
tempo-real.

www.teleco.com.br 2
A seção Codificação de Voz tratará dos padrões de codificação determinados pelo ITU-T. A
evolução seqüencial dos codificadores e suas características de desempenho. A seção
Transmissão tratará dos parâmetros de qualidade de serviço como os impactos causados pelo
atraso fim-a-fim e a importância da segurança e da confiabilidade para a qualidade de serviço
das transmissões de voz.

A seção Qualidade de Voz em Redes IP abordará a questão da avaliação da Qualidade de


Serviço (QoS) em uma rede de VoIP. A seção Monitoração abordará a monitoração de
desempenho de VoIP, dando ênfase ao modelo mais utilizado atualmente para esse serviço, o E-
Model.

www.teleco.com.br 3
Desempenho VoIP: Tecnologia VoIP

Atualmente o TCP/IP está presente na maioria dos sistemas operacionais de redes de pacotes,
sendo utilizado em uma gama enorme de aplicações. É um protocolo específico para aplicações
não sensíveis ao atraso como a internet.

As aplicações de voz são extremamente sensíveis a qualquer atraso, no caso, atraso de pacotes.
Dessa forma, os protocolos da camada de transporte não são adequados para aplicações de voz
em tempo real, devido à imprevisibilidade desse atraso.

O TCP não suporta transmissão de voz em tempo real porque utiliza um mecanismo de
recuperação dos dados perdidos por retransmissão, i.e., no caso da perda de um pacote, a
liberação dos dados para a aplicação deve esperar por todas as retransmissões, acarretando
atrasos intoleráveis. Por outro lado, o TCP é um protocolo confiável. O UDP evita esses
problemas de atraso, pois fornece um serviço de datagrama, mas tem como grande desvantagem
o fato de não ser confiável.

O codificador é o equipamento responsável por digitalizar a voz. Com o sinal digitalizado, a voz
pode ser transportada através de uma rede de comutação de pacotes. Até que ocorra a
transmissão dos pacotes de voz, estes passarão pelos processamentos necessários nas diferentes
camadas da rede.

No receptor, todo o processamento inverso deverá ser feito, sendo que o último e mais
complexo é transformar o sinal digital para analógico novamente, e recuperar, da forma mais
fiel possível, a conversação transmitida.

Existem duas classificações para a codificação da voz:

• Codificação baseada em forma de onda;


• Codificação paramétrica (Vocoders).

O primeiro método faz a codificação diretamente sobre a forma de onda do sinal através do
processo de amostragem. Converte a amplitude de cada amostra para um valor discreto
aproximado por valores pertencentes a um conjunto finito.

Este último processo é chamado quantização. Já o Vocoder, analisa as amostras de voz e associa
os parâmetros apropriados para a modelagem do sinal. Estes parâmetros são enviados ao
receptor para que este possa decodificar o sinal recebido e reconstruir a voz.

A escolha do codificador de voz (codec) é fundamental para o sucesso da aplicação VoIP. Os


codecs modernos são inteligentes e executam funções sobre o fluxo de dados de voz, como:
compressão, supressão de silêncio e cancelamento de eco, o que faz com que o fluxo na saída do
codec seja normalmente do tipo VBR.

O fluxo na saída de um codec de voz se apresenta sob a forma de conjuntos de pacotes de


tamanho fixo, emitidos segundo uma cadência constante, o que caracteriza um serviço do tipo
ON/OFF em rajada.

www.teleco.com.br 4
Um conjunto de pacotes (rajada) é emitido seqüencialmente segundo uma taxa máxima, o que
determina o período de ON do serviço. Uma vez emitido um conjunto de pacotes de tamanho
fixo, haverá um período de inatividade até que seja emitido o próximo conjunto de pacotes – o
que caracteriza o período de OFF do serviço (conferir a figura a seguir).

Um exemplo de codificador com essas características é o G.729 do ITU-T, que apresenta uma
qualidade de voz boa, com uma pontuação MOS de 3.29 e uma taxa de bit média de apenas 8
kbit/s. Todos esses parâmetros de classificação serão apresentados no decorrer do trabalho.

O transporte dos pacotes de voz deve ser realizado pela rede segundo exigências específicas
deste serviço, também conhecidas como parâmetros de QoS da aplicação. As redes IP não
oferecem nenhum tipo de QoS as suas aplicações multimídia, o que é considerado atualmente o
principal empecilho para as aplicações multimídia. MOS (Mean Opinion Score) é uma medida
de qualidade da voz amplamente aceita em telefonia que varia entre 1 (ruim) e 5 (excelente).

O padrão dominante para transmitir serviços multimídia em redes de pacotes como IP é a


recomendação H.323 do ITU-T, que sugere, para o encapsulamento do serviço de voz, a
utilização da pilha de protocolos IP/UDP/RTP. No entanto, o H.323 não fornece qualquer
garantia de QoS, especifica apenas, como um protocolo de transporte confiável como o TCP,
pode ser utilizado para transmissão de informações de controle destes serviços.

No âmbito do IETF, as discussões são baseadas em cinco abordagens para o oferecimento real
de QoS pela rede: A arquitetura de serviços integrados (IntServ), que utiliza o protocolo RSVP
para reserva de recursos, a Arquitetura de Serviços Diferenciados (DiffServ), o MPLS
(Multiprotocol Label Switching), o Roteamento com QoS e a Engenharia de Tráfego.

Destas abordagens, a arquitetura de serviços integrados com RSVP e a arquitetura de serviços


diferenciados (DiffServ) são as que oferecem as melhores perspectivas quando se quer
implementar serviços multimídia com QoS efetivo em redes corporativas com abrangência
limitada.

O protocolo RSVP funciona no topo do protocolo IP, na camada de transporte. É um protocolo


de controle e sinalização, compatível com o ICMP ou IGMP. O RSVP foi projetado para
funcionar com os protocolos de roteamento, considerando um único receptor ou um grupo de
receptores.

Algumas aplicações são direcionadas para apenas um receptor (unicast) enquanto que outras
podem enviar dados a mais de um receptor (multicast), sem ter que especificar cada destinatário
para a rede. Com o RSVP, a aplicação é capaz de notificar antecipadamente quais os recursos da
rede que serão necessários para atender às exigências de QoS da aplicação (sinalização).

Os roteadores envolvidos fazem uma reserva e se comprometem a oferecer estes recursos de


forma garantida. Se o roteador não é capaz de disponibilizar de forma garantida estes recursos, a
aplicação não pode ser implementada. Neste caso, a origem é imediatamente notificada,
evitando-se desperdício de tempo e recursos numa tentativa se chance de sucesso.

Os componentes do RSVP são o transmissor, o receptor e os roteadores intermediários que


intervém na rota entre a origem e o destino dos pacotes. Seu funcionamento pode se resumido
como segue: o transmissor origina os dados, especifica o destino dos mesmos e define para a
rede as exigências de QoS em relação ao transporte destes dados.

www.teleco.com.br 5
O receptor, por sua vez, envia notificações para os roteadores envolvidos para que aloquem
recursos em termo de banda e buffers e assim permitam repassar os pacotes segundo as
exigências de QoS definidas. Somente depois de completados estes passos, em ambos os
sentidos (bidirecional), são emitidos os pacotes contendo os dados de voz. A abordagem
segundo a arquitetura de DiffServ é mais recente que a abordagem do IntServ.

O objetivo principal do DiffServ é o oferecimento de uma arquitetura mais escalável e mais


gerenciável para obter diferenciação de serviços em redes IP. O DiffServ parte do pressuposto
de que este objetivo pode ser alcançado, centrando o foco não em fluxos de pacotes individuais,
mas em fluxos de tráfego agregados – formados por um conjunto de aplicações com requisitos
de serviço semelhantes.

O protocolo RTP (Real Time Protocol) é um mecanismo genérico para suportar a integração de
voz, vídeo e dados e foi definido pela RFC 1889. Sua função principal é agir como uma
interface melhorada entre as aplicações de tempo real e os protocolos das camadas já existentes.
De maneira geral, o RTP tenta, mas não garante o fornecimento de pacotes no tempo desejado
ou de acordo com uma qualidade de serviço especificada.

O cabeçalho do RTP fornece o número de seqüência e a informação de tempo através de uma


etiqueta de tempo (time-stamp) que é necessária para a remontagem do fluxo de tempo real, a
partir dos pacotes IP recebidos. O protocolo, no entanto, não assegura que os pacotes sejam
entregues em ordem, nem tão pouco oferece uma garantia de tempo de entrega dos pacotes – o
que o torna pouco confiável.

As aplicações geralmente usam o RTP junto com o UDP, porém pode ser usado com outros
protocolos de transporte. A tabela abaixo mostra como fica um pacote IP utilizando os
protocolos ideais para transmissão de voz.

Figura 1: Pacote IP Gerado por uma Aplicação de Voz G.711.

O campo payload inclui o esquema de codificação usado pelo media gateway para digitalizar a
voz. Isso auxilia o receptor a reconstruir a voz de acordo com o algoritmo específico de
codificação que foi utilizado pelo transmissor.

O protocolo RTCP é um protocolo que pode ser usado juntamente com o RTP, porém sua
utilização não é necessária para que o RTP funcione. Trata-se de um protocolo opcional cuja
principal função é transmitir periodicamente pacotes de controle para os participantes de uma
conversação com o objetivo de monitorar a qualidade de serviço e transportar informações úteis
de tais participantes. Trata-se de um protocolo bastante utilizado em aplicações de
videoconferência.

Embora as informações retornadas pelo RTCP não informem onde determinado problema está
ocorrendo (somente informa que está ocorrendo um problema), elas podem servir como
ferramenta para localizar o problema. Como as informações são geradas por diferentes gateways
em uma rede, isso ajuda a delimitar a área da rede em que o problema pode estar ocorrendo.

www.teleco.com.br 6
A quantidade de largura de banda utilizada pelo RTCP deve ser pequena para que não atrapalhe
o transporte dos dados, no caso a voz. Algumas especificações do IETF recomendam que a
fração de largura de banda que deve ser usada pelo RTCP deve ser 5% da largura utilizada pelo
RTP.

Para que a voz seja transmitida através de uma rede IP, utilizando o protocolo UDP da camada
de transporte, ela primeiramente deve ser codificada, ou seja, deve-se transformar o sinal
analógico da voz em um sinal digital, para que o mesmo possa fazer parte do campo de dados de
um pacote IP.

Tal codificação é feita utilizando-se equipamentos especiais, que além de codificar também irão
comprimir os dados. Tais dispositivos são chamados de codecs. Os mais modernos além de
comprimir ainda fazem supressão de silêncio e cancelamento de eco. Esses dispositivos serão
mostrados na próxima seção.

www.teleco.com.br 7
Desempenho VoIP: Codificação de Voz

O padrão G.711 do ITU-T, conhecido como PCM (Pulse Code Modulation), é um padrão de
codificação de voz baseado na forma de onda e para a digitalização da voz esse é o padrão mais
usado. Temos 8000 amostras /segundo e cada amostra codificada por uma seqüência de 8 bits,
i.e., cada amostra pode ter 1 entre 256 valores possíveis.

A freqüência de amostragem obedece ao teorema de Nyquist para que o sinal possa ser
restaurado com perfeição no processo de decodificação. A taxa de saída deste codificador,
desconsiderando qualquer “overhead”, é, portanto, 64 kbit/s.

Os codificadores evoluíram a partir do PCM com a finalidade de reduzir cada vez mais a taxa de
bits necessária para que se mantenha transmissões de voz com qualidade.

Conseguiu-se através do ADPCM (Adaptive Differential PCM), com quantização adaptativa e


algoritmos de estimação, reduzir à metade a taxa de bits. Com os vocoders, utilizados
principalmente em sistemas celulares, foram obtidos resultados melhores ainda chegando a
codificações a taxas em torno de 8kbit/s.

Os vocoders trabalham de forma diferente do PCM. Eles trabalham em cima dos mecanismos de
produção da voz ao invés de trabalhar sobre a forma de onda resultante. Os mecanismos são: a
fonte de excitação, i.e., a passagem do ar proveniente dos pulmões através das cordas vocais e a
cavidade oral.

Para estes mecanismos são estabelecidos modelos matemáticos representativos acompanhados


de seus respectivos parâmetros. O processo de codificação é dividido em análise e síntese.
Durante a análise, um segmento de voz é processado estimando-se os parâmetros do modelo. Na
síntese deve -se reproduzir a voz através desses parâmetros.

Com o número de parâmetros menor do que o número de amostras, fica muito mais fácil
transmitir esses parâmetros a uma taxa menor. Dois parâmetros caracterizam o desempenho de
um codificador: Um ligado a inteligibilidade e outro correspondente ao atraso no processo
codificação-decodificação.

No referente à inteligibilidade, aumentando a taxa de compressão, a qualidade da voz tende a


diminuir. Essa diminuição é compensada com o aumento da complexidade do algoritmo, mas,
por outro lado, o atraso do processo codificação-decodificação aumenta. Dois grandes fatores
compõem o retardo do processo codificação-decodificação: Retardo do Processamento e
Retardo de Quadro.

Um quadro é o número de parâmetros ligados a um segmento de voz em análise. Este quadro,


por ser armazenado junto com suas amostras antes da análise da voz, gera um retardo. Na
grande maioria o algoritmo analisa, também, informações contidas no quadro seguinte,
permitindo que o codificador utilize a correlação entre os quadros adjacentes e diminua a taxa
de transmissão.

O comprimento do quadro seguinte, que o codificador utiliza no processo, é conhecido como


atraso “lookahead”. O retardo de processamento é o tempo necessário para que o codificador
analise a voz e o respectivo tempo para o decodificador reconstruí-la.

www.teleco.com.br 8
O hardware utilizado no vocoder influencia diretamente na duração desse tempo. Essa
velocidade é medida em MIPS (milhões de instruções por segundo). O ITU-T padronizou vários
padrões de codificação (G.723.1, G.729, G.729A) para comunicação multimídia em geral e
aplicações de voz com baixa taxa de transmissão.

O padrão ITU-T G.729, ou CS-ACELP (Conjugate-Structure Algebraic-Code-Excited Linear


Prediction) é um algoritmo de codificação que gera informação à uma taxa de 8kbit/s com boa
qualidade de voz. O tamanho total do quadro (10 ms), o atraso “lookahead” (5 ms) e o tempo de
processamento do algoritmo diminuem na mesma proporção em que a tecnologia avança na área
de processadores.

Esses três parâmetros compõem o retardo total no processo de codificação.

O padrão G.723 opera a taxas de 6,3 e 5,3 kbit/s produzindo níveis de compressão digital da voz
de, respectivamente, 10:1 e 12:1. No processo de codificação este padrão possui um atraso total
de 37,5 ms. Em aplicações sensíveis ao atraso, esse padrão pode não ser o ideal.

Se a aplicação não for sensível a esse parâmetro, o G.723 será uma excelente alternativa ao
G.729 com menor complexidade e maior compressão, trazendo uma pequena degradação na
qualidade da voz. Outra técnica utilizada pelos vocoders para aumentar a eficiência no uso da
banda, além da compressão digital de voz, é a detecção ativa da voz e supressão de silêncio.

Nos períodos de silêncio apenas a informação do ruído ambiente é enviada no período de


atividade, a uma taxa inferior a taxa de codificação. O envio dessa informação cessa a partir do
momento em que não ocorrem variações significativas na mesma. Assim o decodificador
restaura essa informação a partir de amostras previamente recebidas.

A escolha certa entre os codificadores apresentados depende da boa relação entre economia de
recursos e inteligibilidade da comunicação. As tabelas a seguir demonstram os valores dos
parâmetros de desempenho dos codificadores padronizados, com relação ao retardo e a
inteligibilidade.

Taxa
Método de Compressão MOS
(kbit/s)
G.711 64 4,1
G.729 8 3,9
G.729A 8 3,7
G.723.1 5,3 e 6,3 3,7/3,9
Tabela 1: Codificadores e respectivos MOS.

Partindo dos dados demonstrados na tabela 1, podemos concluir que não há perda tão
significativa da qualidade do sinal de voz ao se empregar a compressão nos vocoders, i.e, para
aplicações que desejam transmitir voz sobre uma rede de comutação de pacotes, as técnicas de
compressão com vocoders são as mais indicadas.

www.teleco.com.br 9
Codec G.723.1 G.729/G.729A G.711
Taxa de bits (kbit/s) 5,3/6,3 8 64
Tamanho do quadro (ms) 30 10 0,125
Lookahead Delay (ms) 7.5 5 Inexistente
Comprimento do Quadro (bytes) 20/24 10 1
Tabela 2: Codificadores e características principais.

Na tabela 2, o comprimento do quadro corresponde ao número de bytes em um quadro


codificado.

www.teleco.com.br 10
Desempenho VoIP: Transmissão

Existem algumas questões que podem ser levadas em consideração para que haja uma certa
qualidade de serviço nas transmissões de voz. Tais questões estão diretamente relacionadas
abaixo.

Eco

O eco, que surge nas redes de telefonia tradicionais, é causado por um descasamento de
impedância nas híbridas utilizadas na conversão de 4 para 2 fios. Este descasamento faz com
que parte do sinal transmitido seja refletido de volta à origem.

Quando o RTT (“round trip time”) desse sinal supera 40 ms o usuário percebe o eco, já que
acima desse patamar ocorre degradação da comunicação.

Este fenômeno também pode ser observado quando é utilizado um conjunto alto-falante
microfone no receptor, possibilitando que o sinal seja captado pelo microfone e reenviado ao
transmissor.

Atraso fim-a-fim

A diferença de tempo entre o instante em que o transmissor envia o primeiro bit do pacote e o
instante que o receptor recebe este bit é definido como atraso fim-a-fim. Seu comportamento é
função da carga na rede.

Seu crescimento demasiado leva a uma perda de qualidade a nível de usuário, já que a demora
na escuta do sinal do assinante “1” pode levar o assinante “2” a iniciar sua fala, causando uma
sobreposição das falas. A sensação do usuário é a de estar usando um sistema “half-duplex”.

O limite máximo de atraso fim-a-fim é estabelecido em 300 ms pela recomendação G.114.


Sendo esse valor um limite máximo, isto quer dizer que acima desse valor a qualidade da
transmissão se torna inaceitável.

O limite de conforto é estabelecido em 150 ms. Atrasos entre esses dois valores definem uma
região de qualidade marginal, que pode ser aceitável para algumas aplicações de voz.

Componentes do atraso fim-a-fim

O atraso descrito anteriormente e nomeado de fim-a-fim, possui componentes de natureza fixa e


de natureza variável. Estas componentes serão descritas abaixo.

• Atraso de Propagação: Este atraso é diretamente relacionado com o tempo de


propagação do sinal no meio de transmissão, sendo este, função da velocidade da luz no
meio. O atraso de propagação depende do tipo de meio, da distancia percorrida e é
considerado atraso fixo;
• Atraso de Empacotamento: Tempo necessário para se gerar um número suficiente de
quadros de voz para preencher o payload do pacote IP. Para que esse atraso não atinja
valores muito altos, os pacotes enviados podem conter somente um quadro, porém, isto
reduz a eficiência (“overhead”/informação do sistema) do sistema;

www.teleco.com.br 11
• Atraso nos Nós da Rede: O atraso de enfileiramento é o principal atraso que os pacotes
sofrem dentro da rede. Este atraso é composto de duas parcelas: uma fixa, referente ao
tempo de transmissão do pacote, e outra variável, correspondente ao tempo de espera na
fila até que o pacote seja atendido. Este atraso é responsável pela aleatoriedade do
atraso total ao qual o pacote é exposto, assumindo valores inaceitáveis quando a rede
estiver congestionada;
• Atraso devido ao Dejitter Buffer: O jitter é introduzido no sistema através do
comportamento aleatório do tempo de enfileiramento dos pacotes nos roteadores. Uma
das soluções que podem ser usadas para compensar esta variação é a introdução de
buffers (“dejitter buffers”), com a função de armazenar os pacotes que chegam com
atraso variável e entregá-los ao receptor. Se a variação do atraso for muito alta, o atraso
adicional necessário para compensar a variação pode resultar em um atraso fim-a-fim
inaceitável. É definido, então, um valor máximo de atraso aceitável para o “dejitter
buffer”. Qualquer pacote que chegar após esse tempo será descartado.

Jitter

O jitter é uma variação de tempo entre chegadas de pacotes do endereço de origem. Caso
houvesse uma taxa de transmissão constante com intervalo de 20 ms ente cada transmissão de
um pacote e outro, tais pacotes deveriam chegar ao destino com intervalo de 20 ms.

Porém, como cada pacote pode trafegar na rede por diferentes rotas e diferentes meios, esse
tempo de chegada pode variar. Fato este que diminuiria a qualidade do serviço.

Perda de Pacotes

A perda de pacotes é outro fator crítico que implica diretamente na qualidade de serviço.
Existem vários fatores que podem levar a perda de um pacote IP. Podemos citar entre eles o
estouro do buffer de recepção nos roteadores e switches. Os pacotes que chegarem e
encontrarem o buffer cheio serão descartados.

Pacotes perdidos em aplicações que utilizam o protocolo UDP e RTP não podem ser
retransmitidos e mesmo que pudessem não seria nada interessante já que duas mensagens
enviadas em seqüência poderiam chegar em ordem inversa, o que não é tolerável em aplicações
de tempo-real. Como a perda de pacotes é inevitável, tolera-se um pequeno nível perda.

Caso a perda seja menor que 5% do total de pacotes a qualidade não é significativamente
afetada. No caso de aplicações em tempo-real, é melhor perder uma pequena porcentagem dos
pacotes do que atrasar a transmissão com buffers de grande capacidade.

Largura de Banda

A largura de banda para a transmissão de voz depende de vários fatores e pode ser calculada
facilmente de acordo com informações de amostragem, quantização da voz, algoritmos de
compressão e etc.

Além da transmissão de voz, as redes também são usadas com outras finalidades. Como a
transmissão de voz em uma conversação telefônica deve ocorrer em tempo real, tais dados
devem possuir uma prioridade em relação a outros dados com menor importância.

www.teleco.com.br 12
É claro que a decisão de se usar uma largura de banda maior ou menor deve ser tomada de
acordo com as necessidades e prioridades da rede. Vale ressaltar que uma banda muito estreita
para a transmissão de voz influencia negativamente na qualidade do serviço.

Segurança

Segurança é um parâmetro que sempre deve ser considerado quando tratamos de redes, seja em
aplicações de tempo-real ou não. Para se manter a integridade e a qualidade de serviço de uma
rede, o acesso deve ser permitido somente a pessoas autorizadas.

Os equipamentos de voz devem trabalhar com endereços IP não válidos para que sejam evitados
os ataques de DoS (Denial of Service, ou Ataque de Negação de Serviço) ocorre quando um
serviço é requisitado por vários usuários, simultaneamente, e o provedor do serviço não
consegue atender a demanda podendo até ficar “fora do ar”.

Como a rede utiliza o protocolo IP, existem métodos de se tornar as informações mais
confiáveis e menos suscetíveis a ataques através da utilização de criptografia, que já é suportada
nativamente pela versão 6 do IP (Ipv6).

Confiabilidade

Algumas providências deve ser tomadas em relação a confiabilidade da rede como um todo.
Uma das soluções mais apropriadas para aumentar a confiabilidade de um serviço seria a
utilização de equipamentos e links com redundância. Isso deixaria a rede menos suscetível a
falhas e aumentaria assim a qualidade de serviço.

Latência

É o tempo que um pacote leva para sair da origem e chegar ao seu destino. Em termos de
telefonia, latência é o tempo que a fala leva pra sair do locutor e chegar ao receptor.
Uma grande latência não significa que ocorrerá degradação da voz, o que pode ocorrer é uma
perda de sincronização.

Para que se obtenha uma boa qualidade em chamadas telefônicas a latência deve possuir um
valor abaixo do patamar de 150 ms. Para que isso ocorra devem ser tomadas algumas
providencias para que diminua o tempo de empacotamento, transmissão e transporte dos dados.

www.teleco.com.br 13
Desempenho VoIP: Qualidade de Voz em Redes IP

Nesta seção iremos demonstrar através de estudos técnicos já realizados, como os parâmetros
descritos nos capítulos anteriores afetam a qualidade da transmissão de voz em redes IP, com ou
sem DiffServ.

Esses estudos são feitos sobre os parâmetros de rede que possuem grande influência na
qualidade da fala percebida pelo usuário, que são o atraso fim-a-fim, a taxa de perdas e a
variação de atraso. Medindo estes parâmetros é possível verificar se a rede é ou não
recomendada para VoIP e qual é o nível de qualidade máxima que a rede pode oferecer à VoIP.

Estudos realizados anteriormente definem dois métodos básicos para medir o tráfego com QoS
em uma rede: Intrusivo e Não-Intrusivo.

O Intrusivo se refere à injeção controlada de pacotes na rede e subseqüentemente da coleta


destes pacotes. Já o Não-Intrusivo está relacionado com a medição do comportamento da rede
através da observação da taxa de chegada de pacotes em um sistema final.

Na técnica pesquisada por nós os testes foram realizados considerando o tráfego do tipo
intrusivo, através de uma ferramenta composta de dois agentes: gerador e coletor. O coletor
localizado na máquina de destino e o gerador na máquina de origem do tráfego.

A seguir apresentaremos os conceitos de como caracterizar o tráfego de teste, como medir a


qualidade e como aferir a qualidade considerada nesta técnica de avaliação.

Caracterizando o Tráfego de Teste

Para a definição do tráfego de teste é necessário definir a quantidade de tráfego gerado pelas
aplicações VoIP da empresa. Para tal, dois fatores devem ser determinados nesta fase: o codec
utilizado e o número de chamadas simultâneas.

Para este teste foi adotado como codec o G.711 sem supressão de silêncio. Essa escolha foi feita
por se tratar do pior caso em termos de taxa de bit gerada e, além disso, ele é muito usado para
reduzir retardos de codificação/decodificação. Neste exemplo cada fluxo de voz é caracterizado
por um tráfego do tipo CBR (Constant Bit Rate), em uma taxa de 80 kbits e cujo tamanho dos
pacotes é igual a 200 bytes.

Para determinar o tráfego de voz a ser gerado, além do codec, deve-se determinar o número de
chamadas simultâneas. Como o número de chamadas simultâneas se altera durante um período
normal em uma rede, novamente será utilizado o pior caso, ou seja, o número máximo de
chamadas simultâneas que podem ocorrer.

Este número será chamado de NCS (Número de Chamadas Simultâneas). Portanto, o tráfego de
voz sintetizado para esse teste corresponde a NCS x 80 kbit/s. Assim, é possível projetar a
largura de banda necessária para o tráfego VoIP, dependendo de quantas ligações simultâneas se
queira disponibilizar.

Note que aqui foi considerado um número de chamadas simultâneas constante durante todo o
teste por motivo de simplificação do gerador de testes e da análise. Em um ambiente real, o
número de chamadas e a duração das chamadas variam com o tempo.

www.teleco.com.br 14
Medindo a Qualidade

Para aferir a qualidade de voz obtida, é necessário definir os níveis de qualidade de voz e os
correspondentes valores limites dos parâmetros de desempenho de rede. Neste exemplo, as
seguintes métricas são consideradas para medir a qualidade de voz:

• Vazão: taxa de transmissão em bits por segundo (bit/s);


• Atraso por pacote: tempo que um pacote leva da origem até o destino;
• Variação no atraso: é a variação do atraso por pacote entre dois pacotes subjacentes.
Por meio dessa métrica, consegue-se analisar quão constante é o roteamento de pacotes
processado por salto (hop);
• Taxa de perda de pacotes: quantidade de pacotes que foram descartados por fluxo
numa transmissão de dados (Voz).

A tabela 3 define os níveis de qualidade de voz com base apenas nos parâmetros de desempenho
no nível de rede. Note que além destes, outros componentes do equipamento terminal
(computadores dos usuários finais) influenciam na qualidade de voz percebida. Este exemplo
considera apenas a influência da rede na qualidade final da voz.

Categorias Média das Variação Satisfação


Atraso
de perdas de do do
fim-a-fim
Qualidade pacotes atraso Usuário

Muito
Melhor < 150 ms 00% 0 ms
Satisfeito
Alto < 250 ms 03% 75 ms Satisfeito
Alguns Usuários
Médio < 350 ms 15% 125 ms
Insatisfeitos
Muitos Usuários
Baixo < 450 ms 25% 225 ms
Insatisfeitos
Tabela 3: Parâmetros de Referência de Rede.

Aferição da Qualidade

Existem duas formas para aferição dos parâmetros de desempenho citados. Um onde o tráfego é
unidirecional, isto é, os agentes geradores e coletores se posicionam em máquinas distintas
(origem e destino, respectivamente).

A segunda forma é quando o tráfego é gerado e coletado numa mesma máquina. Nesse caso é
preciso mais um agente, responsável por refletir os dados na máquina destino.

Note que a aferição da qualidade não pode ser feita predefinindo um dia da semana, duração e
um horário das chamadas, pois o estado da rede se altera no decorrer do período.

Portanto, é necessário realizar várias rodadas de teste durante todo o período de interesse de
realização (8 horas ou 24 horas).

www.teleco.com.br 15
O intervalo entre as rodadas deve ser de quinze, trinta ou sessenta minutos, dependendo da
granularidade desejada. Isso permite avaliar a situação da rede em vários períodos, já que a rede
não possui um comportamento uniforme durante todo o tempo.

www.teleco.com.br 16
Desempenho VoIP: Monitoração

As características do tráfego de voz gerado são dependentes principalmente do codificador


utilizado.

Existem várias opções de codificação de voz, sendo que as mais utilizadas são:

• G.711, que define um codec de alta velocidade para conversão do que gera um fluxo
constante a uma taxa de 64 kbit/s (quando não utilizada a supressão de silêncio). Sua
vantagem é sua velocidade, reduzindo o atraso fim a fim dos pacotes de voz, e sua
desvantagem é o maior uso de mais largura de banda;
• G.723.1 e G.729, que definem codecs de baixa velocidade, sendo que o G.723.1 tem
duas opções de taxa de bits, 5.3 e 6.4 kbit/s e o G.729 gera uma taxa de 8Kbit/s. Em
ambos, a taxa de bits é variável. Esta baixa taxa de bits gerada é a vantagem do uso
destes codecs. A desvantagem é o aumento no atraso fim-a-fim do fluxo de voz, devido
à complexidade computacional do algoritmo de compressão.

As aplicações de voz, usando o codec G.711 (que é o mais utilizado pelos fabricantes
atualmente), geram uma vazão em nível de aplicação a taxa de bits constante de 64 kbit/s. Até
alcançar o nível de rede, esta taxa sofrerá várias sobrecargas de protocolos.

Considerando as aplicações de voz que seguem a recomendação H.323, amostras de áudio, em


nível de aplicação, devem ser encapsuladas em pacotes RTP (Real Time Protocol), em seguida,
encapsuladas nos pacotes UDP e após, IP.

A sobrecarga total de protocolos depende do tamanho do payload (área que contém os dados de
voz) adotado no RTP. O valor usual do payload de voz em um pacote RTP é de 20 ms, ou seja,
cada pacote IP transporta 20 ms de voz que corresponde a 160 bytes. Com isto, a cada 20ms
será gerado um pacote IP com o tamanho de payload de 160 bytes.

Assim, considerando a sobrecarga dos protocolos RTP (12 bytes), UDP (8 bytes) e IP (20
bytes), o tamanho do pacote IP gerado por uma aplicação de voz G.711 será de 200 bytes, e a
taxa gerada, por fluxo, será de 80 kbit/s.

Parâmetro de Qualidade para uma Chamada de Voz

Como a maior parte das aplicações multimídia, a qualidade de voz obtida na VoIP é muito
sensível ao atraso fim-a-fim, variação de atraso de chegada de pacotes e perda de pacotes. O
critério mais amplamente aceito para qualidade de chamada de voz é o MOS (Mean Opinion
Score).

O E-Model é um modelo computacional que avalia os efeitos combinados de variações em


diversos parâmetros de transmissão, que afetam a qualidade conversacional na telefonia. O E-
Model resulta em um número chamado de fator R, derivado de atrasos e fatores de deterioração
causados pelos equipamentos. O fator R medido pode ser mapeado para um MOS estimado.

O fator R varia de 100 (excelente) até 0 (pobre) e, o MOS varia de 5 a 1. Um MOS estimado
pode ser diretamente calculado do fator R do E-Model, conforme demonstra a figura a seguir.

www.teleco.com.br 17
Nesta figura, valores do fator R do E-Model são mostrados à esquerda, com os valores
correspondentes ao MOS à direita. O nível de satisfação dos ouvintes é apresentado na coluna
do meio. É recomendado o uso do E-Model para avaliação da qualidade das chamadas de VoIP.

Figura 2: Medida de Qualidade de Chamada Telefônica.

As recomendações sobre atraso e perda para que uma rede possibilite uma boa qualidade da
chamada VoIP são: atraso fim a fim deve ser menor que 150ms; limite máximo de 50ms para a
variação de atraso; taxa de perda limitada a 3% (mas recomendável é ser inferior a 0,50%). O
não respeito destes limites gera degradações da qualidade de voz perceptíveis ao usuário.

Relação do E-Model com outros Métodos

Existem alguns produtos comerciais que implementam medidas de monitoração similares as


utilizadas pelo E-Model. Dois deles são: o Cisco Voice Dial Control MIB e o Telchemy’s
Monitoring Software. No entanto, as informações nestes produtos fazem referência ao E-Model
em sua descrição.

Como estas informações aparentam ter sido baseadas em descrições retiradas dos próprios
gateways de voz, e, nosso interesse é abordar a comparação de forma generalizada, vamos
enfatizar uma comparação que independa do local no qual é implementado o modelo de
monitoração.

Um tipo de método alternativo, razoavelmente utilizado, requer a injeção amostras de


“palavras” ao longo do caminho de transmissão da voz. Esse método é conhecido como
“Modelo Objetivo de Qualidade”.

Esse modelo compara a “palavra” inserida em uma ponta, com o resultado na saída na outra
extremidade, utilizando de fundamentos psico-acústicos para fornecer uma opinião sobre as
condições do canal de transmissão.

Porém, ainda é necessária a utilização do E-Model para monitorar as de perturbações bem como
o atraso.

As vantagens dos métodos objetivos são:

• Total transparência em relação aos equipamentos e regras existentes na rede;


• Previsão das condições de qualidade, baseando-se nos fundamentos psico-acústicos
junto com outros modelos de monitoração como o E-Model.

www.teleco.com.br 18
Voltado para a precisão, o E-Model foi criado para ser usado como uma ferramenta de
planejamento de redes, e não como uma ferramenta de manutenção da mesma. No entanto, ele
não pode prever condições que não tenham sido previamente medidas.

As desvantagens dos métodos objetivos são:

• Muito complexos;
• Em algumas condições eles não são muito precisos;
• Eles são intrusivos, enquanto o E-Model pode ser ou não intrusivo;
• Não revelam nada sobre a causa de problemas na qualidade.

Outro método é se basear na “Medida Direta de Nível de Pacotes”. O limiar é definido no ponto
crítico a partir de onde ocorre a degradação da qualidade de voz. A vantagem desse método é o
fato de ser de simples implementação. E sua desvantagem é se basear em um limiar arbitrário.

Composição do E-Model

A fórmula básica do E-Model é: R = Ro - Is - Id - Ie + A

Onde:

• Ro é a Relação Sinal-Ruído;
• Is são perturbações simultâneas na transmissão da voz;
• Id são perturbações após a transmissão da voz, Ie são as perturbações causadas pelos
equipamentos (ex: codec);
• A é o fator de expectativa (que vem da tentativa de medir a expectativa do chamador).

O termo Id é o valor da perturbação devido ao atraso e ao eco gerado após a transmissão da voz.

Ele é composto pela soma das perturbações de eco causadas pelo transmissor (Idte), pelo
receptor (Idle) e também pelos longos atrasos (Idd), ou seja:

Id = Idte + Idle + Idd

Dentro do E-Model, o parâmetro Idd só é calculado apenas para atrasos maiores que 100ms.
Isso significa que atrasos menores que 100ms não são perceptíveis pelo usuário.

Nesse caso esses efeitos são considerados como incorporados nas componentes Idte e Idle.

www.teleco.com.br 19
A fórmula do E-model requer três medidas diferentes:

Figura 3: Esquema indicativo das três medidas.

Onde:

• T é a média do atraso de “one -way”;


• Ta o atraso absoluto;
• Tr o atraso de “round-trip”.

Infelizmente, sobre a perspectiva de medição, não é possível medir todos os três utilizando
métodos simples de medição passiva, ou ativa.

No entanto, para aplicações práticas, são necessárias aproximações para esses parâmetros. A
seguir apresentamos uma aproximação para a estimativa do atraso em VoIP utilizando técnicas
passivas de medida.

www.teleco.com.br 20
Desempenho VoIP: Estimativa de Atraso

Tradicionalmente, em redes de comutação por circuito, medições passivas de atraso são


estimadas a partir da observação do eco refletido na extremidade final do circuito.

Isso não é possível em redes com VoIP, porém, ao invés disso são utilizados pacotes RTCP para
estimar o atraso de “roundtrip” entre os mecanismos de VoIP.

A figura a seguir ilustra como a estimativa do atraso de “roundtrip” se relaciona com uma
conexão de VoIP.

Figura 4: Relação entre atraso de “roundtrip” e a conexão IP.

Onde:

• Drtcp representa o atraso estimado a partir dos pacotes RTCP;


• De o atraso de codificação e empacotamento (pelo menos do mesmo tamanho do
pacote), Dj é o atraso introduzido pelo buffer de jitter e pelo decoder;
• Ds o atraso no acesso do lado de envio;
• Dr simboliza o atraso no acesso do lado de recebimento.

Estimativa de Ds e Dr

Atrasos em acesso não são conhecidos quando monitoramos uma rede de VoIP. A rede poderia
conectar diretamente um usuário, ou mesmo uma rede móvel.

O uso do E-model como ferramenta de medição para monitoração da qualidade de uma rede de
VoIP deveria ser independente das redes conectadas.

A métrica é projetada para indicar o quão boa é o desempenho da rede de VoIP. Assim, é
sugerido que o Ds e Dr sejam configuráveis pelo usuário, e/ou tenha como default o valor zero.

Estimativa de De

Os atrasos de codificação e empacotamento dependem de uma série de de fatores. São eles:


comprimento do quadro codificado (coded frame), “codec lookahead”, o número de frames no
pacote, e a eficiência do codificador. Eficiência é o tempo levado para codificar uma “palavra”,
para a qual existe um “upper bound” e um “lower bound”.

Para um codificador simples como o G.711, o atraso de codificação (coding delay) não é
significante, porém, para esquemas de codificação mais complexos, o atraso máximo de
codificação para o sistema ser capaz de operar em tempo real é o tamanho do frame, assumindo
que a codificação começa assim que o primeiro quadro é recebido.

www.teleco.com.br 21
A tabela abaixo apresenta uma lista de melhor e pior caso de atrasos de codificação para três dos
mais populares codecs de VoIP.

Codec Melhor caso (ms) Pior caso (ms)


G.711 Tamanho do pacote Tamanho do pacote + 125ms
G.729 Tamanho do pacote + 5 Tamanho do pacote + 5 + 10
G.723.1 Tamanho do pacote + 7,5 2 x Tamanho do pacote + 7,5 + 30
Tabela 4: Melhor e Pior caso de atrasos de codificação.

Em situações mais práticas é preferível que o atraso de codificação seja o mais próximo do
melhor caso, assim, escolhendo esse valor, somado a mais 20% do tamanho do frame, temos
uma estimativa bem razoável para o atraso de codificação.

O atraso entre o pacote sendo preparado para transmissão, e o mesmo “aparecendo” na linha é
considerado insignificante, ficando assim, fora dos nossos cálculos.

Estimativa de Drtcp

Pacotes RTCP podem ser usados para estimar o “round-trip transmission” que é o atraso entre
dois equipamentos de VoIP. Drtcp é o “round-trip delay” estimado dividido por 2. Devemos
ressaltar que se o IP da ponta não enviar ou não preencher corretamente os pacotes RTCP, não
será possível fazer uma estimativa ou ela poderá ser feita de forma incorreta.

Estimativa de Dj

Essa estimativa depende do jitter-buffer e do decodificador dos gateways de VoIP utilizados. A


maioria deles implementa um jitter-buffer dinâmico para suportar as variações das condições
dos jitters. É possível que esse valor seja configurável por usuário ou, baseado na medida do
“stream jitter” de chegada do RTP.

Uma possível equação para Dj é:

Dj = min (codec_frame_size + 0.9 * RTP_jitter , 300)

Essa fórmula é puramente especulativa e algumas alternativas podem ser consideradas. No


entanto, ela leva em conta o princípio básico de que um jitter-buffer dinâmico aumenta em
tamanho quando “enxerga” um aumento no jitter da rede.

Ela também impõe um limite ao tamanho do jitter-buffer, nesse caso de 300ms, o qual também
pode ser um parâmetro configurável por usuário. O “RTP_jitter” deve ser medido de acordo
com a RFC 1889.

www.teleco.com.br 22
Cálculo de Id

A seguir estão as aproximações para os atrasos especificados para o cálculo do E-Model,


mantendo, porém, uma solução razoável:

T = Drtcp + Dj + De + Dr
Tr = 2 * Drtcp + Dj + De
Ta = Drtcp + Dj + De + Dr + Ds

Cálculo do Fator R Padrão

A fórmula do fator R padrão é:

R = Ro – Is – Id – Ie + A

Não vamos considerar o “advantage factor” (A), logo, o valor escolhido para ele é zero. A
equação agora fica:

R = Ro – Is – Id – Ie

A partir da Recomendação [G.107 2003, Pág. 4] temos:

Ro = 15 – 1.5 * (SLR + No)

Onde SLR é a taxa de ruído de envio, e No é a adição de potência devido às diferentes fontes de
ruído. O valor default da SLR é +8 dB [G.107 2003, Pág. 8], enquanto o valor de No pode ser
calculado utilizando as expressões definidas na Recomendação [G.107 2003, Pág. 4], e os
demais valores default necessários também são definidos na Recomendação [G.107 2003, Pág.
8]. O resultado é: Ro = 94.77.

Is = Iolr + Ist + Iq

Onde Iolr representa o decréscimo de qualidade causado pelos valores muito pequenos de OLR
(soma das taxas de ruídos de envio e recebimento), Ist é a perturbação causada pelo “sidetone”
não-ótimo, e Iq é a perturbação devido a distorção na quantização. Os valores podem ser
calculados utilizando as expressões apresentadas na Recomendação [G.107 2003, Págs. 4 e 5], e
os demais valores default necessários na mesma [G.107 2003, Pág. 8]. O resultado é: Is = 1.43.

Id = Idte + Idle + Idd

Onde Idte é uma estimativa para a perturbação causada pelo eco resultante do transmissor, Idle
o eco resultante do receptor, e Idd a perturbação causada pelos longos atrasos absolutos, os
quais ocorrem mesmo com um perfeito cancelamento de eco.

Os valores podem ser calculados utilizando as expressões apresentadas na Recomendação


[G.107 2003, Págs. 5 e 6], e os demais valores default necessários na mesma [G.107 2003, Pág.
8]. O resultado é: Id = 0.14.

Ie = 0

www.teleco.com.br 23
Onde Ie representa o fator de perturbação causada pelo equipamento, e seu valor default,
encontra-se na Recomendação [G.107 2003, Pág. 8].

Com os valores default para todos os parâmetros, a fórmula fica:

R = 94.77 – 1.43 – 0.14 – 0


R = 93.2

Este valor é considerado de altíssima qualidade, pois como podemos observar, se aproxima
muito do valor ideal utópico de 100.

Vale comentar que, na revisão do ano 2000 da recomendação G.107, o valor de R, levando em
conta os valores default, era apenas um pouco diferente do atual (2003) igual a 94.2. No entanto,
na prática, essa diferença pode ser considerada insignificante.

www.teleco.com.br 24
Desempenho VoIP: Considerações Finais

Abordamos no presente tutorial a predominância do protocolo TCP/IP na maior parte das


estruturas de redes de pacotes existentes, se tornando necessário para um grande número de
aplicações. Vimos que a sensibilidade a atrasos é um fator determinante na associação de
aplicações de voz, com seus respectivos protocolos, no que diz respeito a transmissões de
tempo-real.

Exploramos a necessidade de se projetar protocolos específicos para aplicações de tempo-real


como o RSVP, o RTP e o RTCP. Protocolos, estes, que fazem a interação com os protocolos já
existentes e são interdependentes, por exemplo, o RTP só funciona se trabalhar juntamente com
o RTCP, obedecendo as especificações estabelecidas pela IETF.

Tratamos do desempenho dos diferentes padrões de codificação estabelecidos pela ITUT. O


caráter evolutivo desses padrões, i.e., evoluir com a finalidade de estar sempre reduzindo a taxa
de bits necessária para que a qualidade nas transmissões de aplicações de voz seja sempre a
melhor possível.

Mostramos a existência de limites de atraso, especificados nos padrões recomendados pela ITU-
T, que possam interferir negativa ou positivamente no fator sensibilidade das transmissões de
tempo-real. Foi discutido que a escolha certa entre os diferentes padrões de codificação
depende, exclusivamente, da boa relação entre a economia de recursos e a inteligibilidade da
comunicação.

Apresentamos todos os parâmetros que interferem na qualidade de serviço das transmissões de


voz no capítulo 4 e logo em seguida um exemplo comentado de como e onde esses parâmetros
entram para contribuir ou não para uma transmissão de qualidade aceitável.

Finalmente, demonstramos o modelo de monitoração de desempenho de uma rede VoIP


conhecido como E-Model (ITU-T Rec.G.107). Um modelo computacional, que utiliza
parâmetros obtidos das características físicas e tecnológicas de equipamentos que compõe a
rede, para avaliar o desempenho das transmissões de Voz sobre IP.

Referências

Recomendação ITU-T G.107


Especificações IETF

www.teleco.com.br 25
Desempenho VoIP: Teste seu Entendimento

1. Com que finalidade o E-Model foi desenvolvido?

Como uma ferramenta de planejamento de redes.

Como uma ferramenta de manutenção de redes.

Como uma ferramenta de especificação de redes.

Como uma ferramenta de monitoração de redes.

2. Os vocoders trabalham sobre:

Mecanismos de produção da voz.

Forma de onda resultante.

Modelos matemáticos.

Voz pré-processada.

3. Os parâmetros que caracterizam o desempenho de um codificador são:

Ligados a forma de onda.

Ligados a um segmento de voz em análise.

Ligados a inteligibilidade e ao atraso no processo codificação-decodificação.

Ligados aos parâmetros físicos da rede.

www.teleco.com.br 26