Você está na página 1de 5

Caracterização de tráfego VoIP

Carlos Marcelo Pedroso Jefferson P. Caldeira Keiko Fonseca


Departamento de Computação Departamento de Computação Pós Graduação em Engenharia
PUCPR PUCPR Elétrica e Informática Industrial UTFPR
Curitiba, Paraná, Brasil Curitiba, Paraná, Brasil Curitiba, Paraná, Brasil
Email: c.pedroso@pucpr.br Email: caldeira@gmail.com Email: keiko@utfpr.edu.br

Abstract— This paper presents the traffic characterization em estudo. Finalmente, as conclusões e trabalhos futuros são
of a VoIP system based on data collected from a brazilian apresentados na seção VI.
carrier with more than 10.000 active users. The resulting model
updates existing models and can be applied to capacity planning II. S ISTEMAS VOI P: CONCEITOS B ÁSICOS
and scientific research to workload generation for VoIP system
simulation. Um sistema Voip é caracterizado pelo transporte da voz
através de uma infra-estrutura baseada em IP (rede IP).
I. I NTRODUÇ ÃO Usualmente se refere à conversão da voz tradicional (sinal
analógico) em sinais digitais a serem transportados em pacotes
A utilização de sistemas transmitindo Voz sobre IP (Voice IP. Esta conversão conhecida como codificação da voz pode ser
over IP, VoIP) tende a alterar o perfil de uso das redes de realizada diretamente no próprio aparelho telefônico (telefonia
telecomunicações. Atualmente o uso de sistemas VoIP está em IP), no PABX ou em gateways especı́ficos antes de serem
seu estado inicial - no entanto, as operadoras que oferecem encaminhados para roteadores IP.
serviços baseados em VoIP têm experimentado um grande Vários algoritmos têm sido padronizados para codificação
crescimento de demanda por estes serviços. de voz com taxas de bit variando desde 5,3kb/s to 64kb/s
Um dos problemas a serem enfrentados na implementação [2] [3]. Um codec (de Coder-Decoder) é um dispositivo ou
de novas tecnologias é o correto dimensionamento do sistema. programa capaz de realizar a codificação e a decodificação de
Já é conhecido que o tráfego gerado por sistemas VoIP não voz em fluxo de dados. Seus componentes usuais são amos-
possui as mesmas caracterı́sticas apresentadas pelo sistema tragem da voz, conversão analógica para digital, codificação,
de telefonia convencional. Modelos modernos [1] indicam encapsulamento, transmissão, decodificação, armazenamento e
que o tráfego de sistemas VoIP pode ser modelado através ajuste do atraso (play out). Exemplos de codecs são o G.711,
de um modelo ON-OFF onde os perı́odos ON e OFF são G.729 e G.723 [4]. Os dispositivos que operam com Voz
caracterizados por distribuições de cauda pesada. sobre IP devem suportar no mı́nimo o codec ITU G.711, que
Este trabalho apresenta a caracterização de tráfego VoIP é a especificação da técnica PCM (Pulse Code Modulation).
amostrado em uma grande operadora de telecomunicações No entanto, os dispositivos podem implementar codecs mais
no Brasil contando com aproximadamente 10.000 usuários complexos, com possı́vel impacto no perfil de tráfego gerado.
ativos. Esta caracterização do tráfego se fez a nı́vel de pacotes, Os codecs que apresentam melhores taxas de compressão
utilizando aproximadamente 90 segundos de tráfego. tendem a utilizar pacotes maiores transmitidos a intervalos de
O estudo apresentado analisa os dados obtidos do sistema tempo maiores se comparados ao G.711. A escolha do codec
real, identifica os principais codecs em uso e realiza a mo- é do cliente.
delagem do tráfego no nı́vel de pacotes. É importante citar Um protocolo amplamente utilizado para troca de
que a maioria dos artigos encontrados baseia-se em análise sinalização de telefonia é o SIP (Session Initiation Protocol)
de dados de sistemas VoIP operando em Universidades ou em [5]. Ele estabelece, modifica e finaliza chamadas telefônicas
empresas - diferentemente do nosso universo de usuários, o através do protocolo IP e atuando na camada de aplicação.
que torna os resultados aqui apresentados ainda mais impor- Criado originalmente por Henning Shulzrinne (Columbia Uni-
tantes. Não é de conhecimento dos autores nenhum trabalho versity) e Mark Handlery (UCL) em 1996, é um padrão da
anterior caracterizando um sistema VoIP em uso no Brasil. Internet Engineering Task Force (IETF).
As caracterı́sticas aqui reveladas configuram-se como dados O SIP foi projetado para interagir com outros protocolos da
importantes para análise de desempenho e pesquisas cientı́ficas Internet, funcionando como um mecanismo de estabelecimento
sobre sistemas VoIP. de sessão, iniciando, modificando e terminando a sessão
Este artigo está estruturado como a seguir. A seção II independente do tipo de mı́dia ou aplicação que será usada
introduz o conceitos básicos sobre sistemas VoIP. A seção III na chamada; uma chamada pode utilizar diferentes tipos de
mostra um resumo com trabalhos anteriores sobre o tema. dados, incluindo áudio e vı́deo. O protocolo caracteriza-se por
A IV descreve o conjunto de dados em estudo, e a seção V ser simples, flexı́vel, estável, de não depender do protocolo
apresenta a modelagem de diversas métricas de desempenho de transporte e de ser baseado em texto. Uma vez iniciada
TABELA I
a conferência, a voz será codificada/decodificada utilizando
S UM ÁRIO COLETA DE DADOS
um algoritmo (codec) e transmitida através do protocolo RTP
(Real Time Protocol[6]). Tempo total Quantidade de pacotes Tamanho do arquivo
92,8 segundos 2.420.654 315.073.656 bytes
III. M ODELAGEM DE TR ÁFEGO VO IP
A voz humana pode ser modelada como uma seqüência de
perı́odos de atividade e silêncio, conhecida como padrão ON- • Intervalo entre pacotes dos fluxos RTP de voz;
OFF, primeiramente descrito por [7] e ainda utilizada para • Tamanho do pacote dos fluxos RTP de voz;
modelagem de tráfego na rede de telefonia fixa. Neste tipo de • Codec utilizado pelos fluxos RTP.
rede, usualmente, os perı́odos ON e OFF são modelados por O item V-A a seguir introduz conceitos fundamentais, que
distribuições de decaimento exponencial. Em redes de pacotes, serão utilizados na avaliação das métricas citadas acima.
a modelagem de tráfego usualmente utiliza distribuições de
probabilidade para prever a chegada de pacotes e o tamanho A. Conceitos Fundamentais
dos mesmos. Para entendimento dos resultados da análise dos dados
Trabalhos recentes [8] [9] relatam uma nova alternativa obtidos fazem se necessários os conceitos relacionados a
para caracterização do tráfego gerado pelos codecs G.729 Processo com dependência de longa duração ou Long Range
e G.723 não baseada no modelo ON-OFF. Outros trabalhos Dependence (LRD).
realizados sobre redes de serviço diferenciado também mos- Um Processo com dependência de longa duração ou Long
tram que a caracterização de tráfego diverge daquela utilizada Range Dependence (LRD) é o fenômeno que ocorre quando
para rede de telefonia convencional; em [10] é reportado o observações de um evento são significantemente correlaciona-
comportamento de cauda pesada para os perı́odos ON/OFF e das com observações muito distantes no tempo. Este fenômeno
em [11] é reportado a aderência à distribuição de Weibull, é de particular interesse na modelagem de tráfego, uma vez
que possui decaimento semi-exponencial. [12] considera o que pesquisas comprovaram que o tráfego em redes modernas
uso da distribuição de Pareto e modelos multi-fractais para de comunicação freqüentemente apresenta LRD [17].
reproduzir e caracterizar o tráfego VoIP. Investigações em Em um processo LRD a função de auto-correlação ρk (ou
[13] de uma rede GPRS (General Packet Radio) utilizando ACF, Auto-Correlation Function decai para zero lentamente
G.729 sugere que o perı́odo OFF pode ser modelado por em função do deslocamento (ou Lag) k. Seja Xt , t = 1, 2, . . .,
uma distribuição de Weibull, enquanto [14] argumenta que um processo estacionário de segunda ordem, se existe uma
a distribuição Lognormal pode pode ser utilizada para ambos constante c tal que γk ∼ c/k α , 0 < α < 1, então o processo
os perı́odos ON e OFF. [15] analisa o tráfego VoIP no nı́vel possui LRD.
de pacotes, utilizando os codecs G.723 e G729 e reporta a O termo auto-similar descreve a geometria de objetos em
distribuição de Pareto para os perı́odos ON-OFF e também que uma pequena parte quando expandida se parece com o
para o intervalo entre pacotes. todo [18]. Muitos objetos encontrados na natureza apresentam
IV. C ONJUNTO DE DADOS UTILIZADO caracterı́sticas auto-similares (ou fractais aproximados). Pode-
se citar como exemplo a estrutura geométrica de nuvens,
O conjunto de dados em estudo refere-se ao tráfego coletado montanhas e árvores.
em uma grande operadora de telecomunicações brasileira. A Um processo será auto-similar do ponto de vista estocástico
operadora fornece um serviço de Voz sobre IP utilizando se ele mantém caracterı́sticas estocásticas sobre uma certa
o protocolo SIP. A rede analisada possuı́a aproximadamente faixa de escalas, de modo a satisfazer a relação dada pela
10.000 usuários na época da coleta do tráfego. Equação 1. Processos auto-similares apresentam LRD [1].
Em termos gerais, a rede de acesso é formada de enlaces
ADSL (Assymmetric Digital Subscriber Line). O tráfego VoIP
Xmt ∼
=d mH Xt , m > 0 (1)
gerado pelos usuários é direcionado para uma rede Ethernet
não congestionada. Os usuários enviam solicitações ao Call Hurst foi um famoso hidrólogo interessado no Egito e no
Server conectado à rede Ethernet. O tráfego da porta do switch rio Nilo que mostrou em 1951 que o nı́vel do rio Nilo é uma
Ethernet onde está conectado o Call Server foi espelhado em seqüência LRD. Por razões históricas, o parâmetro de Hurst
uma porta onde foi configurado o analisador de protocolos H = 1 − α/2 é utilizado para representar a auto-similaridade.
Open Source Wireshark [16] e os dados coletados. Um processo com memória longa apresenta auto-similaridade
Os dados foram coletados em 4 de maio de 2006, durante assintótica de segunda ordem.
um perı́odo de 92.8 segundos no momento de maior tráfego. Processo com memória de curta duração ou Short Range
A Tabela I mostra um sumário dos dados coletados. Dependence (SRD) indica o fenômeno onde a observação
corrente não é correlacionada com observações muito antigas.
V. M ODELAGEM DO TR ÁFEGO
Para um processo SRD, a função de auto-correlação decai
rapidamente para zero.
A partir da amostra coletada, foram analisados: O valor H = 12 é o limite entre a LRD e a SRD. Processos
• Protocolos utilizados; com 12 < H < 1 são LRD, enquanto processos com 0 < H <
TABELA II

0.0020
Intervalo entre Pacotes (segundos)
P ROTOCOLOS ENCONTRADOS

Protocolo Quantidade de pacotes %


RTP 2.221.441 91,77

0.0010
SIP 39.998 1,65
Outros 159.215 6,57

TABELA III

0.0000
S UM ÁRIO DE ESTAT ÍSTICAS SOBRE O INTERVALO ENTRE PACOTES RTP
( SEGUNDOS )
0 2000 4000 6000 8000 10000
Min. 1o Q Mediana Média 3o Q. Max. Var. Amostra
0.00 8.0e-06 2.30e-05 4.187e-05 5.0e-05 6.649e-03 4.768e-09
Fig. 2. Série temporal representando os intervalos entre pacotes RTP

1 TABELA IV
2 são SRD. O efeito da LRD será maior quando H estiver
PAR ÂMETRO DE H URST PARA OS INTERVALOS ENTRE PACOTES
próximo a 1.

B. Protocolos Utilizados Tamanho da Parâmetro de Intervalo de


amostra Hurst confiança para 95%
O maior número de pacotes amostrados carregava o proto- 1.000.000 0.5766 [0.575, 0.578]
colo RTP, transportando voz codificada (91,77% dos pacotes). 100.000 0.5807 [0.576, 0.585]
Pacotes carregando sinalização SIP corresponderam a 1,65% 10.000 0.5935 [0.579, 0.609]
1.000 0.6207 [0.564, 0.678]
do total e protocolos diversos (principalmente ARP, ICMP,
VRRP e HTCP) foram identificados no restante dos pacotes.
A Tabela II sumariza o percentual de carga (quantidade de
pacotes) oferecido pelos principais protocolos encontrados. em diferentes componentes de freqüência e permite o estudo
de cada componente com uma resolução ajustada à sua escala.
C. Intervalo entre pacotes dos fluxos RTP O método apresenta vantagens sobre os métodos tradicionais
Da análise dos protocolos verificou-se que a maior parte dos de Fourier para a análise de situações onde o sinal contém
pacotes observados pertence à transmissão de voz codificada descontinuidades e picos. Wavelets foram desenvolvidas in-
utilizando protocolo RTP. Assim sendo o estudo concentrou- dependentemente nos campos da matemática, fı́sica quântica,
se em analisar os dados para modelagem do tráfego RTP . A engenharia elétrica e geologia sı́smica [20].
Tabela III mostra um sumário com estatı́sticas básicas sobre Os testes sobre os dados revelaram que a amostra apre-
os intervalos entre chegada dos pacotes RTP da amostra. senta auto-similaridade leve, com o parâmetro de Hurst de
A Figura 1 mostra a função de auto correlação para diversos aproximadamente 0,58. Os resultados para diversos nı́veis de
nı́veis de sub-amostragem. A Figura 1(a) a (d) mostra, respec- sub-amostragem são mostrados na Tabela IV.
tivamente, a função de autocorrelação para os nı́veis de sub-
D. Tamanho dos pacotes dos fluxos RTP de voz
amostragem de 1.000.0000 pontos, 100.000 pontos, 10.000
pontos e 1.000 pontos. O lento decaimento da função de auto- A análise do tamanho dos pacotes dos fluxos RTP de voz
correlação (ACF, auto-correlation function) é um indicativo mostra que o tamanho possui um comportamento praticamente
da auto-similaridade da série. O alto nı́vel de auto-correlação discreto: foram detectados pacotes de tamanho igual a 64, 74,
observado impede o uso de distribuições de probabilidade, 84, 104 e 214 bytes. O histograma apresentado na Figura 3
como Weibull ou Pareto, para a modelagem desta métrica de mostra a freqüência observada em cada um dos tamanhos
desempenho. citados. A Tabela V mostra um sumário de estatı́sticas básicas
Para que os valores da função de auto-correlação fossem sobre o tamanho dos pacotes.
considerados não correlacionados para um nı́vel de confiança A análise da função de auto-correlação do tamanho de
de 95% os valores correspondentes para uma determinada de- pacotes sucessivos (definir), apresentada na Figura 4, mostra
fasagem deveriam estar abaixo da linha pontilhada. Percebe-se um decaimento lento, indicativo da auto-similaridade da série.
que mesmo a sub-amostragem de 1.000 pontos apresenta um A Tabela VI mostra o cálculo do parâmetro de Hurst
alto grau de auto-correlação. A observação da série temporal, para diversos nı́veis de sub-amostragem dos dados em estudo
apresentada na Figura 2 indica que a série é estacionária (séries
não estacionárias apresentam lento decaimento da função de TABELA V
auto-correlação). S UM ÁRIO DE ESTAT ÍSTICAS SOBRE O TAMANHO DOS PACOTES RTP
A estimação do parâmetro de Hurst do tráfego agregado se ( BYTES )
fez através do método da transformada Wavelet utilizando-se
as ferramentas disponibilizadas por Roughan et al. em [19]. Min. 1o Q Mediana Média 3o Q. Max. Var.
Wavelets são funções matemáticas que seccionam os dados 60.0 74.0 74.0 107.6 104.0 214.0 3364.72
(a) (b) (c) (d)

1.0

1.0
1.0

1.0
0.8

0.8

0.8
0.8

0.6

0.6
0.6
0.6
ACF

ACF

ACF

ACF
0.4

0.4
0.4
0.4

0.2

0.2
0.2
0.2

0.0

0.0
0.0
0.0

0 30 60 0 30 0 20 40 0 15 30

Lag Lag Lag Lag

Fig. 1. Função de auto correlação

TABELA VI
PAR ÂMETRO DE H URST PARA O TAMANHO DOS PACOTES
1000000

Tamanho da Parâmetro de Intervalo de


Frequência

amostra Hurst confiança para 95%


1.000.000 0.5661 [0.565, 0.568]
100.000 0.5777 [0.573, 0.582]
400000

10.000 0.5922 [0.577, 0.607]


1.000 0.5906 [0.533, 0.648]
0

100 150 200 TABELA VII


C ODECS IDENTIFICADOS
Tamanho do pacote RTP

Fig. 3. Histograma do tamanho do pacote dos fluxos RTP Codec Número de pacotes %
G.729 1.563.402 70.37%
G.711 500.423 22.52%
iLBC 148.262 6.67%
Outros 7.504 0.33%
1.0
0.8
0.6

através do método da transformada de Wavelet. O resultado


ACF

indica que a série apresenta caracterı́sticas auto-similares, com


0.4

H ' 0.56.
0.2

E. Codec utilizado pelos fluxos RTP


0.0

A Tabela VII mostra os principais codecs identificados no


0 10 20 30 40 50 60 fluxo de dados amostrado. O codec mais utilizado foi o G.729,
seguido pelo G.711.
Lag
VI. C ONCLUS ÕES E TRABALHOS FUTUROS
Fig. 4. Função de auto-correlação da série representada pelos tamanhos de
pacotes sucessivos Este trabalho realizou a caracterização de tráfego VoIP de
uma grande operadora de telecomunicações. O conjunto de
dados disponibilizado foi correspondente a aproximadamente [11] Chen-Nee Chuah and R. H. Katz. Characterizing packet audio streams
90 segundos de tráfego, capturado diretamente no call server from internet multimedia applications. In IEEE International Conference
on Communications (ICC 2002), volume 2, pages 1199–1203, Apr-May
da operadora. 2002.
A principal contribuição deste artigo é a caracterização [12] X.Liu and J.S.Baras. Aggregation of heavy-tailed on-off flows is
dos fluxos RTP, de fundamental importância para o estudo multifractal. In Technical Report CSHCN TR 2002-5 ISR TR2002, 2003.
[13] B.Bellalta, M.Oliver, and D.Rincn. Capacity and traffic analysis of
de sistemas VOIP. Os resultados mostram que os intervalos voip services over gprs mobile networks. In report TIC2001-0956-C04.
entre pacotes dos fluxos RTP podem ser caracterizados por Technical University of Catalonia, University Pompeu Fabra, Spain.,
um modelo auto similar. O tamanho dos pacotes observados 2001.
[14] E.Casilari, H.Montes, and F.Sandoval. Modelling of voice traffic over
apresentam uma caracterı́stica bastante particular em termos ip networks. In Proc. of Communication Systems, Networks and Digital
dos valores discretos de tamanho observados, possivelmente Signal Processsing (CSNDSP), 2002.
devido aos codecs utilizados. O tamanho dos pacotes também [15] T.D.Dang, B.Sonkoly, and S.Molnr. Fractal analysis and modeling of
voip traffic. In Report to Ministry of Education IKTA-0092/2002, 2003.
possuem uma estrutura auto-similar. [16] Angela Orebaugh, Gilbert Ramirez, Josh Burke, and Larry Pesce.
Observou-se também que o codec mais utilizado foi o Wireshark & Ethereal Network Protocol Analyzer Toolkit (Jay Beale’s
G.729, seguido pelo G.711. Esta caracterı́stica está relacionada Open Source Security). Syngress Publishing, 2006.
[17] W.E. Leland, M.S. Qaqqu, W. Willinguer, and D.V. Wilson. On the
às capacidades dos aplicativos de usuários. O suporte ao self-similar nature of Ethernet traffic (extended version). IEEE/ACM
G.711 é obrigatório em dispositivos VoIP e a utilização de Transactions on Networking, 2(1):1–15, February 1994.
outros codecs implica maior compactação do sinal de voz e [18] D. Kaplan and L. Glass. Understanding non Linear Dynamics. Springer,
New York, 1st edition, 1998.
conseqüente alteração nas caracterı́sticas de tráfego geradas. [19] Matthew Roughan, Darryl Veitch, and Patrice Abry. On-line estimation
Os resultados aqui apresentados são de grande valor para o of the parameters of long-range dependence. In Proceedings Globecom
estudo de desempenho das redes que operam sistema VoIP, ’98, volume 6, pages 3716–3721, Sydney, 1998.
[20] Amara Graps. An introduction to Wavelets. IEEE Comput. Sci. Eng.,
permitindo o uso de ferramentas analı́ticas e de simulação 2(2):50–61, 1995.
apropriadas para realizar o dimensionamento e análises em
redes existentes ou em pesquisas cientı́ficas. Com os dados
aqui apresentados é possı́vel alimentar geradores de tráfego
sintético com o perfil encontrado de fato em redes reais.
A seqüência deste trabalho está sendo executada com a
análise de perı́odos maiores de tráfego, de modo a confirmar
a análise aqui apresentada e incluir a caracterização do com-
portamento da sessão: tempo de duração da conversação e
intervalo entre chamadas.

VII. AGRADECIMENTOS
Os autores agradecem a GVT pela disponibilização dos
dados utilizados no estudo realizado.

R EFER ÊNCIAS
[1] W. Willinger and K. Park. Self-similar network traffic and performance
evaluation. John Wiley & Sons, New York, 1st edition, 2000.
[2] A.Tyagi, H. De Meer, and J.K.Muppala. VoIP support on differentiated
services using expedited forwarding. In ICON 2000. IEEE International
Conference on Networks 2000, pages 574–580, February.
[3] R.V.Cox. Three new speech coders from the itu cover a range of
applications. Communications Magazine, IEEE, 35(9):40–47, September
1997.
[4] ITU-T. Recommendation G.711. pulse code modulation (PCM) of voice
frequencies, 1988.
[5] J. Rosenberg, H. Schulzrinne, G. Camarillo, A. Johnston, J. Peterson,
R. Sparks, M. Handley, and E. Schooler. Sip: Session initiation protocol,
2002.
[6] H. Schulzrinne, S. Casner, R. Frederick, and V. Jacobson. STD 64:
RTP: A transport protocol for real-time applications, July 2003. See
also RFC3550. Obsoletes RFC1889.
[7] P.Brady. A technique for investigating on/off patterns of speech. Bell
Labs Tech Journal., January 1965.
[8] A.Estepa, R.Estepa, and J.Vozmediano. Packetization and silence
influence on voip traffic profile. In Lecture Notes on Computer Science,
Multimedia Interactive Protocols and Systems MIPS 2003, 2003.
[9] A.Estepa, R.Estepa, and J.Vozmediano. A new approach for voip traffic
characterization. IEEE Communications Letters, 8(10), October 2004.
[10] W.Jiang and H.Schulzrinne. Analysis of on-off patterns in voip and
their effect on voice traffic aggregation. In Proceedings of 9th IEEE
International Conference on Computer Communication Networks, 2000.

Você também pode gostar