01 - Redes Multimídia

TP - 121
REDES MULTIMÍDIA
Prof. MSc. Guilherme Pedro Aquino
INATEL – Instituto Nacional de Telecomunicações

Av. João de Camargo, 510
Santa Rita do Sapucai - MG
Tel: (35) 3471-9330
1
Avaliação
• O aluno deverá fazer uma resenha crítica sobre algum assunto pertinente às
redes multimídias. Esta resenha deverá ser feita com base em dois artigos
acadêmicos relacionados ao mesmo tema.
• Um exemplo de resenha crítica está na pasta compartilhada no DropBox.
• Escala de atribuições de conceitos.

• 85 – 100 (A) 70 – 84 (B) 50 – 69 (C) 0 – 49 (D)
• Assuntos para resenha crítica.

Voz e vídeo sobre IP (cenários atuais).
Redes NGN e/ou IMS (aplicações).
Protocolos multimídias.
QoS de redes para aplicações multimídias. 2
Programa
• Capítulo 1: Introdução aos Sistemas Multimídia.
• Capítulo 2: Voz sobre IP.
• Capítulo 3: Arquiteturas de redes multimídia.
3
Demanda por comunicação multimídia
• Estamos testemunhando o desdobramento mundial de aplicações de vídeo e
áudio na Internet. Milhares de sites disponibilizam o envio de informações
multimídia com conteúdo de áudio e vídeo.
Estamos testemunhando o desdobramento mundial de aplicações de vídeo e

áudio na Internet. Milhares de sites disponibilizam o envio de informações
multimídia com conteúdo de áudio e vídeo. Pode ser citado o Youtube, onde
usuários podem assistir a filmes armazenados em um servidor. Milhões de
usuários usam o Skype para necessidades relacionadas à telefonia e a vídeo-
conferência. Além disso, alguns canais de televisão estão transmitindo seus
programas através da Internet, possibilitando que pessoas possam assistir estes
canais de qualquer parte do mundo.
4
Definições
• O que é mídia?
– Mídia é um vocábulo latino que em português significa “meios”.
Podemos distinguir os tipos de mídia pela sua origem:
• Mídia dinâmica (vídeo, áudio, animação).
• Mídia estática (texto, gráfico, fotografia).
• O que é multimídia?
– Segundo a Enciclopédia Larousse, multimídia é a “forma de
comunicação com utilização de múltiplos meios: sons, imagens, textos,
vídeos, animações.”.
Mídia é um termo utilizado em comunicação e pode apresentar vários

significados:
Os meios de comunicação.
Os veículos de comunicação.
Mídia de armazenamento (fitas magnéticas, disquetes, discos
ópticos).
Hoje, a multimídia está presente nos CDs, TVs interativas, vídeo-games, DVDs,
aparelhos celulares, etc., mas, de fato, a web é o maior meio multimídia
conhecido porque possibilita que seu usuário crie, manipule, armazene e
pesquise conteúdos.
5
Definições
• As exigências de funcionamento das aplicações multimídia são diferentes

das aplicações elásticas (e-mail, navegação na web e download).
• Aplicações elásticas
– Atrasos longos são incômodos, mas não prejudiciais.
– A completude e a integridade dos dados transferidos são de suma
importância.
• Aplicações multimídia
– As aplicações multimídia são mais sensíveis a atrasos fim-a-fim e a
variações desses atrasos.
– Podem tolerar casuais perdas de informações.
No caso de aplicação de voz, atrasos menores que 150ms não são percebidos
pelo ouvido humano, enquanto que atrasos maiores que 400ms podem resultar
em uma conversa frustrante ou completamente ininteligível.
6
Tipos de fluxo de mídia
• As aplicações multimídia podem ser classificadas em três grupos distintos:
– Áudio e vídeo de fluxo contínuo armazenado (YouTube).
– Áudio e vídeo de fluxo contínuo ao vivo (TV ou Rádio via IP).
– Áudio e vídeo interativos em tempo real (VoIP).
7
Fluxo contínuo e armazenado
• Áudio e vídeo de fluxo contínuo e armazenado.
– Mídia armazenada: O conteúdo multimídia foi pré-gravado e está

armazenado em um servidor.
– Fluxo contínuo (streaming): Enquanto o usuário reproduz o conteúdo, o

mesmo é recebido do servidor.
– Reprodução contínua: Os dados devem ser recebidos do servidor a

tempo de ser reproduzidos no cliente. Caso isso não aconteça, o usuário
irá experimentar um atraso de buffer.
8
Fluxo de mídia ao vivo e em tempo real
• Áudio e vídeo de fluxo contínuo ao vivo.
– Esta aplicação é semelhante à transmissão tradicional de sinais de rádio

e televisão, porém a transmissão é feita via Internet. Neste tipo de
aplicação o conteúdo é transmitido ao vivo.
• Áudio e vídeo interativos em tempo real.
– Essa classe de aplicação permite que pessoas usem áudio/vídeo para se

comunicar entre si em tempo real. Áudio interativo é freqüentemente
denominado de Telefone via Internet.
9
• REDES DE TRANSMISSÃO DE DADOS.
– REDES DE COMUTAÇÃO DE CIRCUITOS.

– REDES DE COMUTAÇÃO DE PACOTES.
10
Comutação
• As redes de telecomunicações podem ser classificadas quanto ao tipo de

comutação.
– Comutação de circuitos – Redes de telefonia convencional.
– Comutação de pacote – Redes de computadores.
11
As redes de telecomunicações podem ser classificadas sob diversos aspectos.

Um aspecto interessante para classificação de redes é quanto ao tipo de
comutação. Será explorado neste material, dois tipos de comutação: (i)
comutação de circuitos e (ii) comutação de pacotes. Um exemplo de rede que
emprega a comutação de circuitos é a rede de telefonia convencional. A
comutação de pacotes é empregada em redes de computadores.
• Redes de comutação de circuitos.

Em uma rede de comutação de circuitos existem três fases que constitui todo o
processo de comunicação: (i) estabelecimento do circuito (este assunto será
tratado no capítulo sobre sinalização), (ii) transmissão da informação e (iii)
encerramento da chamada (trata-se de uma sinalização para liberação do
circuito).
Na fase de estabelecimento do circuito, o assinante chamador deve informar à

rede o endereço do assinante chamado (plano de numeração de telefonia). O
elemento responsável por estabelecer o circuito (central telefônica), ao receber o
endereço do assinante chamado, aloca recursos de comunicação para uso
exclusivo dos terminais de assinantes (chamado e chamador). A partir desta
fase, existe uma conexão ponto-a-ponto formada entre assinante chamado e
chamador. Esta conexão recebe o nome de circuito. Neste circuito podem ser
trafegados informações de voz ou de dados.
Comutação de circuito
• Fases de estabelecimento da comunicação em uma rede de comutação de circuito.
∆tS
∆tC
∆t L
Figura 1 12
O estabelecimento do circuito é feito através de mensagens enviadas entre os

elementos que participam da comunicação (nós de rede). No caso de telefonia,
os elementos serão os terminais de assinantes e as centrais telefônicas. Estas
mensagens são padronizadas e correspondem ao processo de sinalização de
rede. Existem vários tipos de sinalização. Os mais comuns serão estudados em
um capítulo exclusivo à sinalização telefônica.
Após o estabelecimento do circuito, tem-se início a fase da conversação. Nesta

fase, os terminais de assinante trocam informações pelo circuito estabelecido. É
interessante ressaltar que as informações não são processadas pelas centrais.
Isto faz com que o atraso de comunicação dependa somente do atraso de
propagação do sinal na linha. Em média, o atraso de propagação nos pares de
fios é de 5 µs/km [1]. O atraso constante na comunicação é vantajoso para
aplicações que são sensíveis à variação do atraso (jitter). É o caso de aplicações
com mídia em tempo-real e interativa (tráfego de voz).
A fase de encerramento do circuito acontece ao fim da comunicação. Esta fase

serve para liberar os recursos utilizados na comunicação para que outros
usuários (ou os mesmos) possam utilizá-los em uma próxima comunicação.
A Figura 1 representa os estágios para comunicação em uma rede de
comutação de circuitos. Pode-se notar pela Figura 1 que, em um primeiro
instante ocorre a troca de mensagens de sinalização entre as centrais e os
assinantes para o estabelecimento do circuito. Em um segundo momento ocorre
a troca das informações de voz entre os assinantes. E por fim, a liberação do
circuito.
O tempo de estabelecimento do circuito (∆t S ) depende do atraso de propagação,

do atraso de processamento de cada central, do tamanho da mensagem de
sinalização e da taxa de transmissão do canal de sinalização.
O tempo de conversação ( ∆tC ) é definido pelos assinantes. Trata-se do tempo

que eles ficaram conversando. Enquanto que, o tempo de encerramento da
chamada ( ∆t L ) depende das mesmas grandezas de ∆t S . Normalmente, o tempo
de estabelecimento é maior que o tempo de encerramento da chamada, devido
às características da sinalização.
Pode-se deduzir que as principais vantagens da comutação de circuito são: (i) a

comunicação entre a origem e o destino é transparente e, (ii) o atraso entre
origem e destino é constante e limitado ao tempo de propagação.
Como desvantagens da comutação de circuitos, pode-se citar: (i) existirá um

baixo fator de utilização dos recursos de transmissão da rede (rede ociosa), (ii)
se os terminais não transmitem, há subutilização do recurso de comunicação
alocado, pois este recurso é de uso exclusivo dos terminais e (iii) o
estabelecimento do circuito consome tempo, o que pode reduzir a eficiência do
sistema quando a mensagem a ser transmitida possui comprimento pequeno.
Redes de comutação de circuitos
• Vantagens
– Recurso dedicado entre as estações.
– Capacidade de transmissão sempre disponível.
– Atraso de comunicação constante.
• Desvantagens
– Desperdício de capacidade do meio se o tráfego não for constante
(baixa eficiência em utilização de recursos).
– Rede ociosa fora da Hora de Maior Movimento (HMM).
– Não explora intervalos de silêncio na comunicação.
14
14
Comutação de Pacotes
• Fases de transmissão de dados por uma rede de comutação de pacotes.
∆t P
∆tF
t ∆tTx
Figura 2 15
• Redes de comutação de pacotes.
Não é intuito deste material esgotar o assunto sobre comutação de pacotes. Na

verdade, serão apresentados alguns princípios para comparação com a
comutação de circuitos (que é o foco deste curso).
A primeira diferença da comutação de pacotes em relação à comutação de

circuitos esta na fase de estabelecimento da rota fim-a-fim. Na comutação de
pacotes não existe uma sinalização para estabelecimento de um caminho único
interligando os usuários em comunicação. Isto faz com que cada mensagem de
informação seja enviada de maneira independente pela rede de comutação de
circuito. Na comutação por pacote a informação a ser transmitida é separada
(segmentada) em blocos antes de ser transmitida. Os blocos de informação são
denominados pacotes, e cada pacote contém parte da informação.
Como não existe um caminho pré-estabelecido entre o remetente e o

destinatário do pacote, cada pacote de informação carrega consigo um
cabeçalho (OH – Overhead). No cabeçalho são inseridas informações de
controle para a rede. Basicamente, o OH carrega informações que serve para
que o equipamento de comutação de pacotes (roteador) saiba para onde deve
encaminhar o pacote. Além disso, um número de sequência é adicionado ao
cabeçalho do pacote. Esta informação informa o receptor como deve ser feita a
remontagem da informação.
Neste tipo de rede, o atraso que cada pacote sofre (entre transmissor e receptor)
segue uma distribuição estatística. Portanto, diz-se que o atraso na rede é
variável. Enquanto que na comutação de circuitos, o atraso é constante.
Basicamente, existem quatro tipos de atrasos que um pacote pode sofrer em

uma rede de computadores: (i) atraso de processamento, (ii) atraso de fila, (iii)
atraso de transmissão e (iv) atraso de propagação. A Figura 2 ilustra estes
atrasos.
Atraso de processamento ( ∆t proc ) – trata-se do tempo requerido

para o roteador examinar o cabeçalho do pacote e determinar para onde
direcioná-lo. Pode também incluir outros fatores, como o tempo necessário para
verificar os erros de bits existentes no pacote.
Atraso de fila ( ∆t F ) – trata-se do atraso que um pacote sofre

enquanto aguarda para ser transmitido no enlace. Se a fila estiver vazia, e
nenhum outro pacote estiver sendo transmitido naquele momento, então o tempo
de fila do pacote que entrar no roteador será zero. Por outro lado, em uma rede
congestionada, o atraso de fila será longo.
Atraso de transmissão ( ∆tTx ) – trata-se da quantidade de tempo

requerida para transmissão de todos os bits do pacote para o enlace, ou seja,
para fora do roteador. Sendo o tamanho do pacote igual a L [bits], e a velocidade
de transmissão do enlace igual a R [bps]. Então, o atraso de transmissão deste
pacote será igual a L/R.
Atraso de propagação ( ∆t P ) – é o tempo necessário para propagar

o bit desde o início do enlace até o roteador de destino. O bit propaga à
velocidade de propagação do enlace, que pode variar entre 2.108 e 3.108,
dependendo do meio de propagação. Portanto, o atraso de propagação é igual à
distância do enlace dividida pela velocidade de propagação, ou seja, d/v.
O atraso total experimentado por um pacote é igual a soma de todos os atrasos

individuais, logo
∆ttotal = ∆t proc + ∆t F + ∆tTx + ∆t P
Não é difícil entender que o atraso varia de um pacote para outro. Por exemplo,
se dois pacotes forem roteados por rotas diferentes, todos os atrasos poderão
ser diferentes, uma vez que, as distâncias serão diferentes, a taxa de
transmissão do enlace poderá ser diferente, e o congestionamento de cada
enlace poderá ser diferente. No caso de dois pacotes serem transmitidos pela
mesma rota, o atraso poderá variar devido à flutuação do congestionamento.
O atraso variável é uma desvantagem deste tipo de rede, quando a aplicação é
um tipo de mídia em tempo-real e interativa (voz e videoconferência). Como a
aplicação é gerada em tempo real, os tempos de geração do sinal devem ser
respeitados na hora de reproduzir este sinal no receptor. Há ainda o fator da
interatividade entre os usuários, que exige da rede uma baixa latência de rede.
A Figura 3 ilustra uma rajada de pacotes sendo transmitida por uma rede de
comutação de pacotes. Pode-se observar pela Figura 3 que, no receptor, os
pacotes chegaram com atrasos diferentes entre si. Não respeitando o tempo de
geração dos mesmos. Pode acontecer, até mesmo, a recepção de pacotes fora
da sequência.
∆t ∆t = 10ms t
L
{
∆t1 ∆t 2 ∆t 3
Figura 3 – Análise de atraso variável na rede de comutação de pacotes.
É importante salientar que o receptor não pode reproduzir o áudio assim que o
pacote é recebido. Isso causaria uma série de deformações na forma de onda do
áudio, e tornaria a informação ininteligível.
Diante disso, pode-se concluir que a rede de comutação de pacote não é

interessante para tráfego de voz. Porém, existem aplicações que utilizam a rede
de dados para este fim. É o exemplo do Skype, MSN, entre outros aplicativos
que permitem o tráfego de voz e vídeo sobre IP (Internet Protocol). Estas
aplicações devem utilizar ferramentas que possibilitem o contorno deste
problema. Algumas destas ferramentas serão explicadas no próximo tópico.
Redes de comutação de Pacotes
• Vantagens.
– Melhora a eficiência de utilização de recursos da rede.
– Menor exigência quanto à investimentos na rede.
– Compartilhamento de banda (melhor aproveitamento da capacidade da
rede).
• Desvantagens.
– Não é criado um caminho dedicado entre as estações.
– Congestionamento da rede.
– Atraso variável (péssimo para comunicação multimídia).
– Não existem garantias de QoS (Qualidade de Serviço).
18
Este tipo de rede possui as seguintes características. Os canais de dados são

compartilhados entre os dispositivos de comunicação, melhorando a eficiência
no uso da banda passante disponível. Os roteadores podem armazenar os
pacotes até que o canal fique disponível, reduzindo a sensibilidade ao
congestionamento da rede. A Internet é um exemplo de rede baseada em
comutação de pacotes.
De maneira geral, a Tabela 1 é uma tentativa de estabelecer uma comparação

entre as características das comutações de circuitos e pacotes. Esta tabela é
uma versão adaptada da tabela de comparação mostrada em [1]. Isto reforça a
necessidade da leitura desta referência, sobre este assunto.
18
Comparações
• Características gerais das comutações de circuito e pacote.
Tabela 1 19
Como trafegar voz e vídeo em uma rede de comutação de pacotes?

Como já observado anteriormente, apesar do problema do Jitter, as redes de
comutação de pacotes são utilizadas para tráfego de voz e vídeo em tempo real.
Isto é possível dada uma série de medidas que são tomadas para contornar este
problema na rede.
Em uma rede de pacotes datagrama [1], não há como evitar o Jitter. Portanto, no
receptor, os pacotes chegarão com atrasos variáveis. Neste caso, são usadas
três medidas para contornar este problema: (i) atraso de reprodução, (ii)
marcação de tempo em cada pacote, (iii) marcação de sequência em cada
pacote.
As três medidas juntas podem retirar por completo o Jitter da informação. E
assim, permitir a reprodução da mídia sem distorções. Além das informações
passadas em sala de aula, o aluno pode consultar a referência [2] (nas seções
citadas) para um melhor entendimento.
Além das três medidas apresentadas, existe uma outra forma de trafegar mídia
em uma rede de pacotes. Trata-se do modo de conexão por Circuito Virtual. O
modo circuito virtual tem o seu princípio de funcionamento similar a comutação
de circuitos, ou seja, um caminho é pré-estabelecido no início da comunicação.
Este caminho permanece até o final da comunicação. O circuito estabelecido
para uma ligação não é dedicado para aquela ligação, ou seja, pode ser
compartilhado por outras ligações. Para o usuário isto é transparente.
A Figura 4 ilustra uma rede trabalhando em modo circuito virtual. Neste caso,
existe uma ligação sendo feita entre os usuários A e F. Uma única rota foi pré-
estabelecida para esta chamada (rota A-B-C-F). Deste modo, pode-se dizer que
ficou fixado um circuito (virtual) para a troca de dados.
Qualquer pacote desta chamada deverá ser enviado pelo circuito virtual.
Portanto, os pacotes chegam ao receptor em ordem, e com um baixo Jitter
inserido pela rede. Apesar de parecer uma solução ótima, este tipo de conexão
(circuito virtual) não é utilizado em larga escala na prática.
Roteador B Roteador C
3 2 1
1
2 3
3 2
Roteador A
1 Roteador F
Transmissor
Receptor
Roteador D Roteador E
Figura 4 – Modo circuito virtual.
É extremamente recomendável que seja feita a leitura do Capítulo 5 da

referência [1]. Seção 5.1.
Redes de comutação de Pacotes: Datagrama
• Na rede de comutação de pacotes baseada em datagrama não é criada
nenhuma conexão entre o emissor e o receptor. Cada pacote é tratado de
forma independente na rede.
21
Os serviços de datagrama tratam cada pacote como uma mensagem

independente. Cada pacote é roteado independentemente na inter-rede e cada
roteador decide qual segmento da rede deve ser adotado na próxima etapa da
rota do pacote.
Essa capacidade permite que os roteadores ignorem os segmentos ocupados e

passem para outras etapas, a fim de acelerar o percurso dos pacotes na inter-
rede. Os datagramas são freqüentemente usados em redes locais. Os protocolos
da camada de rede são responsáveis pelo envio do frame à rede apropriada.
Depois, como cada datagrama contém informações de endereço de destino, os
dispositivos da rede local poderão reconhecer e receber os datagramas.
Como cada pacote é tratado de forma independente e, cada pacote pode

percorrer caminhos diferentes até chegar ao receptor, nenhuma garantia pode
ser oferecida por esta rede quanto ao atraso entre os pacotes. Ou seja, os
pacotes podem chegar de forma desordenada, com atrasos diferentes da
geração e ainda podem, até mesmo, não chegar ao destino. Estes fatores têm
de ser levado em consideração quando se deseja trafegar dados em tempo real
sobre este tipo de rede.
21
Redes de comutação de Pacotes:
Circuito Virtual
• A rede de comutação de pacotes pode se comportar como uma rede de
comutação por circuito. Para isso, é necessário dispositivos que trabalhem
na forma de Circuito Virtual.
22
Os circuitos operam por meio de uma conexão formal entre dois dispositivos que
estão em comunicação. Quando os dispositivos iniciam uma sessão, eles
negociam os parâmetros para o tamanho máximo de mensagens, janelas de
comunicação, caminhos de rede, etc. Esta negociação estabelece um circuito
virtual, um caminho bem definido na inter-rede através do qual os dispositivos se
comunicam. Geralmente, esse circuito virtual permanece em funcionamento até
que os dispositivos finalizem a comunicação. Os circuitos virtuais distinguem-se
pelo estabelecimento de uma conexão lógica.
Circuito Virtual significa que a rede se comporta como um circuito físico

dedicado, estabelecido entre os dispositivos que estão se comunicando. Ainda
que não exista nenhum circuito físico, a rede terá a aparência de uma conexão
física, no caso dos dispositivos que estão nas extremidades do circuito. Os
circuitos virtuais são freqüentemente usados junto com serviços baseados em
conexão. Este tipo de rede associa duas características vantajosas: i) resiliência
(característica das redes de comutação por pacote), ii) atraso praticamente fixo
entre os pacotes (característica das redes de comutação por circuito).
22
Redes de comutação de Pacotes
Datagrama vs. Circuito Virtual
• Circuito Virtual
– Pacotes percorrem o mesmo caminho e chegam em ordem.
• Datagrama
– Pacotes percorrem caminhos diferentes, podem chegar fora de ordem,
repetidos, e até mesmo, não chegarem ao destino.
23
Comparando as duas tecnologias observamos que o circuito virtual garante que

a informação chegará em ordem no destino e que o atraso será praticamente o
mesmo para todos os pacotes enquanto que nas redes que usam o conceito de
datagrama poderemos ter os pacotes percorrendo caminhos diferentes fazendo
com que alguns pacotes possam ser perdidos, além de chegarem fora de ordem
(em função da escolha de caminhos diferentes).
23
Obstáculos para transmissão multimídia
• O protocolo IP disponibilizado na Internet de hoje provê um serviço de
melhor esforço (best-effort) a todos os datagramas que transporta.
– Perda de pacotes.
– Atraso fim-a-fim (Delay).
– Variações de atraso (Jitter).
24
Em outras palavras, a Internet faz seu melhor esforço para transportar cada
datagrama do remetente ao receptor o mais rápido possível, mas não faz
nenhuma promessa sequer sobre atraso fim-a-fim para um pacote individual.
Tampouco faz promessas quanto à variação do atraso de pacote dentro de uma
corrente de pacotes. Como TCP e UDP executam sobre IP, nenhum desses
protocolos pode dar alguma garantia contra atraso às aplicações requisitantes.
O projeto de aplicações multimídia seria certamente menos complicado se

houvesse algum tipo de classificação dos serviços na Internet. Assim, os pacotes
de serviços de primeira classe teriam número limitado e receberiam serviço
prioritário em filas de roteadores. Porém, esse tipo de marcação ainda não foi
adotado na Internet.
24
Perda de pacotes – Considere um segmento UDP gerado por uma aplicação de
telefone via Internet. O segmento UDP é encapsulado em um datagrama IP.
Este datagrama passa por buffers nos roteadores (filas). É possível que estas
filas estejam lotadas. Neste caso o datagrama é sumariamente descartado e
nunca chegará à aplicação receptora.
Atraso fim-a-fim – É o acumulo de atrasos de processamento, transmissão e de

formação de filas nos roteadores. Para aplicações de telefone via Internet,
atrasos menores que 150ms não são percebidos pelo ouvido humano. Atrasos
entre 150ms e 400ms podem ser aceitáveis. Atrasos acima de 400ms podem
atrapalhar seriamente a interatividade em conversas por voz.
Variações de atraso – São os atrasos aleatórios das filas nos roteadores. Por
causa dessa variação no atraso, o tempo decorrido entre a geração e a recepção
pode variar de pacote para pacote. Se o receptor ignorar a presença da variação
de atraso e reproduzir as porções assim que elas chegam, então a qualidade de
áudio resultante poderá facilmente se tornar ininteligível.
É interessante salientar que a perda de pacotes não é necessariamente tão

grave. Na verdade, taxas de perda de pacotes entre 1 e 20 por cento podem ser
toleradas, dependendo da codificação (CODEC).
25
Parâmetros de QoS
• Tabela comparativa de aplicações multimídia.
26
26
Eliminação do Jitter no receptor
• O receptor multimídia deve prover uma reprodução sincronizada dos
pacotes de voz mesmo na presença de variação de atraso aleatório.
– Numeração de pacote: Cada pacote é marcado com um número que

representa a sequência de geração.
– Marca de tempo do pacote: Cada pacote possui uma marcação do

tempo em que ele foi gerado. Esta marcação é feita pelo remetente e
instrui o receptor do instante de reprodução.
– Atraso de reprodução: O atraso de reprodução dos pacotes deve ser

suficientemente longo para que a maioria dos pacotes seja recebida
antes de seu tempo de reprodução programado.
27
27
Atraso de reprodução
• A figura abaixo mostra a relação do atraso de reprodução com a perda de

pacotes no receptor multimídia.
28
O receptor tenta reproduzir cada pacote com um atraso de q [ms] após o pacote
ter sido gerado. Portanto, se a marca de tempo de um determinado pacote for t,
então, o receptor reproduz este pacote no tempo t+q . Os pacotes que chegam
após seu tempo de reprodução são descartados. Nesta técnica deve-se adotar
um valor de q que satisfaça uma solução de compromisso entre atraso de
reprodução e perda de pacotes.
28
Atraso de reprodução
• Uma vez calculados os valores da estimativa de atraso ( ) em uma rede

multimídia e o desvio médio do atraso ( ), pode-se calcular o atraso de
reprodução ( ) pela seguinte equação.
• k é um inteiro positivo qualquer.

• é o tempo de geração do pacote.
29
Exercício) Uma vez calculados os valores da estimativa de atraso ( di ) em uma

rede multimídia e o desvio médio do atraso ( vi ), pode-se calcular o atraso de
reprodução ( pi ) pela seguinte equação.
pi = ti + d i + k ⋅ vi (1)
onde, k é um inteiro positivo qualquer e ti é o tempo de geração do pacote.

Sendo assim, estime a perda total de pacotes ocorrida em uma aplicação que
transmitiu 10 pacotes com os seguintes tempos de geração ti . O atraso estimado
é de 200 ms e o desvio máximo deste atraso é 25 ms. Considere igual a 4.
Quantos pacotes foram perdidos por chegarem depois do tempo de reprodução
programado? Quais foram esses pacotes (numeração)?
Qual a porcentagem de pacotes perdidos? Em uma aplicação de voz sobre IP
esta taxa de perdas é aceitável?
Recuperação de perda de pacotes
• A idéia básica da FEC (Forward Error Correction) é adicionar informações
redundantes à corrente de pacotes original. Ao custo de aumentar a taxa de
transmissão do áudio.
30
A retransmissão de pacotes perdidos (como no TCP) não é apropriada para

aplicações em tempo real. Na verdade, retransmissões de pacotes que
chegaram após o tempo de reprodução não servem para absolutamente nada.
Enquanto que a retransmissão de pacotes descartados em um roteador nem
sempre é feita com necessária rapidez. Portanto, deve-se considerar outras
formas para recuperar as perdas de pacotes.
A informação redundante pode ser usada para reconstruir aproximações ou

versões exatas de alguns pacotes perdidos. Um mecanismo de FEC consiste em
enviar uma corrente de áudio de baixa resolução como informação redundante.
Neste caso, o usuário gera duas correntes de áudio, uma nominal com resolução
alta (G.711) e uma redundante com baixa resolução (GSM).
- G.711 – PCM-64kbps.
- GSM – 13 kbps.
O remetente monta o n-ésimo pacote de transmissão tomando o n-ésimo pacote

da corrente nominal e anexando o pacote (n-1) da corrente redudante. Sendo
assim, se ocorrer a perda de pacotes não-consecutivos, o receptor pode
reproduzir o pacote de menor resolução e ocultar a perda de pacote.
30
Recuperação de perda de pacotes
• Intercalação de pacotes. A desvantagem desta técnica é que ela aumenta a
latência. Porém, não necessita de incremento de largura de banda.
31
Como alternativa à transmissão redundante, a aplicação de telefonia via Internet

pode enviar pacotes de áudio intercalado. Neste caso, o remetente re-arranja a
sequência de parcelas que montam o pacote de áudio antes da transmissão. No
caso de perda de um pacote, a re-ordenação na recepção, faz com que
apareçam pequenas lacunas na corrente de áudio reconstruída, aumentando a
qualidade de áudio.
31
Compromisso das redes multimídia
• A figura abaixo mostra o compromisso das redes multimídia quanto a
qualidade do serviço. Mostra também a relação entre a perda de pacotes e
atraso da aplicação com esta qualidade.
32
• PROTOCOLOS DE CONTROLE E TRANSPORTE DE MÍDIA
– RTP (Real-Time Transport Protocol)

– RTCP (Real-Time Transport Control Protocol)
33
RTP – Real-Time Transport Protocol
• Para transportar dados em tempo real, são necessários protocolos que
levem consigo informações de sincronismo e de tempo, como o RTP (Real-
time Transport Protocol).
• Para fornecer feedbacks aos participantes da transmissão efetuada pelo
RTP, existe o protocolo RTCP (RTP Control Protocol).
34
Aplicações interativas em tempo real prometem liderar grande parte do

crescimento futuro da internet. Para transportar dados em tempo real, são
necessários protocolos que levem consigo informações de sincronismo e de
tempo, como o RTP (Real-time Transport Protocol). Para fornecer feedbacks aos
participantes da transmissão efetuada pelo RTP, existe o protocolo RTCP (RTP
Control Protocol). É interessante salientar que o RTP não garante nenhuma
reserva de banda para a aplicação. Também não garante nenhum QoS para
serviços em tempo real, tão pouco, garante a entrega de dados.
34
RTP – Real-Time Transport Protocol
• O RTP definido na RFC 3550 é um padrão para transporte de dados

multimídia. Ele pode ser usado para transportar vários formatos de áudio
como PCM, GSM, MP3, bem como alguns formatos de vídeo, MPEG e
H.263.
35
• CONSIDERAÇÕES SOBRE ENCAPSULAMENTO DE VOZ EM
PACOTES IP. (VoIP).
36
Antes de estudar o protocolo de transporte de dados multimídia, é interessante

analisar como é construído um pacote de voz a partir da informação analógica,
passando pela digitalização voz e, por último, uma análise sobre codificadores
de voz (CODECs).
36
Transmissão de voz sobre pacotes
37
Voz sobre IP é um conceito relativamente simples, basta transformar a voz em

sinal digital e então empacotar os dados em uma aplicação IP dentro de uma
rede de dados que utilize o IP como protocolo de nível de rede. Aliás, esta
simplicidade é que permite transmitir dados e voz dentro de uma mesma rede.
Aplicações de voz em tempo real sobre o protocolo IP já são uma realidade em
rede privadas onde é possível exercer um controle sobre a rede, o que não é
possível quando se fala de Internet.
37
Digitalização de voz
• O processo de digitalização da voz segue os seguintes passos:
38
Nos sistemas computacionais todas as informações são representadas

internamente no formato digital. Mas como os sentidos humano reagem a sinais
analógico, faz-se a necessidade de uma conversão de sinal digital para
analógico (ou conversão D/A), vários problemas surgem nessas conversão tais
como a distorção dos dados e a necessidade de uma grande capacidade
armazenamento e transmissão.
Quando digitalizamos um dado (foto, som, vídeo, etc.), um novo fator aparece
como fundamental quando se fala em armazenamento e transmissão, é a taxa
de bits.
Taxa de bits é definida como o produto entre taxa de amostragem e o número de
bits usados no processo de quantificação. Por exemplo, supondo uma freqüência
de 8 KHz e 8 bits por amostra, a taxa de bits necessária à telefonia é igual a
8000 x 8 = 64 Kb/s. Logo vemos que nossa taxa de transmissão de áudio e
vídeo, estará sempre relacionada a taxa de bits utilizada para a digitalização de
dado. Quando maior a qualidade de digitalização, maior será o espaço
necessário para armazenar ou transmitir esse dado.
38
Filtragem
• O sinal a ser digitalizado deve ser limitado em frequência. Para isso deve-
se filtrar o sinal de voz antes de digitalizá-lo.
39
O sinal de voz possui componentes de freqüência que vão desde valores da

ordem de 10 Hz a valores próximos a 15 KHz. Apesar desta grande largura de
faixa, a maior parte da energia (cerca de 75%) está contida em uma faixa de
freqüência próxima a 1 KHz. Desta forma, é possível limitarmos a largura de
faixa (BW) do sinal de voz e mesmo assim garantirmos que a maior parte da
energia fique dentro da faixa que será transmitida.
39
Teorema de Nyquist
40
Nyquist provou, através da teoria da amostragem, que valores de um sinal

analógico tomados a intervalos regulares Ts contém a mesma informação do
sinal original desde que o intervalo de tempo entre as amostras não seja superior
a 1 / (2xB).
Ts < 1 / (2xB)
onde B é a largura de faixa do sinal analógico, ou, em outras palavras, a taxa de

amostragem (ou freqüência de amostragem) deve ser maior do que o dobro da
largura de faixa do sinal analógico
1 / Ts > (2xB)
sendo que a relação acima é denominada segundo critério de Nyquist.
40
Etapas da digitalização da voz
• Sinal analógico.
– Contínuo no tempo.
– Contínuo na amplitude.
41
41
Amostragem
• Sinal amostrado.
– Discreto no tempo.
– Contínuo na amplitude.
42
O 1º passo consiste em colher amostras do sinal analógico. O número mínimo

de amostras é definido pelo teorema de Nyquist e deve ser maior do que duas
vezes a maior freqüência do sinal que está sendo digitalizado.
42
Quantização
• Níveis de quantização
43
Em seguida, no 2º passo, as amostras colhidas devem ser quantizadas. Nesta

etapa existirá um número finito de níveis que serão utilizados para a medida de
cada uma das amostras.
Observe que algumas amostras possuem valores intermediários entre os níveis

de quantização. Esse é um erro inserido pelo processo de quantização,
denominado de Erro de Quantização. Quanto maior for o número de níveis de
quantização, menor será esse erro. Este erro pode ser reduzido, mas não
eliminado. Para que o erro de quantização seja nulo, são necessários infinitos
níveis de quantização (seria necessário um sinal analógico).
43
Quantização
• Sinal quantizado.
– Discreto no tempo.
– Discreto na amplitude.
44
Durante a quantização algumas amostras serão iguais a um dos níveis usados

para a medida mas poderão existir amostras que possuem um valor entre dois
níveis consecutivos de quantização. O sistema deverá, neste caso, aproximar o
valor desta amostra para um destes dois valores, resultando em um valor
superior ao valor real ou inferior ao valor real. Nos dois casos aparecerá um erro,
denominado erro de quantização. Este erro será menor quanto maior for o
número de níveis de quantização. Na seqüência, cada amostra deverá ser
representada por um conjunto de bits, resultando no sinal digital que será
transmitido.
44
Sistema PCM
45
A modulação em pulsos codificados (PCM - Pulse Code Modulation) consiste em

transformar o valor da amostra do sinal analógico num valor numérico no sistema
binário cujos algarismos (bits 1 ou 0) são transmitidos seqüencialmente na forma
de presença (bit 1) ou ausência (bit 0) de pulsos retangulares. As vantagens do
sinal PCM sobre os demais tipos de modulação em pulsos consiste no fato de
que a amplitude, a duração e a posição do pulso são fixas de tal forma que a
informação do sinal analógico está traduzida apenas na presença ou na
ausência do pulso. Isto torna o sinal PCM muito mais imune ao ruído e às
distorções, podendo ser replicado tantas vezes quanto se queira sem que a
informação seja deteriorada. O sinal PCM permite ainda o armazenamento da
informação na forma digital através dos mesmos recursos utilizados no
armazenamento de dados em computadores (CD, HD, FDD, RAM, ROM).
45
Compressão de áudio
• Codificadores e Decodificadores de voz. (CODEC).

– São usados algoritmos para reduzir tráfego gerados por cadeias
repetitivas de informação.
– Otimiza o uso da banda disponível.
– Aumenta o atraso no envio das informações.
46
Por compressão de dados entendemos que é uma forma de codificar um certo

conjunto de informação de maneira que o código gerado seja menor que o fonte.
O uso de técnicas de compressão é claramente essencial para aplicações
multimídia. As razões são as seguintes:
• O grande requisito de armazenamento de dados multimídia.
• A velocidade relativamente lenta dos dispositivos de armazenamento que não

podem apresentar dados multimídia (principalmente vídeo) em tempo-real.
• A largura de banda da rede que não permite a transmissão de vídeo em tempo

real.
46
Codificadores de áudio
• Tabela de CODEC mais usados para voz com suas respectivas taxas de
transmissão e escala de qualidade MOS (Mean Opinion Score)
47
O G.711 define a representação de voz não compactada, usando modulação

PCM. A recomendação G.726 converte um fluxo de bits de 64 Kb/s em um fluxo
de 32 Kb/s. G.726 é baseado na técnica ADPCM (Adaptive differential pulse-
code modulation) e sua taxa de amostragem é de 8 KHz.
G.723 é outro padrão de compressão sem perdas baseado no ADPCM que

opera a 6,3 ou 5,3 Kb/s. A qualidade de som resultante é inferior ao padrão
G.711 PCM não compactado. Este padrão tem pouco uso.
O G.728 objetiva baixas taxas de bits. Ele opera a 16 Kb/s mas sua largura de
banda é limitada a 3,4 KHz. A qualidade de som resultante é significativamente
inferior ao G.711. Ele usa uma técnica de vetor quantificação, onde um número
de amostragens são agrupadas em um vetor e cada vetor é representado por um
índice na entrada do dicionário.
47
O G.729: Usado para voz com compressão de taxa de 8 Kb/s. Há duas
variações deste padrão: G.729 e G.729.A. A principal diferença é a
complexidade computacional, ambos fornecem qualidade similar a 32 Kb/s em
ADPCM.
Cada codec fornece som com uma determinada qualidade. E esta qualidade é
algo subjetivo, pois depende das preferências de cada pessoa. Um parâmetro
usado é o nível de opinião médio MOS. Assim, um grande número de ouvintes
julgam a qualidade do som em uma escala de 1 (ruim) até 5 (excelente).
48
Empacotamento da voz
49
Uma das mais importantes considerações em transmissão de voz é minimizar o

atraso. para isso deve-se considerar o trafego de voz em tempo real. Se ocorrer
um atraso muito grande no pacote, o som será irreconhecível, o atraso aceitável
é da ordem de 200 ms. Há basicamente dois tipos de atraso: Propagação e
processamento. O atraso de propagação é causado pela característica da luz em
uma fibra óptica e atrasos de processamento ou serialização são causados pelos
aparelhos. A tabela mostra os atrasos introduzidos por diferentes codecs. Outro
atraso de processamento é o tempo para gerar o pacote de voz. Em VoIP o DSP
(Processador Digital de Sinais) forma um "frame" a cada 10 ms. Outra forma de
atraso é mover o pacote para a saída da fila. "Jitter" também interfere no tempo
de transmissão. Ocorre quando há uma variação entre o tempo em que o pacote
é esperado e o tempo de recebimento; isto é, o pacote foi recebido antes ou
depois do esperado. Assim ocorre descontinuidade no fluxo de voz em tempo
real.
49
Taxas de transmissão
• A figura abaixo mostra o uso real da banda para aplicação de VoIP. Deve-
se considerar os cabeçalhos a serem enviados junto com a informação.
50
Supressão de silêncio
• De acordo com as estatísticas do sinal de voz:
– 22% são características essenciais.

– 22% são redundâncias.
– 56% são intervalos de silêncio.
51
Em muitos casos, amostragens de áudio adjacentes são similares. A amostra

futura não é completamente diferente da passada, o próximo valor pode ser
previsto baseado no valor atual. A técnica de compressão que se aproveita desta
característica do áudio é chamada de codificação preditiva. Técnicas de
compressão preditivas são baseadas no fato que nós podemos armazenar a
amostra anterior e usar esta para ajudar a construir a próxima amostra.
51
Projeto de um sistema de VoIP.
• O Figura abaixo mostra um sistema de telefonia IP de uma dada empresa.
52
Calcule a largura de faixa necessária para cada link do sistema de comunicação

VoIP abaixo. Sabe-se que cada ramal faz 3 ligações de 5 minutos em média na
Hora de Maior Movimento (HMM). O controle de admissão não pode bloquear
mais que uma chamada em 100 realizadas.
Cabeçalho RTP
• Normalmente o cabeçalho é composto de 12 bytes.

• Se a aplicação fizer uso de várias fontes de dados, podem ser inseridos de 0
a 60 bytes no cabeçalho.
53
Para pacotes que chegam em ordem trocada, o número de seqüência ajuda na

reorganização da informação. Já para atrasos variáveis na rede, a informação de
timestamp vai ajudar o receptor a dimensionar o buffer de recepção.
53
Cabeçalho RTP
• Cabeçalho RTP.
– Versão – 2 bits – Mostra a versão do protocolo, atualmente a versão é a

2.0.
– Padding (P) – 1 bit – Indica o uso de bytes de enchimento na
informação útil.
– Extensão (E) – 1 bit – Indica a presença de extensões de cabeçalho no
próximo pacote.
– Contador de CSRC (CSRC) – 4 bits – Indica o número de fontes de
contribuição presente no cabeçalho.
– Marcação (M) – 1 bit – Marca o final de um frame (vídeo) ou o início
de uma rajada (voz).
54
Cabeçalho RTP
• Cabeçalho RTP.
– Tipo de payload – 7 bits – Indica qual o codificador usado. (RFC 1890).

– Número de sequência – 16 bits – Marcação do número do pacote, usado
no receptor para detectar e restaurar a sequência de pacotes.
– Timestamp – 32 bits – Marca de tempo do pacote. Reflete o tempo de
geração do pacote, e é usado na recepção para sincronismo de
reprodução.
– SSRC (Synchronization Source Identifier) – 32 bits – Identifica o
remetente do fluxo RTP.
– CSRC – 32 bits – máximo de 15 itens – Identificam as fontes que
contribuíram para um fluxo multiplexado de dados.
55
RTCP – Real-Time Transport Control Protocol
• A RFC 3550 especifica também o RTCP (Real-Time Transport Control
Protocol), um protocolo que uma aplicação multimídia pode usar
juntamente com o RTP.
• Os pacotes RTCP não encapsulam porções de áudio e/ou vídeo. São

enviados periodicamente e contêm relatórios com dados estatísticos que
podem ser úteis para a aplicação.
56
A RFC 3550 especifica também o RTCP (Real-Time Transport Control Protocol),

um protocolo que uma aplicação multimídia pode usar juntamente com o RTP.
Os pacotes RTCP não encapsulam porções de áudio e vídeo. Em vez disso, eles
são enviados periodicamente e contêm relatórios com dados estatísticos que
podem ser úteis para a aplicação. A especificação RFC 3550 não determina o
que a aplicação deve fazer com estas informações de retorno. Isto depende do
desenvolvedor da aplicação. Por exemplo, o remetente pode usar esta
informação para modificar sua taxa de transmissão (codec) caso a rede esteja
perdendo muitos pacotes.
56
Tipos de mensagens RTCP
• Para contribuir com o protocolo RTP o RTCP utiliza os seguintes 4 tipos de
pacote:
– SR (Sender Report) – Este pacote contém um relatório de envio e

recebimento de pacotes RTP por participantes que são fontes ativas.
– RR (Receiver Report) – Este pacote contém um relatório de

recebimento de pacotes RTP por participantes que não são fontes ativas.
– SDES (Source Description Items) – Este é um pacote descritivo do

participante e inclui a informação do seu CNAME.
– BYE – Indica a saída deste participante da comunicação e precisa

conter a SSRC/CSRC para sua identificação.
57
Cabeçalho RTCP
• Tanto o receptor quanto o remetente enviam pacotes RTCP durante uma
sessão multimídia. As informações são enviadas nos campos mostrados
pela figura abaixo.
58
O relatório feito pelo receptor contém diversos campos, os mais importantes são:
SSRC da transmissão RTP.
A fração de pacotes perdida na transmissão RTP.
O último número de sequência recebido.
A variação de atraso entre os pacotes recebidos.
As informações importantes contidas no relatório feito pelo remetente são:

SSRC da transmissão RTP.
A marca de tempo (timestamp) e o tempo de relógio (tempo real)
do pacote da transmissão RTP gerada mais recentemente.
O número de pacotes enviados.
O número de bytes enviados.
58
Largura de faixa RTCP
• Largura de faixa necessária para o RTCP.
– O RTCP controla a taxa de transmissão com a qual um participante

envia pacotes RTCP em função do número de participantes da sessão
multimídia.
– O RTCP tenta limitar seu tráfego em 5% da largura de faixa da sessão.
– Da taxa total do RTCP 75% da taxa é oferecida aos receptores de forma

igualitária e 25% ao transmissor.
59
Por exemplo, se um remetente que está enviando vídeo a uma taxa de

2Mbps, o RTCP tenta limitar seu tráfego em 100Kbps. Onde 75Kbps é
distribuído entre os receptores de forma igualitária 75/R. E 25Kbps é
oferecido para o remetente.
59
• PROTOCOLOS DE CONTROLE DE SESSÃO MULTIMÍDIA
60
Padrões de controle de sessões multimídia
• Entre os padrões de controle de sessão multimídia mais promissores estão:
– H.323 (ITU-T)
– SIP (IETF)
61
Entre os padrões de controle de sessão multimídia mais promissores, dois

padrões surgiram para suportar sinalização e controle de sessão em redes IP. O
H.323 desenvolvido pelo ITU-T e o SIP desenvolvido pela IETF. Ambos os
protocolos provêem aplicações similares, entretanto o SIP e um protocolo mais
“leve”, o que permite uma implementação mais simples, enquanto é mais
eficiente que o H.323.
61
• SIP – SESSION INITIATION PROTOCOL
62
SIP / SDP
• O protocolo SIP, definido na RFC 3261, é um protocolo da camada de

aplicação que pode estabelecer, modificar e terminar uma sessão
multimídia através de uma rede IP .
• Nas mensagens SIP deve conter a “descrição da sessão” (SDP – Session

Description Protocol) onde os participantes podem negociar os parâmetros
da sessão.
63
O protocolo SIP, definido na RFC 3261, é um protocolo da camada de aplicação

que pode estabelecer, modificar e terminar uma sessão multimídia através de
uma rede IP (Internet). Nas mensagens SIP deve conter a “descrição da sessão”
(SDP – Session Description Protocol) onde os participantes podem negociar os
parâmetros da sessão, como por exemplo o tipo de mídia e codec (áudio e/ou
vídeo).
O SIP prove seus próprios meios para prover confiabilidade a comunicação e
pode ser usado com qualquer protocolo de transporte como os protocolos TCP
ou UDP. Já o H323 só pode ser transmitido pelo protocolo TCP.
63
SIP / SDP
• A figura abaixo mostra a localização dos protocolos SIP e H.323 nas
camadas do modelo TCP/IP.
64
Arquitetura SIP
• O SIP é um protocolo baseado na estrutura cliente-servidor, e os
componentes da rede SIP são definidos abaixo:
– SIP user agent: um user agent (UA) é um ponto final na internet.
– SIP redirect server: é um UAS (User Agent Server) que gera um

resposta com objetivo de redirecionar uma requisição a outra
localização.
– SIP proxy server: pode atuar como UAS e UAC (User Agent Client).
Atua como um entidade intermediária entre outros agentes.
– SIP registrar: um SIP registrar é um UAS que processa requisições

SIP REGISTER.
65
SIP user agent: um user agent (UA) é um ponto final na internet, como um
telefone IP, um PC ou um dispositivo da rede.
SIP redirect server: é um UAS (User Agent Server) que gera um resposta com
objetivo de redirecionar uma requisição a outra localização;
SIP proxy server: pode atuar como UAS e UAC (User Agent Client). Atua como
um entidade intermediária entre outros agentes com o objetivo de rotear
mensagens SIP para o usuário de destino;
SIP registrar: um SIP registrar é um UAS que processa requisições SIP

REGISTER mantendo um registro de nome de usuário e domínio do mesmo.
Normalmente é consultado pelo SIP server para roteamento de mensagens.
65
Arquitetura padrão SIP
• Arquitetura padrão SIP.
– SIP Proxy.
– SIP Registrar.
– User Agent.
66
De forma a operar em todos os modos possíveis e com todos os recursos

previstos na arquitetura SIP, devemos possuir alguns servidores que serão
responsáveis por diversas tarefas. Embora sejam tarefas efetuadas por
servidores distintos, é possível se encontrar estas três funcionalidades em um
mesmo hardware físico.
66
SIP Proxy
• Funções de um SIP Proxy.
– Responsável pelo recebimento de mensagens provenientes do usuário

chamador e endereçadas ao usuário chamado.
– Atua como intermediário entre o usuário chamado e chamador.
– Um SIP proxy nunca formula mensagens de requisição, com exceção

da mensagem CANCEL.
– O SIP proxy não trafega mídia, somente mensagens de sinalização.
67
Como, na maioria dos casos, o usuário que deseja iniciar uma conexão com
outro, não sabe o endereço IP do mesmo, há a necessidade de um servidor
denominado SIP Proxy. O SIP Proxy, possui acesso a um mapeamento entre
nome de usuário e endereços IP (tal base de dados é mantida por um outro tipo
de servidor). Em nossos exemplos que veremos durante todo este curso, temos
a comunicação entre dois ramais de uma empresa, de número 201 e 202. Estes
ramais, por sua vez, estão associados a um endereço IP cada um, através de
seu registro, o qual é efetuado no momento da conexão deste ramal, e mantido
periodicamente. Um Servidor Proxy tem como função somente o
encaminhamento das mensagens SIP entre o usuário chamador e o usuário
chamado. Desta forma, ele nunca criará uma nova requisição, com exceção do
método CANCEL, que permite com que uma comunicação seja cessada.
Por fim, um servidor SIP Proxy não é responsável pelo tráfego de mídia, ou seja,
esta comunicação deverá ser efetuada entre os dois pontos envolvidos na
conversação.
67
SIP Registrar
• Funções do SIP Registrar.
– Autentica o usuário para evitar registros indevidos.
– Mantém um banco de dados de usuários e endereços IP.
– Processa o método REGISTER.
68
O servidor responsável pela procedimento de registro de usuários, ou seja, a sua

autenticação (através de nome de usuário e senha) e a associação do mesmo a
um endereço IP, é o servidor denominado REGISTRAR. Este servidor também
mantém um banco de dados com estas informações sempre atualizado, através
do registro periódico efetuado pelos usuários conectados ao mesmo.
68
Endereçamento SIP
• O padrão SIP usa um Universal Resource Identifier (URI) para identificar
um usuário.
– username@domain
• Exemplos.
– alice@example.com
– 123456@gateways.com
– bob@192.168.1.10
• A associação entre o nome do usuário e o domínio deste usuário é chamado

de binding e é mantida pelo servidor Registrar.
69
O endereçamento SIP possui formato parecido com o já familiar endereço de e-

mail, onde temos a sintaxe nome@domínio. Chamamos este formato de
endereço de URI – Universal Resource Identifier o qual pode assumir diversos
padrões, podendo conter letras e números tanto no campo relativo ao usuário
quanto no campo relativo ao domínio. Essa associação é efetuada e mantida
pelo servidor REGISTRAR sendo obrigatória para que o usuário possa iniciar ou
participar de sessões SIP.
69
Sinalização de chamadas
• O protocolo SIP adota o conceito de requisições (métodos) e respostas.
Abaixo alguns métodos do protocolo.
70
Métodos são as requisições do protocolo SIP e são gerados pelos User Agent
Clients e processadas/reencaminhadas pelos User Agent Servers. Alguns
métodos SIP foram previstos na RFC que define o protocolo em si, a RFC3261.
Como o protocolo prevê também interoperação com as redes de telefonia fixa e
móvel, foram criados métodos adicionais para suportar serviços presentes
nestas redes.
70
Sinalização de chamada
• Respostas SIP.
71
Sinalização de chamada
Procedimento de sinalização SIP
72
Protocolo SIP
• Método REGISTER
73
Protocolo SIP
• Resposta 200 OK.
74
Protocolo SIP
• Método INVITE.
75
Protocolo SIP
• Resposta 100 Trying
76
Protocolo SIP
• Método ACK
77
• SDP (Session Description Protocol)
78
• O Protocolo de descrição da sessão (SDP – Session Description Protocol) é
encapsulado pelo protocolo SIP. Portanto, o corpo da mensagem SIP é o
próprio protocolo SDP.
• Este protocolo, tipicamente, é utilizado pelos participantes de uma sessão

para negociar os parâmetros necessários para estabelecer a sessão.
79
• Parâmetros para descrição da mídia.
– Session Description (Descrição de Sessão).

– Time Description (Descrição de Tempo).
– Media Description (Descrição de Mídia).
• Cada uma das descrições possui linhas obrigatórias e linhas opcionais de

acordo com a RFC 2327.
80
• Descrição da Sessão.
81
• Descrição da Sessão.
82
• Descrição de Tempo.
83
83
• Descrição da Mídia.
84
84
• Mensagem SDP
85
V=0
Esta linha marca o inicio da descrição do nível de sessão, em que é identificada
a versão do SDP utilizado. O valor padrão é “zero”.
O=anderson 2890844526 2890842807 IN IP4 m34.rio.com.br

Indica o originador da sessão. O primeiro valor apresenta a identificação do
usuário (username). O segundo e o terceiro valor são referentes a identificação
da sessão. O valor seguinte define o tipo de rede (IN – Internet). O próximo valor
define o tipo de endereço utilizado (IP4 – IPv4). Por fim, o último valor apresenta
a origem da sessão, pode ser o nome do domínio DNS, ou o endereço IP de
origem.
85
• Códigos AVP para os CODECs utilizados em uma sessão multimídia.
86
M=audio 30530 RTP/AVP 0 97 101

Esta linha marca o início da descrição do nível de mídia e apresenta as
informações sobre uma das mídias da sessão. O primeiro valor indica o tipo de
mídia (audio, video, application, data ou control). O segundo valor indica a porta
de transporte para a qual a mídia deve ser enviada. O valor seguinte indica o
protocolo de transporte (normalmente RTP). Por fim, os últimos valores indicam
as opções de padrões de CODEC da mídia. A tabela a seguir mostra alguns
CODECs e seus parâmetros.
A=ptime:20
O valor determina que cada pacote terá 20ms de amostra de voz.
86
• ITU-T H.323
87
87
H.323
• Em 1996 a ITU (União Internacional de Telecomunicações) emitiu a
primeira versão para a recomendação H.323.
• A recomendação foi revisada em 1998, e essa última foi a base para os

primeiros sistemas amplamente difundidos de telefonia da Internet.
88
A recomendação H.323 e mais uma avaliação da arquitetura de telefonia da

Internet que um protocolo específico. Ela faz referência a um grande número de
protocolos específicos para codificação de voz, configuração de chamadas,
sinalização, transporte de dados e outras áreas, em vez de especificar
propriamente cada um desses elementos.
88
• A recomendação define a seguinte arquitetura.
– Terminal H.323
– Gatekeeper (porteiro)
– Gateway
89
No centro há um gateway que conecta a Internet a rede de telefonia. Ele se

comunica por meio dos protocolos H.323 no lado da Internet e dos protocolos
PSTN no lado da rede telefônica. O gatekeeper (porteiro) é um dispositivo
semelhante à entidade registradora SIP.
Uma rede de telefonia necessita de vários protocolos. Para começar, existe um

protocolo para codificação e decodificação de voz (G.711). Todos os sistemas
H.323 devem ter suporte para a G.711. No entanto, também são permitidos (mas
não exigidos) outros protocolos de compactação de voz.
89
Gatekeeper
• Dentre as principais serviços providos pelo gatekeeper estão:
– Tradução de Endereços
• Permite o uso local de esquemas de endereçamento proprietários
(chamados de apelidos H.323), tais como mnemônicos, nicknames,
ou endereços de e-mail.
• O Gatekeeper traduz estes endereços em endereços IP, que são

necessários para o estabelecimento das comunicações H.323.
• Este processo pode ser feito através de uma tabela de translação,

que é atualizada através de mensagens de registro.
90
90
Gatekeeper
• Controle de Admissões
• Controla o estabelecimento de chamadas entre terminais H.323,
gateways, e outros dispositivos não-H.323 (através do gateway).
• A admissão de uma chamada pode ser autorizada ou negada pelo
gatekeeper baseada em diversas métricas de admissão, como por
exemplo: endereços de fonte ou destino, largura de banda
disponível, etc.
• Controle de Largura de Banda

• Através da sinalização H.225, pode rejeitar chamadas de um
terminal devido a limitações de largura de banda.
• O critério usado para determinar se a largura de banda disponível é
suficiente para atender uma chamada entrante não é definido pela
recomendação H.323.
91
91
Gatekeeper
• Sinalização de Chamada
• Atua como um proxy de sinalização de chamada entre os terminais

ou gateways sob sua responsabilidade, aliviando-os da necessidade
de suportar o protocolo de controle da chamada.
• Após a admissão de uma chamada, o gatekeeper coloca os dois

terminais em contato para que eles troquem mensagens de
sinalização diretamente.
92
92
Gateway
• O Gateway é um dispositivo de adaptação entre terminais H.323 e
terminais não-H.323.
• Pode ser omitido da rede se não houver interconexão com a rede telefônica
tradicional.
• Principais Funções:
– Translação entre formatos de áudio, vídeo e dados.
– Estabelecimento de chamadas do lado da rede telefônica tradicional e
do lado da rede IP.
93
93
• O padrão H.323 é uma especificação “guarda-chuva” que inclui as
seguintes especificações.
– H.245 – Especificação para o modo como os terminais negociam

codificações comuns de áudio/vídeo.
– RTP/RTCP – Especificações de transporte e controle de mídia.
– Q.931 – Especificação para o modo como telefones IP se comunicam

por meio do gateway com os telefones comuns na PSTN.
– H.225 – Especificação para o modo como os terminais se comunicam

com seus respectivos gatekeepers.
94
Tendo em vista que são possíveis diversos algoritmos de compactação, é

necessário um protocolo para permitir que os terminais negociem o algoritmo
que vão usar. Esse protocolo e chamado H.245. Ele também negocia outros
aspectos da conexão, como a taxa de bits. O RTCP e necessário para controlar
os canais do RTP. Também e preciso um protocolo para estabelecer e encerrar
conexões, fornecer tons de discagem, gerar tons de chamada e o restante da
telefonia padrão. A recomendação ITU Q.931 é responsável por isso.
94
• Pilha de especificação do padrão H.323
95
Os terminais precisam de um protocolo para se comunicar com o gatekeeper (se

presente). Para esse propósito, é usado o H.225. O canal do PC para o
gatekeeper é chamado canal RAS (Registration/Admission/Status). Esse canal
permite que os terminais solicitem largura de banda e forneçam atualizações de
status. Por fim, é necessário um protocolo para a transmissão de dados reais. O
RTP é usado para esse propósito.
95
IP phone Gatekeeper Gateway Telefone fixo
H.225 Descoberta de gatekeeper
H.225 Resposta (IP gate)
H.225 Registro (RAS)
Para que o Gate limite o

H.225 Solicitação de banda
número de chamadas
H.225 Resposta solicitação
Fixo - Número do telefone

Q.931 SETUP IP - Endereço IP.
Q.931 CALL PROCEEDING
SETUP
Procedimento de chamada
Tom de chamada SS#7

Q.931 ALERT
Atendimento
Q.931 CONNECT
Negociação de parâmetros
H.245 Negociação de parâmetros (CODEC)
(CODEC)
RTP Fluxo RTP (IP) Fluxo de Voz (PSTN)
Desligamento
Q.931 DISCONNECT
H.225 Liberação de banda
H.225 Resposta solicitação

96
• REDES CONVERGENTES
– REDES NGN (Next Generation Network)
97
• O conceito NGN (Next Generation Network) está relacionado a uma ideia
bastante simples: transportar toda a informação que corre pela rede em
pacotes digitais que utilizam o protocolo IP.
– Conversas telefônicas.
– Vídeo.
– E-mails.
– Etc..
98
• A rede NGN disponibiliza uma plataforma comum para transporte de
áudio, vídeo e dados.
99
Em suma, a NGN parece ter vindo para concretizar o velho sonho das
telecomunicações e áreas afins em disponibilizar uma plataforma de transporte
comum para vídeo, voz, dados, permitindo aplicações do tipo telefonia IP,
acesso a Web através de telefones móveis, e outras aplicações bastante
interessantes.
99
Conceito NGN
• Antes das redes NGN

• Redes dedicadas
• Serviços dedicados
• Conceito de redes NGN

• Rede convergente
• Novos e diferenciados serviços
integrados de comunicações
100
Arquitetura NGN
• A arquitetura NGN é normalmente dividida em três camadas:
– camada de serviço.
– camada de controle.
– camada de acesso.
101
Na camada de acesso encontram-se as unidades de acesso de assinante, como

os telefones IP, além de comutadores, roteadores e Media Gateways. A camada
de controle é responsável pelo encaminhamento, supervisão e liberação das
ligações que trafegam pela rede IP. É uma parte estratégica da rede onde fica o
equipamento chamado Media Gateway Controller (MGC) ou Softswitch (SS) que
é a inteligência da rede. O SS tem a função de interpretar os números discados
pelo assinante, acompanhar e controlar o estabelecimento da chamada, além de
deter tarefas relacionadas à tarifação. A camada de serviço É o grande
diferencial e atrativo da NGN. Os softwares irão permitir às operadoras a oferta
de novos e múltiplos serviços aos usuários.
101
SoftSwitch
• O SoftSwitch (SS) executa funções de estabelecimento e finalização de

sessões na rede IP.
• Mantém o estado de todas as chamadas e dos recursos alocados para elas.
• Até o final de uma chamada o SS também coleta informações para
bilhetagem.
• Protocolos de controle de MGW (Media Gateway).
– MGCP (Media Gateway Control Protocol).

– MEGACO (H.248).
102
No caso de um cliente IP, o SS irá usar o SIP ou o H.323 para estabelecer a

chamada e alocar os recursos e serviços necessários. O MGC também fará a
tradução entre o H.323 e SIP para a interconexão de clientes com diferentes
protocolos.
102
Media Gateway (MGW)
• O Media Gateway faz a adaptação da mídia entre redes. Onde, uma das
mídias é presumível ser pacotes do tipo IP.
• Mantém a informação de todos os recursos e, em caso de links ocupados

ele assegura o tratamento apropriado de gerenciamento para cada situação.
• Até o encerramento de uma chamada o Media Gateway provê ao MGC

informações do QoS para fins de bilhetagem.
103
O Media Gateway poderá terminar uma conexão de circuitos (linhas troncos,

loops) e transformar em pacotes o stream de voz se a chamada ainda não
estiver nesse estado. O Media Gateway realiza conexões ponto-a-ponto e
conferências, e suporta funções como conversão da mídia, alocação de recursos
(incluindo reserva de banda) e notificações de eventos.
103
• Protocolos usados em uma NGN.
– SIP – Session Initiation Protocol (RFC 3261)

• Inicialização, controle e finalização de sessão multimídia.
– SDP – Session Description Protocol (RFC 2327)
• Descrição de mídia (CODEC utilizado, porta UDP, etc.)
– H.248 (Megaco) (RFC 3525) ou (ITU-T H.248.1)
• Protocolo de controle de Gateway
– RTP – Real-Time Transport Protocol (RFC 3550)
• Transporte de Mídia
– RTCP – Real-Time Transport Control Protocol (RFC 3550)
• Controle de qualidade de transporte de mídia (Jitter, perda de
pacotes, etc.)
104
• Pilha de protocolos.
105
OBRIGADO.
INATEL – Instituto Nacional de Telecomunicações

Av. João de Camargo, 510
Santa Rita do Sapucai - MG
Tel: (35) 3471-9330
106

01 - Redes Multimídia

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

01 - Redes Multimídia

Enviado por

Direitos autorais:

Formatos disponíveis

TP - 121

Prof. MSc. Guilherme Pedro Aquino

INATEL – Instituto Nacional de Telecomunicações

• Um exemplo de resenha crítica está na pasta compartilhada no DropBox.

• Escala de atribuições de conceitos.

• Assuntos para resenha crítica.

• Capítulo 1: Introdução aos Sistemas Multimídia.

• Capítulo 2: Voz sobre IP.

• Capítulo 3: Arquiteturas de redes multimídia.

Estamos testemunhando o desdobramento mundial de aplicações de vídeo e

Mídia é um termo utilizado em comunicação e pode apresentar vários

• As exigências de funcionamento das aplicações multimídia são diferentes

• As aplicações multimídia podem ser classificadas em três grupos distintos:

– Áudio e vídeo de fluxo contínuo armazenado (YouTube).

– Áudio e vídeo de fluxo contínuo ao vivo (TV ou Rádio via IP).

– Áudio e vídeo interativos em tempo real (VoIP).

• Áudio e vídeo de fluxo contínuo e armazenado.

– Mídia armazenada: O conteúdo multimídia foi pré-gravado e está

– Fluxo contínuo (streaming): Enquanto o usuário reproduz o conteúdo, o

– Reprodução contínua: Os dados devem ser recebidos do servidor a

• Áudio e vídeo de fluxo contínuo ao vivo.

– Esta aplicação é semelhante à transmissão tradicional de sinais de rádio

• Áudio e vídeo interativos em tempo real.

– Essa classe de aplicação permite que pessoas usem áudio/vídeo para se

– REDES DE COMUTAÇÃO DE CIRCUITOS.

• As redes de telecomunicações podem ser classificadas quanto ao tipo de

– Comutação de circuitos – Redes de telefonia convencional.

– Comutação de pacote – Redes de computadores.

As redes de telecomunicações podem ser classificadas sob diversos aspectos.

• Redes de comutação de circuitos.

Na fase de estabelecimento do circuito, o assinante chamador deve informar à

O estabelecimento do circuito é feito através de mensagens enviadas entre os

Após o estabelecimento do circuito, tem-se início a fase da conversação. Nesta

A fase de encerramento do circuito acontece ao fim da comunicação. Esta fase

O tempo de estabelecimento do circuito (∆t S ) depende do atraso de propagação,

O tempo de conversação ( ∆tC ) é definido pelos assinantes. Trata-se do tempo

Pode-se deduzir que as principais vantagens da comutação de circuito são: (i) a

Como desvantagens da comutação de circuitos, pode-se citar: (i) existirá um

• Redes de comutação de pacotes.

Não é intuito deste material esgotar o assunto sobre comutação de pacotes. Na

A primeira diferença da comutação de pacotes em relação à comutação de

Como não existe um caminho pré-estabelecido entre o remetente e o

Basicamente, existem quatro tipos de atrasos que um pacote pode sofrer em

Atraso de processamento ( ∆t proc ) – trata-se do tempo requerido

Atraso de fila ( ∆t F ) – trata-se do atraso que um pacote sofre

Atraso de transmissão ( ∆tTx ) – trata-se da quantidade de tempo

Atraso de propagação ( ∆t P ) – é o tempo necessário para propagar

O atraso total experimentado por um pacote é igual a soma de todos os atrasos

Figura 3 – Análise de atraso variável na rede de comutação de pacotes.

Diante disso, pode-se concluir que a rede de comutação de pacote não é

Este tipo de rede possui as seguintes características. Os canais de dados são

De maneira geral, a Tabela 1 é uma tentativa de estabelecer uma comparação

Como trafegar voz e vídeo em uma rede de comutação de pacotes?

Figura 4 – Modo circuito virtual.

É extremamente recomendável que seja feita a leitura do Capítulo 5 da

Os serviços de datagrama tratam cada pacote como uma mensagem

Essa capacidade permite que os roteadores ignorem os segmentos ocupados e

Como cada pacote é tratado de forma independente e, cada pacote pode

Circuito Virtual significa que a rede se comporta como um circuito físico

Comparando as duas tecnologias observamos que o circuito virtual garante que

O projeto de aplicações multimídia seria certamente menos complicado se

Atraso fim-a-fim – É o acumulo de atrasos de processamento, transmissão e de

É interessante salientar que a perda de pacotes não é necessariamente tão

• Tabela comparativa de aplicações multimídia.