Você está na página 1de 12

1.

PROTOCOLO DE SINALIZAÇÃO SIP

O Protocolo de Iniciação de Sessão (Session Initiation Protocol - SIP) é um protocolo de aplicação,


que utiliza o modelo “requisição-resposta”, similar ao HTTP, para iniciar sessões de comunicação
interativa entre utilizadores. O SIP é o protocolo de sinalização recomendado pela IETF para
estabelecimento de sessões de comunicação mais utilizado hoje nas redes IP. Ele não é apenas
utilizado para estabelecer sessões de VoIP, mas uma diversidade de aplicações exigindo o conceito
de sessão (como, conferência, jogos on-line, TV sobre IP e outros).
1.1.Principais características do SIP
 Simplicidade
 Extensibilidade
 Escalabilidade
 Conferência multiponto
 Suporte a multicast

1.2 Componentes do SIP


 User Agents : São os dispositivos de usuário final como telefones celulares, PDAs,
PCs, etc. usados para criar a administrar sessões SIP. O User Agent Client inicia a
mensagem e o User Agent Server a responde.
 Registrar Servers: São bases de dados que contém as locações de todos os User Agents
em um domínio. Esses servidores resgatam e enviam endereços IP e outras informações
pertinentes dos participantes para os Proxy Servers.
 Proxy Servers: Aceitam requisições de sessão feitas por uma UA e consultam o
Registrar Server para obter as informações de endereçamento do UA de destino. Ele
então encaminha o convite de sessão diretamente para o UA de destino se este estiver
no mesmo domínio ou para outro Proxy Server se estiver em outro domínio
 Redirect Servers : Permite aos Proxy Servers direcionarem os convites de sessão SIP
para domínios externos. Os Redirect Servers podem residir no mesmo hardware que os
Proxy Servers e os Registrar Servers.
O SIP define dois tipos de mensagens: REQUEST e RESPONSE. As mensagens REQUEST
podem ter vários métodos (Method), e cada método representa uma ação requerida, conforme os
exemplos apresentados a seguir:

 REGISTER: uma mensagem com este método envia informações sobre identificação e
localização do usuário;
 INVITE: este método é utilizado quando se deseja convidar um novo participante para
uma sessão já existente ou para uma nova sessão;
 BYE: método utilizado para encerrar a participação numa sessão;
 ACK: Uma mensagem com este método é enviada por um usuário que mandou um
INVITE para avisar que uma mensagem do tipo RESPONSE foi recebida. Portanto, para
toda mensagem com um ACK deve existir uma mensagem anterior com INVITE.

2. SINALIZACAO H.323
O padrão H.323 fornece uma fundação para transmissões de dados, áudio e vídeo através de redes
IP, incluindo a Internet. Ao seguir as regras do H.323, os produtos e as aplicações de multimídia
dos múltiplos fabricantes podem operar entre si, permitindo que os usuários comuniquem-se sem
se preocupar com a compatibilidade.

O H.323 também endereça controle de chamadas, gerência de multimídia, e gerência de largura de


banda, assim como a interface entre LANs e outras redes.

O H.323 ajusta padrões para as infra-estruturas de multimídia existentes (isto é redes IP). Projetado
para compensar o efeito da latência altamente variável das LANs, o H.323 permite que os clientes
usem aplicações de multimídia sem mudar sua infra-estrutura de rede.

Por fornecer interoperabilidade entre dispositivos, aplicações, fabricantes, ele é de grande valia
para os usuários de equipamentos que necessitam de certas aplicações.

Os PCs estão se tornando plataformas mais e mais poderosas de multimídia devido a processadores
mais rápidos, a instruções avançadas, e a poderosos chips aceleradores de multimídia. Com o
H.323 o fluxo da rede pode ser controlado, isto é, o gerente de rede pode restringir a quantidade
de largura de banda da rede disponível para conferências. A sustentação do multicast reduz
também exigências da largura de banda.
O H.323 tem a sustentação de muitas companhias e organizações de comunicações, incluindo Intel,
Microsoft, Cisco, e IBM. Os esforços destas companhias gerarão um nível mais elevado da
consciência no mercado.

2.1.Principais características:
 Padronização de codecs: O H.323 estabelece padrões para a compressão e o
descompressão de streams de dados de áudio e vídeo, assegurando-se de que o
equipamentos de fabricantes diferentes tenham alguma área de sustentação comum.
 Interoperabilidade: Os usuários querem se comunicar sem se preocupar com a
compatibilidade no ponto de recepção. Além de assegurar-se de que o receptor possa
descomprimir a informação, o H.323 estabelece métodos para que os clientes destinatários
informem suas potencialidades ao remetente.
 Independência da rede utilizada: H.323 é projetado funcionar no topo das arquiteturas
de rede comuns. A partir do momento que a tecnologia das redes evolui, e as técnicas de
gerenciamento de largura de banda melhoram, as soluções baseadas em H.323 poderão
tirar proveito destas potencialidades realçadas.
 Independente de plataforma e aplicação: O H.323 não está amarrado a nenhum hardware
ou sistema operacional. As plataformas que seguem as regras do H.323 estarão disponíveis
em muitos tamanhos e formas
 Suporte a conferência multiponto: Embora o H.323 possa suportar conferências de três
ou mais pontos sem requerer uma unidade de controle especializada, as MCUs (multipoint
control units) fornecem uma arquitetura mais poderosa e mais flexível para hospedar
conferências multiponto.
 Administração de banda utilizada: O tráfego de áudio e vídeo é intenso e poderia obstruir
a rede corporativa. O H.323 dirige-se a este assunto fornecendo a gerência da largura de
banda. Os gerentes de rede podem limitar o número das conexões H.323 simultâneas dentro
de sua rede ou a quantidade de largura de banda disponível às aplicações H.323. Estes
limites asseguram que o tráfego crítico não seja ultrapassado
 Suporte a multicast: O H.323 suporta o transporte do multicast em conferências
multiponto. O multicast emite um único pacote a um subconjunto de destinos na rede sem
repetição. Em contraste, no unicast emite múltiplas transmissões ponto-a-ponto, quando o
broadcast emite a todos os destinos. No unicast ou no brodcast, a rede é usada sem
eficiência por os pacotes serem replicados por toda a rede. A transmissão multicast usa a
largura da banda mais eficientemente desde que todas as estações no grupo do multicast
leiam um único stream de dados.
 Flexibilidade: Uma conferência H.323 pode incluir destinatários com potencialidades
diferentes. Por exemplo, um terminal com potencialidades de áudio somente pode
participar em uma conferência com terminais que têm potencialidades do vídeo e/ou dos
dados.
2.2.Componentes da Arquitectura H.323
A organizacao logica tipica de um sistema baseado no H.323 e: Terminais, Gateways,
Gatekeepers e MCUs. Os tres primeiros são chamados de pontos finais e eles podem
coexistir em um mesmo equipamento.
 Terminais: São os clientes que provém comunicação bi-direcional em tempo real com
outros terminais H.323, gateways ou MCUs; Essa comunicação pode consistir apenas de
voz, voz e dados, voz e vídeo, ou voz, vídeo e dados.
 Gateways: São tradutores entre terminais H.323 e outros tipos de terminais; Podem
traduzir:
1. Formatos de transmissão (ex.: H.225.0 para H.221)

2. Procedimentos de comunicação (ex.: H.245 para H.242)

3. Codecs de áudio e video

 Gatekeepers: É o componente mais importante em um ambiente H.323; Atua como ponto


central para chamadas efetuadas dentro de uma zona; Zona: conjunto de todos os terminais,
gateways e MCUs administrados por um gatekeeper (zona H.323); Provem serviços de
controle de chamadas
1. Tradução de endereços

2. Administração da largura de banda utilizada

Uma característica opcional mas muito valiosa é a capacidade de rotear chamadas;

Provedores de serviço utilizam essa habilidade para tarifar as chamadas que passem por
suas redes;
As funcionalidades de getekeeper podem ser incorporadas em implementações de
gateways e MCUs;

Funções requeridas:

1. Tradução de endereços

2. Controle de admissões

3. Controle de largura de banda

4. Administração de zona

Funções opcionais:

1. Sinalização de controle de chamada

2. Autorização de chamadas

3. Administração de largura de banda

4. Administração de chamadas

 Multipoint Control Units (MCUs): Os MCUs (Multipoint Control Units) suportam


conferências entre 3 ou mais dispositivos. São constituídos de:
1. Um Multipoint Controller (MC), que é requerido
2. Zero ou mais Multipoint Processors (MP)
O MC manipula negociações H.245 entre todos os terminais para determinar capacidades em
comum;

O MC também controla recursos da conferência determinando qual, se alguma, das streams de


áudio e vídeo usarão multicast;

O MC não lida diretamente com nenhuma das streams de mídia;

É função do MP mixar, chavear e processar bits de áudio, vídeo e dados;

As capacidades de MC e MP podem existir em um componente dedicado ou como parte de outros


componentes H.323.
2.3.Protocolo H.245
H.245 é um protocolo de controlo usado entre dois ou mais pontos terminais, para controle
e sinalizacao. H.245 gere os media streams entre os participantes de sessões H.323;
Estabelece padrões para a comunicação entre terminais, para o processo de controle do
transporte de Voz (transport control). Estas mensagens usam como suporte os pacotes TCP
da rede IP, e são trocadas entre os terminais, GW e MCU’s envolvidos em chamadas do
tipo ponto-a-ponto e ponto-multiponto.
A ordem típica de geração de mensagens é:
1.RAS para obter autorização de um gatekeeper.
2.Callsignalling(Q.931) para estabelecer comunicação com o outro ponto terminal.
3.H.245 para negociar parâmetros referentes ao tipo de media utilizado.
4.Os streams de mensagens circulam nos canais lógicos estabelecidos.
2.4.Protocolo H.248
2.5. Exemplos Padroes de codificadores de audio para sistemas H. 323
Para que os dados multimedia sejam enviados, são usadas técnicas de processamento digital
de sinais para codifica-los. O H. 323 aceita codificação/ decodificação de algoritmos de audio
como G.711 e G.723.1

2.5.1. G. 711
O codec de áudio G.711 é um dos padrões utilizados pelo H.323. O G.711 utiliza PCM para
representar amostras de freqüências de voz, amostrada a 8kHz. Existem dois algoritmos de
compressão neste padrão, o μ-law, usado nos Estados Unidos e Japão, e o A-law, usado em
outros países fora dos EUA. Ambos são logarítmicos, mas o A-law é mais simples para ser
processado. Estes algoritmos codificam amostras PCM de 13bits e 14bits para amostras
logarítmicas de 8bits. Deste modo, o codificador G.711 irá criar uma transmissão de 64kbps
para um sinal amostrado a 8kHz

2.5.2. G.723.1
Este codec é baseado em ADPCM (adapdative differential pulse code) com 24 e 40kbps.

O padrão G.723 opera a taxas de 6,3 e 5,3 kbit/s produzindo níveis de compressão digital da
voz de, respectivamente, 10:1 e 12:1. No processo de codificação este padrão possui um atraso
total de 37,5 ms. Em aplicações sensíveis ao atraso, esse padrão pode não ser o ideal.

3. Exemplos de Gateways

3.1. Gateway Planet VIP (Internet Telephony Gateway 2/4/8 portas)

 Funcinonalidades (dependente do software instalado)

 Configuração baseada na web

 Plano de discagem simples

 Suporta somente H.323

 Não tem modelo de placa de alta densidade E1

 DTMF Relay

3.2.Gateway LineJack (Quicknet)

 Atua em conjunto com o computador

 Em conjunto com software OptnH323

 Não precisa de configuração de IRQ

 No máximo 16 placas no mesmo computador


3.3.Switch Ethernet Alcatel OmniAccess 512

 Gerenciamento de VLANs

 Servico de autenticação

 QoS

 Placas de Alta densidade E1

 Planos de discagem flexíveis

 Fax Relay/Modem Relay/DTMF Relay

3.4. Cisco gateway 2600

 QoS

 DTMF Relay

 Solucoes H.323/SIP

 Placas de Alta densidade E1

 Planos de discagem flexíveis IRV

 Pode actuar como Gatekeeper

 Monitoramento de voz

 Listas de Acesso

 Monitoramento de voz

 Possibilidade de fragmentação

4. Seguranca em VoIP
4.1.SRTP (SECURE REAL-TIME TRANSPORT PROTOCOL)
O SRTP é uma variante do RTP, que pode oferecer confidencialidade, autenticação de
mensagem e proteção contra ataques do tipo repetição para o tráfego RTP, e para o controle
do tráfego RTP, chamado RTCP (Real-time Transport Control Protocol). Como o RTP é
estreitamente relacionado com o RTCP, que é usado para controlar as sessões RTP, o SRTP
também possui um protocolo “irmão” denominado SRTCP (Secure Real-time Transport
Control Protocol). O SRTCP provê para o RTCP as mesmas funcionalidades de segurança que
o SRTP provê para o RTP.

O SRTP oferece algumas melhorias para a segurança da mídia, tais como: confidencialidade
e integridade para RTP/RTCP, criptografando os respectivos campos de carga útil (payload);
possibilidade de atualização das chaves de sessão periodicamente, estrutura que permite
atualizações com novos algoritmos de criptografia; e segurança para aplicações unicast e
multicast.

O SRTP provê um acréscimo na segurança, conforme abaixo:

1. Confidencialidade para RTP e RTCP através da encriptação da carga útil de cada um;
2. Integridade para pacotes inteiros RTP e RTCP, junto com proteção contra ataques de
repetição;
3. Possibilidade de atualizar a chave de sessão periodicamente, o que limita a quantidade de
textos cifrados produzidos por uma chave fixa que podem ficar disponíveis para um
adversário criptoanalisar ;
4. Framework extensível que permite a melhora com novos algoritmos de criptografia ;
5. Derivação de chave da sessão segura com função pseudo-randômica para ambos os fins;
6. Uso de chaves de salto (salting keys) para proteger contra ataques com pré-computação;
7. Segurança para aplicações RTP unicast e multicast.
4.2.TLS
A Segurança da Camada de Transporte — TLS (em inglês, Transport Layer Security) — e o
seu predecessor, o Protocolo de Camada de Sockets Segura — SSL (em inglês, Secure Sockets
Layer) —, são protocolos criptografados que oferecem ao usuário segurança de comunicação
ao acessarem o ambiente virtual, como e-mail (SMTP) e navegação em páginas (http), SIP,
além de outros meios para a transferência de dados.

Os certificados SSL garantem a segurança do usuário ao acessar um site. Ou seja, os dados


enviados são criptografados, como no caso de dados bancários, nomes ou mesmo endereços,
de forma a impossibilitar que outras pessoas possam utilizá-lo indevidamente.
Já o TLS é uma versão mais segura e atualizada do SSL, geralmente, usado como uma
configuração nos programas de e-mail, mas que não menos importante que o SSL, tem seu
papel em qualquer transação entre o cliente e o servidor.

4.3.IPsec
IPsec permite a troca segura de dados na rede, ou camada IP , de entrada. Ele é usado
principalmente para conectar redes privadas virtuais , quando você deve acessar redes de
escritório a partir de computadores domésticos . IPsec usa o modo de túnel para criar um
caminho seguro para transmitir os dados através de uma rede pública . Modo de transporte do
IPsec apenas criptografa o pacote de dados , fazendo com que a transmissão de ser um pouco
mais lento e use mais banda do que os pacotes IP normais.

4.4.S/MIME
Security/ Multipurpose Internet Mail Extension é um padrão especificado pela IETF para
fornecer autenticação, integridade e confidencialidade para protocolos de aplicação como
SMTP e SIP.

O MIME define série de mecanismos para codificar e representar mensagens de formatos


complexos como arquivos multimídia.

O S/MIME é uma versão MIME que incorpora em sua estrutura padrão de criptografia de
chaves públicas a fim de prover segurança para os protocolos de SIP em suas estruturas.

Ė mais flexível que os métodos usando IPsec, TLS e DTLS na proteção ponto-a-ponto.

5. IVR (Interactive Voice Response)


URA, Unidade de Resposta Audível, é um sistema de atendimento automático que
ao receber uma nova chamada telefônica reproduz um menu de opções para o cliente.
O sistema identifica qual foi a opção digitada pelo cliente e direciona sua chamada
para uma Fila Universal ou qualquer outro serviço de atendimento previamente
configurado.
Em sua modalidade mais básica, a URA PCS funciona como um atendedor automático de
telefone, emitindo mensagens institucionais gravadas a cada ligação de entrada, antes
mesmo que seja transferida a um atendente, o que diminui drasticamente a quantidade de
chamadas perdidas.
Funcionalidades

 audiação profissional 24 horas por dia, com encaminhamento de chamadas e correio de


voz.
 Atendimento diferenciado e personalizado com integração de banco de dados e front-end
 Filtro de segurança, que limita o tempo máximo para espera de ligação em fila,
transferências e ausência de mensagens publicitárias (opcional).
 Software Programador IVR, um sistema gerenciador para edição e inserção das
mensagens de voz pelo próprio administrador do sistema na empresa (opcional).
 Aplicativo completo para gestão do volume de ligações da central de atendimento, com
relatórios e estatísticas online de fila de espera, ligações tranferidas, horários de pico,
ociosidade, e muitos outros.
 Integração a bancos de dados para consultas a informações, atualizações cadastrais,
pedidos e solicitações específicas, realizadas pelo próprio cliente.
 Tecnologias de interatividade avançadas, como TTS (text-to-speech), que converte texto
em mensagem de voz, e Reconhecimento de Voz (Voice Recognition), capaz de identificar
termos e frases faladas ao telefone e transformá-las em texto, sendo assim integradas ao
sistema de gestão da empresa (BD) ou encaminhadas para atendimento.

Tipos de URA

A URA – Unidade de Resposta Audível, do inglês IVR – Interactive Voice Response, é um recurso
capaz de aumentar a produtividade e reduzir os custos, melhorando os resultados. Existem diversas
configurações:

 Receptiva: recebe chamadas antes de direcioná-las a um agente. Ex: “Disque 1 para


Administrativo, 2 para Comercial…”;

 Ativa: dispara uma mensagem a diversos contatos. Ex: “Olá! Temos uma oportunidade para você!
Ligue agora mesmo para 84111”;
 Reversa: funciona como a URA ativa, permitindo ao cliente selecionar uma opção para falar com
um humano. Ex: “Olá! Temos uma oportunidade para você! Para saber mais, disque 1 e fale com
um de nossos consultores”;

 de Pesquisa: aparece ao término de uma ligação, solicitando uma avaliação em relação ao


atendimento. Ex: “Disque 1 para ‘ótimo’, 2 para ‘bom’…”;

 TTS (Text to Speech): reproduz um texto para voz, “lendo” parâmetros de um mailing ou banco
de dados;

 ASR (Automatic Speech Recognition): reconhece as palavras ditas em ligação, “conversando”


com o consumidor.

Você também pode gostar