Você está na página 1de 127

Tema 2

Redes Multimedia
(versin 2010-2011)

Rogelio Montaana Departamento de Informtica Universidad de Valencia rogelio.montanana@uv.es http://www.uv.es/~montanan/


Universidad de Valencia Ampliacin Redes 2-1 Rogelio Montaana

Sumario
Fundamentos de telefona. Conversin analgico-digital Audio digital. Estndares. Compresin Vdeo digital. Estndares. Compresin Protocolos RTP y RTCP Calidad de Servicio Videoconferencia. Estndares H.32x Pasarelas e Interoperabilidad Telefona Internet Protocolo SIP

Universidad de Valencia

Ampliacin Redes 2-2

Rogelio Montaana

Espectro acstico de la voz y la msica


Lmite superior de la radio FM Lmite superior de la radio AM Canal telefnico Rango dinmico de la voz Lmite superior del CD-audio

0 dB

MSICA

Potencia relativa

-20 dB

VOZ Rango dinmico de la msica

-40 dB Ruido 300 Hz -60 dB 3,3 KHz

10 Hz

100 Hz

1 KHz

10 KHz

100 KHz

Frecuencia Universidad de Valencia Ampliacin Redes 2-3 Rogelio Montaana

Anchura de canal y distorsin


Distorsin (%)

Al reducir la anchura del canal no solo se reduce el ancho de banda, tambin se reducen los requerimientos de calidad, ya que se tolera una mayor distorsin

20 18 16 Distorsin molesta 14 12 10 8 6 4 2 0 0 3 5 10 15 Ancho de Banda (KHz) Distorsin perceptible

Universidad de Valencia

Ampliacin Redes 2-4

Rogelio Montaana

Diseo de la red telefnica


Hacia 1930 la banda de frecuencias en una comunicacin telefnica era de 300 a 3300 Hz, aproximadamente. Esta limitacin se deba a la necesidad de abaratar los telfonos y los equipos de transmisin. La relacin seal/ruido (lo que se conoce como el rango dinmico) tampoco era demasiado elevada, en torno a 40dB. Se observ que estas condiciones tan pobres eran suficientes para permitir una comunicacin inteligible Cuando, hacia 1960, se empez a implantar la telefona digital el objetivo fue igualar (no mejorar) la calidad que tena la telefona analgica

Universidad de Valencia

Ampliacin Redes 2-5

Rogelio Montaana

Teorema de muestreo de Nyquist (1924)


La digitalizacin de una seal analgica ha de hacerse muestreando al menos al doble de la frecuencia mxima que se pretende capturar. Ejemplos:
Canal telefnico: 3,3 KHz Muestreo 8 KHz Audio HiFi: 20 KHz Muestreo 44,1 KHz

Universidad de Valencia

Ampliacin Redes 2-6

Rogelio Montaana

Conversin analgico-digital: muestreo de la seal


Canal telefnico Ancho de banda 300 a 3.300 Hz

Proceso de muestreo 8.000 muestras/s (captura de 0 a 4 KHz)


Muestras

Seal analgica original


Universidad de Valencia Ampliacin Redes 2-7

Seal muestreada a 8 KHz


Rogelio Montaana

Conversin analgico-digital
Ruido (o error) de cuantizacin Digitalizacin
La seal digital se ha de ajustar a uno de los valores preestablecidos de amplitud El error de cuantizacin depende del nmero de bits por muestra.

Seal muestreada (valores continuos)

La escala de digitalizacin puede ser lineal o logartmica

Seal digital (valores discretos)


Universidad de Valencia Ampliacin Redes 2-8

100100111011001
Rogelio Montaana

Compromiso entre calidad y recursos (costo)


Para digitalizar una seal analgica hay que fijar dos parmetros: Frecuencia de muestreo: cuanto ms alta mayor es el ancho de banda que se captura de la seal analgica Nmero de bits por muestra: cuanto mayor es menor es el error de cuantizacin y mayor la relacin seal/ruido de la seal digital En ambos casos un valor mayor supone una mayor fidelidad en la informacin digitalizada, pero tambin un mayor caudal en los datos generados
Universidad de Valencia Ampliacin Redes 2-9 Rogelio Montaana

Telefona digital G.711 PCM


La digitalizacin de audio para telefona se viene haciendo en la red troncal desde los 1960s, por varias razones fundamentalmente:
Mayor calidad de sonido, especialmente en largas distancias cuando es necesario regenerar la seal Mayores facilidades para multiplexar varias conversaciones

En 1972 la ITU-T estableci el estndar G.711 para la telefona digital, tambin llamado PCM (Pulse Code Modulation) El muestreo se hace con una frecuencia de 8 KHz, es decir una muestra cada 125 s. La amplitud se representa en una escala logartmica utilizando 8 bits por muestra El caudal utilizado es de 64.000 bits por segundo. Este caudal se utiliz despus para el canal B de RDSI (Red Digital de Servicios Integrados) Existen dos variantes de G.711:
G.711 - law: usada en Norteamrica y Japn G.711 A-law: usada en el resto del mundo

Universidad de Valencia

Ampliacin Redes 2-10

Rogelio Montaana

Comunicacin entre telfonos analgicos en una red moderna


Enlace de central final Enlace de central final Bucle de abonado Cdec

Bucle de abonado
Cdec

Enlaces entre centrales de facturacin

Central Telefnica final


Central Telefnica de facturacin

Central Telefnica primaria Central Telefnica de facturacin

Central Telefnica final

Seal Analgica (300-3.400 Hz) Universidad de Valencia

Seal Digital G.711 (64 Kb/s)

Seal Analgica (300-3.400 Hz) Rogelio Montaana

Ampliacin Redes 2-11

Sumario
Fundamentos de telefona. Conversin analgico-digital. Audio digital. Estndares. Compresin Vdeo digital. Estndares. Compresin Protocolos RTP y RTCP Calidad de Servicio Vdeoconferencia. Estndares H.32x Pasarelas e Interoperabilidad Telefona sobre Internet Protocolo SIP

Universidad de Valencia

Ampliacin Redes 2-12

Rogelio Montaana

Audio digital no comprimido


Tipo Frec. de Muestreo (KHz) 8 Ancho de banda (KHz) 4 Bits por muestra 8 log Relacin S/R (dB) 48 Canales Caudal

Sonido telefnico (G.711) CD-DA (Compact Disc Digital Audio) (Linear PCM) DVD-Audio

64 Kb/s (canal B de RDSI) 1,411 Mb/s (CD-ROM 1x) 9,216 Mb/s (capacidad de un DVD)

44,1

22,05

16 lineal

96

192 (mx.)

96

24 lineal (mx.)

144 (mx.)

Universidad de Valencia

Ampliacin Redes 2-13

Rogelio Montaana

Diseo de la alta fidelidad (Hi-Fi)


El diseo de la alta fidelidad se hizo con un criterio maximalista, es decir conseguir una calidad de sonido que abarque todo el rango de frecuencias que puede captar el odo humano (20-20.000 Hz), de forma que resulte indistinguible del original, para su almacenamiento o distribucin Como consecuencia de ello los parmetros elegidos fueron:
Anchura de canal: 20 KHz mnimo Relacin seal/ruido: 90 dB mnimo

Cuando se estandariz el CD-DA el objetivo fue mantener, e incluso mejorar, la calidad que tena la Hi-Fi existente. La disminucin en alguno de los parmetros del CD-DA podra haber dado lugar a una merma perceptible de calidad
Universidad de Valencia Ampliacin Redes 2-14 Rogelio Montaana

Algunos codecs de audio digital


Formato No comprimido PCM (G.711) G.719 SB-ADPCM (G.722) Ancho de banda (KHz) 3,3 20 7 Caudal (Kb/s) 64 32 a 128 48/56/64 Uso Voz Voz y msica Voz

SB-ADPCM (G.722.1)
SB-ADPCM (G.722.1C) Bajo Retardo y, en general, baja calidad (telefona) AMR-WB (G.722.2) MP-MLQ (G.723.1) ADPCM (G.726)

7
14 7 3,3 3,3

16/24/32
24/32/48 12,65-23,85 6,3/5,3 16/24/32/40

Voz y msica
Voz y msica Voz (GSM) Voz Voz

LD-CELP (G.728)
CS-ACELP (G.729A) LPC-10E (FS 1015) MELP (STANAG-4591) ILBC (RFC 3951)

3,3
3,3 3,3 3,3 3,3 22/24 16/22/24 16/22/24 16/22/24 16/22/24 Ampliacin Redes 2-15

16
8 2,4 0,6-2,4 13,33/15,2 705,6/768 192-256 96-128 64 32-44

Voz
Voz Voz Voz Voz Voz y msica Voz y msica Voz y msica Voz y msica Voz y msica Rogelio Montaana

No comprimido Elevado Retardo y alta calidad (msica)

CD-DA / DAT MPEG-1 Layer I MPEG-1 Layer II MPEG-1 Layer III (MP3) MPEG-2 AAC

Universidad de Valencia

Codecs de audio estandarizados


La mayora de los cdecs estandarizados de compresin de audio provienen de dos organismos La ITU-T: son los estndares G.7xx pensados para telefona (voz) aunque algunos son aptos para msica y sonidos diversos. Suelen tener bajo retardo y poco consumo de CPU. La ISO: son los estndares de audio de MPEG pensados para pelculas (por tanto msica y sonidos diversos). Suelen tener elevado retardo y gran consumo de CPU. Generalmente no aptos para telefona.

Universidad de Valencia

Ampliacin Redes 2-16

Rogelio Montaana

Audio digital comprimido


En telefona y videoconferencia se suele utilizar codecs G.xxx (estndares ITU-T) que dan un bajo retardo y una calidad adecuada para la voz, pero no para la msica (excepto algunos como G.719 y G.722) La parte de compresin audio de MPEG (estndares ISO) es ms eficiente (mejor ratio de compresin) y da mayor calidad, pero consume mucha CPU e introduce mucho retardo por lo que no suele emplearse en aplicaciones interactivas Generalmente a ms compresin menor calidad y mayor consumo de CPU.

Universidad de Valencia

Ampliacin Redes 2-17

Rogelio Montaana

Retardo y complejidad de codecs ITU vs ISO


Codec
G.719 MP3 MPEG-4 AAC LD

Ancho de banda
20 kHz 20 kHz 20 kHz

Caudal
64-256 Kbps 64-384 Kbps 24-192 Kbps

Retardo
40 ms 54 ms 20 ms

Complejidad (CPU)
17,7 MIPS > 100 MIPS > 130 MIPS

Universidad de Valencia

Ampliacin Redes 2-

Rogelio Montaana

Comparacin de codecs
La comparacin de calidad de codecs de audio no puede hacerse por tcnicas objetivas. Se suele recurrir a encuestas de opinin puntuando entre 1 y 5, obteniendo lo que se denomina un MOS (Mean Opinion Score) Fuente Simulacin de canal

Limitacin Codec X

El tren es un medio de transporte cmodo.


MOS Calidad voz Nivel de distorsin

5
4 3 2 1

Excelente
Buena Regular Pobre

Imperceptible
Apenas perceptible, no desagradable Perceptible, levemente desagradable Desagradable, pero aceptable

Insatisfactoria Muy desagradable, inaceptable G.711 tiene un MOS de 4,2

Universidad de Valencia

Ampliacin Redes 2-19

Rogelio Montaana

Compresin vs calidad
Caudal (Kb/s)
64 56 48
PCM (G.711)

Normalmente para tener alta compresin con calidad y bajo retardo hay que ejecutar el algoritmo de compresin en hardware, en unos chips llamados DSP (Digital Signal Processor)

40
32 24 16 8 0 0 1 2 3 4 5
LPC 4.8 ADPCM 24 (G.725) ADPCM 16 (G.726) CS-ACELP (G.729a) LDCELP 16 (G.728) CS-ACELP 8 (G.729) MP-MLQ 6,4 (G.723.1) ADPCM 32 (G.726)

MOS (Mean Opinion Score)


Universidad de Valencia Ampliacin Redes 2-20 Rogelio Montaana

Audio MPEG-1
Compresin psicoacstica con prdidas (aprovecha las caractersticas del odo humano). Frecuencias de muestreo entre 8 y 48 KHz. Si se va a utilizar un caudal reducido es conveniente hacer el muestreo a baja frecuencia. Tres capas en orden ascendente de complejidad/calidad. Cada capa incorpora nuevos algoritmos, y engloba los de las anteriores :
Capa I: buena calidad con 192-256 Kbps por canal; no se utiliza Capa II: calidad CD con 96-128 Kbps por canal Capa III: calidad CD con 64 Kbps por canal

El ms utilizado actualmente es Capa III por su mayor eficiencia. Tambin se le conoce como MP3. El caudal puede estar entre 8 y 320 Kb/s
Universidad de Valencia Ampliacin Redes 2-21 Rogelio Montaana

Audio MPEG-2: AAC (Advanced Audio Conding)


Algoritmo de compresin de audio de alta eficiencia y alta calidad incorporado en los estndares MPEG-2 parte 7 y MPEG-4 parte 3. Frecuencias de muestreo de 8 a 192 KHz. Caudales entre 8 y 529 Kb/s Calidad comparable a MP3 con el 50-70% de caudal. Calidad CD streo con 96 Kbps Soporte multicanal (idiomas) y 5.1 (5 canales ms surround). Permite hasta 48 canales simultneos Hay una versin adaptada para bajo retardo, especialmente pensada para telefona (AAC-LD, Low Delay)
Universidad de Valencia Ampliacin Redes 2-22 Rogelio Montaana

Sumario
Fundamentos de telefona. Conversin analgico-digital. Audio digital. Estndares. Compresin Vdeo digital. Estndares. Compresin Protocolos RTP y RTCP Calidad de Servicio Vdeoconferencia. Estndares H.32x Pasarelas e Interoperabilidad Telefona Internet Protocolo SIP

Universidad de Valencia

Ampliacin Redes 2-23

Rogelio Montaana

Seal de vdeo analgica


R (rojo) G (verde) B (azul) La imagen capturada se descompone en tres seales que corresponden a los colores primarios. A partir de ellos se puede reconstruir cualquier color

Filtros R Divisor Lente

Escaneador rasterizador
amplitud tiempo amplitud amplitud

G
B

tiempo
tiempo

Universidad de Valencia

Ampliacin Redes 2-24

Rogelio Montaana

Fundamentos de la TV en color
Las seales R-G-B obtenidas se transforman en otras tres, una de luminancia (Y) y dos de crominancia (U y V). Esta conversin se hace:
Para mantener la compatibilidad con televisin en blanco y negro (en ese caso se ignora la crominancia) Para dar ms ancho de banda a la luminancia, ya que el ojo es menos sensible a la crominancia

En el sistema PAL (europeo) la transformacin se realiza aplicando las siguientes frmulas:


Y (Luminancia) = 0,30 R + 0,59 G + 0,11 B U (Crominancia) = 0,493 (B - Y) = -0,15 R - 0,29 G + 0,44 B V (Crominancia) = 0,877 (R - Y) = 0,62 R - 0,52 G - 0,10 B

Universidad de Valencia

Ampliacin Redes 2-25

Rogelio Montaana

Funcionamiento de la TV en color
Matriz Inversa R G B TV Color

R G B

Circuito Matricial

U V

Modulador Modulador

Mezclador

El modulador traslada las seales U y V a frecuencias superiores, para que no se solapen con la luminancia

Filtro

TV Blanco y Negro
Universidad de Valencia Ampliacin Redes 2-26 Rogelio Montaana

Vdeo digital no comprimido


El formato de vdeo digital utilizado como referencia en estudios de TV es el estndar ITU-R CCIR-601, tambin llamado D1. En CCIR-601 (y en otros formatos digitales) las componentes de crominancia se denominan Cr y Cb (en vez de U y V) En CCIR-601 PAL la parte de luminancia de cada fotograma se representa como una imagen de 720x576 pxels. Las de crominancia con 360x576:
Luminancia (Y): 720(h) x 576(v) x 8 bits x 25 fps = 82,944 Mb/s Crominancia (Cr ): 360(h) x 576(v) x 8 bits x 25 fps = 41,472 Mb/s Crominancia (Cb): 360(h) x 576(v) x 8 bits x 25 fps = 41,472 Mb/s

Caudal total: 82,944 + 41,472 + 41,472 = 165,888 Mb/s


Universidad de Valencia Ampliacin Redes 2-27 Rogelio Montaana

Submuestreo
La reduccin de la resolucin en las componentes de crominancia se denomina submuestreo (equivalente a reducir la frecuencia de muestreo al digitalizar una onda) El submuestreo se basa en la menor sensibilidad del ojo humano a la crominancia. El submuestreo de CCIR-601, llamado 4:2:2, reduce la informacin de crominancia a la mitad. Sin submuestreo el caudal total sera 248,832 Mb/s. La informacin de crominancia puede reducirse an ms aplicando submuestreo 4:1:1 4:2:0. Esto degrada un poco la calidad de color, pero la diferencia respecto a 4:2:2 es pequea y slo suele ser percibida por profesionales o en situaciones extremas.
Universidad de Valencia Ampliacin Redes 2-28 Rogelio Montaana

Submuestreo 4:2:2
720 720 360 576 576 576

8 bits

G B

Y
Cr Cb

Luminancia 4 Crominancia 2+2


Universidad de Valencia Ampliacin Redes 2-29 Rogelio Montaana

Submuestreo 4:1:1
720 720 180 576 576 576 R

G
B

Y Cr Cb

Luminancia 4 Crominancia 1+1

Universidad de Valencia

Ampliacin Redes 2-30

Rogelio Montaana

Submuestreo 4:2:0
720 720 360 576 576 288

Cr
R Y B Cb

Luminancia 4 Crominancia 2+0


Universidad de Valencia Ampliacin Redes 2-31 Rogelio Montaana

Caudales de video digital en diferentes calidades (a 25 fps)


Calidad CIF (VHS) SD (CCIR-601) HD 720p HD 1080p Dig. cinema 2K Dig. cinema 4K Submuestreo 4.1:1 4:2:2 4:2:2 4:2:2 4:4:4 4:4:4 Bits/ pixel 12 16 16 16 36 36 Resolucin 352 x 288 720 x 576 1280 x 720 1920 x 1080 2048 x 1080 4096 x 2160 Caudal no compr. 30 Mb/s 166 Mb/s 369 Mb/s 829 Mb/s 3822 Mb/s 7644 Mb/s Caudal compr. 56-256 Kb/s 256-512 Kb/s 1-2 Mb/s 2-4 Mb/s 100 Mb/s 200 Mb/s

Conclusin: La compresin en vdeo digital es una necesidad


Universidad de Valencia Ampliacin Redes 2-32 Rogelio Montaana

Compresin de vdeo
Para la compresin de vdeo se aplican dos tcnicas:
Compresin espacial o intraframe: se aprovecha la redundancia de informacin que hay en la imagen de cada fotograma, como en la imgenes JPEG Compresin temporal o interframe: se aprovecha la redundancia de informacin que hay entre fotogramas consecutivos.

La compresin temporal siempre lleva implcita la espacial La compresin temporal aumenta el consumo de CPU, pero mejora la eficiencia
Universidad de Valencia Ampliacin Redes 2-33 Rogelio Montaana

Compresin espacial de vdeo


Consiste en la compresin de cada fotograma de forma independiente. Permiten la edicin no lineal (edicin independiente de cada fotograma):
M-JPEG: los fotogramas se comprimen con JPEG. Usado en las cmaras DV (25 Mb/s). No es un estndar M-JPEG2000: los fotogramas se comprimen con JPEG2000. Usado en vdeo de muy alta resolucin (digital cinema). Forma parte del estndar ISO JPEG2000 (parte 3)

Generalmente en estos casos el audio se registra como LPCM (Linear Pulse Code Modulation, calidad CD sin compresin)
Universidad de Valencia Ampliacin Redes 2-34 Rogelio Montaana

Compresin temporal
Se definen tres tipos de fotogramas: I (Intra): autocontenidos, solo compresin espacial (como JPEG) P (Predictive): referido al P/I anterior. Compresin temporal por extrapolacin mediante macrobloques. Un macrobloque pueden ser: Inalterado: no modificado respecto al fotograma de referencia Desplazado: (p. ej. un baln en movimiento) se describe por un vector de movimiento y eventualmente una correccin (diferencia respecto al original) Nuevo: (p. ej. lo que aparece detrs de una puerta que se abre) se describe partiendo de cero por compresin espacial (como un fotograma I) B (Bidireccional): compresin temporal con interpolacin; referido al P/I anterior y al P/I posterior. Mxima compresin, mxima complejidad de clculo. Suaviza la imagen, reduce el ruido.
Universidad de Valencia Ampliacin Redes 2-35 Rogelio Montaana

Compresin temporal
Para detectar la redundancia de informacin los algoritmos de compresin temporal dividen la imagen de cada fotograma en una cuadrcula de macrobloques Cada macrobloque est formado por un cuadrado de 8x8 16x16 pxels. Por eso a veces cuando se pierden paquetes la imagen se ve cuadriculada. El tamao de un fotograma (especialmente P B) puede variar mucho en funcin de la cantidad de informacin que deba incluir respecto al fotograma anterior Los fotogramas B al ser una interpolacin del fotograma anterior y posterior aumentan la complejidad de clculo y la latencia
Ampliacin Redes 2-36 Universidad de Valencia Rogelio Montaana

Caudal de una vdeoconferencia


Caudal medio: 384 Kb/s Resolucin: 352 x 288 x 30 fps

Caudal instantneo

Fotograma I 600 Kb/s

Fotograma I

300 Kb/s

Fotogramas P y B (mayor compresin)

0 Kb/s 0 ms
Universidad de Valencia

Tiempo
400 ms

100 ms

200 ms
Ampliacin Redes 2-37

300 ms

Rogelio Montaana

Estndares de compresin de vdeo


Los estndares de compresin de vdeo se llevan a cabo en el seno de dos grupos de trabajo: El MPEG (Moving Pictures Expert Group) de la ISO: sus estndares se denominan MPEG-n (n = 1,2,4,7). Abarcan la compresin de audio y video El VCEG (Video Coding Experts Group) de la ITU-T: sus estndares se denominan H.26x (x = 1,3,4,5). Solo abarcan la compresin de video, la de audio se hace segn los estndares de telefona (G.xxx) Los algoritmos bsicos son los mismos y en muchos casos pueden utilizar los mismos los ASICs (mismos chips)

Universidad de Valencia

Ampliacin Redes 2-38

Rogelio Montaana

Estndares de compresin de vdeo


H.120 (1984-1988)
H.261 (1990+) ITU-T (VCEG) H.263 (1995-2000+)

ISO (MPEG)

MPEG-2 H.262 (1994/95-1998+)

MPEG-4 part 10 (H.264 AVC) (2003-2006) JPEG 2000 Part 3 (M-JPEG 2000) (2001)

HEVC (2009)

MPEG-1 (1993)

MPEG-4 Part -2 (1998-2001+)

1990

1992

1994

1996

1998

2000

2002

2004

2006

2008

2010

Universidad de Valencia

Ampliacin Redes 2-39

Rogelio Montaana

MPEG 1 y 2
MPEG-1 Orientado a vdeo en CD-ROM (vdeo progresivo) Objetivo: Calidad VHS. Caudal tpico 1,5 Mb/s til para teleenseanza, aplicaciones de empresa, negocios, etc. MPEG-2 Extensin compatible de MPEG-1 hacia arriba (mayor calidad) Orientado a TV digital (vdeo entrelazado) calidad SD (broadcast) tambin HD. Caudales de 4 a 100 Mb/s. til para un rango amplio de aplicaciones mediante diferentes niveles (calidades) y perfiles (algoritmos) Es el ms utilizado hoy en da (TV digital, DVDs, cmaras digitales)
Universidad de Valencia Ampliacin Redes 2-40 Rogelio Montaana

Niveles y perfiles en MPEG-2


Nivel Bajo Principal Alto-1440 Alto Resolucin max. 352 x 288 720 x 576 1440 x 1152 1920 x 1152 Calidad MPEG-1 (CIF, VHS) SD (Broadcast o CCIR-601) HD 4:3 HD 16:9

Perfil Simple Principal SNR

Finalidad Solo fotogramas I y P (para codecs de bajo costo) El ms utilizado Alta calidad, escalable

Espacial
Alto
Universidad de Valencia

Para video tridimensional


Permite submuestreo 4:2:2 (adems del 4:2:0)
Ampliacin Redes 2-41 Rogelio Montaana

Combinaciones permitidas de niveles/perfiles en MPEG-2 y caudales mximos


Perfiles Simple Principal SNR Espacial Alto

Submuestreo
Alto 1920 x 1152 (HDTV 16:9) Alto-1440 1440 x 1152 (HDTV 4:3) Principal 720 x 576 (CCIR 601) Bajo 352 x 288 (MPEG1)

4:2:0
No

4:2:0
80 Mb/s

4:2:0
No

4:2:0
No

4:2:0/2
100 Mb/s

No

60 Mb/s

No

60 Mb/s

80 Mb/s

Niveles

15 Mb/s

15 Mb/s

15 Mb/s

No

50 Mb/s

No

4 Mb/s

4 Mb/s

No

No

Universidad de Valencia

Ampliacin Redes 2-42

Rogelio Montaana

MPEG 3, 4 y HEVC
MPEG-3: Grupo inicialmente pensado para HD, finalmente disuelto. Objetivo resuelto por reparametrizacin de MPEG-2. MPEG-4: ha aprobado multitud de estndares diferentes denominados partes de los que dos tienen que ver con algoritmos de compresin de video: Parte 2: basado en algoritmos DCT, como MPEG-1 y 2 pero un poco ms eficiente. Resoluciones desde 176 x 144 hasta 1920 x 1080 y caudales desde 64 Kb/s hasta 38 Mb/s. Utilizado en codecs DivX, Xvid y Nero Digital. Parte 10: tambin llamado H.264/AVC (Advanced Video Coding). Calidad comparable a MPEG-2 o MPEG-4 parte 2 con la mitad de caudal. Rango amplio de resoluciones (16 niveles) y algoritmos (14 perfiles). Se usa en algunas emisiones de HDTV y en videoconferencia (H.264) El siguiente estndar en desarrollo es el del grupo denominado HEVC (High Efficiency Video Codec) que es una colaboracin de la ISO y la ITU-T
Universidad de Valencia Ampliacin Redes 2-43 Rogelio Montaana

Estndares de vdeo ITU-T (VCEG)


Desarrollados para videoconferencia: H.120: Histrico, no se usa H.261(1980): desarrollado para RDSI (caudal constante). Poco utilizado actualmente H.262: es el MPEG-2. No se usa en videoconferencia H.263 (1995): Desarrollado para IP (caudal variable) H.264 (2003): Coincide con MPEG-4 Parte 10 HEVC (?): en fase de discusin La videoconferencia generalmente usa un caudal mas bajo que el cine y tiene menos accin (los vectores de movimiento se restringen a +/- 15 pixels) Estos estndares no especifican la compresin de audio. Para ello se emplean los estndares G.xxx
Universidad de Valencia Ampliacin Redes 2-44 Rogelio Montaana

Compresin M-JPEG2000: Digital Cinema


Resoluciones: 2K (2048x1080) y 4K (4096x2160) Caudal de vdeo hasta 250 Mb/s 4K ofrece una calidad superior al cine de 35mm, comparable a una actuacin en directo (lmite del ojo humano) Codificacin intraframe: Motion-JPEG2000 (MJ2, MJP2) Audio: muestreo de 24 bits, PCM a 48 96 kHz sin comprimir. Hasta 16 canales Se est estableciendo un estndar a travs del DCI (Digital Cinema Initiatives) http://www.dcimovies.com/

Universidad de Valencia

Ampliacin Redes 2-45

Rogelio Montaana

Formatos compresin de vdeo


Codec M-JPEG M-JPEG 2000 H.261 MPEG-1 MPEG-2, H.262 Compresin temporal No No Fot. I y P Fot. I, P y B Fot. I, P y B Complejidad Algoritmo * ** ** *** *** Eficiencia * ** **** *** *** Usos Cmaras DV Digital Cinema Videoconf. (antigua) VCD DVD, SDTV, HDTV DivX, Xvid Videoconf. HDTV, videoconf.

MPEG-4 parte 2 H.263 MPEG-4 Parte 10 H.264

Fot. I, P y B Fot. I, P y B Fot. I, P, B y otros

**** **** *****

**** **** *****

Universidad de Valencia

Ampliacin Redes 2-46

Rogelio Montaana

Sumario
Fundamentos de telefona. Conversin analgico-digital. Audio digital. Estndares. Compresin Vdeo digital. Estndares. Compresin Protocolos RTP y RTCP Calidad de Servicio Videoconferencia. Estndares H.32x Pasarelas e Interoperabilidad Telefona Internet Protocolo SIP

Universidad de Valencia

Ampliacin Redes 2-47

Rogelio Montaana

Protocolo de transporte para trfico en tiempo real


TCP presenta dos inconvenientes para trfico en tiempo real:
En caso de reenvo de un paquete (por error o prdida) la copia no llegar normalmente a tiempo de ser reproducida en su sitio El mecanismo de slow-start puede provocar que en caso de reinicio el caudal de la comunicacin sea menor que el mnimo necesario

Por ese motivo normalmente se utiliza UDP El nico caso en que se utiliza TCP para trfico en tiempo real es como truco para cruzar los cortafuegos (que a veces no dejan pasar UDP). En esos casos se suele crear un buffer grande que retrasa la reproduccin 10-30 segundos, de forma que los reenvos s pueden llegar a tiempo y el efecto del slow-start puede compensarse con el contenido del buffer
Universidad de Valencia Ampliacin Redes 2-48 Rogelio Montaana

Caractersticas de UDP
UDP da un servicio best effort (del mejor esfuerzo) a nivel de transporte, igual que lo hace IP a nivel de red. En particular:
UDP no reenva paquetes perdidos UDP no descarta duplicados UDP no garantiza que se respete el orden UDP no realiza control de congestin

Universidad de Valencia

Ampliacin Redes 2-49

Rogelio Montaana

Protocolos RTP y RTCP


Los protocolos RTP (Real Time Protocol) y RTCP (Real Time Control Protocol) complementan UDP cuando se enva trfico en tiempo real Sus funciones son:
Detectar los paquetes perdidos e informar de ello al emisor (el cual normalmente no reenviar esos paquetes) Detectar y descartar duplicados Detectar paquetes que llegan fuera de orden

RTP y RTCP pueden funcionar en unicast y en multicast


Universidad de Valencia

Ampliacin Redes 2-50

Rogelio Montaana

Estructura de un paquete RTP


20
Cabecera IP

12

Variable
Datos (Audio o Video digital)

Cabecera Cabecera UDP RTP

La cabecera RTP incluye:


Tipo de carga til (7 bits)

Con esto el receptor puede:


Identificar si es audio o video y el codec utilizado
Ordenar datagramas recibidos, detectar perdidos Reproducir en el instante adecuado, sincronizar audio y vdeo Distinguir diferentes fuentes originadas por un mismo emisor
Ampliacin Redes 2-51
Rogelio Montaana

Nmero de secuencia (16 bits)

Timestamp (32 bits) Identificador de la fuente (32 bits)


Universidad de Valencia

Algunos valores del campo Tipo de carga til en RTP


Valor Significado

0
9 14

G.711 - law
G.722 MPEG Audio El valor se puede cambiar al vuelo en una transmisin, por ejemplo un audio de G.711 a G.728

15
26 31 32 33

G.728
M-JPEG H.261 MPEG 1 video MPEG 2 video

Universidad de Valencia

Ampliacin Redes 2-52

Rogelio Montaana

Flujos RTP en una videoconferencia


A 25 fps se emite un fotograma cada 40 ms
Un fotograma Un fotograma Un fotograma

Tipo H.261 Seq. 32 TS 955 Ident. 653

Tipo H.261 Seq. 31 TS 955 Ident. 653

Tipo H.261 Tipo H.261 Seq. 30 Seq. 29 TS 635 TS 635 Ident. 653 Ident. 653

Tipo H.261 Tipo H.261 Seq. 28 Seq. 27 TS 315 TS 315 Ident. 653 Ident. 653

Tipo G.722 Seq. 35 TS 955 Ident. 468

Tipo G.711 Seq. 34 TS 315 Ident. 468

Flujo vdeo (ident. 653) Flujo audio (ident. 468)

En este ejemplo cada paquete de audio contiene 80 ms o sea 640 muestras (el audio que corresponde a dos fotogramas)

Universidad de Valencia

Ampliacin Redes 2-53

Rogelio Montaana

Mensajes RTCP
Tipo de mensaje SR (Sender Report) RR (Receiver Report) SDES (Source Description) BYE Enviado por Contenido Emisores Receptores Emisores Emisores y receptores Informacin sobre paquetes enviados y timestamp de sincronizacin Informacin sobre paquetes recibidos, perdidos, jitter y retardo medidos Descripcin de un emisor, p. ej.: nombre, e-mail, telfono, identificacin, etc. Cuando un participante se despide del grupo

Universidad de Valencia

Ampliacin Redes 2-54

Rogelio Montaana

RTCP
Los mensajes RTCP no llevan informacin de audio/vdeo, slo informacin de control. Los mandan tanto emisores como receptores. En una emisin multicast el RTCP convierte a todos los receptores del trfico RTP en emisores del grupo multicast correspondiente (debido al envo de los Receiver Report) En principio una emisin RTP multicast con muchos receptores podra llegar a tener una parte importante de trfico RTCP Para evitarlo el trfico RTCP se limita a un 5% del trfico RTP. De ese 5% el 25% se asigna a los emisores (mensajes SR y SDES) y el 75% restante a los receptores (mensajes RR)
Universidad de Valencia Ampliacin Redes 2-55 Rogelio Montaana

Control de congestin con RTP


El receptor de un flujo RTP informa peridicamente al emisor del nmero de paquetes perdidos El emisor normalmente supondr que la prdida se debe a congestin en la red (como hace TCP) En ese caso la aplicacin puede intentar paliar el problema, por ejemplo pasando a un codec con mas compresin, bajando la resolucin del vdeo o la frecuencia de muestreo del audio RTP y RTCP permiten detectar las situaciones de congestin, pero en ningn caso intentan aplicar medidas correctoras o paliativas. Eso siempre queda al albedro de la aplicacin

Universidad de Valencia

Ampliacin Redes 2-56

Rogelio Montaana

Sumario
Fundamentos de telefona. Conversin analgico-digital. Audio digital. Estndares. Compresin Vdeo digital. Estndares. Compresin Protocolos RTP y RTCP Calidad de servicio Vdeoconferencia. Estndares H.32x Pasarelas e Interoperabilidad Telefona sobre Internet Protocolo SIP

Universidad de Valencia

Ampliacin Redes 2-57

Rogelio Montaana

Redes con calidad de servicio


Desde principios de los 90 se ha experimentado en Internet con diferentes protocolos que permiten priorizar determinado tipo de trfico considerado ms importante o urgente Decimos que las redes que incorporan dichos protocolos ofrecen Calidad de Servicio (QoS, Quality of Service) mientras que las que no lo hacen dan un servicio best effort (del mejor esfuerzo) La realidad es que la mayor parte de la Internet sigue funcionando en modo best effort. Ninguno de los protocolos de Calidad de Servicio se ha extendido de forma significativa Algunos consideran que cuando aparecen problemas de congestin es hoy en da ms sencillo y ms barato ampliar capacidad que implementar QoS
Universidad de Valencia Ampliacin Redes 2-58 Rogelio Montaana

Requisito de las redes multimedia


Las aplicaciones de audio-video en tiempo real han sido tradicionalmente los principales usuarios de redes con QoS, ya que el servicio se degrada rpidamente cuando la red va lenta Los principales factores que influyen en esa degradacin son los siguientes:
Prdida de paquetes Retardo excesivo en la entrega de los paquetes Fluctuacin excesiva en el retardo (Jitter)

Los problemas se pueden deber a congestin en la red o a que simplemente se est inyectando un caudal superior a la capacidad disponible
Universidad de Valencia Ampliacin Redes 2-59 Rogelio Montaana

Multimedia sin QoS


La necesidad de utilizar aplicaciones multimedia en redes sin QoS ha provocado el desarrollo de tcnicas paliativas tales como: Usar grandes bferes en el receptor. Esto solo es posible en aplicaciones no interactivas. Ajustar dinmicamente el ancho de banda utilizado Reconstruir la informacin de los paquetes perdidos a partir de informacin colindante Introducir un canal de comunicacin en paralelo con informacin redundante

Universidad de Valencia

Ampliacin Redes 2-60

Rogelio Montaana

Uso de grandes bferes


El jitter puede compensarse introduciendo un buffer en el receptor que retrase la reproduccin del flujo de audio o vdeo Con un buffer suficientemente grande puede compensarse cualquier jitter, por grande que sea Sin embargo esto puede introducir un retardo inaceptable cuando se trata de una comunicacin interactiva (videoconferencia o telefona) Las mayores exigencias en cuanto a retardo se dan en las aplicaciones de telefona
Universidad de Valencia Ampliacin Redes 2-61 Rogelio Montaana

Compensacin del jitter con un buffer de reproduccin


Paquetes
8 7 6 5 Retardo de paquetizacin 20 ms Retardo de transmisin 140 ms Flujo de audio ILBC de 15,2 Kb/s (1 paquete de 38 bytes cada 20 ms) Reproduccin sin buffer Reproduccin con buffer de 76 bytes (2 paquetes)

Paquetes recibidos demasiado tarde

4 3
2 1

Todos los paquetes llegan a tiempo Llegada Retardo de reproduccin 40 ms

Salida 0 20 40 60

80 100 120 140 160 180 200 220 240 260 280 Ampliacin Redes 2-62

Tiempo (ms)
Rogelio Montaana

Universidad de Valencia

Retardo mximo admisible


La recomendacin G.114 de la ITU-T establece retardos mximos en telefona:
Se considera que un retardo por debajo de 150 ms es imperceptible y permite una buena calidad de comunicacin Entre 150 y 400 ms el retardo se considera perceptible pero tolerable Por encima de 400 ms se considera excesivo e inaceptable

En comunicacin unidireccional (p. ej. conferencias, clases magistrales) se puede tolerar un retardo bastante mayor En aplicaciones donde el receptor no tiene ninguna posibilidad de interaccin (p. ej. emisora de radio por Internet) se genera un retardo de reproduccin de hasta 30 segundos, con lo que se pueden tolerar congestiones momentneas (y se puede funcioanr con TCP sin problemas)
Universidad de Valencia Ampliacin Redes 2-63 Rogelio Montaana

Recomendacin ITU-T G.114


Imperceptible

Perceptible pero tolerable

Intolerable

Universidad de Valencia

Ampliacin Redes 2-64

Rogelio Montaana

Ajuste dinmico del ancho de banda


El receptor puede (mediante RTP) detectar los paquetes perdidos, e informar al emisor de la tasa de prdidas mediante RTCP (Receiver Report) El emisor puede entonces reducir el caudal bajando la calidad (ej. video de 720x576 a 352x288) o pasando a un cdec ms eficiente (de H.263 a H.264), o ambos Peridicamente el emisor debera probar a volver a la situacin inicial por si la saturacin era momentnea
Universidad de Valencia Ampliacin Redes 2-65 Rogelio Montaana

Reconstruir los paquetes perdidos


El receptor puede intentar minimizar el efecto producido por la prdida de un paquete de varias maneras, por ejemplo:
En vdeo se puede reconstruir un macrobloque ausente a partir de los macrobloques vecinos, o de los fotogramas anteriores o posteriores En audio se puede rellenar un hueco extrapolando o interpolando a partir de las muestras de audio anteriores o posteriores
Universidad de Valencia Ampliacin Redes 2-66 Rogelio Montaana

Informacin redundante
Algunos sistemas envan un flujo paralelo con informacin redundante utilizando cdigos correctores FEC (Forward Error Correction). Esto permite al receptor reconstruir los paquetes perdidos sin que el emisor los tenga que reenviar y sin tener que enviar el trfico duplicado Normalmente estos mecanismos se ajustan dinmicamente, de forma que cuando no se pierden paquetes no se enva informacin redundante

Universidad de Valencia

Ampliacin Redes 2-67

Rogelio Montaana

Codec ILBC
Para compensar la poca implantacin de tcnicas QoS en Internet se han desarrollado cdecs resistentes a la prdida de paquetes El codec ILBC (Internet Low Bitrate Codec) ha sido desarrollado por el IETF (RFC 3951) con el objetivo de permitir una calidad aceptable aun en el caso de que produzca la prdida de una cantidad significativa de paquetes ILBC es utilizado por Skype, Google Talk, Yahoo Messenger, Gizmo5, QuteCom y Ekiga
Universidad de Valencia Ampliacin Redes 2-68 Rogelio Montaana

Comparacin de los codecs ILBC, G.729A y G.723.1

Universidad de Valencia

Ampliacin Redes 2-69

Rogelio Montaana

Sumario
Fundamentos de telefona. Conversin analgico-digital. Audio digital. Estndares. Compresin Vdeo digital. Estndares. Compresin Protocolos RTP y RTCP Calidad de Servicio Videoconferencia. Estndares H.32x Pasarelas e Interoperabilidad Telefona Internet Protocolo SIP

Universidad de Valencia

Ampliacin Redes 2-70

Rogelio Montaana

Aplicaciones de audio-vdeo en tiempo real


Aplicacin Audio/Video conferencia (telefona) Audio-Vdeo bajo demanda* Emisin en directo (radio-TV por Internet)
(*)

Sentido Bidirecc.

Retardo tolerable Espectadores 150-400 ms Uno o varios

Multicast Apropiado

Unidirec. Unidirec.

5-10 s 10-30 s

Uno Muchos

No Muy Apropiado

En el audio-vdeo bajo demanda el usuario puede controlar la emisin, de ah el requerimiento de un retardo no excesivo

Universidad de Valencia

Ampliacin Redes 2-71

Rogelio Montaana

Videoconferencia
Comunicacin interactiva por medio de audio y video. Opcionalmente puede haber comparticin de datos Puede ser:
Punto a punto Punto a multipunto Multipunto a multipunto

Universidad de Valencia

Ampliacin Redes 2-72

Rogelio Montaana

Requisitos/Caractersticas de la videoconferencia
Compresin/descompresin en tiempo real Retardo mximo 400 ms. Movilidad reducida Normalmente aceptable audio de calidad telefnica Necesidad de sincronizar audio y vdeo Necesidad de protocolo de sealizacin (servicio orientado a conexin)

Universidad de Valencia

Ampliacin Redes 2-73

Rogelio Montaana

Estndares de Videoconferencia
Los estndares H.32x (x = 0, 1, 2, 3 4) de la ITU-T establecen todo lo relativo a videoconferencia. La x depende del tipo de red utilizada Son estndares paraguas ya que en muchos casos se basan en otros estndares. Por ejemplo G.7xx para el audio, H-26x para el vdeo La serie H de la ITU-T se refiere a sistemas multimedia y audiovisuales.

Universidad de Valencia

Ampliacin Redes 2-74

Rogelio Montaana

Estndares H.320 y H.323

RDSI
Universidad de Valencia Ampliacin Redes 2-75

IP
Rogelio Montaana

Videoconferencia H.320
3*BRI

RDSI

3*BRI

Sistema de grupo o sala

Polycom

Picturetel

Flujo de audio-vdeo 128 - 384 Kb/s

Direccin E.164: 963865420

Direccin E.164: 963983542

Universidad de Valencia

Ampliacin Redes 2-76

Rogelio Montaana

Direcciones E.164
El formato de los nmeros de telfono se establece en el estndar E.164 de la ITU-T Los nmeros pueden tener un mximo de 15 dgitos decimales. Los primeros 1, 2 3 dgitos representan el pas, ej:
1: Norteamrica (Estados Unidos y Canad) 34: Espaa 216: Tnez

La estructura de las direcciones dentro de cada pas es decidida por el pas. Normalmente es de tipo jerrquico con criterio geogrfico
Universidad de Valencia Ampliacin Redes 2-77 Rogelio Montaana

Videoconferencia H.323
10BASE-T

Internet

ADSL

Sistema de sobremesa

Polycom, Tandberg Flujo de audio-vdeo 14,4 - 512 Kb/s

Microsoft Netmeeting, Polycom ViaVideo

Direccin IP: 147.156.1.20

Direccin IP: 172.68.135.22

Universidad de Valencia

Ampliacin Redes 2-78

Rogelio Montaana

Arquitectura terminal H.323


Equipo e/s de vdeo Equipo e/s de audio Datos usuario Aplicaciones T.120, etc.
Codec Video H.26x Retardo trayecto Recepcin (Sync)

RTP RTCP

UDP

Codec Audio G.7xx

Control del sistema Control H.245

Capa H.225 TCP

IP

Interfaz de usuario para control del sistema

H.225.0 Control llamada

H.225.0 Control RAS

UDP

Universidad de Valencia

Ampliacin Redes 2-79

Rogelio Montaana

Terminales de videoconferencia

Polycom ViaVideo Video: H.261, H.263, H.263+ Audio: G.711, G.722, G.728, G.723.1 Caudal: 32-384 Kb/s (H.323) Formatos: CIF, QCIF Peso: 250 g Conexiones ent./sal.: USB, audio Precio: 500 euros Universidad de Valencia

Polycom ViewStation SP128 Video: H.261, H.263+ Audio: G.711, G.722, G.728 Caudal: 56-128 Kb/s (H.320), 56-768 Kb/s (H.323) Formatos: CIF, QCIF Peso: 2,7 Kg Conexiones ent./sal.: video v audio Precio: 5.000 euros Ampliacin Redes 2-80 Rogelio Montaana

Videoconferencia H.323: Gatekeeper


Luis 147.156.3.12 Ext. 5112 Laura 147.156.4.15 Ext. 5113

Internet

Pedro 147.156.1.20 Ext. 5111

Ana 147.156.7.45 Ext. 5114

Solo la parte de audio es obligatoria en un terminal H.323

GK

Direccin E.164 (nmero telfono)

Alias H.323

Direccin IP

5111
5112 5113 5114

Pedro
Luis Laura Ana

147.156.1.20
147.156.3.12 147.156.4.15 147.156.7.45 Rogelio Montaana

Universidad de Valencia

Ampliacin Redes 2-81

Sealizacin H.323
Peticin de admisin Confirmacin de admisin Inicio Conexin

RAS (Registration GK Admission Status) Gatekeeper


H.225 (Q.931)

Terminal H.323

Intercambio de capacidades Apertura de canal lgico ACK de apertura de canal lgico Path Resv Flujo RTP Flujo RTP Flujo RTCP Medio RSVP (opcional) H.245

Terminal H.323

Universidad de Valencia

Ampliacin Redes 2-82

Rogelio Montaana

Sumario
Fundamentos de telefona. Conversin analgico-digital. Audio digital. Estndares. Compresin Vdeo digital. Estndares. Compresin Protocolos RTP y RTCP Calidad de Servicio Videoconferencia. Estndares H.32x Pasarelas e Interoperabilidad Telefona Internet Protocolo SIP

Universidad de Valencia

Ampliacin Redes 2-83

Rogelio Montaana

Elementos de videoconferencia
Terminal: es el equipo que utiliza el usuario para comunicarse Gateway, pasarela o puerta de enlace: interconecta redes diferentes: H.320 (RDSI) e Internet (H.323) Gatekeeper o equipo selector: permite el control de acceso. Realiza la equivalencia de direcciones E.164 o usuarios a direcciones IP MCU, Multipoint Control Unit o Unidad de control multipunto: replica un flujo de audio/video para permitir multiconferencia
Universidad de Valencia Ampliacin Redes 2-84 Rogelio Montaana

Pasarela (Gateway) H.320-H.323


147.156.2.15
Arrancar Netmeetig GW 147.156.2.69 Llamar a 963972386

963972386

ADSL
147.156.2.69 963171500 PRI

BRI

Internet

GW Gateway o puerta de enlace

RDSI

Universidad de Valencia

Ampliacin Redes 2-85

Rogelio Montaana

Funciones Gateway H.323


Interoperabilidad entre audio/vdeo y estndares de red Conversin de protocolo
Procedimientos de comunicacin Formatos de transmisin

Opcionalmente: Transcodificacin (conversin de formatos audio/video)


Universidad de Valencia Ampliacin Redes 2-86 Rogelio Montaana

Gateway/Gatekeeper, llamada entrante


147.156.2.15
Arrancar Netmeeting GK: 158.42.5.96 Usuario: Alicia Nmero de tel.: 60 Llamar a 963171500 ext. 60

963972386

ADSL 147.156.2.69 963171500 BRI

Internet

GW
ext. 60?

PRI

RDSI

60 = 147.156.2.15

158.42.5.96

GK

Gatekeeper o equipo selector

Usuario IP Ext. Alicia 147.156.2.15 60

Universidad de Valencia

Ampliacin Redes 2-87

Rogelio Montaana

Gateway/Gatekeeper, llamada saliente


147.156.2.15
Arrancar Netmeeting GK: 158.42.5.96 Usuario: Alicia Nmero de tel.: 60 Llamar al 963972386

963972386

ADSL 147.156.2.69 963171500

BRI

Internet
Registro

GW

PRI

RDSI

Usar GW 147.156.2.69

158.42.5.96

Gatekeeper

GK
Usuario Alicia IP 147.156.2.15 Ext. 60

Universidad de Valencia

Ampliacin Redes 2-88

Rogelio Montaana

Funcionamiento del gatekeeper


El Gatekeeper puede validar el usuario/password en el momento del registro accediendo a un servidor RADIUS El alias y la direccin E.164 permiten localizar a usuarios que utilicen diversos terminales o en redes que utilicen direcciones IP dinmicas El Gatekeeper facilita el control de uso del servicio, permisos y autorizaciones, paso por cortafuegos, NATs, etc.
Universidad de Valencia Ampliacin Redes 2-89 Rogelio Montaana

Procedimientos de llamada va Gateway/Gatekeeper


Respuesta de voz interactiva (IVR, Interactive Voice Response):
Al marcar se escucha una locucin que dice: si sabe la extensin teclela con un cero delante, si no espere y le atender la operadora.

Extensin por defecto:


Todas las llamadas se encaminan a una extensin determinada.

Llamada directa del exterior (DID, Direct Inward Dialing):


Cada extensin recibe un nmero directo del exterior. Ej.: 96-3863563 llama a la extensin 3563. Requiere obtener nmeros extra del operador, lo cual tiene un costo.

Enrutamiento TCS4:
La extensin se marca detrs del nmero, ej.: 96-386-3500#3563 llama a la extensin 3563. No disponible en Espaa (los nmeros extra se ignoran).
Universidad de Valencia Ampliacin Redes 2-90 Rogelio Montaana

Videoconferencia multipunto H.323

Internet

MCU
MCU H.323 (Multipoint Control Unit)
Replica el flujo de audio/vdeo para cada participante. Posible cuello de botella Universidad de Valencia Ampliacin Redes 2-91 Rogelio Montaana

Transcodificacin
Valencia Bilbao Flujos H.263 de 384 Kb/s 3*BRI 3*BRI

RDSI
BRI
Terminal sin soporte H.263

3*BRI PRI

Flujo H.261 de 128 Kb/s

MCU MCU con transcodificacion


La transcodificacin ha de hacerse en tiempo real y consume mucha CPU Toulouse Atenas Universidad de Valencia Ampliacin Redes 2-92 Rogelio Montaana

Sumario
Fundamentos de telefona. Conversin analgico-digital. Audio digital. Estndares. Compresin Vdeo digital. Estndares. Compresin Protocolos RTP y RTCP Calidad de Servicio Vdeoconferencia. Estndares H.32x Pasarelas e Interoperabilidad Telefona Internet Protocolo SIP

Universidad de Valencia

Ampliacin Redes 2-93

Rogelio Montaana

Telefona sobre Internet


Pretende aprovechar la red IP para la comunicacin telefnica Requiere una red con bajo retardo y QoS, o bien una red sobredimensionada Adems de digitalizar la voz es necesario ofrecer todas las funciones propias de una red telefnica:
Sealizacin (llamada) Funciones avanzadas: reenvo de llamadas, mensajera, etc.
Universidad de Valencia Ampliacin Redes 2-94 Rogelio Montaana

Evolucin de la telefona (I)


Telefona Tradicional

Datos

Voz no comprimida

Centralita telefnica (PBX, Private Branch Exchange)

Lnea E1 (2.048 Kb/s) Par telefnico

Universidad de Valencia

Ampliacin Redes 2-95

Rogelio Montaana

Evolucin de la telefona (II)


Telefona tradicional sobre backbone IP (voz sobre IP)

Voz comprimida Voz y datos

Ethernet Lnea E1 Par telefnico

Universidad de Valencia

Ampliacin Redes 2-96

Rogelio Montaana

Evolucin de la telefona (III)


Telefona IP

Call Manager

Call Manager

Voz comprimida Voz y datos

Ethernet Lnea E1 Par telefnico

Universidad de Valencia

Ampliacin Redes 2-97

Rogelio Montaana

Ejemplo de red de telefona IP


Call Manager

Red Telefnica
Sucursal Antigua Oficina Principal

Internet

Sucursal Moderna Universidad de Valencia Ampliacin Redes 2-98

Teletrabajador Rogelio Montaana

Telefona IP
Ventajas:
+ Integracin de la red de datos y la red telefnica + Reduccin de distancias (y costes) en la red telefnica + Fcil enrutamiento alternativo en caso de averas en la red (servicio no orientado a conexin) + Posibilidad de compresin de la voz (G.729, G.723.1) + Supresin de silencios y generacin de ruido de confort + Servicios de alta calidad (G.722, G.722.1, G.719) + Posibilidad de integrar servicios: directorio telefnico con LDAP, envo de ficheros de audio por e-mail, lectura automtica de emails por telfono, navegacin web asistida, etc.

Inconvenientes
Degradacin de la calidad cuando hay congestin Mayores retardos, posibles problemas de ecos Mayor costo de los telfonos

Universidad de Valencia

Ampliacin Redes 2-99

Rogelio Montaana

LAN con telefona IP


WAN con QoS (DiffServ o IntServ)
Call Manager (Gestor de telefona IP) (Servidor Windows/XP)

Tramas H.323 con alta prioridad (802.1p)

Las tramas del telfono van en una VLAN de alta prioridad (se usa 802.1p y 802.1Q)

Telfono software (Netmeeting, GnomeMeeting, Softphone, etc.)

El telfono recibe alimentacin elctrica desde el switch LAN (estndar 802.3af) y acta como un switch de dos puertos

Universidad de Valencia

Ampliacin Redes 2-100

Rogelio Montaana

Hard

Telfonos IP

Soft

OpenPhone http://www.openh323.org/code.html Precio: 0 euros

Cisco 7905 Audio G.711 y G.729a Precio: 200 euros

Cisco 7960G Audio G.711 y G.729a Incorpora conmutador de dos puertos 10/100 Precio: 500 euros Universidad de Valencia Ampliacin Redes 2-101

Cisco SoftPhone Audio G.711, G.723.1 y G.729a Precio: 150 euros

Rogelio Montaana

Tratamiento del sonido en videoconferencia y telefona


Control automtico de ganancia: si la fuente sonora es ms dbil la ganancia se aumenta Supresin automtica de ruidos: un sonido constante se suprime (por ejemplo el ventilador de un proyector) Supresin de silencios y ruido de confort: el emisor deja de enviar cuando el sonido est por debajo de un umbral. El receptor genera entonces un ruido de fondo artificial llamado ruido de confort Cancelacin de eco: en los sistemas manos libres es fundamental evitar realimentaciones altavoz-micrfono; muchas veces esto se consigue forzando una comunicacin half duplex. Requieren cierto adiestramiento (por ejemplo si se cambia la ubicacin de los micrfonos)
Universidad de Valencia Ampliacin Redes 2-102 Rogelio Montaana

Telefona IP con H.323


Un terminal H.323 solo est obligado a soportar audio, el vdeo es opcional Por tanto con H.323, gateways y gatekeepers podemos ofrecer telefona Internet sin necesidad de nuevos estndares Sin embargo la mayora de los fabricantes utilizan protocolos propietarios para dar soporte a las funciones adicionales (desvo de llamadas, mensajera, etc.) En la prctica es muy difcil desarrollar una red de telefona IP multifabricante basada solo en estndares H.323
Universidad de Valencia Ampliacin Redes 2-103 Rogelio Montaana

Sumario
Fundamentos de telefona. Conversin analgico-digital. Audio digital. Estndares. Compresin Vdeo digital. Estndares. Compresin Protocolos RTP y RTCP Calidad de Servicio Vdeoconferencia. Estndares H.32x Pasarelas e Interoperabilidad Telefona Internet Protocolo SIP

Universidad de Valencia

Ampliacin Redes 2-104

Rogelio Montaana

SIP (Session Initiation Protocol)


En el mundo del IETF los estndares de la ITU-T siempre se han visto con recelo. En particular H.323 se considera un protocolo demasiado complejo Esto di lugar al desarrollo de un protocolo alternativo llamado SIP (Session Initiation Protocol, RFC2543, 3/99, 153 pg.) cuyo diseo est inspirado en HTTP y SMTP En SIP las direcciones son URIs. Ej.: sip:rector@uv.es Pgina principal del SIP: Universidad de Columbia: http://www.cs.columbia.edu/sip Con el tiempo SIP se ha complicado ms de lo previsto. Pero aun as parece que terminar ganando la batalla a H.323

Universidad de Valencia

Ampliacin Redes 2-105

Rogelio Montaana

Componentes de SIP
UA (User Agent): Terminal SIP (hard o soft). Un UA puede actuar como:
UAC (User Agent Client): el que llama UAS (User Agent Server): el que es llamado

Servidores:
Proxy: acta como intermediario, en representacin de un UA para efectuar o atender llamadas. Ayuda a gestionar el paso por cortafuegos, establecer restricciones, etc. Registrar: atiende peticiones de registro de los agentes activos en su dominio (bien suyos o visitantes) Redirect: informa a los clientes de los agentes que se encuentran fuera de su ubicacin natural

Universidad de Valencia

Ampliacin Redes 2-106

Rogelio Montaana

Llamada SIP directa entre dos UAs

Indica audio G.711 -law

Luis 154.42.13.26 UA Server

Alicia 147.156.12.24 UA Client

Puerto 5060 (Suena el telfono de Luis) Indica audio GSM Puerto 5060

Puerto 5060

Puerto 38060

Audio G.711 -law (sobre RTP) Audio GSM (sobre RTP)


Puerto 48753

Universidad de Valencia

Ampliacin Redes 2-107

Rogelio Montaana

Algunas caractersticas de SIP


Los mensajes de control se envan fuera de banda, es decir forman un flujo independiente (sockets distintos) de los datos intercambiados (en este caso la voz digitalizada). Los mensajes de control se envan a un puerto bien conocido (el 5060). El puerto de los datos en cambio lo elige cada agente independientemente en el momento de iniciar la sesin Los mensajes estn en caracteres ASCII y tienen una sintaxis parecida a los del protocolo HTTP Las direcciones IP de los agentes implicados y los puertos elegidos figuran en los mensajes SIP. Cuando hay un NAT en el camino ste ha de realizar las conversiones pertinentes Todos los mensajes requieren confirmacin, por lo que pueden enviarse sobre TCP o sobre UDP En el proceso de conexin se realiza una negociacin de capacidades. En el ejemplo si Luis no soportara el audio G.711 -law le enviara a Alicia un mensaje 600 Not Acceptable indicndole adems los codecs que l soporta
Universidad de Valencia Ampliacin Redes 2-108 Rogelio Montaana

Direcciones SIP
En el ejemplo anterior Luis tena una IP fija. Esto no siempre es posible, bien porque el usuario obtenga su direccin de forma dinmica (por DHCP) o porque utilice diversos dispositivos, cada uno con una IP diferente (porttil, PDA, etc.) En SIP se prev que las direcciones puedan ser:
IPs fijas: sip:luis@152.44.13.26 URIs: sip:luis@uv.es Direcciones E.164: 43865@uv.es

Para que los URIs y las direcciones E.164 puedan funcionar hace falta que la red SIP tenga un Registrar y un Proxy

Universidad de Valencia

Ampliacin Redes 2-109

Rogelio Montaana

Registrar SIP (Registrador)


Cada vez que un usuario arranca una aplicacin SIP enva un mensaje REGISTER al Registrar competente en ese dominio, que toma nota de su presencia Los mensajes REGISTER tiene un tiempo de vida (por ejemplo una hora) Cada dominio tiene un Registrar que desarrolla para las direcciones SIP una funcin equivalente a la del DNS con los nombres Los Proxys SIP lanzan consultas a los Registrar

Universidad de Valencia

Ampliacin Redes 2-110

Rogelio Montaana

Proceso de registro SIP


Luis@uv.es 154.42.13.26 Registrar SIP Dominio uv.es

URI luis@uv.es

Direccin IP 154.42.13.26

T. Vida (seg.) 3600

El registro debe renovarse peridicamente (en este ejemplo cada hora) Normalmente el registro ir precedido de una validacin por usuario/password ante un servidor RADIUS (no mostrado en la figura) El usuario puede registrarse desde cualquier direccin IP, aunque sta no pertenezca al dominio uv.es Universidad de Valencia Ampliacin Redes 2-111 Rogelio Montaana

Funciones del Proxy SIP


El Proxy SIP es un router que acta como intermediario en la comunicacin entre agentes SIP. Su actuacin se limita al proceso de conexin (sealizacin). Una vez establecida esta los agentes intercambian directamente los paquetes de datos El proxy consulta al registrar para localizar a un usuario dado. Generalmente el proxy y el registrar son el mismo equipo (normalmente un router) El proxy permite forzar la autentificacin de los usuarios y restringir el uso de los servicios de acuerdo con lo que tiene autorizado cada uno

Universidad de Valencia

Ampliacin Redes 2-112

Rogelio Montaana

Llamada SIP mediante Proxy/Registrar

Proxy SIP uv.es alicia@uv.es 147.156.12.24 luis@uv.es 154.42.13.26 Alicia@uv.es 147.156.12.24 P R O X Y

Luis@uv.es 154.42.13.26

Puerto 38060

Audio G.711 -law (sobre RTP) Audio GSM (sobre RTP) Puerto 48753

El trfico entre Alicia y Luis ir por la ruta ms corta Universidad de Valencia Ampliacin Redes 2-113 Rogelio Montaana

Descubrimiento del Proxy


En el ejemplo anterior Alicia tena que saber quin era su Proxy El proxy se puede indicar en la configuracin del agente, pero eso es poco flexible En su lugar se utilizan registros tipo SRV (Service) en el DNS. As se puede cambiar el Proxy sin tener que tocar la configuracin de los agentes
Definicin en el DNS del proxy SIP para uv.es: uv.es. _sip._udp _sip._tcp
protocolo

IN NAPTR 2 0 "s" "SIP+D2U" "" _sip._udp.uv.es. IN SRV 0 0 5060 admundsen.red.uv.es. IN SRV 0 4 5060 admundsen.red.uv.es.
Puerto (SIP)

Universidad de Valencia

Ampliacin Redes 2-114

Rogelio Montaana

Llamada SIP a un usuario remoto


pedro@uji.es 150.128.4.8

INVITE 200 OK Proxy SIP uv.es

INVITE 200 OK Proxy SIP uji.es

INVITE 200 OK

ACK Audio-vdeo

Alicia@uv.es 147.156.12.24

Pedro@uji.es 150.128.4.8

Cuando Alicia llama a Pedro sigue el mismo procedimiento que antes, salvo que ahora usa dos proxys, el de uv.es y el de uji.es. El proxy de uv.es averigua la direccin del Proxy de uji.es haciendo una consulta al DNS: DNS Query: SRV uji.es UDP 5060? DNS Response: 150.128.4.8

Una vez establecida la sesin el trfico entre Alicia y Pedro discurre por la ruta ms corta entre ambos
Ampliacin Redes 2-115 Rogelio Montaana

Universidad de Valencia

Llamadas a mltiples agentes


Un mismo URI (p. ej. luis@uv.es) se puede registrar desde diferentes agentes simultneamente En ese caso el proxy puede redirigir la llamada a todos ellos en paralelo o en serie, siguiendo una secuencia determinada previamente

Universidad de Valencia

Ampliacin Redes 2-116

Rogelio Montaana

Redireccin de llamadas SIP


Un URI puede redirigirse (desviarse) temporalmente hacia otro. Supongamos que Pedro se va de Erasmus a la Universidad de Edimburgo; all le asignan un nuevo identificador, peter@ed.ac.uk Pedro recibir las llamadas dirigidas a su nuevo URI, pero adems quiere seguir recibiendo en su telfono de Edimburgo las que le hagan a su URI permanente, pedro@uji.es Para ello Pedro debe indicar al redirect server de uji.es que se ha trasladado temporalmente a peter@ed.ac.uk Normalmente el proxy, el registrar y el redirect server de una organizacin son el mismo equipo (un router)
Universidad de Valencia Ampliacin Redes 2-117 Rogelio Montaana

Redireccin de llamadas SIP


Alicia@uv.es 147.156.12.24 1: INVITE 8: 200 OK Proxy SIP uv.es 2: INVITE 3: 301 MOVED Contact: peter@ed.ac.uk Proxy/redirect SIP uji.es

pedro@uji.es en peter@ed.ac.uk

5: INVITE
peter@ed.ac.uk 129.215.233.60 9: ACK 10: Audio-video peter@ed.ac.uk 129.215.233.60 Universidad de Valencia Ampliacin Redes 2-118 Rogelio Montaana Proxy SIP ed.ac.uk 6: 200 OK

Comunicacin SIP Red telefnica


Comunicacin fsica: se requiere un gateway o pasarela (normalmente un router) entre la red IP y la red telefnica pblica. Comunicacin lgica (direccionamiento):
SIP Red telefnica: La posibilidad de utilizar direcciones E.164 desde SIP est prevista por defecto Red telefnica SIP: hay que asignar direcciones E.164 a los agentes SIP. Esto se consigue con ENUM (E.164 NUmber Mapping), conjunto de protocolos que integran el espacio de direcciones E.164 en el DNS. ENUM permite adems asignar URIs a las direcciones E.164

Universidad de Valencia

Ampliacin Redes 2-119

Rogelio Montaana

Como funciona ENUM


A cada direccin E.164 le corresponde un nombre en el DNS, de la siguiente forma (RFC 3761): Direccin E.164: 3 4 9 6 3 5 4 3 8 6 5 Nombre DNS: 5.6.8.3.4.5.3.6.9.4.3 .e164.arpa

Los registros introducidos en el DNS son de tipo NAPTR (Name Authority Pointer) y le asignan uno o varios URIs equivalentes con diferentes prioridades. Ejemplo:
$ORIGIN 5.6.8.3.4.5.3.6.9.4.3.e164.arpa. IN NAPTR 100 10 "u" "E2U+sip" "!^.*$!sip:rogelio.montanana@uv.es!i" IN NAPTR 102 10 "u" "E2U+email" "!^.*$!mailto:rogelio.montanana@uv.es!i

Una vez configurado el mapping las direcciones E.164 pueden ser utilizadas no solo desde la red telefnica convencional sino tambin desde terminales SIP
Universidad de Valencia

Ampliacin Redes 2-120

Rogelio Montaana

Ejemplo de uso de ENUM


DNS 3: DNS response: NAPTR 100: sip:rogelio.montanana@uv.es NAPTR 102: mailto:rogelio.montanana@uv.es

2: DNS query: 5.6.8.3.4.5.3.6.9.4.3.e164.arpa

4: rogelio.montanana@uv.es? 5: Usuario no disponible Registrar SIP 6: e-mail a rogelio.montanana@uv.es 1: El usuario marca 34963543865 Servidor de e-mail Universidad de Valencia Ampliacin Redes 2-121 Rogelio Montaana

Aplicacin de SIP: sip.edu


El proyecto SIP.edu de Internet2 consiste en permitir el acceso por Internet a las redes telefnicas privadas de las universidades La llamada se enruta por Internet y una vez en la universidad de destino se pasa a travs de una pasarela a la red telefnica (privada) de la universidad, con lo que la llamada no tiene costo El llamante utiliza un agente SIP y llama al URI del destinatario. El Proxy del destinatario traduce dicho URI en un nmero de extensin (direccin E.164) consultando una base de datos (directorio LDAP por ejemplo). Entonces la llamada es enrutada a travs de la pasarela de la red privada al telfono de la persona de destino. No se accede al DNS, no se usa ENUM
Universidad de Valencia Ampliacin Redes 2-122 Rogelio Montaana

Funcionamiento de SIP.edu
Proxy SIP 1: INVITE unam.mx 2: INVITE Proxy SIP 3: query LDAP: sip: rogelio.montanana@uv.es uv.es LDAP 4: respuesta LDAP: Ext. 43865 5: llamar a Ext. 43865

10: ACK

9: ACK 8: ACK

GW alicia.martinez@unam.mx llama desde su agente SIP a rogelio.montanana@uv.es


6: suena la extensin 43865

7: Rogelio descuelga el aparato Universidad de Valencia Ampliacin Redes 2-123 Rogelio Montaana

Referencias
Sobre RTP: http://www.ietf.org/html.charters/avt-charter.html Sobre H.323: http://www.h323plus.org/ Sobre SIP: http://www.iptel.org/SIPResources Tutorial de SIP: http://www.iptel.org/files/sip_tutorial.pdf Sobre SIP.edu: http://www.internet2.edu/sip.edu/
Universidad de Valencia Ampliacin Redes 2-124 Rogelio Montaana

Junio 2004. Problema 2.1


En un sistema de videoconferencia H.323 se quiere establecer una multiconferencia de cuatro participantes con presencia continua (todos ven a todos todo el tiempo). Uno de los cuatro equipos acta como MCU. El audio se selecciona por voz (volumen ms alto) Los caudales de vdeo ocupan 90 Kb/s y los de audio 16 Kb/s Calcular el caudal mnimo necesario entrante y saliente en cada uno de los cuatro terminales, contando que hace falta un 15% adicional para informacin de control. Cada terminal (excepto la MCU) inyecta 90 Kb/s de vdeo y 16 Kb/s de audio. Con el 15% adicional resultan ser 103,5 y 18,4 Kb/s respectivamente. Por tanto cada terminal genera un caudal saliente de 121,9 Kb/s La MCU recibe los tres flujos remotos de audio y vdeo: 121,9*3=365,7 Kb/s La MCU ha de enviar a cada terminal tres vdeos (no cuatro ya que el vdeo de cada terminal no se le reenva). La MCU enva adems el audio seleccionado, salvo al terminal que genera dicho audio que no recibe ningn audio de la MCU Audio elegido de la MCU:
Tipo de terminal Terminal H.323 + MCU Terminal H.323 Caudal ascendente 986,7 Kb/s (9 video + 3 audio) Caudal descendente 365,7 Kb/s (3 video + 3 audio)

121,9 Kb/s (audio + video)

328,9 Kb/s (3 video + 1 audio)


Caudal descendente 365,7 Kb/s (3 video + 3 audio) 310,5 (3 video) 328,9 (3 video + 1 audio)

Audio elegido de otro terminal: Universidad de Valencia

Tipo de terminal Terminal H.323 + MCU Terminal H.323 emisor de audio Terminal H.323receptor de audio

Caudal ascendente 986,7 Kb/s (9 video + 3 audio) 121,9 Kb/s (audio +video) 121,9 Kb/s (audio+video)

Rogelio Montaana

Audio de Terminal A
V+A V+A

Terminal B

Internet
3V + A 3V V+A 3V + A 3V + A 3V + 3A

Terminal A

MCU

Terminal C

Universidad de Valencia

Ampliacin Redes 2-126

Rogelio Montaana

Audio de MCU
V+A V+A

Terminal B

Internet
3V + A 3V + A V+A 3V + A 3V + A 3V + 3A

Terminal A

MCU

Terminal C

Universidad de Valencia

Ampliacin Redes 2-127

Rogelio Montaana

Você também pode gostar