MODOS DE PREDICCIN ESPECFICOS MPEG-2 (IMGENES ENTRELAZADAS)
LA EXTRUCTURA" FRAME"
LA EXTRUCTURA "FIELD"
SCANNING (EXPLORACIN)
DESCRIPCIN DEL PROCESO DE DECODIFICACIN MPEG-2
DESCRIPCIN DEL PROCESO DE DECODIFICACIN MPEG-2
AUDIO MPEG 2
SISTEMAS MPEG 2 PARA MULTIPLAJE Y TRANSPORTE (ITU-T REC. H.222) 2
INTRODUCCIN La segunda fase de MPEG, llamada MPEG 2, tambin consta de tres partes o estndares, cubiertas por la: ISO/IEC 13818-1 Sistemas MPEG-2 (Draft ITU-T Rec. H.222), ISO/IEC 13818- 2 Vdeo MPEG-2 (Draft ITU-T Rec. H.262) y ISO/IEC 13818-3 Audio MPEG-2. Estas fueron aprobadas finalmente como Estndar Internacional (IS) por la asamblea N 29 de la ISO/IEC JTC1/SC29/WG11 (MPEG) hecha en Singapore en Noviembre de 1994. El registro ITU-T H.262 trata con codificacin de vdeo de alta calidad con posible vdeo entrelazado de NTSC, PAL o Televisin de Alta Definicin (HDTV). Esto es un intento para operar en un rango de 2 a 15 Mbit/s. Sin embargo puede funcionar a velocidades superiores de 100 Mbit/s. Un amplio rango de aplicaciones, velocidades, resolucin calidades de las seales y servicios son direccionados, incluyendo todas las formas de medios de almacenamiento digital, televisin (incluyendo HDTV), broadcasting y comunicaciones. MPEG-2 puede describirse como una " caja de herramientas" de compresin ms compleja que MPEG-1, por lo tanto, tambin puede ser considerada como una unidad superior: en efecto, toma todas las herramientas anteriores y le aade otras. Adems, la norma prev la compatibilidad ascendente, lo que significa que un decodificador MPEG-2 deber decodificar trenes binarios elementales de la norma MPEG-1. Entre las varias mejoras o extensiones introducidas en los codificadores MPEG 2, tenemos: Nuevos modos de prediccin de campos y tramas para scanning entrelazado. Cuantizacin mejorada. Nuevos cdigos intra-trama de longitud variable (VLC). Extensin escalada de resoluciones para compatibilidad, servicios jerrquicos y robustos, y Dos nuevas capas de sistema para multiplexaje y transporte que provee celdas/paquetes de vdeo de alta o baja prioridad, cuando son llevados a travs de una red conmutada. Incrementos soportados por accesos aleatorios. Soporte resistente para incremento de errores. Mltiples programas con un multiplexor (MPEG 1 no puede hacer esto, y esto fue un driver principal para el MPEG 2). Al igual que el H.261 y JPEG (Joint Photographic Expert Group), el estndar MPEG 2 es un esquema hbrido de compresin para imgenes en pleno movimiento que usa codificacin inter-trama y codificacin intra-trama y combina la codificacin predictiva con la codificacin con la transformada DCT 8x8 (Discrete Cosine Transform, o sea, transformada discreta de coseno). La DCT es un algoritmo matemtico (conversin del dominio del tiempo hacia el dominio de la frecuencia), que es aplicado tpicamente a un bloque de 8x8 elementos de imagen, dentro de un cuadro. La DCT elimina redundancia en la imagen a travs de la compresin de la informacin contenida en 64 pixels. El cuantizador otorga los bits para los coeficientes DCT ms importantes, los cuales son transmitidos El concepto de MPEG 2 es similar al MPEG 1, pero incluye extensiones para cubrir un amplio rango de aplicaciones. La principal aplicacin destinada durante el proceso de definicin de MPEG 2 fue todas las transmisiones de vdeo con calidad de TV codificadas a velocidades entre 5 y 10 Mbit/s. Sin embargo, la sintaxis del MPEG 2 ha sido descubierta para ser eficiente para otras aplicaciones como las de altas velocidades binarias y velocidades de muestreo (HDTV). La 3
caracterstica ms resaltante con respecto a MPEG 1 es la sintaxis para codificacin eficiente de vdeo entrelazado. Otras caractersticas ms especficas (precisin 10 bit DCT DC, cuantizacin no-lineal, tablas VLC) son incluidas, y tienen un mejoramiento notable en la eficiencia de la codificacin. Otra caracterstica clave de MPEG 2 son las extensiones escalables las cuales permiten la divisin de continuas seales de vdeo dentro de dos o ms cadenas binarias codificadas, representando el vdeo en diferentes resoluciones, calidades (por ejemplo SNR), o velocidades 4
PERFILES Y NIVELES MPEG-2 MPEG-2 es una recomendacin muy compleja, tiene una larga variedad de combinaciones (sobre 10 6 ). Sin embargo, un reducido conjunto de combinaciones son definidas bajo "perfiles" y "niveles". Dentro de los perfiles, una larga variacin de desempeos son posibles. Por otra parte los niveles son un conjunto de derivaciones impuestas para los perfiles. Las combinacin de un perfil y un nivel produce una arquitectura muy bien definida para una cadena particular de bit. Los perfile limitan la sintaxis (por ejemplo los algoritmos), mientras los niveles limitan los parmetros (velocidad de muestreo, dimensiones de las tramas, velocidad binaria codificada, etc.). Niveles: proveen un rango de cualidades potenciales, definen los mximos y mnimos para la resolucin de la imagen, muestras Y por segundo (luminancia), el nmero de capas de audio y vdeo soportados por los perfiles escalados, y la mxima velocidad binaria por perfil. A continuacin una explicacin resumida de cada uno de ellos: Nivel Bajo: tiene un formato de entrada el cual es un cuarto de la imagen definida en el registro ITU-R 601. Nivel Principal: tiene una trama de entrada completa definida en el registro ITU-R 601. Nivel Alto 1440: tiene un formato de alta definicin con 1440 muestras por lnea. Nivel Alto: tiene un formato de alta definicin con 1920 muestras por lnea (para aplicaciones sin cualquier limitacin en velocidades de datos). Perfiles: son definidos subconjuntos con caractersticas de sintaxis (por ejemplo: algoritmos), usados para converger la informacin. Hay cinco diferentes perfiles y cada uno es progresivamente ms sofisticado y agrega herramientas adicionales (y por supuesto ms costoso para el cliente) con la caracterstica adicional de ser compatible con el anterior. Esto significa que un decodificador equipado con un alto perfil descodificar perfiles simples. A continuacin una pequea explicacin de los perfiles: Perfil Simple: es el que ofrece pocas herramientas. Perfil Principal: tiene herramientas extendidas o mejoradas del perfil simple y prediccin bidireccional. Tendr mejor calidad para la misma velocidad binaria que el perfil simple. Perfil Escalable SNR y Perfil Escalable Espacial: son los prximos pasos. Estos dos niveles son llamados escalables porque ellos permitirn codificar datos de vdeo que sean particionados dentro de una capa base y una o ms seales "Top-up". La seal Top-up puede tanto tratar la proporcin S/N (SNR escalable) o la resolucin (escalable espacial). Perfil Alto: este incluye todas las herramientas de las versiones anteriores y mejoradas. Tiene la habilidad de codificar diferencias de color entre lneas simultneamente. Este es un super sistema diseado para aplicaciones donde no estn contradas sobre las velocidades de los bits Para muchas de las aplicaciones (incluyendo transmisin de satlites) el Perfil Principal, Nivel Principal (MP@ML, siglas en ingles) provee una buena relacin entre calidad de imagen y la complejidad VLSI, como resultado, MP@ML el punto de desarrollo para los actuales sistemas DCTV. El siguiente grfico es un resumen o representa de todas las combinaciones entre perfiles y niveles. Tambin muestra las mximas velocidades de datos para cada combinacin: 5
Mximas velocidades de datos para MPEG 2 y combinaciones recomendadas para perfiles y niveles. MPEG-2 se puede utilizar en un vasto rango de aplicaciones, requiriendo diferentes grados de complejidad y desempeo. NIVELES Level Max. Sampling dimensions fps Pixels/sec Max. bitrate Signficance Low 352 x 240 x 30 3.05 M 4 Mb/s CIF, consumer tape equiv. Main 720 x 480 x 30 10.40 M 15 Mb/s CCIR 601, studio TV High 1440 1440 x 1152 x 30 47.00 M 60 Mb/s 4x 601, consumer HDTV High 1920 x 1080 x 30 62.70 M 80 Mb/s production SMPTE 240 std
Niveles y perfiles de MPEG-2 6
Un perfil simple no soporta una codificacin bidireccional y de este modo solo genera imgenes I y P. Esto reduce la tasa de compresin simplificando el codificador y el decodificador; permitiendo un sencillo hardware. Un perfil simple solamente est definido en el nivel main (principal) como (SP@ML). El perfil main (principal) corresponde actualmente al mejor compromiso entre calidad/tasa de compresin, utilizando los tres tipos de imgenes (I, P y B), a costa de un codificador y decodificador, ms complejos. 7
MODOS ESCALABLES Actualmente hay cuatro modos escalables en MPEG 2. Estos modos rompen el vdeo MPEG 2 en diferentes capas (base, media, y alta) para propsitos de proritizacin de datos de vdeo. Otro propsito de la escalabilidad es para divisiones complejas. Por ejemplo, en HDTV, la alta prioridad de la cadena binarias (720x480) puede ser descodificada bajo condiciones de ruido donde la baja prioridad (1440x960) no pueda. A continuacin una breve explicacin de los modos escalables: Escalabilidad espacial: Este mtodo de dominio espacial codifica la capa base a una dimensin de muestro bajo (por ejemplo: resolucin) que las capas superiores. Las capas bajas (base) reconstruidas del muestro son usadas como prediccin de las capas superiores. Particionamiento de datos: es un mtodo de dominio de frecuencia que rompe los bloques de 64 coeficientes cuantizados de la transformada dentro de dos cadenas binarias. La primera, cadena de alta prioridad contiene los coeficientes ms crticos de las frecuencias bajas e informacin (tales como valores DC, vectores, etc.), la segunda, cadena binaria de baja prioridad lleva datos AC de las altas frecuencias. Escalabilidad SNR: es un mtodo de dominio espacial donde los canales son codificados a velocidades de muestreo idnticas, pero con diferentes calidades de imgenes. La cadena binaria de alta prioridad contiene datos de la capa base que pueden ser aadidos a la capa de refinamiento de baja prioridad para construir una imagen de alta calidad. Escalabilidad temporal: Un mtodo de dominio temporal usado por ejemplo en vdeo estereoscopico. La primera, la cadena binaria de alta prioridad codifica vdeo a una baja velocidad de tramas, y las tramas intermedias pueden ser codificadas en una segunda cadena binaria usando la reconstruccin de la primera cadena binaria como prediccin. Por ejemplo en una visin estereoscopica, el canal de vdeo izquierdo puede ser predecido del canal derecho. Los perfiles escalables (cdigo jerrquico) estn previstos para operaciones posteriores y permitirn transmitir una imagen bsica (base layer) en trminos de resolucin espacial (spatially scalable profile) o de cuantificacin (SNR scalable profile), as como informacin suplementaria independiente (enhanced layer) que permite mejorar sus caractersticas, por ejemplo para transmitir la misma emisin en definicin estndar y HD (High Definition), o permitir una recepcin con calidad aceptable en caso de recepcin difcil y de calidad ptima en buenas condiciones (por ejemplo, para la televisin digital terrestre). La figura siguiente muestra un codificador MPEG convencional, con coeficientes de cuantificacin de elevado peso; que al codificar una imagen la genera con una moderada razn seal a ruido. Despus esta imagen al ser decodificada y sustrada de la imagen original pixel a pixel da como resultado una imagen de "ruido de cuantificacin". Esta imagen puede ser comprimida y transmitida como una imagen de ayuda. Un simple decodificador solo decodifica la imagen principal, con un flujo de bit con ruido de cuantificacin, pero un decodificador ms complejo puede decodificar ambas imgenes con diferentes flujos de bits y combinarlos para producir una imagen con bajo ruido. Este es el principio del perfil SNR escalable. 8
Codificacin escalable SNR Como otra alternativa, la figura inferior muestra que por solo codificar las frecuencias espaciales bajas en imgenes HDTV, parte del flujo de bits puede ser reconstruido por un receptor con codificador para SDTV (Standard Definition TeleVision). Si una imagen de baja definicin es localmente decodificada y sustrada de la imagen original, se produce entonces una imagen de "realce de definicin", esta imagen puede ser codificada en una seal de ayuda. Un decodificador de forma conveniente podra combinar las seales principales y de ayuda para recrear la imagen HDTV. Este es el principio del perfil de escalabilidad espacial.
Codificador espacial escalable El perfil high (alto) soporta tanto el SNR y la escalabilidad espacial como tambin la opcin de muestreado 4:2:2. El perfil 4:2:2 se ha desarrollado para proveer compatibilidad con los equipos de produccin digital de televisin existentes. Este perfil admite trabajar con 4:2:2 sin requerir una complejidad adicional si se usa en el perfil high. Por ejemplo, un decodificador HP@ML debe soportar escalabilidad SNR que no es requerida en la produccin de televisin digital. El perfil 4:2:2 tiene la misma libertad de escoger su estructura de GOP como en otros perfiles, pero en la prctica este usa comnmente GOPs cortos de edicin sencilla. La operacin 4:2:2 requiere una mayor velocidad en la transmisin del bit que una operacin 4:2:0, y el uso de pequeos GOPs requiere tambin de mayores velocidades de transferencia de bits para proporcionar calidad en sus imgenes. El nivel low (bajo) corresponde a la resolucin SIF utilizada en el MPEG-1. El nivel main (principal) corresponde a la resolucin 4:2:0 "normal" (de hasta 720 pixeles x 576 lneas). El nivel high-1440 (alto-1440) est destinado a la HDTV (de hasta 1440 pixeles x 1152 lneas). El nivel high (alto) est optimizado para la HDTV (de hasta 1920 pixeles x 1152 lneas). Segn el compromiso de calidad/flujo de bits perseguido y la naturaleza de las imgenes, el flujo de bits estar comprendido entre los 4 Mbits/s (calidad equivalente a la de una imagen codificada en PAL o SECAM) y los 9 Mbits/s (calidad prxima a la de una imagen de estudio CC1R-601). 9
Todo el proceso de codificacin de las imgenes animadas descrito en el captulo anterior para MPEG-1 se aplica a MPEG-2 (MP@ML), especialmente la jerarqua de capas (desde el bloque hasta la secuencia de la Figura siguiente).
Jerarqua de capas de la secuencia
La principal novedad con respecto a MEPG-1, adems de los perfiles y niveles, provienen del tratamiento de las imgenes entrelazadas. 10
MODOS DE PREDICCIN ESPECFICOS MPEG-2 (IMGENES ENTRELAZADAS) Dependiendo del trabajo a realizar, estas pueden ser tratadas de manera diferente segn la importancia de los movimientos entre los dos campos de una misma imagen (los casos extremos son, por un lado, cuando se transmiten pelculas cinematogrficas por televisin "telecine" donde no hay movimiento entre los dos campos de TV, puesto que proceden de la exploracin del mismo fotograma de la pelcula, y por otro lado, las imgenes de video de acontecimientos deportivos, donde puede haber importantes movimientos entre los dos campos de una imagen). La figura siguiente representa la secuencia temporal de la posicin vertical de las lneas de los campos sucesivos en un sistema entrelazado.
Posicin de las lneas de campos sucesivos en un sistema entrelazado Para la codificacin Intra de las imgenes entrelazadas, MPEG-2 permite elegir entre dos estructuras de imgenes llamadas frame (estructura "imagen") o field (estructura "campo"). 11
LA EXTRUCTURA" FRAME" Tambin llamada "progresiva", es apropiada para los casos donde hay poco movimiento entre dos campos sucesivos. Los bloques y macrobloques se dividen en la imagen completa (Ver figura), y la DCT se efecta, sobre puntos verticales que distan 20 ms en el tiempo, lo que no plantea problemas si los dos campos difieren poco.
Divisin de los macrobloques en bloques en modo imagen (frame) En este caso, siempre es posible codificar los bloques de mayor animacin en modo inter- campo, es decir, dividindoles en un campo. 12
LA EXTRUCTURA "FIELD" Tambin llamada "entrelazada", es preferible cuando el movimiento de un campo a otro es importante. En este caso, a fin de evitar un contenido en frecuencias verticales elevadas que reducira la eficacia de la compresin tras efectuar la DTC, la divisin de los macrobloques se hace considerando cada uno de los campos como una imagen independiente en el interior del cual se toman los bloques. Verla figura siguiente
Divisin de los macrobloques en bloques en modo campo (field) En cuanto a la estimacin de movimiento, tambin hay varios modos previstos: Un macrobloque puede predecirse en modo "imagen", "campo" o "mixto" El Modo "Frame" Un macrobloque formado en el campo impar sirve para predecir el bloque correspondiente del prximo campo impar, y lo mismo para los bloques del campo par, por tanto, la prediccin se hace sobre un tiempo de 40 ms (2 campos). El Modo "Field" La prediccin de un bloque se efecta a partir de un bloque del campo anterior, entonces aqu, los vectores de movimiento corresponden a un tiempo de 20ms. El Modo "Mixto" Los bloques se predicen a partir de dos bloques que corresponden a dos campos. 13
SCANNING (EXPLORACIN) Despus de realizar la DTC a un bloque de 8x8 pixeles, se nota que generalmente los coeficientes ms significativos de la DTC se encuentran en la parte superior izquierda de la matriz. Una vez evaluados, los coeficientes de menor valor pueden ser redondeados a cero. Permitiendo de este modo, una transmisin de datos ms eficiente, debido a que los coeficientes no-cero son enviados primero, seguido de un cdigo el cual indica que todos los dems nmeros son ceros. La exploracin es una tcnica que aumenta la probabilidad de alcanzar este resultado, porque ella enva los coeficientes en orden descendente segn su probabilidad. La figura muestra que en un sistema no-entrelazado, la probabilidad de hallar coeficientes de mayor peso es ms alta en la parte superior izquierda que en la parte inferior derecha. Aqu una exploracin en forma diagonal a 45 es la que se denomina una exploracin en zig-zag, la cual es la mejor secuencia para emplear en este caso.
Exploracin clsica o en zig-zag, normalmente para cuadros (frames) En la figura siguiente muestra una exploracin para una fuente entrelazada, se observa que la exploracin se extiende dos veces ms por encima del rea vertical, de este modo se pueden conseguir ms detalles acerca de la imagen. Las frecuencias verticales aparecen dos veces ms que las frecuencias horizontales. Por tanto, la exploracin ideal para una imagen entrelazada ser sobre una diagonal de 67.5. La figura muestra que esta forma de exploracin, entrega primero las frecuencias espaciales verticales y luego las frecuencias espaciales horizontales. 14
Exploracin alternada, normalmente para campos (fields)
15
DESCRIPCIN DEL PROCESO DE DECODIFICACIN MPEG-2 Al igual que MPEG-1, la norma no define explcitamente el mtodo de codificacin, sino nicamente la sintaxis que controla el tren binario a la salida del codificador, lo cual deja gran libertad a su diseador. El esquema de bloques MPEG-1, tambin se aplica al codificador MPEG-2.
Esquema simplificado del codificador MPEG-2 A partir de la imagen digitalizada en formato 4:2:0 (caso del main profile), el codificador elige para cada imagen su tipo (I, P o B) y si esta debe ser codificada en modo frame (imagen) o field (campo). El codificador a continuacin debe estimar los vectores de movimiento para cada macrobloque de 16x16 pixeles. El nmero de vectores depende del tipo de imagen y del modo de codificacin escogido para cada bloque. En el caso ms general, donde el codificador es capaz de generar imgenes B (bidireccionales), deber reordenar las imgenes antes de la codificacin y la transmisin. La unidad bsica de codificacin es el macrobloque, compuesto por 4 bloques de luminancia de 8x8 pixeles y (en el caso del formato 4:2:0) de 2 bloques de crominancia (un Cr y un Cb) de 8x8 pixeles que abarcan la misma zona de la imagen. Todos los macrobloques de la imagen se codifican secuencialmente de izquierda a derecha y de arriba abajo, eligindose un modo de codificacin independiente para cada uno de ellos. Una vez que se ha elegido el modo de codificacin, la prediccin con compensacin de movimiento del contenido del bloque se hace a partir de la imagen de referencia (I o P) pasada (caso de las imgenes P) y eventualmente futura (caso de las imgenes B). La prediccin se elimina de los datos reales del macrobloque, lo que da la seal de error de prediccin. 16
En una imagen con estructura frame, el codificador deber elegir entre efectuar la DTC en modo frame o field. Esto depende principalmente de la amplitud del movimiento entre los campos de la imagen. La seal de error se separa inmediatamente en bloques de 8x8, a los que se aplica la DTC. Cada bloque de coeficientes resultante se cuantifica y barre en zig-zag para formar una serie de coeficientes. Seguidamente, se codifica la informacin auxiliar necesaria para que el decodificador pueda reconstruir el bloque (modo de codificacin, vectores de movimiento, etc.), codificando los coeficientes cuantificados con ayuda de una tabla VLC (codificacin Huffman). La unidad de control de flujo supervisa el estado de ocupacin de la memoria intermedia de salida, utilizando esta informacin como retorno para controlar el nmero de bits que el codificador generar para los bloques siguientes, jugando principalmente con los coeficientes de cuantificacin. Se obtiene entonces a la salida del codificador un tren binario completo, ya utilizable para un decodificador. Para aumentar la calidad de la imagen decodificada, el propio codificador almacena y decodifica (decuantificacin de los coeficientes despus de la DTC inversa) las imgenes I y P, como referencia para reconstruir otras imgenes obtenidas por prediccin con compensacin de movimiento en el decodificador, y calcula una seal de error que se aade a la seal de prediccin. 17
DESCRIPCIN DEL PROCESO DE DECODIFICACIN MPEG-2 Como ya se ha dicho, la decodificacin es ms sencilla que la codificacin, ya que no tiene que efectuar alguna estimacin de movimiento, que es una de las partes ms complejas del codificador.
Esquema simplificado del decodificador MPEG-2 El esquema de bloques del decodificador de la figura anteriores el que se va a analizar para MPEG-2. La memoria intermedia (buffer) de entrada recibe los datos del canal de transmisin, y el decodificador lee el tren binario hasta encontrar el principio de una imagen, su tipo (I, P o B) y su estructura (frame o field). Empieza la decodificacin con la primera imagen I, almacenndola en su memoria, as como la imagen P siguiente, para servir de referencia a las imgenes P o B que dependen de ella. Para las imgenes I, la decodificacin propiamente dicha consiste en aplicar a cada bloque la decodificacin VLC, la decuantificacin de los coeficientes y la transformacin DTC inversa. Para las imgenes P o B, este proceso consiste en construir la prediccin de cada macrobloque a partir de su tipo, de los vectores de movimiento y de las imgenes de referencia memorizadas. El decodificador lee, decodifica y decuantifica los coeficientes DTC del error de prediccin transmitido para cada bloque de 8x8 pixeles, y, despus de la transformada DTC inversa, aade el resultado a la prediccin. La reconstruccin de la imagen se efecta cuando todos los macrobloques han sido tratados. La ltima etapa de la decodificacin es poner las imgenes en el orden inicial de visualizacin. Como se vio anteriormente, la necesidad de memoria para el decodificador es de unas 3 imgenes (dos imgenes de referencia ms la imagen en va de reconstruccin), siendo para una imagen 4:2:0, de aproximadamente 16 Mbits. 18
AUDIO MPEG 2 El sistema de multiplexaje MPEG 2, soporta cualquier nmero de canales de entrada de audio tan largos que la velocidad de transporte seleccionada pueda soportar la suma de datos. Los usuarios tienen la flexibilidad para seleccionar su propio algoritmo de compresin de audio, tales como: Audio MPEG 2, MUSICAM, DOLBY AC-2 o AC-3. Los canales pueden ser configurados independientemente o en pares estreo. Diferentes velocidades de audio es otra de las caractersticas de el sistema. Una vez ms, la velocidad tambin ser asociada con la calidad. La compresin de audio MPEG 2 es un algoritmo que, como el vdeo MPEG 2, explota las limitaciones del sistema humano, en este caso el odo. Como en la compresin de vdeo, el algoritmo de compresin de audio tambin elimina la informacin irrelevante dentro de la seal de audio. La informacin irrelevante es cualquier seal imperceptible. Por ejemplo, en presencia de una seal fuerte, todas las seales vecinas flojas son enmascaradas y aunque son parte del espectro, no son percibidas por el odo. El algoritmo MPEG 2 es del tipo "lossy" o con prdidas pero la distorsin insertada por la seal ser inaudible. La configuracin bsica del audio MPEG 2 ofrece seis canales de audio. Esta caracterstica debe ser usada para distribuir tres pares de estreos ( o seis canales mono) para aplicaciones multilenguajes o para crear un sistema estereofnico multicanal. Lo anterior crea una realidad como a la de un campo de audio. La recomendacin de cornetas configuradas para sistemas estereofnicos multicanales es conocido como estreo -p/q , donde p es el nmero de cornetas en el frente y q es el nmero de cornetas en el fondo. Por ejemplo un estreo-3/2 proveer un sistema con canales al frente en la derecha, centro y a la izquierda ms canales posteriores que rodean el rea y ofrecen un mejor e impresionante realismo a la audiencia. Las configuraciones tpicas para sistemas estereofnicos multicanales son: 1 Canal modo 1/0: Mono 2 Canales estreo 2/0: izquierda y derecha 3 Canales estreo 3/0: izquierda, derecha y centro 4 Canales estreo 3/1: izquierda, derecha, centro y posterior 5 Canales estreo 3/2: izquierda, derecha, centro, posterior izquierda y derecha 5.1 Canales estreo 3/2: izquierda, derecha, centro, posterior izquierda y derecha y un canal de efectos especiales de 100 Hz LFE (Low Frequency Enhancement). Audio MPEG 2 ofrece tres diferentes capas de compresin (capa -I, -II, y -III). Cada capa usa un esquema de reduccin incremental de la velocidad binaria, con la ayuda de el incremento de la velocidad de compresin mientras se mantiene la calidad. Para la capa -II, la tcnica de reduccin de bit corresponde para el algoritmo MUSICAM, el permite varias combinaciones de velocidades de bit (32 a 224 Kbit/s por canal), y calidad de audio sin comprometer la complejidad del hardware. Por ejemplo una velocidad de muestreo de 56 Kbit/s y 16 KHz en la capa -II ofrece mejor calidad que la definida en el registro ITU-G.722. 19
SISTEMAS MPEG 2 PARA MULTIPLAJE Y TRANSPORTE (ITU-T REC. H.222) El multiplexaje y transporte definidos bajo MPEG 2 especfica el formato de codificacin para multiplexar audio, vdeo y datos dentro de una forma manejable para almacenar o transmitir. Hay dos formatos de cadenas de datos definidos: 1. Cadena de transporte (TS), la cual porta o lleva uno o ms programas simultneamente, es optimo para aplicaciones donde la prdida de datos puede ser requerida (como los enlaces satelitales). Tales errores pueden ser manifestados como errores de bit o prdida de paquetes. Una TS es una sucesin de paquetes de 188 bytes de longitud llamados "paquetes de transporte". Es posible construir una TS a partir de: 2. Cadenas elementalmente paquetizadas (PES), vienen de mltiples programas. Cada programa debe tener velocidad variable, sin embargo, la TS ser de velocidad fija. Cada programa tiene un Reloj Referencial Primario (PCR) asociado con el para indicar la actual velocidad del programa. 3. Cadenas de Programa u otra TS las cuales puedan contener uno o ms programas. La cadena de transporte es optima para transmisiones de satlites, cable, ISDN, redes ATM y vdeotelefona. 1. Cadena de programa (PS). Es optima para usarse en ambientes libres de errores, como aplicaciones multimedia. Llevan paquetes largos de longitud variable. Cada paquete comenzar con una cabecera. Un error en la cabecera puede causar la prdida del paquete completo y puede representar la corrupcin de una trama entera de vdeo. PS puede llevar uno o ms programas simultneamente, pero la PES tiene que compartir un tiempo base comn. Cadena Elementalmente Paquetizada (PES): El transporte es desarrollado dividiendo las salidas del compresor (vdeo y audio) para formar paquetes de longitud variable marcados por tiempo llamados cadenas elementalmente paquetizadas (PES). Las PES son paquetes de longitud variable sujeto a la mxima longitud de 64 Kbytes. El proceso de paquetizacin es aplicado para tanto vdeo y audio. Cada PES es marcado con el tiempo para darse una referencia antes y despus del demultiplexaje, con la finalidad de reproducir las tramas de vdeo completamente sincronizadas con el audio PES. Este es un tiempo de referencia para cada programa llamado Reloj Referencial Primario (PCR). El PCR es una informacin independiente usada para crear un reloj de referencia en el descodificador. Cada programa prescinde de la velocidad y si la velocidad es variable o fija son referidas para un PCR. Finalmente, la PES viniendo de diferentes programas puede compartir un nico PCR. Multiplexaje: Un multiplexaje basado en paquete es muy flexible. Paquetes pertenecientes a diferentes programas pueden ser distribuido de varias maneras. Un buffer es usado en el descodificador para asegurarse que todos los datos son descodificados y presentados a tiempo. Ya que la naturaleza inherente de la PES es variable en velocidad, el multiplexaje basado en paquetes es de gran aprovechamiento porque puede distribuir PES de diferentes fuentes con diferentes velocidades instantneas dentro de una salida comn con velocidad fija. Explotando la no coincidencia de picos de velocidad, se puede transportar altas velocidades instantneamente en una salida de baja velocidad. Este tipo de multiplexor es algunas veces referido como "multiplexor estadstico". Las capas del sistema ofrecen diferentes modos de operacin: 1. Multiplexaje estadstico, descrito anteriormente. 20
2. Multiplexaje estadstico limitado en el cual la velocidad de cualquier cadena de vdeo no podr caer bajo un umbral programable. 3. Multiplexaje con velocidad fija, las velocidades de vdeo son fijas. 4. Modo mixto. Todos los modos previos pueden ser mezclados dentro de un simple TS. Despus del multiplexaje, la seal sufrir el proceso final, cada paquete de transporte puede ser encriptado y revuelta, bajo control de acceso condicional. La salida de un multiplexor portando mltiples canales siempre ser a velocidad fija.