Compresión de Video en El Estándar MPEG-2

1
COMPRESIN DE VIDEO EN EL ESTNDAR MPEG-2

SUMARIO

INTRODUCCIN

PERFILES Y NIVELES MPEG-2

MODOS ESCALABLES

MODOS DE PREDICCIN ESPECFICOS MPEG-2 (IMGENES ENTRELAZADAS)

LA EXTRUCTURA" FRAME"

LA EXTRUCTURA "FIELD"

SCANNING (EXPLORACIN)

DESCRIPCIN DEL PROCESO DE DECODIFICACIN MPEG-2


AUDIO MPEG 2

SISTEMAS MPEG 2 PARA MULTIPLAJE Y TRANSPORTE (ITU-T REC. H.222)
2

INTRODUCCIN
La segunda fase de MPEG, llamada MPEG 2, tambin consta de tres partes o estndares,
cubiertas por la: ISO/IEC 13818-1 Sistemas MPEG-2 (Draft ITU-T Rec. H.222), ISO/IEC 13818-
2 Vdeo MPEG-2 (Draft ITU-T Rec. H.262) y ISO/IEC 13818-3 Audio MPEG-2. Estas fueron
aprobadas finalmente como Estndar Internacional (IS) por la asamblea N 29 de la ISO/IEC
JTC1/SC29/WG11 (MPEG) hecha en Singapore en Noviembre de 1994.
El registro ITU-T H.262 trata con codificacin de vdeo de alta calidad con posible vdeo
entrelazado de NTSC, PAL o Televisin de Alta Definicin (HDTV). Esto es un intento para
operar en un rango de 2 a 15 Mbit/s. Sin embargo puede funcionar a velocidades superiores de
100 Mbit/s. Un amplio rango de aplicaciones, velocidades, resolucin calidades de las seales
y servicios son direccionados, incluyendo todas las formas de medios de almacenamiento
digital, televisin (incluyendo HDTV), broadcasting y comunicaciones.
MPEG-2 puede describirse como una " caja de herramientas" de compresin ms compleja que
MPEG-1, por lo tanto, tambin puede ser considerada como una unidad superior: en efecto,
toma todas las herramientas anteriores y le aade otras. Adems, la norma prev la
compatibilidad ascendente, lo que significa que un decodificador MPEG-2 deber decodificar
trenes binarios elementales de la norma MPEG-1.
Entre las varias mejoras o extensiones introducidas en los codificadores MPEG 2, tenemos:
Nuevos modos de prediccin de campos y tramas para scanning entrelazado.
Cuantizacin mejorada.
Nuevos cdigos intra-trama de longitud variable (VLC).
Extensin escalada de resoluciones para compatibilidad, servicios jerrquicos y
robustos, y
Dos nuevas capas de sistema para multiplexaje y transporte que provee
celdas/paquetes de vdeo de alta o baja prioridad, cuando son llevados a travs de una
red conmutada.
Incrementos soportados por accesos aleatorios.
Soporte resistente para incremento de errores.
Mltiples programas con un multiplexor (MPEG 1 no puede hacer esto, y esto fue un
driver principal para el MPEG 2).
Al igual que el H.261 y JPEG (Joint Photographic Expert Group), el estndar MPEG 2 es un
esquema hbrido de compresin para imgenes en pleno movimiento que usa codificacin
inter-trama y codificacin intra-trama y combina la codificacin predictiva con la codificacin con
la transformada DCT 8x8 (Discrete Cosine Transform, o sea, transformada discreta de coseno).
La DCT es un algoritmo matemtico (conversin del dominio del tiempo hacia el dominio de la
frecuencia), que es aplicado tpicamente a un bloque de 8x8 elementos de imagen, dentro de
un cuadro. La DCT elimina redundancia en la imagen a travs de la compresin de la
informacin contenida en 64 pixels. El cuantizador otorga los bits para los coeficientes DCT
ms importantes, los cuales son transmitidos
El concepto de MPEG 2 es similar al MPEG 1, pero incluye extensiones para cubrir un amplio
rango de aplicaciones. La principal aplicacin destinada durante el proceso de definicin de
MPEG 2 fue todas las transmisiones de vdeo con calidad de TV codificadas a velocidades
entre 5 y 10 Mbit/s.
Sin embargo, la sintaxis del MPEG 2 ha sido descubierta para ser eficiente para otras
aplicaciones como las de altas velocidades binarias y velocidades de muestreo (HDTV). La
3

caracterstica ms resaltante con respecto a MPEG 1 es la sintaxis para codificacin eficiente
de vdeo entrelazado.
Otras caractersticas ms especficas (precisin 10 bit DCT DC, cuantizacin no-lineal, tablas
VLC) son incluidas, y tienen un mejoramiento notable en la eficiencia de la codificacin. Otra
caracterstica clave de MPEG 2 son las extensiones escalables las cuales permiten la divisin
de continuas seales de vdeo dentro de dos o ms cadenas binarias codificadas,
representando el vdeo en diferentes resoluciones, calidades (por ejemplo SNR), o velocidades
4

PERFILES Y NIVELES MPEG-2
MPEG-2 es una recomendacin muy compleja, tiene una larga variedad de combinaciones
(sobre 10
6
). Sin embargo, un reducido conjunto de combinaciones son definidas bajo "perfiles"
y "niveles".
Dentro de los perfiles, una larga variacin de desempeos son posibles. Por otra parte los
niveles son un conjunto de derivaciones impuestas para los perfiles. Las combinacin de un
perfil y un nivel produce una arquitectura muy bien definida para una cadena particular de bit.
Los perfile limitan la sintaxis (por ejemplo los algoritmos), mientras los niveles limitan los
parmetros (velocidad de muestreo, dimensiones de las tramas, velocidad binaria codificada,
etc.).
Niveles: proveen un rango de cualidades potenciales, definen los mximos y mnimos
para la resolucin de la imagen, muestras Y por segundo (luminancia), el nmero de
capas de audio y vdeo soportados por los perfiles escalados, y la mxima velocidad
binaria por perfil. A continuacin una explicacin resumida de cada uno de ellos:
Nivel Bajo: tiene un formato de entrada el cual es un cuarto de la imagen definida
en el registro ITU-R 601.
Nivel Principal: tiene una trama de entrada completa definida en el registro ITU-R
601.
Nivel Alto 1440: tiene un formato de alta definicin con 1440 muestras por lnea.
Nivel Alto: tiene un formato de alta definicin con 1920 muestras por lnea (para
aplicaciones sin cualquier limitacin en velocidades de datos).
Perfiles: son definidos subconjuntos con caractersticas de sintaxis (por ejemplo:
algoritmos), usados para converger la informacin. Hay cinco diferentes perfiles y cada
uno es progresivamente ms sofisticado y agrega herramientas adicionales (y por
supuesto ms costoso para el cliente) con la caracterstica adicional de ser compatible
con el anterior. Esto significa que un decodificador equipado con un alto perfil
descodificar perfiles simples. A continuacin una pequea explicacin de los perfiles:
Perfil Simple: es el que ofrece pocas herramientas.
Perfil Principal: tiene herramientas extendidas o mejoradas del perfil simple y
prediccin bidireccional. Tendr mejor calidad para la misma velocidad binaria
que el perfil simple.
Perfil Escalable SNR y Perfil Escalable Espacial: son los prximos pasos. Estos
dos niveles son llamados escalables porque ellos permitirn codificar datos de
vdeo que sean particionados dentro de una capa base y una o ms seales
"Top-up". La seal Top-up puede tanto tratar la proporcin S/N (SNR escalable)
o la resolucin (escalable espacial).
Perfil Alto: este incluye todas las herramientas de las versiones anteriores y
mejoradas. Tiene la habilidad de codificar diferencias de color entre lneas
simultneamente. Este es un super sistema diseado para aplicaciones donde
no estn contradas sobre las velocidades de los bits
Para muchas de las aplicaciones (incluyendo transmisin de satlites) el Perfil Principal, Nivel
Principal (MP@ML, siglas en ingles) provee una buena relacin entre calidad de imagen y la
complejidad VLSI, como resultado, MP@ML el punto de desarrollo para los actuales sistemas
DCTV. El siguiente grfico es un resumen o representa de todas las combinaciones entre
perfiles y niveles. Tambin muestra las mximas velocidades de datos para cada combinacin:
5

Mximas velocidades de datos para MPEG 2
y combinaciones recomendadas para
perfiles y niveles.
MPEG-2 se puede utilizar en un vasto rango de aplicaciones, requiriendo diferentes grados de
complejidad y desempeo.
NIVELES
Level
Max. Sampling
dimensions fps
Pixels/sec Max. bitrate Signficance
Low 352 x 240 x 30 3.05 M 4 Mb/s CIF, consumer tape equiv.
Main 720 x 480 x 30 10.40 M 15 Mb/s CCIR 601, studio TV
High 1440 1440 x 1152 x 30 47.00 M 60 Mb/s 4x 601, consumer HDTV
High 1920 x 1080 x 30 62.70 M 80 Mb/s production SMPTE 240 std

Niveles y perfiles de MPEG-2
6

Un perfil simple no soporta una codificacin bidireccional y de este modo solo genera imgenes
I y P. Esto reduce la tasa de compresin simplificando el codificador y el decodificador;
permitiendo un sencillo hardware. Un perfil simple solamente est definido en el nivel main
(principal) como (SP@ML). El perfil main (principal) corresponde actualmente al mejor
compromiso entre calidad/tasa de compresin, utilizando los tres tipos de imgenes (I, P y B), a
costa de un codificador y decodificador, ms complejos.
7

MODOS ESCALABLES
Actualmente hay cuatro modos escalables en MPEG 2. Estos modos rompen el vdeo MPEG 2
en diferentes capas (base, media, y alta) para propsitos de proritizacin de datos de vdeo.
Otro propsito de la escalabilidad es para divisiones complejas. Por ejemplo, en HDTV, la alta
prioridad de la cadena binarias (720x480) puede ser descodificada bajo condiciones de ruido
donde la baja prioridad (1440x960) no pueda.
A continuacin una breve explicacin de los modos escalables:
Escalabilidad espacial: Este mtodo de dominio espacial codifica la capa base a una
dimensin de muestro bajo (por ejemplo: resolucin) que las capas superiores. Las
capas bajas (base) reconstruidas del muestro son usadas como prediccin de las capas
superiores.
Particionamiento de datos: es un mtodo de dominio de frecuencia que rompe los
bloques de 64 coeficientes cuantizados de la transformada dentro de dos cadenas
binarias. La primera, cadena de alta prioridad contiene los coeficientes ms crticos de
las frecuencias bajas e informacin (tales como valores DC, vectores, etc.), la segunda,
cadena binaria de baja prioridad lleva datos AC de las altas frecuencias.
Escalabilidad SNR: es un mtodo de dominio espacial donde los canales son
codificados a velocidades de muestreo idnticas, pero con diferentes calidades de
imgenes. La cadena binaria de alta prioridad contiene datos de la capa base que
pueden ser aadidos a la capa de refinamiento de baja prioridad para construir una
imagen de alta calidad.
Escalabilidad temporal: Un mtodo de dominio temporal usado por ejemplo en vdeo
estereoscopico. La primera, la cadena binaria de alta prioridad codifica vdeo a una baja
velocidad de tramas, y las tramas intermedias pueden ser codificadas en una segunda
cadena binaria usando la reconstruccin de la primera cadena binaria como prediccin.
Por ejemplo en una visin estereoscopica, el canal de vdeo izquierdo puede ser
predecido del canal derecho.
Los perfiles escalables (cdigo jerrquico) estn previstos para operaciones posteriores y
permitirn transmitir una imagen bsica (base layer) en trminos de resolucin espacial
(spatially scalable profile) o de cuantificacin (SNR scalable profile), as como informacin
suplementaria independiente (enhanced layer) que permite mejorar sus caractersticas, por
ejemplo para transmitir la misma emisin en definicin estndar y HD (High Definition), o
permitir una recepcin con calidad aceptable en caso de recepcin difcil y de calidad ptima en
buenas condiciones (por ejemplo, para la televisin digital terrestre).
La figura siguiente muestra un codificador MPEG convencional, con coeficientes de
cuantificacin de elevado peso; que al codificar una imagen la genera con una moderada razn
seal a ruido. Despus esta imagen al ser decodificada y sustrada de la imagen original pixel a
pixel da como resultado una imagen de "ruido de cuantificacin". Esta imagen puede ser
comprimida y transmitida como una imagen de ayuda. Un simple decodificador solo decodifica
la imagen principal, con un flujo de bit con ruido de cuantificacin, pero un decodificador ms
complejo puede decodificar ambas imgenes con diferentes flujos de bits y combinarlos para
producir una imagen con bajo ruido. Este es el principio del perfil SNR escalable.
8

Codificacin escalable SNR
Como otra alternativa, la figura inferior muestra que por solo codificar las frecuencias
espaciales bajas en imgenes HDTV, parte del flujo de bits puede ser reconstruido por un
receptor con codificador para SDTV (Standard Definition TeleVision). Si una imagen de baja
definicin es localmente decodificada y sustrada de la imagen original, se produce entonces
una imagen de "realce de definicin", esta imagen puede ser codificada en una seal de ayuda.
Un decodificador de forma conveniente podra combinar las seales principales y de ayuda
para recrear la imagen HDTV. Este es el principio del perfil de escalabilidad espacial.

Codificador espacial escalable
El perfil high (alto) soporta tanto el SNR y la escalabilidad espacial como tambin la opcin de
muestreado 4:2:2.
El perfil 4:2:2 se ha desarrollado para proveer compatibilidad con los equipos de produccin
digital de televisin existentes. Este perfil admite trabajar con 4:2:2 sin requerir una complejidad
adicional si se usa en el perfil high. Por ejemplo, un decodificador HP@ML debe soportar
escalabilidad SNR que no es requerida en la produccin de televisin digital. El perfil 4:2:2
tiene la misma libertad de escoger su estructura de GOP como en otros perfiles, pero en la
prctica este usa comnmente GOPs cortos de edicin sencilla. La operacin 4:2:2 requiere
una mayor velocidad en la transmisin del bit que una operacin 4:2:0, y el uso de pequeos
GOPs requiere tambin de mayores velocidades de transferencia de bits para proporcionar
calidad en sus imgenes.
El nivel low (bajo) corresponde a la resolucin SIF utilizada en el MPEG-1.
El nivel main (principal) corresponde a la resolucin 4:2:0 "normal" (de hasta 720 pixeles
x 576 lneas).
El nivel high-1440 (alto-1440) est destinado a la HDTV (de hasta 1440 pixeles x 1152
lneas).
El nivel high (alto) est optimizado para la HDTV (de hasta 1920 pixeles x 1152 lneas).
Segn el compromiso de calidad/flujo de bits perseguido y la naturaleza de las imgenes, el
flujo de bits estar comprendido entre los 4 Mbits/s (calidad equivalente a la de una imagen
codificada en PAL o SECAM) y los 9 Mbits/s (calidad prxima a la de una imagen de estudio
CC1R-601).
9

Todo el proceso de codificacin de las imgenes animadas descrito en el captulo anterior para
MPEG-1 se aplica a MPEG-2 (MP@ML), especialmente la jerarqua de capas (desde el bloque
hasta la secuencia de la Figura siguiente).

Jerarqua de capas de la secuencia

La principal novedad con respecto a MEPG-1, adems de los perfiles y niveles, provienen del
tratamiento de las imgenes entrelazadas.
10

MODOS DE PREDICCIN ESPECFICOS MPEG-2 (IMGENES
ENTRELAZADAS)
Dependiendo del trabajo a realizar, estas pueden ser tratadas de manera diferente segn la
importancia de los movimientos entre los dos campos de una misma imagen (los casos
extremos son, por un lado, cuando se transmiten pelculas cinematogrficas por televisin
"telecine" donde no hay movimiento entre los dos campos de TV, puesto que proceden de la
exploracin del mismo fotograma de la pelcula, y por otro lado, las imgenes de video de
acontecimientos deportivos, donde puede haber importantes movimientos entre los dos
campos de una imagen).
La figura siguiente representa la secuencia temporal de la posicin vertical de las lneas de los
campos sucesivos en un sistema entrelazado.

Posicin de las lneas de campos sucesivos en un sistema
entrelazado
Para la codificacin Intra de las imgenes entrelazadas, MPEG-2 permite elegir entre dos
estructuras de imgenes llamadas frame (estructura "imagen") o field (estructura "campo").
11

LA EXTRUCTURA" FRAME"
Tambin llamada "progresiva", es apropiada para los casos donde hay poco movimiento entre
dos campos sucesivos. Los bloques y macrobloques se dividen en la imagen completa (Ver
figura), y la DCT se efecta, sobre puntos verticales que distan 20 ms en el tiempo, lo que no
plantea problemas si los dos campos difieren poco.

Divisin de los macrobloques en bloques en modo imagen (frame)
En este caso, siempre es posible codificar los bloques de mayor animacin en modo inter-
campo, es decir, dividindoles en un campo.
12

LA EXTRUCTURA "FIELD"
Tambin llamada "entrelazada", es preferible cuando el movimiento de un campo a otro es
importante. En este caso, a fin de evitar un contenido en frecuencias verticales elevadas que
reducira la eficacia de la compresin tras efectuar la DTC, la divisin de los macrobloques se
hace considerando cada uno de los campos como una imagen independiente en el interior del
cual se toman los bloques. Verla figura siguiente

Divisin de los macrobloques en bloques en modo campo (field)
En cuanto a la estimacin de movimiento, tambin hay varios modos previstos:
Un macrobloque puede predecirse en modo "imagen", "campo" o "mixto"
El Modo "Frame"
Un macrobloque formado en el campo impar sirve para predecir el bloque correspondiente del
prximo campo impar, y lo mismo para los bloques del campo par, por tanto, la prediccin se
hace sobre un tiempo de 40 ms (2 campos).
El Modo "Field"
La prediccin de un bloque se efecta a partir de un bloque del campo anterior, entonces aqu,
los vectores de movimiento corresponden a un tiempo de 20ms.
El Modo "Mixto"
Los bloques se predicen a partir de dos bloques que corresponden a dos campos.
13

SCANNING (EXPLORACIN)
Despus de realizar la DTC a un bloque de 8x8 pixeles, se nota que generalmente los
coeficientes ms significativos de la DTC se encuentran en la parte superior izquierda de la
matriz. Una vez evaluados, los coeficientes de menor valor pueden ser redondeados a cero.
Permitiendo de este modo, una transmisin de datos ms eficiente, debido a que los
coeficientes no-cero son enviados primero, seguido de un cdigo el cual indica que todos los
dems nmeros son ceros.
La exploracin es una tcnica que aumenta la probabilidad de alcanzar este resultado, porque
ella enva los coeficientes en orden descendente segn su probabilidad. La figura muestra que
en un sistema no-entrelazado, la probabilidad de hallar coeficientes de mayor peso es ms alta
en la parte superior izquierda que en la parte inferior derecha. Aqu una exploracin en forma
diagonal a 45 es la que se denomina una exploracin en zig-zag, la cual es la mejor secuencia
para emplear en este caso.

Exploracin clsica o en zig-zag,
normalmente para cuadros (frames)
En la figura siguiente muestra una exploracin para una fuente entrelazada, se observa que la
exploracin se extiende dos veces ms por encima del rea vertical, de este modo se pueden
conseguir ms detalles acerca de la imagen. Las frecuencias verticales aparecen dos veces
ms que las frecuencias horizontales. Por tanto, la exploracin ideal para una imagen
entrelazada ser sobre una diagonal de 67.5. La figura muestra que esta forma de
exploracin, entrega primero las frecuencias espaciales verticales y luego las frecuencias
espaciales horizontales.
14

Exploracin alternada, normalmente
para campos (fields)

15

Al igual que MPEG-1, la norma no define explcitamente el mtodo de codificacin, sino
nicamente la sintaxis que controla el tren binario a la salida del codificador, lo cual deja gran
libertad a su diseador.
El esquema de bloques MPEG-1, tambin se aplica al codificador MPEG-2.

Esquema simplificado del codificador MPEG-2
A partir de la imagen digitalizada en formato 4:2:0 (caso del main profile), el codificador elige
para cada imagen su tipo (I, P o B) y si esta debe ser codificada en modo frame (imagen) o
field (campo). El codificador a continuacin debe estimar los vectores de movimiento para cada
macrobloque de 16x16 pixeles. El nmero de vectores depende del tipo de imagen y del modo
de codificacin escogido para cada bloque.
En el caso ms general, donde el codificador es capaz de generar imgenes B
(bidireccionales), deber reordenar las imgenes antes de la codificacin y la transmisin.
La unidad bsica de codificacin es el macrobloque, compuesto por 4 bloques de luminancia
de 8x8 pixeles y (en el caso del formato 4:2:0) de 2 bloques de crominancia (un Cr y un Cb) de
8x8 pixeles que abarcan la misma zona de la imagen.
Todos los macrobloques de la imagen se codifican secuencialmente de izquierda a derecha y
de arriba abajo, eligindose un modo de codificacin independiente para cada uno de ellos.
Una vez que se ha elegido el modo de codificacin, la prediccin con compensacin de
movimiento del contenido del bloque se hace a partir de la imagen de referencia (I o P) pasada
(caso de las imgenes P) y eventualmente futura (caso de las imgenes B). La prediccin se
elimina de los datos reales del macrobloque, lo que da la seal de error de prediccin.
16

En una imagen con estructura frame, el codificador deber elegir entre efectuar la DTC en
modo frame o field. Esto depende principalmente de la amplitud del movimiento entre los
campos de la imagen.
La seal de error se separa inmediatamente en bloques de 8x8, a los que se aplica la DTC.
Cada bloque de coeficientes resultante se cuantifica y barre en zig-zag para formar una serie
de coeficientes. Seguidamente, se codifica la informacin auxiliar necesaria para que el
decodificador pueda reconstruir el bloque (modo de codificacin, vectores de movimiento, etc.),
codificando los coeficientes cuantificados con ayuda de una tabla VLC (codificacin Huffman).
La unidad de control de flujo supervisa el estado de ocupacin de la memoria intermedia de
salida, utilizando esta informacin como retorno para controlar el nmero de bits que el
codificador generar para los bloques siguientes, jugando principalmente con los coeficientes
de cuantificacin. Se obtiene entonces a la salida del codificador un tren binario completo, ya
utilizable para un decodificador.
Para aumentar la calidad de la imagen decodificada, el propio codificador almacena y
decodifica (decuantificacin de los coeficientes despus de la DTC inversa) las imgenes I y P,
como referencia para reconstruir otras imgenes obtenidas por prediccin con compensacin
de movimiento en el decodificador, y calcula una seal de error que se aade a la seal de
prediccin.
17

Como ya se ha dicho, la decodificacin es ms sencilla que la codificacin, ya que no tiene que
efectuar alguna estimacin de movimiento, que es una de las partes ms complejas del
codificador.

Esquema simplificado del decodificador MPEG-2
El esquema de bloques del decodificador de la figura anteriores el que se va a analizar para
MPEG-2.
La memoria intermedia (buffer) de entrada recibe los datos del canal de transmisin, y el
decodificador lee el tren binario hasta encontrar el principio de una imagen, su tipo (I, P o B) y
su estructura (frame o field).
Empieza la decodificacin con la primera imagen I, almacenndola en su memoria, as como la
imagen P siguiente, para servir de referencia a las imgenes P o B que dependen de ella.
Para las imgenes I, la decodificacin propiamente dicha consiste en aplicar a cada bloque la
decodificacin VLC, la decuantificacin de los coeficientes y la transformacin DTC inversa.
Para las imgenes P o B, este proceso consiste en construir la prediccin de cada
macrobloque a partir de su tipo, de los vectores de movimiento y de las imgenes de referencia
memorizadas. El decodificador lee, decodifica y decuantifica los coeficientes DTC del error de
prediccin transmitido para cada bloque de 8x8 pixeles, y, despus de la transformada DTC
inversa, aade el resultado a la prediccin.
La reconstruccin de la imagen se efecta cuando todos los macrobloques han sido tratados.
La ltima etapa de la decodificacin es poner las imgenes en el orden inicial de visualizacin.
Como se vio anteriormente, la necesidad de memoria para el decodificador es de unas 3
imgenes (dos imgenes de referencia ms la imagen en va de reconstruccin), siendo para
una imagen 4:2:0, de aproximadamente 16 Mbits.
18

AUDIO MPEG 2
El sistema de multiplexaje MPEG 2, soporta cualquier nmero de canales de entrada de audio
tan largos que la velocidad de transporte seleccionada pueda soportar la suma de datos. Los
usuarios tienen la flexibilidad para seleccionar su propio algoritmo de compresin de audio,
tales como: Audio MPEG 2, MUSICAM, DOLBY AC-2 o AC-3. Los canales pueden ser
configurados independientemente o en pares estreo. Diferentes velocidades de audio es otra
de las caractersticas de el sistema. Una vez ms, la velocidad tambin ser asociada con la
calidad.
La compresin de audio MPEG 2 es un algoritmo que, como el vdeo MPEG 2, explota las
limitaciones del sistema humano, en este caso el odo. Como en la compresin de vdeo, el
algoritmo de compresin de audio tambin elimina la informacin irrelevante dentro de la seal
de audio. La informacin irrelevante es cualquier seal imperceptible. Por ejemplo, en
presencia de una seal fuerte, todas las seales vecinas flojas son enmascaradas y aunque
son parte del espectro, no son percibidas por el odo. El algoritmo MPEG 2 es del tipo "lossy" o
con prdidas pero la distorsin insertada por la seal ser inaudible.
La configuracin bsica del audio MPEG 2 ofrece seis canales de audio. Esta caracterstica
debe ser usada para distribuir tres pares de estreos ( o seis canales mono) para aplicaciones
multilenguajes o para crear un sistema estereofnico multicanal. Lo anterior crea una realidad
como a la de un campo de audio. La recomendacin de cornetas configuradas para sistemas
estereofnicos multicanales es conocido como estreo -p/q , donde p es el nmero de cornetas
en el frente y q es el nmero de cornetas en el fondo. Por ejemplo un estreo-3/2 proveer un
sistema con canales al frente en la derecha, centro y a la izquierda ms canales posteriores
que rodean el rea y ofrecen un mejor e impresionante realismo a la audiencia.
Las configuraciones tpicas para sistemas estereofnicos multicanales son:
1 Canal modo 1/0: Mono
2 Canales estreo 2/0: izquierda y derecha
3 Canales estreo 3/0: izquierda, derecha y centro
4 Canales estreo 3/1: izquierda, derecha, centro y posterior
5 Canales estreo 3/2: izquierda, derecha, centro, posterior izquierda y derecha
5.1 Canales estreo 3/2: izquierda, derecha, centro, posterior izquierda y derecha y un
canal de efectos especiales de 100 Hz LFE (Low Frequency Enhancement).
Audio MPEG 2 ofrece tres diferentes capas de compresin (capa -I, -II, y -III). Cada capa usa
un esquema de reduccin incremental de la velocidad binaria, con la ayuda de el incremento de
la velocidad de compresin mientras se mantiene la calidad.
Para la capa -II, la tcnica de reduccin de bit corresponde para el algoritmo MUSICAM, el
permite varias combinaciones de velocidades de bit (32 a 224 Kbit/s por canal), y calidad de
audio sin comprometer la complejidad del hardware. Por ejemplo una velocidad de muestreo de
56 Kbit/s y 16 KHz en la capa -II ofrece mejor calidad que la definida en el registro ITU-G.722.
19

SISTEMAS MPEG 2 PARA MULTIPLAJE Y TRANSPORTE (ITU-T REC. H.222)
El multiplexaje y transporte definidos bajo MPEG 2 especfica el formato de codificacin para
multiplexar audio, vdeo y datos dentro de una forma manejable para almacenar o transmitir.
Hay dos formatos de cadenas de datos definidos:
1. Cadena de transporte (TS), la cual porta o lleva uno o ms programas simultneamente,
es optimo para aplicaciones donde la prdida de datos puede ser requerida (como los
enlaces satelitales). Tales errores pueden ser manifestados como errores de bit o
prdida de paquetes. Una TS es una sucesin de paquetes de 188 bytes de longitud
llamados "paquetes de transporte". Es posible construir una TS a partir de:
2. Cadenas elementalmente paquetizadas (PES), vienen de mltiples programas. Cada
programa debe tener velocidad variable, sin embargo, la TS ser de velocidad fija. Cada
programa tiene un Reloj Referencial Primario (PCR) asociado con el para indicar la
actual velocidad del programa.
3. Cadenas de Programa u otra TS las cuales puedan contener uno o ms programas.
La cadena de transporte es optima para transmisiones de satlites, cable, ISDN, redes ATM y
vdeotelefona.
1. Cadena de programa (PS). Es optima para usarse en ambientes libres de errores, como
aplicaciones multimedia. Llevan paquetes largos de longitud variable. Cada paquete
comenzar con una cabecera. Un error en la cabecera puede causar la prdida del
paquete completo y puede representar la corrupcin de una trama entera de vdeo. PS
puede llevar uno o ms programas simultneamente, pero la PES tiene que compartir un
tiempo base comn.
Cadena Elementalmente Paquetizada (PES): El transporte es desarrollado dividiendo las
salidas del compresor (vdeo y audio) para formar paquetes de longitud variable marcados por
tiempo llamados cadenas elementalmente paquetizadas (PES). Las PES son paquetes de
longitud variable sujeto a la mxima longitud de 64 Kbytes. El proceso de paquetizacin es
aplicado para tanto vdeo y audio. Cada PES es marcado con el tiempo para darse una
referencia antes y despus del demultiplexaje, con la finalidad de reproducir las tramas de
vdeo completamente sincronizadas con el audio PES. Este es un tiempo de referencia para
cada programa llamado Reloj Referencial Primario (PCR). El PCR es una informacin
independiente usada para crear un reloj de referencia en el descodificador. Cada programa
prescinde de la velocidad y si la velocidad es variable o fija son referidas para un PCR.
Finalmente, la PES viniendo de diferentes programas puede compartir un nico PCR.
Multiplexaje: Un multiplexaje basado en paquete es muy flexible. Paquetes pertenecientes a
diferentes programas pueden ser distribuido de varias maneras. Un buffer es usado en el
descodificador para asegurarse que todos los datos son descodificados y presentados a
tiempo. Ya que la naturaleza inherente de la PES es variable en velocidad, el multiplexaje
basado en paquetes es de gran aprovechamiento porque puede distribuir PES de diferentes
fuentes con diferentes velocidades instantneas dentro de una salida comn con velocidad fija.
Explotando la no coincidencia de picos de velocidad, se puede transportar altas velocidades
instantneamente en una salida de baja velocidad. Este tipo de multiplexor es algunas veces
referido como "multiplexor estadstico".
Las capas del sistema ofrecen diferentes modos de operacin:
1. Multiplexaje estadstico, descrito anteriormente.
20

2. Multiplexaje estadstico limitado en el cual la velocidad de cualquier cadena de vdeo no
podr caer bajo un umbral programable.
3. Multiplexaje con velocidad fija, las velocidades de vdeo son fijas.
4. Modo mixto. Todos los modos previos pueden ser mezclados dentro de un simple TS.
Despus del multiplexaje, la seal sufrir el proceso final, cada paquete de transporte puede
ser encriptado y revuelta, bajo control de acceso condicional. La salida de un multiplexor
portando mltiples canales siempre ser a velocidad fija.

Compresión de Video en El Estándar MPEG-2

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Compresión de Video en El Estándar MPEG-2

Enviado por

Direitos autorais:

Formatos disponíveis

1

COMPRESIN DE VIDEO EN EL ESTNDAR MPEG-2

Você também pode gostar