Você está na página 1de 67

6. Vídeo (I).

6.1. INTRODUCCIÓN.

6.2. BREVE HISTORIA DEL VÍDEO DOMÉSTICO

6.3. VÍDEO ANALÓGICO.

6.4. VÍDEO DIGITAL.

6.5. FORMATOS ESTÁNDARES DE VIDEO DIGITAL

6.6. COMPRESION DE VIDEO

6.7 HARDWARE PARA VIDEO

6.8. PROCESO DE CREACIÓN DE VÍDEO EN MULTIMEDIA

6.9. EDICIÓN DE VÍDEO

6.10 VIDEO EN INTERNET


Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.1.- Introducción (I).

z Podemos considerar el vídeo como una extensión lógica


de los gráficos e imágenes estáticas, agrupando un cierto
número de estos/as entre las que existe una relación
temporal.

z Podemos considerar el vídeo como una secuencia de


imágenes caracterizadas por su resolución, número de
colores y, un factor distintivo con respecto a la imagen
estática que es el número de imágenes que se muestra
por unidad de tiempo (FRAME
(FRAME RATE),
RATE), de forma que la
impresión obtenida es que existe movimiento.
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

1
6.1.- Introducción (II).

z Para dar una sensación de movimiento continuo, el valor del


frame rate debe estar alrededor de las 25 imágenes por
segundo.

z Como es obvio, nos encontramos nuevamente con el


problema de las altas necesidades de espacio de
almacenamiento necesarias para poder tratar adecuadamente
este medio.

z Sin embargo, existen técnicas de compresión basadas en los


cambios que se producen entre imágenes consecutivas que
pueden reducir considerablemente el tamaño final del fichero
generado (Ej
(Ej:: Persona hablando con el mismo fondo y la
cámara fija).

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.1.- Introducción (III).

z Es útil que la secuencia de imágenes incluya


información de sonido en el mismo conjunto. Para
obtener la correcta sincronización entre sonidos e
imágenes, se suelen mezclar dichas informaciones =>
INTERLEAVING: UNA PEQUEÑA CANTIDAD DE
IMÁGENES SE ALTERNA CON LA INFORMACIÓN
DE AUDIO ASOCIADA, DESPUÉS DE LA CUAL SE
DISPONE OTRA PIEZA DE VÍDEO CON SU
CORRESPONDIENTE INFORMACIÓN DE SONIDO,
ETC.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

2
6.2.- Breve historia del vídeo doméstico (I).
z 1927. John Logie Baird inventó
inventó la "fonovisi
"fonovisió
ón", para grabar imá
imágenes
de televisió
televisión en discos de fonó
fonógrafo. La calidad era horrible...

z 1951. Bing Crosby Enterprises construyó


construyó el primer magnetoscopio en
b/n, grabador de cinta de ví
vídeo magné
magnética. Al añ
año siguiente RCA
desarrolló
desarrolló un prototipo en color.

z En los sesenta. Aparecen cientos de formatos y tipos distintos (Sony


(Sony,,
Panasonic,
Panasonic, Philips,
Philips, General Electric...),
Electric...), fundamentalmente para
grabació
grabación y redifusió
redifusión de programas de TV. La cinta era bastante
ancha, de dos pulgadas.

z En los setenta. Empezaron a aparecer aparatos domé domésticos (CBS,


Philips...)
Philips...) reduciendo el ancho de la cinta (a 3/4 de pulgada, sistema
U-matic).
matic).

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.2.- Breve historia del vídeo doméstico (II).


z 1975. Apareció
Apareció el sistema Betamax de media pulgada, diseñ
diseñado por
Sony.
Sony.

z 1977. JVC comercializó


comercializó el VHS.

z 1979. Philips y Grundig sacaron el Ví


Vídeo 2000.

z La polí
política de VHS, mucho mámás abierta que la de Sony,
Sony, junto a la
mayor duració
duración de las cintas, provocaron que el mercado se inclinara
significativamente por el VHS que, como sabemos, es el sistema que que
finalmente se ha impuesto en el mercado domé
doméstico.

z Actualmente tenemos la siguiente generació


generación de ví
vídeo: el digital, DV.
Y con él el DVD. El ví
vídeo digital de consumo es de calidad similar al
vídeo de estudio, con 500 lí
líneas de resolució
resolución.

z ¿Siguiente paso? HD-


HD-DVD; Blu-
Blu-Ray
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

3
6.3.1.- Señal de vídeo analógico (I).
z La señal de vídeo analógico es una señal eléctrica que varía con el
tiempo y que se obtiene a partir de muestrear, de forma periódica,
periódica, la
información que llega a una cámara: un patrón de distribución espacial
espacial
de intensidad luminosa cambiante con el tiempo.

z Este proceso se conoce como BARRIDO (scanning


(scanning)).

z De esta forma se recoge la información acerca de la distribución


luminosa a través de unas líneas predefinidas de muestreo, así como
como
la información de control (sincronismos) acerca de la posición
horizontal y vertical del punto de barrido en cada momento.

z El punto de reconocimiento de la imagen va trazando líneas casi


horizontales de izquierda a derecha, volviendo a la izquierda y así
sucesivamente hasta completar la pantalla.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.3.1.- Señal de vídeo analógico (II).


z Los métodos de barrido más comúnmente usados son:
PROGRESIVO y ENTRELAZADO.
ENTRELAZADO.

z PROGRESIVO:
PROGRESIVO:
– Recorre (obtiene) una imagen que se denomina cuadro o frame
cada T segundos.
– En el campo de los ordenadores, este valor T es de 1/72 segundos
para monitores de alta resolución.

z ENTRELAZADO:
– Se usa comúnmente en el campo de la televisión.
– Ej:
Ej: Entrelazado 2:1 donde se dibuja primero las líneas pares y
después las impares, por eso se distingue entre el campo (field
(field))
par e impar de una imagen.
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

4
6.3.1.- Señal de vídeo analógico (III).
z Ha de existir una indicación para el final de cada línea,
denominado SINCRONISMO HORIZONTAL.
HORIZONTAL.

z También existe una indicación para el final de cada campo o


SINCRONISMO VERTICAL.
VERTICAL.

z Durante el tiempo en que el punto de barrido se desplaza de


una línea a la siguiente es necesario apagar el rayo de
electrones (blanking
(blanking intervals)
intervals) y se denomina HORIZONTAL
BLANKING.
BLANKING.

z También se define un VERTICAL BLANKING que se produce


desde que se termina de barrer la última línea hasta que el
punto de barrido vuelve a la primera.
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.3.1.- Señal de vídeo analógico (IV).

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

5
6.3.1.- Señal de vídeo analógico (V).
z A partir del recorrido descrito anteriormente se obtiene la señal,
señal, que
para el caso monocromático, toma la forma que se muestra a
continuación, donde se puede observar la parte correspondiente al al
recorrido sobre una de las líneas comentadas.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.3.1.- Señal de vídeo analógico (VI).

z La relación entre la anchura de la imagen respecto a


su altura se denomina RELACIÓN DE ASPECTO
(ASPECT RATIO).

z Ejemplos de aspect ratio:


– Televisión convencional: 4:3.
– Televisión de alta definición: 16:9.
– Cine: 1,85:1 y 2,35:1.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6
6.3.1.- Señal de vídeo analógico (VII).
z Se han definido diferentes estándares de vídeo basándose en distintas
distintas
relaciones de aspecto (aspect
(aspect ratio).

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.3.1.- Señal de vídeo analógico (VIII).


z Los parámetros a considerar en la señal de vídeo analógico son
los siguientes:
– Intervalo en blanco horizontal (horizontal blanking intervals):
intervals):
Durante la vuelta al principio de una línea hay un pequeño espacio
espacio
de tiempo en que el sensor se apaga y y se envía un nivel en
blanco (cero), con lo que la señal completa de un fotograma es una
una
serie de líneas separadas por intervalos en blanco horizontal.

– Relación de aspecto (aspect


(aspect ratio): Relación entre la distancia
horizontal y la vertical de recorrido del punto de rastreo, la relación
relación
horizontal/vertical de la imagen (televisión -> 4:3, película de cine -
> 2:1, televisión de alta calidad -> 16:9).

– Sincronización: Se utiliza una señal adicional de sincronización


(sync information)
information) que es una marca de temporización horizontal y
vertical
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

7
6.3.1.- Señal de vídeo analógico (IX).
– Resolución horizontal: Corresponde al área que el sensor es capaz
de detectar. Está limitada por por el ancho de banda de la señal,
señal, ya
que la variación de la señal eléctrica tiene que ser capaz de variar
variar con
la suficiente velocidad para reflejar los cambios que se encuentran
encuentran en
cada uno de los puntos sucesivos de la línea horizontal.

– Relación vertical: Número de líneas que determinan la resolución de


la imagen.Un pequeño número de líneas de cada fotograma se dejan
blancas para retornar de nuevo a la línea inicial, marcando el intervalo
intervalo
de separación vertical (vertical blanking interval).
interval). Este espacio en
blanco se suele usar para transmitir otra información mezclada con con la
señal de vídeo, como el teletexto o subtítulos.

– Velocidad de cuadro y entrelazado: Para que el ojo humano no


perciba que hay parpadeo en una serie de imágenes mostradas de
forma consecutiva, esta debe refrescarse al menos 50 veces por
segundo.
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.3.1.- Señal de vídeo analógico (X).


– Para no necesitar actualizar la imagen completa tan rá rápido, se suele usar
un truco que es refrescar en ese perí
período só
sólo la mitad de la imagen, de
modo que la imagen completa se refresca 25 veces (60 / 30 en otros otros
sistemas). Si se hiciera con mitades completas de pantalla el ojo ojo humano
notarí
notaría el parpadeo (flicker
(flicker),
), pero si se hace con lílíneas consecutivas es
imperceptible en objetos tan limitados en altura, por lo que se suele
emplear entrelazado de lílíneas (en un rastreo se muestran las lílíneas
impares y en el siguiente las pares, y así
así sucesivamente).

– B/N y color: La señseñal en blanco y negro puede representarse


elé
eléctricamente só sólo como un valor lineal de brillo. Para el color se
necesitan tres señ
señales independientes que representen el brillo de cada
punto filtrado con un color primario: RGB. Debido a la complejidad
complejidad de
distribuir tres señ
señales en sincronismo perfecto, la mayorí
mayoría de los sistemas
de ví
vídeo no gestionan RGB (tres cables), sino que las tres señ señales se
codifican en un formato compuesto que puede ser distribuido en un un único
cable (o transmitido por radiodifusió
radiodifusión). Hay distintos tipos de composició
composición,
que son los distintos sistemas que conocemos estandarizados en el el
mundo: PAL, NTSC, SECAM...
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

8
6.3.1.- Señal de vídeo analógico (XI).
z Los estudios sobre la percepción de los colores permitieron llegar
llegar a
una serie de estándares de vídeo analógico que, a pesar de sus
defectos, siguen vigentes y satisfacen a millones de telespectadores
telespectadores
de todo el mundo, 40 años después de que saliera a la luz el primero.
primero.

z La triple señal de video “en color” (rojo, verde y azul - RGB)


suministrada por el dispositivo captador de imagen, debía ser
transformada a una señal que, por un lado, fuera visualizable sin
sin
demasiados defectos sobre un televisor en blanco y negro y, por otro,
“cupiese” en un canal de televisión existente garantizando una imagen
imagen
en color con una calidad satisfactoria.

z La idea básica fue transformar por combinación lineal las tres


componentes RGB (rojo, verde, azul) en otras tres señales
equivalentes Y, CB, CR (Y, U, V)
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.3.1.- Señal de vídeo analógico (XII).


z Se llama Luminancia o brillo Y a la señal en blanco y negro y queda expresada
matemáticamente por la siguiente fórmula:

Y= 0,30R + 0,59G + 0,11B

z Por tanto, la señal de luminancia Y está formada por un 30% de la señal roja
(R), un 59% de la señal verde (G) y un 11% de la señal azul (B).

z La señal de luminancia no tiene información sobre el color y es preciso tener


alguna información adicional que contribuya a restituir el color.
color. En la matriz,
además de la luminancia se obtienen, algebraicamente, las informaciones
informaciones de
la diferencia de color: U (CB) y V (CR).

z Por simple suma algebraica, se pueden obtener las relaciones siguientes:


siguientes:
z (R – Y) + Y = R
z (G – Y) + Y = G
z (B – Y) + Y = B

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

9
6.3.1.- Señal de vídeo analógico (XIII).
z A los términos entre paréntesis anteriores se les conoce por diferencia de
color.
color.
– A la diferencia B-
B-Y se la denomina U (CB).
– A la diferencia R-
R-Y se la denomina V (CR).

z En la salida de la matriz se obtienen tres informaciones: Y, U y V. Este


conjunto de señales YUV (o Y, CB, CR) es el punto común de todos los
sistemas de televisión en color, incluso para los sistemas digitales
digitales más
recientes.

z La señal YUV es idéntica en contenido a la señal RGB, pero existe


existe una clara
diferencia. Cada componente de la señal RGB ocupa un ancho de banda
banda de
5MHz, mientras que la señal YUV requiere un menor ancho de banda:
banda: 5 MHz
para la Y y 1MHz para cada componente U y V. Por tanto, la señal RGB es
más pura y nítida, de ahí el uso en monitores informáticos.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.3.1.- Señal de vídeo analógico (XIV).

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

10
6.3.2.- Estándares de vídeo analógico (I).
z También hay diferencia a la hora de elegir el cableado:
– El cable de vídeo compuesto (por ejemplo, el conector RCA)
transmite únicamente una señal completa. Normalmente es
un conector RCA amarillo o a través de un euroconector.
euroconector.

– El cable de S-
S-vídeo (super
(super--vídeo) separa la luminancia de la
crominancia y es un conector mini DIN de 4 patas.

– El cable de RGB (como el euroconector)


euroconector) transmite las tres
señales de color original independientes.

– La conexión YUV es de uso mayoritario en USA y Japón


(rara vez lo encontramos en Europa) y suele tener 3
conexiones tipo BNC.
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.3.2.- Estándares de vídeo analógico (II).


z Podemos clasificar las conexiones por su calidad como:
– RGB -> EXCELENTE.
EXCELENTE.
– YUV -> EXCELENTE.
EXCELENTE.
– Y/C -> MUY BUENA.
BUENA.
– VÍDEO COMPUESTO -> ACEPTABLE.
ACEPTABLE.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

11
6.3.2.- Estándares de vídeo analógico (III).
z Los estándares más difundidos en el campo de la difusión
televisiva son los siguientes (VIDEO
(VIDEO COMPUESTO):
COMPUESTO):
– NTSC: National Television Systems Commitee (1952), se
utiliza principalmente en Norte América y Japón.
– PAL: Phase Alternation Line (1960), se utiliza mayormente
en Europa.
– SECAM: Systeme Electronique Color Avec Memoire,
Memoire,
utilizado en Francia y Rusia.
– HDTV: High Definition Television,
Television, se define como dos veces
mayor en resolución que la televisión convencional, con una
relación 16:9 de aspecto, una frecuencia de barrido de
cuadro de 24Hz o mayor y, por lo menos, dos canales de
audio de calidad CD.
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.3.2.- Estándares de vídeo analógico (IV).

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

12
6.4.- Vídeo digital (I).
z Podemos considerar el vídeo digital como una forma más de
información (datos) que es capaz de manejar un ordenador.

z El vídeo digital realiza la conversión de la señal eléctrica a bits,


bits,
mediante el proceso de digitalización o muestreo (conversión A/D).A/D).

z Esto produce una aproximación a la señal original y si la


digitalización es suficientemente precisa, podemos realizar tantas
tantas
copias como queramos sin pérdida de calidad, cosa que no ocurre
con las copias analógicas.

z Para que la señal obtenida sea precisa, debemos cumplir el


teorema de Nyquist en el proceso de muestreo.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.4.- Vídeo digital (II).


z Las ventajas de realizar el tratamiento en formato digital
son:
– ROBUSTEZ DE LA SEÑAL: es menos sensible a interferencias y
errores en la transmisión. También admite procesos de
comprobación de la integridad de la señal.
– Es posible el ACCESO ALEATORIO a los contenidos de la
secuencia, facilitando la edición y/o impresión de imágenes
individuales de la secuencia grabada.
– SIMULTANEIDAD: Es posible realizar la captura (grabación) al
mismo tiempo que otros procesos de tratamiento de la imagen.
– SIN SINCRONISMO: Se conoce la longitud de cada línea y dónde
empieza y termina.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

13
6.4.1.- Señal de vídeo digital (I).
z Casi todos los estándar de vídeo digital se ajustan al estándar de
componentes de vídeo para representar la señal de color (o niveles
niveles de
gris).

z La mayoría de las cámaras de vídeo proporcionan salida RGB que se


se
digitalizan de forma individual.

z La resolución horizontal y vertical del vídeo digital se refieren


refieren al
número de pixels por línea y el número de líneas por cuadro.

z La pérdida de resolución espacial en el caso analógico comporta un


efecto de desenfoque o emborronamiento. En el caso digital, se
produce el efecto de ALIASING:
ALIASING: se hace visible la naturaleza pixelada
de la imagen, fundamentalmente en los bordes de los objetos, ya que
en lugar de verlos de forma continua, se aprecia un efecto de escalera.
escalera.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.4.1.- Señal de vídeo digital (II).

z En funció
función de las caracterí
características del monitor y de la
distancia del usuario este efecto se aprecia en mayor o
menor medida.

z La calidad de color deseable se alcanzarí


alcanzaría con 24 bits de
color (8 bits de cada canal RGB), aunque a menudo se
usa una solució
solución de compromiso para disminuir los
requisitos de tamañ
tamaño de 16 bits (5 bits R, 6 bits G, 5 bits B,
ya que el ojo humano parece ser má más receptivo al verde),
o bien se define el color mediante paleta.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

14
6.4.1.- Señal de vídeo digital (III).

z El cuadro de trabajo de ví
vídeo digital en PAL es de 768 x
576. El hecho de que sea tan habitual trabajar en 320 x
240 o 160 x 120 es que son divisores directos de 640 x
480, que es la resolució
resolución NTSC.

z El problema del ví
vídeo digital es el requerimiento de
memoria que impone al sistema, tanto para su
almacenamiento como para su transmisió
transmisión.

z La viabilidad del ví
vídeo digital está
está en funció
función del uso de
los mé
métodos de compresió
compresión.
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.4.2.- Estándares de vídeo digital (I).

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

15
6.4.2.- Estándares de vídeo digital (II).
z Aunque la calidad de imagen es alta en estos estándares,
no pueden competir con la película de 35mm. en lo que
respecta a resolución espacial.

z Existen desarrollos encaminados a desarrollar un estándar


denominado superhigh-
superhigh-definition (SHD), que permita
mostrar imágenes en tiempo real de 2000x2000 pixels con
una frecuencia de cuadro de 60Hz.

z Para llevarlo a la práctica se necesitan nuevas técnicas de


compresión.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.5 Formatos estándares de vídeo digital

z Video CD

z Super Video CD

z DVD

z DV

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

16
6.5.1 Vídeo CD
z Implementación especial de CD-ROM/XA diseñada para
almacenar vídeo MPEG-1

z Vídeo sin comprimir: 1 seg VHS 5 MB

z Define un disco Mode 2 Form 2 que puede contener hasta 74


minutos de calidad VHS a pantalla completa

z Extiende la utilidad de MPEG codificando el vídeo de bitrates


estándares en un formato que elimina la información de vídeo
redundante y añade una aplicación en tiempo de ejecución CDi
para ser usada en reproductores CDi, DVD o VideoCD.

z Evolución
– VCD 2.0
– VCD-ROM
– Super VCD
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.5.1 Vídeo CD: Características


Parámetro Valor

Tiempo de reproducción 74 minutos

Video: MPEG-1

Resolución: 352 x 240 a 30 fps (NTSC) o 352 x 280 a 25 fps (PAL/SECAM)

Audio: MPEG-1 estéreo y pistas de audio opcionales

Imágenes: MPEG-1 de hasta 720 x 480/576 (uso para menús)

Interacción: Menús para seleccionar. Listas de reproducción para secuencias


predeterminadas de audio/vídeo/imágenes. Movimiento hacia
adelanta y hacia atrás.

Subtítulos Sí

Puntos de entrada Hasta 98 por pista (500 en total por disco)

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

17
6.5.1 Vídeo CD: Estructura
Directorio Archivos Comentarios
VCD INFO.VCD Identificación de álbum y disco
ENTRIES.VCD Lista de puntos de entrada (máx 500)
PSD.VCD Descriptor de secuencia de reproducción
LOT.VCD Archivo de desplazamiento de lista de IDs
MPEGAV AVSEQnn.DAT Archivos MPEG (uno por pista)
CDDA AUDIOnn.DAT Archivos CD Audio files (uno por pista)
SEGMENT ITEMnnn.DAT Items de reproducción (uno por segmento)
KARAOKE KARINFO.xxx Archivos opcionales de información para karaoke
EXT PSD_X.VCD

LOT_X.VCD Versión opcional extendida de PSD.VCD


Versión opcional extendida de LOT.VCD
SCANDATA.DAT Lista opcional de direcciones de I-frame
Datos opcionales (uno por pista)
CAPTnn.DAT

CDI (undefined) Archivos de datos y programa CD-i


Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.5.1 Vídeo CD 2.0


Características Descripción

Resolución Vídeo SIF (352 x 288 PAL, 352x240 NTSC)

Compresión Vídeo MPEG-1

Bitrate Vídeo Hasta 1151 kbps (CBR)

Compresión Audio MPEG-1 layer 2

Bitrate Audio 224kbps

Sonido Surround Dolby ProLogic (analógico)

Flujos máximos de audio 1 estéreo o 2 mono

Menús, control de reproducción e ítems de reproducción de


Otras características
segmentos MPEG

Resolución de imágenes 480 x 480, 480 x 576, 704x480 or 704x576

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

18
6.5.2 Super Video CD
z Estándar de 1998 construido sobre el estándar VCD

z Calidad de vídeo entre el VCD y el DVD

z Mejor resolución de vídeo, codificación con bitrate variable y


compresión MPEG-2

z Vídeo entrelazado y mejor resolución en componente DC

z Se puede incluir un segundo flujo de audio MPEG, por lo que se


puede añadir un segundo idioma.

z La codificación de audio MPEG-2.5.1 permite añadir sonido


digital surround a las películas

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.5.2 Super Video CD: Características


Característica Descripción

Resolución Vídeo 2/3 D1 (480x576 PAL, 480x480 NTSC)

Compresión Vídeo MPEG-2

Bitrate video Variable hasta 2600 kbps

Compresión Audio MPEG-1 layer 2

Bitrate Audio Variable entre 32 kbps y 384 kbps

Sonido Surround MPEG-2 5+1 (digital) o Dolby ProLogic (analógico)

Máximo flujos audio 2 stereo o 4 mono

Overlay gráfico para OSD, 4 flujos de subtítulos o letras, interactividad


Otras características
extendida con instrucciones variables y condicionales

Imágenes 480 x 480, 480 x 576, 704x480, 704x576

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

19
6.5.2 Super Video CD vs VCD
Parámetro Video CD v 2.0 SVCD

Tiempo de reproducción: 74 minutos 35 a 70 mins+

Ratio datos: 150 kBps 300 kBps

MPEG-1 MPEG-2
Vídeo:
1.15 Mbps CBR 2.6 Mbps VBR medio

352 x 240 (NTSC) 480 x 480 (NTSC)


Resolución:
352 x 280 (PAL/SECAM) 480 x 576 (PAL/SECAM)

MPEG-1 estéreo CBR 2 flujos MPEG-1 estéreo VBR


Audio:
pistas CD audio opcionales canal 5.1 opcional

Imágenes: MPEG-1 MPEG-2

Interacción:
Menús, Lista de reproducción, FF/FR Mayor interactividad

Subtítulos: Leyendas Gráficos superponibles

Puntos de entrada: Hasta 98 por pista (500 por disco).

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.5.3 DVD
z Requisitos de diseño
– 133 minutos en una cara de un disco (99% de las películas) de
vídeo comprimido MPEG-2 con audio multicanal surround.
– Mejor resolución de vídeo que el Laserdisc.
– Sonido surround calidad CD (calidad home cinema)
– Audio hasta en 8 idiomas
– Subtítulos hasta en 32 idiomas
– Formatos Pan-scan, letterbox y panorámico
– Control de contenidos
– Protección de copia
– Compatibilidad con CDs
– División y acceso por capítulos
– Hasta 9 ángulos de cámara para dar mayores posibilidades al
usuario

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

20
6.5.3 DVD: Tiempo de reproducción
z Un DVD-5 (cara simple): 133 minutos de vídeo codificado con MPEG-2, 3 canales
de audio surround y 4 canales de subtítulos.

z En un DVD-9 (capa dual) tenemos hasta 240 minutos de vídeo.

z En un DVD-10 (doble cara) tenemos 133 minutos por cara, pero hay que darle la
vuelta al disco.

z Un DVD-18 (capa dual, doble cara) puede tener 240 minutos por cara, necesitando
cambiar de cara

z Estos tiempos son variables, dependiendo del bitrate de codificación, número de


canales de audio

z El bitrate máximo es 9’8 Mb/s para vídeo, audio e imágenes (10’08 incluyendo la
información de control).

z Para 133 minutos, el bitrate medio es 4’7 Mb/s. El bitrate medio de vídeo
disponible depende del número de flujos de audio y la codificación usada y
debería ser al menos 4 Mb/s para obtener resultados de alta calidad.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.5.3 DVD: Estructura de archivos (I)

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

21
6.5.3 DVD: Estructura de archivos (II)
Archivo Descripción

VIDEO_TS.IFO Archivo VMGI (Video Manager Information)


VIDEO_TS.VOB Archivo VOB para Menú VMG
VIDEO_TS.BUP Copia Seguridad VMGI

VTS_01_0.IFO Archivo VTSI (VTS Manager Information)


VTS_01_0.VOB Video Object Set para Menú VTS
VTS_01_0.BUP Copia Seguridad VTSI

VTS_01_1.VOB Primer Title Video Object Set


VTS_01_2.VOB Segundo Title Video Object Set
..... ......
VTS_01_n.VOB Último Title Video Object Set (n <=9 para DVD-9)

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.5.3 DVD: Flujos de datos


Max datos rate
Tipo de dato Flujos Codificación

Video 1 9.8 Mb/s Vídeo MPEG-1 o MPEG-2

Audio Hasta 8 6.144 Mb/s Varios formatos de audio en stereo y


surround

Imágenes Hasta 32 3.36 Mb/s 2 bits/pixel RLE

Navegación 1 - PGC para obtener interactividad

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

22
6.5.3 DVD: Codificación vídeo
Parámetro MPEG-2 MPEG-1

Resolución NTSC 720/704 x 480 352 x 480


(horizontal x vertical) 352 x 480/240 351 x 240

Resolución PAL/SECAM 720/704 x 576 352 x 576


(horizontal x vertical) 352 x 576/288 352 x 288

VBR o CBR VBR o CBR CBR

PAL/SECAM frame rate 25 fps

NTSC frame rate (en disco) 24 o 29.97 fps

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.5.3 DVD: Calidad de imagen


Propiedad Laserdisc Video CD SVCD DVD-Video

Formato de Composición analógica MPEG-1 MPEG-2 MPEG-2


codificación
CBR/VBR - CBR VBR VBR

Píxels 352 480 720

Líneas 240/288 480/576 480/576

Bitrate - 1.15 Mb/s 2.6 Mb/s 3.5 Mb/s

Calidad Buena Aceptable Buena Muy buena

Canales audio 2 a 5.1 2 4 5.1

Idiomas 1 1 2 st/4 mono Hasta 8

Tiempo de 60 mins 74 mins 37 mins bitrate ~133 mins por


reproducción max max capa
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

23
6.5.3 DVD: Formatos de pantalla

•Widescreen, 16:9 a pantalla completa.


•Letterbox, donde una película widescreen se muestra dejando
barras arriba y abajo.
•Pan & Scan, donde una película widescreen se muestra como 4:3
pero más estrecha que la original.
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.5.3 DVD: Ángulos de cámara

Hasta 9 ángulos de cámara diferentes. Estas secuencias son


entrepuestas en el disco para permitir un rápido acceso a las
mismas, por lo que se reduce el bitrate general para permitir ese
tiempo de búsqueda.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

24
6.5.3 DVD: Codificación del audio
z Dolby Digital: (Dolby AC-3) proporciona sonido surround 5.1 y se usa actualmente en reproductores de
Laserdisc y DVD-Video. Es un formato con pérdidas que tiene bitrates que van desde 64 kbps (mono) a 448
kbps. El sonido surround 5.1 requiere de un mínimo de 384 kbps, pero Dolby recomienda usar el máximo de
448 kbps. El audio stereo suele requerir 192kbps. Los reproductores de DVD-Video convierten la salida
Dolby Digital 5.1 en Dolby Surround (ProLogic) usando las salidas analógicas stereo cuando no se dispone
de decodificador Dolby Digital.

z MPEG: También es un formato con pérdida. MPEG-2 proporciona sonido surround 5.1/7.1 con CBR (32-912
kbps, 384 kbps de media) o VBR. La tasa de muestreo se fija a 48 kHz. La opción 7.1 añade los altavoces
centro-izquierda y centro derecha. MPEG-1 layer II se usa como para Video CD.

z LPCM: Formato de audio sin comprimir, similar al Audio CD, pero con mayor frecuencia de muestreo y
cuantización. LPCM ofrece hasta 8 canales de 48/96 kHz de frecuencia de muestreo y 16/20/24 bits por
muestra, pero no todos al mismo tiempo. El bitrate máximo es 6144 Mbps, superior al de Dolby Digital o
MPEG-2, ofrece una calidad similar al DVD-Audio, pero deja poco ancho de banda para el vídeo.

z DTS (Digital Theater System): Es un formato de audio 5.1 con pérdida, frecuencia de muestreo de 48 kHz y
usa hasta 20 bits por muestra. La tasa de datos varía de 64 kbps a 1536 Mbps.

Disco Obligatorio Opcional

NTSC LPCM ó Dolby Digital LPCM, Dolby Digital, MPEG u otros

PAL/SECAM Linear PCM or MPEG-1 or MPEG-2 or Dolby Digital Linear PCM, Dolby Digital, MPEG or others

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.5.4 DV
z Estándar internacional creado por un consorcio de 10 compañías para
obtener un formato de vídeo digital para el consumidor

z Se muestrea el vídeo a 720 píxels por línea de escaneo.

z DV usa compresión intraframe: cada frame comprimida depende


completamente de sí misma y no de datos provenientes de otras frames

z También usa compresión adaptativa entre frames; si el compresor


encuentra poca diferencia entre los campos entrelazados de un frame,
los comprimirá juntos

z La información de vídeo DV se introduce en un flujo de datos de 25 Mbps


que, añadiendo el audio y la corrección de errores se forma un flujo total
de 36 Mbps

z Transferencia del vídeo al ordenador: IEEE-1394

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

25
6.5.4 DV: especificaciones
Características Descripción

Resolución de Vídeo D1 (720x576 PAL, 720x480 NTSC)

Compresión de Video DV

Bitrate Video 25 Mbps (CBR)

2 canales stereo a 32 kHz 12-bit PCM no lineal


Audio
1 canal stereo a(48/44.1/32) kHz 16-bit PCM lineal

Bitrate Audio 1000 kbps a 1500 kbps

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.5.4 DV: calidad de formatos


z D-5 (10-bit uncompressed digital) 10
z D-1 (8-bit uncompressed digital) 9.9
z Digital Betacam, Ampex DCT 9.7
z D-9 (Digital-S), DVCPRO50 9.6
z DV, DVCAM, D-7 (DVCPRO) 9
z MII, Betacam SP 8.9
z 1" Type C 8.7
z 3/4" SP 6.5
z 3/4", Hi8, SVHS 5
z Video 8, Betamax 4
z VHS 3
z EIAJ Type 1, Fisher-Price Pixelvision 1
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

26
6.6.- Compresión de vídeo (I).
z Una idea básica de compresión de vídeo consiste en emplear cualquiera
cualquiera de
los métodos vistos para la compresión de imágenes aplicado a cada
cada uno de
los cuadros o frames que se denominan INTRAFRAMES.
INTRAFRAMES.

z Sin embargo, los niveles de compresión que se pueden alcanzar de esta


forma son limitados por el tratamiento diferenciado de cada cuadro.
cuadro.

z Los métodos de compresión INTERFRAMES tratan de aprovechar las


características de redundancia temporal debida a la similitud entre
entre cuadros
vecinos, junto a redundancias espaciales, espectrales y psicovisuales para
obtener porcentajes de compresión mayores.

z Algunas aplicaciones pueden tener requerimientos específicos (p.e.


(p.e. acceso
aleatorio a todos los cuadros) que dicten el uso de técnicas intraframes en
lugar de interframes.
interframes.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.- Compresión de vídeo (II).


z Podemos clasificar los métodos de compresión de vídeo en cuatro clases:

– Basadas en forma de ondas (Waveform


(Waveform).). La idea de estos métodos es
estimar los contenidos de un cuadro o campo en la siguiente instancia
instancia a partir
de la información en un punto de la secuencia; esto se lleva a cabo
cabo mediante
técnicas de MOTION ESTIMATION.
ESTIMATION.

– Basadas en objetos (Object


(Object based).
based). Son la generalización de aquellas
empleadas para la compresión de imágenes en las que se descomponía
descomponía la
información visual en función de una serie de primitivas (por ejemplo
ejemplo contornos
y texturas) que en este caso incluirán como parámetro el movimiento
movimiento asociado
a las mismas.

– Basadas en modelos (Model


(Model based).
based). Hacen referencia a la búsqueda de modelos
que representen la información de la escena. Los modelos son objetos
objetos en 2D o 3D
predefinidos. Esta idea se incluye en el estándar MPEG-
MPEG-4.

– Basadas en fractales (Fractal coding).


coding). Como generalización de las vistas para
imágenes estáticas.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

27
6.6.1.- Estándares para compresión de vídeo

z Vamos a hacer un repaso de los estándares


realizados por comisiones internaciones hasta
llegar a formatos propietarios de codificación de
vídeo.
– MJPEG como representante de los denominados
métodos de compresió
compresión intraframe
intraframe.
– H.261 (desarrollado para videoconferencia que admite
tanto el mé
método intraframe como interframe
interframe).
– MPEG que está
están encaminados a mé
métodos interframe
interframe.
– Formatos QuickTime,
QuickTime, Video for Windows y otros como
ejemplos de sistemas propietarios.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.1.1- MJPEG
z El estándar Motion-
Motion-JPEG trata cada campo (ó cada cuadro) de una
secuencia de vídeo de forma diferente y le aplica un proceso de
compresión totalmente independiente del resto. Al igual que JPEG
obtiene una reducción de 20:1.

z Hay dos variantes usuales de MJPEG:


– MJPEG A,A, que obtiene ficheros más pequeños.
– MJPEG B,B, que obtiene ficheros de más calidad.

– BENEFICIOS:
z Modificaciones más precisas en un editor de vídeo.
z Podemos empezar a reproducir en cualquier cuadro.
– INCONVENIENTES:
z Como no se usa la redundancia Inter-
Inter-Frame (temporal), la compresión da como
resultado un fichero relativamente largo.
z Gran carga computacional.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

28
6.6.1.2.- H.261 (I).
z Es el estándar de compresión de vídeo utilizado para
videoconferencia.

z Describe los métodos de codificación y decodificación cómo parte de


un servicio audiovisual en múltiplos de p*64 Kbps (1<= p <= 30).

z Existen implementaciones hardware y software.

z Sus dos caracterí


características principales son:
– Determina el retraso má
máximo (150 milisegundos), para que las
comunicaciones bidireccionales de ví
vídeo ofrezcan, de forma efectiva,
realimentació
realimentación visual directa.
– Es posible realizar implementaciones hardware a bajo coste.

z De cara a futuras aplicaciones para el gran pú


público, se requerirá
requerirán
velocidades de transmisió
transmisión superiores. Para este propó
propósito se han
desarrollado H.263 y H.263+.
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.1.2.- H.261 (II).

Opera sobre imágenes no entrelazadas, codifica en modo YCbCr


y soporta como resoluciones de los formatos CIF y QCIF los que
se muestran en la figura siguiente:

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

29
6.6.1.2.- H.261 (III).
z Las redundancias espaciales se reducen mediante el
empleo de la transfomació
transfomación basada en DCT y la
correlació
correlación temporal mediante una codificació
codificación predictiva
del movimiento.

z Permite la utilizació
utilización de mé
métodos de compresió
compresión
Intraframe
Intraframe, donde se codifican bloques de 8x8 pixels de
cada imagen con ellos mismos.

z Tambié
También puede funcionar en modo Interframe donde se
codifican los cuadros con respecto a uno de referencia.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.1.3.- MPEG (I).


z El Moving Picture Experts Group ha dado nombre a una
familia de estándares que se aplica a la codificación de
señales de vídeo y en la cual se pueden distinguir entre
diferentes estándares con rangos de actuación distintos.
– MPEG-
MPEG-1:
z Es capaz de realizar su trabajo sobre medios de almacenamiento
como el CD-
CD-ROM, así como canales de comunicación del estilo de las
RDSI, LANs y WANs.
WANs.
z Codifica macrobloques (16x16) hasta en tres modos diferentes para
cada cuadro de la secuencia.
z Cada cuadro se codifica, en relación a los cuadros consecutivos con
técnicas de compensación del movimiento desde un cuadro anterior
anterior
(predictive mode)
mode) o hacia un próximo cuadro (bidirectional
(bidirectional mode).
mode).

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

30
6.6.1.3.- MPEG (II).
z A intervalos regulares, se fuerza a codificar todos los macrobloques en
modo intracode frame,
frame, para evitar la propagación de errores y permitir
un rápido acceso a cualquier cuadro decodificado en una secuencia
secuencia de
imágenes.

z MPEG-
MPEG-1 considera solo vídeo en formato de barrido progresivo.

z El espacio de representación de color es el YCrCb.


YCrCb.

z Las características diferenciadoras de MPEG-


MPEG-1 respecto a sus
predecesores son:
– Acceso aleatorio: cualquiera de los cuadros puede ser codificado en un
tiempo máximo conocido. Se consigue mediante la inclusión de puntos
puntos de
acceso independientes (I-
(I-frames)
frames) en la secuencia codificada.
– Permite operaciones de búsqueda rápida hacia delante/atrás.
– Retraso razonable en el proceso de codificación/decodificación.
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.1.3.- MPEG (III).


z La estructura de un fichero MPEG-
MPEG-1 tiene los siguientes
componentes:
– Secuencias formadas por grupos de imágenes
– Grupos de imágenes GOP (group
(group of pictures)
pictures) compuestas por
imágenes.
– Imágenes compuestas por trozos (slices
(slices).
). Existen diferentes tipos
de imágenes o cuadros: I, P y B; que indican diferentes grados de de
compresión.
– Los trozos están compuestos de macrobloques.
macrobloques.
– Los macrobloques están compuestos por un número de bloques.
– Los bloques, son vectores de 8x8 pixels.
pixels. Esta son las unidades
más pequeñas debido a la operación de transformación basada en
DCT.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

31
6.6.1.3.- MPEG (IV).

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.1.3.- MPEG (V).


z Los cuatro tipos de cuadros o slices MPEG son:
– Intra-
Intra-coded (I): son los de referencia y están completos.
z Al menos hay uno cada 10 o 15 frames.
frames.
z Están comprimidos con un algoritmo al estilo de JPEG de forma intra-
intra-
frame con DCT.
z Se utilizan como puntos de acceso aleatorio a la secuencia.
z También se les llama cuadros clave (key
(key frames).
frames).

– Predictive-
Predictive-coded (P): se codifican con respecto al frame anterior
(I o P a su vez).
z Realiza una predicción del movimiento.
z Hacen uso de codificaciones interframes,
interframes, en las cuales se realiza una
estimación de movimiento y se codifican mediante DCT las diferencias
diferencias
obtenidas.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

32
6.6.1.3.- MPEG (VI).
– Bidirectional predictive-
predictive-coded (B): bidireccional y relativa a
otras I o P. No se pueden utilizar nunca como referencias de
otros frames.
frames. Generan mejor compresión.
– DC-
DC-coded (D):(D): intraframe,
intraframe, para compresión sin pérdida

z El número de cada uno de estos tipos de cuadros en un GOP,


depende de la aplicación (en realidad de los tiempos de acceso y
requerimientos de velocidad que esta deba cumplir).

z El primer cuadro de un GOP siempre tiene que ser de tipo I.

z El orden en que son procesados los cuadros, no tiene por qué ser
secuencial en el tiempo, ya que la predicción para los cuadros tipo
tipo
P y B debe basarse en imágenes que ya hayan sido trasmitidas.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.1.3.- MPEG (VII).

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

33
6.6.1.3.- MPEG (VIII).
z Diferencias entre H.261 y MPEG-
MPEG-1.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.1.3.- MPEG-2

z Principios similares al MPEG-


MPEG-1

z Permite uso de secuencias entrelazadas

z Permite decodificación a menor calidad/resolución que la


contenida en la señal

z Mayor calidad, mayor complejidad que MPEG-


MPEG-1

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

34
6.6.1.3.1.- MPEG-4 (I).
z MPEG-
MPEG-4 trata más de agrupar los estándares ya existentes que
de crear nuevos formatos (formato de formatos).

z Se trata de una especie de meta-


meta-formato que engloba tanto la
posibilidad de almacenar imágenes y sonidos comprimidos,
como la de añadir objetos sintéticos, interpretar (decodificar y
renderizar)
renderizar) y representar una composición de escena a partir de
múltiples objetos.

z Además, describe la forma en que debe transmitirse y


sincronizarse el envío de los datos, bien sea a través de una red
red
o bien en un soporte físico local.

z Se encarga de la posible interacción del usuario con las


escenas descritas.
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.1.3.1.- MPEG-4 (II).


z Dispone de un conjunto de tecnologías para satisfacer las
necesidades de los autores de productos multimedia, los proveedores
proveedores
de servicios de red y los usuarios finales.

– AUTORES DE PRODUCTOS MULTIMEDIA:


z Les permite combinar varias tecnologías en una sola con mayor flexibilidad.
flexibilidad.
z Les otorga una mayor reutilización de sus creaciones al trabajar con objetos

– USUARIO FINAL:
z Le ofrece televisión digital, aplicaciones gráficas y multimedia interactivas,
comunicación en tiempo real, vigilancia a distancia, etc.

– PROVEEDORES DE SERVICIOS DE RED:


z Controlarán mejor el tráfico, puesto que el estándar contempla elel envío de
señales de control.
z Define unos niveles mínimos de calidad de servicio (QoS
(QoS)) para que cada
operador garantice un servicio de calidad según los requerimientos
requerimientos del cliente y
del canal a utilizar.
z Se puede optimizar el flujo de datos en función de su tipo y relevancia.
relevancia.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

35
6.6.1.3.1.- MPEG-4 (III).

z Las escenas audiovisuales MPEG-


MPEG-4 están compuestas por
multitud de objetos multimedia de forma jerárquica.

z MPEG-
MPEG-4 estandariza el número de objetos multimedia
primitivos que pueden ser de dos o tres dimensiones.
– Ejemplo: Si pensamos en una persona hablando en una clase y
queremos transmitir esta información de forma audiovisual,
podemos descomponer la escena en varios objetos diferentes,
como: imágenes estáticas (pizarra, fondo, etc), objetos de vídeo (la
animación de la persona hablando), objetos audio (la voz de esa
persona), etc.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.1.3.1.- MPEG-4 (IV).


z MPEG-
MPEG-4 (Escena. Composición de objetos multimedia)
– Las escenas son agrupaciones de objetos multimedia.
– Los objetos que componen la escena se agrupan en árboles y
subárboles.
– Esta idea se basa en el concepto de escena empleado en el
lenguaje VRML (Virtual Reality Modeling Language o Lenguaje de
Modelado de Realidad Virtual).
– La idea básica es que los objetos multimedia primitivos se agrupan
agrupan
para formar objetos multimedia más complejos de forma jerárquica.
jerárquica.
– De esta manera, el autor puede construir escenas tan complejas
como sea necesario y el usuario puede interactuar con un grupo dede
objetos como si de uno sólo se tratara.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

36
6.6.1.3.1.- MPEG-4 (V).

escena

presentación
profesor fondo 2D mobiliario
audiovisual

voz sprite
mesa

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.1.3.1.- MPEG-4 (VI).


z MPEG-
MPEG-4 (Sincronización de flujos de datos de los objetos multimedia)
– Debido a la presencia de varios objetos es un solo bloque, es
necesario tener en cuenta las necesidades de ancho de banda de
cada objeto para no tener que esperar al más lento.
– Esto se consigue mediante una capa de sincronización (capa de
sincronización de flujos) que se dedica exclusivamente a la gestión
gestión
y control de los objetos que se necesitan representar.
– Los objetos multimedia se transmiten en los que llamaremos flujos
de datos.
datos.
– Los flujos de datos se componen de flujos elementales de datos
(elementary stream,
stream, ES).
ES).
– Así pues, los objetos multimedia pueden necesitar varios flujos de
datos, que pueden ser de diferente naturaleza y que son
transportados en uno o mas flujos elementales.
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

37
6.6.1.3.1.- MPEG-4 (VII).
z MPEG-
MPEG-4 (Sincronización de flujos de datos de los objetos multimedia)
– Un objeto descriptor identificará los flujos asociados a un objeto
objeto
multimedia.
– Los descriptores pueden llevar indicaciones del nivel de calidad
(QoS)
QoS) apropiado que se requiere para la transmisión (p.e., la
máxima tasa de bit, la tasa de bit de error, la prioridad, etc).
– La capa de sincronización se encarga de sincronizar los flujos
elementales.
– La sintaxis de esta capa de sincronización es configurable en
multitud de modos por lo que se puede usar en distintos tipos de
sistemas.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.1.3.1.- MPEG-4 (VIII).


z MPEG-
MPEG-4 (Interacción con los objetos multimedia)
– Generalmente, el usuario final verá la escena tal cual el autor la ha
creado, aunque este pueda permitir cierto grado de interacción concon
la escena si la diseña de este modo.
– Entre otras cosas, el usuario podrá:
z Cambiar los puntos de vista o audición (navegar por la escena).
z Mover objetos de la escena a distintas posiciones.
z Arrancar y detener el flujo de eventos (ej
(ej:: iniciar y detener el vídeo).
z Elegir el lenguaje que desea emplear, caso de que se ofrezca soportesoporte
para varios.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

38
6.6.1.3.1.- MPEG-4 (IX).

Demultiplexión Descompresión
C
a
p ...............
Objetos primitivos
a
Descripción escena
Flujos Elementales escena

d
e presentación
profesor fondo 2Dmobiliario
audiovisual

voz sprite
mesa

R
e
d

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.1.3.1- Familia MPEG.


z El MPEG-
MPEG-4 introduce como caracterí
característica má
más notable sobre los
anteriores la facilidad de interacció
interacción con objetos visuales.
– Está
Está basado en tétécnicas de representació
representación de basadas en objetos.
– Los pixels de un objeto se consideran inseparables en la misma forma que
lo son las molé
moléculas en un objeto del mundo real debido a efecto de un
campo de fuerza.
– En este está
estándar, la señ
señal de ví
vídeo se descompone en diferentes objetos,
cada uno de los cuales tiene su respectiva informació
información de forma, textura y
movimiento.
– Estas entidades se codifican de forma independiente para permitir
permitir el
acceso directo y la manipulació
manipulación (es decir operaciones de cortar, pegar,
deformar, etc.).

z El está
estándar MPEG-
MPEG-7 pasa por un cambio fundamental en la forma de
representació
representación de la informació
información: la llamada representació
representación
semá
semántica.
ntica.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

39
6.6.1.3.1- MPEG-7 (I)

z Permite la descripción de contenidos por palabras clave y por significado


semántico (quién, qué, cuándo, dónde) y estructural (formas, colores, texturas,
movimientos, sonidos)

z Se asocia de forma natural a los contenidos audiovisuales comprimidos por los


codificadores MPEG-1 (almacena y descarga archivos audiovisuales), MPEG-
2 (televisión digital) y MPEG-4 (codifica audio y vídeo en forma de objetos),
pero se ha diseñado para que sea independiente del formato del contenido

z Incluye, además de la descripción de los contenidos, información sobre:


– tipo de compresión utilizada (JPEG, en dibujos; MPEG-2, en imágenes),
– condiciones para acceder (derechos, precio)
– clasificación (adultos, por ejemplo),
– enlaces a otros materiales relevantes (para acelerar la búsqueda)
– contexto (final de los 200 metros femeninos de los Juegos Olímpicos de
Verano de 2000).

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.1.3.1- MPEG-7 (II)

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

40
6.6.1.3.1- MPEG-7 (III)

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.1.3.1- MPEG-7 (IV)

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

41
6.6.1.3.1- MPEG-7 (V): Aplicaciones..
z Bibliotecas digitales (catálogos de imágenes, vídeos, música,
etc.)

z Servicio de directorios multimedia (algo similar a lo que podrían


ser unas Páginas Amarillas).

z Servicio de noticias electrónicas personalizado.

z Autorización para contenidos multimedia (p.e. música, canales de


televisión, etc.)

z Potencialmente, los dominios donde se pueden aplicar este


estándar son ilimitados y van desde aplicaciones tan obvias
como el periodismo a la educación, información turística,
entretenimiento o aplicaciones biomédicas, entre muchas otras.
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.1.3.1- MPEG: Evolución.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

42
6.6.1.4.- Cinepak
z El codec más utilizado si lo que interesa es el espacio.

z Permite definir el espacio entre key frames y la calidad


interframe,
interframe, eliminando má
más o menos informació
información en cada
uno de los fotogramas relativos.

z Tambié
También se suele poner definir la velocidad de
transferencia de datos má
máxima soportada, de modo que
Cinepak reducirá
reducirá la calidad hasta permitir que los datos
necesarios no sean superiores.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.1.5.- Sorenson Video


z Parece que va a ser el sustituto natural de Cinepak.
Cinepak.

z Tiene una gran calidad incluso con tasas de transmisió


transmisión
mínimas, con lo que se está
está convirtiendo en una de las
principales opciones para transmisió
transmisión de ví
vídeo en Web.

z Tambié
También es tremendamente asimé
asimétrico, como Cinepak.
Cinepak.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

43
6.6.1.6.- Indeo

z Indeo es una tecnologí


tecnología de compresió
compresión/descompresió
n/descompresión de
vídeo desarrollada por Intel para procesadores Pentium,
muy usada en los ficheros AVI, y QT, entre otros.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.1.7.- Quicktime

z Desarrollado por Apple Computer como una arquitectura


para sistemas multimedia multiplataforma.

z Se utiliza por desarrolladores de herramientas y


contenidos software para crear y distribuir de forma
sincronizada gráficos, sonidos, video, texto y música.

z No requiere hardware.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

44
6.6.1.8.- Animation

z Es el codec más utilizado para comprimir pelí


películas
generadas por ordenador (2 o 3-
3-d), por ejemplo una
animació
animación generada con Macromedia Director.

z Utiliza tambié
también compresió
compresión interframe.
interframe.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.2.1 DIVX/XVID
z Vídeo de alta calidad en un fichero de tamaño
reducido (CD de 650-700-800 o 900 MB)

z Al contrario que los ficheros de DVD que van


con compresión de vídeo en MPEG 2, utilizan
el la compresión en MPEG 4

z DIVX/XVID y AVI

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

45
6.6.2.1 DIVX/XVID vs DVD
z DIVX/XVID
– Resolución PAL (generalmente): 640x480 o menor
– Compresión vídeo: MPEG 4
– Compresión de audio: MP3, Ogg, WMA
– Bitrate de vídeo: 300-1000 kbps
– Tamaño/minuto: 1-10 MB/min.
– Compatibilidad con reproductores: cada vez mayor
– Potencia necesaria: mucha
z DVD
– Resolución PAL: 720x576
– Compresión vídeo: MPEG 2
– Compresión de audio: MPEG 1, 2, AC3, DTS
– Bitrate de vídeo: 3000-8000 kbps
– Tamaño/minuto: 30-70 MB/min.
– Compatibilidad con reproductores: máxima
– Potencia necesaria: mucha
– Calidad de visionado: excelente
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.2.1 Codecs DIVX/XVID


z El códec original DivX 3.xx se basa en el códec MPEG-4 V3 de Microsoft (ASF se basa en
MPEG-4 V2). Este códec fue hacheado y re-distribuido porque no se podía codificar ficheros
AVI con este códec de Microsoft, sólo se permitía crear ficheros ASF/WMV. DivX 3.xx también
incluía versiones hacheadas de códecs MP3 y WMA.

z El códec DivX4.xx no tiene nada que ver con el de Microsoft, fue desarrollado desde cero, y
sigue en desarrollo. Ambos códecs pueden estar instalados al mismo tiempo y cada uno
decodificará los contenidos codificados con ellos.

z OpenDivX, conocido como “DivX para Windows/Linux/Mac”, que es parte del proyecto de
código abierto del Proyecto Mayo, donde el códec original es referido como DivX ;-) Codec.
Las versiones de estos dos códecs también difieren. El original usa 3.xx, mientras que el del
Proyecto Mayo usa 4.xx.

z DivX 5.x de DivXNetworks, de pago. DivX 5.1 pretendió revolucionar la creación, producción y
distribución de vídeo digital, incluso a través de Internet. Es más rápido que los códecs
anteriores y más eficiente, permitiendo la reproducción en tiempo real de resoluciones de
vídeo de alta definición sin usar hardware especial. Es capaz de decodificar flujos de vídeo
MPEG-4 Simple Profile y MPEG-4 Advanced Simple Profile (ISO/IEC 14496-2).

z XviD (DivX al revés) parte del formato de compresión de vídeo MPEG-4. Sin embargo, en este
caso, se desarrolla bajo el proyecto de software libre del mismo nombre.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

46
6.6.2.2 xVCD
z xVCD PAL:
– Vídeo: MPEG-1 con CBR o VBR; 352x288 píxels: 25 frames/s.
– Audio: 32-384 kbps MPEG-1 Layer 2.
– Extra: Menús y capítulos. Imágenes fijas 704x576, 352x288.

z xSVCD PAL:
– Vídeo: MPEG-2 con CBR o VBR; 352x288;352x576;720x576: 25 frames/s, hasta con 4
subtítulos
– Audio: 32-384 kbps MPEG-1 Layer 2 con hasta 2 pistas de audio.
– Extra: Menús y capítulos. Imágenes fijas 704x576, 352x288.

z xVCD NTSC:
– Vídeo: MPEG-1 con CBR o VBR; 352x240; 29’97 frames/s
– Audio: 32-384 kbps MPEG-1 Layer 2.
– Extra: Menús y capítulos. Imágenes fijas 704x480, 352x240.

z xSVCD NTSC:
– Vídeo: MPEG-2 con CBR o VBR; 352x240;352x480;720x480: 29’97 frames/s, hasta con 4
subtítulos
– Audio: 32-384 kbps MPEG-1 Layer 2 con hasta 2 pistas de audio.
– Extra: Menús y capítulos. Imágenes fijas 704x480, 352x240.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

Comparativa
Format VCD SVCD DVD DivX MOV ASF RM DV
XviD SMR
WMV nAVI

Resolution 352x240 480x480 720x480 640x480² 640x480² 320x240² 320x240² 720x480


NTSC 352x288 480x576 720x576² 720x576
PAL

Video MPEG1 MPEG2 MPEG2, MPEG4 Sorenson, MPEG4 RM DV


Compression MPEG1 Cinepak,
MPEG4

Video bitrate 1150 kbit/s 1000~2500 3000~9000 300~1000 300~2000 100~500 100~500 25 Mbit/s
kbit/sec kbit/s kbit/s kbit/s kbit/s kbit/s kbit/s

Audio MP1 MP1 MP1, MP2, MP3, WMA, Sorenson, MP3, WMA RM DV
Compression AC3, DTS, OGG, AAC, Cinepak,
PCM AC3 MP3

Audio bitrate 224 kbit/s 128~384 192~448 64~448 64~192 64~128 64~128 1000~1500
kbit/sec kbit/s kbit/s kbit/s kbit/s kbit/s kbit/s kbit/s

Size/min 10 MB/min 10 - 20 30 - 70 1 - 10 1 - 20 1-5 1-5 216 MB/min


MB/min MB/min MB/min MB/min MB/min MB/min

Min/74min 74min 35-60min 15-20min 60-180min 60-180min 120-300min 120-300min 3min


CD

Hours/DVDR N/A N/A 2-4hrs 13-26hrs 13-26hrs 26-40hrs 26-40hrs 20min


(3-7hrsª)

Computer Low High Very High Very High High Low Low High
CPU Usage

Quality Good Great*Sistemas MultimediaGreat*


Excellent* e Interacción Gráfica-
Great* Curso 2006/07Decent*
Decent* Excellent

47
6.6.3.1 AVI
z Existen dos tipos generales de AVI
– basados en Video for Windows (los primeros en aparecer)
z ¿VBR, VFR?
– basados en DirectShow (originalmente ActiveMovie)

z Contenedor que puede guardar datos en su interior codificados


de diversas formas y con la ayuda de diversos códecs

z Existe la posibilidad de almacenar los ficheros en un formato AVI


"raw" o crudo, es decir, sin compresión

z Aunque un AVI puede tener n número de flujos, lo más común es


un flujo de vídeo (vids) y otro de audio (auds)

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.3.1 AVI: Estructura


RIFF ('AVI '
LIST ('hdrl'
'avih'(<Main AVI Header>)
LIST ('strl'
'strh'(<Stream header>)
'strf'(<Stream format>)
[ 'strd'(<Additional header data>) ] (sobre códec)
[ 'strn'(<Stream name>) ] (descripción)
...
)
...
)
LIST ('movi'
{SubChunk | LIST ('rec '
SubChunk1
SubChunk2
...
)
...
}
...
)
['idx1' (<AVI Index>) ] )
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

48
6.6.3.1 AVI: Cabecera principal (avih)
z Número de frames

z Número de flujos

z Frames iniciales

z Max bytes

z Tamaño de buffer

z Microsegundos/frame

z Frames/segundo

z Tamaño (p.ej., 320x240)

z Flags
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.3.1 AVI: Cabecera de flujo (strh)


z Tipo de flujo (‘vids ‘, ‘auds’)

z Manejador de flujo (‘cvid’ para cinepak)

z Muestras por segundo

z Prioridad

z Frames iniciales

z Comienzo

z Longitud en frames

z Longitud en segundos

z Flags

z Tamaño de Buffer

z Calidad

z Tamaño de muestra
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

49
6.6.3.1 AVI: Cabecera de bloque (strf)
z Flujo de vídeo:

– Tamaño (ej, 320x240)

– Profundidad de bit (ej, color 24 bits)

– Colores usados

– Compresión

z Flujo de audio

– wFormatTag: formato (ej, WAVE_FORMAT_PCM)

– Número de canales

– Muestras por segundos

– Bytes medios por segundo

– Número de bloques de alineamiento

– Bits por muestra


Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.3.1 AVI: Cabecera de datos (movi)


z La lista ‘movi’ contiene los frames de video y los samples de audio.

z Los bloques de datos pueden residir directamente en la lista ‘movi’ o


ser agrupadas en listas ‘rec’, que agrupan bloques que deben ser
leídos juntos.

z Cada bloque de datos es identificado por un número de 2 dígitos


seguidos de 2 caracteres que describen el tipo de información del
bloque. El significado de los caracteres es el siguiente:
– Db frame de vídeo no comprimida
– Dc frame de vídeo comprimida
– Pc cambio de paleta
– Wb datos de audio

z Por ejemplo, si el flujo 0 contiene audio, los datos valdrían 00wb. Si es


de vídeo tendría valor 01db o 01dc.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

50
6.6.3.2 OGM
z OGM significa Ogg Media File y fue desarrollado por Tobias Waldogels,
siendo un formato de vídeo avanzado que puede hacer muchas cosas a
las que no llega el formato AVI:
– Soporte de múltiples pistas de subtítulos
– Soporte de múltiples pistas de audio en varios formatos (MP3, Dolby Digital,
Ogg Vorbis, WAV).
– Soporte de capítulos
– Soporte de audio OGG Vorbis.

z OGM es fundamentalmente una extensión de Ogg, que no fue diseñado


originalmente para contener audio y vídeo.

z OGM no era un proyecto de código abierto a pesar de basarse en el


entorno Ogg, aunque actualmente el creador se ha unido al equipo que
lleva el proyecto Ogg y ha donado todo el código.

z Compresión Xvid aunque se está completando en Ogg Theora,


supuestamente el mejor codec para el formato OGM.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.6.3.3 Matroska
z Formato código-abierto, multiplataforma, libre de patente, más reciente
que OGM

z Contenedor video(s) + audio(s) + subtítulo(s).

z Formatos de audio soportados incluyen Ogg Vorbis, AAC, MP3 y AC3.

z EMBL

z Incorpora características tales como:


– Los ficheros pueden ser emitidos mediante streaming por HTTP/RTP a través
de Internet
– Búsqueda rápida en el fichero
– Recuperación ante errores
– Menús (como los DVDs)
– Entradas de capítulos
– Subtítulos y audio seleccionables
– Extensibilidad modular

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

51
Matroska: Estructura fichero(I)
Header

Meta Seek Information

Segment Information

Track

Chapters

Clusters

Cueing Data

Attachment

Tagging

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

Estructura fichero (II)


z Header
– Versión de EBML
– Tipo de documento
z Metaseek information
– Índice que localiza el resto de grupos en el fichero
z Segment information
– Título del archivo
– Identificador único para el archivo ( ¿y del siguiente?)
z Track
– Tipo de pista
– Resolución
– Tasa de muestreo
– Codec(s) usados

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

52
Estructura fichero (III)
z Chapters
– Lista de capítulos (puntos de salto)
z Clusters
– Frames de audio y video para cada pista
z Cueing data
– Índices para cada pista
z Attachment
– Para adjuntar cualquier tipo de fichero
z Tagging
– Etiquetas relacionadas con fichero y pistas: autor,
cantante, etc
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.7 Hardware para editar vídeo


z Cámara miniDV con interface Firewire ( IEEE1394) de entrada/salida.

z Una tarjeta de interface Firewire para el ordenador.

z Un software de edición de video no-lineal tal como Adobe Premiere.

z Un ordenador potente con un gran disco duro. Tener en cuenta que el


formato DV emana 3.7 Mbytes de datos por segundo. 10 minutos son 2.2
G y 90 minutos son 20 Gigas. Además se generan grandes archivos
temporales durante la edición.

z Una tarjeta de edición DV con codec HW ( opcional ). Como veremos


después, hay operaciones en las que es necesario descomprimir las
imágenes DV al formato RGB u otros. Existen dos opciones :
– que lo haga la CPU del ordenador a través de un driver que suele venir con la
tarjeta Firewire,
– que lo haga una tarjeta PCI con un chip especializado.
– La potencia de los procesadores actuales minimizan la importancia de este
aspecto

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

53
6.7.1 Tarjeta firewire/IEEE1394/iLink
z Bus serie de alta velocidad complementario del USB . Mejora la conectividad de dispositivos
incluyendo videocámaras, dispositivos de almacenamiento y periféricos. Debe coexistir
pacíficamente con USB quedando éste para periféricos de menor ancho de banda. No son
compatibles.
1394/FireWire/i.Link USB

Maximo número de disposititivos 62 127

Inserción en caliente (enchufar sin resetear) Sí Sí

Máx. longitud del cable entre dispositivos 4,5m 5m

Velocidad de transferencia 400Mbps (50MB/sec) 12mbps (1.5MB/sec)

800Mbps (100MB/sec)
Velocidad en el futuro version 2.0 hasta 460Mbps
1Gbps+ (125MB/sec+)

Compatible Macintosh Sí ?

Conexión de dispositivos Internos Sí No

- Videocámaras DV
Teclados
- Cámaras de alta resolución
Ratones
- HDTV
Monitores
- Discos duros
Periféricos típicos Joysticks
- DVD-ROMs
Cámaras de baja resolución
- Impresoras
CD-ROMs de baja velocidad
- Escáneres
Modems

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.7.1 El conector firewire


z conector para 6 cables : 4 de señal ( en modo diferencial ) y dos más para
alimentar los dispositivos externos (algunas tarjetas Firewire, como la Digital
Origin IntroDV vienen con un conector de 4 pines y un cable de 4 pines por
ambos extremos.

z Las cámaras de vídeo, sin embargo, montan un conector de 4 pines , ya que no


necesitan ser alimentadas externamente. Por tanto, se necesita un cable de " 6
a 4 pines" para conectar una Firewire a una miniDV.

z Si queremos conectar dos cámaras miniDV ( una de ellas con capacidad de


grabación) se necesita un cable de "4 a 4 pines".

z Mucho cuidado, no conectar al reves estos conectores, aunque parezca


imposible hay quién lo ha hecho ( en el conector de la tarjeta firewire) con
resultados fatales ( cámara con el circuito de entrada dv quemado)

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

54
6.7.2 Videocámaras digitales
z Zoom óptico vs zoom digital
z Autofocus
z Iris
z Balance de blancos
z CCD: imagen -> señal eléctrica
– 4:3, ¿16:9?
– Número de CCDs
– Tamaño CCD
– Óptimo: 3 CCD 720x576

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.7.2 Filtros de color

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

55
6.7.2 Exploración progresiva
z Captura cada campo de manera completa
z Ideal a 25 fps, no habitual
z Ventajas
– Todos los fotogramas son completos: fotos
– Mejor reproducción en pantallas progresivas (p.ej.,
ordenador)
z DV: entrelazado ¿¿??
z Conveniencia profesional frente al modo
entrelazado

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.7.2 Resolución
z La parte digital de la cámara trabaja con imágenes en
formato 720x576 x 24 bits
z Eso no implica que todas tengan la misma
resolución: óptica y CCD.
z Medida en líneas horizontales perfectamente
distinguibles unas de otras sin que se forme un
"todo”
z Ejemplo: sistema PAL de televisión especifica 625
líneas (575 útiles): este es el máximo posible teórico,
pero está claro que pocas videocámaras o televisores
brindan esa resolución

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

56
6.7.2 Digitalización
z La calidad también depende de otros factores, como la
digitalización

z Tras obtener los valores RGB se pasa al YUV

z (Y=luminancia, U=R-Y, V=B-Y). La señal de luminancia


se muestrea a una frecuencia de 13.5 Mhz, mientras
que la R-Y y la B-Y se hace a 3.375 Mhz (4:1:1)

z En sistemas de vídeo profesionales, como el D-1 sin


compresión, se usa una relación 4:2:2 , es decir, el B-Y
y el R-Y se muestrean al doble para así obtener una
mejor calidad de la señal de color.
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.7.2 Otros aspectos


z Corrección de errores
z Audio digital y estéreo
– 2 pistas 16 bits 48 Khz
– 4 pistas 12 bits 32 Khz
z Información de control
z Salidas: S-video, Video compuesto, IEEE1394,
RS-232
z Entradas: muy limitadas
z Memoria flash

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

57
6.7.2 Diagrama de bloques

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.8.- Proceso de creación de vídeo en multimedia


z Debido al coste en tiempo, espacio, equipo (y dinero, por
supuesto, si sumamos todo esto) especialmente alto del
vídeo, el proceso de creació
creación debe estar bien planificado
para conseguir el resultado apetecido sin desperdiciar má
más
recursos que los imprescindibles.

z Podrí
Podríamos generalizar el proceso de elaboració
elaboración de ví
vídeo
en los siguientes pasos:
– Diseñ
Diseño,
– Obtenció
Obtención.
– Digitalizació
Digitalización.
– Edició
Edición.
– Integració
Integración.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

58
6.8.1.- Diseño (guión) (I).
z Deberí
Deberíamos diseñ
diseñar el esquema del ví
vídeo a incluir en
nuestra aplicació
aplicación multimedia. Para ello se emplean varias
técnicas:
– Diagrama de flujo de la aplicació
aplicación, indicando todos los puntos
donde aparecen vívídeos y recogiendo todos y cada uno de ellos,
identificando posibles partes comunes y determinando las
necesidades siempre antes de empezar a obtener los medios.

– Guió
Guión de cada vívídeo a elaborar (como en el proceso
cinematográ
cinematográfico, aunque aquí
aquí caben posibilidades de interacció
interacción o
integració
integración de otro tipo de medios). Se suele usar mucho el
concepto de storyboard,
storyboard, que es una especie de desarrollo en
viñ
viñetas dibujadas a nivel esquemá
esquemático de lo que va a contener el
vídeo.
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.8.1.- Diseño (guión) (II).


z Los storyboards se pueden usar para má más partes de una
aplicació
aplicación multimedia (animaciones, efectos grá gráficos,
incluso diseñ
diseño de interfaz). Cada viñ
viñeta puede indicar
anotaciones adicionales de voz en off,
off, de mú
música, efectos
pretendidos, duració
duración aproximada en tiempo, tipo de plano
de cá
cámara, etc.

z Otro punto importante del diseñ


diseño es la calidad que va a
tener el vívídeo final, en cuanto a tamañ
tamaño del marco
(resolució
(resolución), tipo de compresió
compresión asumida, etc.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

59
6.8.2.- Filmación/obtención de los cortes de
vídeo y audio

z Una vez que está


está claro que hay que filmar o que ví
vídeos ya
filmados hay que obtener, viene el proceso de obtener el
material audiovisual. Para obtener resultados
profesionales normalmente hay que contar con equipo
profesional, con lo que es una parte que habitualmente se
subcontrata en producció
producción multimedia.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.8.3.- Revisión y digitalización

z Antes de digitalizar, hay que revisar cuidadosamente el


material obtenido para no utilizar demasiado tiempo y
espacio en cortes no utilizables (aunque la precisió
precisión de
décimas de segundo ya se alcanzará
alcanzará despué
después en la
producció
producción del montaje).

z Es conveniente agrupar todo el proceso de digitalizació


digitalización
para que todo el material esté
esté disponible cuando despué
después
se realiza el montaje.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

60
6.8.4.- Edición/montaje
z Es el proceso mámás interesante y normalmente el má
más complejo y
consumidor de tiempo de la producció
producción de ví
vídeo.

z Los programas de edició


edición no lineal de ví
vídeo actuales, como Adobe
Premiere,
Premiere, permiten incorporar de modo sencillo gran cantidad de
efectos y posibilidades de edició
edición para acabados semiprofesionales.

z En la edició
edición hay que sincronizar el sonido con el ví
vídeo. A menudo
para esto se graba sonido independiente del ví vídeo (voces en off,
off,
bandas sonoras, efectos de sonido, etc.).

z De la misma forma, los grá


gráficos está
estáticos, las animaciones a combinar
con el ví
vídeo y las titulaciones se pueden elaborar en el montaje o
preparar antes cuando su complejidad es considerable.
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.9.- Edición de vídeo

z La edició
edición lineal usa algú
algún componente analó
analógico, de modo
que sobre la marcha tenemos que generar efectos de
transició
transición, montaje y superposició
superposición para crear el ví
vídeo final.
Hacen falta dos o tres magnetoscopios (uno de grabació
grabación).

z En la edició
edición no lineal,
lineal, en cambio, todo el soporte se digitaliza
previamente, con lo que podemos editar lo que sea necesario
sin necesidad de sincronizació
sincronización previa, retocar el resultado, etc.
utilizando solamente el ordenador en el proceso. Con un
magnetoscopio puede ser suficiente, primero para digitalizar las
tomas que queramos procesar y finalmente para registrar el
resultado final.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

61
6.9.1.- Edición lineal y no lineal

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.9.2.- Efecto croma

z El efecto croma es muy conocido en edición de vídeo


y consiste en determinar un color como transparente
para poder superponer dos vídeos o un vídeo con una
imagen (las clásicas filmaciones sobre fondo azul).
También puede realizarse este efecto si la pista de
vídeo contiene canal alfa.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

62
6.10 Vídeo en Internet
z Mediante plug-ins
z Hay dos maneras de reproducir vídeos:
– Asíncrona: cargándolos primero y visualizándolos
después.
– Síncrona: visualizándolos según se cargan. Dadas
las características especiales del vídeo como
soporte, esto nos obliga a:
z Tener suficiente ancho de banda
z Dedicar gran parte del hardware, porque realmente la
única manera de tener ancho de banda es con una buena
línea, un buen servidor, y un mecanismo de
codificación/decodificación en tiempo real.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.10 Vídeo por Demanda


Hay dos modelos distintos de VOD:
z Push:
– El dispositivo doméstico es una especie de terminal "tonto"
audiovisual.
– Manda comandos al servidor, recibe los datos de él, y los visualiza.
– La aplicación se encuentra en el servidor.
– Sólo la visualización y las comunicaciones tienen que
estandarizarse para fabricar dispositivos.
z Pull:
– El servidor opera como una fuente de datos (ya sea para carga -
downloaded- o para muestra en directo -streamed-).
– La aplicación, que también se carga del servidor, se ejecuta en el
dispositivo, que no puede ser por ello un terminal "tonto".
– Las propias aplicaciones deben estandarizarse entonces entre el
servidor y el dispositivo usuario.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

63
6.10.1 Soporte de vídeo para web
z QuickTime:
– Es el más universal (Windows, Mac, Unix...). Desarrollado por Apple.
– Además de vídeo digital también suministra entornos de gestión de audio digital, realidad
virtual 3D y otros tipos de datos multimedia con un soporte basado en pistas.

z AVI:
– (Audio Video Interleave) Sólo para Windows. Carece del sofisticado soporte multimedia y de
sincronización de QT.

z Otros formatos:
– MPEG (Motion Picture Experts Group) es el más utilizado, aunque es bastante exigente en
software (y/o hardware).

z Vídeo continuo:
– Hay software de vídeo con streaming para Internet. Algunos son:

z VDOLive. Suministra reproductores y utilidades de creación gratuitos. Tiene un sistema


de compresión propietario, VDOWave, que intenta conservar audio y velocidad de cuadro
a costa de la calidad de imagen.

z StreamWorks. Diseñado para ser un servicio de difusión y codec en tiempo real. Utiliza
una variedad de MPEG, e intenta conservar la calidad de la imagen a costa de la
velocidad de cuadro. Con módems más bien parece una secuencia de diapositivas que
un vídeo.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.10.2 Insertar clips en páginas Web


z Archivo
– <a href=”my_file.rm”>My Real File</a>.
z Servidor streaming windows media
– <a
href=”mms://mystreamingserver.myuni.ac.uk/mymedia/my_file.asf
”>
z Real Server
– <a
href=”rtsp://mystreamingserver.myuni.ac.uk/mymedia/my_file.rm”
>.
z Especificación de protocolo
– Puntero al Ramgen
z <a href=”http://[realserver.com]:[port]/ramgen/file.rm”>Click me</ a>
– Archivo de configuración
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

64
6.10.3 Videoconferencia en Web
z La videoconferencia se basa en la captura de contenidos en directo.

z Ventajas:
– Aumentar el impacto del evento a una audiencia más numerosa.
– Los eventos en directo permiten comunicación en los dos sentidos.
– Permite el almacenado del evento para posteriores consultas.

z Desventajas:
– Planificación técnica y personal para un evento en directo que para uno
por demanda.
– Conexión rápida, que deberá ser comprobada de antemano.
– Dependiendo del volumen de la audiencia y de la cantidad de ancho de
banda de ella, deberemos ser capaces de satisfacer esa demanda.
– Deberíamos tener una máquina secundaria capaz de emitir por si
ocurriera algún problema.

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.10.4 Real Audio y Video

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

65
6.10.5 Video Streaming

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

6.10.5 Video Streaming:


Reproductores

Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

66
6.10.6: Servidores de streaming
z Servidor RealNetwork
– Es una plataforma muy estable, rápida y amigable.
– Tiene posibilidades de administración remota y es muy seguro.
– Soporta: Microsoft Windows NT/2K/XP/.NET, todo tipo de Linux, FreeBSD y Solaris.
– Fácil instalación.
– Costoso.
– Formatos soportados: Windows Media, QuickTime, RealVideo, MPEG-1, MPEG-2, MP3 y MPEG-
4.

z Microsoft Windows Media Server:


– Viene dentro del servidor W2000/.NET, por lo que sólo se ejecuta sobre un Windows Server.
– Maneja más de 3000 usuarios por servidor sin coste de licencia.
– Es una plataforma rápida y eficiente aunque los archivos no están tan seguros.

z Apple QuickTime Streaming Server / Darwin Streaming Server


– Es una solución basada en Macintosh, para los que ofrece un amplio rango de compatibilidad
de ficheros de streaming, incluyendo los estándares MOV, MP3, MPEG-4 y Shockwave Flash a
más de 4000 usuarios por servidor. También proporciona un servidor gratuito basado en PERL
llamado Darwin para:
z Red Hat Linux 7.1
z Solaris 8 (SPARC)
z Windows NT Server 4.0/Windows 2000 Server
– Darwin no es muy amigable y su configuración requiere de un administrador experto
– Amplio abanico de formatos de archivo compatibles y más de 2000 usuarios por servidor.
– Por debajo de 512 Kbps es inferior a los otros pero por encima de 1000 kbps ofrece mayor
calidad.
Sistemas Multimedia e Interacción Gráfica- Curso 2006/07

67

Você também pode gostar