Você está na página 1de 10

Conceptos Bsicos de Vdeo Al intentar comprender cmo se almacena y se muestra el vdeo debemos retroceder en el tiempo y fijarnos en una tecnologa

muy obsoleta: la televisin por tubo de rayos catdicos. Sin dar un curso de Fsica, un tubo de un televisor es un gran trozo de metal que no tiene aire dentro. Dentro de este tenemos un ctodo que emite electrones cuando se calienta (por eso la imagen tarda un rato en aparecer cuando se enciende la TV, el ctodo debe calentarse primero hasta la temperatura apropiada para emitir electrones). Hay tambin un fuerte campo electromagntico que acelera los electrones hacia la parte frontal del tubo, y que posiciona el haz de electrones (son muchos electrones los que se lanzan hacia la parte frontal del tubo). La parte frontal del tubo est cubierta de fsforo y cuando los electrones la golpean, emite luz hacia el otro lado (el lado en el que estars t). Debajo puedes ver un esquema de un CRT (Cathodic Ray Tube, Tubo de rayos catdicos).

En un principio las televisiones eran slo en blanco y negro, con lo que era suficiente con un slo haz de electrones. Ahora, para poder ver una pelcula debes escribir esta por toda la pantalla, as que el haz de electrones debe barrer la pantalla. La frecuencia de barrido se conoce normalmente como tasa de refresco (refresh rate). La tasa de refresco se escogi de acuerdo con los ciclos de los sistemas elctricos que se usaban: Norteamrica y parte de Japn usan 60 Hz, Europa, Oriente Medio y partes de Asia usan 50 Hz. Esto dio lugar a dos sistemas de TV que compiten entre s: NTSC: National Television Standard Committee. Tambin conocido como "Never the same color" (nunca el mismo color) porque no hay dos imgenes NTSC que se vean igual. El sistema NTSC tiene 525 lneas horizontales de las cuales apenas 487 se ven en la pantalla y tiene una tasa de refresco de 60 Hz entrelazada (veremos esto ms adelante). PAL: Phase Alternating Line. El sistema PAL tiene 625 lneas horizontales, de las cuales apenas 540 se ven en la pantalla y tiene una tasa de refresco de 50 Hz entrelazada. Ahora, en la poca en la que aparecieron en el mercado las primeras TVs, la tecnologa que permita escribir 525 lneas 60 veces por segundo, o 625 lneas 50 veces por segundo tena un precio prohibitivo que no era adecuado para el mercado de masas.

Reducir la tasa de refresco habra requerido circuitos ms complicados y no era una opcin tampoco - adems, la mente humana tiene un lmite inferior para lo que acepta como movimiento continuo. Pero los ingenieros de TV tuvieron una idea: Qu pasara si escribisemos nicamente una de cada dos lneas en cada barrido, y escribisemos la otra mitad durante el siguiente barrido? De este modo slo necesitaramos 25/30 imgenes por segundo (lo que implica menos ancho de banda, lo que implica ms cadenas de TV en la misma banda de frecuencia), y el ojo humano seguira aceptando esto como movimiento continuo. A esta idea de dividir la imagen en dos partes se la llam entrelazado (interlacing), ya a las imgenes divididas, campos (fields). Visto de modo grfico, un campo es bsicamente una imagen con una lnea negra de cada dos (o blanca, lo que prefiris). Pero aqu tenis una imagen para que podis imaginar mejor lo que est pasando: Durante el primer barrido, el camposuperior se escribe en la pantalla. Como podis ver, se escriben las lneas 1, 3, 5, etc.y despus de escribir cada lnea, el haz de electrones se mueve a la izquierda antes de escribir la siguiente lnea. Como podis ver a la izquierda, ahora la imagen muestra un efecto de "peinado", parece que lo estis viendo a travs de un peine. Cuando la gente habla de artefacto de entrelazado (interlacing artifacts) o dicen que su imagen est entrelazada, se suelen referir a esto. Una vez que se han escrito todas las lneas impares, el haz de electrones regresa a la esquina superior izquierda de la pantalla y comienza a escribir las pares. Como el fsforo tarda un momento en dejar de emitir luz y dado que el cerebro humano es demasiado lento, en vez de dos campos distintos, lo que vemos es una combinacin de los dos - en otras palabras, la imagen original. Cuando finalmente lleg la TV en color, la tecnologa de entrelazado sigui siendo la misma, pero se necesitaba un tubo de rayos catdicos ms sofisticado. En vez de emitir un nico haz de electrones, se emiten 3 haces de electrones, con los colores rojo, verde y azul. Cuando colocas puntos de distintos colores lo suficientemente cerca unos de otros, el ojo humano no ver puntos individuales, sino un solo punto y unir los colores para crear un nuevo color. Debajo podis ver un esquema de un CRT en color.

Las TVs usan un sistema de color aditivo para mostrar toda clase de colores. Para ms informacin sobre las mezclas de colores aditivas, por favor, referos a EPICentre Digital Imaging Basics. En el mundo del NTSC el cambio al color requiri un cambio ms: la tasa derefresco deba disminuirse ligeramente, de 60 Hz a 59.97 Hz (quedando en 29.97 imgenes por segundo) para ajustarsea los colores - por este motivo tenemos estas tasas de refresco tan extraas en el mundo del NTSC en la actualidad. Ahora, antes de que procedamos a ver cmo filmaron las pelculas de Hollywood, echemos un vistazo a los monitores de los PCs. El CRT tradicional de un PC es distinto de las pantallas de TV. Cuando los PCs aparecieron en el mercado, se pudo finalmente escribir una imagen entera en un barrido - esto tambin se llama escaneado progresivo (escaneado porque el haz de electrones "escanea" cada lnea de izquierda a derecha). Los primeros monitores de PC an utilizaban modos entrelazados, pero el mayor contraste y el brillo de los fondos nos daba tal dolor de cabeza que ahora tenemos la suerte de que la mayora de las pantallas ya no emplean este modo. Hoy en da todas las pantallas de PC escriben una imagen as:

Recientemente ha habido pantallas de TV que trabajan en modo de escaneo progresivo. Estos modelos, sin embargo, son muy raros, y requieren una seal distinta, ya que el modo tradicional de conectar los vdeos, reproductores de DVD o cmaras a la TV no trabaja con imgenes progresivas. Las pantallas de LCD y de plasma slo pueden escribir imgenes progresivas - cuando reciben una imagen entrelazada necesitan trucos tcnicos para mostrar una imagen razonable. A estas tcnicas se las llama normalmente

desentrelazado (deinterlacing). Unas palabras ms sobre TVs antes de que procedamos: Como quiz recordis, las TVs antiguas tenan tubos que no eran en absoluto planos. Cuanto ms nos alejamos del centro del tubo (el punto en el cual el haz de electrones ira directamente a la capa de fsforo sin desviarse), ms complicado es escribir una imagen geomtricamente correcta y precisa. Incluso en la actualidad no veris el tubo entero, las ltimas pulgadas se esconden tras la carcasa de la TV. Esa es la razn por la que ambos formatos de TVtienen ms lneas de las que podemos ver, el resto de las lneas est y siempre estar escondido. Pero estas lneas se usan: los canales de TV transmiten pginas de texto en estas lneas, pueden contener seales que estropean el amplificador (gain controller) automtico de tu aparato de vdeo (el sistema de proteccin anti-copia analgico Macrovision), etc. Antes de comenzar con el desentrelazado hay unas cuantas cosas que deberais saber acerca de cmo se graban las pelculas. La mayora de las pelculas destinadas al cine se graban en un material similar al que usamos en la fotografa tradicional. En un segundo, se hace una escena con 24 imgenes. As que, en teora, podras rodar una pelcula con tu cmara de fotos, slo que tendrasque cambiar de rollo cada segundo o segundo y medio (y normalmente las cmaras de fotos no pueden hacer 24 fotos en un segundo;). Cuando vemos estas pelculas en el cine vemos 24 imgenes (o frames) por segundo. Pero cuando compramos estas pelculas en cinta de vdeo VHS, o en DVD para verlas en nuestras cutres pantallas de TV tenemos un problema. Las pantallas PAL necesitan 25 imgenes por segundo y cada imagen debe dividirse en 2 campos. Pero dado que 25 no es mucho mayor que 24, lo que solemos hacer en los pases en los que usa PAL es tomar la pelcula original a 24 fps (frames por segundo) y acelerarla a 25 fps. Esto implica que las voces y la msica tienen un tono ms agudo y que la pelcula es un poco ms corta, pero a no ser que compares una con otra, apenas se nota. Ahora vamos con el NTSC. Aqu necesitamos 29.97fps. No se puede acelerar la pelcula, ya que la diferencia de velocidad sera demasiado grande para que la gente no la notase. As que lo que se hace es que tras dividir los frames en campos, se repiten ciertos campos para obtener una mayor tasa de refresco. Bsicamente, 4 frames se convierten en 10 campos, como se muestra abajo: Entonces, como podis ver en la imagen, en contra de lo que podis pensar, un mayor framerate no implica movimiento ms fluido - al contrario, NTSC es un poco ms desigual, ya que algunos campos se muestran dos veces (el primer campo del frame 2, y el segundo campo del frame 4). En la TV esto no da mucho problema, ya que la mala calidad evita que nos demos cuenta de que algo no va muy bien. Pero las cosas cambian cuando entramos en el mundo progresivo. Para mostrar las cosas de modo progresivo el dispositivo que muestra la imagen o la reproduce debe conseguir de algn modo que la imagen entrelazada vuelva a ser progresiva. La manera ms fcil de obtener esto es combinar los campos.

De los 10 campos, se juntan los dos primeros para reconstruir el frame 1, y despus el tercer y cuarto campos para reconstruir el frame 2. Pero entonces si juntas los campos quinto y sexto no obtienes ni el frame 2 ni el 3. Esto no es tan grave si no ha habido cambios del frame 2 al 3, pero si la cmara se mueve podrs ver algunas lneas entrelazadas en la imagen. Y puede ser an peor. Imaginad que hay un corte entre los dos frames y que el frame 3 muestra una escena completamente distinta a la del frame 2. Si combinas un campo de una escena con un campo de otra escena lo que obtienes es un desastre. As que, combinando simplemente los campos no slo obtendramos 2 frames de cada 5 estropeados con gran probabilidad, tambin tendramos una imagen a 29.97fps en vez de a la tasa original de la pelcula. Ahora bien, si sabemos cmo funciona este proceso, podemos deshacerlo simplemente descartando los frames duplicados. Este proceso se conoce como IVTC - InVerse TeleCine (el proceso de insertar campos duplicados se llama Telecine). Hay dos buenos artculos que explican telecine e IVTC con ms detalle: Video and Audio synching problems por Robshot, que explica la creacin del contenido obtenido con telecine en ms detalle, y Force Film, IVTC, and Deinterlacing - what is DVD2AVI trying to tell you and what can you do about it por hakko504, manono y jiggimi. Tambin est mi gua sobre Decomb, probablemente la utilidad de IVTC ms popular. Ahora que hemos dejado IVTC atrs echemos un vistazo ms detallado al desentrelazado (deinterlacing). Primero dejadme que presente el problema de nuevo: En un principio tenemos dos campo de una escena de vdeo entrelazada:

Como podis ver - no hay artefactos de entrelazado visibles. Ahora el frame correspondiente: A pesar de la baja calidad del JPEG, podis ver que hay las mismas lneas de entrelazado visibles, en especial en la ropa y los brazos del chico.

Y este es un ejemplo an peor, en el que tenemos un campo de una escena y el segundo campo de otra escena:

Y el frame correspondiente: Como podis ver, no es algo que queramos experimentar. Lo que es interesante tambin es el tamao de estas imgenes. La de la izquierda es ms de 3 veces mayor que el resto, y tiene an peor aspecto. Esto explica tambin porqu almacenar imgenes entrelazadas en modo progresivo no es buena idea. Las lneas ocupan un montn de espacio. Los descodificadores de VCD y de MPEG-4 normales (excepto XviD) trabajan slo con contenido progresivo. As que almacenar algo entrelazado, como se muestra a la izquierda, usando esta tcnica de compresin no es muy eficiente, y sera preferible que

buscsemos modos de convertir el material entrelazado en progresivo que fuesen ms eficientes que combinar simplemente 2 campos en un frame. El perfil avanzado de MPEG-2 y de MPEG-4 tienen un modo de entrelazado especial. En este modo todas las lneas de un campo se toman juntas (dejando fuera los blancos) y se comprimen; de este modo se ahorran un montn de bits que de otro modo se gastaran en almacenar las lneas que faltan. Una ltima nota sobre estos pantallazos: Ya que esto se tom de un DVD entrelazado y se almacen en modo entrelazado, hubo que estrechar los pantallazos de los campos a su tamao original (recordad que en modo entrelazado codificamos slo las lneas reales, y dejamos las lneas en blanco) - en realidad los campos seran la mitad de alto que los frames. Ahora que hemos establecido virtualmente nuestro problema echemos un vistazo a las posibles soluciones. Como se ha visto, tomar los dos primeros campos y combinarlos en un frame no siempre es posible. Esto es cierto en especial al tratar con contenido que se ha editado cuando ya estaba en modo entrelazado (este es tambin el problema nmero uno cuando se hace el IVTC, en especial el contenido Anime se corta tras hacer el telecine de las partes de la pelcula, lo que da como resultado problemas de IVTC casi irresolubles). Un modo simple y rpido de librarnos del problema de entrelazado sera tomar el contenido basado en campos, redimensionar los campos al tamao del frame (recordad que un campo tiene la mitad de la resolucin vertical del frame) y pasar los segundos campos. Este mtodo se usa, por ejemplo, cuando seleccionas Separate Fields (Campo Separados) en GordianKnot. Pero como un campo tiene slo la mitad de la resolucin de un frame nos dejamos la mitad de la resolucin vertical en el proceso. Ahora veamos diferentes tcnicas de desentrelazado (deinterlacing): Weave: Toma dos campos consecutivos y los pone en un frame. Esto reduce el framerate a la mitad pero no soluciona los problemas que hemos visto arriba, el frame que tiene campos de dos escenas superpuestos queda igual. Despus tenemos el blending: Aqu tomamos dos frames consecutivos, los redimensionamos al tamao del frame, y ponemos uno sobre otro. Si no tenemos movimiento esto tiene un aspecto perfecto pero en cuanto hay movimiento comienza a parecer poco natural y poco claro y puede dejar un "rastro fantasmal". Bob: En bob aumentas cada campo hasta el tamao del frame y lo muestras dos veces. Ya que el primer campo y el segundo no comienzan exactamente en la misma posicin (recordad que empezamos en la lnea 1 para el campo 1 y en la lnea 2 para el campo 2) la imagen se mueve ligeramente arriba y abajo, lo que se puede ver como un ligero temblor en las escenas en las que no hay movimiento Hay algunos mtodos ms, como area based deinterlacing (desentrelazado basado en reas), motion blur (desenfoque de movimiento) y adaptive deinterlacing (desentrelazado adaptativo). Cada uno tiene sus ventajas e inconvenientes. 100fps.com tiene una bonita comparacin de todos los mtodos, que incluye buenas muestras que ilustran los efectos de cada filtro y tiene una buena matriz de comparacin de

caractersticas. El sitio tambin sirve de gua para crear verdadero material progresivo a 50fps a partir de fuentes entrelazadas. Si el sitio tiene demasiado que leer para ti (dudo que ningn lector de Doom9 pueda decir eso, pero puede ser) Gunnar Thalin's area based deinterlacer y DeinterlacePALInterpolation que se basa en el filtro de Thalin son soluciones bastante buenas cuando necesitas salidas a 25fps. Tambin est el desentrelazado de campo de Decomb, que resulta ser bastante efectivo. De todos modos, antes de hacer el desentrelazado, intenta intercambiar el orden de los campos antes (swapping). DVD2AVI posee una funcin para esto (Video - Field Operations - Swap Field order) y tambin AviSynth (SwapFields). En bastantes ocasiones eso puede solucionar vuestros problemas de entrelazado, especialmente cuando parece que la pelcula principal est entrelazada. Palabras finales: Esto no es de ningn modo una descripcin tcnica completa y la escrib intentando recordar todas las clases de fsica y de compresin de vdeo que di en el instituto y en la facultad. Espero que mi memoria no haya fallado miserablemente.

Você também pode gostar