Audio Digital

AUDIO DIGITAL
Digitalizacin Ruido de cuantizacin Transmisin de la seal Grabacin en disco duro Compresin Formatos de ficheros Compact disc DVD-Audio Super Audio CD
DIGITALIZACIN
PCM (Pulse Code Modulation)
PCM no es ms que un proceso digital de modulacin para convertir una seal analgica en un cdigo digital. Veamos como se realiza:
FUNDAMENTOS DE LA CONVERSIN ANALGICA-DIGITAL

Antes, la nica manera de almacenar o de transmitir una seal de audio era utilizar un cambio en el voltaje (o en el magnetismo) que tena una forma de onda que era anloga a la forma de onda de la presin que es el sonido en s mismo. Esta seal anloga (anloga porque la onda del voltaje es anloga a la onda de la presin) trabajaba bien, pero sufria de cierto nmero de ediciones, particularmente la introduccin indeseada de ruido. Entonces alguien lleg con la gran idea de que esas ediciones podran ser superadas si la onda analgica era convertida a una manera diferente de representacin.
Figura 1: Forma de onda analgica que se va a convertir en una representacin digital. El primer paso en digitalizar una forma de onda analgica es hacer bsicamente lo mismo que hace una pelcula para dar la impresin de movimiento. Cuando alguien se sienta a ver
una pelcula en un cine, parece que est viendo una imagen mvil. De hecho, esa persona est viendo 24 imgenes inmviles cada segundo - pero sus ojos son demasiado lentos en responder a las mltiples fotos y por lo tanto se consigue engaar al ojo, teniendo as la impresin de que est sucediendo el movimiento. En jerga tcnica, estamos cambiando un acontecimiento que sucede en tiempo contnuo en uno que se separa en porciones de tiempo discreto. Como una pelcula, donde se toman fotografas sucesivas del acontecimiento que se reproducir, en audio se utiliza un procedimiento levemente diferente. Aqu, se utiliza un dispositivo para muestrear el voltaje de la seal en intervalos regulares de tiempo como se puede ver en la siguiente figura:
Figura 2: La forma de onda de audio es "trozeada" en momentos de tiempo. Una muestra de la seal se toma en cada lnea punteada vertical. Cada muestra se almacena temporalmente y toda la informacin inherente a la seal entre las muestras se rechaza. El sistema que realiza esta tarea se conoce como circuito "sample and hold" porque muestrea la forma de onda original en un momento dado, y guarda ese nivel hasta la siguiente vez que se muestrea la seal como se puede ser en la imagen siguiente:
Figura 3: Salida del circuito "sample and hold". Note que, aunque todava tenemos la forma bsica de la forma de onda original, se han perdido los detalles contnuos. Nuestra meta es representar la seal original con una cadena de nmeros que representan las medidas de cada muestra. Por lo tanto, el paso siguiente en el proceso es actualizar la
medida de cada muestra. Desafortunadamente, la "regla" que se utiliza para hacer esta medida no es infinitamente exacta - es como una cinta de medicin marcada en milmetros. Aunque se puede hacer una medida bastante buena con esa cinta, no puede hacer una medida exacta de algo que tiene 4.23839 milmetros de largo. El mismo problema existe con nuestro sistema de medicin. Como se puede ver en la siguiente figura, es un muy raro que el nivel de cada muestra caiga exactamente en uno de los niveles del sistema de medicin.
Figura 4: La salida del circuito "sample and hold" mostrada junto a los niveles permisibles trazados como lneas punteadas horizontales. Si vamos de nuevo al ejemplo de la regla marcada en milmetros se usa para medir algo de 4.23839 milmetros de largo, la respuesta obvia estara redondeada al milmetro ms cercano. so es realmente lo mejor que se podra hacer... y no demasiada preocupacin en que el peor error que se pudiera cometer fuese de medio milmetro. Lo mismo ocurre en el circuito que mide la seal - redondea el nivel de la muestra al valor ms cercano. Este procedimiento de redondear el nivel de la seal se llama cuantizacin porque est cambiando la seal (que tena resolucin infinita) a valores discretos (quantos). Por supuesto, tenemos que tener presente que estamos creando un error al redondear estos valores arbitrariamente al valor ms cercano que cabe en nuestro sistema. Este error es llamado error de cuantizacin y es perceptible en la salida del sistema como ruido cuyas caracter&iacut;sticas son dependientes de la seal. Este ruido comnmente se llama ruido de cuantizaci&ocute;n y nos referiremos a l ms adelante. En un mundo perfecto, no habra que cuantificar los niveles de la seal, pero desafortunadamente, el mundo no es perfecto... Lo mejor es poner el mayor nmero posible de graduaciones en el sistema de modo que tengamos que redondear lo menos posible. De esa manera reducimos al mnimo el error del cuantizacin y por lo tanto se reduce el ruido de cuantizacin. Se hablar ms adelante sobre lo que esto implica, pero para empezar teniendo una ligera idea, un CD tiene 65.536 posibles niveles que puede utilizar cuando mide el nivel de la seal (con respecto al sistema mostrado en la siguiente figura, donde tenemos solamente 16 niveles posibles...)
Figura 5: Salida del circuito cuantificador. Note que casi todas las muestras se han redondeado a la lnea punteada ms cercana. En este punto, finalmente tenemos nuestra seal digital. Mirando la imagen anteriror como ejemplo, podemos ver que los valores son 0 2 3 4 4 4 4 3 2 -1 -2 -4 -4 -4 -4 -4 -2 -1 1 2 3 Estos valores despus se almacenan en (o se transmiten por) el sistema como una representacin digital de la seal analgica original. Siguiente>>
DIGITALIZACIN
FUNDAMENTOS DE LA CONVERSIN DIGITAL-ANALGICA
Ahora que tenemos todos esos dgitos almacenados en nuestro sistema digital, cmo los convertimos en una seal de audio?. Comenzamos haciendo el circuito "sample and hold" al contrario. Alimentamos al nuevo circuito con la cadena de nmeros, los cuales han sido convertidos en voltajes, dando como resultado una seal que es igual a la de la salida del circuito de cuantizacin (vase la figura 5). Comparemos la forma de onda de la figura 1 con la forma de onda de la figura 4. Una de las mayores diferencias entre ellas es que hay cambios instantneos en la pendiente de la onda, es decir, la onda de la figura 4 tiene esquinas ms agudas, mientras que la de la figura 1 es agradable y lisa. La presencia de esas esquinas agudas indica que hay componentes de alta frecuencia en la seal. Por lo tanto, si tomamos la seal mostrada en la figura 5 y quitamos las altas frecuencias, eliminamos las esquinas. Esto se hace usando un filtro que bloquee la informacin de alta frecuencia, pero que permita que las frecuencias bajas pasen. Generalmente hablando, el filtro se llama filtro pasa-baja, pero para uso especfico en audio digital se llama filtro de
reconstruccin porque ayuda a reconstruir la seal de audio desde la fea representacin con forma de escalera.
Figura 6: Resultado del filtro de reconstruccin. Se muestra como lnea punteada la forma de onda original de la cual fue derivada. El resultado de la salida del filtro de reconstruccin, mostrado en la figura 7 es la salida del sistema. Como se puede ver, el resultado es una forma de onda continua. Tambin, se puede observar que es igual que la forma de onda analgica introducida en el sistema en primer lugar (figura 1) - bueno... no exactamente... pero hay que tener presente que utilizamos un ejemplo con un error de cuantizacin MUY malo. Afortunadamente nunca se vera ninguna seal tan mala en la realidad...
Figura 7: La salida del sistema.
ALIASING
Cuando se est viendo la televisin y salen girando las ruedas de algn vehculo en marcha, extraamente, las ruedas parece que aceleran, despus se paran y de pronto comienzan a ir al revs... sin que el sentido del vehculo cambie. Qu causa este fenmeno, y porqu no se puede ver en la realidad? Miremos esto considerando una rueda con un radio nada ms, como se muestra en la parte superior izquierda de la figura 8. Cada columna de la figura representa una velocidad rotatoria distinta para la rueda, cada fila numerada representa un fotograma de la pelcula. En la columna del extremo izquierdo, la rueda hace un sexto de una rotacin por fotograma.
Como se puede ver en la animacin de la figura 9, esto da lugar a una rueda que parece rotar a la derecha segn lo esperado. En la segunda columna, la rueda est haciendo un tercio de una rotacin por fotograma y la animacin que resulta es una rueda que gira ms deprisa, pero sigue rotando hacia la derecha. En la tercera columna, la rueda est dando vueltas levemente ms rpido, haciendo la mitad de una rotacin por fotograma. Como se puede ver en la correspondiente animacin, ste d como resultado el aspecto de una rueda de 2 radios que est parada.
Figura 8: Fotogramas de una rueda de un radio girando a direrentes velocidades. Figura 9: Animaciones que demuestran los resultados de los fotogramas exhibidos en la figura 8. Si la rueda gira ms rpido que una rotacin cada dos fotogramas, sucede lo siguiente. La rueda, haciendo ms de media rotacin por fotograma, da lugar a la sensacin de que la rueda gira al revs y ms lentamente que la rotacin real... Esto es un problema causado por el hecho de que estamos dividiendo el tiempo continuo en tiempo discreto, distorsionando el hecho real. Este resultado que parece ser algo distinto a lo qu sucedi se conoce como alias. En audio digital existe el mismo problema. Si se hecha una ojeada a la forma de onda de la figura 10, se puede ver que tenemos menos de dos muestras por cada perodo de la onda. Por lo tanto la frecuencia de la onda es mayor que la mitad de la frecuencia de muestreo.
Figura 10: Forma de onda con una frecuencia mayor que la mitad de la frecuencia de muestreo.
La figura 11 mostrada abajo demuestra que hay una segunda forma de onda con la misma amplitud que la de la figura 10 la cual se podra representar por las mismas muestras. Como se puede ver, esta frecuencia es ms baja que la que tena la onda original.
Figura 11: La frecuencia resultante causada por el muestreo de la forma de onda segn lo mostrado en la figura 10. El problema del aliasing causa dos resultados. En primer lugar, hay que cerciorarse de que ninguna frecuencia que sea la mitad de la frecuencia de muestreo (tpicamente llamada frecuencia de Nyquist) llegue al circuito de muestreo. En segundo lugar, hay que fijar la frecuencia lo bastante alta para poder capturar todas las frecuencias que deseamos or. El segundo requisito es fcil de solucionar: el odo humano puede or solamente frecuencias de hasta cerca de 20 kHz, por lo tanto lo que hay que hacer es cerciorarse de que la frecuencia de muestreo es por lo menos dos veces este valor - por lo tanto, al menos 40.000 muestras por segundo. El nico problema que hay que tener en cuenta es que hay que asegurarse de que ninguna frecuencia por encima de la frecuencia de Nyquist entre en el circuito de muestreo. Esto es una tarea bastante fcil. Justo antes del circuito de muestreo, se utiliza un filtro pasa-baja para eliminar componentes de alta frecuencia en la seal de audio. Este filtro pasa-baja, generalmente llamado filtro anti-aliasing porque previene el aliasing, corta todas las frecuencias que estn sobre la de Nyquist, solucionando as el problema. Por supuesto, hay gente que piensa que esto crea un enorme problema porque deja fuera mucha informacin que no puede realmente probarse si es o no importante. Siguiente>>
DIGITALIZACIN
NMEROS BINARIOS Y BITS
Como se ver un poco ms adelante, se necesita convertir los nmeros que describen el nivel de cada muestra en un nmero binario antes de almacenarlo o de transmitirlo. Esto
hace al nmero ms fcil de reconocer por parte de la computadora. Entonces la pregunta es, cmo trabaja el sistema binario? Bien, esencialmente en binario se trabaja de la misma manera que en el sistema decimal, pero solo se tienen dos dgitos para trabajar, 0 y 1. Si se escribe el nmero 2436, lo que se est haciendo es (2 * 1000) + (4 * 100) + (3 * 10) + (6 * 1) de donde salen el 1000, el 100, el 10 y el 1?. Bien, eso se relaciona con el hecho de que tenemos 10 dedos, por lo tanto utilizamos 10 dgitos para representar una cantidad (0, 1, 2, 3, 4, 5, 6, 7, 8 y 9). Consecuentemente, una vez que se consigan ms de 9 cosas, se necesita comenzar a usar 2 o ms dgitos para representar la cantidad. Esto requiere el uso de "posiciones" (la posicin de las centenas, la de los millares, etctera...). Por qu 100, 1000, 10000 etc, especficamente? Eso es porque stos son "potencias" (o exponentes) de diez. Es decir estamos diciendo (2 * 103) + (4 * 102) + (3 * 101) + (6 * 100) si se tuviesen ms dgitos a la izquierda en nuestro nmero, se estaran utilizando potencias ms altas de diez. Ahora, imaginemos que hemos inventado exactamente el mismo sistema, salvo que tenemos solamente dos dedos, y por lo tanto dos dgitos - 0 y 1. Ahora, comenzaramos a ver nmeros como 10010101101. Cunto es ese nmero? Bien, consideremos que, puesto que tenemos solamente dos dgitos, ahora estamos trabajando con potencias de 2, as que:

(1 * 210) + (0 * 29) + (0 * 28) + (1 * 27) + (0 * 26) + (1 * 25) + (0 * 24) + (1 * 23) + (1 * 22) + (0 * 21) + (1 * 20) o bien: (1 * 1024) + (0 * 512) + (0 * 256) + (1 * 128) + (0 * 64) + (1 * 32) + (0 * 16) + (1 * 8) + (1 * 4) + (0 * 2) + (1 * 1) o bien: 1024 + 128 + 32 + 8 + 4 + 1 = 1197.
As pues, ahora en vez de la posicin de las decenas, de las centenas y dems, tenemos la posicin del dos, la del cuatro, la del ocho, etc. Ahora, volvamos al nmero 2436 - lo llamamos nmero de 4 dgitos porque tiene 4 dgitos en l. El nmero 10010101101 tiene diez dgitos binarios en l - por lo tanto decimos que es un nmero de 10 bits (binary digits o binary units). Cuando se agrega un dgito adicional a un nmero decimal, se aumenta su rango en un factor de 10. Por ejemplo, el nmero ms grande que puedo representar con 2 dgitos es 99. El nmero ms grande que puedo representar con 3 dgitos es 999 - aproximadamente 10 veces ms que el nmero de 2 dgitos. De manera similar, cuando se agrega un bit adicional a un nmero binario, se aumenta su rango ms del doble. Por ejemplo, el nmero ms grande que puedo representar con un nmero de 3 bits es 111 (o 7 en decimal...). El nmero ms grande que puedo representar con un nmero de 4 bits es 1111 (o 15 en decimal - por lo tanto 2 * 7 + 1). As pues, podemos decir que cada vez que se agrega un bit a un nmero binario, ste se dobla. Por qu se est tratando esto? Bien, por ejemplo, un disco compacto utiliza un nmero de 16 bits para representar los niveles de cuantizacin de la seal. Por tanto los nmeros se extienden a partir del 0000000000000000 hasta el 1111111111111111 - un total de 65.536
niveles discretos. Si lo aumentramos a un sistema de 24 bits, tendramos un total de 16.777.216 niveles para representar cada nivel. Como los niveles anlgicos de la entrada y de la salida no cambian, entonces simplemente se aumenta la resolucin aumentando el nmero de bits - y cada vez que se agrega un bit ms, doblamos la precisin (porque hay dos veces los niveles de cuantizacin). As pues, un aumento de 16 a 24 bits representa una mejora de la resolucin por un factor de 256. La razn de hacer esta conversin de decimal a binario es que las computadoras - y los equipos elctricos en general - son ms eficientes cuando tienen que trabajar solamente con dos dgitos. Digamos, por ejemplo, que se tuvo que inventar un sistema para enviar nmeros a alguien que usa una linterna. Se podra poner un interruptor que vare la intensidad de la luz en la linterna y decir que, cuanto ms grande es el nmero, ms brillante es la luz. Esto dara al receptor una idea intuitiva del tamao del nmero, pero sera extremadamente difcil representar nmeros exactamente. Por otra parte, si utilizamos la notacin binaria, podramos decir "si la luz est encendida, es un 1 - si est apagada, es un 0" entonces se puede puede encender la luz para los 1s y apagarla para los 0s. De manera similar, las computadoras utilizan voltajes para enviar seales - as pues, si el voltaje es alto, se entiende como un 1, si es bajo, es un 0. De esta manera no se tienen que utilizar 10 niveles distintos de tensin para representar los 10 dgitos. Por lo tanto, en el mundo de las computadoras, el binario es mejor que el decimal.
COMPLEMENTO A DOS
Volvamos a la discusin sobre nmeros binarios. Recuerde que estamos utilizando esos nmeros binarios para describir el nivel de la seal. Esto realmente no es un problema, salvo por el hecho de que la seal es bipolar, ya que tiene componentes positivas y negativas. Podramos utilizar nmeros binarios positivos y negativos para representar esto, pero no se hace. Se utiliza un sistema llamado "complemento a dos". Hay realmente dos caractersticas aqu. Una es que, si no hay seal, probablemente queramos que la representacin digital de ella sea 0 - por lo tanto el nivel cero en la seal analgica corresponde al cero en la seal digital. La segunda es, cmo se representan los nmeros negativos? Una forma para considerar esto es utilizar una traza circular de los nmeros binarios. Si contamos de 0 a 7 usando una "palabra" de 3 bits, tenemos lo siguiente: 00 0 00 1 01 0 01 1 10 0 10
1 11 0 11 1 Ahora si se escriben estos en un crculo que comience en las 12 y que vaya en el sentido de las agujas del reloj como se muestra en la Figura 12, se ver que el valor 111 termina siendo adyacente al valor 000. Entonces, se comienza en 000 y se gira a la derecha para los valores positivos y a la izquierda para los valores negativos. Ahora, tenemos una manera de representar los valores positivos y negativos para la seal donde un paso sobre 000 es 001 y un paso por debajo de 000 es 111. Esto parece un poco simpar porque los nmeros realmente no se alinean del modo que nos gustara como se puede ver en la Figura 13 - pero realmente tiene algunas ventajas. En particular, el cero digital corresponde al cero analgico - y si hay un 1 al principio de la palabra binaria, entonces la seal es negativa.
Figura 12: Contando a partir de 0 hasta 7 usando una palabra de 3 bits alrededor de un crculo.
Figura 13: Palabras binarias correspondientes a los niveles de cuantizacin en el sistema de complemento a dos. Una cuestin que se puede querer concernir aqu es el hecho de que hay un nivel ms de cuantizacin en el rea negativa que el que hay en la positiva. Esto es porque hay un nmero par de los niveles de cuantizacin (porque ese nmero es una potencia de dos) pero uno de ellos se dedica al nivel cero. Por lo tanto, el sistema es ligeramente asimtrico -
entonces es, de hecho posible deformar la seal en el positivo antes de que comience a distosionar en el negativo. Pero hay que tener presente que, en un sistema tpico de 16 bits se est hablando de una MUY PEQUEA diferencia.
RUIDO DE CUANTIZACIN Y DITHER

RUIDO DE CUANTIZACIN
La diferencia fundamental entre el audio digital y el audio analgico es la resolucin. Representaciones analgicas de seales analgicas tienen una tericamente infinita resolucin en nivel y en tiempo. Representaciones digitales de ondas de sonido analgico estln discretizadas en niveles cuantificables en "porciones" de tiempo. Un sistema de audio digital tiene un nmero finito de niveles que se pueden utilizar para especificar el nivel de la seal para una muestra particular en un canal dado. Por ejemplo, un compact disc utiliza una palabra binaria de 16 bits por cada muestra, por lo tanto, hay un total de 65.536 (216) niveles de cuantizacin disponibles. Sin embargo, hay que tener siempre presente que solamente se utilizan todos estos niveles si la seal tiene una amplitud igual al mximo nivel posible en el sistema. Si se reduce el nivel por un factor de 2 (en otras palabras, una ganancia de -6.02 dB) se estan usando unos pocos bits menos de niveles de cuantizacin para medir la seal. Cuanto ms baja es la amplitud de la seal, menos niveles de cuantizacin se pueden utilizar hasta, si se sigue atenuando la seal, que se llegue a una situacin donde la amplitud de la seal es el nivel de 1 bit lo menos significativo posible (LSB - Least Significant Bit -). Veamos un ejemplo. La figura 1 muestra un ciclo individual de una onda senoidal trazada con un alto grado de resolucin.
Figura 1: Un ciclo individual de una onda senoidal. La consideraremos como seal de entrada analgica para el convertidor digital Digamos que esta seal es convertida a una representacin digital usando un convertidor que tiene 3 bits de resolucin - por lo tanto hay un total de 8 niveles diferentes que se pueden utilizar para describir el nivel de la seal. En un sistema de complemento a dos, esto significa que tenemos la lnea cero con 3 niveles sobre ella y 4 por debajo. Si la seal en la figura 1 se alinea en nivel de modo que su pico positivo sea igual que el mximo nivel posible en la representacin digital, entonces la seal digital que resulta se parecer a la que se muestra en la figura 2.
Figura 2:Un solo ciclo de una onda senoidal despus de la digitalizacin utilizando 4 bits , donde el nivel de la seal se redondea al nivel ms cercano de cuantizacin en cada muestra. El diagrama azul es la forma de onda original, el rojo es la representacin digital. La representacin digital no es exactamente igual que la onda senoidal original. El coste de la cuantizacin es la introduccin de errores en la medida. Sin embargo, veamos exactamente cunto error se introduce. Este error es la diferencia entre la entrada del sistema y la salida, as que se puede ver esta diferencia restando la forma de onda roja de la figura 2 de la forma de onda azul.
Figura 3: Diagrama del error de cuantizacin generado por la conversin mostrada en la figura 2. Hay un par de caractersticas de este error que hay que discutir. En primer lugar, como la onda senoidal se repite, el error de la seal ser peridico. Tambin, el perodo de esta forma de onda compleja sera idntico al de la onda senoidal original - por lo tanto estar compuesta por armnicos de la seal original. En segundo lugar, el error mximo de cuantizacin que se introduce es la mitad de 1 LSB. Lo significativo es su relacin con la amplitud de la seal. El error de cuantizacin nunca ser mayor de la mitad de un LSB, as que cunto ms niveles de cuantizacion tenga, ms alta se puede hacer la seal que se desea or respecto al error que no se quiere or.
Figura 4: Diagrama combinado de la seal original, de la seal cuantizada y del error de cuantizacin que resulta en un sistema de 3 bits.
Figura 5: Diagrama combinado de la seal original, de la seal cuantizada y del error de cuantizacin que resulta en un sistema de 5 bits.
Figura 6: Diagrama combinado de la seal original, de la seal cuantizada y del error de cuantizacin que resulta en un sistema de 9 bits. Viendo las figuras 4, 5 y 6, se puede ver que cuanto mayor es el nmero de bits disponibles para describir el nivel instantneo de la seal, ms bajo es el nivel del error del cuantizacin. Dado que un CD tiene 65.536 niveles de cuantizacin disponibles, realmente hay que preocuparse por este error?. La respuesta es "s" - y es s por dos razones: 1. El nico momento en el que se usan todos los bits de un sistema digital es cuando la seal est a su mximo nivel posible. Si sto no sucede - y esto es lo ms normal se est utilizando un subconjunto del nmero de niveles de cuantizacin. Si el error de cuantizacin permanece constante a +/- 0.5 LSB y el nivel de la seal es menor, entonces el nivel relativo del error de cuantizacin de la seal es mayor. Cunto menor es la seal, ms audible es el error. Esto es particularmente cierto en el final del decaimiento de una nota en un instrumento o en la reverberacin en un cuarto grande. Mientras que el sonido decae del mximo a nada, utiliza cada vez menos niveles de cuantizacin y la calidad percibida baja porque el error llega a ser ms evidente ya que se enmascara cada vez menos. 2. Como el error de cuantizacin es peridico, es una distorsin de la seal y por lo tanto se relaciona directamente con sta. El cerebro humano es muy bueno ignorando cosas poco importantes. Por ejemplo, cuando se entra en la casa de
alguien y se huele un olor nuevo - el olor de la casa. Despus de 5 minutos ese nuevo olor no se huele ms. El olor no ha desaparecido - el cerebro lo ignora cuando comprende que es constante. Lo mismo sucede con el ruido analgico de una cinta. Cuando se presta atencin a la msica, se deja de or el ruido despus de un par de minutos. El cerebro puede hacer esto por s mismo porque el ruido no est en relacin con la seal. Es un sonido constante que nunca cambia con la msica y por lo tanto no tiene relacin con ella - el cerebro decide que es constante as que no es digno de seguir. La distorsin es algo diferente. sta, como el ruido, tpicamente est compuesta completamente de material no deseado. A diferencia del ruido, sin embargo, los productos de distorsin se modulan con la seal. Por consiguiente el cerebro piensa que es material importante, y por lo tanto siempre le presta atencin. Por eso es mucho ms difcil de ignorar la distorsin que el ruido. Lamentablemente, el error de cuantizacin produce distorsin. Siguiente>>
RUIDO DE CUANTIZACIN Y DITHER

DITHER
Afortunadamente lo comentado anteriormente tiene solucin. Resulta que podemos eliminar el error de cuantizacin simplemente agregando ruido a la seal. Parece ineficaz arreglar este problema agregando ruido - pero hay que considerar que lo que estamos haciendo esencialmente es un intercambio - distorsin por ruido. Agregando ruido a la seal de audio con un nivel que sea aproximadamente la mitad del nivel del LSB, generamos un ruido audible constante, pero muy bajo que elimina con eficacia la distorsin que resulta de seales de bajo nivel. Este ruido que se agrega a la seal (antes del filtro antialiasing) se llama "dither" y usualmente posee caractersticas que se especifican usando probabilidad. Tpicamente, se ven referencias al "dither triangular", lo que significa que el ruido tiene "una funcin de densidad de probabilidad" que parece un tringulo como se muestra en la figura 7.
Figura 7: Funcin triangular de densidad de probabilidad usada en dither. Qu significa este grfico? Quiere decir que cada muestra tendr una pequea cantidad de seal aadida que es medida en el nivel relativo al LSB. La probabilidad de que la seal tenga un nivel de 0 es grande. Hay una probabilidad ms y ms pequea de tener aadida (o restada) una seal ms y ms alta hasta que se consigue una probabilidad cero de que una seal igual a 1 LSB sea agregada (o restada). Por lo tanto el nivel del dither agregado nunca ser tan grande como 1 LSB. Hay otras funciones de densidad de probabilidad que se utilizan para el dither, las tres ms usadas son la rectangular (donde todos los niveles de la seal a partir de -0.5 LSB y de 0.5 LSB son igualmente probables), la triangular, y la gaussiana (piense en una curva con forma de campana que tenga sus lmites en -2 y 2 LSB.)
PROTOCOLOS DE TRANSMISIN DE LA SEAL DIGITAL

INTRODUCCIN
Si se desea enviar una seal digital a travs de un cable, la manera ms simple de hacerlo es tener una referencia a tierra y un cierto voltaje de corriente contnua (5 V por ejemplo), donde llamaremos a uno "0" (tierra) y al otro "1" (5 V). Si entonces sabemos cundo "mirar" la seal elctrica en el cable (esta sincronizacin se puede determinar por un reloj interno...), podemos saber si estamos recibiendo un 0 o un 1. Este sistema funcionara - de hecho lo hace, pero tiene algunos problemas inherentes que evitaran que lo usramos como mtodo de transmitir seales de audio digitales en la realidad. A principio de los aos 80, la sociedad de ingeniera del audio (Audio Engineering Society) form un comit para decidir sobre un protocolo estndar para transmitir audio digital. Al principio decidieron que queran un sistema que tuviese las siguientes caractersticas e implicaciones resultantes:
El protocolo debe utilizar los cables y los conectores existentes. Adems, debe soportar la transmisin a travs de los equipos existentes. Las implicaciones de esto son: o No puede haber ningn contenido de corriente contnua, ya que sera borrado por transformadores o condensadores en la cadena de transmisin. (Piense en una cadena de 1's en el sistema de 0V / 5V explicado antes ... los 5 V de corriente contnua no pasaran el sistema)
o
La seal no puede ser crtica en fase. Es decir, si se toma la seal y se cambia su polaridad, esto no puede conducir a que se cambien los 1's por 0's y viceversa.
La seal debe tener su propio reloj
La seal debe tener 2 canales de audio en un nico cable.
El resultado fu el protocolo AES/EBU (tambin conocido como IEC-958 tipo 1). Es un protocolo de codificacin de la seal bifase que satisface todos los requisitos antedichos. "Qu es un protocolo de codificacin de la seal bifase?". Bien lo que esto quiere decir es que, en lugar de usar dos voltajes discretos para denotar 1 y 0, la distincin se hace por transiciones de voltaje. Para transmitir un solo bit por un cable, el sistema AES/EBU lo separa en dos "celdas". Si las celdas son del mismo voltaje, entonces el bit es un 0: si las celdas son de distinto voltaje, entonces el bit es un 1. Es decir, si hay una transicin entre las celdas, el bit es un 1. Si no hay transicin, el bit es un 0.
El nivel de pico a pico de esta seal est entre 2 V y 7 V. La impedancia de la fuente es 150 ohmios. Observe que no hay necesidad de referencias de 0 V en este sistema. El receptor AES/EBU mira solamente si hay una transicin entre las celdas - no se preocupa de cul es el voltaje solamente si ha cambiado. Lo nico que no se ha tratado es la parte del reloj.... Este se consigue por medio de un circuito conocido como lazo de fase bloqueada (o PLL - Phase-Locked Loop -). Este circuito crea un reloj usando un oscilador que deriva su frecuencia de la transicin del voltaje que recibe. La seal AES/EBU se enva al PLL que comienza en un modo de "captura". Esto es una amplio vistazo en donde el circuito trata de obtener una idea bsica de cual es la frecuencia de la seal entrante. Una vez que se logra eso, pasa a modo "pullin" donde se bloquea sobre la frecuencia y permanece all. Este PLL entonces se convierte en el reloj que es utilizado por los dispositivos de recepcin internos (como buffers). Siguiente>>
PROTOCOLOS DE TRANSMISIN DE LA SEAL DIGITAL
QU SE ENVA?
Los datos AES/EBU se envan en bloques que estn comprendidos por 192 marcos (frames). Cada marco contiene 2 submarcos (subframes), cada uno de los cuales contiene 32 bits de informacin. La disposicin es algo como esto:
La informacin en el submarco se puede romper en dos categoras, el cdigo del canal y el cdigo de la fuente.
Cdigo del canal

Es informacin con respecto a los datos de la transmisin en s misma - datos que mantienen a las mquinas "hablando" unas con otras. Consiste en 5 bits compuestos por el cdigo de sincronizacin y el bit de paridad.
Cdigo de sincronizacin (Prembulo)

Son 4 bits que le dicen al dispositivo de recepcin que la transmisin est al principio de un bloque o de un submarco (y qu submarco es...) Diferentes cdigos especficos le dicen al receptor qu es lo que sigue...
Observe que estos cdigos violan el protocolo de codificacin de la seal bifase (porque no hay transicin al principio del segundo bit.) pero no violan la regla de que no debe haber corriente contnua.
Bit de paridad
Es un solo bit que se asegura de que todos los prembulos estn en fase. El bit de paridad se elige para ser un 1 o un 0 y asegurarse as de que el prembulo siguiente ser encabezado correctamente.
Cdigo fuente
Es la informacin que estamos intentando transmitir. Utiliza los otros 27 bits del submarco abarcando: la muestra audio (20 bits), los datos auxiliares (4 bits), el bit de validez (1 pedacitobit), el bit de usuario (1 bit) y el bit de estado (1 bit).
Muestra de audio
Es la propia muestra. Tiene un mximo de 20 bits, con el bit menos significativo (LSB) enviado primero.
Datos auxiliares
Son 4 bits que se pueden utilizar para cualquier cosa. Actualmente se utilizan generalmente como bits extras que se unirn a la muestra de audio - aumentando la resolucin hasta 24 bits.
Bit de validez
Es simplemente un indicador que le dice al dispositivo receptor si los datos son vlidos o no. Si el bit es un 1, entonces los datos no son vlidos. Un 0 indica que los datos son vlidos.
Bit de usuario
Es un solo bit que se puede utilizar para cualquier cosa, por ejemplo como cdigo de tiempo (si es reservado para cdigo de tiempo, entonces un nmero de bits de usuario de submarcos sucesivos se encadenan juntos para hacer una sola palabra.)
Bit de estado
Es un indicador de un solo bit el cual puede ser utilizado para cierto nmero de cosas:

Emphasis on / off Tasa de muestreo Seal estreo / mono Longitud de palabra de la muestra de audio ASCII (8 bits) para el canal origen y destino
GRABACIN EN DISCO DURO

ANCHO DE BANDA Y ESPACIO EN DISCO
Si se desea grabar algo en una cinta y se sabe que va a durar alrededor de una hora y media, entonces se utiliza una cinta de dos horas. Si se est grabando en un disco duro, y se tienen 700 MB disponibles, de cunto tiempo se dispone?. Para calcular esto, se necesitar considerar el ancho de banda de la seal que se va a enviar. Hay que tener en cuenta que, para cada canal de audio, se va a un cierto nmero de muestras, dependiendo de la frecuencia de muestreo, y cada una de esas muestras va a tener cierto nmero de bits, dependiendo de la longitud de palabra. Utilicemos el ejemplo del CD para hacer un clculo. El CD utiliza una frecuencia de muestreo de 44.1 kHz (44100 muestras por segundo) y una longitud de palabra de 16 bits para dos canales de audio. Por lo tanto, cada segundo, en cada uno de los dos canales, 44100 nmeros de 16 bits llegan a travs del sistema. Por tanto: 2 canales * 44100 muestras por segundo * 16 bits por muestra ______________________________ = 1,411,200 bits por segundo
Qu significa esto en trminos de espacio en disco? Para calcular esto, solo hay que convertir el nmero de bits a la unidad tpica de almacenamiento en las computadoras - un byte (ocho bits). 1,411,200 bits por segundo / 8 bits por byte ______________________________ = 176,400 bytes por segundo Dividamos esto por 1024 (bytes por kilobyte) y conseguiremos el valor en kilobytes por segundo, resultando un valor de 172.27 KB por segundo. Se puede calcular cules son probablemente los trminos ms significativos: 172.27 kB por segundo * 60 segundos por minuto ______________________________ = 10,335.94 kilobytes por minuto / 1024 kilobytes por megabyte ______________________________ = 10.1 MB por minuto. As pues, cuando se almacena sin comprimir audio con calidad CD en el disco duro, se est ocupando poco ms de 10 MB por minuto de espacio, as que 700 MB de espacio libre son cerca de 70 minutos de msica
COMPRESIN
INTRODUCCIN
Las tcnicas de compresin son la herramienta fundamental de la que se dispone para alcanzar el compromiso adecuado entre capacidad de almacenamiento y de procesamiento requeridas. Las tcnicas de compresin ms elaboradas proporcionan una reduccin muy importante de la capacidad de almacenamiento, pero requieren tambin de un importante procesado tanto para compresin como para la descompresin (sobre todo en la compresin). Las tcnicas ms simples ofrecen reducciones moderadas con poco procesamiento. Las caracter&iacue;sticas del sistema digital implicado y la aplicacin determinarn el compromiso entre estos factores y permiten seleccionar las teacute;cnicas de compresin adecuadas. Las tcnicas ms avanzadas analizan la respuesta del odo a la seal y simplifican aquellos elementos irrelevantes para la sensacin sonora, consiguiendo tasas de compresin mucho mayores.
TCNICAS
Aqu se describen algunas de las tcnicas ms importantes:
ADPCM (Adaptative Differential Pulse Code Modulation).

Se trata de una codificacin diferencial: en lugar de representar las muestras de la seal, se almacena la diferencia entre muestras consecutivas, que para seales de audio, suele ser pequea.
LPC-10E (Linear Predictive Coder).

Este algoritmo hace corresponder la seal de audio con un modelo lineal simple y obtiene los parmetros que mejor ajustan el modelo a la seal. La seal generada es poco fiel a la original. Se utiliza en algunos servicios de voz.
CELP (Code Excited Linear Prediction).

Es similar a LPC-10E, pero adems de asignar los parmetros del modelo, tiene en cuenta el error entre la seal original y la aproximada, creando una tabla de errores. La seal se compone de los parmetros del modelo ms el ndice del error en cada muestra. La tabla es comn a codificador y decodificador.
MPEG
Es un estndar tanto para audio como para vdeo. Consigue alta compresin en los datos y requiere de mucha potencia de clculo, sobre todo en la codificacin. Hay definidos tres layers para las versiones MPEG-1 y MPEG-2:

Layer I: desde 32 a 448 kbps Layer II: desde 32 a 384 kbps Layer III: desde 32 a 320 kbps
FORMATOS DE FICHEROS
INTRODUCCIN
<="" p=""> Los formatos de fichero no tienen por qu coincidir con las caractersticas del reproductor. En general un mismo formato de fichero permite contener diversas codificaciones, tasas de muestreo, etc. Se distinguen dos grupos de formatos de ficheros de audio:
Formatos autodescriptivos: Contienen de forma explcita los parmetros del dispositivo y la codificacin en algn punto del fichero. Formatos sin cabecera o tipo raw: Los par&aactue;metros del dispositivo y codificacin empleada son fijos.
FORMATO MIDI
Es un estndar para la transmisin de informacin musical entre instrumentos electrnicos y computadoras. MIDI es capaz de producir msica o sonidos nicamente desde tarjetas de sonido, lo cual quiere decir que no se pueden esperar sonidos muy reales, como la voz humana o el sonido de las olas del mar chocando con un arrecife. El tamao de los archivos MIDI es muy pequeo por lo que se utiliza bastante en internet, la calidad de lo que se escucha depende de la tarjeta de audio o del hardware que se tenga para escuchar. Su extensin es ".mid", ".rmi" o ".midi".
FORMATO AU
Es un formato de fichero muy asociado a mquinas Sun y Next. Su estructura es muy sencilla, las razones de compresin que puede llegar a ofrecer son pequeas y destaca sobre todo su soporte de longitudes de muestras muy altas comparadas con otros formatos (32 y 64 bits). Se compone de tres secciones:

Una cabecera, en la que describe la codificacin de audio utilizada Un campo de longitud variable para almacenar otro tipo de informacin como texto en formato ASCII El conjunto de los datos de audio
FORMATO AIFF
Abreviatura de Audio Interchange File Format o Archivo de Formato de Audio de Intercambio, un formato comn para almacenar y transmitir sonidos de muestra. El formato fue desarrollado por Apple Computer y es el formato estndar de audio para los computadores Macintosh. Tambin es utilizado por Silicon Graphics Intercorporated (SGI). El formato codifica datos de audio en 8 bits mono o estreo en forma anloga. Los archivos AIFF generalemente llevan la extensin ".AIF" o ".IEF". El formato AIFF no soporta compresin de datos, por tanto los archivos AIFF tienden a ser grandes. Sin embargo, existe otro formato llamado AIIF-Compressed (AIFF-C o AIFC) que soporta la compresin en relaciones tan altas como 6:1.
FORMATO WAVE
Este formato tiene por extensin ".wav" o ".riff" y fu diseado por Microsoft que se convirti en un estndar en audio digital para PC, estos archivos contienen informacin de
audio del mundo real, esto es la representacin digital de una seal analgica. Estos archivos de audio pueden ser de calidad pequea como de una transmisin por radio de A.M. (amplitud modulada) o de alta calidad como la de un CD e inclusive mayor. Aunque existen muchos archivos de audio en formato WAVE en Internet la principal desventaja es su peso, un minuto de audio en este formato con calidad de CD ocupa 10 MB aproximadamente.
FORMATO MP3
El afamado formato que ha estado revolucionando la industria de la msica, debe su nombre a sus predecesores, stos son formatos de compresin para video, el formato MPEG, que por sus siglas en ingls quiere decir "Moving Pictures Expert Group", el formato MP3 tiene la capacidad de almacenar audio con calidad de CD para la gran mayora de los odos humanos, ya que los odos ms entrenados y sensibles si notan la diferencia entre estos dos, pero prcticamente es nula, la gran ventaja del MP3 es que tiene muy poco tamao; este reduce dramticamente el tamao de un archivo de audio, por ejemplo un archivo wave con calidad de CD de una cancin de cinco minutos ocupa 50 MB, mientras que en un archivo MP3 la misma cancin ocupa 4 MB aproximadamente, esta es la razn por la cual se ha generalizado el uso del formato por internet llegando a millones de personas ms rpido
FORMATO REAL AUDIO

RealAudio es el estndar para transmitir audio por medio de Internet. Esta tecnologa fue desarrollada por RealNetworks y soporta una calidad de audio FM estreo. Para escuchar una pgina que incluya un archivo de RealAudio, se necesita el reproductor de RealAudio o un plug-in, un programa que est disponible gratuitamente en un infinidad de sitios. Tambin viene incluida en las actuales versiones de Netscape Navigator y Microsoft Internet Explorer. No es un formato cerrado, ni define un esquema de codificacin propio. En sus diferentes versiones cambia de codificacin utilizada.
FORMATO AC3
A diferencia de los CDs tradicionales, los DVDs incorporan 6 canales de audio que proporcionan sonido tridimensional envolvente. El formato AC3 (Dolby Digital) es el estndar para DVD audio, que permite la codificacin de 6 canales, capaces de proporcionar sonido envolvente y transformar nuestro saln en una autntica sala de audiciones.
FORMATO AAC
Hay una manera de codificar y reproducir ficheros desde el disco duro que tiene calidad CD y que utiliza menos espacio que un MP3. Se denomina AAC (Advanced Audio Coding -
Codificacin de Audio Avanzada), tambin conocido como codificacin NBC (Non Backward Compatible - Sin compatibilidad hacia atrs), y forma parte del prximo-a-estarterminado standard MPEG-2. El MPEG-2 AAC es un algoritmo de compresin de audio innovador que proporciona compresiones superiores a las que aportaban algoritmos ms viejos como el AC-3. AAC y AC-3 son ambos cdigos de transformacin, pero AAC usa un banco de filtros con una resolucin de frecuencias ms fina que proporciona una mayor compresin de la seal. AAC tambin utiliza una serie de nuevas herramientas como formacin de ruido temporal (temporal noise shaping), prediccin lineal adaptable hacia atrs, tcnicas de codificacin joint stereo (unin del estreo) y cdigo Huffman, cada uno de los cuales proporciona una capacidad de compresin adicional. Adems, AAC es mucho ms flexible que el AC-3, AAC soporta una amplia gama de sampling rates (tasas de sampleado) y bitrates (tasas de bits), de uno a 48 canales, hasta 15 canales de realzado de baja frecuencia, capacidad multi lenguaje y hasta 15 flujos de datos incluidos.
FORMATO OGG VORBIS

OGG es un formato abierto, es decir, sin dueo y sin posibilidad de ser patentado, creado por voluntarios al estilo del software libre y por ello, ms avanzado tecnolgicamente al recibir aportaciones e ideas de una enorme comunidad de programadores. Soporta audio de alta calidad, en bitrates variables, varios canales y por ahora hasta 128kb/canal. Esto sita a OGG a la misma altura actualmente que MP3 y MP4 (AAC). El lder del proyecto se llama Christopher Montgomery. Son muchos los voluntarios que se han unido a Montgomery sin dejar de aportar ideas y lneas de cdigo, consiguiendo que de media los archivos OGG sean un 25% menores que los mp3 de la misma calidad.
FORMATO VQF
VQF (Transform-domain Weighted Interleave Vector Quantization por sus siglas en ingls) es un nuevo formato de compresin de audio desarrollado por Yamaha, similar al MP3, pero con una mejor compresin y calidad de sonido. Los archivos VQF son entre 30-35% mas pequeos que un archivo MP3, por ejemplo: El archivo WAV de una cancin de 4 minutos ocupa aproximadamente 40MB, al convertir ese archivo a formato MP3 ocupa 3.33 MB, mientras que al convertirlo a formato VQF ocupa solamente 2.33 MB, con una calidad cercana a la del WAV. Este nivel de comprensin no afecta de ningn modo la calidad del sonido, inclusive la calidad del sonido de este formato es mucho mejor que el de MP3, por ejemplo: un archivo VQF a 80 kbps es tan bueno como un MP3 a 128 kbps, y un VQF a 96 kbps tiene casi la misma calidad que un MP3 a 256kbps a 1/4 de su tamao.
FORMATO MOD
Los ficheros MOD se asemejan a los ficheros MIDI en la medida que representan sonidos musicales. Este formato se origin en plataformas Amiga, pero debido a su flexibilidad y al gran nmero de ficheros MOD disponibles, su uso se extendi a otras plataformas (PC,
Mac, Sparc Station, etc.). Hoy en da es casi de inter6eacute;s meramente histrico porque estuvo bastante extendido.
FORMATO VOC
El formato VOC es propietario de Creative y apareci con las tarjetas de sonido SoundBlaster, muy populares en plataformas PC. Es un formato de fichero muy simple pero muy poco flexible.
EL COMPACT DISC
INTRODUCCIN
El origen de los discos compactos se debi a la necesidad en el mercado del sonido, de un sistema que reprodujera el sonido original una y otra vez sin perder la calidad de sonido. Para entenderlo veamos un poco de historia. Primero fueron los discos fonogrficos en los que se graba el sonido en un plstico en el cual se han dibujado unos surcos que hacen vibrar a una aguja, y sta a su vez hace vibrar a una membrana. Despus se inventaron las cintas magnetofnicas, en las que se plasmaban las seales de audio en una cinta magntica, mediante una cabezal (hacia falta que la gente pudiera grabar sonido). Estos sistemas tenan el problema de que el cabezal o la aguja tenan un contacto directo con el material grabado, con lo que por el rozamiento se iban deteriorando. Adems era muy fcil que algn factor externo los rayara o desmagnetizara. Es por eso que se invent el CD, que acababa con el problema de la friccin (es un haz de luz y no un cabezal el que toca la superficie del disco, y adems para solucionar los errores provocados por factores externos tienen algoritmos de correccin de errores). Otra ventaja que tienen los cds contra los discos de vinilo es el tamao. Ocupando muchsimo menos y en una sola cara de grabacin tiene el mismo tiempo para grabar audio. Un CD no es ms que un disco fabricado con un material plstico llamado policarbonato, en el que se han hecho surcos siguiendo una especie de circuito en espiral, y sobre el cual se han aplicado lacas y plsticos protectores para reducir la posibilidad de que alguno de estos surcos se llenen o se creen nuevos.
MEDIDAS
Si se corta un disco transversalmente distinguimos tres zonas, como se puede ver en la figura. La parte de arriba es una capa de acrlico en la que se puede escribir o imprimir la etiqueta. Despus hay una capa de aluminio reflectante, donde est codificada la informacin, y por ltimo hay una capa protectora de policarbonato, que es la cara por la que lee el lector de CD.
El disco tiene un dimetro de 12cm, con un agujero central de 15mm de dimetro. La informacin digital del disco se almacena en un rea que comienza a 25 mm del centro y se extiende hasta los 58 mm. Bordeando este rea existen dos anillos o guas, uno interno y otro externo. La gua interna contiene la tabla de contenidos del disco (lead in), y permite al lser sincronizarse y saber el contenido de informacin de audio o de datos antes de proceder a su lectura. La longitud de la gua interna depende de las dimensiones de la tabla de contenidos (que puede almacenar hasta 99 pistas de audio 33mm). A continuacin viene la informacin del CD, capaz de almacenar hasta unos 76 min. de audio y 99 pistas como mximo. Finalmente se encuentra la gua externa (lead out), que marca el fin de los datos (1 mm de ancho).
PISTAS
Cada una de las lneas paralelas que aparecen si miramos de forma transversal la superficie de un CD es una pista. Al igual que en los discos de vinilo, la informacin de un CD est grabada en forma de diminutos salientes practicados a lo largo de una espiral contnua, inicindose en el interior y continuando hacia el borde externo. En un disco de 74 min. la
longitud total del surco sobrepasa los 5 kilmetros, y su reproduccin implica ms de 20,000 revoluciones del disco.
Todos los discos compactos de audio deben girar con una velocidad lineal constante (1.3 m/s). Esto significa que, en cada segundo, el lector explora un tramo cuya longitud es de 1.3 metros. Como la espiral va aumentando su dimetro a medida que transcurre la reproduccin, el giro del disco (velocidad angular) va disminuyendo para mantener constante la velocidad lineal. Esto puede observarse en un reproductor provisto de ventanilla.
CD AUDIO
Ahora vamos a recorrer el camino de la seal, desde que es registrada por los micrfonos del estudio de grabacin, hasta que se acua el disco en la cadena de produccin. Primero se capta el sonido de forma analgica mediante unos micrfonos, esta seal recogida por los micrfonos es muestreada a 44,1 kHz y digitalizada. En el proceso de digitalizacin se representa cada muestra de sonido mediante un cdigo de 16-bit, implicando un rango dinmico de 90 dB. Como los CD audio contienen informacin de sonido estereofnico, tendremos, por cada tiempo de muestreo 32 bit de informacin, 16 bit por cada canal de audio. Estas tramas de bits obtenidas hasta el momento, se codifican mediante el cdigo Reed-Solomon entrelazado de dos niveles, haciendo posible la deteccin, correccin y ocultacin de errores, tanto de lectura, como de soporte. A esta trama de bits se le aaden una serie de bits para el control y la visualizacin de datos de cara al usuario final de este soporte de audio digital. Entonces, estos datos se ven sometidos a un ltimo tratamiento, la modulacin ocho a catorce (EFM o eight to fourteen modulation) esta modulacin se aplica (puesto que en un CD la informacin est registrada mediante flancos y llanuras) para que en ningn caso sea necesaria la utilizacin de, por ejemplo, dos flancos seguidos. En este ultimo tratamiento de la informacin se toman tramas de 8 bits, e identificndolas en una tabla ROM se traducen a palabras de 14 bits. La trama de bits resultante despus de todo este proceso, es utilizada para controlar un rayo lser, que registrar la informacin digital en la capa fotosensible de un disco rotatorio de cristal. Entonces, mediante un proceso fotogrfico se transfiere el patrn de flancos al disco maestro que se utilizar para producir los compact discs que luego llegarn a los usuarios. Siguiente>>
EL COMPACT DISC
LECTOR DE CD
Un lector de discos compactos est compuesto de un cabezal, un motor y un conversor digital-analgico (DAC). Cabezal: Tiene un emisor de rayos lser, que dispara un haz de luz hacia la superficie del disco. Posee tambin un fotoreceptor (foto-diodo) que recibe el haz de luz que rebota en la superficie del disco. El lser suele ser un diodo AlGaAs con una longitud de onda en el aire de 780 nm. (Cercano a los infrarrojos, nuestro rango de visin llega hasta aproximadamente 720 nm. Por lo que nos resulta una luz invisible, pero no por ello no daina. No debemos mirar nunca un haz lser. La longitud de onda dentro del policarbonato es de un factor n=1.55 ms pequeo que en aire, es decir 500 nm. Motor: hace girar el disco. Hay otro motor que mueve el cabezal a lo ancho del disco. Con estos dos mecanismos se tiene acceso a todo el disco. El motor se encarga del CLV (constant linear velocity), que es el sistema que ajusta la velocidad del motor de manera que su velocidad lineal sea siempre constante. As, cuando el cabezal de lectura est cerca del borde el motor gira ms despacio que cuando est cerca del centro. Este hecho dificulta mucho la construccin del lector pero asegura que la tasa de entrada de datos al sistema sea constante. La velocidad de rotacin en este caso es controlada por un microcontrolador que acta segn la posicin del cabezal de lectura para permitir un acceso aleatorio a los datos. DAC: Es un convertidor de seal digital a seal analgica, la cual es enviada a los altavoces. Tambien tiene muchsimos ms servosistemas, como el que se encarga de guiar el lser a travs de la espiral, el que asegura la distancia precisa entre el disco y el cabezal, para que el lser llegue perfectamente al disco, o el que corrige los errores. Los pasos que sigue el cabezal para la lectura de un CD son: 1. .Un haz de luz coherente (lser) es emitido por un diodo de infrarrojos hacia un espejo que forma parte del cabezal de lectura, el cual se mueve linealmente a lo largo de la superficie del disco.
2. La luz reflejada en el espejo atraviesa una lente y es enfocada sobre un punto de la superficie del CD 3. Esta luz incidente se refleja en la capa de aluminio, atravesando el recubrimiento de policarbonato. La altura de los salientes (que es como se ven los agujeros desde abajo) es igual en todos y est seleccionada con mucho cuidado, para que sea justo de la longitud de onda del lser en el policarbonato.
La idea aqu es que la luz que llega al llano (parte dos de la figura anterior) viaje 1/4 + 1/4 = 1/2 de la longitud de onda (en la figura se ve que la onda que va a la zona sin saliente hace medio perodo, rebota y hace otro medio perodo, lo que devuelve una onda desfasada medio perodo cuando va a la altura del saliente), mientras que cuando la luz rebota en un saliente, como se puede ver en la primera parte de la figura la seal rebota con la misma fase y perodo pero en direccin contraria. Esto
hace que se cumpla una propiedad de la fsica ptica que dice que una seal que tiene cierta frecuencia puede ser anulada por otra seal con la misma frecuencia, y misma fase pero en sentido contrario, por eso la luz no llega al fotoreceptor, se destruye a s misma. Se da el valor 0 a toda sucesin de salientes (cuando la luz no llega al fotoreceptor) o no salientes (cuando la luz llega desfasada perodo, que ha atravesado casi sin problemas el haz de luz que va en la otra direccin, y ha llegado al fotoreceptor), y el valor 1 al cambio entre saliente y no saliente, teniendo as una representacin binaria. (Cambio de luz a no luz en el fotoreceptor 1, y luz continua o luz no continua 0.) 4. La luz reflejada se encamina mediante una serie de lentes y espejos a un fotodetector que recoge la cantidad de luz reflejada. 5. La energa luminosa del fotodetector se convierte en energa elctrica y mediante un simple umbral nuestro detector decidir si el punto sealado por el puntero se corresponde con un cero o un uno.
DVD-AUDIO
DESCRIPCIN
En 1999, tres aos despus de la aparicin del DVD Vdeo, el DVD Forum (en el que estn incluidas compaas como Panasonic, Apple, IBM o Dolby) lanz las especificaciones definitivas del formato DVD Audio y en octubre de 2000 vio la luz el primer disco comercializado al pblico. La idea era, al igual que en el caso del DVD Vdeo, conseguir la mayor calidad posible pero esta vez en el terreno musical, lo que significaba superar el listn impuesto por el CD Audio. Dado que el DVD Audio se basa en un soporte con mucha ms capacidad de datos como es el DVD (con 4,7 Gbytes por capa y posibilidad de emplear dos capas y dos caras), el espacio no supona un problema y tampoco la tasa de transferencia del lector (de 150 Kbytes/seg del CD a los 1.200 Kbytes/seg del DVD). As pues, solamente haba que ampliar las funcionalidades del formato PCM para conseguir una digitalizacin mucho ms fiel de la onda analgica original. Esto supuso incrementar la tasa de muestreo de 44.100 Hz a 192.000 Hz y el nmero de bits empleados por muestra de 16 a 24. Con la primera medida se consigue, adems de reducir el efecto de los "dientes de sierra", ampliar la respuesta en frecuencia del sonido a 96 KHz (en contraposicin a los 20 KHz del CD) y con la segunda aumentar la gama dinmica de los 96 dB hasta los 144 dB. Adems, se introducen subarmnicos que complementan la seal principal. El resultado es un sonido ms ntido, una reproduccin mucho ms fiel de los agudos (sobre todo en instrumentos
como los platillos con un timbre de frecuencia muy alto) y mayor naturalidad en los medios y bajos. Ms de uno se preguntar sin embargo el porqu de aumentar el rango de frecuencias (entre 0 y 96.000 Hz) si en teora el odo humano slo es capaz de distinguir sonidos entre los 20 y los 20.000 Hz, precisamente el rango que cubra el CD. La respuesta est en la psicoacstica, esto es, en aquellos sonidos que el odo no percibe pero el cerebro s. Ampliar el sonido que percibimos con frecuencias que ms que orse se sienten, hace que se pueda distinguir una mayor calidad en un disco DVD Audio que en un CD Audio. Los datos de un DVD Audio se pueden almacenar en el disco de dos modos: sin comprimir, por medio del formato Linear PCM (LPCM), o comprimidos, mediante el sofisticado sistema MLP (Meridian Lossless Packing). Lo ms reseable de este ltimo es que se trata de un formato de compresin sin prdida alguna de calidad y que puede llegar a conseguir una reduccin del 45% con respecto al sistema LPCM. Esta compresin es la que permite incluir sonido multicanal en los discos DVD Audio para aumentar la espectacularidad y naturalidad de stos. Eso s, en modo multicanal, la frecuencia de muestreo mxima se reduce a 96 KHz en lugar de los 192 KHz que pueden conseguirse con grabaciones estreo o mono. Pero la flexibilidad con la que est pensado el estndar DVD Audio permite asignar una frecuencia y nmero de bits diferente a cada uno de los seis canales independientes. Puesto que las salidas digitales de los reproductores DVD no permiten mantener las tasas de transferencias necesarias para los discos de audio, los lectores de este tipo decodifican internamente los datos y los transmiten por seis salidas analgicas (una por canal) que deben conectarse directamente a un amplificador multicanal. En un futuro, los lectores DVD Audio incorporarn una salida digital IEEE 1394 (Firewire) para transferir ms fielmente el sonido al amplificador, pero de momento la industria musical y cinematogrfica no ve con buenos ojos esta idea por miedo a facilitar la piratera. Adems, un DVD Audio puede (y suele) contener otro tipo de informacin, concretamente de tipo visual. Puesto que estos discos estn pensados para reproducirse en lectores de DVD (que podrn o no tener capacidad para decodificar el formato DVD Audio), es prctica habitual incluir una pista Dolby Digital o DTS con el mismo contenido sonoro (pero con menor resolucin y calidad, claro est), as como fotografas, notas, letras e incluso vdeos, lo que les otorga un valor aadido que, por ejemplo, no suele tener un CD.
SUPER AUDIO CD
DESCRIPCIN
El formato SACD (Super Audio CD) es un nuevo formato desarrollado por Philips y Sony que supera en prestaciones al Compact tradicional.
Est basado en DSD (Direct Stream Digital) que es una tcnica de modulacin por densidad de pulsos (PDM) que emplea un bit para representar el incremento o cada de la forma de onda de audio. Esto produce mejoras en la calidad ya que elimina la pared de filtros requerida para la codificacin PCM. SACD multiplica por cuatro la capacidad de los CDs tradicionales y emplea un rango de frecuencias de hasta 100 Khz. No obstante hay que tener en cuenta que esta especificacin supera en mucho los lmites de audicin del odo humano. Al igual que los discos tradicionales, los SACD permiten almacenar 74 minutos de audio, aunque los contenidos estarn codificados a 2,8 MHz en lugar de a los 44,1 KHz de los CDs de audio tradicionales, en trminos profanos esto significa que la msica est muestreada 2,8 millones de veces por segundo, comparativamente hablando SACD muestrea contenidos 64 veces ms rpido que en los CD tradicionales. Las ventajas de este sistema son mltiples y variadas. Por un lado, el sistema de grabacin digital se acerca ms al empleado en la grabacin analgica al ser ms continuo y no estar restringido a unos valores mnimos y mximos de cuantificacin, lo que produce un sonido ms natural al odo humano. Por otra parte, los componentes necesarios para decodificarlo son, en principio, muy sencillos pues slo han de trabajar con un nico bit de datos. De hecho, en la mayora de reproductores de CD actuales con un mnimo de calidad se emplean DACs (convertidores de digital a analgico) de 1 bit para intentar evitar en lo posible la artificialidad del sonido PCM de 16 bits. La diferencia es que ahora no es necesario suavizar la seal, nicamente introducirla por un filtro pasa bajos analgico. Al igual que el DVD Audio, el formato SACD cuenta con la posibilidad de incluir informacin de hasta seis canales de audio independientes, codificados mediante un sistema de compresin sin prdida llamado DST (Direct Stream Transfer). Adems, del mismo modo que en los discos DVD Audio se suele incluir una pista Dolby Digital para hacerlos compatibles con todos los lectores de DVD, los discos SACD pueden albergar informacin PCM a 16 bits totalmente compatible con cualquier reproductor de CD, lo que se conoce como discos SACD hbridos. Esto se consigue empleando dos capas de lectura: en la ms superficial estar la informacin DSD en alta resolucin, mientras que en la interior se incluir el audio PCM convencional. SACD incluye caractersticas de marca de agua. El procesado digital de los pits (PSP) modula el ancho de los pits con la intencin de almacenar una marca de agua digital. Los reproductores SACD contienen una circuitera adicional capaz de leer la marca de agua
PSP, la cual posteriormente es comparada con la informacin almacenada en el disco para asegurarse de que consista en una marca leg6iacute;tima.

Audio Digital

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Audio Digital

Enviado por

Direitos autorais:

Formatos disponíveis

AUDIO DIGITAL

FUNDAMENTOS DE LA CONVERSIN ANALGICA-DIGITAL

Figura 7: La salida del sistema.

RUIDO DE CUANTIZACIN Y DITHER

RUIDO DE CUANTIZACIN Y DITHER

PROTOCOLOS DE TRANSMISIN DE LA SEAL DIGITAL

La seal debe tener su propio reloj

La seal debe tener 2 canales de audio en un nico cable.

PROTOCOLOS DE TRANSMISIN DE LA SEAL DIGITAL

Cdigo del canal

Cdigo de sincronizacin (Prembulo)

GRABACIN EN DISCO DURO

ADPCM (Adaptative Differential Pulse Code Modulation).

LPC-10E (Linear Predictive Coder).

CELP (Code Excited Linear Prediction).

FORMATO REAL AUDIO

FORMATO OGG VORBIS

Você também pode gostar