Você está na página 1de 6

Audio digital

El audio digital es la codificacin digital de una seal elctrica que representa una onda sonora. Consiste en una secuencia de valores enteros y se obtienen de dos procesos: elmuestreo y la cuantificacin digital de la seal elctrica.

Muestreo digital de una seal de audio.

El muestreo consiste en fijar la amplitud de la seal elctrica a intervalos regulares de tiempo (tasa de muestreo). Para cubrir el espectro audible (20 a 20000 Hz) suele bastar con tasas de muestreo de algo ms de 40000 Hz (el estndar CD-Audio emplea una tasa un 10% mayor con objeto de contemplar el uso de filtros no ideales), con 32000 muestras por segundo se tendra un ancho de banda similar al de la radio FM o una cinta de casete, es decir, permite registrar componentes de hasta 15 kHz, aproximadamente. Para reproducir un determinado intervalo de frecuencias se necesita una tasa de muestreo de poco ms del doble (Teorema de muestreo de Nyquist-Shannon). Por ejemplo en los CD, que reproducen hasta 20 kHz, emplean una tasa de muestreo de 44,1 kHz (frecuencia Nyquist de 22,05 kHz). La cuantificacin consiste en convertir el nivel de las muestra fijadas en el proceso de muestreo, normalmente, un nivel de tensin, en un valor entero de rango finito y predeterminado. Por ejemplo, utilizando cuantificacin lineal, una codificacin lineal de 8 bitsdiscriminar entre 256 niveles de seal equidistantes (28). Tambin se pueden hacer cuantificaciones no lineales, como es el caso de cuantificadores logartmicos como la Ley Muo la Ley A, que, a modo de ejemplo, an usando 8 bits funcionan perceptualmente como 10 bits lineales para seales de baja amplitud en promedio, como la voz humana por ejemplo. El formato ms usado de audio digital PCM lineal es el del CD de audio: 44,1 kHz de tasa de muestreo y cuantificacin lineal de 16 bits (que mide 65536 niveles de seal diferentes) y que, en la prctica, permite registrar seales analgicas con componentes hasta los 20 kHz y con relaciones seal a ruido de ms de 90 dB.
Contenido
[ocultar]

1 Tasa de muestreo 1.1 Aliasing

2 Tamao de las muestras 2.1 Dither 3 Formatos de archivo de audio digital 4 Referencias 5 Bibliografa 6 Vase tambin

[editar]Tasa

de muestreo

Ejemplo de reconstruccin de una seal de 14,7 kHz (lnea gris discontinua) con slo cinco muestras. Cada ciclo se compone de slo 3 muestras a 44100 muestras por segundo. La reconstruccin terica resulta de la suma ponderada de la funcin de interpolacin g(t) y sus versiones correspondientes desplazadas en el tiempo g(tnT) con , donde los coeficientes de ponderacin son las muestras x(n). En esta imagen

cada funcin de interpolacin est representada con un color (en total, cinco) y estn ponderadas al valor de su correspondiente muestra (el mximo de cada funcin pasa por un punto azul que representa la muestra).

De acuerdo con el Teorema de muestreo de Nyquist, la tasa de muestreo, esto es, el nmero de muestras con las que se realiza el proceso de muestreo en una unidad de tiempo, determina exclusivamente la frecuencia mxima de los componentes armnicos que pueden formar parte del material a digitalizar.1 Satisfechos los requerimientos de Nyquist y un pequeo margen prctico, y al contrario de lo que es una creencia errnea muy extendida, 2 no existe relacin directa entre el sobremuestreo A/D (realizar el muestreo digital a una tasa mayor de la estrictamente necesaria para el ancho de banda de inters) y una mayor fidelidad en la posterior reconstruccin de la seal en todo el espectro (hasta la frecuencia de Nyquist).3

[editar]Aliasing

Con objeto de evitar el fenmeno conocido como aliasing, es necesario eliminar todos los componentes de frecuencias que exceden la mitad de la tasa de muestreo, es decir, del lmite de Nyquist, antes del proceso de digitalizacin (conversin A/D). En la prctica, estos componentes se atenan fuertemente mediante un filtro activo analgico paso-bajo que se aplica a la seal analgica de inters antes de su digitalizacin y que para este objetivo se denomina filtro antialiasing. En el proceso de reconstruccin posterior (conversin D/A) de la reproduccin se deber aplicar en esencia el mismo filtrado analgico mediante un filtro que, empleado en este proceso, se denomina de reconstruccin.

[editar]Tamao

de las muestras

El nmero de bits que conforman las muestras en un proceso determinado de cuantificacin determina la relacin seal a ruido mxima que debe tener la seal (la salida de un micrfono y, consecuentemente, el material sonoro que recoge, la salida de un mster analgico, etc.) que se pretende cuantificar y, por tanto, limita tambin el rango dinmico que debe tener para su cuantificacin completa, de modo parecido a cmo la capacidad de un recipiente (bits por muestra) limita el volumen de lquido (rango del material sonoro a cuantificar) que puede contener. Sea el nmero de bits con las que se cuantifican las muestras, la relacin seal (para sinusoidal

mxima que cubre todo el rango) a ruido de cuantificacin terica se obtiene en dB:4

Por tanto, una cuantificacin de 16 bits permite un mximo terico para la relacin seal sinusoidal a ruido de cuantificacin de 98,09 dB (122,17 dB para 20 bits, valor muy cercano al lmite real que permite el ruido de Johnson-Nyquist (tambin conocido como ruido trmico) de los mejores convertidores A/D actuales). En la prctica, el lmite de una seal analgica para que pueda ser cuantificada sin merma dinmica es, aproximadamente, el 90% del lmite terico.5 Por lo tanto, el lmite que debe tener una seal (por ejemplo, la seal directa de un micrfono o la que resultara de un mster analgico) para ser cuantificada con seguridad con slo 14 bits es de unos 78 dB, an cuando el lmite terico sea de 86,05 dB en este caso. Una vez que la relacin seal a ruido de cuantificacin que permite un proceso de cuantificacin dado excede la relacin seal a ruido mxima del material sonoro que se pretende cuantificar, esta podr ser cuantificada totalmente sin prdidas en su rango dinmico. Pasado este umbral, de nada sirve aumentar el nmero de bits por muestra del proceso de cuantificacin: no resultar en una conversin ms fiel. Por ejemplo, una relacin seal a ruido de cuantificacin de 90 dB (una relacin prctica que permiten sobradamente los 16 bits por muestra de un CD-Audio) es suficiente para cuantificar cualquier grabacin musical normal, cuyo rango de intensidad sonora puede ir desde los 25 dB(SPL) del ruido de fondo de un estudio de grabacin hasta los 115

dB(SPL), casi el umbral del dolor de la audicin humana,6 en la posicin del micrfono duante una grabacin en dicho estudio. El tamao de las muestras necesario en un proceso de cuantificacin digital se determina, por tanto, a partir del anlisis del ruido de fondo y de la intensidad mxima del material sonoro a registrar. Aumentar por encima de lo necesario el tamao de las muestras es slo un desperdicio de ancho de banda, especialmente en los formatos finales de distribucin. No supone mejora alguna, ni siquiera mensurable, ya que slo servira para registrar el ruido con ms bits, es decir, ms bits intiles cuyo valor depender exclusivamente del azar o, segn se ajuste la ganancia, para dejar los bits ms significativos a cero en todas las muestras (o una combinacin de ambas cosas). De modo parecido, un recipiente de capacidad mayor a la del lquido que se pretende depositar en l no mejora en medida alguna la calidad o cantidad de dicho lquido respecto al uso de un recipiente de menor capacidad siempre que sta capacidad menor sea an suficiente para el volumen del lquido. Dicho de otro modo, al contrario de lo que es una creencia errnea muy extendida,7 el tamao de las muestras a emplear en una cuantificacin depende del material sonoro que se pretende cuantificar y nada tienen que ver la fidelidad de la reconstruccin en la reproduccin o los lmites psicoacsticos humanos (por la percepcin de dicha fidelidad) con esta determinacin, por ejemplo. Si un material sonoro a digitalizar "cabe" en 10 bits por muestra, cuantificar a 14 bits (o 20) no hace ms fiel su reconstruccin posterior ni, consecuentemente, es posible percibir diferencias subjetivas que no resulten de la sugestin.

[editar]Dither

Seal armnica (sinusoidal pura) con dither aadido en una relacin seal a ruido de 21,03 dB lista para ser cuantificada con slo 4 bits por muestra (16 niveles de cuantificacin). La seal tiene, por tanto, unas 127 veces la potencia del dither (11,26 veces su valor eficaz -RMS-). Una futura conversin A/D con ms niveles de cuantificacin (ms bits por muestra) permitiran aadir un ditherproporcionalmente (respecto de la seal) menor.

Con objeto de evitar que el ruido de cuantificacin se manifieste como una distorsin, se hace necesario aadir un ruido denominado dither antes del proceso de cuantificacin en todos los casos donde el nivel del ruido de la seal (por ejemplo,ruido de Johnson-Nyquist o ruido trmico de un

circuito especfico) sea inferior al de cuantificacin.8 Sea el incremento de tensin (diferencia de potencial) correspondiente a un escaln de cuantificacin, el valor eficaz (RMS) del ruido de cuantificacin sera:

Dado que actualmente los mejores convertidores tienen relaciones seal a ruido trmico que raramente exceden los 122 dB a temperatura ambiente, se hace necesario aadir dither en todos los casos en los que se emplean cuantificaciones (o recuantificaciones) inferiores a 20 bits. Los cuantificadores de 24 bits, si bien no presentan ventajas prcticas sobre los de 20 bits debido al nivel del ruido trmico de los convertidores, al menos no requieren la adicin de dither (y permiten registrar la muestra en un nmero entero de bytes). Sin embargo, s ser imprescindible aadir dither en los casos donde se recuantifican estas grabaciones a muestras de 16 bits, por ejemplo.

[editar]Formatos

de archivo de audio digital

Este artculo o seccin necesita referencias que aparezcan en una publicacin acreditada, como revistas especializadas, monografas, prensa diaria o pginas de Internet fidedignas.
Puedes aadirlas as o avisar al autor principal del artculo en su pgina de discusin pegando:

{{subst:Aviso referencias|Audio digital}} ~~~~


Los archivos de audio digital almacenan toda la informacin que ocurra en el tiempo, el tamao del archivo no vara as contenga 'silencio' o sonidos muy complejos[cita requerida]. Existen muchos formatos de archivo de audio digital, que se pueden dividir en dos categoras PCM y comprimidos. Como se vio arriba el tamao puede depender de la cantidad de canales que tenga el archivo y de la resolucin (tasa de muestreo y profundidad). Formatos PCM Los formatos PCM contienen toda la informacin que sali del convertidor analgico a digital, sin ninguna omisin y por eso, tienen la mejor calidad. Dentro de esta categora se encuentran los formatos WAV, AIFF, SU, AU y RAW (crudo). La diferencia principal que tienen estos formatos es el encabezado, alrededor de 1000 bytes al comienzo del archivo[cita requerida]. Formatos comprimidos Para usar menos memoria que los archivos PCM existen formatos de sonido comprimidos, como por ejemplo el MP3, AAC y Ogg. Ciertos algoritmos de compresin descartan informacin que no es perceptible por el odo humano para lograr que el mismo fragmento de audio pueda ocupar en la memoria inclusive dcima parte -o menos- de lo que ocupara de ser PCM[cita requerida]. La reduccin en tamao implica una prdida de informacin y por esto a los formatos de este tipo se les llama formatos comprimidos con prdida[cita requerida]. Existen tambin formatos de archivo comprimido sin prdida, dentro de los que se cuentan el FLAC y el Apple Lossless Encoder, cuyo tamao suele ser de aproximadamente la mitad de su equivalente PCM[cita requerida].

Formatos descriptivos: Archivos MIDI Este formato de archivos no es precisamente de audio digital, pero s pertenece a las tecnologas de la informtica musical. El archivo MIDI no almacena "sonido grabado", sino las indicaciones para que un sintetizador o cualquier otro dispositivo MIDI "interprete" una serie de notas u otras acciones (control de un mezclador, etc.)[cita requerida]. Podemos imaginarlos como algo similar a una partitura, con los nombres de los instrumentos que hay que utilizar, las notas, tiempos y algunas indicaciones acerca de la interpretacin.

[editar]Referencias

1.
(ingls)

Teora de muestreo (Dan Lavry de Lavry Engineering, Inc.): Por qu ms no es mejor.

2.

Embedded Signal Processing Laboratory (University of Texas at Austin): Debunking

Audio Myths Desenmascarando los mitos del audio (ingls). Vase "Mito 4: Necesitamos 96 kHz, no, mejor 192 kHz".

3.

Las tcnicas de Noise-Shaping pueden mejorar la relacin seal a ruido de parte del

espectro hasta el lmite de Nyquist pero siempre a cambio de empeorar esa relacin en otra parte de ese mismo espectro. No hay nunca, por tanto, mejora global de ningn tipo en todo el espectro hasta la frecuencia de Nyquist por aumentar la tasa, incluso cuando este aumento se realiza con la intencin de aplicar estas tcnicas de modelado de ruido.

4. 5.

Smith, J.O.. "Round-off Error Variance", en Mathematics of the Discrete Fourier

Transform (DFT). ISBN 978-0-9745607-4-8. Por la necesidad de aadir dither y contemplar un margen de error de ajuste (se

deber ajustar el nivel de la seal a cuantificar para que coincida, aproximadamente, la potencia del ruido de cuantificacin con la del ruido base de la seal).

6. 7.

Carl R. Nave. Threshold of Hearing (en ingls). Consultado el 2 de enero de 2012. Kite, Thomas (2001). Signal Processing Seminar: Debunking Audio Myths (Vase

"Myth 5: 16 bits are not enough"). The Embedded Signal Processing Laboratory - University of Texas at Austin.

8.

Martin, Geoff (2004). "Dither examples", en Introduction to Sound Recording.

[editar]Bibliografa
Proakis, J. G. y Manolakis, D. G. (1998). Tratamiento digital de seales. Principios,

algoritmos y aplicaciones. Hertfordshire: PRENTICE HALL International (UK) Ltd. ISBN 84-8322000-8.