Você está na página 1de 16

Audio digital

Richard Marcelo Guardia

Qu es?
El audio digital es una representacin numrica binaria de las principales caractersticas de una onda sonora o audio analgico, a travs de cadenas de dgitos 0 y 1. La digitalizacin es un proceso tecnolgico mediante el cual, el audio anlogo es convertido a formato digital. El audio anlogo puede provenir de diversas fuentes como micrfonos receptores de narraciones, canciones, sonidos y ruidos provenientes de la naturaleza, fuentes grabadas en formatos y dispositivos analgicos, etc. Estas fuentes son capturadas como pequeas muestras en un determinado intervalo de tiempo y son representadas en formato binario como informacin digital.

Ha usado dispositivos digitales para grabar o reproducir audio digital? Podra indicar qu tipo de dispositivos? Recuerda el formato soportado?

Definiciones
A continuacin se presenta definiciones bsicas para una mejor comprensin del audio digital.

Sample (Muestra)
Este trmino se refiere a un valor que se toma de la salida de un convertidor analgico/digital. Mientras se tome o registre mayor nmero de muestras por unidad de tiempo, se contar con mayor densidad de informacin y dicho registro podra conllevar a una mejor calidad del audio.

Bit Depth (profundidad de bit)


Es un nmero entero, usualmente pequeo y expresado en bits. Hace referencia a la cantidad de bits utilizados para guardar la informacin de cada muestra. Por ejemplo si la profundidad de bit es 4, entonces se pueden guardar hasta 16 valores diferentes de una muestra. Observe a continuacin de dnde se obtiene el nmero de valores en funcin de la profundidad de bit.

24 = 16 valores (profundidad de bit 4)


Channel (Canal)
Un sonido digital puede estar constituido por uno o ms canales: 1 canal (monoaural)

2 canales (estreo) 6 canales (5.1 surround) o Canal 1: Frontal izquierda o Canal 2: Frontal derecha o Canal 3: Central o Canal 4: Efectos de baja frecuencia o Canal 5: Envolvente izquierdo o Canal 6: Envolvente derecho

Sampling Rate (Frecuencia de muestreo)


Se refiere al nmero de muestras capturadas por unidad de tiempo al que fue sometido un sonido analgico al ser digitalizado. La frecuencia de muestreo se expresa en Hz o kHz.

Nmero de muestras / segundo = 1 Hz (Hertz) 1000 Hz = 1kHz


La frecuencia de muestreo se mide por canal, por tanto un sonido estreo grabado a 16 kHz est constituido por 32000 muestras por cada segundo. Observe cmo se obtiene este resultado:

2 canales x 16000 muestras/canal = 32000 muestras


Bit Rate (tasa de bits)
La tasa de bits es la cantidad total de datos que se transmite por cada segundo. El bit rate se expresa en bits por segundo; es decir, bit/s o su representacin ms usada bps. Retomando el ejemplo anterior, se cuenta con un audio estreo grabado a 16 kHz y cada muestra tiene como profundidad de bit: 8 bits, entonces calculemos el bit rate o tasa de bits que se transmite en un segundo.

2 canales x 16000 muestras/canal x 8 bit/muestra = 256000 bit/segundo 256000 bit/segundo = 256 kbps (kilobits por segundo)

Calidad
Una vez que el audio se encuentra en formato digital, la seal es inmune a degradaciones y es posible grabarla fcilmente en una variedad de medios pticos o magnticos, donde puede ser guardada indefinidamente sin prdida de calidad. La calidad del audio depende de la calidad de la grabacin y de las caractersticas capturadas en el proceso de digitalizacin; por ejemplo, el nmero de muestras o frecuencia de muestreo, el tamao de cada muestra y el nmero de canales. Por ello se dice que la calidad del audio es independiente del dispositivo. Estas caractersticas se pueden ajustar atendiendo a criterios como peso del archivo, dispositivo en donde se va a reproducir o medio en el cual se va a publicar. Mayor frecuencia de muestreo significa mayor densidad de informacin capturada y mayor profundidad de bit significa la posibilidad de almacenar mayor cantidad de valores diferentes de la muestra, por tanto, cuanto mayor sean la frecuencia de muestreo y la profundidad de bit, se tendr mejor calidad de audio digital. La fidelidad es un trmino empleado para expresar la exactitud en la rplica del sonido original.

Rango audible: El odo humano puede percibir sonidos que se encuentran entre 20 Hz y 22000 Hz aproximadamente.

20 Hz < Rango audible < 22000 Hz


Las frecuencias por debajo de ese rango se llaman infrasnicas o subsnicas; y las que se encuentran por encima se denominan ultrasnica.

Si un audio digital cuenta con un solo canal y luego es grabado como sonido digital estreo, el resultado del audio digital no ser de mejor calidad. Lo nico que se habr conseguido es duplicar el tamao del archivo inicial.

Consideraciones para realizar una grabacin


Contar con el equipo necesario: computador, tarjeta de sonido, micrfono, audfonos, programa editor de audio. Realizar la grabacin en un ambiente aislado de ruidos, en tanto sea posible. Evitar sonidos o msica de fondo, conversacin de personas, vibraciones o ruidos de equipos como ventiladores, aire acondicionado, entre otros. Tener en cuenta que el propio equipo en donde se realiza la grabacin podra aadir ruido a la grabacin de forma inevitable. Verificar el funcionamiento de los equipos correctamente conectados y la configuracin del editor de audio que permitir la captura de audio. Ajuste los niveles de los parmetros de captura como el volumen del micrfono, nmero de canales de captura, tamao de las muestras, frecuencia de muestreo, etc. Tener en cuenta que al grabar un audio con frecuencia de muestreo alto y una alta profundidad de bits, se obtiene una mejor calidad, pero la desventaja es que el archivo resultante ocupar mucho espacio en disco. Sin embargo, se recomienda trabajar con la mejor calidad que sea posible ya que el audio grabado constituir un archivo fuente y a partir del cual se podr generar o convertir a diversos formatos de audio. Para obtener un audio que no represente prdida de calidad en la percepcin del odo humano, considere como frecuencia de muestreo el doble de lo que el odo humano puede percibir como frecuencia mxima (Teorema de Nyquist); es decir, alrededor de 44000 Hz. Tener en cuenta la calidad del audio fuente y del dispositivo en el que se encuentra, en caso se desee capturar, digitalizar o transferir informacin auditiva, por ejemplo: Sintetizador, Cassette, MiniDisc, CD Audio, etc. Grabar alrededor de 30 segundos de silencio, en caso se use un micrfono, para registrar el ruido del ambiente y de los equipos, y posteriormente pueda ser eliminado del audio grabado.

El teorema de Nyquist- Shannon seala que es posible una representacin digital perfecta de un audio analgico cuando la frecuencia de muestreo es de al menos el doble de la frecuencia ms alta que el odo humano puede percibir. El lmite superior de frecuencia que el odo humano puede percibir es de alrededor de 22 kHz, por tanto, con un audio

digital cuya frecuencia sea de al menos 44 kHz se puede asegurar una reproduccin del audio en todo el rango de percepcin del odo humano.

Sampling rates ms utilizados


El nmero de muestras por segundo es uno de los parmetros que define la calidad del audio digital y est relacionado directamente con el tamao o peso en disco del archivo resultante, por ello se debe tener en cuenta el medio o dispositivo sobre el cual se va a transmitir, reproducir o publicar. Los sampling rates ms conocidos son: 8000 Hz - 11025 Hz: estndar usado en telefona 11025 Hz - 22100 Hz: usado en transmisin de audio por Internet. 32000 Hz: usado en radio digital, en algunas televisoras de Gran Bretaa o del Reino Unido y en los televisores HDTV japoneses. 44100 Hz: estndar usado en CD de audio. 48000 Hz: usados en DAT (Digital Audio Tape). 96000 Hz: audio de alta definicin para DVD y BD-ROM (Blu-ray Disc).

Edicin del sonido


Una de las recomendaciones al momento de digitalizar o grabar un sonido es capturarlo con la mejor calidad posible, teniendo en cuenta las mejores caractersticas de los equipos as como la configuracin del software que permite dicha captura. El audio digital fuente podr ser procesado para ser modificado de acuerdo a diversos criterios con la finalidad de obtener un audio con la calidad y caractersticas requeridas. Para este fin, existen diversos programas de edicin de audio, software de tipo propietario y otros de libre distribucin (Open Source). En este caso vamos a utilizar el Audacity, el cual es un editor de audio multiplataforma y de libre distribucin. Los programas de edicin de audio muestran representaciones grficas del audio en forma de ondas, permitiendo realizar sobre ellas una serie de acciones como seleccionar un fragmento para eliminar, copiar y pegar en un proyecto nuevo; mejorar la calidad del sonido, eliminar ruido mediante filtros de determinadas frecuencias; eliminar, por ejemplo, la voz de una cancin; aplicar efectos como el eco de un auditorio o de un tnel; efectos doppler; realizar entradas y salidas suaves jugando con los niveles de volumen mediante los fade in y fade out; y muchas otras tareas

tan interesantes como revertir las ondas para or una msica al revs, normalizar, convertir y exportar en diferentes formatos.

Con qu formatos de audio ha trabajado o interactuado? Ha notado que algunos optimizan el espacio en disco? Ha notado diferencias en cuanto a la calidad de ellos?

Formatos de audio
Existen diversos formatos de audio, algunos determinados para una plataforma en particular y otras multiplataformas. Es importante tener en cuenta el tipo de archivo de audio con el que se trabaja y la extensin del archivo nos brinda informacin acerca del tipo de audio. Por lo general los diversos tipos de formatos de audio comprimen los datos a travs de un Codec y como resultado, estos archivos se compactan considerablemente. En todos los casos se pierde calidad pero en algunos de ellos, estas prdidas son imperceptibles por el odo humano.

Un Codec (compressor-decompressor) comprime un flujo de datos de audio o video para su almacenamiento o transmisin, de la misma forma, puede descomprimirla para realizar su reproduccin. Por este motivo, es necesario contar con el cdec en particular instalado en los equipos para la correcta reproduccin del audio comprimido. Existen codecs que comprimen con prdida y otras sin prdida, se deber decidir si vale la pena perder calidad a cambio de conseguir una alta compresin y buena velocidad de transmisin.

Los formatos de audio sin compresin son el WAV introducido por Microsoft y el AIFF utilizado en plataformas Macintosh.

Formato WAV Este formato es el ms compatible y usado por los usuarios de Windows, se trata de un archivo de audio sin compresin, de alta calidad y por tanto, resultan ser muy grandes. El formato wav se ha constituido en el estndar de calidad tomado como referencia para compararse con otros formatos. En el proceso de edicin de este formato, se puede especificar arbitrariamente la frecuencia de muestreo, el nmero de canales y el tamao de la muestra, con la finalidad de fijar la calidad y el tamao ocupado en disco. Un minuto de audio en este formato ocupa aproximadamente 10 MB de espacio en disco. Si desea puede observar el siguiente clculo.

Teniendo en cuenta el rango de percepcin del odo humano y el Teorema de Nyquist, una buena calidad de audio debe considerar una frecuencia de muestreo de 44100 Hz, estreo y 16 bits por muestra como profundidad de bits. Realicemos algunos clculos para hallar el tamao resultante de un minuto de audio de este tipo. La primera lnea de clculo muestra ya el resultado 1411200 bit/s, las otras dos son conversiones de unidades para llegar a 10,09 MB/min.

2 canales x 44100 muestras/canal x 16 bit/muestra = 1411200 bit/s 1411200 bit/s x 1 Byte/8 bit x 1 KB/1024 Byte = 172,27 KB/s 172,27 KB/s x 1 MB/1024 KB x 60 s/1 min = 10,09 MB/min
Con esto verificamos que cada minuto de audio en formato WAV, con las consideraciones del caso, ocupa un espacio de aproximadamente 10 MB (Mega Bytes).

Formato AIFF El formato AIFF (Audio Interchange File Format) fue desarrollado por Apple Computer. En un inicio este formato solo era para almacenamiento de archivos de audio en computadoras Apple, pero actualmente este formato AIFF al igual que el formato WAV es intercambiable, no es comprimido, presenta muy buena calidad y ocupa gran tamao en disco. El formato AIFF puede tener tambin muestras de 8 16 bits y soporta frecuencias de muestreo de hasta 44,1 kHz. Este formato es tan conocido y usado como el formato WAV y por tanto se puede exportar a este formato desde cualquier programa editor de audio digital.

Formato MP3 MP3 es la abreviacin de MPEG-1 Audio Layer 3, este formato fue desarrollado por el Moving Picture Experts Group (MPEG) y ha llegado a ser un formato muy conocido y usado debido a su alto ratio de compresin con una prdida mnima de calidad. Este formato descarta algunos detalles del audio digital que no son percibidos por el odo humano, consiguiendo un resultado de muy buena calidad casi idntica al original. Su alta capacidad de compresin hace que el archivo resultante sea muy pequeo y dependiendo de la calidad que se desee, es posible variar su tasa de bits. Por ejemplo, la tasa de bits de un audio digital que se encuentra grabado en un CD comercial es de 1411,2 kbps (kilobits por segundo), mientras que un sonido en formato MP3 de alta calidad tiene una tasa de bits de 320 kbps, pero en la prctica se puede reducir hasta 8kbps. La tasa de bit o bitrate ms comn es la de 128 kbps y existen otras tambin muy usadas como la de 160 kbps y la de 192 kbps. Hay que tener en cuenta que a mayor tasa de bits mejor ser la calidad del audio pero mayor ser su tamao en disco. El formato MP3 comprime, teniendo en cuenta el formato de audio de CD comercial, a la dcima parte consiguiendo en promedio una calidad aceptablemente buena.

Los programas editores de audio requieren de un Codec MP3 que permita comprimir el audio digital en dicho formato, los editores propietarios vienen integrados con este cdec mientras que los editores de libre distribucin (open source) no los incluyen y en el momento de la conversin solicitar la ubicacin de este cdec para proceder a crear el audio en este formato. Uno de los mejores cdec actualmente es el Codec LAME (Lame Aint an MP3 Encoder), existen otros como el Xing, pero el Lame es mejor en calidad.

Formato OGG OGG Vorbis fue creado como una alternativa al formato MP3, es abierta, gratuita y de gran calidad. Este formato no es tan conocido como los formatos WAV y MP3, pero al presentar una muy buena calidad su popularidad va en aumento, incluso cada vez ms dispositivos reproductores de audio soportan este formato. En pruebas realizadas, el Ogg Vorbis usando tasas de bits de buena calidad, se ha verificado que presentan una mejor calidad (precisin y sonido natural). A diferencia del MP3 que soporta como mximo dos canales, el formato Ogg Vorbis soporta sonido envolvente multicanal.

Formato WMA WMA (Windows Media Audio) es un formato desarrollado por Microsoft para competir en internet con el codec de streaming G2 de Real Audio y el MP3. Tcnicamente el formato WMA es un archivo de formato ASF (Advanced Streaming Format), sin embargo, esta extensin .wma responde a una necesidad de identificar estos archivos de audio, ya que los archivos ASF pueden incluir audio y video. Microfost afirma que este formato es superior en calidad al MP3, en pruebas realizadas se puede constatar dicha afirmacin aunque no en todos los casos, dependiendo de las caractersticas de los audios comparados como la tasa de bits y los canales. Sin embargo, se puede conseguir un audio en formato WMA para ser distribuida en internet y que cumpla muy bien sus objetivos.

Formato FLAC FLAC (Free Lossless Audio Codec) es un formato abierto y libre, que proviene del proyecto OGG. Tiene un formato de compresin con prdida, pero el archivo comprimido es equivalente en calidad al formato WAV con la ventaja de que los tamaos de archivo resultantes se reducen desde un medio hasta un tercio en relacin al WAV. Como se puede ver, con este formato se puede optimizar el espacio en disco y a la vez contar con una calidad de audio de muy buena calidad. Este formato FLAC no soporta profundidad de bits de 32-bits sino a lo ms de 24-bits y sin embargo con ello se puede conseguir un audio de muy alta calidad.

CDA (Compact Disc Audio) es una particularidad del formato de audio WAV que alcanz popularidad al ser introducidas y comercializadas por Philips y Sony. En realidad se trata de un estndar de almacenamiento ms que un formato, en el que se fijan algunas caractersticas al momento de grabar: 44,100 Hz como frecuencia de muestreo, profundidad de bits 16-bits y pueden ser monoaural o estreo. Como ya se verific antes, bajo estas caractersticas, cada minuto de audio en CD ocupa aproximadamente 10 MB (MegaBytes).

MIDI (Musical Instrument Digital Interface)


MIDI es un protocolo estndar de comunicacin realizado entre instrumentos electrnicos y computadoras. Se puede crear y reproducir una composicin MIDI a travs de software de notacin, composicin y secuenciador. Una composicin MIDI guarda la informacin de una

msica a manera de partituras que no es ms que una secuencia de mensajes para controlar alguna caracterstica de la msica, mientras que el audio digital s guarda informacin propiamente de una msica. Es decir, MIDI no constituye un audio digitalizado sino una representacin abreviada de una msica almacenada en forma numrica. Por tanto, el tamao en disco resulta bastante pequeo ya que solo guarda la informacin musical a manera de partituras, lista para ser reproducida y ejecutada por cualquier instrumento. La forma abreviada de msica almacenada puede ser reproducida por diversos instrumentos identificados por un sistema general MIDI de numeracin que va desde 0 a 127, en otras palabras se puede reproducir sonidos mediante 128 instrumentos diferentes.

Importancia como recurso didctico

El audio, al igual que otros tipos de medios, es un recurso importante y complemento didctico si se tiene en cuenta los diversos estilos de aprendizajes de los estudiantes. Brinda la posibilidad de estimular el inters y la motivacin hacia diversos temas, en especial en las aplicaciones multimedia educativas, siendo un recurso primordial. El audio convierte los momentos que pasa el estudiante, navegando e interactuando en aplicaciones multimedia, en una experiencia amena y divertida. Es difcil imaginar secuencias de imgenes, videos o animaciones, sin audio. El audio es un complemento para conseguir resultados potencialmente mayores, gracias a que el mensaje que se quiere transmitir es captado con mayor facilidad consiguiendo una comunicacin ms efectiva. Teniendo en cuenta la teora cognitiva del aprendizaje multimedia, permite aprovechar el canal auditivo para percibir la informacin, procesarla y construir los conocimientos, de tal forma que el estudiante adquiera aprendizajes significativos. En el mbito acadmico se puede usar en presentaciones, introducciones, indicaciones, narraciones, cuentos, enunciados, entre otras formas creativas. No solo debera ser importante la lectura y el discurso, sino tambin el desarrollo de la destreza de escuchar o saber escuchar.

Audacity es una herramienta para manejo de audio de tipo open source, libre de costo y multiplataforma (Windows, Linux y Mac OS X). Este software permite grabar, editar y mezclar audio digital con la posibilidad de obtener resultados en diversos formatos.

Pgina oficial de descarga: http://audacity.sourceforge.net/

Puede indagar e investigar acerca del trmino Podcasting. Qu es el podcasting? Se trata de la transmisin y distribucin, en principio, de audio a travs de internet. Se requiere de conexin a internet para poder acceder a los contenidos a travs del computador o cualquier otro medio que permita navegar en la web; sin embargo, tambin se puede descargar a cualquier dispositivo como reproductores mp3, smartphones, entre otros para luego escuchar y disfrutar del contenido de audio digital. La palabra Podcasting proviene de la combinacin de las palabras iPod y Broadcast, est relacionado directamente a la radio transmisin por internet, aunque actualmente este trmino se ha ampliado al uso del video. Descubra el poder y las ventajas del Podcasting en el mbito de la educacin. Puede revisar los textos recomendados que aparecen en la bibliografa de este tema. http://blog.educastur.es/cuate/category/podcasting/

Codificador LAME (Lame Aint an MP3 Encoder), es un codificador de MPEG Audio Layer III(MP3). Los programas editores de audio digital trabajan con diversos formatos y de preferencia con el formato nativo WAV a partir del cual se puede convertir a otros

formatos como el MP3, para realizar esta tarea de transformacin o codificacin se requiere el uso de un cdec como el LAME. La licencia de este codificador es Open Source. Sitio oficial del proyecto LAME http://lame.sourceforge.net/ Pgina de descarga de LAME para Audacity: http://lame1.buanzo.com.ar Puede encontrar otras distribuciones que permiten convertir a formato MP3, como por ejemplo el WinLame: http://sourceforge.net/projects/winlame/

Proteja sus odos: El rango de sensibilidad auditiva en las personas jvenes va de 20 Hz a 22000 Hz, pero conforme avanzamos en edad perdemos la audicin de altas frecuencias. Evite la exposicin prolongada a altos niveles de volumen y tenga cuidado cuando fije el nivel a escuchar, se recomienda iniciar de un nivel bajo e ir gradualmente aumentando hasta el nivel mnimo necesario. El odo se vuelve insensible a niveles altos ocasionando daos irreversibles como la prdida de audicin y llegar hasta el dolor. Uno de los sndromes muy conocidos es el de tinnitus.

Bibliografa
Andleigh, P. & Thakrar, K. (1995). Multimedia Systems Design. New York: Editorial Prentice Hall.

Baddeley, A D. (1986). Working memory. Oxford: Oxford University Press.

Beltrn, J. (1993). Procesos, estrategias y tcnicas de aprendizaje. Madrid: Sntesis.

Cuban, L. (1986). Teachers and machines: The classroom use of technology since 1920. New York: Teachers College Press.

Hernndez, J. , Pennesi, M., Sobrino, D. y Vzquez, A. (2011). Experiencias educativas en las aulas del siglo XXI. Innovacin con TIC. Madrid: Editorial Ariel, S.A.

Herrington, J. (2005). Podcasting Hacks. California: O'Reilly Media.

Hiitola, B. (2010). Getting started with Audacity 1.3. Create your own podcasts, edit music, and more with this open source audio editor. Birmingham: PACKT Publishing Ltd.

Kim, P. (2006). Real World Digital Audio. Berkeley: Peachpit Press. Koumi, J. Designing video and multimedia for open and flexible learning. New York: Routledge.

Linares, M. (1994). El guin. Elementos - Formatos Estructuras. Mxico: Editorial Alhambra Mexicana, S.A. de C.V.

Mack, S. & Ratcliffe, M. (2007). Podcasting Bible. Indianapolis: Wiley Publishing, Inc.

Mayer, R. E. (2001). Multimedia Learning. Cambridge: Cambridge University Press.

Mayer, R. E., & Sims, V. K. (1994). For whom is a picture worth a thousand words? Extensions of a dual-coding theory of multimedia learning. Journal of Educational Psychology, 84, 389-40l.

Montgomery, S. M. (1995). Addressing Diverse Learning Styles Trough the Use of Multmedia. ASEE/IEEE Frontiers in Education. Recuperado de: http://fieconference.org/fie95/3a2/3a22/3a22.htm (Consultado el 12 de mayo de 2011)

Norman, D. A. (1993). Things that make us smart. Reading, MA: Addison-Wesley.

Paivio, A. (1986). Mental representations: A dual coding approach. Oxford, England: Oxford University Press.

Prabhat, Andleigh y Kiran, Thakrar. Multimedia Systems Design. An introduction (chapter 1). Editorial Prentice Hall. New York. Pressman, R. (2006). Ingeniera de software. Un enfoque prctico. Quinta edicin: Editorial McGraw-Hill/Interamericana de Espaa, S.A.U. Madrid

Richardson, W. (2010). Blogs, Wikis, Podcasts, and Other Powerful Web Tools for Classrooms. London: Corwin. A SAGE Company.

Rosenborg, V., Green, B., Hester, J., Knowles, W. y Wirsching, M. A Guide To Multimedia. New Readers Publishing. Indiana. Schroder, C. (2011). The Book of Audacity. Record, edit, mix and master with free audio editor. San Francisco: No Starch Press, Inc. Simon, H. A. (1974). How big is a chunk? Science, 183, 482-488.

Skopec, D. (2004). Maquetas digitales. Barcelona: AVA Publishing S.A. Truesdell, C. (2007). Mastering Digital Audio Production. Indianapolis: Wiley Publishing, Inc. Vaughan, T. (2011). Multimedia: Making it work. Eigth edition. New York: McGraw-Hill. Walch, R. & Lafferty, M. (2006). Tricks of the Podcasting Masters. Indianapolis: Que Publishing. Watkinson, J. (2002). An introduction to Digital Audio. Second edition. Oxford: Focal Press.