Você está na página 1de 76

LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

PG. 1
AVANCES del audio en Latinoamrica.

AUDIO ENGINEERING SOCIETY Comit Cientfico


Seccin Colombia
PhD. Mauricio Ardila
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN PhD. Ana Mara Jaramillo Jaramillo
COLOMBIA PhD. Jos Ricardo Zapata
Avances del audio en Latinoamrica Mg. Daniel Vsquez
2016 Mg. Ricardo Escalln
ISBN- 978-958-56264-0-9 Mg. Jorge Mario Valencia Upegui
Mg. Carlos Andrs Caballero Parra
Mg. Luis Fernando Hermida
Publicacin dirigida a la comunidad cientfica y profe- Mg. Ral Enrique Rincn
sional del audio en Latinoamrica Mg. Luis Jorge Herrera
Ing. Manuel Fernando Torres Cifuentes
AES REGIN LATINOAMRICA Ing. Belman Rodriguez
Hugo Villegas
Vice Presidenta
VALERIA PALOMINO Compilador
Carlos Andrs Caballero Parra

COMIT AES COLOMBIA Diseo Grfico


Shapes | Comunicacin Visual
Presidente
ANDRS MILLN Publicacin Digital
Vice Presidente Editado por:
RICARDO ESCALLN Instituto ENE Audio
Secretario
CARLOS CABALLERO Los contenidos de sta publicacin son responsabilidad
Tesorero de cada autor, por lo tanto, no comprometen la opinin
FABIO NICHOLLS del Instituto ENE Audio y tampoco de la Seccin AES Co-
Vocales lombia.
RAJIV ARORA
WILLIAM FLREZ El Comit AES Colombia autoriza la reproduccin parcial
ANDREA LIVANO o total de los contenidos slo con fines acadmicos, con
ANDRS NEZ la solicitud expresa de mencionar la fuente.
JORGE VALENCIA
JOHNATAN MONTENEGRO

Audio Engineering Society


Seccin Colombia
Cel: +57 (310) 768-3433
Contacto: facebook.com/aescolombia
Web: www.aes-colombia.org
Bogot - Colombia

PG. 2
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

CONTENIDO
1. Presentacin
Pag. 4
2. Diseo y construccin de un preamplifi-
cador a vlvulas con emulacin de calidad
tonal de dos amplificadores clsicos de
guitarra.
Johnatan Lpez Pilco
Pag. 5
3. Metodologa para la medicin de directi-
vidad en tiple colombiano
Fredy Alzate Arias
Jos Julin Cadavid Sierra
Pag. 11
4. Comparacin entre diferentes frecuen-
cias de muestreo y profundidad de bits en
el desarrollo de una produccin musical
Sebastin Lopera Gmez
Pag. 19
5. Mezcla de audio binaural mediante inter-
faz tangible
Juan Esteban Herrera
Ricardo Moreno
Pag. 27
6. Desarrollo de algoritmo de interpreta-
cin de respuestas al impulso en tres di-
mensiones
Federico Nahuel Cacavelos
Augusto Bonelli Toro
Alejandro Bidondo
Pag. 33
7. Audiojuego con implementacin de audio
binaural
Andrs Carmona
Diego Sierra
Ricardo Moreno
Pag. 39
8. Mtodos alternativos de espacializacin
compuesta. Parte 1
Juan David Sierra
Pag. 47
9. Mtodos alternativos de espacializacin
compuesta. Parte 2
Juan David Sierra
Pag. 55
10. Criteria: medicin de respuesta al im-
pulso y obtencin de parmetros acsticos
Yonny Quiceno
Alejandro Meja
Juan F. Londoo
Antonio Escamilla
Pag. 61
11. Conferencia Latinoamericana
Resumen
Momentos destacados del evento
Pag. 69-70
12. Comit AES Colombia
Pag. 74
13.Prximo eventos
Pag. 75

PG. 3
AVANCES del audio en Latinoamrica.

PRESENTACIN
La Conferencia Latinoamericana de la Audio Engineering So-
ciety 2016 fue uno de los eventos regionales ms importan-
tes y destacados de la asociacin. El impacto que marc a lo
largo de la comunidad de audio a nivel Latinoamericano fue
importante y cumpli con los estndares de calidad esta-
blecidos por la AES. Para esta oportunidad, recibimos como
anfitriones asistentes de Ecuador, Per, Costa Rica, Estados
Unidos, Mxico, Argentina y diversas ciudades de Colombia,
a quines ofrecimos contenidos muy nutridos e impartidos
por algunos de los expertos nacionales e internacionales
ms importantes y reconocidos de las diferentes ramas del
sonido.

A diferencia de conferencias anteriores, para esta oportuni-


dad decidimos presentar un evento que girara alrededor de
cuatro ejes temticos: Acstica/Electroacstica/Psicoacs-
tica, Refuerzo Sonoro/Diseo de Sistemas de Sonido, Pro-
duccin (Grabacin, Mezcla y Mastering) y PostProduccin
de Audio/Videojuegos. A lo largo del evento se presentaron
conferencias, talleres, paneles de discusin demostraciones,
competencias de diseo y grabacin, tours tcnicos, crti-
cas de grabacin, ponencias y posters de investigacin por
estudiantes y profesionales nacionales e internacionales,
haciendo de la Conferencia el evento ms grande en audio
efectuado en el pas.

Adicionalmente, particip Sennheiser con la presentacin y


demostracin de su sistema AMBEO 3D, Technik S.A. con au-
diometras gratuitas para los asistentes y ms de 25 compa-
as que presentaron sus productos y servicios en la zona
de exhibicin comercial. Este magno evento fue patrocina-
do por Electro Voice, Sennheiser, Olson Sound Design, Meyer
Sound, InfoComm International, AVID y AFMG (Ahnert Feistel
Media Group) y fue posible gracias al apoyo de la Universi-
dad de San Buenaventura, el Instituto Ene Audio y Diffusion
Magazine.

Los resultados de la Conferencia Latinoamericana 2016 con-


ducen a la periodicidad de un evento anual de la asociacin,
a mantener una constante convocatoria de proyectos de in-
vestigacin y al fortalecimiento de los contenidos presen-
tados en las competencias estudiantiles de diseo y graba-
cin. Ahora bien, las memorias de esta convocatoria inician
el capitulo de un compromiso de incentivar a investigadores,
cientficos, docentes y estudiantes a fortalecer sus procesos
de investigacin y ser participes de futuras convocatorias li-
deradas por la AES dentro del marco de sus eventos locales
e internacionales. Ing.

ING. ANDRS FELIPE MILLN SILVA


Presidente AES Colombia

PG. 4
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

AVANCES
DEL AUDIO EN
LATINOAMRICA.

DISEO Y CONSTRUCCIN
DE UN PREAMPLIFICADOR
A VLVULAS CON CALIDAD
TONAL DE DOS AMPLIFICADORES
CLSICOS DE GUITARRA

Jhonatan Lpez
PG. 5
Pilco
AVANCES del audio en Latinoamrica.

Ing. Jhonatan Lpez Pilco para Fender y Angus y Mal Young (AC/DC), Jimi Hendrix, Zakk
Ingeniera en Sonido y Acstica, Universidad de las Wylde (Black Label Society), Steph Carpenter (Deftones), para
Amricas Marshall, por mencionar algunos.
Quito, Ecuador
Por las razones antes expuestas es que hoy por hoy se con-
jlopez@udlanet.ec
sidera como un buen punto de partida estudiar circuitos
jhonyg_4@.hotmail.com
preamplificadores bases como lo son los de las marcas Fen-
der y Marshall.
Resumen El proyecto presenta el diseo y construccin de un
preamplificador con dos distintas sonoridades, partiendo de dos di-
seos de preamplificadores de marcas reconocidas a nivel mundial
II. Diseo y Construccin
La sonoridad de un amplificador de guitarra depende de
como lo son Fender y Marshall. Empleando programas de simula- una serie de variables entre las que estn: los componentes
cin electrnica se simula los preamplificadores, estos se estudian y internos, el diseo, la configuracin del preamplificador, la
analizan para luego unirlos y tener un solo circuito. Posteriormente etapa de potencia, el altavoz o los altavoces elegidos y el
se lo lleva a una placa de pruebas para luego finalmente implemen- diseo de la caja, sin tomar en cuenta el instrumento que in-
tarlo en un circuito PCB y ensamblarlo en una caja. As tambin se fluye en gran medida; sin embargo el presente artculo trata
muestra mediciones y anlisis parmetros tcnicos como respuesta en particular sobre el diseo y construccin de la etapa de
en frecuencia e impedancia. Finalmente se realiza comparaciones pre amplificacin.
entre el preamplificador diseado y uno de sus homlogos, mostran-
do as resultados en simulaciones y algunas entrevistas realizadas a Un preamplificador viene definido elctricamente por una
algunos ingenieros en sonido. etapa de alimentacin elctrica, una o varias etapas de am-
plificacin (trodos 12AX7) y una etapa de ecualizacin.
Palabras clave Diseo, construccin, preamplificador, vlvulas,
Fender, Marshall.
Fig. 1. Diagrama de bloques de un preamplificador.
Abstract This project deals with how a preamplifier is designed and
built using valves with two different sounds, based on the two designs A. Seleccin de circuitos preamplificadores.
of the world renowned preamplifier brands of Marshall y Fender. El primer paso es la seleccin de los circuitos, para lo cual se
Using electronic design and simulation to simulate preamplifiers, tom en cuenta principalmente que los diagramas elctricos
they are studied and analyzed to then join them in a single circuit. estn disponibles bibliogrficamente o que se encuentren
Next it is taken to a test board so that it can be finally installed into a disponibles en la red para realizar el anlisis respectivo.
PCB circuit and assembled in a box. This way the measurement and Los preamplificadores seleccionados fueron el Marshall JCM
analysis of some technical parameters such as frequency response 800 y el Fender Champ 5E1.
and impedance are also shown. Finally comparisons are carried out
between the designed preamplifier and one of its counterparts, ob-
taining results with the emulation as demonstrated in meetings held
with some sound engineers.

Keywords Design, built, preamplifier, valves, Fender Marshal.

I. Introduccin
Desde el ao de 1946, cuando la empresa norteamericana
Fender revoluciona la industria musical con la produccin
en masa de instrumentos y dispositivos amplificadores de
audio para instrumentos musicales, empieza una carrera
por encontrar nuevas posibilidades y caractersticas sonoras
para que los msicos se identifiquen con estas.

En esta bsqueda de nuevas sonoridades nacen nuevas em-


presas una de ellas es la empresa inglesa Marshall, que 20 Fig. 2. Circuito Fender Champ 5E1.
aos despus de la aparicin de los primeros modelos de
Fender revoluciona la industria con un nuevo sonido. Este
sonido se caracterizaba por ser ms agresivo que los mo-
delos presentados por Fender sin embargo este sonido fue
conseguido tras la experimentacin con modelos propios de
la marca de Fender.

Estas dos empresas, desde sus inicios se han caracterizado


por su constante innovacin en sus productos de amplifi-
cacin, presentando as una infinidad de posibilidades en
cuanto a lo que gustos sonoros se refiere. Adems del pres-
tigio ganado a lo largo de los aos se han posicionado como
lderes en el mercado mundial, ganndose la confianza de Fig. 3. Circuito Marshall JCM 800.
msicos profesionales como lo son: Pete Townshend (The
Who), Billy Gibbons (ZZ Top), Larry Ler LaLonde (Primus),

PG. 6
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

B. Circuito de ecualizacin.
El segundo paso para el diseo del preamplificador es la se-
leccin del ecualizador. Si bien un preamplificador de gui-
tarra se encuentra definido por tres partes fundamentales
(rectificacin, amplificacin y ecualizacin), la etapa de ecua-
lizacin no forma parte del circuito de referencia del Fender
Champ 5E1 y con este se presenta el primer reto, si debera Fig. 5. Simulacin preamplificador 5E1 con una fuente de voltaje
o no ir ste dentro del circuito. Con fines experimentales se de 260 V.
lo incluye, para as incrementar la versatilidad, ampliar los
resultados y cumplir uno de los objetivos planteados que fue
el de unir dos amplificadores en un solo circuito compartien-
do la mayor cantidad de etapas.

Para el circuito ecualizador se toma en consideracin el cir-


cuito presentado por el preamplificador Marshall JCM 800, el
mismo que se mantendr para el diseo final. Fig. 6. Simulacin preamplificador 5E1con una fuente de voltaje
de 300 V.

Para todas las mediciones realizadas se utiliza una seal de


entrada de 1 kHz y una amplitud de 100 mV RMS, que es el
voltaje promedio que entrega una guitarra al ser rasgada.

Conociendo los pros y contras que representa el utilizar una


misma fuente para los dos amplificadores, se opta por uti-
lizar el circuito rectificador de 300 V, siendo este el menos
contraproducente.

Fig. 4. Circuito ecualizador Marshall JCM 800. Fig. 7. Circuito rectificador de onda 300 V.

C. Etapa de alimentacin elctrica.


Para la etapa de alimentacin elctrica de los circuitos am-
plificadores son necesarios cuatro circuitos rectificadores fil-
trados para obtener corrientes continuas, uno de 300 V (JCM
800), uno de 260 V (5E1) y dos de 12 V; estos ltimos encar-
gados de calentar el filamento de cada vlvula (ctodo); de Fig. 8. Circuito rectificador de onda 12 V.
esto resulta evidente que un solo circuito rectificador de 12 V
puede ser compartido. D. Simulacin del preamplificador Fender Champ 5E1.
La simulacin del circuito preamplificador se la realiz a travs
Con la finalidad de simplificar una vez ms el diseo se opta de dos programas de simulacin elctrica; CircuitMaker 2000
por la posibilidad de que los preamplificadores compartan e ISIS de Proteus. El primero utilizado para realizar el diseo
uno de los otros circuitos rectificadores. debido a que simplifica las conexiones y el segundo utilizado
en la construccin.
De forma terica la variacin del voltaje constante sobre la
resistencia del ctodo (voltajes de 300 o 260 V) en un circui- Por simplicidad los grficos mostrados a continuacin son los
to amplificador con vlvulas, afecta directamente a la lnea de la simulacin realizada en CircuitMaker 2000.
de carga, la misma que indica la forma de onda amplificada
resultante y que es creada a partir de los valores de los com- Es importante mencionar que para la simulacin de este circui-
ponentes electrnicos del diseo; es decir que al alterar este to se omite la etapa de rectificacin y se la reemplaza por una
valor incidiremos en la forma de onda amplificada. batera de voltaje constante, que cumple la misma funcin.

Mediante el anlisis matemtico se determina que una l-


nea de carga con mayor voltaje genera una amplificacin de
la seal de entrada mayor y con menor distorsin, mientras
que una lnea de carga con menor voltaje genera una ampli-
ficacin de la seal de entrada menor y con mayor distorsin;
en otras palabras, si se aplica un voltaje de 260 V al circuito
amplificador se tender a distorsionar la seal amplificada Fig. 9. Simulacin del circuito Fender Champ 5E1 con etapa de
ms que si aplicamos 300 V. ecualizacin.

PG. 7
AVANCES del audio en Latinoamrica.

riano se tiene como formato estndar entregar la simulacin


La simulacin es realizada con un voltaje de entrada cuya del circuito en el programa ISIS de Proteus para poder dise-
amplitud es de 100 mV RMS y una frecuencia de 1 kHz. ar el PCB.

Dentro del programa de simulacin Proteus se cuenta otro


E. Simulacin del preamplificador Marshall JCM 800. programa que trabaja en conjunto con el ISIS llamado ARES
Esta simulacin se la realiz de forma igual que la anterior el cual permite visualizar el PCB y realizar correcciones antes
en el programa CircuitMaker 2000, con voltajes de entrada de de su impresin.
1 kHz y 100 mV RMS de amplitud.
En el proceso de ensamblaje se realiz el montaje de compo-
nentes y se establecieron cdigos de colores para los cables
que conectan las vlvulas, con finalidad de mantener el or-
den y evitar inducciones electromagnticas.

Otro criterio importante que se tom en cuenta durante el


montaje es el uso de interruptores, con la finalidad de rediri-
gir las seales elctricas y simplificar el circuito e incremen-
Fig. 10. Simulacin del circuito Marshall JCM 800 con etapa de tar la versatilidad del preamplificador. Agrupando por un
ecualizacin. lado las seales de voltaje constante y por otro las seales
de audio, facilitando tambin la manipulacin del preampli-
F. Diagrama de flujo de seal del circuito final. ficador.
El circuito preamplificador final se resume en la suma de to-
das las etapas interconectadas, los interruptores S1 y S2 ru- I. Clculo de la respuesta en frecuencia y la impe-
tean de manera simultnea las seales de audio a la entrada dancia.
Por las dimensiones del circuito resulta bastante complejo el
y salida, mientras que el interruptor S3 rutea los voltajes de
clculo matemtico de la respuesta en frecuencia sin embar-
alimentacin elctrica. go la evaluacin experimental de la respuesta se la realiza a
travs de un analizador de espectro.

Por otro lado, el clculo matemtico de la impedancia se la


realiza a travs de la siguiente expresin matemtica:

(1)

Dnde:
RL: es la resistencia de carga (1000 ).
VS: es el voltaje de salida.
VL: es el voltaje de entrada.
Z: es la resistencia igual a la impedancia de salida.
Fig. 11. Diagrama de flujo de seal del circuito preamplificador
final. El valor del voltaje de entrada se lo obtiene por bandas de
octava desde los 31.5 Hz a los 16 kHz, cuya amplitud es de 100
mV, mientras que el voltaje de salida es obtenido midiendo
G. Implementacin del circuito en protoboard. la salida del dispositivo.
Previo a la implementacin del circuito se realiz una simu-
lacin del circuito integrando todas las etapas anteriormen-
te simuladas, de igual manera para la implementacin del
III. Resultados
Los resultados se expresan en funcin de la utilizacin del
circuito en protoboard se realiz por etapas (rectificacin, desempeo del preamplificador, la impedancia, la respuesta
amplificacin, ecualizacin) para finalmente unirlas en un en frecuencia y el comportamiento de los parmetros que
solo circuito final. La implementacin en protoboard es prin- permite manipular el dispositivo.
cipalmente til para la toma de las mediciones.
La impedancia representada en la Figura 13, se utiliza princi-
palmente para la adicin de nueva circuitera o nuevos dis-
positivos.

Fig. 13. Curvas de impedancia de los preamplificadores Fender


Fig. 12. Mediciones circuito Fender Champ 5E1 y Marshall JCM Champ 5E1 y Marshall JCM 800.
800.
A continuacin se muestra la respuesta en frecuencia de los
H. Implementacin circuito PCB y ensamblaje. preamplificadores, analizados con ruido blanco (seal de
La elaboracin de la placa PCB es realizada por un tcnico
entrada) Figura 14, y el cmo se comporta este al atravesar
especializado, para lo cual es necesario poseer el circuito
completo en un programa simulador. En el mercado ecuato- cada preamplificador.

PG. 8
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

como retroalimentacin para el investigador, sin embargo


las opiniones, comentarios y sugerencias no son mostrados
en este artculo al ser considerados subjetivos.

IV. Conclusiones
El diseo y construccin de un solo circuito de un preampli-
ficador a vlvulas para guitarra con dos diferentes calidades
tonales es completamente factible.

Es posible establecer un solo circuito elctrico que permita


seleccionar entre dos diferentes preamplificadores, compar-
tiendo circuitera en las etapas de rectificacin y ecualiza-
cin.
Fig. 14. Respuesta en frecuencia ruido blando en el analizador de
espectro. La simulacin mediante software no solo facilita el com-
prender cmo funciona la circuitera, sino tambin simplifica
el anlisis, la experimentacin y la construccin.

La implementacin y el ensamblaje del circuito elctrico es


factible. Si bien estas son etapas que llevan mucho tiempo,
cerca del cincuenta por ciento del tiempo de todo este pro-
yecto fue destinado para el ensamblaje.

La medicin de parmetros tcnicos del preamplificador no


es del todo posible, puesto que actualmente no existe un re-
ferente que establezca las caractersticas tcnicas que debe
poseer un preamplificador de guitarra, as como tampoco
existen metodologas nicas de medicin de las distintas ca-
ractersticas. Sin embargo, la impedancia y la respuesta de
Fig. 15. Respuesta en frecuencia de preamplificador Fender Champ frecuencia, son parmetros que pueden ser considerados, a
5E1. partir de la presente investigacin.

La comparacin entre los preamplificadores referenciales y


construidos fue considerada indispensable en la investiga-
cin. El mercado ecuatoriano est limitado por la escases y
la demanda que presentan estos dispositivos. Por lo tanto la
comparacin elctrica de los dispositivos resulta complica-
da, considerando las variables tiempo y dinero que implica
el realizar estas mediciones. Por otro lado, la comparacin
psicoacstica es posible mediante grabaciones.

Las diferencias en frecuencias medias y en graves del pream-


plificador son las principales caractersticas del preamplifi-
cador construido, como lo indican las percepciones de los
especialistas entrevistados. Si bien no es exactamente igual
Fig. 16. Respuesta en frecuencia de preamplificador Marshall JCM al sonido del preamplificador JCM800 original, tienen sus si-
800. militudes, sin embargo debido a las apreciables diferencias,
se termina hablando de un nuevo preamplificador con un
nuevo sonido.
La Tabla I muestra el resumen del parmetro ecualizador y
como modifica la amplitud de la seal en su respectivo rango
Pese a que el preamplificador no cuenta con etapa de po-
de frecuencias.
tencia, si es posible que este sea aadido a cualquier etapa
de amplificacin y funcionar en la prctica.
TABLA I
RESPUESTA EN FRECUENCIA DE LOS ECUALIZADORES. Al alterar el circuito rectificador, se modifica directamente
a la forma de onda resultante; otorgndole a esta mayor o
menor amplitud y distorsin. En el caso del preamplificador
5E1 aument su amplitud y disminuy su distorsin hasta ser
prcticamente imperceptible visualmente en las simulacio-
nes realizadas.

La etapa de ecualizacin influye directamente en la forma


de onda resultante. Su aporte es apreciable tanto en las si-
El anlisis psicoacstico fue realizado a travs de entrevistas mulaciones como en el osciloscopio, para el proceso que
a tcnicos especializados, estas entrevistas fueron utilizadas realiza el ecualizador en los diferentes preamplificadores.

PG. 9
AVANCES del audio en Latinoamrica.

Villamar Villareal, J. J. (2011). Diseo y construccin de un pream-


La etapa de ecualizacin compartida por los preamplifica- plificador para micrfono con tecnologa de tubos catdicos. Quito,
dores, no comparte las mismas frecuencias de corte, es decir, Ecuador: Universidad de las Amricas.
el realce o la atenuacin de las frecuencias no son los mis-
mos dependiendo del preamplificador que est funcionan- Zattola, T. (1995). Vacuum Tube Guitar And Bass Amplifier Theory.
do. New York, USA: The Bold Strummer.

V. Referencias
Allen, D. (28 de Noviembre de 2010). Fender 5E1 Tweed Champ.
Recuperado el 28 de Marzo de 2014, de Fender 5E1 Tweed Champ
Project Page: http://tknives.com/classact/tweedchamp.html/

lvarez, J. A. (marzo de 2012). As Funciona. Recuperado el 5 de


noviembre de 2013, de http://www.asifunciona.com/

Blencowe, M. (2009). Designing Valve Preamps for Guitar and Bass


(Segundaed.). York, United Kingdom.
Carrin Isbert, A. (1998). Diseo acstico de espacios arquitectni-
cos. Barcelona, Espaa: UPC.

Colombo, A. (6 de agosto de 2012). Universidad Nacional de la Pa-


tagonia San Juan Bosco. Recuperado el 6 de noviembre de 2013, de
Facultad de Ingeniera: http://www.ing.unp.edu.ar/electronica/asig-
naturas/ee016/

Costas Soto, R. (19 de noviembre de 2008). Departamento de Tec-


nologa Electrnica Universidad de Vigo. Recuperado el 7 de no-
viembre de 2013, de Convertidores AC/DC: http://www.dte.uvigo.
es/recursos/potencia/ac-dc/archivos/diodo.htm

Dr. Tube Marshall Schematics. (01 de octubre de 2014). Recupera-


do el 01 de Octubre de 2014, de Dr. Tube: http://www.drtube.com/
library/ schematics/69-marshallschemas#JCM800

Fender. (1 de Octubre de 2014). Fender Musical Instruments . Re-


cuperado el 1 de Octubre de 2014, de Fender Musical Instruments:
http://www.fender.com/es-ES/history/

Jones, M. (2004). Building Valve Amplifiers (Primeraed.). Oxford,


England: Newnes.

Kuehnel, R. (2009). Vacuum Tube Circuit Design: Guitar Ampli-


fier Preamps (Segundaed.). Seattle, United States of America: Amp
Books LLC.

Marshall Amplification. (1 de Octubre de 2014). Marshall Amplifi-


cation. Recuperado el 1 de Octubre de 2014, de Marshall Amplifica-
tion: http://www.marshallamps.com/history/made-in-england

Midge, M. &. (1 de Abril de 2008). Mhuss. Recuperado el 28 de


Marzo de 2014, de Mhuss: http://mhuss.com/MyJCM/ 90

Miyara, F. (2004). Acstica y Sistemas de Sonido. Rosario, Argenti-


na: UNR Editora.
Miyara, F. (7 de junio de 2006). FCEIA. Recuperado el 22 de sep-
tiembre de 2013, de Laboratorio de Acstica y Electroacstica: http://
www.fceia.unr.edu.ar/acustica/audio/electroac.pdf

Pittman, A. (2004). The Tube Amp Book. China: Backbeat Books.

Rumsey, F., & McCormick, T. (2009). Introduccin al Sonido y la


Grabacin. Madrid, Espaa: IORTV.

PG. 10
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

AVANCES
DEL AUDIO EN
LATINOAMRICA.

METODOLOGA PARA LA
MEDICIN DE DIRECTIVIDAD
EN TIPLE COLOMBIANO

Fredy Alzate Arias / Jos Julin Cadavid


PG. 11
AVANCES del audio en Latinoamrica.

Fredy Alzate Arias*, Jos Julin Cadavid**


Facultad de Artes y Humanidades, Instituto Actualmente el proceso de microfoneo en campo cercano
Tecnolgico Metropolitano - ITM de fuentes naturales, como instrumentos de viento o de
Medelln, Colombia cuerdas, se realiza sin un fundamento cientfico sobre el
fredyalzate@@itm.edu.co comportamiento fsico y acstico de los instrumentos.
jose.cadavid0335@correo.itm.edu.co
La directividad de un instrumento musical depende de
* Resumen Los patrones de directividad de las fuentes naturales mltiples factores, que van desde el tipo de material con el
como los instrumentos de viento y cuerdas, por lo general no son que est construido, la intensidad con el que se ejecute y en
tenidos en cuenta en el momento de posicionar uno o ms micrfonos el caso de los instrumentos de cuerdas, no solo depende de
para realizar una grabacin o para disear un espacio acstico de la madera con la que fue construido, sino tambien, de el tipo
un lugar en el que se quiera ejecutar dichos instrumentos. Dichos de material de las cuerdas y el modo de pulsacin utilizada
procesos en la mayora de los casos son realizados de manera por el ejecutante.
emprica.
En ste contexto, se evidencia la necesidad de realizar un estudio Hoy en da se encuentran artculos e investigaciones sobre:
de cmo se comporta el patrn de directividad de un instrumento metodologas para la grabacin de intrumentos de percusin
musical (en ste caso el tiple colombiano), en funcin de la frecuencia carctersticos del folclor colombiano [1], medicin
y de la posicin alrededor del mismo. Dicha informacin puede ser multicanal de patrones de directividad de instrumentos de
utilizada tanto por productores musicales, como tambin para futuros viento [2] [3], medicin de directividad de instrumentos de
desarrollos de simuladores que permitan visualizar comportamiento cuerdas (guitarras y cuerdas frotadas) [4] [5], pero an no
del patrn de directividad de un instrumento acstico o de un se ha realizado un modelamiento fsico y matemtico de
ensamble de los mismos, con el fin de analizar cual es la posicin instrumentos autoctonos colombianos.
ms recomendada para el uso de micrfonos.
El objetivo de este artculo, es realizar una adaptacin de la
Palabras clave directividad, espectro sonoro, patrn de radiacin, metodologa empleada por Ptynen, Lokki y K.J.Bodon [6]
grabacin, recintos acsticos [20] para la caracterizacin de la directividad de diversos
instrumentos, pero empleando un recinto acsticamente
Abstract The directivity patterns of natural sources such as wind controlado, como lo es un estudio de grabacin y no una
instruments and strings , usually are not taken into account at the cmara anecica; pues se busca analizar el comportamiento
time of positioning one or more microphones for recording or to del patrn de directividad del tiple colombiano en un
design an acoustic space of a place in which want to play these recinto que presente condiciones reales. Adems de esto, la
instruments. These processes in most cases are made empirically. presente aproximacin permite utilizar una menor cantidad
In this context, the need for a study of how the directivity pattern of de instrumentos de medida, para as adaptar el proceso a
a musical instrument (in this case the Colombian tiple ) , depending los equipos y recintos instalados en la Facultad de Artes y
on the frequency and position around it behaves is evident . Such Humanidades del Instituto Tecnolgico Metropolitano.
information can be used by both music producers , as well as for
future development of simulators that allow viewing behavior Lokki en su metodologa propuesta para la medicin de
directivity pattern of an acoustic instrument or an assembly thereof,directividad de instrumentos acsticos de cuerdas y de viento,
in order to analyze what is the most recommended for the position utiliza una cmara anecica y en su interior un gran arreglo
use of microphones. esfrico de micrfonos que, junto con una interface de audio
y un computador, permite hacer la captura multicanal de la
Keywords directivity, sound spectrum, radiation pattern, recording, energa acstica radiada por un intrumento determinado
acoustic enclosures. ubicado en el centro geomtrico de dicho arreglo.

Para lo anterior, es necesario contar con una gran cantidad


I. Introduccin de micrfonos, cables para conexin y una estructura que
permita ubicar cada micrfono en una posicin especfica
La norma internacional para la realizacin de medidas alrededor del instrumento junto con su ejecutante.
acsticas ISO 3382-1, especifica que, para la realizacin La cantidad de seales y la resolucin empleada en tiempo
de cualquier medicin acstica, es necesario usar fuentes - ampiltud para la conversin anloga-digital para las
omnidireccionales. Por lo tanto, es necesario plantear una mismas, ocacinan un gran requerimiento de capacidad
metodologa para la medicin de instrumentos acsticos, computacional para el procesamiento y anlisis de toda
debido a que el sonido caracterstico y el patrn de la informacin producto de las mediciones. Por tanto, la
directividad, vara en diferentes direcciones; lo que modifica metodologa propuesta en el presente artculo, disminuye los
su contenido espectral en alrededor del espacio en el que se requerimientos tcnicos de manera notable, lo que permite
encuentra. realizar la medicin y anlisis de datos de una manera ms
sencilla y en un espacio con condiciones reales como lo es
un estudio de grabacin.
*
* Fredy Alzate A. labora en ITM- Medelln, Ing. Electrnico. (e-mail: Es muy importante tener en cuenta los patrones de
fredyalzate@itm.edu.co). directividad de diversas fuentes acsticas, no solo para la
** J. Julian Cadavid. Labora en ITM- Medellin, Ing. Electricista realizacin de una grabacin, el diseo de espacios acsticos
(e-mail: josecadavid0335@correo.itm.edu.co) adecuados para la ejecucin de diversos instrumentos, sino
tambin, para un adecuado refuerzo sonoro en un concierto.

PG. 12
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

Cabe anotar, que el presente artculo, es un primer


p ( , , ) r
acercamiento a la medicin de la directividad de un D( , , ) r =
tiple colombiano, pero a futuro, se espera desarrollar un p ( , o , o ) r (3)

software y hardware que permita simular y medir patrones


de directividad de otros instrumentos musicales en tiempo Donde el numerador es la presin sonora radiada en cualquier
real y en cualquier ambiente, adems de desarrollar un punto de una esfera de radio r alrededor de la fuente en
dispositivo que permita parametrizar la directividad de una una posicin que depende de ambos ngulos; mientras que
forma ms sencilla, rpida y confiable. el denominador es la presin sonora emitida captada a una
distancia radial r, en ngulos de referencia
qo, f o
II. Patrn De Radiacin Nuevamente, w es la frecuencia angular
tal cual se haba expresado anteriormente.
Con el fin de realizar las mediciones necesarias para la
parametrizacin de los patrones de directividad y distribucin Con la ecuacin (3) es posible calcular cual es la prdida de
espectral de instrumentos acsticos, como lo es en este caso presin sonora relacionada segn la frecuencia alrededor de
un tiple, es necesario realizar la mayor cantidad de datos una fuente a una distancia r.
posible alrededor del instrumento; ya que como se haba
mensionado anteriormente, un instrumento acstico no se Para el caso del presente artculo, se decidi hacer el estudio
comporta como una fuente sonora puntual omnidireccional. de la presin sonora en dBSPL, por tanto, la ecuacin (3)
quedara expresada como:
Se tiene entonces que el patrn de radiacin de una fuente,
es el resultado de la solucin a la priera integral de la p ( , , ) r 2
D( , , ) r dB = 10 log
ecuacin de Rayleigh [19] expresada de la siguiente forma: SPL
p ( , , ) 2
o r
o
(4)
P( x, ) = g (r , ) s ( ) D( , , ) Como resultado se puede obtener un diagrama polar donde
(1) la magnitud radial est dada por los decibeles de atenuacin
que tiene la presin sonora a medida que se cambia la
donde: posicin del receptor alrededor del eje de la fuente.
x es el campo de propagacin del sonido radiado
es la frecuencia angular La fuente direccionalmente ms sencilla es una fuente
j r esfrica o mono polo, la cual radia con igual presin en todas
e c
las direcciones, de forma tal que la atenuacin se da solo en
g (r , ) =
r funcin de la distancia a la fuente y esta disminuye a una
(2) razn de 6dB cada vez que la distancia se duplica. Esta es la
s ( ) es la transformada de Fourier en el tiempo, de la seal fuente utilizada para realizacin de medicin de parmetros
de la fuente acsticos de un cuarto y adems, la ms usada por los
D( , , ) es la funcin de directividad programas de simulacin.
Sin embargo, las fuentes en las que se centra el presente
y w puede ser escrita como:
artculo no pueden ser aproximadas a fuentes esfricas,
= 2f debido a varios factores, tales como el tipo de madera usado
para la construccin del tiple, el tipo de cuerdas empleada, y
(3) la tcnica de pulsacin usada por el ejecutante para excitar
donde f es la frecuencia. el instrumento.

Claramente se evidencia, como la funcin que describe el Hay una distancia Ro a la cual, todas las fuentes pueden
patrn de directividad de una fuente sonora, depende de la ser tratadas como fuentes puntuales, pues a partir de ah
frecuencia y de la posicin alrededor de la misma. la intensidad radiada disminuye respondiendo a la ley de
Es por esto que todo instrumento tiene una directividad la inversa del cuadrado de la distancia, por tanto, se puede
distinta en cada frecuencia emitida. concluir lo siguiente:
A. Directividad Para distancias menores a Ro, la fuente no puede
aproximarse a una fuente puntual, sta zona recibe el
La directividad de una fuente sonora en una direccin, se nombre de campo cercano.
define como la razn entre la presin eficaz generada por la Para distancias mayores o iguales a Ro, la fuente puede
fuente en esa direccin a la distancia r, y una presin eficaz aproximarse a una fuente puntual, sta zona recibe el
de referencia p0 (r); que suele ser la mxima que produce la nombre de campo lejano.
fuente a esa distancia.
Para el desarrollo del presente trabajo, la distancia de inters
Existe una dependencia direccional entre la energa sonora fue 53 cm, con la cual se garantiza que en la intensidad sonora
radiada y la energa percibida por un oyente, a su vez, hay obtenida predomina el sonido directo de la fuente evitando
una dependencia a la frecuencia y hay una ecuacin que las saturaciones, efecto de proximidad y la captacin mnima de
relaciona [16] [17]. las reflexiones producidas en las superficies del cuarto.

PG. 13
AVANCES del audio en Latinoamrica.

B. Trabajos Previos
La estructura consta de 90 varillas flexibles de fibra de vidrio
Existen algunos trabajos previos que se han realizado a nivel que pueden ser unidas mediante holders de micrfonos
cientfico y tecnolgico sobre la parametrizacin y medicin formando una esfera.
de directividad en los instrumentos musicales. El montaje completo fue realizado en una cmara anecica
con el fin de evitar cualquier rebote en paredes, techo y piso.
La primera aproximacin a la recoleccin de una base de
datos sobre la directividad de instrumentos musicales fue En el centro del arreglo de micrfonos se instala una silla de
en la dcada de los setentas con Jrgen Meyer, quien realiz altura ajustable con la cual se busca ubicar al msico en el
mediciones de la radiacin promedio de varios instrumentos centro geomtrico de la esfera.
musicales por bandas de octava(Behler, POLLOW, Vorlnder,
& undefined, 2012) [9]. Ms recientemente Otondo y Rindel,
midieron la directividad usando un set de micrfonos
ubicados alrededor del msico , utilizando 13 microfonos en
el medio plano y en el plano horizontal (Pollow, Behler, &
Schultz, 2010) [10] .
En 2010 Ptynen y Lokki (Ptynen & Lokki, 2010), usaron una
ligera distribucin de varios micrfonos con el fin de grabar
fragmentos musicales [6] [7].

Los patrones de radiacin de los instrumentos representan


una parte considerable de la percepcin de la acstica de un Fig. 2. Estructura Isocaedro para medicin de directividad (Behler
cuarto. etal., 2012)

La directividad de varios instrumentos sinfnicos y El 2015, en Colombia se realiz una investicacin por C.A.
un cantante soprano fueron investigados durante su Caballero y J.M. Moreno, en el que se especifica la metodologa
interpretacin. Para este propsito cada instrumento fue correcta para realizar la captura digital de sonido de
grabado por separado en una cmara anecica con un arreglo instrumentos de percusin folclricos con el objetivo de
de 22 micrfonos distribuido alrededor del msico. Los crear bancos de sonidos de instrumentos virtuales.
interpretes eran avisados de cambiar el tono que tocaban,
mientras el instrumento emita en direccin de su campana. En ninguno de los casos, se cuenta con material relacionado
El tocar con dinmica dio como conclusin que no causa con el estudio fsico matemtico de la directividad de el tiple
cambios en la directividad segn el espectro, en particular colombiano.
con los instrumentos de metales.
C. Metodologa
La metodologa seleccionada para la medicin y parametrizacin
de la directividad de los instrumentos, en la presente investigacin,
es la utilizada por Ptynen y Lokki. En primer lugar, por la reduccin
de costos, ya que la elaboracin de una esfera conlleva mucho
ms tiempo y recurso econmico. Segundo, porque la metodologa
de Lokki puede ser implementada en un estudio de grabacin con
acstica variable y no necesariamente en una cmara anecica; a la
cual no se tiene acceso en el Instituto Tecnolgico Metropolitano.
Adems, dicha metodologa involucra una estructura ms simple en
cuanto a su montaje y mucho ms flexible en cuanto la adquisicin
de datos con un software convencional como puede ser MatLab,
Fig. 2. Estructura para medicin de directividad (Ptynen & Lokki,
C++ o una hoja de procesamiento numrico como excel.
2010)

Un arreglo esfrico de 64 micrfonos fue construido en


Graz, Austria, diseado por Procesamiento ptico harmnico
ptimo.

En el 2012 G.K Behler public un estudio con una metodologa


novedosa para la parametrizacin de directividad. Esta consiste
en la construccin de una estructura esfrica; esto con el fin de
conseguir la radiacon natural de instrumentos musicales, todas
las direcciones deben ser medidas simultneamente debido a la
falta de repetibilidad. Fig. 3. Disposicin de micrfonos en cmara anecica (Ptynen &
Esto motiv la construccin de una esfera liviana, que fuera Lokki, 2010)
transportable, que contiene un arreglo de micrfonos. Se eligi
como geometra para el arreglo una figura truncada de isocaedro, Para la medicin del patrn de radiacin de un tiple
en el cual se distribuyeron 32 micrfonos de manera regular en colombiano, se utiliz el equipo PAA6, el cual permite hacer
toda la superficie de la estructura, la cual tiene un dimetro de medicin de dB, RTA, FFT, entre otros.
4,2 m.

PG. 14
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

Un primer acercamiento al patrn de radiacin, se realiz mediante D. Equipos Requeridos


la medicin con la funcin RTA del equipo.
Se dispuso del estudio de grabacin de la facultad de Artes y 2 sonmetros PAA6
Humanidades del ITM, el cual presenta un tiempo de reverberacin
Medidor de distancia laser
media de 0,2s (tiempo de reverberacin promedio en 500Hz y
Analizador de espectro
1kHz); el cual es un valor optimo para la realizacin de las pruebas,
debido a que hay muy poca energa reflejada. Cables y conectores
Audifonos
Como una aproximacin adicional a la metodologa para la 2 Tripodes
medicin del patrn de directividad, se realizo la marcacin sobre
la superficie del piso, una circunferencia, cuyo radio es la distancia
mxima desde el centro del instrumento. El centro del instrumento E. Calibracin de Equipos
coincide con el centro de la circunferencia.
Dicha circunferencia se divide en ngulos iguales de 22,5, en Con el fin de verificar el correcto estado de calibracin
los cuales se realizan las mediciones respectivas en frecuencias de los equipos de medicin PAA6, ambos fueron ubicados
caractersticas del instrumento. equidistantes al centro acstico del instrumento utilizando
Para esta primera etapa de medicin fueron seleccionadas las los trpodes antes mencionados. Con esto fue posible
siguientes frecuencias: 130Hz, 260Hz, 315Hz, 630HZ, 874Hz, 1kHz y
constatar una desviacin en su medicin menor al 0,32%.
2,5kHz y a la misma altura del centro del instrumento.
Debido a que cada uno de estos equipos cuenta con dos
microfonos para medicin, realizamos el anlisis estadstico
Analizando los procedimientos para medir la directivitad en muchos de las 4 mediciones realizadas.
proyectos de investigacin descritos en los trabajos previos,se
sugiere la siguiente metodologa para mejorar lo hecho hasta el F. Proceso de grabacin
momento ; una primera fase que mede de la directivdad en tiempo
real y en una cmara anecoica, ver figura 4 (Norma AES 56-2008) y Cada equipo de medicin fue ubicado a una distancia de
una segunda fase que describe el modelo fsico del tiple con anlisis 0,53m tomados desde el centro del instrumento y a una
numrico, ms concretamente por diferencias finitas, adems se
altura de 70cm respecto al suelo.
harn medidas de la resonancia del instrumento, analizando los
modos de vibracin, la figura 5 muestra el procedimiento
TABLA I
Posicin de microfonos implementada (Ptynen, Pulkki, &
Lokki, 2008),(Behler etal., 2012)
Angulos de Azimut Elevacin Grados
0 0
22,5 0
45 0
67,5 0
90 0
112,5 0
135 0
157,5 0
180 0
-22,5 0
-45 0
-67,5 0
Figura 4 Metodologa para medir directividad en el tiple -90 0
-112,5 0
-135 0
-157,5 0
-180 0

Se le pide al musico ejecutante que pulse la nota respectiva


a cada frecuencia antes mencionada, con una intensidad
constante. Cada medicin es tomada dos oportunidades con
los dos equipos de medicin con el fin de hacer un promedio
durante el anlisis de datos.

En primer lugar, se realiza la medicin del piso de ruido


antes de hacer la medicin en cada frecuencia, con el fin de
sustraer algebraicamente dicho valor y obtener la medicin
de la fuente de inters.
Figura 5. Simulacin Anlisis diferencias finitas
Los datos adquiridos son almacenados en un archivo de texto
plano separado por comas, con el fin de luego ser usados
para anlisis y graficos en forma bidimensional polar.

PG. 15
AVANCES del audio en Latinoamrica.

III. Resultados -90


-112,5
46,2
47,6
16,6
36,3
45,90751341
44,83940401

Los datos son presentados de manera grfica y detallada -135 45,7


44,37729703 28,7

inicialmente con el programa Excel. En una etapa posterior -157,5 53,6 30,1 52,99917449

de la investigacin, se buscar desarrollar un hardware


que permita realizar la medicin a varias alturas y angulos, Fig. 5. Patrn de radiacin obtenido para tiple colombiano en
adems de un software que mida en tiempo real los la frecuencia de 2,5kHz
patrones de directividad y permita almacenar los datos con
el objetivo de realizar simulaciones no solo de instrumentos
individuales como el presente caso, sino tambin de arreglos
de instrumentos.

Con los datos anteriores se van conformando los diferentes


diagramas polares de cada frecuencia, con el fin de crear
una base de datos para la mayor cantidad de frecuencias
posibles, comenzando por las ms bajas de un tiple.
En las siguientes tablas se muestran algunos resultados
obtenidos por el grupo de investigacin en ingeniera de
audio del ITM:

TABLA II
Datos Obtenidos Para 130Hz de Tiple Colombiano ITM-
Medellin (Elaboracin propia)
Angulo nivel promedio sonoro ruido promedio de nivel promedio sonoro
dB fondo dB de la fuente dB
0 46,4 35,8 43,3622924
22,25 52,8 18,5 52,63094272
45 52,9 27,3 52,43176088
67,5 53,5 35,5 52,33129652 Fig. 6. Patrn de radiacin obtenido para tiple colombiano en
90 50,9 40,6 47,73354366 las frecuencias s especificadas
112,5 49,9 28,9 49,08917476
135 41 28,5 38,64892681
157,5 45,5 28,2 44,22566615 IV. Conclusiones
180 54,7 31,2 54,09917449
-22,25 48,2 34,2 46,26694209 En el presente trabajo se puede concluir que para obtener
-45 49,3 31,7 48,07213877
una mayor presicin en los datos, es necesario realizar un
-67,5 50,3 30,6 49,35086814
tratamiento estadstico de una gran muestra de mediciones;
-90 53,7 28,8 53,19129035
es decir es necesario realizar un gran nmer de medidas del
-112,5 51,8 29,7 51,08968468
instrumento interpretado por varios ejecutantes.
-135 52,6 22,3 52,33051537
-157,5 48,4 27,4 47,58917476
Las mediciones son dependientes de un sinnumero de
variables, una de ellas es la fuerza con la que se toque el
instrumento (dinmica) que puede afectar de cierta forma
Fig. 4. Patrn de radiacin obtenido para tiple colombiano en las medidas obtenidas; lo cual debe ser tenido en cuenta en
la frecuencia de 130Hz el tratamiento de errores.

Debido a que la metodologa utilizada para la presente


TABLA III investigacin, es una aproximacin a la propuesta por Ptynen
Datos Obtenidos Para 2,5kHz de Tiple Colombiano ITM-
y Lokki, no es posible hacer una comparacin directa con los
Medellin (Elaboracin propia)
resultados encontrados por estos en los patrones de radiacin
Nivel promedio ruido promedio de nivel promedio sonoro
Angulo sonoro dB fondo de la fuente de otros instrumentos. Como segunda etapa de la presente
0 73,3 33,2 73,21370814 investigacin, se desarrollar un hardware que permita una
22,25 51,3 28,4 50,65456846 medicin ms cercana a los modelos originales. Adems, la
45 63,1 34,1 62,78621269
intensin inicial de la presente investigacin es realizar la
67,5 57,7 27,1 57,43980257
medicin en un recinto que presente condiciones acsticas
90 72,4 22,2 72,37311647
reales; ya que las ejecuciones de instrumentos musicales
no se realizan en condiciones acsticas completamente
112,5 44,1 22,5 43,3457159
controladas como el caso de una cmara anecica, cmo lo
135 45,3 30,5 43,55538371
expresado por F. Otondo [18].
157,5 48,6 31,7 47,26073736
180 50,2 36,4 48,21636472
Con los datos obtenidos de este trabajo, es posible llegar
-22,25 48,6 35,7 46,36960577
a hacer una comparacin entre fabricantes y referencias de
-45 38,9 36,9 25,16349351
instrumentos musicales acerca de la efectividad acustica
-67,5 51,3 29,3 50,58110972
de los materiales con los que estn construdos, adems de

PG. 16
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

realizar una evaluacin crtica entre fabricantes y posible doi:10.1121/1.4783611


bench marking.
[10] Behler, G., POLLOW, M., Vorlnder, M., & undefined,
Este trabajo es un aporte no solo a los ingenieros de sonido others. (2012). Measurements of musical instruments with surroun-
para conocer la mejor manera de capturar los instruemntos, ding spherical arrays. Acoustics 2012 Nantes. Recuperado a partir de
sino tambin a ingenieros de audio que mediante el http://hal.archives-ouvertes.fr/hal-00811213/
conocimiento de los patrones de directividad de instrumentos
musicales y ensambles de estos pueden disear lugares [11] Felipe Otondo, J. H. R. (2002). New Method for the Directio-
acustiamente mejor tratados. nal Representation of Musical Instruments in Auralizations. Interna-
tional Computer Music Conference Proceedings. Recuperado a partir
Todos los datos obtenidos en este proyecto pueden ser de http://hdl.handle.net/2027/spo.bbp2372.2002.051
utilizados en la consecucin de un algoritmo para el desarrollo
de un software que haga siulaciones de instrumentos [12] Fletcher, N. H., & Rossing, T. D. (1998). Bowed String Ins-
musicales no solo virtualmente, sino tambien por medio de truments. En The Physics of Musical Instruments (pp. 272-330).
hardware mediante el uso de un dodecaedro. Springer New York. Recuperado a partir de http://link.springer.com/
chapter/10.1007/978-0-387-21603-4_10

V. Referencias [13] Forum Acusticum, D. A. S. (2011). Proceedings of Forum


[1] Carlos A. Caballero & Jamir M. Moreno (2015). Parmetros Acusticum 2011, 27 June-01 July, Aalborg, Denmark. [S. l]: Euro-
tcnicos de captura en instrumentos musicales percutidos del folclor pean Acoustics Association.
colombiano para su uso en bancos virtuales de sonidos, AES-9444
October 23, 2015. http://www.aes.org/e-lib/browse.cfm?elib=18000 [14] Karjalainen, M., Huopaniemi, J., & Vlimki, V. (s.f.). of
the paper. Recuperado a partir de http://www.acoustics.hut.fi/~mak/
[2] Fernandez Comesana, D., Takeuchi, T., Morales Cervera, S., PUB/ICA95IR.pdf
& Holland, K. R. (2012b, julio). Measuring musical instruments di-
rectivity patterns with scanning techniques. Conference presentado [15] Kristiansen, U., Stfringsdal, B. ard, Svensson, P., & Tro, J.
en 19th International Conference of Noise and Vibration. Recupera- (2001). Performance control and virtualization of acoustical sound
do a partir de http://eprints.soton.ac.uk/346037/ fields related to musical instruments. En Workshop on Current Re-
search Directions in Computer Music. Barcelona: Audiovisual Insti-
[3] Fernandez Comesana, D., Takeuchi, T., Morales Cervera, S., tute, Pompeu Fabra University. Recuperado a partir de http://www.
& Holland, K. R. (2012a). Measuring musical instruments directivi- academia.edu/download/30493373/p46.pdf
ty patterns with scanning techniques. Recuperado a partir de http://
eprints.soton.ac.uk/346037/1/ICSV_2012_Measuring_musical_ins- [16] Pasqual, A. M. (2010). Sound directivity control in a 3-D spa-
truments_directivity_patterns_with_scanning_techniques.pdf ce by a compact spherical loudspeaker array. Universidade Estadual
de Campinas. Recuperado a partir de http://tel.archives-ouvertes.fr/
[4] Otondo, F., Rindel, J. H., Causse, R., Misdariis, N., & de la tel-00530855/
Cuadra, P. (2002). Directivity of musical instruments in a real per-
formance situation. En Proceedings of the International Symposium [17] Pollow, M., Behler, G. K., & Schultz, F. (2010). Musi-
on Musical Acoustics (ISMA), Mexico City, Mexico (pp. 312318). cal instrument recording for building a directivity database. Forts-
Recuperado a partir de http://www.otondo.net/research/man_isma_ chritte der ANustiN: Tagungsband d, 36. Recuperado a partir de
final.pdf http://www.researchgate.net/publication/233762472_Musical_Ins-
trument_Recording_for_Building_a_Directivity_Database/file/
[5] D. F. Comesaa, T. Takeuchi, S. M. Cervera, and K. R. Ho- 9c960516683598bc5d.pdf
lland, Measuring musical instruments directivity patterns with scan-
ning techniques, in ResearchGate, 2012, vol. 3. [18] F. Otondo and J. H. Rindel, Directivity of musical instru-
ments in a real performance situation, ResearchGate, Dec. 2002.
[6] Ptynen, J., & Lokki, T. (2010). Directivities of Symphony
Orchestra Instruments. Acta Acustica united with Acustica, 96(1), [19] M. Pollow, Los Patrones de directividad de la Sala de Medi-
138-167. doi:10.3813/AAA.918265 ciones Acsticas y Simulaciones. Place of publication not identified,
2015.
[7] Ptynen, J., Pulkki, V., & Lokki, T. (2008). Anechoic Recor-
ding System for Symphony Orchestra. Acta Acustica United with [20] K. J. Bodon and T. W. Leishman, Development, evaluation,
Acustica, 94(6), 856-865. doi:10.3813/AAA.918104 and validation of a high-resolution directivity measurement system
for live musical instruments, The Journal of the Acoustical Society
[8] Bassuet, A. A., Caulkins, T., Digerness, J. K., & KnicKrehm, of America, vol. 138, no. 3, pp. 17851785, Sep. 2015.
G. A. (2013). New implementation of multi-microphone recording
technique to simulate music ensembles in room acoustic auraliza-
tions. En Proceedings of Meetings on Acoustics (Vol. 19, p. 015135).
Acoustical Society of America. Recuperado a partir de http://scita-
tion.aip.org/content/asa/journal/poma/19/1/10.1121/1.4801040

[9] Behler, G., & Pollow, M. (2009). Representation of the mu-


sical instruments directivity using dodecahedron loudspeakers. The
Journal of the Acoustical Society of America, 125(4), 2543-2543.

PG. 17
AVANCES del audio en Latinoamrica.

PG. 18
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

AVANCES
DEL AUDIO EN
LATINOAMRICA.

COMPARACIN ENTRE DIFERENTES


FRECUENCIAS DE MUESTREO Y
PROFUNDIDAD DE BITS EN EL DESARROLLO
DE UNA PRODUCCIN MUSICAL

Sebastin Lopera Gmez


PG. 19
AVANCES del audio en Latinoamrica.

Sebastin Lopera Gmez* superiores a los establecidos en el libro rojo, alcanzando


Facultad de Ingenieras, Universidad de frecuencias de muestreo de 352.8kHz, equivalente a ocho ve-
San Buenaventura Medelln ces la frecuencia de muestreo que se usa actualmente para
Medelln, Colombia discos compactos de audio digital. Es de vital importancia
reconocer la existencia de nuevos formatos existentes que
ResumenDe acuerdo a las actuales posibles configuraciones trabajan con configuraciones diferentes a las establecidas
de los conversores AD/DA, se plante la pregunta si es para discos de audio digital, pero este trabajo se ha delimi-
realmente beneficioso usar parmetros superiores a los tado en hacer una comparacin de acuerdo a los parmetros
establecidos en el libro rojo para disco compacto de establecidos en el libro rojo.
audio digital. Se realiz la misma produccin musical con
distintas configuraciones de frecuencia de muestreo y Aunque la seal digitalizada tiene mayor similitud con la
profundidad en bits durante los procesos de grabacin, seal anloga al aumentar estos dos parmetros, posterior-
mezcla y masterizacin, obteniendo archivos de audio que mente deben sufrir un proceso de disminucin de muestras
cumplan con los parmetros establecidos para los discos por segundo (downsampling) a 44.1 kHz y re-cuantificacin
de compactos de audio digital. Mediante pruebas objetivas de niveles a 16 bits, para as poder cumplir con los estn-
y subjetivas se determinaron las diferencias existentes y dares del libro rojo y es por esto que surge la pregunta de
perceptibles causadas por las diferentes configuraciones investigacin:
usadas en el desarrollo de las producciones musicales.
Es verdaderamente beneficioso realizar una produccin
Palabras clave audio digital, conversin AD/DA, grabacin, musical usando archivos de audio, hardware de conversin
produccin de audio. anlogo-digital y software de procesamiento con parmetros
superiores a los establecidos en el libro rojo, o es
Abstract According to current possible configurations of AD simplemente uno de los tantos mitos que se han creado
/ DA converters, the question was raised whether it is really respecto al audio digital?
beneficial to use higher than those set in the "red book"
parameters for digital audio disc. A musical production was Al comparar frecuencias de muestreo y profundidades de
done with different configurations of sample rate and bit bits, de manera terica es evidente que existe una diferencia
depth during the process of recording, mixing and mastering,al usar diferentes parmetros logrando variar el ancho de
obtaining audio files that meet the parameters for digital banda del sistema y su rango dinmico. Hay estudios previos
audio compact disc. Applying objective and subjective que evalan si los individuos de una prueba diferencian
tests the existing and perceptible differences caused by theentre programas musicales grabados a distintas frecuencias
different configurations used in the development of musical de muestreo, obteniendo que las personas con experiencia
productions were determined. estn en la capacidad de diferenciar entre diferentes
frecuencias de muestreo (Pras & Guastavino, 2010). Un anlisis
Keywords Digital audio, AD/DA conversion, recording, audio cualitativo de manera verbal a los mismos sujetos indica que
production. perciben diferencias en reproduccin espacial, contenido de
frecuencias altas, timbre y precisin del material evaluado.
I. Introduccin Algunos autores defienden el uso de frecuencias de muestreo
altas, como Wieslaw Woszczyk que explica:
En 1982, las empresas Philips y Sony publicaron el libro
rojo (Red Book), que establece las caractersticas tcnicas
El audio de alta definicin ha sido sesgado al ancho de banda
que deben cumplir los CD-DA (disco compacto de audio digi-
amplio y que, dada la limitada sensibilidad del odo humano
tal). Este estndar especifica las propiedades que se deben
a las frecuencias altas, se gana poca resolucin perceptible.
cumplir, tanto fsicas como de codificacin del audio digital,
No hay mucha evidencia de laboratorio para contrarrestar
estableciendo que el audio debe estar codificado mediante
esto, ya que la investigacin psicoacstica se ha limitado en
el sistema PCM (Pulse Code Modulation o Modulacin por gran parte a estudiar los efectos en el rango de frecuencias
Impulsos Codificados), con una frecuencia de muestreo de entre los 20 Hz a 20 kHz. (Woszczyk, 2003)
44.1 kHz y una profundidad en bits de 16. Con esta cantidad
de muestras, se puede garantizar el ptimo registro y repro- Adems se muestra como la alta resolucin temporal,
duccin de frecuencias inferiores a 22.05 kHz, de acuerdo con espectral, espacial y dinmica en conjunto determinan la
el teorema de Nyquist-Shannon y con ese valor de profundi- calidad de la percepcin de la msica y el sonido, y que
dad de bits se asegura un rango dinmico de 96 dB. Aunque la resolucin temporal puede ser la ms importante en la
este estndar se ha mantenido hasta la actualidad, se desa- percepcin del ser humano (Woszczyk, 2003).
rrollan nuevos equipos y formatos que usan parmetros su-
periores (Rumsey, 2007). Estos nuevos avances se basan en la Aunque s existen diferencias, muchos usuarios de sistemas
idea que esta cantidad de muestras por segundo y niveles de de audio digital se preguntan si trabajar con frecuencias
cuantificacin son insuficientes, generando gran cantidad de de muestreo altas es ms beneficioso que con frecuencias
distorsin al momento de digitalizar una seal de audio. Es de muestreo bajas. Otros autor plantea esta pregunta y
por esta razn que los fabricantes hoy en da producen con- responde:
versores con frecuencias de muestreo y profundidad en bits
Falso, este tema es probablemente lo que ms exageran
* * Sebastin Lopera Gmez labora en la Universidad de San para realizar mercadeo, se aprovechan de las conclusiones
Buenaventura Medelln, Carrera 56 C # 51 110, Of. 409C. (e-mail: simples e intuitivas ilustradas por la gran mayora de
esp.postproduccion@usbmed.edu.co). personas, donde ms es mejor. (Aldrich, 2005)

PG. 20
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

1) Variacin De La Frecuencia De Muestreo


Dan Lavry tambin expone algunos mitos que ha encontrado Actualmente los conversores A/D y D/A pueden trabajar con
a lo largo de su carrera, uno de ellos describe que la imagen frecuencias de muestreo de 192 kHz, incluso hay algunos que
estreo se ve afectada al tomar un menor nmero de permiten valores de 384 kHz. Para las comparaciones se es-
muestras, refutando esta idea asegurando que no existe la tablecen dos configuraciones posibles, una de acuerdo a lo
velocidad de muestreo correcta respecto a la seal. Cuando especificado en el libro rojo y otra con una frecuencia de
se realizan los procesos de conversin de archivos estreo o muestreo de 176.4 kHz que equivale a cuatro veces la esta-
multicanal, todos los archivos son muestreados de manera blecida para disco de audio digital. La tabla 1 muestra las
simultnea, asegurando que la relacin de tiempo entre los caractersticas de cada una de las configuraciones. Sabiendo
canales se mantiene y no se ve afectada. (Lavry, The Optimal que el parmetro a evaluar es la frecuencia de muestreo es
Sample Rate for Quality Audio, 2012) importante mantener constante la profundidad de bits y ni-
camente cambiar lo que se desea evaluar.
Algo cierto y explicado por Dan Lavry en otro documento
es que, al trabajar con archivos de audio con frecuencias TABLA 1
de muestreo altas, se generan archivos ms grandes que Caractersticas de cada configuracin al variar la
requieren de ms espacio en disco para su almacenamiento y frecuencia de muestreo
ralentiza la transmisin, requiriendo a su vez mayor velocidad
Frecuencia de Frecuencia mxima a Tiempo entre
de procesamiento computacional. Asimismo, el autor expone
muestreo muestrear muestras
otro de los mitos que ha encontrado en el medio que consiste
en grabar con una frecuencia de muestreo alta (192 kHz) y 44.1 kHz 22,05 kHz 22,68 s
luego realizar un proceso de downsampling para cumplir 176.4 kHz 88,2 kHz 5,67 s
con la frecuencia de muestreo establecida en el libro rojo
(44.1 kHz). Frente a este mito el autor explica que lo nico 2) VARIACIN DE LA PROFUNDIDAD DE BITS
que se obtiene es un mayor ancho de banda, pero que los A la fecha no existen conversores de audio que permitan tra-
instrumentos musicales producen poca informacin en bajar con una profundidad de bits mayor a 24 bits. Aunque
frecuencias alrededor de los 96 kHz, muy pocos micrfonos muchos de los sistemas D.A.W permiten crear archivos con
responden en frecuencias tan altas, los altavoces no las niveles superiores, esto solo es til para el procesamiento
reproducen y por ltimo, el odo de los seres humanos no interno de las seales de audio. Teniendo en cuenta que los
responde a estas.(Lavry, Sampling Theory For Digital Audio, conversores en la actualidad slo permiten dos configura-
2004). ciones, los parmetros que se compararon se muestran en la
tabla 2, junto a las caractersticas tcnicas de cada una. Simi-
Algunos defensores dicen que parte de la calidad que se lar a la variacin de la frecuencia de muestreo, el parmetro
obtiene al trabajar con 192 kHz se retiene al disminuir a una que no se compara se mantuvo fijo y solo se alter la varia-
frecuencia de muestreo de 44.1 kHz ignorando que cualquier ble a evaluar que en este caso sera la profundidad de bits.
material muestreado a esa frecuencia, no puede contener
informacin con frecuencia superior a 22,05 kHz. Dan Lavry
TABLA 2
manifiesta que al muestrear seales con frecuencias de
Caractersticas de cada configuracin al variar la
muestreo de 192 kHz, que es tres veces mayor que la ptima,
profundidad de bits
se compromete la precisin del conversor que se ve reflejado
en distorsin. Tambin afirma que el verdadero error es Profundidad de Rango dinmico Niveles de
cuando la gente que escucha algo que les gusta, asocian Bits Aproximado Cuantizacin
mejor sonido con un muestreo ms rpido, mayor precisin 16 bits 96 dB 65.536
y mayor ancho de banda. (Lavry, Sampling Theory For Digital 24 bits 144 dB 16.777.216
Audio, 2004)
Teniendo en cuenta las configuraciones previamente descri-
La ausencia de informacin acerca de comparaciones entre tas, se realiz la captura de mnimo cuatro programas musi-
profundidad en bits es notoria, un autor analiza esto y plantea cales con las configuraciones que se muestran en la tabla 3.
una pregunta similar, pero esta vez analizando los niveles
de cuantificacin, afirmando esto como falso y que este tipo TABLA 3
de mitos se plantean a partir de conclusiones intuitivas e Nombre de cada captura del programa musical y su
informacin que permite obtener respuestas incorrectas. configuracin
(Aldrich, 2005)
Nombre de cada Frecuencia de Profundidad de
II. Parte Tcnica del Artculo configuracin
A
Muestreo
44.1 kHz
Bits
24 bits
A. Definicin De Configuraciones A Evaluar B 176.4 kHz 24 bits
Como se mencion anteriormente los parmetros para disco C 44.1 kHz 16 bits
de audio digital descritos en el libro rojo establecen que D 44.1 kHz 24 bits
los archivos de audio deben tener una frecuencia de mues-
treo de 44.1 kHz y una profundidad de bits igual a 16 bits. Te- Las capturas A y B corresponden a un conjunto de seales
niendo en cuenta esto se realizaron dos comparaciones: una grabadas que permitirn evaluar los cambios de frecuencia
variando la frecuencia de muestreo y otra la profundidad en de muestreo ya que solo se cambi la frecuencia de mues-
bits. treo durante el downsampling como se ilustra en la Figura 1 .

PG. 21
AVANCES del audio en Latinoamrica.

objetivas, es importante definir algunas caractersticas acer-


ca del programa musical que permiti obtener las muestras
de audio que posteriormente sern presentadas en pruebas
subjetivas.

C. Caractersticas del Programa Musical


Figura 1. Etapas de la produccin musical de las muestras A y B.Al revisar diferentes investigaciones que involucren prue-
bas subjetivas con programas musicales, no hay algn g-
Mientras que las capturas C y D se usarn para evaluar los nero que haya sido definido como estndar y suelen usar
cambios de profundidad de bits, la configuracin de frecuen- como seales de prueba interpretaciones de instrumentos
cia de muestreo (fs) y profundidad de bits (pb) durante las individuales. Debido al planteamiento del problema, no se
etapas durante la produccin musical se aprecian en la Figu- considera apropiado el uso de la interpretacin de un solo
ra 2. Es por esto que, aunque las capturas A y C tienen la mis- instrumento musical, pues se busca responder si existe al-
ma configuracin el programa musical que ser ejecutado es guna diferencia al usar otros parmetros a los descritos en
completamente diferente. el libro rojo en procesos de grabacin, mezcla y masteri-
zacin de una produccin musical, que finalmente cumplir
con los estndares definidos para disco compacto de audio
mediante tcnicas de downsampling y dithering.

Teniendo en cuenta las variaciones que producen en el sis-


tema cambiar la cantidad de muestras por segundo y la pro-
fundidad de bits, se plantea que el programa musical debe
Figura 2. Etapas de produccin musical de las muestras C y D tener una respuesta en frecuencia amplia, cambios de din-
mica a travs del tiempo y que posea instrumentos musica-
B. Parmetros A Evaluar les a los que el odo humano este acostumbrado, haciendo
que sea ms fcil identificar si existen diferencias mediante
A continuacin, se presentan algunos parmetros que per- pruebas subjetivas. Otro aspecto que debe considerarse es
miten conocer las caractersticas propias de cada configura- la presencia de instrumentos de percusin que posiblemen-
cin. te generen un reflejo estapedial.

1) Respuesta En Frecuencia El reflejo estapedial consiste en la tensin del msculo esta-


Se refiere al rango de frecuencias que el sistema es capaz depedio de manera involuntaria como consecuencia de un so-
grabar y/o reproducir. Se puede encontrar representado en nido de alta intensidad. Este reflejo es de carcter bilateral,
una imagen que describe la amplitud de la seal en cada una es decir que cuando la onda sonora llega a uno de los dos
de las frecuencias, o como un rango de valores entre los que odos el reflejo estapedial ocurre en ambos odos. El umbral
vara la seal, en un conjunto de frecuencias deseado. de este reflejo se ubica a 85 dB por encima del umbral de
audicin del oyente en un rango de frecuencias que va desde
2) Nivel De Ruido los 50 Hz hasta los 4 kHz, esta contraccin hace que cuando
Indica la amplitud del ruido propio del sistema causado por exista un aumento de la presin sonora en 10 dB para el odo
el diseo de los componentes electrnicos, su interaccin y interno solo sean 3 dB. (Feeney, 2014)
las conexiones de los distintos elementos. Se expresa en dB
y debe indicarse si se us alguna curva de ponderacin para El flujo de seal para la captura del programa musical se
expresar este valor. aprecia en la Figura 3. Este mismo se us para las pruebas
objetivas de las distintas configuraciones.
3) Rango Dinmico
Es la diferencia que hay entre el nivel de amplitud ms alto
que puede alcanzar el sistema antes de generar saturacin
y la amplitud del ruido de fondo. Se expresa en dB y debe
indicarse si se us alguna curva de ponderacin.

4) Distorsin Armnica Total


Se produce cuando la seal que sale de un sistema no es
igual a la seal que entr, esta ausencia de linealidad en los
equipos de audio introduce armnicos que son mltiplos de
la seal. El porcentaje de distorsin armnica total (THD%)
cuantifica la distorsin armnica que entrega el sistema
usando la ecuacin (1) donde An equivale a la amplitud del
armnico n y A1 la amplitud de la frecuencia fundamental.

Figura 3.Diagrama de bloques del flujo de seal anlogo

Luego de conocer la metodologa planteada para las pruebas

PG. 22
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

D. Pruebas Subjetivas 0.02 dB cuando la frecuencia de muestreo es 176.4 kHz. Los


resultados de respuesta en frecuencia se presentan como un
A la fecha no se ha establecido un mtodo estndar para la rango, sin embargo en la Figura 6 se aprecia que la respuesta
realizacin de pruebas subjetivas, sin embargo, existe docu- en frecuencia solo
mentacin sobre algunas pruebas realizadas y recomenda- TABLA 4
ciones que permiten definir algunos aspectos importantes
de cada prueba. Teniendo en cuenta esto se usaron como Respuesta en frecuencia de las configuraciones.
gua las recomendaciones (UIT, 1994-1997) y (UIT, 1997 - 2003), Frecuencia Respuesta en frecuencia
Profundidad
que brindan informacin til para la seleccin de los oyen- de
tes, presentacin de las muestras de audio, dispositivos de de bits 40 Hz 15 kHz 20 Hz 20 kHz
muestreo
reproduccin y caractersticas del lugar de escucha. Aunque 44.1 kHz 16 -0.57 dB, +1.17 -8.47 dB, +1.17
estas recomendaciones no son una norma, sirven como gua
para el diseo y realizacin de las pruebas subjetivas. dB dB
44.1 kHz 24 -0.57 dB, +1.17 -8.47 dB, +1.17
Aunque existen diferentes formas de presentar las muestras dB dB
de audio a ser evaluadas se opt por realizar una compara- 176.4 kHz 24 -0.59 dB, +1.17 -8.47 dB, +1.17
cin de dos sistemas con referencia, donde una de las dos dB dB
muestras es la referencia y la otra es la muestra a comparar.
Estas muestras se presentan en el siguiente orden: primero
la secuencia de referencia, luego la segunda secuencia, pos- Aunque estos datos parecen no concordar con el teorema
teriormente se repite la secuencia de referencia y por ltimo de Nyquist Shannon, es importante recordar que las se-
se presenta la segunda secuencia, como se muestra en la ales resultantes de las pruebas objetivas se les aplicaron
Figura 4. La prueba subjetiva se realizo en un lugar que cum- procedimientos de dithering y re-muestreo. Adicionalmente
pliera las condiciones establecidas en las recomendaciones se realiz una medicin de las seales resultante previas a
y que contar con un sistema de altavoces para la realiza- estos procesos cuyos resultados se revelan en la Figura 5,
cin de la prueba. Ninguno de los sujetos tuvo conocimiento permitiendo afirmar que al usar frecuencias de muestreo su-
previo sobre la finalidad o justificacin de la prueba, simple- periores el sistema responde mejor en frecuencias mayores
mente se le plantearon preguntas donde el indicar si en-
contraba alguna diferencia entre las muestras de audio y en a 16 kHz.
que caso de ser afirmativo, indicar cual era su apreciacin.

Figura 4. Reproduccin de las muestras de audio en la prueba sub-


jetiva

III. Resultados
A. Pruebas Objetivas
Para cada uno de los parmetros que se evalu, se realiz
una tabla comparativa que permite identificar de manera r-
pida las diferencias entre las diferentes configuraciones. El Figura 6.Respuesta en frecuencia de cada configuracin durante el
flujo de seal usado para la captura de las seales de prueba proceso de grabacin
se muestra en la Figura 5. Este software de medicin per-
mite disminuir las alteraciones que produce la interfaz de 2) Nivel De Ruido
adquisicin de datos realizando una captura previa de sus Como se muestra en la tabla 5, la diferencia ms grande de
propiedades. Al revisar estos datos, es importante tener en nivel de ruido se da entre las configuraciones con diferente
cuenta que todos los audios cumplen con las caractersti- profundidad de bits y equivale a un valor no mayor a las
cas exigidas por el libro rojo as hayan sido capturadas con 0.05dB.
configuraciones superiores, pues este trabajo se centra en
estos parmetros establecidos. TABLA 5
Niveles de ruido de cada configuracin
Frecuencia de Profundidad de Nivel de ruido
muestreo bits
44.1 kHz 16 -93.8 dB
44.1 kHz 24 -93.5 dB
Figura 5. Flujo de seal para anlisis objetivo 176.4 kHz 24 -94.2 dB

1) Respuesta En Frecuencia El odo humano es capaz de identificar cambios de hasta 1dB


Al revisar los datos obtenidos y presentados en la tabla 4 se pero esto depende de muchos factores, entre ellos la fre-
observa que la respuesta en frecuencia de todas las confi- cuencia. Por esto se considera que esta diferencia de nivel de
guraciones es muy similar y solo se aprecia una variacin de ruido es imperceptible para el ser humano. (Howard, 2009).

PG. 23
AVANCES del audio en Latinoamrica.

3) Rango Dinmico
La tabla 6 muestra los valores de rango dinmico obte-
nidos para cada una de las configuraciones evaluadas.

TABLA 6
Rango dinmico de cada configuracin
Frecuencia de Profundidad Rango dinmico
muestreo de bits
44.1 kHz 16 -93.9 dB
44.1 kHz 24 -94.3 dB
176.4 kHz 24 -94.4 dB Figura 8. Anlisis espectral de las muestras de audio usadas en la
prueba 2
4) Distorsin Armnica Total
Los porcentajes de distorsin armnica total de cada confi- Ahora se presenta un anlisis similar para las muestras que
guracin se presentan en la tabla 7. Se puede apreciar que se presentaron en las pruebas 3 y 4, con la diferencia de que
las diferencias son pequeas y se puede decir que el porcen- ya no se medir ningn atributo relacionado con la frecuen-
taje de distorsin armnica de todas las configuraciones es cia sino con el rango dinmico, ya que ste se ve afectado por
inferior a 0.003. la variacin de la profundidad de bits. Aunque al graficar los
niveles de amplitud pico y RMS durante 10 segundos como
TABLA 7 se muestra en las Figuras 28 y 29, se observan diferencias
Distorsin armnica total de cada configuracin inferiores a 3 dB en los cambios de nivel RMS, estos cam-
bios de nivel no estn relacionados con el rango dinmico
Frecuencia de mues- Profundidad de del producto final ya que ambas muestras de audio poseen
% THD
treo bits el mismo rango dinmico (aproximadamente 96 dB) debido a
44.1 kHz 16 0.0020 que la profundidad de bits es igual a 16.
44.1 kHz 24 0.0028
176.4 kHz 24 0.0027

B. Anlisis Objetivo de las Muestras de Audio

En primer lugar, se realiz un anlisis objetivo sobre las mues-


tras de audio que seran evaluadas y as determinar si existen Figura 28. Nivel pico y RMS de las muestras usadas en la prueba 3
diferencias entre las muestras que sern comparadas. Esta
informacin ser til para determinar cundo una respuesta
es un acierto o desacierto y a partir de esto analizar los datos
obtenidos. Las pruebas 1 y 2 buscan evaluar las diferencias
en las etapas de una produccin musical usando diferentes
frecuencias de muestreo, esta variacin hace que cambie la
frecuencia mxima que puede ser muestreada. Considerando
esto, se hizo un anlisis espectral de ambas seales y as Figura 29. Nivel pico y RMS de las muestras usadas en la prueba 4
evidenciar las diferencias existentes entre las muestras que
hacen parte de las pruebas 1 y 2, como se ve en las figuras 6 Estas pruebas se realizaron con el fin de obtener un criterio
y 7. para indicar un caso de acierto o desacierto al tabular los
datos, es decir que, si una persona expres la percepcin
de alguna diferencia en las pruebas 1 y 2 se tom como un
acierto, de lo contrario es un desacierto. Caso contrario a las
pruebas 3 y 4 donde la persona que indic no haber apre-
ciado alguna diferencia entre las muestras se tom como un
acierto y desacierto para la respuesta contraria.

C. Pruebas Subjetivas

A continuacin, se presentan los datos obtenidos luego de


procesar la informacin obtenida. La variable se comporta
como una distribucin binomial ya que solo tiene dos posi-
bles valores, un acierto con probabilidad p y un desacierto
Figura 7.Anlisis espectral de las muestras de audio usadas en la con probabilidad q=1-p. Un caso concreto del teorema del
prueba 1 lmite central es la distribucin binomial, que con nmero
de muestras mayor o igual 30 se comparta como una distri-
bucin normal (Escofet, 2014). En la tabla 8 y la figura 8 con
los resultados obtenidos para la prueba 1 que evaluaban las

PG. 24
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

muestras de audio donde se vari la frecuencia de muestreo. las muestras de audio que fueron realizadas con diferente
(Escofet, 2014) frecuencia de muestreo. Al realizar un anlisis espectral so-
bre las muestras de audio de las pruebas 1 y 2 se observan
TABLA 8 diferencias en altas frecuencias. Despus de aplicar un con-
Personas que perciben alguna diferencia entre las mues- junto de pruebas, se concluye que estas diferencias son cau-
tras de la prueba 1 sadas por el procesamiento de seal mediante software tipo
plug-in. Cas contrario para las pruebas 3 y 4 que evaluaban
Nmero de Desviacin Intervalo de con-
la diferencia en rango dinmico al usar dos configuraciones
prueba Aciertos Proporcin tpica fianza
de profundidad de bits, donde los resultados obtenidos me-
1 28 80 % 6.76 % 66,7 % - 93,3% diante anlisis de niveles pico y RMS de ambas muestras,
2 27 77 % 7.10 % 63,2 % - 91,1% sealan que no existe diferencia, pero algunos individuos
3 18 51 % 8,45 % 34,87 % - expresaron percibir un cambio entre las muestras. Esta per-
67,99% cepcin puede atribuirse a la dificultad, que fue comunicada
4 13 37 % 8,17 % 21,13 % - 53,15% por parte de los individuos encuestados de identificar cam-
bios en el rango dinmico durante el desarrollo de las prue-
bas.

Finalmente se concluye el uso de diferentes frecuencias de


muestreo si influye en el desarrollo de una produccin mu-
sical, ya que ha sido posible evidenciar que se presentan
diferencias al aplicar procesos de mezcla y masterizacin
con software tipo plug-in, adems de la cantidad de alma-
cenamiento y recursos del sistema que son necesarios para
trabajar con archivos de audio que tengan frecuencias de
muestreo superiores a las establecidas en el libro rojo. Se
deja abierto el anlisis de otras configuraciones establecidas
por otros sistemas de reproduccin y una evaluacin de di-
ferentes configuraciones usando relojes que brinden mayor
precisin, pues este es uno de los elementos ms importan-
tes en el proceso de conversin AD/DA.

V. Referencias
Figura 9. Cantidad de personas que perciben alguna diferencia en-
Aldrich, N. (2005). Digital Audio Explained For The Audio Engineer.
tre las muestras de la prueba 1
Sweetwater Sound.
Adicional a esto, se analiz si cada uno de los aciertos con-
cordaba con las propiedades de las distintas muestras de Escofet, C. R. (15 de Octubre de 2014). Teorema del limite central.
audio de las pruebas 1 y 2 como se muestra en la TABLA 9. Obtenido de http://www.calidad.com.mx/docs/art_64_1.pdf

Feeney, M. P. (2014). Acoustic Stapedius Reflex Measurements. En


TABLA 9
J. Katz, Handbook of Clinical Audiology (pgs. 165-186). Wolters
Personas que perciben los cambios correctos entre las Kluwer Health.
muestras de audio
Nmero Howard, D. M. (2009). Acoustics and psychoacoustics. Amsterdam:
de prue- Desviacin Intervalo de con-
Focal.
ba Aciertos Proporcin tpica fianza
1 17 61% 9,2 % 42,6% - 78,8% Lavry, D. (2004). Sampling Theory For Digital Audio.
2 27 77 % 7.10 % 63,2 % - 91,1%
3 18 51 % 8,45 % 34,87 % - 67,99% Lavry, D. (Mayo de 2012). The Optimal Sample Rate for Quality Audio.
4 13 37 % 8,17 % 21,13 % - 53,15% Pras, A., & Guastavino, C. (2010). Sampling rate discrimination: 44.1
kHz vs. 88.2 kHz . AES 128th convention. London.

Rumsey, F. (2007). High Resolution Audio. Journal AES Volume 55


IV. Conclusiones Issue 12, 1161-1167.

Al caracterizar y comparar todas las configuraciones selec- UIT. (1994-1997). Recomendacin UIT-R BS.1116-1.Mtodos Para La
cionadas mediante pruebas objetivas no se evidencian gran- Evaluacin Subjetiva De Pequeas Degradaciones En Los Sistemas De
des diferencias, asegurando que los conversores de audio Audio Incluyendo Los Sistemas De Sonido Multicanal,.
no se ven beneficiados ni afectados por la variacin de la
frecuencia de muestreo o la profundidad de bits. UIT. (1997 - 2003). Recomendacin UIT-R BS.1284-1. Mtodos gene-
rales para la evaluacin subjetiva de la calidad de sonido.
Algo diferente arroj la realizacin de las pruebas subjetivas, Woszczyk, W. (2003). Physical and perceptual considerations for hi-
donde el 80% de los individuos de la prueba 1 y 77% de los gh-resolution audio. AES 115th Convention. New York.
individuos de la prueba 2, percibieron diferencias al evaluar

PG. 25
AVANCES del audio en Latinoamrica.

PG. 26
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

AVANCES
DEL AUDIO EN
LATINOAMRICA.

MEZCLA BINAURAL
MEDIANTE INTERFAZ TANGIBLE

Juan Esteban Herrera / Ricardo Andrs Moreno


PG. 27
AVANCES del audio en Latinoamrica.

condiciones del campo sonoro para poder proporcionar


Juan Esteban Herrera percepcin de espacialidad, direccionalidad y distancia de
Instituto Tecnolgico Metropolitano las fuentes emisoras a su alrededor. Referentes musicales
Medelln, Colombia de los aos ochenta, contemplaron la espacialidad sonora
juanherrera37166@correo.itm.edu.co usando tcnicas de grabacin que permitieron establecer
Ricardo Andrs Moreno condiciones de espacialidad, la agrupacin Pink Floyd fue
Instituto Tecnolgico Metropolitano una de las pioneras en experimentar con grabacin binaural
Medellin, Colombia
en su lbum The final cut, tiempo despus esta actividad se
ricardomoreno9013@correo.itm.edu.co
populariz con otras agrupaciones musicales entre las que se
Resumen. Este artculo propone una alternativa a la forma conven- destacan producciones de artistas como: Pearl Jam Binaural,
cional de realizar mezcla de seales de audio en procesos de pos- Michael Jackson History, entre otros (Fontana, Farina, &
tproduccin musical; para lograrlo se implementa un panoramiza- Yves, 2007); estas producciones, principalmente, utilizaban
dor binaural controlado a travs de una interfaz tangible de usuario tcnicas de grabacin que requeran el uso de maniques
(TUI), conformando un prototipo de mesa de mezcla binaural que o cabezas artificiales capaces de emular la condicin de
permite la manipulacin de parmetros de audio de forma prctica e escucha humana, gracias a la implementacin de micrfonos
intuitiva, reemplazando los tradicionales controles de tipo atenuador ubicados en la parte interior de sus orejas, sin embargo,
y perilla que han sido empleados durante dcadas en las interfaces
el efecto binaural que genera la cabeza artificial, radica
fsicas de consolas de mezcla y en interfaces grficas de estaciones
principalmente en los fenmenos acsticos causados por el
de audio digital (DAW). El propsito de la interfaz TUI es permitir la
interaccin del usuario con objetos fsicos, que son dispuestos sobre choque de la onda sonora en la irregularidad de la cabeza,
una superficie o mesa; dichos objetos constituyen representaciones el pabelln y conducto auditivo, ms que por micrfonos
tangibles de fuente(s) y receptor de audio que se usan para confi- usados en la captura. Entregarle al oyente sonido 3D exige un
gurar imgenes sonoras tridimensionales que son recreadas en la replanteamiento total de la cadena de produccin, desde la
produccin de seales de audio binaural. grabacin de sonido y procesamiento, hasta la adaptacin a
formatos de audio para su posterior reproduccin (Cengarle,
Palabras clave. Mezcla binaural, Audio 3D, Sntesis binaural, inter- 2012). Este artculo se enfoca en la mezcla y el procesamiento
faz tangible.
de audio en postproduccin, lo cual es una labor tcnica y
artstica que est en constante evolucin, permitiendo hoy
Abstract. The present paper proposes an alternative to the conven-
tional way of mixing audio signals in musical postproduction pro- en da el uso de procesamiento digital para producir seales
cesses, to achieve this, a binaural panner controlled through a tan- binaurales; estos procesos hacen uso de la sntesis binaural,
gible user interface (TUI) was deployed, thus building a binaural sin embargo, aunque aseguran resultados de espacialidad
mixing table prototype which allows practical and intuitive manipu- ptimos, solo es posible percibirlos a travs de sistemas
lation of audio parameters, by replacing traditional controls such as de reproduccin monousuario, por ejemplo a travs de
faders and knobs, which have been used for decades on the physical audfonos o de un sistema compatible de altavoces con
interfaces of mixing consoles and on the graphical interfaces of digi- filtros canceladores de crosstalk (Cengarle, 2012); adems
tal audio workstations (DAW). The purpose of the TUI interface is to
de un monitoreo especial, el proceso de mezcla binaural
allow user interaction with physical objects arranged on a surface or
requiere herramientas de control adecuadas que permitan
table; these objects are tangible representations of audio source(s)
and receiver, used to set up 3D sound images, recreated in the pro- ajustar el nivel y ubicacin de la fuente en una panormica
duction of binaural audio signals. tridimensional. En una consola tradicional, la mezcla implica
en trminos elctricos, el ajuste de controles de resistencia
Keywords. Binaural audio mixing, 3D audio, Binaural synthesis, variable (faders o perillas), que son componentes estndar de
Tangible user interface. las interfaces fsicas de la mayora de equipos y procesadores
de audio, incluso en las interfaces grficas de usuario (GUI) de
I. Introduccin sistemas DAW y de procesadores de audio virtuales, se hayan
dichos controles con esquemas de operacin similares a las
El principal propsito de usar sistemas de captura y procesa- versiones hardware. Actualmente han surgido herramientas
miento binaural de seales de audio, es proporcionar al oyente digitales que definen otra manera de hacer las tareas de
contenido audible con caractersticas tridimensionales, que mezcla, brindado posibilidades creativas y novedosas, tal
pueden ser perceptibles gracias a la forma en que escucha es el caso de las interfaces multitouch que hoy permiten
el ser humano y a la interpretacin que realiza el cerebro de generar nuevas sensaciones y cambiar un poco la manera
las seales que llegan a los odos izquierdo y derecho, este tradicional de hacer mezcla de seales de audio (Carralscal
proceso se conoce como fusin binaural, y permite inferir el & Jorda), sin embargo, para algunos usuarios, como para
ngulo de precedencia de las fuentes sonoras (Xaus, 2009). los autores de este artculo, las interfaces multitouch no
El ser humano en su cotidianidad est constantemente han logrado un buen nivel de aceptacin, ya que en su
expuesto a campos sonoros tridimensionales, por ejemplo, gran mayora y pese a la popularidad que han alcanzado
sonidos de la naturaleza o sonidos generados por la en dispositivos como pantallas, tablets y telfonos mviles,
interaccin del hombre con objetos; es por tanto coherente, carecen de una respuesta hptica, lo cual, las hace poco
en aras de realismo, que un sistema de grabacin y atractivas para el trabajo profesional. Por otro lado, han
reproduccin de sonido capture y reproduzca fielmente las aparecido interfaces tangibles orientadas a realizar labores

PG. 28
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

musicales y de produccin de audio, las cuales permiten al


usuario interactuar directamente con datos digitales por
medio de objetos fsicos, stas han resultado bien aceptadas;
tal es el caso del proyecto Reactable*, un sintetizador que
hace uso de una TUI para controlar generadores de sonido
usando tcnicas de sntesis; dado lo innovador del uso de
este tipo de interfaces, se han generado nuevas formas de
ver y propiciar la interaccin hombre computadora, cada
vez tendiendo a desarrollar interfaces ms antropomorfas,
donde la mquina se acopla al pensamiento y el accionar del
humano, con aplicacin al campo de la msica y la ingeniera
de sonido (Jorda, 2005).

En este artculo se describe el diseo e implementacin de


un mezclador binaural, a travs de una interfaz tangible de
usuario, que permite realizar procesos de mezcla de audio de
una manera simple e intuitiva, mediante representaciones
tangibles de fuente(s) y receptor de audio para configurar
imgenes sonoras tridimensionales propias de procesos de
mezcla binaural.

II. Parte tcnica


Fig 1. Ejemplo de interaccin con objetos sonoros.
El desarrollo del mezclador binaural se dividi en dos eta-
pas, A y B; la primera consisti en la elaboracin de la inter- La mesa cumple el papel de mezclador binaural donde la
faz tangible y la segunda en la elaboracin de un aplicativo distancia y el ngulo entre cada objeto instrumento y recep-
que se controla a travs de la interfaz para la realizacin de tor, se asigna a variables que se utilizan en el aplicativo para
determinar el nivel y la posicin de la fuente en la panor-
mezcla binaural.
mica binaural.
A. Diseo de la interfaz TUI Descripcin de los Objetos

Para la elaboracin de la interfaz tangible se implement el La interfaz posee objetos tangibles para el control de datos
toolkit Reactivision2 y el protocolo de comunicacin TUIO3, la mediante el empleo de fiducias, en este caso se lograron tres
materializacin de la interfaz se tradujo en la construccin tipos diferentes de objetos: objeto receptor, objeto instru-
de una mesa en madera, que incorpora una cmara infrarro- mento y objeto efecto.
ja para la deteccin de objetos y una superficie semitrans-
parente con dimensiones (55cm x 70 cm), la proporcin largo Objeto Receptor
x ancho se establece en relacin a la distancia focal de la
cmara ubicada al interior de la mesa; se utiliz una cmara El objeto receptor es la representacin del oyente en la mesa,
Sony PS3eye modificada en su ptica, mediante la adicin de este objeto es uno de los elementos principales de la inter-
un filtro que bloquea la luz visible y un lente de foco ajusta- faz, ya que con el movimiento y rotacin del objeto receptor,
ble; la cmara infrarroja se usa para leer informacin de po- son actualizados todos los datos de distancia y orientacin
sicin que poseen los objetos fsicos ubicados sobre la mesa de los dems objetos para mantener coherencia en la mez-
(Bencina & Kaltenbrunner, 2005). Estos objetos correspon- cla final, esto permite generar recorridos audibles entre los
den a una serie de fichas que poseen un cdigo visual o fidu- instrumentos que componen la mezcla. En condiciones de
cia**, todas las fiducias son ledas de forma simultnea por operacin estndar se sugiere dejar fijo el objeto receptor en
la cmara infrarroja al interior de la mesa, proporcionando el centro de la mesa, en posicin coherente con la orienta-
informacin de control codificada segn las especificaciones cin del oyente; la ficha del objeto receptor tiene un dibujo
del protocolo TUIO, dicha informacin consiste en tres ele- de cabeza que indica la orientacin en la mesa.

mentos: un nmero de identificacin ID, dato de posicin en
Objeto Instrumento
la superficie de la mesa expresado en coordenadas X, Y y
ngulo de giro u orientacin. Todos los datos son actualiza-
La interfaz creada soporta hasta 8 objetos de instrumento,
dos al interactuar y mover los objetos. La Fig. 1 muestra un
stos son la representacin de un mdulo de canal en una
ejemplo donde se analizan los datos correspondientes a dos mesa de mezcla; haciendo uso de todos los datos que en-
objetos sonoros respecto a la posicin del objeto receptor. trega cada fiducia, se propone un esquema de control mul-
tiparamtrico (Hunt & Wanderley, 2000), para nivel, ngulo
* http://mtg.upf.edu/project/reactable azimut y ngulo de elevacin; donde, el nivel depende de la
cercana con el objeto receptor, el ngulo azimut corresponde
2 http://reactivision.sourceforge.net/
al ngulo que se forma entre el eje que indica la orientacin
3 http://www.tuio.org/
del receptor y el vector que forma el objeto instrumento,
4 Fiducia es un smbolo de referencia o cdigo visual

PG. 29
AVANCES del audio en Latinoamrica.

tomando como origen la posicin del receptor. Por ltimo, Sntesis binaural
el ngulo de elevacin se establece mapeando el ngulo
de rotacin del objeto instrumento; donde al girar hacia la Para lograr el procesamiento de audio y convertir las sea-
derecha aumenta su elevacin hasta 45 y al girar hacia la les monofnicas a seales binaurales, se implement el ex-
izquierda disminuye su elevacin hasta -45 respecto al ternal para PD, CW_Binaural~ (Doukhan & Sedes, 2009), este
receptor. objeto realiza un proceso de filtrado digital en tiempo real,
usando respuestas al impulso relativas a la cabeza (HRIR);
Objeto Efecto para este proyecto se utilizaron las bases de datos del Ircam,
estas bases de datos corresponden a mediciones de HRIR
Este objeto se usa para el control de efectos sonoros de tiem- realizadas a varias personas con diferentes caractersticas
po y modulacin; cada objeto efecto acta como un canal fsicas en una cmara anecica (Ircam, 2010); tambin se ex-
auxiliar que recibe la seal de los objetos tipo instrumento, periment con una base de datos propia construida a partir
donde el nivel de envo depende de la distancia entre objeto de mediciones de una cabeza artificial 01dB Mk2, tomando
instrumento y objeto efecto; por otro lado, el ngulo de ro- como referencia el protocolo de medicin propuesto por el
tacin se usa para controlar parmetros segn el efecto que Ircam. Dado que las bases de datos no contienen las medi-
representa. En la tabla 1 se describe la asignacin sugerida ciones para todas las posiciones espaciales posibles y estas
e implementada para diferentes tipos de efectos: posiciones adems varan con el movimiento de cada fuente
a espacializar, se requiri usar una instancia del objeto CW_
TABLA 1 Binaural~ por cada canal del aplicativo; dicho objeto acta
MAPEO DE PARMETROS EN EFECTOS como un interpolador de las funciones de transferencia re-
Tipo de efecto Control de ngulo de lativas a la cabeza (HRTF), con el fin de aproximar y obtener
rotacin en todo momento los filtros necesarios que caracterizan la
posicin deseada para cada una de las fuentes a procesar.
Reverb Decay
Delay Subdivisin de tiempo Como se describi en la etapa A, el ngulo azimut de cada
Flanger, phaser Feedback fuente representada por cada uno de los objetos tipo instru-
mento, se obtiene a partir de las coordenadas de posicin
B. Programacin de los objetos instrumento y receptor, y se calcula segn la
expresin mostrada en (1).
Se utiliz la plataforma de programacin Pure Data (PD)***,
sta permite crear entornos de interaccin para aplicaciones
multimedia a travs de objetos y extensiones; se program (1)
un patch**** que sirve de puente de comunicacin entre la in-
terfaz y la plataforma DAW que contiene los canales de audio Donde, es el ngulo azimut, or.x y or.y son las coordenadas
a mezclar. Las seales de audio se envan a PD desde el DAW del objeto receptor y oi.x y oi.y son las coordenadas del ob-
usando la herramienta Jack*****, sta acta como un servidor jeto instrumento. La funcin atan2 es una modificacin de
de audio de baja latencia que permite compartir audio entre atan implementada en la mayora de lenguajes de progra-
aplicaciones; el cliente, en este caso, el DAW de preferencia macin, incluido PD, se utiliza para entregar el ngulo de un
del usuario, puede ejecutar procesos de audio independien- vector entre 0 y 2 respecto al eje de abscisas; luego, a este
tes y compartir las seales con el servidor a travs de puer-
tos de audio virtuales. Por otro lado, PD recibe los datos de la ngulo, se le suma el ngulo correspondiente a la rotacin
interfaz tangible para calcular las distancias y ngulos entre o eje de orientacin del receptor para obtener correctamen-
los objetos de instrumento, efecto y receptor. En la figura 2 te la ubicacin o imagen virtual del instrumento. El ngulo
se observa un diagrama de bloques general del sistema com- de elevacin se encuentra limitado entre -45 a +45 y se
pleto. controla con el giro de cada objeto instrumento; al situar un
nuevo objeto instrumento sobre la mesa, el aplicativo asig-
na por defecto un ngulo de elevacin 0, esto quiere decir
que el instrumento se encuentra a la altura de los odos, a
partir de este punto la rotacin del objeto se programa para
funcionar como una perilla infinita, donde el incremento o
decremento en el ngulo de elevacin es controlado por la
direccin de rotacin de cada objeto instrumento hacia de-
recha o izquierda respectivamente, con la posibilidad de ser
visualizado en el aplicativo PD.

El valor de amplitud del instrumento corresponde a la mag-


nitud del vector, cuyo origen es la posicin del receptor, y
el destino, la posicin del instrumento; dicha magnitud se
calcula como se muestra en (2)

Fig. 2. Diagrama de bloques general (2)

*** http://puredata.info/ El valor de magnitud, al igual que el ngulo, se calcula con va-
**** Se denomina patch al ejecutable programado en Pure Data. lores expresados en nmero de pixeles dados por la imagen
***** http://jackaudio.org/

PG. 30
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

que capta la cmara, este valor luego se escala para operar


en un rango entre 0 a 1, que corresponde al nivel del canal
L y R de la seal binaural obtenida para los ngulos azimut
y elevacin dados. En la Fig. 3, se muestra el patch princi-
pal del mezclador binaural, con una interfaz grfica que sirve
para monitorear los niveles de entrada de las seales a pro-
cesar, los niveles de salida de la seal binaural, los ngulos
de azimut y elevacin, y la posicin de cada instrumento en
la superficie de la mesa.

Fig. 4. Prototipo de mesa para mezcla binaural

Se obtuvo un prototipo de bajo costo de produccin gracias


a que en todas las etapas de diseo y construccin se utili-
z software, libreras, protocolos y extensiones de libre dis-
tribucin. Luego de un proceso de experimentacin con la
interfaz y el aplicativo de sntesis binaural, en sistemas de
reproduccin con audfonos; y en el sistema de altavoces con
tecnologa Opsodis******; se obtienen imgenes sonoras tridi-
mensionales que recrean la escena fsica configurada sobre
Fig. 3. Patch principal del mezclador binaural creado en PD la mesa. El aplicativo incorpora un factor de atenuacin por
distancia entre objetos que puede ser modificado; sin em-
Reproduccin binaural bargo su comportamiento es lineal; como trabajo futuro se
plantea la implementacin de curvas de atenuacin modi-
La reproduccin de audio binaural de esta interfaz se hace ficables y programacin de un algoritmo que simule efecto
posible a travs del uso de audfonos, este mtodo de re- doppler.
produccin de audio ofrece una buena impresin espacial
(Barlett & Barlett, 1999), garantizando que las seales proce- IV. Conclusiones
sadas en la sntesis binaural con las HRIR del odo izquierdo
y derecho lleguen en correspondencia a los odos del recep- Este proyecto contribuy a proporcionar una herramienta
tor, evitando problemas de diafona (Cengarle, 2012). Sin em- no convencional para facilitar los procesos de mezcla bin-
bargo, la precisin en la identificacin del ngulo de proce- aural como respuesta al notable incremento de utilidades o
dencia de una fuente cuando se escucha una seal binaural, herramientas software en formato plugin o standalone para
depende en gran medida de la antropometra de la cabeza procesamiento binaural y a la necesidad de usar interfaces
artificial usada, obteniendo mejores resultados cuando sta de control que se ajusten a los procesos de una panormica
se aproxima a la antropometra del usuario. En el caso del tridimensional.
patch programado se brinda la opcin de cambiar la base de
datos de HRIR cargada en cw_binaural~ buscando aproximar Las pruebas de interaccin con el prototipo mostraron que
las respuestas a las caractersticas del usuario mediante un
el tiempo de actualizacin de las posiciones de objetos, est
test de escucha previo en pro de ofrecer una experiencia au-
sujeto a las caractersticas tcnicas de la cmara PS3eye,
dible ms realista.
alcanzando en el mejor de los casos una actualizacin de
45 fps; esto se traduce en la escucha de saltos en posicin
III. Resultados de los instrumentos cuando se realizan movimientos o giros
bruscos sobre la superficie de la mesa, esta situacin es de
Se obtuvo un prototipo de mesa que incorpora una interfaz especial cuidado cuando se desea grabar el audio corres-
tangible y un aplicativo para ser usado en procesos de mez- pondiente a un movimiento del objeto receptor; para mejo-
cla binaural de seales de audio. La interaccin con la in- rar esta condicin se hace necesario implementar a futuro
terfaz permite transmitir datos de posicin para realizar sn- una cmara de mejores especificaciones tcnicas.
tesis binaural de ocho canales de instrumento simultneos,
ms un canal master con 3 envos auxiliares para efectos. Luego de testear el prototipo con un sistema de monitoreo a
travs de audfonos, se evidencian problemas comunes en la
mezcla como el incremento en frecuencias bajas por efecto
de oclusin y lateralizacin de fuentes en las seales binau-
rales, por lo tanto se utiliz un sistema de monitoreo alterno
basado en altavoces, para este caso, el reproductor Opsodis,
con ste se encontr que aunque se evitan los problemas
anteriormente mencionados con audfonos, se requiere de

****** http://resource.isvr.soton.ac.uk/FDAG/VAP/pdf/OPSODIS.
pdf

PG. 31
AVANCES del audio en Latinoamrica.

unas condiciones de escucha controladas para garantizar en


un sweetspot pequeo una percepcin binaural.

En este artculo se present una descripcin de cmo cons-


truir un prototipo de mesa de mezcla binaural de bajo costo;
que puede reproducirse o considerarse como referente para
disear y construir un prototipo propio ajustado a las nece-
sidades del usuario.

V. Referencias
Barlett, B., & Barlett, J. (1999). On-location recording techniques.
Focal Press.

Bencina, R., & Kaltenbrunner, M. (2005). The Design and Evolution


of Fiducials for the reacTIVision System. In Proc. 3rd International
Conference on Generative Systems in the Electronic Arts. Melbour-
ne.

Carralscal, J., & Jorda, S. (s.f.). Multitouch interface for audio mi-
xing.

Cengarle, G. (2012). 3D audio technologies: applications to sound


capture, post-production and listener perception.

Doukhan, D., & Sedes, A. (2009). CW_binaural~: A binaural syn-


thesis external for Pure Data. In Proc. 3rd Puredata Int. Conv. (Pd-
Con09). Sao Paulo.

Fontana, S., Farina, A., & Yves, G. (2007). Binaural for popular mu-
sic: A case of study. Proceedings of the 13th International Conferen-
ce on Auditory Display, (pg. 6). Montral.

Hunt, A., & Wanderley, M. (2000). Towards a model for instrumental


mapping in expert musical interaction. In Proceedings of the 2000
International Computer Music Conference, (pgs. pp. 209-212).

Ircam, R. A. (2010). http://recherche.ircam.fr. Obtenido de http://re-


cherche.ircam.fr/equipes/salles/listen/system_protocol.html
Izhaki, R. (2008). Mixing audio: concepts, practices and tools. Focal
Press.

Jorda, S. (2005). Digital Lutherie: Crafting musical computers for


new musics performance and improvisation. Tesis, Universitat Pom-
peu Fabra, Tecnologia, Barcelona.

Kaltenbrunner, M., & Bencina, R. (2007). reacTIVision: a compu-


ter-vision framework for table-based tangible interaction. In Procee-
dings of the 1st international conference on Tangible and embedded
interaction (pgs. pp. 69-74). ACM press.

Klemmer, S. (2004). Tangible User Interface Input: Tools and Tech-


niques. University of California, Berkeley.

Moggride, B. (2007). Designing Interactions . London: MIT Press.

Moylan, W. (2002). The art of recording: understanding and crafting


the mix.

Xaus, A. (2009). La percepcin acstica egocntrica y principios de


sistemas espaciales. Barcelona.

PG. 32
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

AVANCES
DEL AUDIO EN
LATINOAMRICA.

DESARROLLO DE ALGORITMO DE
INTERPRETACIN DE RESPUESTAS
AL IMPULSO EN TRES DIMENSIONES

Federico Nahuel Cacavelos / Augusto Bonelli Toro / Alejandro Bidondo


PG. 33
AVANCES del audio en Latinoamrica.

Federico Nahuel Cacavelos*, Augusto Bonelli Toro**, tacin de respuestas al impulso en tres dimensiones. Para
Alejandro Bidondo*** esto se utiliz la plataforma MATLAB como entorno de pro-
gramacin. Esta plataforma permite la visualizacin de vec-
Universidad Nacional de Tres de Febrero, tores de intensidad en tres dimensiones. De esta manera, se
Buenos Aires, Argentina puede distinguir de forma espacial y temporal, el sonido di-
recto de las reflexiones en una respuesta al impulso grabada
fnahuelc@gmail.com con un arreglo de micrfonos. Para esto, diversas tcnicas de
abonellitoro@gmail.com procesamiento digital de seales fueron abordadas para la
abidondo@untref.edu.ar evaluacin de los datos. Finalmente, se constat el funcio-
namiento del algoritmo con una serie de mediciones.
ResumenEn el presente trabajo se presenta el desarrollo de un al-
goritmo de interpretacin de respuestas al impulso en tres dimen- Aplicaciones de la respuesta al impulso en tres di-
siones. Esta herramienta posibilita la visualizacin de vectores de mensiones
intensidad en un sentido espacial, siendo til para distintas ramas
de la acstica arquitectnica, la produccin de audio y la industria. Los espacios acsticos son comnmente evaluados utilizan-
Esta visualizacin permite distinguir de forma espacial y temporal, do tcnicas de medicin de respuestas al impulso omnidi-
el sonido directo de las reflexiones en una respuesta al impulso (RI) reccionales. Estas tcnicas permiten obtener caracteriza-
grabada con un arreglo de micrfonos. Diversas tcnicas de proce- ciones en trminos de nivel y tiempo, pero no proporcionan
samiento digital de seales fueron abordadas para la evaluacin de informacin sobre la direccin. En este sentido la ventaja de
los datos. Finalmente, se constat el funcionamiento del algoritmo la comprensin y caracterizacin de los parmetros acsti-
con una serie de mediciones. cos a travs de la medicin de respuestas al impulso en tres
dimensiones es la de abarcar tambin una caracterizacin
Palabras clave Respuesta al impulso en 3 dimensiones, Erizo, Es- en trminos de direccin. La obtencin de la direccin per-
pacializacin, Soundfield, Ambisonics. mite entre otras, relacionar las reflexiones sonoras a las ca-
ractersticas fsicas de la sala, observar la distribucin direc-
Abstract In this paper, the development of an interpretation algo- cional de la energa temprana y tarda, as como identificar
rithm for 3D impulse responses is presented. This new tool allows to las superficies que generan reflexiones indeseadas. Por otro
identify the spatial provenance for each time window of an impulse lado, la comparacin de las direcciones de los componentes
response recorded in aA-Formatmicrophone. In this way, it is possi- de respuestas al impulso de distintas salas puede aportar
ble to discern between the direct sound and the different reflections a la identificacin de diferencias y similitudes de patrones
temporarily and spatially. To understand the basics of this method, a acsticos.
brief introduction to all concepts involved is presented. Alternatively,
different types of procedures are used for data evaluation. Finally, Si bien existen en la actualidad parmetros acsticos que
system applications are shown in controlled acoustical environments describan caractersticas espaciales de la respuesta al im-
toevaluate the precision and the potential of this tool. pulso, es posible desarrollar nuevos parmetros al contem-
plar la direccin como una variable independiente.
Keywords Impulse response 3D, Hedgehog, Spacialization, Soun-
dfield, Ambisonics. Formato A y Formato B
I. Introduccin El formato A de micrfonos permite la captacin de cuatro
seales de audio. Para esto es necesario utilizar un arreglo
La captacin de respuestas al impulso ha sido ampliamente de micrfonos con cuatro cpsulas sub-cardioides ubicadas
estudiada con anterioridad en diversas reas de la acstica.
en las caras de un tetraedro.
El uso ms conocido est dado en la industria de la produc-
cin de audio comercial. La convolucin de este tipo de res-
puestas al impulso con seales anecoicas posibilitan recrear Desde un aspecto terico las cpsulas deberan coincidir en
ambientes sonoros envolventes. En el presente trabajo se un solo punto, pero debido a limitaciones fsicas obvias, esto
presenta un uso alternativo a este tipo de respuestas, con resulta imposible. Esta condicin produce una distorsin de
aplicaciones en la caracterizacin de los parmetros acsti- fase en longitudes de onda menores a cuatro veces la dis-
cos y diseo de recintos. tancia entre las cpsulas. Por este motivo es necesario im-
plementar filtros que corrijan este problema y que represen-
Este trabajo presenta la metodologa y consideraciones que ten la especializacin sonora como si las cpsulas estuvieran
se realizaron en el desarrollo de un algoritmo de interpre- virtualmente colocadas en el centro del tetraedro.

*N. Cacavelos estudiante en Ingeniera de Sonido en Universidad Na- El formato B consiste en cuatro seales denominadas W, X,
cional de Tres de Febrero, Valentn Gmez 4828/38, Buenos Aires, Y y Z. La seal W representa el componente de presin de la
Argentina y Universidad de San Buenaventura, Carrera 56C N 51- seal captada en forma omnidireccional, mientras que X, Y y
110, Medelln, Colombia.(fnahuelc@gmail.com.ar). Z representan los vectores de velocidad relacionados con las
direcciones horizontales (X e Y) y la direccin vertical (Z). El
** A. Bonelli estudiante en Ingeniera de Sonido en la Universidad
micrfono formato B se obtiene utilizando tres micrfonos
Nacional de Tres de Febrero, Valentn Gmez 4828/38, Buenos Aires,
figura de 8 y un micrfono omnidireccional. Otra manera de
Argentina (abonellitoro@gmail.com). obtener dicho formato, es realizando una combinacin entre
*** A. Bidondo coordinador de carrera de Ingeniera de Sonido en la las seales en formato A y la posterior aplicacin de un filtro
Universidad Nacional de Tres de Febrero, Valentn Gmez 4828/38, de compensacin de fase. [1, 2].
Buenos Aires, Argentina (abidondo@untref.edu.ar ).

PG. 34
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

Vectores intensidad a partir de seales Formato B donde no se consegua la distancia suficiente, otra tcnica
utilizada estuvo dada por colocar el micrfono lindante a la
Como afirman Farina y Tronchin en su investigacin de la superficie reflejante. Este mtodo modifica el patrn de cap-
Universidad de Parma (2013), los vectores intensidad en una tacin del micrfono a semiesfrico e imposibilita la adqui-
direccin (correspondientes a una o ms fuentes) se pue- sicin de reflexiones producidas por la superficie.
den obtener mediante el producto de la presin (es decir, la Es preciso aclarar que la aplicacin del filtro inverso de la
seal W del micrfono) y el vector velocidad deseado (X, Y o respuesta de la fuente no realiza modificaciones respecto a
Z). Posteriormente, con los valores de la intensidad en cada las diferencias de respuesta entre las cpsulas. Es por esto,
uno de sus ejes, se puede calcular el mdulo de la misma. que futuras mediciones deben ser tomadas en cuenta a fin
Para obtener los ngulos de desplazamiento (azimuth y ele- de realizar una caracterizacin de las capsulas utilizadas.
vacin) de cada uno de los puntos del vector intensidad se
pueden utilizar las ecuaciones trigonomtricas expuestas en Mecanismo de correccin de ganancias
el trabajo anteriormente mencionado [3].
Uno de los aspectos importantes a tener en cuenta refiere a
Log Sine Sweep y algoritmo de Kirkeby la configuracin de ganancias de la interface. La inequidad
de relaciones de ganancia entre los distintos canales puede
La tcnica de medicin de respuestas al impulso con Log Sine provocar la obtencin de resultados errneos.
Sweep (LSS) consiste utilizar como seal de excitacin de un
recinto a una seal del tipo seno, la cual vara exponencial- Con este fin se desarroll un algoritmo de correccin de ga-
mente entre dos frecuencias. La ventaja radical que adquiere nancias. En el mismo se puede iniciar la medicin con cual-
esta tcnica respecto a un barrido lineal es que al tratarse quier criterio de ajuste de ganancias, preferentemente el
de un espaciamiento logartmico, presentara una mayor du- que logre la mayor relacin seal ruido sin distorsin. Luego,
racin para los tonos de baja frecuencia. De esta manera se se introduce una seal de ruido blanco con la misma dura-
pueden lograr mayores relaciones seal ruido aun en baja cin (puede ser generada con la misma interface) en cada
frecuencia. En contraposicin a un barrido lineal, este ltimo uno de los canales utilizados. Las diferencias relativas entre
mantiene la misma duracin para todo el rango de frecuen- las sumas energticas de cada una de las seales adquiridas
cias [4, 5], siendo as necesario aplicar mayores tiempos de representarn las relaciones de ganancia entre canales. De
duracin de barrido. esta manera se debe aplicar correcciones de amplitud a fin
de obtener la misma suma energtica en todos los canales.
La aplicacin del filtro inverso de la fuente tambin produce
una mejora en la calidad de la respuesta al impulso medi- Limitaciones prcticas y filtros
da. El uso de esta herramienta permite reducir las posibles
alteraciones que pueda producir la alinealidad de la fuente Como se mencion anteriormente, hay una restriccin en
utilizada. Para esto, es preciso contar con la respuesta al im- frecuencia debido a la distancia entre las cpsulas. Para
pulso de la fuente utilizada medida en condiciones anecoi- compensar la distorsin de fase en alta frecuencia es nece-
cas. A fines prcticos, es posible lograr una buena evaluacin sario emplear un filtro pasa bajos con una frecuencia de
de la misma aun en condiciones acsticas no ideales. En la corte acorde al micrfono utilizado. En este caso, se utiliz
siguiente seccin se desarrollaran algunas de las herramien- un filtro FIR de fase lineal, de orden 400 y frecuencia de corte
tas plausibles de utilizar. De forma complementaria se utiliza en 5 kHz, como se puede apreciar en la figura 1.
el algoritmo de Kirkeby para la aplicacin del filtro inverso a
las seales medidas. La aplicacin de este filtro mejora en
forma el contenido en frecuencia, eliminando la dispersin
temporal producida por la alinealidad de la fuente.[5]

II. Procedimiento
Adquisicin de respuestas al impulso

Para la obtencin de las respuestas al impulso se utiliz la


tcnica desarrollada por Farina con el LSS en conjunto con
el algoritmo de filtro inverso de Kirkeby, el cual reduce las
alteraciones en la seal producidas por las caractersticas
de la fuente

Dada la dificultad para obtener la respuesta de la fuente om-


nidireccional en condiciones anecoicas se implementaron
una serie de mtodos alternativos capaces de obtener resul-
tados aceptables. La colocacin del micrfono omnidireccio- Fig. 1. Filtro FIR de fase lineal para evitar distorsin de fase
nal fue hecha lejos de una superficie reflectante de manera
de obtener el sonido directo de la fuente lo suficientemente La necesidad de implementar un filtro de fase lineal radica
espaciado de las reflexiones tempranas. El criterio para ele- en la posible alteracin de la interpretacin de resultados
gir dicha distancia fue que sobrepase al menos una longitud al introducir un corrimiento de fase que no es propio de la
de onda de la frecuencia ms baja de anlisis. En los casos seal medida.

PG. 35
AVANCES del audio en Latinoamrica.

Presentacin de grficas que distancien en una proporcin especfica del nivel sonoro
mximo. De los puntos encontrados se adopta el primero en
Las grficas se representan en forma de vectores con un mis- orden temporal como centro del sonido directo. Una ventana
mo origen y distintas direcciones. Cada uno de los vectores temporal es aplicada de forma de extraer el sonido directo
representa a cada una de las ventanas temporales. El largo proveniente de la fuente. Esto puede observarse en la figura 3.
del vector representa su magnitud, la cual est dada por la
suma energtica de los niveles de intensidad que contiene.
Dichas magnitudes se presentan normalizadas en base al so-
nido directo. El color del vector simboliza la distancia tempo-
ral al sonido directo (de rojo al azul). Con el fin de facilitar el
entendimiento de los resultados, los grficos se presentan en
los tres planos ortogonales que incluyen el punto de origen.

Tamao temporal de los vectores graficados

El problema ms discutido en el desarrollo del procedimien-


to de clculo fue la eleccin de las ventanas temporales que
representan cada uno de los vectores graficados. La ms pe-
quea variacin en el alcance de muestras contenidas en
cada ventana influencia la direccin y magnitud de los vec-
tores. Es por esto que distintos mtodos de seleccin fueron
desarrollados con el fin de comparar y contrastar los resul-
tados encontrados.
Fig. 3. Extraccin del sonido directo
La problemtica radica en que el nmero de muestras que se
adquieren de una ventana temporal impacta sobre la reso-
En caso de contar con la respuesta al impulso de la fuente en
lucin frecuencial obtenida y por consiguiente de la menor
condicin anecoica o de que el sonido directo y las reflexio-
frecuencia de anlisis. Por consiguiente, una ventana tem-
nes se encuentren lo suficientemente separadas temporal-
poral con menor nmero de muestras implica una limita-
mente (una longitud de onda de la frecuencia ms baja), es
cin en baja frecuencia, desplazando a valores superiores
posible realizar un anlisis adicional que permite obtener
la frecuencia inferior de anlisis. Por otro lado, el tomar una
las posiciones especficas de cada una de las reflexiones aun
ventana temporal extensa se debe considerar que la misma
existiendo superposicin. El reflectograma (Figura 4) hace
puede contener informacin proveniente de ms de una
uso de la funcin de correlacin cruzada evaluando la ven-
reflexin, dando lugar a interferencias constructivas y des-
tana encontrada con el vector completo de la respuesta al
tructivas, por lo que el anlisis de los resultados debe ser
impulso.
tomado con criterio.

Las diferencias en la sensibilidad de las cpsulas a frecuen-


cias bajas se consideran un factor crtico que puede introdu-
cir errores en el anlisis de los datos.

En la figura 2 se muestran dos graficas obtenidas para tama-


os de ventana distintos.

Fig. 2. Resultados obtenidos para distintos tamaos temporales (Iz-


quierda: 1 ms; Derecha: 10ms)
Fig. 4. Reflectograma de la seal
Criterio de seleccin del sonido directo
Criterio de seleccin de ventanas representativas
Distintos mtodos fueron estudiados para la extraccin del
Otro de los factores importantes radica en la eleccin de las
sonido directo de respuestas al impulso y de sus reflexio-
ventanas ms representativas a graficar. La numerosa canti-
nes [7, 8]. La tcnica utilizada en este trabajo incorpora un
dad de ventanas que resultan del anlisis producen en con-
algoritmo de extraccin de picos que permite al usuario se-
secuencia una densidad de vectores que imposibilita la co-
leccionarlos manualmente, si as lo desea. De esta manera
rrecta visualizacin de los datos. Por este motivo se opta por
se analizan los picos del nivel de presin sonora de la seal

PG. 36
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

extraer los que tuviesen las mayores magnitudes de nivel de


intensidad. Para esta seleccin tambin se tiene en cuenta la
proximidad de las ventanas, evitando la superposicin de las
mismas. Este criterio de evitar o no la superposicin se en-
cuentran actualmente en discusin. Al considerar superposi-
cin de ventanas es preciso aclarar que cada muestra de la
respuesta al impulso tendr asociada una ventana temporal,
por lo cual sin importar el tamao de ventana que se utilice
siempre habr tantas ventanas como muestras del archivo
de audio. En la figura 5 se muestra el resultado para los tres
casos descriptos anteriormente.

Fig. 5. Distintos criterios de seleccin de ventanas (Izquierda: Se


consideran todas las ventanas; Centro: Se consideran las 256 de
mayor nivel; Derecha: Se consideran las 256 de mayor nivel sin su-
perposicin)

Fig. 7. Puntos de medicin y resultados de St. MargaretsChurch


(arriba); Foto de la medicin (abajo-izquierda); Grfico de la res-
puesta al impulso 3D para la medicin (abajo-derecha)

Esta medicin se realiz en distintos puntos ubicados de ma-


nera equidistante a lo largo de la habitacin. Esta dispersin
geomtrica es favorable para evaluar la variacin en la direc-
cin del sonido directo y sus reflexiones. Se puede observar
que los resultados no fueron orientados manualmente hacia
la fuente sino que la orientacin es producto del algoritmo.
Es posible observar como los resultados encontrados en
las posiciones cercanas a las esquinas de la sala adquieren
componentes laterales comparables en magnitud al sonido
directo dada la proximidad a las superficies reflejantes. Si-
tuacin que no se ve reflejada en las posiciones P5 y P14.
Esto advierte que los resultados obtenidos son acordes con
la acstica de la sala. Del mismo modo se observa que en la
posicin P14, el sonido directo adquiere un mayor protago-
nismo en los vectores graficados.

De forma complementaria se evalu el sistema completo rea-


lizando una medicin en una situacin real y conocida. Para
Fig. 6. Distintos criterios de seleccin de ventanas (Arriba: Se con- esto se utiliz una sala preparada acsticamente con mate-
sideran todas las ventanas; Centro: Se consideran las 256 de mayor rial Fonac clase 1 50mm, un micrfono Soundfield SPS200 y
nivel; Debajo: Se consideran las 256 de mayor nivel sin superposi- una fuente KRK Rokit8. Como se menciona anteriormente, es
cin) recomendable realizar una medicin de la fuente en condi-
ciones anecoicas, para esto se usaron las tcnicas descriptas
III. Implementacin y resultados anteriormente con una ventana de 8ms (dadas la geometra
de la sala y la mnima distancia a superficies reflejantes), al-
Con el fin de analizar los mtodos empleados, se utilizaron canzando una frecuencia inferior de anlisis de 121Hz. Usan-
mediciones conocidas. A continuacin se muestra un ejem- do la tcnica de LSS (50s de duracin entre 80 y 15Khz con
plo para St. Margarets Church de York hecha por Aglaia Fo- una frecuencia de muestreo de 44100) e implementando la
teinouy Simon Shelleyen (2011) con un micrfono Soundfield tcnica de Kirkeby8, se llevaron a cabo las mediciones de
SPS422B y una fuente Genelec S30D. Se utiliz la tcnica de respuesta al impulso. Posteriormente se hizo la conversin
LSS de 20 a 22Khz con 15s de duracin y 96Khz de frecuencia de formato A al formato B por medio de la herramienta pro-
de muestreo. En la figura 7 se pueden apreciar la planta con porcionada por la firma Soundfield.
las posiciones de medicin. Tambin se incluye en la misma
grafica los resultados del anlisis. En la figura 8 se muestra un esquema de planta con algunos
objetos presentes en el momento de la medicin. Tambin
se incluye en la misma grafica los resultados del anlisis

PG. 37
AVANCES del audio en Latinoamrica.

ponse and distortion with a swept-sine technique.

[5] Farina A. (2007). Advancements in impulse response m


easurements by sine sweeps.

[6] Kirkeby O. Nelson P. (1999). Digital Filter Design for Inversion


Problems in Sound Reproduction.

[7] Sturm B., Defrance G. (2010). Detection and estimation of arri-


vals in room impulse responses by greedy sparse approximation.

[8] Usher J. (2010). An improved method to determine the onset ti-


mings of reflections in an acoustic impulse response.

Fig. 8. Planta de puntos de medicin y resultados de medicin rea-


lizada en una sala tratada acsticamente

Es posible de observar en los resultados que la direccin del


vector correspondiente al sonido directo mantiene una co-
rrespondencia con la ubicacin de la fuente. No obstante,
sta se orienta levemente hacia la derecha (donde hay gran
componente energtico de reflexiones). Esto puede darse
debido al solapamiento de reflexiones en la misma venta-
na temporal, ya que la medicin fue realizada en una sala
donde la diferencia temporal entre los caminos recorridos es
pequea. Tambin se puede advertir sobre la energa prove-
niente de las superficies reflejantes y difusoras.

IV. Conclusiones
Un algoritmo para la obtencin de respuestas al impulso
en tres dimensiones fue desarrollado e implementado. Los
resultados obtenidos prueban su correspondencia con las
distintas situaciones acsticas evaluadas, evidenciando la
validez de la teora utilizada. De este modo, se puede ad-
vertir que el mtodo entraa una herramienta til y prctica
para el anlisis de cualquier tipo de entorno acstico. Sus
alcances y aplicaciones deben ser estudiados en el futuro a
fin de construir las bases para la descripcin de problemti-
cas acsticas. Se advierte que al igual que las respuestas al
impulso, otros parmetros pueden ser tambin analizados
mediante la interpretacin de vectores de intensidad, por
lo que aplicaciones en diversas reas de la acstica pueden
verse beneficiadas con el desarrollo de esta herramienta.

Es necesario sealar que el estudio debe continuarse por la


caracterizacin de precisin en magnitud y direccin de los
vectores obtenidos relacionndolos a la situacin acstica
planteada.

V. Referencias
[1] Ortolani, F (2015). Introduction to Ambisonics- A tutorials for
beginners in 3D audio, 13-16.

[2] Farina A, (2015). A-format to B-format conversion. (2015). Pc-


farina.eng.unipr.it.

[3] Farina A., Tronchin L. (2013). 3D Sound Characterisation in


Theatres Employing Micropohone Arrays.

[4] Farina A. (2000). Simulataneous measurement of impulse res-

PG. 38
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

AVANCES
DEL AUDIO EN
LATINOAMRICA.

AUDIOJUEGO CON
IMPLEMENTACIN DE
AUDIO BINAURAL

Andrs Carmona / Diego Sierra / Ricardo Moreno


PG. 39
AVANCES del audio en Latinoamrica.

Andrs Carmona*, Diego Sierra** y Ricardo Moreno*** Actualmente se encuentran en el mercado distintos tipos de
Facultad de Ingenieras, Universidad de San Buenaventura audiojuegos, como Papa Sangre, lanzado en diciembre del
Medelln, Colombia 2010 y desarrollado por el estudio Something Else. Este juego
*andres.carmona@tau.usbmed.edu.co cuenta con implementacin de audio binaural a travs de su
**diego.sierra@tau.usbmed.edu.co propio motor de audio patentado: Papa Engine. Otros audio-
***ricardo.moreno@usbmed.edu.co juegos de Something Else son: The Nightjar, lanzado en el 2011,
Papa Sangre II, en el 2013, y Audio Defence: Zombie Arena, en
Resumen. El desarrollo de los videojuegos ha estado enfocado prin- el 2014. En el 2013 la desarrolladora Epicycle present Blind-
cipalmente a la industria del entretenimiento. Por otra parte, el de- side, audiojuego desarrollado en Unity, para iOS, Mac y PC.
sarrollo de audiojuegos ha centrado su atencin en la creacin de
herramientas didcticas de aprendizaje para poblacin con disca- La implementacin de audio en los videojuegos ha tomado
pacidad visual. Solo hasta aos recientes se ha presentado un auge elementos propios del diseo sonoro en la industria cine-
de este tipo de juegos dirigidos a la industria del entretenimiento. matogrfica, adaptadndolos a las dinmicas y requerimien-
Un audiojuego es un juego electrnico en el que, a diferencia de un tos de un juego, y combinando planos visuales con planos
videojuego, la interaccin se logra con base en la percepcin y res- sonoros que a diferencia del cine tradicional son planos
puesta a una serie de estmulos sonoros. En este proyecto se describe animados y sonoros programados en secuencias no lineales
el desarrollo de un audiojuego implementando tcnicas de audio bi- o interactivas. Prescindir de la imagen en un juego virtual
naural interactivo, que puede ser jugado tanto por personas videntes establece retos tcnicos y de diseo sonoro para generar la
como con discapacidad visual. jugabilidad; sin embargo, pueden explorarse aspectos como
la espacialidad sonora, para crear elementos de interaccin
Palabras clave: audio binaural, audio interactivo, audio inmersivo, y efectos sonoros que puedan ser aprovechados en pro de
audiojuego, audio 3D.
la historia del juego. Michel Chion sugiere que escuchar so-
nidos sin ver o conocer su causa puede crear un impacto
Abstract. Video games has been focused mostly to the entertainment
emocional enorme, pues esto hace que el sonido se revele
industry. Meanwhile the audio games has been directed as didac-
en todas sus dimensiones, haciendo que el oyente dirija su
tic element for visually impaired population, only until recent years
atencin a rasgos normalmente ocultos del sonido o que pa-
there has been a boom in this type of games to entertainment. An
audio game is similar to a video game, but unlike all the weight of san desapercibidos (Chion, 1994). Eliminar la imagen pone al
this entertainment is loaded into the sound. This project describes espectador o jugador ante una condicin de escucha cons-
the development of an audio game implementing techniques binaural ciente.
audio and interactive, that can be play by both sighted and visually
impaired players. La aparicin de tecnologas de produccin y posproduccin
permiten crear productos de audio con sonidos que pue-
Keywords: binaural audio, interactive audio, audio game, sound de- den ser percibidos en un determinado punto del espacio 3D,
sign, game play. como los sistemas surround y los mtodos de grabacin bin-
aural. Las tcnicas de espacializacin sonora en videojuegos
han evolucionado conforme a estos formatos y sistemas de
I. Introduccin reproduccin del sonido (Breebaart & Faller, 2007). Francis
Rumsey muestra un resumen general de los esquemas de
Los primeros registros de audiojuegos datan de 1974, con programacin, la relacin de los conceptos de sntesis para
juegos como Touch me, lanzado por Atari. Este consista en el procesamiento de audio, el diseo de los ambientes so-
tocar una serie de botones que se iluminaban y producan noros y la implementacin de tcnicas de mezcla envolvente
sonidos de acuerdo a una secuencia generada por el juego para ubicacin de fuentes sonoras virtuales en sistemas de
en forma automtica. El reto era memorizar la secuencia para reproduccin 5.1 y 7.1 (Rumsey, 2013). Si bien los formatos en-
reproducirla en el mismo orden, incrementando su dificultad volventes han sido usados comercialmente en la industria de
con cada ejecucin (Kurtz, 2004). Aunque contaba con un los videojuegos (Miller, 2006), son pocos los referentes que se
componente visual, tanto los jugadores videntes como con tienen acerca del uso de tcnicas binaurales. En el presente
discapacidad visual podan disfrutarlo de igual forma. Aos proyecto se describe el uso de tcnicas de captura binaural
ms tarde saldran juegos similares, como Simon o Merlin de sonido usando cabezas artificiales, y la implementacin
(Smith, 2011). de herramientas para el diseo y programacin de eventos
sonoros dinmicos e interactivos que permitieron la crea-
Los audiojuegos iniciaron como juegos para personas con cin de un audiojuego titulado El Bosque. A continuacin se
discapacidad visual, adaptando juegos comunes a travs del describen los procesos realizados en las etapas de prepro-
sonido, como Blackjack y Batalla Naval (Lpez, 2008). Luego duccin, produccin y posproduccin del audiojuego.
comenzaron a surgir audiojuegos dirigidos a todo pblico.
Uno de los primeros fue Drive, lanzado en el 2002 (Velleman,
Tol, Huibets, & Verwey, 2004). Es un juego de carreras sin
interfaz visual, basado nicamente en sonidos.
II. Parte tcnica del artculo
____________________________
* A. F. Carmona estudia en la Universidad San Buenaventura A. Preproduccin
Medelln (e-mail: andres.carmona@tau.usbmed.edu.co).
** D. Sierra estudia en la Universidad San Buenaventura Me- En esta primera etapa se concibieron todos los detalles rela-
delln (e-mail: diego.sierra@tau.usbmed.edu.co). tivos al juego, plasmados en un documento de diseo (Sche-
*** R. A. Moreno labora en la Universidad San Buena- ll, 2008) que contiene desde la historia hasta el concepto del
ventura Medelln (e-mail: ricardo.moreno@usbmed.edu.co). juego, y un desglose de cada elemento de audio utilizado.

PG. 40
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

1. Concepcin del juego 1.2. Edicin de script primera persona

En el audiojuego El Bosque, el jugador se representa en pri- Se implement un asset predeterminado de Unity para los
mera persona por un personaje que despierta en medio de movimientos y las propiedades fsicas del personaje. Toda
un bosque oscuro. El bosque es un lugar lleno de misterio, en la implementacin de los audios binaurales se desarrolla en
cuyo terreno hay una serie de trampas. Al acercarse a ellas esta fase. Se agregaron cinco fuentes, que son activadas por
se emiten sonidos espacializados que indican su ubicacin. medio de variables booleanas, contadores, comparadores y
El jugador debe prestar atencin a los eventos sonoros que
las funciones OnTriggerEnter (cuando el personaje choca con
emiten las trampas, para poder cambiar el trayecto y esqui-
varlas. El objetivo del jugador ser salir del bosque guiado un interruptor, el cual activa un evento en el juego) y OnCo-
nicamente por el sonido de una campana que proviene del llisionEnter (cuando choca con un obstculo), que emite un
pueblo ms cercano. Deber salir de all en un tiempo lmi- sonido aleatorio, dependiendo de la fuente activada.
te, esquivando las trampas sin detenerse; de lo contrario,
en poco tiempo escuchar la presencia y persecucin de un 1.3. Enemigo, trampas, contador y fin del juego
enemigo desconocido.
Son los sucesos por los cuales se da por terminado el juego.
2. Diseo
1.3.1. Enemigo
Se plante un juego para plataforma PC, tipo arcade, por
niveles de dificultad, enfocado a un rango de edad entre
trece y veintisiete aos. Tiene mens hablados, para que El enemigo que persigue al jugador durante la partida se com-
pueda ser jugado por personas con discapacidad visual. En pone de una inteligencia artificial que consta de dos estados:
la Fig. 1 se presenta la estructura general del juego, con cada ambulante y persecucin. Cuando el jugador est esttico, el
una de las escenas y las distintas opciones a elegir en cada enemigo lo persigue; cuando el jugador se mueve, el enemigo
men. tambin lo hace, pero este avanza de manera aleatoria por el
escenario. Si el jugador es alcanzado por el enemigo, se dar
por terminada la partida.

1.3.2. Trampas

Son obstculos que, al hacer contacto con ellos, se activan y


generan la terminacin de la partida. Como se muestra en la
Fig. 2, una trampa se constituye de varias zonas: la seccin
A permite que al entrar y salir se reinicie la trampa; la sec-
cin B genera una alerta audible, indicndole al jugador que
est cerca de una trampa y la ubicacin de la misma; esta
depende del ngulo con que entra el jugador a la trampa. La
seccin C da por terminada la partida.

Fig. 1. Diagrama de flujo de pantallas en el juego


Produccin

B. Produccin

1. Programacin

El proyecto fue desarrollado en la plataforma Unity, progra-


mando scripts en C# para cada una de los elementos que
componen el juego; como por ejemplo los mens, persona-
jes, movimientos, trampas, inteligencia artificial del enemi-
go, eventos interactivos, etc. Las interacciones del jugador
con su entorno segn las entradas y los fenmenos indirec-
tamente controlados por l son traducidos en informacin
sonora.

1.1. Elaboracin de scripts para el desarrollo de mens

Aunque El Bosque es un juego que se basa nicamente en so-


Fig. 2. Secciones de una trampa
nidos, cuenta con una interfaz grfica bsica para los mens:
principal, pausa y fin del juego. Los mens tambin actan
Con relacin al nmero de trampas, esta vara segn el nivel
como mens hablados, posibilitando el acceso a personas
de dificultad seleccionado. Hay tres niveles: fcil, medio y
con discapacidad visual e indicando la tecla que deben
difcil; con ocho, catorce y veinticuatro trampas respectiva-
seleccionar de acuerdo a la opcin deseada en cada men.
mente.

PG. 41
AVANCES del audio en Latinoamrica.

1.3.3. Contador

La partida tiene un tiempo lmite de diez minutos. Si el con-


teo llega a cero, el jugador perder.

1.3.4. Fin del juego

Para ganar la partida el jugador tendr que llegar al pueblo,


guiado por el sonido de una campana, y sin haber activado
una sola trampa durante todo el juego, no ser atrapado por
el enemigo y llegar por debajo del tiempo lmite.

2. Produccin de audio

2.1. Grabacin

Se decidi limitar en lo posible el uso de libreras externas,


por lo que se cre un banco sonoro exclusivo para el juego.
Por ende, se realizaron diferentes grabaciones en distintos
lugares. Todas se realizaron con una frecuencia de muestreo
de 44100 Hz y 16 Bits, de acuerdo al estndar de audio pro-
fesional propuesto en el libro rojo (Philips and Sony Corpo-
ration, 1980). Fig. 4. Distribucin esquemtica en el plano horizontal, utilizada
para la grabacin con las cabezas binaurales (Lalwaina, 2015)
2.1.1. Grabacin de efectos
2.1.2. Banco sonoro
La grabacin de efectos se realiz en el estudio A de la
Universidad de San Buenaventura, Medelln. En la Fig. 3 se
Para la grabacin del banco sonoro requerido por el jue-
muestran los dos modelos de cabeza artificial usados, uno
go, se realiz un scouting* de locaciones, entre las cuales
de ellos con torso.
se seleccion el Parque Zoolgico Santa Fe, de la ciudad de
Medelln. Las capturas se hicieron con el prototipo de cabeza
binaural (Fig. 5a), el micrfonosuperdireccional Sennheiser
ME 66 (Fig. 5b) y un par de grabadoras Zoom H4. En este lugar
se logr grabar una gran variedad de animales: mamferos
(ovejas y monos), aves (guacamayas, grullas, patos, loros,
guacharacas, sinsontes, flamencos), y varias cascadas y
fuentes de agua en las que reposan algunos de ellos.

a) b)
Fig. 3. Grabacin de efectos: a) cabeza binaural,
b) cabeza binaural 01 dB con torso

En la Fig. 4 se muestran los ngulos tenidos en cuenta para a) b)


la grabacin. Esto con el fin de tener una cobertura de 360 Fig. 5. Capturas en el zoolgico: a) prototipo de cabeza binaural,
en el plano horizontal (Masiero, 2012). b) micrfonosuperdireccional Sennheiser ME 66.

2.1.3. Ambientes

En la Fig. 6 se muestra la grabacin de ambientes realizada


en el museo El Castillo, ubicado en la ciudad de Medelln,
lugar rodeado de jardines y zonas arboladas. El registro se

* Proceso de anlisis para seleccin de locaciones y escenarios


para la grabacin.

PG. 42
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

realiz en las horas de la madrugada, para evitar el ruido registrados de forma binaural).
producido por el trfico vehicular cercano a este lugar. Los eventos de Unity son emitidos mediante pulsadores, los
cuales reproducen sonidos binaurales grabados en cabezas
artificiales.

El motor de audio de Fmod trabaja mediante eventos, a los


cuales se les puede asignar diferentes propiedades. Estos
eventos se trabajaron en tres formas distintas: la primera,
programacin por ejecucin de eventos y parmetros; la se-
gunda, mediante la activacin de sonidos instantneos con
la funcin PlayOneShot; y la tercera, mediante sonidos es-
tacionarios desde el event_emiter proporcionado por Fmod.
La recreacin del bosque se hace por medio de scatterer
Fig. 6. Grabacin de ambientes sounds. Estos son unos contenedores donde se pueden agre-
gar varios sonidos y configurar su comportamiento a travs
2.1.4. Dilogos de nodos, como random (escoge sonidos aleatoriamente),
modulator (altera el pitch de los sonidos aleatoriamente),
Los mens hablados se grabaron en estudio con el micrfo- attenuator (atena el volumen de los sonidos a partir de un
no de condensador Neumann Kms 105.
determinado umbral que se asigne), entre otros. Por ejemplo,
con cinco cortos sonidos de pjaros, mediante la asignacin
2.2. Msica de nodos, es posible crear varias horas de cantos de muchos
pjaros, emulando una situacin especfica requerida por el
La msica utilizada para el juego fue realizada en Ableton
juego. En la Fig. 8 se hace un esquema del proceso.
Live. Esta solo se reproduce durante el inicio del audiojuego
y no durante la partida, para no sobreponerse a los ambien-
tes y efectos binaurales que transcurren durante el juego.

3. Implementacin de audio

Para el juego se emplearon los motores de audio de Unity y


de Fmod. Ambos constan de parmetros que se encargan de
reproducir y captar los sonidos.

Los sonidos son emitidos por audio sources, que luego


son captados por un audio listener, el cual est adjunto a
la cmara principal y se encarga de mostrar las diferentes
escenas del juego. Fig. 8. Esquema de recreacin del canto de pjaros a travs de un
scatterer sound
Segn la necesidad, en algunos casos se asign al audio
source un audio mixer, que permite aplicar una atenuacin
de volumen, insertar efectos que procesen la seal de audio,
C. Posproduccin
y enviar y devolver (send & return) la seal de un bus a otro.
El Digital AudioWorkstation (DAW) utilizado para la edicin
La Fig. 7 muestra cmo es el enrutamiento de seales de
de sonido del juego fue Reaper. Los ambientes grabados se
audio en Unity.
limpiaron filtrando en algunos casos frecuencias bajas y al-
tas. Las grabaciones en el zoolgico tuvieron mayor trabajo
de edicin, por la gran cantidad de ruido de fondo contenido.
El proceso de edicin fue cuidadoso, para no afectar las dife-
rencias interaurales de tiempo y nivel de las seales binau-
rales, preservando sus condiciones de espacialidad.

Pruebas

En la Fig. 9 se muestra un mapa de todos los elementos que


posee el escenario del juego, distribuidos en lo que fue el
terreno del bosque. En esta etapa el audiojuego adquiere
funcionalidad, para testear y verificar el estado de cada uno
Fig. 7. Enrutamiento de seales de audio en Unity de los eventos interactivos programados.

El audio source cuenta con una propiedad llamada spatial


blend, que establece qu tanto del motor 3D tiene efecto
en este, asignando 0 para que el sonido no sea procesado
(usado para los sonidos grabados binauralmente) y 1 para
espacializarlos (usado para los sonidos que no pudieron ser

PG. 43
AVANCES del audio en Latinoamrica.

a) Fig. 10. Panel de procesamiento: modo desarrollador de Unity


mientras se ejecuta el men principal

La implementacin de grabaciones binaurales, en efecto,


por no tener que ser procesadas, permite aligerar el uso de
la CPU. El procesamiento disminuye con respecto al uso del
motor 3D de Unity y Fmod, dado que estos motores com-
putan las posiciones de la fuente y del oyente, procesan
parmetros como atenuacin por distancia, efecto dopler,
reverberacin, filtros, propagacin, entre otros. Estas herra-
mientas ofrecen muchas posibilidades para el desarrollo de
juegos y son eficaces acsticamente, sin embargo los hacen
computacionalmente ms costosos.
b)
En definitiva se obtuvo un audiojuego que implementa au-
dio binaural. Como consecuencia del efecto crosstalk en
los altavoces estreo convencionales, el cual interfiere con
la reproduccin binaural (Kotorynski, 1990), es necesario el
uso de auriculares para jugarlo. El producto final se presenta
como un ejecutable para plataformas Macintosh y Windows.
El peso final del juego es de 171 MB, se evit usar formatos
de audio comprimidos para garantizar una calidad de audio
mxima; igualmente, al no ser un formato comprimido es r-
pido de reproducir (Trinit, 2009), a costa de ocupar bastante
espacio, pero esto se compensa al no haber almacenamiento
ni procesamiento de grficos.
c)
El banco sonoro resultante est desglosado en doscientos
Fig. 9. Elementos que componen el escenario del juego en Unity: a) veintin archivos de audio en formato wav, a una resolucin
pulsadores, b) trampas y c) obstculos de 44100 Hz y 16 Bits. En su mayora son audios grabados
binauralmente, resultantes de las distintas capturas hechas
III. Resultados tanto en el estudio de grabacin como en exteriores.

El procesamiento de audio se analiz en cuatro casos, to-


IV. Conclusiones
mando como referencia el porcentaje de audio manager, Este tipo de software puede ser implementado en el apren-
como se muestra en la Fig. 10. En primer lugar las escenas dizaje de nios con discapacidad visual. En futuros proyec-
del men que se componen por la interaccin de botones, tos se podra investigar y elaborar softwares orientados en
el men hablado y la msica de fondo; el procesamiento de el desarrollo de estructuras cognitivas de representacin
la CPU en este caso fue de 0.53 ms, donde el audio consu- espacial, a travs de la interaccin con ambientes virtuales
mi el 5.3% del total de procesamiento. A continuacin se basados en sonidos.
evalu el uso de sonidos binaurales mientras se corre juego,
donde el procesamiento de la CPU fue de 1.41 ms y el audio La implementacin de sonido binaural fue una herramienta
idnea para el desarrollo del juego, por su capacidad de ge-
consumi el 2.0% del total de procesamiento. En la tercera
nerar una mayor inmersin y un sentido ms realista de la
parte se evaluaron los sonidos que hacan uso del motor 3D espacializacin. Adicionalmente, esto se potencia con el uso
de Unity, el procesamiento de la CPU fue de 2,30 ms y el au- de tcnicas interactivas de programacin de audio y con las
dio consumi 2.7%. Finalmente se evaluaron los sonidos que intenciones del diseo sonoro, presentndose como alter-
implementan el motor de audio de Fmod, para este caso el nativa en una industria donde el sonido en los videojuegos
procesamiento de la CPU momento fue de 2,52 ms y el audio ha alcanzado un estado de madurez que implica que est
consumi el 3,8% del total de procesamiento. a la paridad de desarrollos grficos. Para esto es necesaria

PG. 44
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

la implementacin de tcnicas de espacializacin sonora en teractivity. Journal of Adolescent & Adult Literacy, vol. 61, n. 7/8,
aras del realismo. julio-agosto, pp. 609-12.

El siguiente paso para el proyecto es hacer pruebas Schell, J. (2008): The art of game design: a book of lenses. Elsevier.
relacionadas con la evaluacin de ciertos parmetros del
juego, como el tiempo lmite establecido para cada nivel de Smith, M. (2011): Simon who? The story behind a playground fa-
dificultad o si el mtodo para la deteccin de las trampas vorite.
es funcional de acuerdo a la interactividad y espacialidad
planteadas como objetivo del juego. Tambin sera Trinit. (2009): Efectos de sonido. En Programacin de videojuegos.
interesante evaluar entre la dos mtodos usados (grabacin Zaragoza: Asociacin de Informaticos de Zaragoza.
binaural y motores 3D) cual presenta mayor nivel de realismo
e inmersin. A nivel personal y como una primera impresin, Velleman, E.; Tol, R. v.; Huibets, S., & H. Verwey (2004): 3D
la grabacin binaural se presenta ms realista, pero tiene un shooting games, multimodal games, sound games and more working
inconveniente que radica en la funcin HRTF, que cambia con examples of the future of games for the blind. En K. Miesenberger,
cada jugador, de manera que las sensaciones que se pueden J. Klaus, W. Zagler, & D. Burger (eds.): Computers helping people
percibir, con una grabacin que introduce una HRTF distinta with special needs. Berln: Springer-Verlag, pp. 257-63.
a la del individuo, pueden ser confusas. Estas pruebas
debern hacerse tanto con personas videntes como con las
que tienen discapacidad visual. Adems, para la evolucin del
juego se debera llevar a plataformas mviles (Android, iOS),
posibilitar otros idiomas, agregar caractersticas adicionales
(como nuevos niveles, escenarios, enemigos y progresin de
habilidades en el personaje) e implementar la combinacin
de sonidos capturados binauralmente con sonidos mono,
que a travs de herramientas de sntesis binaural puedan
ser espacializados en tiempo real.

V. Referencias
Breebaart, J.; & C. Faller (2007): Spatial audio processing: MPEG
Surround and other applications. John Wiley & Sons.

Chion, M. (1994): Audio-Vision: sound on screen. New York: Co-


lumbia University Press, 14th ed.

Kotorynski, K. (1990): Digital binaural/stereo conversion and cross-


talk cancelling. Presented at the 89th convention, 1990 September
21-25, Los Angeles: Audio Engineering Society.

Kurtz, B. (2004): Encyclopedia of arcade video games. Atglen, PA:


Schiffer Publishing.

Lalwaina, M. (2015): Surrounded by sound: how 3D audio hacks your


brain. Obtenido de: http://www.theverge.com/2015/2/12/8021733/3d-
audio-3dio-binaural-immersive-vr-sound-times-square-new-york

Lpez, C. (2008): Breve historia de los mundos virtuales. En AA.


VV.: Arte y arquitectura digital, net.art y universos virtuales. Con-
ferencias presentadas en las Jornadas Internacionales celebradas los
das 5 y 12 de marzo del 2008 en la Facultad de Geografa e Historia
de la Univ. de Barcelona. Barcelona: Univ. de Barcelona, pp. 135-42.

Masiero, B. S. (2012): Individualized binaural technology: measu-


rement, equalization and perceptual evaluation. PhD tesis. Berln:
Logos Verlag.

Miller, R. E. (2006): 5.1 surround and 3D (full sphere with height)


reproduction for interactive gaming and training simulation. Audio
Engineering Society.

Philips and Sony Corporation. (1980): System description compact


disc digital audio (Red book).

Rumsey, F. (2013): Game audio: transforming simulation and in-

PG. 45
AVANCES del audio en Latinoamrica.

PG. 46
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

AVANCES
DEL AUDIO EN
LATINOAMRICA.

MTODOS ALTERNATIVOS DE
ESPACIALIZACIN COMPUESTA
[PARTE 1]

Juan David
PG. 47
Sierra
AVANCES del audio en Latinoamrica.

Juan David Sierra tengan un acercamiento mucho ms consciente a aquello


Facultad de Artes, Pontificia Universidad Javeriana que es el sonido y el papel que juega dentro de la msica y
Bogot, Colombia en ltimas dentro del arte.
jdsierral@icloud.com
Adicionalmente, los procesos tcnicos asociados a la pro-
ResumenEl presente proyecto procura hacer un anlisis de dife- duccin sonora y al procesamiento de seales en pro del
rentes algoritmos de espacializacion para desarrollar mltiples m- arte han tenido grandes desarrollos en diversas ramas; los
todos alternativos de generar posiciones aparentes de fenmenos so- ecualizadores son cada vez mejores y de mayor variedad, los
noros. Sin embargo, ms all de todo el desarrollo investigativo, este compresores son cada vez ms transparentes y con mayor
proyecto representa un esfuerzo por lograr una conjuncin clara en- diversidad colorstica, y as mismo procesos utilizados en la
tre diferentes ramas del conocimiento como la matemtica, la fsica, espacializacin han sufrido desarrollos inimaginables como
el anlisis de seales y sistemas y los lenguajes de programacin en sucede con las reverberaciones tanto algortmicas como de
pro de un objetivo artstico. En ltimas el lector encontrara la des- convolucin. Sin embargo, hay un proceso que se ha mante-
cripcin detallada detrs del desarrollo de una suite de algoritmos nido casi esttico desde el surgimiento del estreo. ste es el
en forma de plug-ins que sirven a un solo propsito. Generar una proceso de panoramizacin o paneo el cual si bien es efecti-
explosin de posibilidades en mezcla a la hora de la manipulacin vo a la hora de localizar una seal en una imagen estreo li-
de la imagen estreo. mitada, es innegable que es un mtodo bastante primitivo si
Palabras clave: Audio 3D, Binaural, Espacializacin, Plug-ins, Sof- se compara con todas los desarrollos en materia de espacia-
tware. lizacin asertiva y natural dentro de la percepcin humana.

AbstractThe present project intends to do an analysis of different En otras palabras, el paneo funciona, pero diferentes estu-
spatialization algorithms in order to develop multiple alternative dios psicoacsticos evidencian que la diferencia de nivel no
methods to simulate apparent positions of sound phenomena. Never- es un parmetro suficiente para hacer creer al cerebro que
theless, beyond the research development, this project represents an una fuente sonora est ubicada en una posicin en especfi-
effort to clearly merge different types of knowledge such as mathe- co. Diferentes marcadores psicoacsticos y la conjuncin de
matics, physics, signal and system analysis, programming langua- los mismos son esenciales para una espacializacin realista.
ges, etc... pointing towards an artistic objective. At last the reader
will encounter a detailed description behind the development of a Sin embargo, no slo no es comn en el mercado un proceso
suite of algorithms presented as plugins for a single purpose: They as, sino que no es solicitado por los ingenieros de mezcla
pursue a burst of possibilities in mixing engineer regarding the ma- en general. De hecho, esto abre las posibilidades a una in-
nipulation of stereo imaging. vestigacin que puede satisfacer un mercado con una clara
Keywords 3D Audio, Binaural, Spatialization, Plug-ins, Software. necesidad tcnica de la cual an no se percata y a la vez
enriquecer las experiencias auditivas de los audio-escuchas
I. Introduccin para forjar mejores procesos de mezcla.

En general el consumo actual de la msica se realiza de una II. Metodologa


manera despreocupada y poco concienzuda y en el mejor de
los casos, si el escucha tiene plena conciencia de la msica La principal propuesta de emulacin ser un algoritmo com-
y el arte que de ella se deriva, es poco frecuente que tenga puesto en el que se encuentren anidadas las mltiples he-
una preocupacin equiparable o si quiera comparable por rramientas de espacializacin en un solo procesador. Sin
obtener un buen sonido dentro de su experiencia auditiva. embargo; para desarrollar este algoritmo, se debe separar
el problema en partes mas pequeas con el fin de resolver,
Ello se evidencia en las claras falencias en el posicionamien- poco a poco, y de manera analtica marcadores psicoacsti-
to de sistemas de reproduccin, en la falta de cuidado con cos diferentes (tales como Diferencias Interaurales de Tiem-
la percepcin espacial dentro de un registro sonoro, en la po (ITD), Diferencias Interaurales de Intensidad (IID), cam-
escasa atencin que se le presta a la calidad de los compo- bios espectrales, reflexiones tempranas y reverberacin) e ir
nentes y equipos de reproduccin en general y en ltimas, moldeando estos anlisis de acuerdo a las necesidades de
a la falta de importancia y credibilidad sobre los sistemas un ingeniero de mezcla.
de reproduccin que ofrecen nuevas y mejores tecnologas
para enriquecer el proceso auditivo como lo son los forma- Con el fin de emular estos marcadores, debe hacerse un pro-
tos multicanal. De hecho, si bien la reproduccin en estreo cesamiento bsico de seal y para ello, ser necesario de-
se ha ganado una gran parte de los audio-escuchas, existen sarrollar algoritmos que permitan determinar todas las va-
nuevas tendencias comerciales y culturales que han lleva- riables a partir de un nmero selecto de parmetros. Esto
do a un incremento en el uso de sistemas monofnicos por resultar en una ecuacin o un conjunto de ecuaciones que
parte de los usuarios promedio. Por ejemplo, sistemas por- sern posteriormente codificadas en un lenguaje de progra-
ttiles que electrnicamente funcionan en estreo pero la macin tal como C++ y as generar un plug-in.
posicin y funcionamiento acstico de los parlantes elimina
totalmente los desarrollos en espacializacin. A. Paneo (IID)
El primer diseo algortmico requerido es el de un simula-
Debido a esto, es importante incentivar el desarrollo de nue- dor simple de IID que ser bsicamente un control de paneo.
vas y mejores tecnologas que acerquen a los consumidores Sin embargo, el paneo requiere cierta comprensin sobre el
de fonogramas a mejores y novedosas experiencias auditivas comportamiento de ondas sonoras reproducidas a travs de
y a la vez procurar la educacin del pblico general para que parlantes. Debido a la expansin tridimensional de las on-
logre valorar dichos procesos. De esta manera buscar que das en un cuarto, no existe una superposicin perfecta de

PG. 48
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

ondas en su interior; a pesar de que la amplitud obtenida a se encuentra en frente del escucha, la diferencia en tiempo
travs de la reproduccin simultnea de un programa comn ser nula. No obstante, habra solo 22 posiciones discretas
a travs de varios parlantes depende en gran medida de la para una fuente sonora virtual con posiciones generadas a
acstica de la sala, en general una ganancia de 3dB (en lugar partir de retrasos. Si se quiere un conjunto mas amplio de
de 6dB esperada de una superposicin perfecta) es comn- posiciones virtuales posibles, entonces se requerira una
mayor frecuencia de muestreo o un mtodo alternativo que
mente aceptada; lo anterior se conoce como la ley del paneo. permita la reproduccin simulada de retrasos mas cortos
Con el fin de simular el comportamiento deseado, se asume que una muestra.
que el eje independiente representa la posicin p de paneo
entre 0 y 1 y por consiguiente la atenuacin a medio camino Dadas las complicaciones en cuanto a la capacidad compu-
(0.5) debera tener un valor de -3dB, es decir, un factor de tacional, se implementaron 3 mtodos de interpolacin. Se
0.747. Para lograr esto, se definen las siguientes funciones ex- utiliz interpolacin lineal, cuadrtica y cbica para definir
ponenciales que determinan la atenuacin: cada muestra en relacin al conjunto correspondiente de
muestras junto a esta. Por ejemplo, en la interpolacin cua-
drtica se usaron 3 muestras para definir cada una de las
muestras interpoladas ubicadas a una fraccin de muestra
de su propia muestra base. A travs del anlisis matemtico
se defini un sistema de ecuaciones donde cada muestra n
Sin embargo, si se requiere otra definicin para la ley del se defini a travs de una ecuacin cuadrtica con coeficien-
paneo, se requiere una generalizacin. Asuma que d es la tes definidos en relacin con las amplitudes de su propio
profundidad del paneo utilizado y s es el exponente de la conjunto de muestras relacionadas.
funcin exponencial requerida para generar la atenuacin
de la profundidad del paneo de la seal. En el caso de una
simple ley del paneo de 3dB, el siguiente algoritmo describe
dicha relacin. -3=20log(0.50.5) y cuando se evala para una
ley del paneo de 6dB la expresin resulta ser -3=20log(0.50.5). Donde son las amplitudes respectivas de las
Por tanto, una expresin general para definir este exponente muestras n, n+1 y n+2 para obtener la n muestra ubicada
a una fraccin de un periodo de muestreo posterior a la
s
posicin de muestreo estndar. Con este mtodo es posible
sera:
definir cualquier retraso requerido, y mas preciso que un re-
traso de una muestra, con el fin de obtener una simulacin
ITD mas precisa a travs de un retraso L-R correlacionado en
el procesador propuesto.

C. R3
El propsito de este procesador ser la eco-localizacin vir-
tual de una fuente sonora en un punto especfico en un es-
pacio tridimiensional a travs de la simulacin de ITDs e IIDs
Por lo tanto, para lograr un paneo adaptativo, la funcin que discutidos anteriormente. Sin embargo, su relevancia reside
define la ganancia de cada canal sera: en la parametrizacin de la realidad de manera tal que las
diferencias de nivel y tiempo sean calculadas a partir de la
definicin de una nica posicin en un espacio tridimensio-
nal. De acuerdo a esto, suponga una posicin P(x,y,z) para
ubicar una fuente puntual en relacin con un escucha ubi-
cado en el origen en R3 de un sistema cartesiano. Se asume
que la posicin de los odos izquierdo y derecho son (0,-r,0)
y (0,r,0) respectivamente. Para evaluar las distancias (dl y dr)
Fig. 1. Posibles Ganancias para distintos ajustes de la ley del paneo. desde la fuente sonora al odo izquierdo y derecho se defi-
nen las siguientes funciones respectivamente:
B. Delay (ITD)
Un algoritmo de retraso sencillo guarda una seal en un bu-
ffer y la lee en un tiempo posterior para volver a reproducir
la seal. Si se asume una seal de entrada x(t) y una seal de
salida y(t) lo anterior se expresara como: A travs de estas distancias es posible calcular el tiempo de
arribo escogiendo una velocidad constante para la propaga-
cin del sonido de 340 m/s

Sin embargo un anlisis simple muestra los inconvenientes


en hacer esto. Si se asume una distancia interaural promedio
de 17cm, el retraso mas largo que se requiere para simular
ITDs ser aquel generado por una fuente sonora colineal a
los odos. En esta posicin la fuente sonora llegar primero
al odo izquierdo y tiempo despus al odo derecho. Si la di-
ferencia en tiempo esta dada por una separacin espacial de
17cm, la misma ser de medio milisegundo. Dicha diferencia
de tiempo con una frecuencia de muestreo de 44.1kHz, im-
plica cerca de 22 muestras. Por otro lado, si la fuente sonora

PG. 49
AVANCES del audio en Latinoamrica.

Esto determinar el tiempo de retraso a cada odo. Adicio- cadores psicoacsticos, en particular aquellos relacionados
nalmente, esta distancia determinar el nivel de la seal con las afecciones espectrales. Esto se representa como si-
despues de recorrer dicha distancia. Asumiendo un patrn gue asumiendo una seal de entrada x(t) y una de salida y(t)
de dispersin esfrico, es posible calcular, a travs de la in-
tensidad acstica inicial, la intensidad en un punto p a una
distancia d. Esto se logra dividiendo la intensidad inicial por
el rea de la esfera de radio d. Dado que la intensidad acsti-
ca puede expresarse como sigue, una simplificacin de toda
la relacin sera la siguiente. En donde h(t) es la respuesta impulso y * denota la convolu-
cin. No obstante, debido a implicaciones computacionales,
la convolucin de seales mayores a 128 muestras se calcula
comunmente a travs del producto de las transformadas de
Fourier tanto de la seal como de la respuesta impulso de-
notado como sigue:

En donde G es la ganancia entre los puntos P y O, Ip e Io son


las intensidades acsticas en el punto de inters y en el ori-
gen del sonido respectivamente, Pp y Po son las presiones donde F-1 denota la transformada inversa de Fourier y X(n),
acsticas en el punto de inters y en el orgen respectiva- H(n) y Y(n) denota las transformadas de Fourier de x(t),
mente, z es la impedancia acstica y r es el radio de la esfe-h(t) y y(t) respectivamente. Finalmente una ultima variable
ra generada por el patrn de dispersin asumido dentro del debe ser incluida para representar la profundidad dentro del
fenmeno. sistema de manera tal que acte como una ganancia para
todo el procesamiento. Debido a esto, se asume un siste-
Finalmente, sustituyendo el radio por la distancia obtenida ma coordenado esfrico donde ( ) representarn la
anteriormente, es posible calcular las ganancias relativas de profundiad, el azimuth y la elevacin respectivamente y x(t)
la fuente sonora a cada odo y y(t) sern la seal de entrada y de salida respectivamente

E. R3-Binaural
As pues, mezclado el resultado para el cclulo de las dis- Finalmente el ltimo procesador ser la conjuncin entre R3
tancias y el clculo de las ganancias otenemos lo siguiente, y Binaural y por tanto ser, de hecho, la salida de R3 convo-
asumiento una seal de entrada x(t) y una de salida y(t): lucionada con la respuesta impulso obtenida de la librera
HRIR usada en Binaural asumiendo una seal de entrada x(t)
y una de salida y(t) como sigue:

Son entonces estas las ecuaciones por medio de las cuales


Sin embargo, esta conjuncin no funciona perfectamente de-
se define la salida del procesador R3.
bido a que R3 se basa en un sistema coordenado rectangular
mientras que Binaural se basa en uno esfrico; por tanto una
D. Binaural transformacin de coordenadas se necesita para mezclar
El procesador binarual, como se espera, utilizar una librera ambas definiciones. Para esto las siguientes equivalencias
de HRTFs (Head Related Transfer Functions) para calcular, a se proponen
travs de convoluciones, las afecciones espectrales de repro-
duccin sonora localizada en relacin a un escucha nico. A
travs de la librera HRIR (Head Related Impulse Responses)
cada combinacin de azimuth y elevacin con una profundi-
dad constante, lo cual da una posicin nica, es asignada a
un par de respuestas impulso experimentalmente obtenidas
de manera tal que la convolucin se calcula con dicha res-
Las cuales a travs de algunas simplificaciones dan la salida
puesta impulso para simular dicha posicin a partir de mar-
de R3-Binaural como sigue:

PG. 50
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

const float* inR = buffer.getReadPointer(1);


float* outL = buffer.getWritePointer(0);
float* outR = buffer.getWritePointer(1);
int bufferSize = buffer.getNumSamples();
for (int i = 0; i < bufferSize; i++) {
outL[i] = Li * pan;
outR[i] = Ri * pAn;}}

Esto da todos los algoritmos necesarios para construir los B. Delay


plug-ins deseados; sin embargo, los algoritmos por s mis- Para la implementacin del delay, se requiere un buffer se-
mos definen la matemtica detrs de los procesos y no cmo cundario para almacenar la seal retrasada; sin embargo,
podra un computador calcularlos. Por esta razn, es necesa- este segundo buffer se reproduce en bucle a medida que
rio el desarrollo de software para escribir cdigo viable para ms y ms muestras son procesadas. Adicionalmente, las
ejecutar dichos algoritmos. variables globales dlyReadPos y dlyWritePos son agregadas
para almacenar la posicin de lectura y escritura respectiva-
III. Programacin e Implementacin mente dentro del buffer del delay. No obstante, estos no son
realmente utilizados dentro del processBlock, en cambio se
Para la implementacin de este algoritmo en forma de plug- utilizan las variables locales drp and dwp y al final se alma-
in, una librera de cdigo llamada JUCE para C++ se requie- cenan sus valores en las variables globales para mantener
re para programar toda la estructura que, ms que proce- los valores hasta la prxima llamada al processBlock.
sar audio, permitir la conformacin de un plug-in VST o AU.
Esta tambin incluir la GUI (Graphic User Interface) y todo void FracDlyAudioProcessor::processBlock
el cdigo necesario para el manejo de la informacin den- (AudioSampleBuffer& buffer) {
tro del plug-in. Sin embargo, para este propsito, solamente int drp, dwp;
el cdigo correspondiente al procesamiento de audio ser int bufSize = buffer.getNumSamples();
int dlySize = dlyBuf.getNumSamples();
expuesto. En especial, la funcin processBlock ser llamada
const float* inL = buffer.getReadPointer(0);
peridicamente para entregar buffers de audio al procesa- const float* inR = buffer.getReadPointer(1);
dor y entregar el buffer procesado cada vez que el host del float* outL = buffer.getWritePointer(0);
plug-in lo solicite. De esta manera, sta ser la funcin prin- float* outR = buffer.getWritePointer(1);
cipal para analizar para entender el cdigo correspondiente const float* dlyDataL = dlyBuf.getReadPointer(0);
a cada procesador. const float* dlyDataR = dlyBuf.getReadPointer(1);
float* dlyWriteL = dlyBuf.getWritePointer(0);
A. Paneo float* dlyWriteR = dlyBuf.getWritePointer(1);
Para el paneo, un cdigo sencillo es implementado; sin em- drp = dlyReadPos;
dwp = dlyWritePos;
bargo, la complejidad residir en cmo definir las ganancias
respectivas. Para hacer esto, una funcin de paneo se define
Finalmente el procesamiento real de los buffers es imple-
para determinar la ganancia en relacin con un valor de 0 a 1
mentado a travs del almacenamiento de la seal de entrada
asignado a la variable pan y diferentes comportamientos se
en un buffer termporal circular. Ntese como Li y Ri son va-
definen dependiendo de si la seal calculada es la del canal
riables locales usadas para definir el valor interpolado y por
izquierdo o el derecho
tanto corresponden directamente a la salida del procesador.
for (int i = 0; i < bufSize; i++) {
float panner (float pan, int chan) {
dlyWriteL[dwp] = inL[i];
if (chan == 0) {
dlyWriteR[dwp] = inR[i];
pan = pow(1-pan, 0.5);
float Li, Ri;
} else if (chan==1) {
pan = pow(pan, 0.5);}
La funcin de interpolacin usa posteriormente un conjunto
return pan;}
de muestras, una parte fraccional del periodo de muestreo y
Posteriormente un valor para Pan (ganancia izquierda) y un tipo de interpolacin para calcular el valor interpolado de
para pAn (ganancia derecha) se definirn a travs de la fun- cada muestra a travs del algoritmo descrito anteriormente
cin anterior
Li = interpol(dlyDataL[drp],
pan = panner(panPotValue, 0); dlyDataL[(drp + 1) % dlyBufSize],
pAn = panner(panPotValue, 1); dlyDataL[(drp + 2) % dlyBufSize],
dlyDataL[(drp + 3) % dlyBufSize], frac, inter);
Finalmente, todo el sistema es multiplicado por la respectiva Ri = interpol(dlyDataR[drp],
seal para los canales izquierdo y derecho dentro del pro- dlyDataR[(drp + 1) % dlyBufSize],
cessBlock. Como se ve, los buffers de entrada y salida (inL, dlyDataR[(drp + 2) % dlyBufSize],
dlyDataR[(drp + 3) % dlyBufSize], frac, inter);
inR) y (outL y outR) respectivamente, tambin se definen en
outL[i] = Li; outR[i] = Ri;
este punto a travs de pointers.
Ntese tambin como drp y dwp recorren de manera circular
void PannerAudioProcessor::processBlock
el buffer temporal redefiniendo sus indices a 0 en cuanto
(AudioSampleBuffer& buffer) {
llegan al lmite del buffer.
const float* inL = buffer.getReadPointer(0);

PG. 51
AVANCES del audio en Latinoamrica.
fracL = fmod(dlyL * getSampleRate(), 1);
if (++drp >= dlyBufSize){drp = 0;} fracR = fmod(dlyR * getSampleRate(), 1);
if (++dwp >= dlyBufSize){dwp = 0;}
dlyReadPos = drp; Ntese como esto define todos los valores requeridos para
dlyWritePos = dwp;} las funciones de interpolacin y por tanto los retrasos as
como las ganancias respectivas de cada canal.
Es importante notar que el tiempo del delay est realmente
definido a travs de la distancia relativa inicial en muestras D. Binaural
entre los ndices drp y dwp. Para el Binarual se debe crear un buffer circular temporal
para almacenar el exceso de muestras y agregar las mismas
C. R3 al prximo processBlock como sigue:
Para R3 el cdigo es basicamente la conjuncin entre el delay
y el paneo explicado anteriormente. Por tanto, la forma ex- for (int i = 0; i < bufSize; i++) {
plicita y concisa de definir el buffer de salida es muy sencilla outL[i] = (outLp[i] + proRdL[i]) / depth;
outR[i] = (outRp[i] + proRdR[i]) / depth;
outL[i] = Li * gainL; outR[i] = Ri * gainR; proWtL[i] = outLp[i + bufSize];
proWtR[i] = outRp[i + bufSize];}
Sin embargo, es importante notar que la relevancia de R3
reside en la parametrizacin de la cantidad de delay y la Ntese como la primera parte de la funcin for define la sa-
proporcin entre las ganancias de cada canal. Todas estas lida inmediata pero la segunda parte escribe el remanente
variables estn definidas en otra funcin llamada en cuanto en otro buffer llamado proBuf cuyo pointer de escritura es
cualquier parmetro dentro del procesador cambie llamada proWt y cuyo pointer de lectura es usado en la primera parte
setParameter. En esta fragmento de cdigo en particular, el como proRd. Toda la definicin de salida es multiplicada por
parmetro modificado es el azimuth azimuParam, no obstan- un factor de profundidad que da la impresin de distancia
te el cdigo se comporta de manera equivalente si cambiase debido a que los HRIR slo nos darn la locacin esfrica a
la elevacin. Aqu la distancia entre las variables dL y dR se un radio comn.
define a travs de la definicin de distancia extraida de la
transformacin entre coordenadas cartesianas a esfricas Finalmente el resto del processBlock se muestra a continua-
cin; ntese como las funciones de convolucin requieren de
void R3AudioProcessor::setParameter las entradas izquierda y derecha (inL, inR), la forma compleja
(int index, float newValue) { de las respuestas impulso (Transformadas de fourier de las
switch (index) { respuestas impulso) previamente calculadas en la funcin
case azimuParam : azimu = newValue; setParameter, y escribe su salida en los arrays locales outLp
dL = sqrt(pow(depth, 2) - y outRp usados posteriormente para definir las salidas del
2 * r * depth * sin(eleva * M_PI / 180) * procesador.
cos (azimu * M_PI / 180) +
pow(r, 2));
void BinauralAudioProcessor::processBlock
dR = sqrt(pow(depth, 2) +
(AudioSampleBuffer& buffer) {
2 * r * depth * sin(eleva * M_PI / 180) *
const float *inL = buffer.getReadPointer(0);
cos (azimu * M_PI / 180) +
const float *inR = buffer.getReadPointer(1);
pow(r, 2));
float *outL = buffer.getWritePointer(0);
float *outR = buffer.getWritePointer(1);
Posteriormente esta definicin ser utilizada para calcular int bufSize = buffer.getNumSamples();
las ganancias de acuerdo a los algoritmos anteriormente de- const float *proRdL = proBuf.getReadPointer(0);
sarrollados const float *proRdR = proBuf.getReadPointer(1);
float *proWtL = proBuf.getWritePointer(0);
gainL = 1/(2 * sqrt(M_PI) * dL); float *proWtR = proBuf.getWritePointer(1);
gainR = 1/(2 * sqrt(M_PI) * dR); nFFT = 2 * bufSize;
float *outLp = new float [nFFT];
Y finalmente, la longitud de los retrasos son tambin defini- float *outRp = new float [nFFT];
convolution (inL, irLc, outLp, nFFT, nFil, nSig);
das a travs de los mismos algoritmos. Note como la variable
convolution (inR, irRc, outRp, nFFT, nFil, nSig);
global c se utiliza como la velocidad de propagacin del so-
nido (340m/s)
La funcin de convolucin es implementada a travs del
producto de las Transformadas de Fourier de la entrada y la
dlyL = dL/c; respuesta impulso tras haberla rellenado con ceros para lo-
dlyR = dR/c; grar una longitud equivalente al tamao del buffer. Todas las
Transformadas de Fourier fueron hechas con una librera C++
Con estas distancias el verdadero retraso es utilizado defini- de LIBROW para procesamiento relacionado con transforma-
do como una diferencia entre muestras y una parte fraccio- das directas como inversas de Fourier
nal definida como sigue:
E. R3-Binaural
Finalmente el plug-in R3-Binaural viene de una conjuncin
dlyReadPosL = (dlyWritePosL - (int)(dlyL
muy simple de todo el cdigo anterior. Por tanto, como fue
* getSampleRate()) + dlyBufSize) % dlyBufSize; mencionado anteriorment , la salida ser la salida de Binau-
dlyReadPosR = (dlyWritePosR - (int)(dlyR ral con las ganancias y los delays generados por R3
* getSampleRate()) + dlyBufSize) % dlyBufSize;

PG. 52
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

en la percepcin de la reproduccin localizada de la fuente


for (int i = 0; i < bufSize; i++) { sonora. Esta es una herramienta particularmente engaosa
outLp[i] = (outLp[i] + proRdL[i]); dado que esta pensada para reproduccin holofonica por lo
outRp[i] = (outRp[i] + proRdR[i]); que a pesar de ser muy precisa en cuanto a la ecolocaliza-
proWtL[i] = outLp[i + bufSize]; cion, puede ser algo perjudicial para el espectro debido al
proWtR[i] = outRp[i + bufSize]; } uso de filtros agresivos por la convolucin con HRIRs. Por
for (int i = 0; i < bufSize; i++) { esto, debe ser usada cuidadosamente durante el proceso de
dly2L[dwpL] = outLp[i]; mezcla.
dly2R[dwpL] = outRp[i];
outL[i] = dlyL[drpL] * gainL; E. R3-Binaural
outR[i] = dlyR[drpR] * gainR;}} Este procesador incluye todos los otros algoritmos por lo
que es la herramienta mas completa para la espacializacion;
Ntese como las definiciones de outLp y outRp usan el mis- sin embargo, la herramienta mas completa no siempre es la
mo buffer para redefinirlo por lo que no se requieren ms mas apropiada para determinadas tareas. Esta es la razn
buffers adicionales entre la salida de Binaural y R3 por la cual se tienen todos los subcomponentes disponibles.
En ultimas R3-Binaural combina todo el desarrollo analtico
IV. Resultados de R3 en relacin a los ITDs y IIDs, as como los logros expe-
rimentales del Binaural a travs de sus HRTFs.
En general, la intencin es la de desarrollar herramientas
comprensivas para que un ingeniero de mezcla pueda sacar V. Conclusiones
provecho de la imagen estreo y de los procesos de espacia-
lizacion multicanal durante el proceso de mezcla. Por con- En ultimas, queda una suite de herramientas enteramente
siguiente la mejor manera de mostrar los resultados es por dedicadas a la espacializacion adems de un plug-in de au-
medio del resultado individual de cada procesador. dio completamente dedicado a la espacializacion multicanal
increbles posibilidades creativas en el mbito de la percep-
A. Paneo cin espacial. Todo esto se da a travs de la implementacin
Aunque un paneo simple es slo una correlacin de ganan- analtica de definiciones bsicas de IIDs y la posibilidad de
cias de tal manera que el nivel no se afecte de manera gene- incluir ITDs y eventualmente quizs la posibilidad de incluir
ral, entender las relaciones apropiadas entre las ganancias afectaciones espectrales a travs de HRTFs. Con suerte, estas
de los canales izquierdo y derecho es crucial. Por esto, la implementaciones podran mejorarse en el futuro y quizs
cuantificacin de la ley del paneo es un proceso fundamen- este tipo de procesamiento pueda impactar directamente en
tal a la hora de desarrollar algoritmos que utilicen un paneo las prcticas de mezcla comunes para mejorar una parte de
simple. As, este procesador tendr como fin ultimo, ser un la mezcla que no ha sido tan desarrollada por ingenieros de
plano base para el resto de los plug-ins. mezcla actuales.

B. Delay VI. Referencias


A pesar de que un retraso simple no es un proceso complejo
en el procesamiento digital de seales, surgen varias com- [1] Ballou, G. (1997). Handbook for Sound Engineers - The New
plicaciones a partir del manejo de la informacin en buffers. AudioCyclopedia (Second Edition ed.).
Adicionalmente, aunque usualmente no se requiere la inter-
polacin en un retraso simple dado que por lo general la [2] Beranek, L. L. (1996a). Acoustics.
precisin de una muestra es suficiente, es importante tener
en cuenta que dicho desarrollo se hizo especficamente para [3] Carrion, A. (1998). Diseno acustico de
generar retrasos de mayor exactitud que pudieran ser usa- espacios arquitectonicos.
dos como herramientas de espacializacion.
[4] William Briggs, L. C., Bernard Gillett. (2013). Calculus for
C. R3 Scientists and Engi- neers.
Aunque los ITDs y los IIDs son usados regularmente durante
procesos de mezcla, usualmente no existe una correlacin [5] William E. Boyce, R. C. D. (2000). Ecuaciones diferenciales y
entre los mismos y una posicin particular en un espacio tri- problemas con valores en la frontera.).
dimensional. Esto ser la funcin principal de este procesa-
dor, presentar los ITDs y los IIDs de tal manera que el usuario
no requiera decidir que diferencia de tiempo y nivel aplicar,
sino solo en donde quisiera escuchar la fuente sonora. Sin
embargo como R3 solo utiliza ITDs y IIDs, las posibilidades
son limitadas debido a que hace falta informacin de otros
marcadores psicoacsticos.

D. Binaural
Este procesador es un algoritmo completamente diferente de
los anteriores, debido a que depende por completo de datos
experimentales. Sin embargo esta informacin ser parti-
cularmente importante para simular la influencia espectral

PG. 53
AVANCES del audio en Latinoamrica.

PG. 54
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

AVANCES
DEL AUDIO EN
LATINOAMRICA.

MTODOS ALTERNATIVOS DE
ESPACIALIZACIN COMPUESTA
[PARTE 2]

Juan David
PG. 55
Sierra
AVANCES del audio en Latinoamrica.

Juan David Sierra en ltimas dentro del arte.


Facultad de Artes, Pontificia Universidad Javeriana
Bogot, Colombia Adicionalmente, los procesos tcnicos asociados a la pro-
jdsierral@icloud.com duccin sonora y al procesamiento de seales en pro del
arte han tenido grandes desarrollos en diversas ramas; los
ResumenEl presente proyecto procura hacer un anlisis de dife- ecualizadores son cada vez mejores y de mayor variedad, los
compresores son cada vez ms transparentes y con mayor
rentes algoritmos de espacializacion para desarrollar mltiples m-
todos alternativos de generar posiciones aparentes de fenmenos so-diversidad colorstica, y as mismo procesos utilizados en la
espacializacion han sufrido desarrollos inimaginables como
noros. Sin embargo, ms all de todo el desarrollo investigativo, este
proyecto representa un esfuerzo por lograr una conjuncin clara en-sucede con las reverberaciones tanto algortmicas como de
convolucin. Sin embargo, el paneo es bastante primitivo
tre diferentes ramas del conocimiento como la matemtica, la fsica,
an para un sistema surround. Su implementacin a travs
el anlisis de seales y sistemas y los lenguajes de programacin en
de tres paneos estreos en conjuncin con un nivel inde-
pro de un objetivo artstico. En ltimas el lector encontrara la des-
pendiente para el canal central muestra que su primitividad
cripcin detallada detrs del desarrollo de una suite de algoritmos
es innegable si se compara con el conocimiento disponible
en forma de plug-ins que sirven a un solo propsito. Generar una
en relacin con la asertividad de la percepcin espacial del
explosin de posibilidades en mezcla a la hora de la manipulacin hombre.
de la imagen surround.
Palabras clave: Audio 3D, Surround, Espacializacin, Plug-ins, En otras palabras, el paneo funciona, pero es evidente que
Software. la diferencia de nivel en la reproduccin es, simplemente,
insuficiente para hacer que el cerebro piense que una fuente
AbstractThe present project intends to do an analysis of different sonora esta, en efecto, ubicada en una posicin especfica.
spatialization algorithms in order to develop multiple alternative Diferentes marcadores psicoacsticos y la precisa conjun-
methods to simulate apparent positions of sound phenomena. Never- cin entre estos son esenciales para una aproximacin rea-
theless, beyond the research development, this project represents an lstica. Sin embargo, la rareza no es lo nico peculiar de estos
effort to clearly merge different types of knowledge such as mathe- procesadores; ms importante an, es el hecho de que estos
matics, physics, signal and system analysis, programming langua- procesadores no estn siendo demandados por ingenieros
ges, etc... pointing towards an artistic objective. At last the reader de mezcla en general. De hecho, esto representa una oportu-
will encounter a detailed description behind the development of a nidad para investigar una necesidad tcnica an desconoci-
suite of algorithms presented as plugins for a single purpose: They da por las personas y entre tanto enriquecer las experiencias
pursue a burst of possibilities in mixing engineer regarding the ma- auditivas de los escuchas para producir mejores obras de
nipulation of surround imaging. arte.
Keywords 3D Audio, Surround, Spatialization, Plug-ins, Software.
II. Metodologa
I. Introduccin Este algoritmo pretende ser un paneo surround altamente
En general el consumo actual de la msica se realiza de una personalizable que no permita el control sobre una distri-
manera despreocupada y poco concienzuda y en el mejor de bucin de niveles a cada parlante en un sistema multicanal
los casos, si el escucha tiene plena conciencia de la msica como los paneos tradicionales, sino que permita controlar
y el arte que de ella se deriva, es poco frecuente que tenga la posicin aparente de una fuente sonora en un sistema de
una preocupacin equiparable o si quiera comparable por reproduccin. Para simular estos marcadores psicoacsticos,
obtener un buen sonido dentro de su experiencia auditiva. se debe recurrir a tcnicas de procesamiento de seales, y
Ello se evidencia en las claras falencias en el posicionamien- para que ello ocurra, ser necesario el desarrollo de algorit-
to de sistemas de reproduccin, en la falta de cuidado con mos que puedan determinar todas las variables necesarias
la percepcin espacial dentro de un registro sonoro, en la para el procesamiento a partir de un nmero selecto de va-
escasa atencin que se le presta a la calidad de los compo- riables. Esto eventualmente dar vida a una ecuacin que
nentes y equipos de reproduccin en general y en ltimas, ser codificada en un lenguaje de programacin como C++
a la falta de importancia y credibilidad sobre los sistemas para construir un VST/AU plug-in.
de reproduccin que ofrecen nuevas y mejores tecnologas
para enriquecer el proceso auditivo como lo son los forma- A. Diseo Algortmico
tos multicanal. De hecho, si bien la reproduccin en estreo Los procesos de espacializacion han sido en general muy
se ha ganado una gran parte de los audio-escuchas, existen diferentes y dependientes de los sistemas de reproduccin
nuevas tendencias comerciales y culturales que han lleva- utilizados; las ideas del vBAP no suelen funcionar tan bien en
do a un incremento en el uso de sistemas monofnicos por otros sistemas ms sencillos como el surround o el Binaural
parte de los usuarios promedio. Por ejemplo, sistemas por- dificilmente se traduce con claridad al estreo. Por esta ra-
ttiles que electrnicamente funcionan en estreo pero la zn es importante desarrollar las mezclas con diversas he-
posicin y funcionamiento acstico de los parlantes elimina rramientas de espacializacion, y en ese sentido, todos los al-
totalmente los desarrollos en espacializacion. goritmos presentados en la parte 1 pueden aplicarse en gran
medida a una mezcla y a un sistema surround. Sin embargo,
Debido a esto, es importante incentivar el desarrollo de nue- surgen importantes complicaciones incluso desde el paneo
vas y mejores tecnologas que acerquen a los consumidores ms sencillo. SurPan, busca plantear un mtodo diferente de
de fonogramas a mejores y novedosas experiencias auditivas lograr el paneo en surround para permitir mayor control so-
y a la vez procurar la educacin del pblico general para que bre el funcionamiento de los IID dentro de este sistema.
logre valorar dichos procesos. De esta manera buscar que
tengan un acercamiento mucho ms consciente a aquello Usualmente, un paneo surround viene de algoritmos en don-
que es el sonido y el papel que juega dentro de la msica y de se conjugan tres paneos tradicionales. Uno frontal, uno

PG. 56
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

trasero y uno frontal trasero se usan en conjunto para definir Figura 2. Campo Escalar 1
el nivel de cada parlante dentro del sistema (adicionalmente
se conjuga tambin un nivel para el fader central y un fader Dadas las posiciones reales de un sistema surround, mlti-
para el canal LFE). Sin embargo, una correlacin inversa no ples funciones como esta podran ser desplazadas a las po-
es posible en un sistema as. Esto significa que empezando siciones de los parlantes con el objetivo de obtener control
con estos cuatro valores (los tres paneos tradicionales y el sobre los parlantes en estas posiciones.
valor del fader del canal central) es bastante difcil entender
en dnde, con exactitud, ser percibida la fuente sonora. Debido a que estas posiciones corresponden a puntos sobre
una misma circunferencia pero a diferentes ngulos, estos
Para resolver esto, una aproximacin radicalmente diferente desplazamientos podran ser definidos en relacin con las
se requiere. Este algoritmo se basa en la posicin que pre- posiciones en coordenadas polares para hacerlas depen-
tende simular. As, para definir los parmetros de espaciali- dientes de los ngulos mismos.
zacion se utiliza un campo escalar para mostrar la relacin
entre el nivel de un parlante en el sistema en relacin con
la fuente sonora virtual que se pretende espacializar. Evi-
dentemente esta relacin implica que si la fuente sonora se
encuentra exactamente encima del parlante, la ganancia del Para un sistema surround, los parlantes se distribuyen como
mismo debera ser unitaria (0dB) y en cuanto se empieza a sigue: (Ballou, 1997):
alejar de la posicin del parlante la ganancia debera decaer De manera correspondiente, las posiciones estn definidas
suavemente de manera concntrica en relacin con el par- en coordenadas polares como sigue:
lante mismo.

Esto es de alguna forma similar a lo que ocurre en una distri-


bucin normal o gaussiana en donde el centro de un numero
de muestras tiene amplitud mxima y a medida que el centro
se aleja, al amplitud decae de manera similar a una curva
exponencial cuadrtica como lo muestra la siguiente figura.
(William Briggs, 2013).

Figura 1. Distribucin Normal Figura 3. Parlantes en un sistema Surround

Sin embargo, para este caso particular, la expansin en R2 TABLA I


de una distribucin es requerida. Esto generara un campo
escalar z definido en relacin a posiciones xy y dentro de un
NGULOS EN UN SISTEMA SURROUND
sistema cartesiano; esto significa que cada dupla x y y defi-
nen un valor de altura z as:

Y por lo tanto los desplazamientos reales de las funciones


estaran definidos como sigue:

PG. 57
AVANCES del audio en Latinoamrica.

Figura 4. Campo Escalar 2

Debido a la alta proximidad entre los parlantes frontales en


un sistema surround, una ponderacin horizontal (o si se
quiere tangencial) de las pendientes obtenidas de cada fun-
cin sera deseable. Esto permitira controlar el exceso de Figura 6. Campo Escalar 4
nivel al generarse un movimiento en el eje xy la falta del mis-
mo al generarse un movimiento en el eje y. Adicionalmente, Finalmente esta funcin corresponde a la ganancia aplica-
una ganancia general sera deseable en caso de que el nivel da a cada uno de los parlantes si alguien esta tratando de
general termine siendo demasiado o muy poco. Esto se intro- generar una fuente sonora aparente en un nico punto (x,y).
duce como sigue: An cuando la ganancia de cada parlante debe ser calculada
de manera independiente es importante entender las rela-
ciones entre todos los parlantes y por lo tanto el conjunto
completo de ganancias por canal para un sistema surround
sera como sigue:

Basado en esto, una correlacin entre las variables obteni-


das y los parmetros fsicos sera posible. Gracias a la mis-
ma, es evidente que a corresponde a una ganancia general;
sin embargo, otras variables no son tan evidentes. b deter-
Figura 5. Campo Escalar 3
mina las pendientes de las funciones y por lo tanto determi-
na la distancia efectiva para cada parlante. Debido a esto, a
No obstante, ahora es obvio que lo que inicialmente eran
medida que el valor de b disminuye (siendo siempre mayor
crculos como curvas de nivel de las funciones, ahora son
a 1) sera cada vez ms fcil para un parlante tener seal en
elipses que deberan ser rotadas de manera que apunten de
comn con el resto de los parlantes haciendo de este pa-
alguna manera al centro del crculo. Esto se logra generando
rmetro algo similar al factor de divergencia encontrado en
una rotacin de cada parlante en relacin con el ngulo que
paneos surround tradicionales. Por otro lado, d representa
define su posicin dentro del crculo con la siguiente tcnica
la separacin entre los parlantes y por lo tanto representa la
de rotacin axial:
separacin entre las seales mismas. Esto hace que d, de al-
guna manera, sea una funcin inversa a lo que la divergencia
representa pero de una manera ms general.

Lo que este algoritmo permite, eventualmente, es el posicio-


namiento de una fuente en surround de una manera precisa
Finalmente la funcin rotada y transformada se ve as: en relacin con la percepcin auditiva. Sin embargo, su ver-
dadera fortaleza viendo del hecho de que es completamen-

PG. 58
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

te independiente de un sistema surround como tal. As, es for (int i = 0; i < bufSize; i++)
relativamente sencillo trasladar la idea de este algoritmo a {
cualquier otra configuracin de parlantes (inclusive configu- input = in[i];

raciones no co-planares de parlantes).
outL[i] =
input * gainL * gain * proximity ;
Finalmente es importante agregar un factor de proximidad outR[i] =
para incrementar la ganancia a medida que el sonido se input * gainR * gain * proximity ;
acerque al centro del crculo que es en donde en ltimas se outC[i] =
generara la percepcin. Esto se hace incluyendo una ltima input * gainC * gain * proximity ;
funcin al centro del crculo pero con mucha menor pen- outLs[i] =
diente con el objetivo de modificar el sistema completo. input * gainLs * gain * proximity ;
outRs[i] =
input * gainRs * gain * proximity ;
B. Programacin e Implementacin outLfe[i] =
Para la implementacin de este algoritmo en forma de plug-
input * gainLfe * gain;
in, una librera de cdigo para C++ se requiere para programar
} }
toda la estructura que, ms que procesar audio, permitir la
conformacin de un plug-in VST o AU. Esta tambin inclui-
Finalmente cada una de los valores de las salidas se calculan
r la GUI (Graphic User Interface) y todo el cdigo necesario
a travs del producto de la entrada con la ganancia general,
para el manejo de la informacin dentro del plug-in. Sin em-
bargo, para este propsito, solamente el cdigo correspon- la ganancia particular de cada canal y el factor de proximi-
diente al procesamiento de audio ser expuesto. Sin embar- dad. Sin embargo, la parte compleja resulta de calcular las
go, es importante notar que dicha librera ser JUCE debido a ganancias de cada canal a travs del campo escalar propues-
que permitir un procedimiento de seteo sencillo e incluir to anteriormente durante el diseo algortmico. Estas ganan-
todas las clases necesarias para este propsito. En especial, cias discretas sern calculadas con el siguiente cdigo.
la funcin processBlock ser llamada peridicamente para
void SurpanAudioProcessor::setParameter
entregar buffers de audio al procesador y entregar el buffer
(int index, float newValue)
procesado cada vez que el host del plug-in lo solicite. De {
esta manera, esta ser la funcin principal para analizar para switch (index)
entender el cdigo correspondiente a cada procesador. {
case bypassParam : bypass = newValue; break;
Debido al hecho de que el procesador surPan slo toma en case gainParam : gain = newValue; break;
case xParam : x = newValue;
cuenta las ganancias relativas entre los diferentes parlantes
gainL = gainPerChan(x, y, slope, separ,
de un sistema surround, el processBlock se ve reducido sim- angL_, angL, radT, radN);
plemente a modificar las amplitudes de las seales entran- gainR = gainPerChan(x, y, slope, separ,
tes; as, slo se requiere calcular dichos valores de ganancia angR_, angR, radT, radN);
para cada parlante cada vez que x o y cambian y por lo tanto gainC = gainPerChan(x, y, slope, separ,
estos valores no sern calculados para cada muestra sino, en 0 , angC, radT, radN);
gainLs = gainPerChan(x, y, slope, separ,
un sentido general, cada vez que un parmetro cambia. Esto
angLs_, angLs, radT, radN);
da la siguiente versin simplificada del processBlock gainRs = gainPerChan(x, y, slope, separ,
angRs_, angRs, radT, radN);
void SurpanAudioProcessor::processBlock proximity = gainPerChan
(AudioSampleBuffer& buffer, (x, y, 1.1, 0, 0, 0, 25, 25);
MidiBuffer& midiMessages)
{ Ac, evidentemente la funcin gainPerChan es la clave para
const float* in = buffer.getReadPointer(0); cada ganancia. Debido a esto, dicha funcin se muestra a
float* outL = buffer.getWritePointer(0); float* outR continuacin:
= buffer.getWritePointer(1); float* outC
= buffer.getWritePointer(2); float* outLfe = bu- double gainPerChan
ffer.getWritePointer(3); float* outLs = (double x, double y, double slope, double separ,
buffer.getWritePointer(4); float* outRs = double ang_, double ang, double radT, double radN)
buffer.getWritePointer(5); int bufSize = {
buffer.getNumSamples(); double gainPerChan =
float input; (pow(slope,
(((- pow((x * cos(ang_) - y * sin(ang_)) -
separ * cos(ang - ang_), 2)) /
En este ultimo, los arrays requeridos son declarados; no obs- (pow(radT, 2)))
tante, en esta situacin en particular, slo existe una entrada - pow((x * sin(ang_) + y * cos(ang_)) -
monofnica y una salida surround. Debido a esto se requie- separ * sin(ang - ang_), 2) /
re de una variable de entrada tipo float que almacene tem- (pow(radN, 2)))));
poralmente cada muestra proveniente del buffer entregado return gainPerChan; }
por el host. Esto es particularmente importante porque si
alguna de las salidas se define con base al buffer de entrada La anterior corresponde con lo que en el diseo algortmico
directamente, esta definicin cambiara prematuramente la era el desarrollo de una distribucin normal en R2 para de-
entrada debido a que dichos buffers estarn funcionando a terminar la ganancia de cada parlante.
travs de pointers y por lo tanto la primera definicin de la
salida del primer canal destruira toda la informacin nece- En esta funcin, los parmetros separ y slope el conjunto
saria para calcular el resto de las salidas. especfico de ngulos interactan resultando en un compor-

PG. 59
AVANCES del audio en Latinoamrica.

tamiento singular del parmetro de ganancia para cada par-


lante.
IV. Conclusiones
Al final, queda un plug-in de audio completamente dedica-
do a la espacializacin multicanal con inmensas posibilida-
proximity =
des creativas. Todo esto se da a travs de la implementacin
gainPerChan (x, y, 1.1, 0, 0, 0, 25, 25);
analtica de definiciones bsicas de IIDs y la posibilidad de
incluir ITDs y eventualmente quizs la posibilidad de incluir
Finalmente, el factor de proximidad es calculado a travs de
afectaciones espectrales a travs de HRTFs. Con suerte, estas
la misma funcin dndole valores especiales que le permitan
implementaciones podran mejorarse en el futuro y quizs
servir de ponderacin general del sistema en relacin con el
este tipo de procesamiento pueda impactar directamente en
centro del crculo de un sistema surround. Adicionalmente,
las prcticas de mezcla comunes para mejorar una parte par-
una segunda ganancia general se implementa para permitir
ticular de la mezcla que no ha sido tan desarrollada por los
que el usuario pueda compensar excesos o escasez de nivel
ingenieros de mezcla actuales.
para ciertas configuraciones del sistema.

En general, la manera ms simple de entender el proceso V. Referencias


establecido por SurPan corresponde a designar a cada par- [1] Ballou, G. (1997). Handbook for Sound Engineers - The New
lante una ganancia especfica correspondiente a la altura de AudioCyclopedia (Second Edition ed.).
un punto en R2 debido a la influencia de una funcin senci-
llas asignada a cada parlante (esto significa el montculo [2] Beranek, L. L. (1996a). Acoustics.
correspondiente a la posicin de cada parlante). Lo ltimo
debe computarse con la altura obtenida debido a la proximi- [3] Carrion, A. (1998). Diseno acustico de
dad al centro del plano cartesiano XY debido a que ste re- espacios arquitectonicos.
presentar la ganancia general calculada automticamente.
Finalmente una ltima ganancia se aplica dependiendo de [4] William Briggs, L. C., Bernard Gillett. (2013). Calculus for
las necesidades del usuario. Scientists and Engi- neers.

[5] William E. Boyce, R. C. D. (2000). Ecuaciones diferenciales y


problemas con valores en la frontera.).

Figura 7. Campo Escalar Representativo de los parlantes en un sis-


tema Surround

III. Resultados
En general, la intencin es la de desarrollar herramientas
comprensivas para que un ingeniero de mezcla pueda sa-
car provecho de los procesos de espacializacin multicanal
durante el proceso de mezcla. SurPan se presenta como un
punto de partida para esto debido a que slo concierne a
las diferencias Interaurales de intensidad; sin embargo, tiene
suficiente potencial para poder manipular otros marcadores
psicoacsticos. Adicionalmente, es extremadamente impor-
tante notar que si bien SurPan fue diseado para sistemas
surround, algortmicamente es perfectamente transferible a
sistemas ms grandes como VBAP o Ambisonics. Por esta ra-
zn, SurPan es especialmente importante en plantear bases
para futuros desarrollos en el campo. Finalmente, representa
una ruptura del paradigma del paneo en sistemas surround
implementado un paneo real en R2 y no una versin estirada
de un paneo lineal como ha pasado hasta ahora.

PG. 60
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

AVANCES
DEL AUDIO EN
LATINOAMRICA.

CRITERIA: MEDICIN DE
RESPUESTA AL IMPULSO Y
OBTENCIN DE PARMETROS
ACSTICOS

Yonny Quiceno / Alejandro Mejia / Juan F.Londoo / Antonio Escamilla


PG. 61
AVANCES del audio en Latinoamrica.

Yonny Quiceno*, Alejandro Mejia*, Juan F. Londoo*, Antonio


Escamilla** La respuesta al impulso, de forma general, hace referencia a
*Facultad de Ingenieras, Universidad San Buena- la reaccin de un sistema dinmico en funcin del tiempo,
ventura, Medelln, Colombia en respuesta a una excitacin externa. Matemticamente,
su importancia reside en que un impulso, modelado como
**Escuela de Ingenieras, Universidad Pontificia una funcin Delta de Dirac, contiene partes iguales de
Bolivariana, todas las posibles frecuencias de excitacin. Razn por la
Medelln, Colombia cual la respuesta al impulso define el comportamiento de
yonnyquiceno@gmail.com un sistema lineal e invariante en el tiempo en funcin de la
alejo_k28@hotmail.com frecuencia, caracterizndolo por completo. En el caso de una
juanlondono6@gmail.com sala, a partir de la respuesta al impulso, se puede obtener
antonio.escamilla@upb.edu.co la curva de decaimiento energtico y con ella obtener los
parmetros acsticos que caracterizan el lugar, como lo son:
*
ResumenEn este artculo se presenta Criteria, un software de la sonoridad, la claridad, el tiempo de reverberacin, entre
cdigo abierto para la medicin de respuestas al impulso y el clcu- otros [1].
lo de parmetros acsticos en salas de concierto y propsito gene-
ral, soportado en la norma ISO 3382-1:2009 y desarrollado en C++ El desarrollo del software de medicin de parmetros acsticos
usando el Framework JUCE. Se exponen los objetivos, la metodolo- en salas, parte de un anlisis de diferentes funcionalidades
ga para el desarrollo y las caractersticas de la aplicacin. Se dis- del software comercial disponible y del estado del arte en
cute sobre algunas de las consideraciones de diseo mas relevantes y esta rea [2] [3]. La investigacin y el estudio de referentes
como estas afectan los clculos de los parmetros acsticos; adems tericos, permitieron identificar las diferentes etapas de
se evala el desempeo del software comparando los resultados con procesamiento que componen el software segn lo sugieren
otros software comerciales. los estndares ISO 18233:2006 e ISO 3382-1:2009, para la
obtencin de la respuesta al impulso [4] y para el clculo de
Palabras clave Clculo de parmetros acsticos, deconvolucin, parmetros acsticos, respectivamente. Y posteriormente,
medicin de respuesta al impulso, tiempo de reverberacin. desarrollar de forma modular, algoritmos para la generacin
de la seal de excitacin, la obtencin de la respuesta al
Abstract This article presents Criteria, an open source software impulso, el filtrado por bandas de octava y tercio de octava, el
for the measurement of impulse responses and room acoustic para- clculo de la curva de decaimiento y el clculo de parmetros
meters in concert halls and ordinary rooms, based in the ISO 3382-1: acsticos. En este documento, se detalla la metodologa para
2009 standard and programmed in C++ using the JUCE framework. el desarrollo, implementacin e integracin de mdulos y
The objectives, methodology for development and software charac- algoritmos; adems se muestran resultados y conclusiones
teristics are exposed. It discusses some of the most relevant design que evidencian un desempeo muy similar a otros software
considerations and how these affect the acoustic parameters measu- de amplio renombre comercial como Dirac y Aurora.
rement. In addition, software performance is evaluated by compa-
ring the results with other commercial software. II. Desarrollo Metodolgico
Keywords Impulse response measurement, deconvolution, acoustic Los objetivos de diseo de una herramienta de software para
parameters measurement, reverberation time. el calculo de parmetros acsticos, nacen de un anlisis del
contexto local de la industria acstica y de la evaluacin de
I. Introduccin las caractersticas de varios de los sistemas de medicin de
Todo recinto cerrado tiene asociado un conjunto de par- respuestas al impulso que han sido desarrollados con el
metros acsticos objetivos medibles, que permiten su ca- mismo fin. El primer objetivo es desarrollar una herramien-
ta de cdigo abierto, multiplataforma, que pueda ser fuen-
racterizacin y estn estrechamente ligados a la percepcin
te de investigacin en reas como el procesamiento digital
subjetiva de la calidad acstica. El tiempo de reverberacin de seales y la acstica arquitectnica. Adicionalmente, que
ha sido uno de los parmetros acsticos ms relevantes para pueda desarrollarse de forma modular para expandir su
caracterizar y acondicionar un recinto, sin embargo, existen funcionalidad de forma sencilla y generar cdigo reutilizable
otro tipo de caractersticas dentro una sala que tambin per- en proyectos que quieran seguir esta misma filosofa.
miten analizar las cualidades acsticas del recinto, como lo
son: las relaciones de energa, relaciones de energa lateral, Un segundo objetivo es disear un software que cumpla con
ruido de fondo, entre otros. las normativas internacionales ISO 18233:2006, ISO 3382-
1:2009 e IEC 61260-1:2014 [5], de forma que los resultados
La norma ISO 3382-1:2009, especifica diferentes mtodos para que se obtengan puedan ser equiparables con software
medir el tiempo de reverberacin en recintos. Es un estndar estndar en la industria y ser usados de forma confiable
que aplica para auditorios, salas de conciertos, recintos para por consultores acsticos, investigadores y estudiantes. Por
la palabra y la msica. Describe tambin el procedimiento de ltimo, como tercer objetivo, disear una herramienta con
pocas restricciones de hardware, para facilitar el uso de
medicin, los equipos necesarios y el mtodo para evaluar
interfaces de audio de propsito general, y con una interfaz
los datos. Adems, se da informacin de la obtencin de los de usuario intuitiva, fcil de usar y grficamente simple y
parmetros acsticos del recinto que son derivados de la agradable.
respuesta al impulso [1].
A. Generalidades
* * Y. Quiceno, A. Mejia y J. Londoo, egresados de la Universi-
dad de San Buenaventura, Medelln. Carrera 56C N 51-110. El software est diseado para ser multiplataforma y se codi-
fic usando el lenguaje de programacin C++ y el framework
**A. Escamilla, Profesor Asociado en la Universidad Pontificia Bo- JUCE, el cual es un amplio, extenso y potente conjunto de
livariana, Medelln. Circular 1 No. 70-01. (e-mail: antonio.escami- herramientas para la creacin de aplicaciones de audio, pu-
lla@upb.edu.co) blicado bajo Licencia Pblica GNU [6]. Las clases que confor-

PG. 62
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

man la librera comprenden modelos para la integracin de


procesos que van desde la construccin de interfaces gr- B. Medicin con seales de barrido sinusoidal
ficas hasta la deteccin de hardware para aplicaciones de
audio. Los sistemas modernos de medicin de respuestas al impul-
so en recintos acsticos estn basados en usar, como entra-
Para el clculo de parmetros acsticos, la aplicacin per- da del sistema, una seal de prueba conocida; y con esta,
mite importar una respuesta al impulso previamente graba- medir la respuesta de la sala [7] [8] [9]. Las condiciones para
da o realizar una medicin de respuesta al impulso a partir la eleccin de la seal de prueba, segn se menciona en [2],
de configurar en primera instancia el hardware de captura deben ser: La perfecta reproducibilidad de la seal, la capa-
y reproduccin de audio y luego los parmetros de la seal cidad de maximizar la relacin seal a ruido en la respuesta
de prueba, como se muestra en la Fig. 1. En cualquier mo- al impulso y permitir la eliminacin de artefactos no-lineales
mento, el usuario puede escoger entre filtros con resolucin que puedan aparecer en la respuesta al impulso. Tradicio-
por octava o tercio de octava, para anlisis en funcin de la nalmente, se han usado 2 tipos de seales: Peridicas pseu-
frecuencia y calcular los parmetros temporales: DT, T10, T20, doaleatorias con prcticamente las mismas propiedades es-
T30 y los parmetros energticos: C50, C80, D50, STearly, STlate, Ts tocsticas del ruido blanco, conocidas como seales MLS y/o
y SNR, segn como estn definidos en la norma ISO 3382- seales de barrido sinusoidal de frecuencia cambiante en el
1:2009, ver Fig. 2. Adems, se pueden exportar los datos de tiempo (Sine Sweep).
los parmetros acsticos calculados como archivo de texto
para facilitar su anlisis por fuera de la aplicacin. La eleccin de seales MLS, en el contexto de mediciones de
respuestas al impulso en recintos acsticos, ha mostrado que
A continuacin se desglosa de forma detalla cada uno de los incluso bajo condiciones ptimas (suponiendo invarianza en
mdulos que componen el sistema de medicin, donde se el tiempo, ruido de fondo bajo, y promediando varias medi-
exponen las consideraciones de diseo mas relevantes en ciones sincronizadas) no es posible obtener una respuesta
cada etapa. al impulso con buen rango dinmico [3]. Autores como Farina
[10] coinciden en que en mediciones que usan ruido como
seal de excitacin, la distorsin producida principalmente
por el altavoz se dispersa por toda la respuesta al impulso y
que a pesar de que la distorsin se puede reducir con menor
nivel en la seal, esto produce ms ruido de fondo que con-
tamina el resultado.

Por otro lado, la tcnica desarrollada por [10] de usar seales


Sine Sweep para medir respuestas al impulso, permite ob-
tener la respuesta al impulso lineal del sistema y separar la
respuesta asociada a la distorsin armnica. El uso de sea-
les de barrido sinusoidal permite excluir la distorsin usan-
do seales de longitud mayor a la respuesta al impulso del
recinto, quedando como nica limitacin para obtener una
buena relacin sealruido, el ruido de fondo en el lugar [3].
Fig. 1. Interfaz grfica. (a) Configuracin del dispositivo de audio,
(b) Parmetros de la seal de prueba. Como resultado del anterior anlisis, se decidi usar seales
Sine Sweep para la excitacin del recinto. La interfaz de usua-
rio permite escoger entre seales sinusoidales de barrido li-
neal o logartmico, definir su duracin e ingresar un tiempo
de reverberacin estimado en el recinto para optimizar el
tiempo de captura de la respuesta del sistema. El barrido en
frecuencia, que debe abarcar todo el rango audible (20Hz-
20KHz), se extiende en ambos extremos para minimizar la
influencia de los transitorios introducidos, tanto al comienzo
como al final, por la funcin matemtica para el calculo de la
seal sinusoidal.

C. Obtencin de la respuesta al impulso


Para la obtencin de la respuesta al impulso, la norma ISO
18233:2006, describe la metodologa de las que son consi-
deradas nuevas tcnicas de medicin en edificaciones por
medio del procesamiento digital de seales. Segn el tipo de
seal de excitacin, MLS o Sine Sweep, la tcnica de proce-
samiento que relaciona la seal de excitacin y la respuesta
de la sala, difiere. Estos mtodos son alternativos a los ex-
puestos en la norma ISO 3382-1:2009, y plantean procesos
Fig. 2. Interfaz grfica mostrando los resultados del clculo de par- indirectos para la obtencin de la respuesta al impulso por
metros acsticos. (a) T10, (b) C80. medio de operaciones como la transformada de Hadamard,

PG. 63
AVANCES del audio en Latinoamrica.

en el caso de seales MLS; y la deconvolucin, si se usan se- Al implementar filtros IIR se obtienen pendientes ms pro-
ales de prueba Sine Sweep [4]. nunciadas y mayor atenuacin en comparacin al uso de fil-
tros no recursivos (FIR). Adicionalmente, los filtros IIR per-
Para el caso del uso de seales de excitacin del tipo barrido miten implementaciones ms eficientes, con retrasos ms
sinusoidal, la obtencin de la respuesta al impulso se obtie- cortos y menos memoria. En el caso particular de un filtro
ne por medio de una deconvolucin directa o por medio de de orden 10, la selectividad de cada banda permite superar
una deconvolucin por divisin espectral. Se decidi optar las especificaciones de la norma para filtros clase 0, como se
por el mtodo de deconvolucin por divisin espectral para
muestra en la Fig. 4.
el desarrollo del software, dado que, a diferencia del mto-
do de deconvolucin directa, implica nicamente el uso de
transformadas rpidas de Fourier sobre la salida y la entra-
da del sistema, operacin que se puede realizar con mucha
eficiencia por medio del uso de la librera FFTW [11]. Por otra
parte, la deconvolucin directa requiere el clculo adicional
de un filtro inverso, y el calculo de su convolucin con la se-
al capturada, lo cual se traduce en mayor tiempo de proce-
samiento y mayor complejidad de implementacin.

A manera explicativa, la Fig. 3 presenta el diagrama de blo-


ques del algoritmo que se implement para la obtencin de
la respuesta al impulso. En la tcnica de la divisin espectral,
la seal de excitacin y la respuesta de la sala, son transfor-
madas al dominio de la frecuencia, por medio de la trans-
formada rpida de Fourier. Luego el espectro complejo de la
respuesta de la sala se divide por el espectro complejo de
la seal de excitacin. Para obtener nuevamente una seal
en el dominio del tiempo, se usa la transformada inversa de
Fourier y se obtiene la respuesta al impulso, en donde la Fig. 4. Atenuacin de un filtro de orden 6 y de orden 10 en compara-
segunda mitad de la seal, correspondiente a tiempos de cin al lmite de atenuacin para un filtro de clase 0.
arribo negativos puede ser descartada. Como se describe en
[3] este mtodo tambin puede ser usado para remover los Por medio de la herramienta para el diseo y anlisis de
efectos de la distorsin armnica en el canal de excitacin. filtros de MATLAB, llamada Filter Design & Analysis Tool, se
obtienen los coeficientes de la funcin de transferencia de
los filtros, para cada banda de frecuencia. Pensando en la
eficiencia de su implementacin, se decide reemplazar cada
funcin de transferencia H(z) de orden 10, por 5 secciones
de segundo orden en serie, ya que los filtros IIR de orden
superior pueden ser muy sensibles a la cuantizacin de sus
coeficientes, y volverse inestables fcilmente. Este hecho es
un problema mucho menos frecuente con filtros de segundo
orden, por lo tanto, los filtros de orden superior se imple-
mentan tpicamente de esta manera, segn se muestra en
(2).
Fig. 3. Diagrama de bloques de deconvolucin por divisin espectral.

D. Filtros por bandas de octava y tercios de octava

Para el diseo e implementacin de un banco de filtros pa-


sa-banda por octava y/o tercio de octava, la norma IEC 61260- E. Curva de decaimiento energtico
1:2014 proporciona informacin en relacin a los requisitos
especficos de rendimiento para filtros anlogos y digitales. La curva de decaimiento energtico es una curva que mues-
De forma concreta, se definen frecuencias centrales, ancho tra cmo decae la energa del recinto en funcin del tiempo.
de banda, atenuacin del filtro y frecuencias de corte para la Esta curva es obtenida por medio de la integral inversa de
implementacin de filtros digitales de clase 0, 1 o 2. A partir Schroeder, que no es otra cosa que la integracin inversa de
de las especificaciones dadas por la norma sobre filtros cla- la respuesta al impulso al cuadrado, como se indica en (3).
se 0, se disea un banco de filtros pasa-banda de respuesta
al impulso infinita (IIR) y de orden 10, cuya ecuacin en dife-
rencias se muestra en (1).

Ante condiciones de ruido de fondo alto durante la medicin


de la respuesta al impulso, es probable la obtencin de par-

PG. 64
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

metros acsticos errneos, que se asocian a inconvenientes el que fue evaluada la tasa de decaimiento energtico por
en el procedimiento del clculo de la curva de decaimiento unidad de tiempo, con la que luego se evala para cada pa-
energtico. Situacin que hace necesaria la utilizacin de al- rmetro temporal, un hipottico decaimiento de 60dB [1].
gn mtodo que minimice la influencia del ruido de fondo. Para el clculo de los parmetros de criterio energtico (C50,
Segn la norma ISO 3382-1:2009, existen dos mtodos que C80, D50, STearly, STlate, Ts) se realiz un algoritmo que utiliza
minimizan la influencia del ruido capturado en la respuesta las respuestas al impulso previamente filtradas, por bandas
al impuso. Uno de estos mtodos sugiere que, cuando el ni- de octava o tercio de octava, y calcula las relaciones ener-
vel de ruido de fondo es conocido, el lmite inicial t_1 para gticas segn las ecuaciones de la norma ISO 3382-1:2009.
En este clculo, es vital definir con mucha precisin los lmi-
la integral inversa de Schroeder, es la interseccin entre una tes de integracin, (segn la definicin de cada parmetro
lnea horizontal a travs del ruido de fondo y una lnea que energtico), en relacin a la informacin de la respuesta al
representa la pendiente del decaimiento de la respuesta al impulso comprendida entre la posicin donde la envolvente
impulso al cuadrado en escala logartmica. La integracin in- de la seal sobrepasa significativamente el nivel del ruido
versa se lleva acabo entonces segn (4). de fondo y la posicin donde la envolvente de la seal de-
cae debajo del nivel del ruido de fondo. Dicho procedimiento
permite que las integrales para el clculo de los parmetros
energticos, se hagan sobre el rango adecuado de datos. Lo
que garantiza que slo se tengan en cuenta las contribucio-
nes energticas de la respuesta al impulso, y no las del rui-
do de fondo. Adems, permite que la curva de decaimiento
energtico tenga una compensacin por ruido que permite
el clculo ms preciso de los parmetros temporales, segn
lo establecido en la ISO 3382-1:2009.
El procedimiento por medio del cual el software detecta el III. Resultados
limite t_1, se basa en la comparacin de la envolvente sua-
vizada de la respuesta al impulso con un valor de ruido de Para el anlisis de resultados se realizaron mediciones en
fondo calculado a partir del ltimo 10% de la seal captu- varios recintos de la universidad de San Buenaventura Me-
rada, el cual se asegura que corresponde a ruido de fondo, delln, que presentan diferentes caractersticas en cuanto
dados los criterios usados para la optimizacin del tiempo a superficies, volumen, nivel de ruido, uso, entre otros. En
cada uno de estos recintos se realizaron procesos de medi-
de captura. En la Fig. 5 se ilustra la manera en que se hace la
cin haciendo uso de los software Criteria, Dirac y Aurora,
comparacin, donde t_1 correspondera al tiempo en el cual teniendo en cuenta que los parmetros de configuracin de
la envolvente suavizada intersecta por primera vez al nivel la medicin con cada software fueran los mismos. Adems,
de ruido de fondo. toda la cadena electroacstica para las mediciones fue la
misma, con el fin de garantizar un punto de comparacin
bien establecido. A continuacin se muestran algunos de los
resultados ms representativos.

Fig. 5. Interseccin de la envolvente suavizada de la respuesta al


impulso con nivel de ruido de fondo(lnea horizontal).

Habiendo determinado t_1, se aplica una versin discreta de


(4) sobre las respuestas al impulso filtradas, obteniendo as
Fig. 6. Comparacin parmetro C80 por octavas.
curvas de decaimiento energtico para cada banda de fre-
cuencia.

F. Calculo de parmetros acsticos


Para el clculo de los parmetros de criterio temporal se de-
sarroll un algoritmo que, partiendo de la curva de decai-
miento energtico, realiza una regresin lineal con los datos
dentro del rango de evaluacin de inters especfico para
cada parmetro. Por ejemplo, para el clculo del T20, se ob-
tiene una funcin lineal ajustada a los datos del decaimiento
energtico entre -5dB y -25dB, que determina la tasa de de-
caimiento energtico por unidad de tiempo. Posteriormente
se debe extrapolar la funcin lineal correspondiente, hasta
el valor donde se pueda evaluar un decaimiento de 60 dB y
medir la cantidad de tiempo que finalmente se interpreta
como un parmetro acstico (EDT, T10, T20 y T30). Es importan-
te dejar claro que el subndice numrico en los anteriores Fig. 7. Comparacin parmetro RT30 por octavas.
parmetros, indica explcitamente el rango en decibeles con

PG. 65
AVANCES del audio en Latinoamrica.

En los resultados presentados en las Figs. 8 y 10 se mues-


tra que la presencia de ruido de fondo durante la medicin,
produce mayor dispersin entre los parmetros acsticos
obtenidos usando los tres software mencionados anterior-
mente. Estos resultados son similares a los que se presentan
en [12] y [13], donde se comparan resultados entre las ban-
das de octava de 125 Hz y 4000 Hz bajo diferentes tcnicas
de compensacin de ruido y condiciones acsticas. All se
evidencia que a pesar de los intentos de calibracin que ha-
cen los diferentes software a partir de respuestas al impulso
idealizadas, en presencia de condiciones reales en la medi-
cin donde el sistema no es lineal e invariante en el tiempo,
las disimilitudes en los parmetros acsticos calculados son
evidentes.
Fig. 8. Comparacin parmetro RT20 con mayor ruido de fondo en
la medicin (aire acondicionado encendido). IV. Conclusiones
Independientemente de la gran cantidad de variables invo-
lucradas en los diferentes procesos para la obtencin de los
parmetros acsticos, se obtienen resultados muy similares
a los obtenidos con otros software de renombre comercial;
lo cual demuestra que los procesos implementados apoyan
su funcionamiento en un seguimiento adecuado de lo esta-
blecido en los referentes tericos. Sin embargo, se presentan
pequeas variaciones en los parmetros acsticos obteni-
dos, que se deben a diferencias en el procesamiento poste-
rior de la respuesta al impulso y no a su medicin.

Otro tipo de pruebas, mostraron de forma preliminar, que


procesos como el filtrado por bandas de frecuencia y los di-
Fig. 9. Comparacion para el parametro EDT por octava. ferentes mtodos de compensacin de ruido que usan los
software evaluados, son la principal causa de las diferencias
en los parmetros acsticos. Situacin que adems eviden-
cia que no hay un punto de referencia que se pueda tomar
como verdad absoluta en la comparacin de parmetros ob-
tenidos con uno u otro software.

V. Referencias
[1] Standard, ISO, 3382-1:2009. Acoustics - Measurement of Room
Acoustic Parameters-part 1: Performance Spaces, Genve: Interna-
tional Organization for Standardization, 2009.

[2] G.-B. Stan, J.-J. Embrechts y D. Archambeau, Comparison of


different impulse response measurement techniques, Journal of the
Audio Engineering Society, vol. 50, n 4, pp. 249-262, 2002.
Fig. 10. Comparacin parmetro D50 por octava con mayor ruido
de fondo en la medicin (aire acondicionado encendido). [3] S. Muller y P. Massarani, Transfer-function measurement with
sweeps, Journal of the Audio Engineering Society, vol. 49, n 6, pp.
Al analizar los resultados de las Figs. 6,7 y 9, se observa que 443-471, 2001.
los parmetros obtenidos por Criteria convergen en conjunto
con los obtenidos por Dirac y Aurora, presentando ten- [4] Standard, ISO, 18233: 2006. Acoustics - Application of New
dencias muy similares tanto en los parmetros temporales Measurement Methods in Building and Room Acoustics, Genve:
como en los energticos. No obstante, se puede ver que en International Organization for Standardization, 2006.
las bandas por debajo de 125 Hz los resultados no siguen una
tendencia en particular. Esto podra deberse a que en la nor- [5] IEC, 61260-1:2014. Electroacoustics-Octave-Band and Frac-
mativa no se establece un diseo de filtro especfico, ocasio- tional-Octave-Band Filters, International Electrotechnical Commis-
nando posibles diferencias en el diseo de estos y es posible sion, 2014.
que los filtros usados por los diferentes software presenten
diferencias en cada una de sus caractersticas, entre las cua- [6] ROLI, Juce Framework, 2014.
les est el retraso de fase, el cual afecta en mayor propor-
cin a las respuestas al impulso filtradas correspondientes a [7] B. Boren y A. Roginska, Multichannel impulse response mea-
las bandas de baja frecuencia. surement in matlab, de Audio Engineering Society Convention 131,
2011.

PG. 66
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

[8] Farina, Angelo, Aurora software suite, 1996.

[9] Bruel & Kjaer, Dirac - Room Acoustics Software - Type 7841.

[10] A. Farina, Simultaneous measurement of impulse response


and distortion with a swept-sine technique, de Audio Engineering
Society Convention 108, 2000.

[11] M. Frigo y S. G. Johnson, FFTW: An adaptive software archi-


tecture for the FFT, de Acoustics, Speech and Signal Processing,
1998. Proceedings of the 1998 IEEE International Conference on,
1998.

[12] P. Fausti y A. Farina, Acoustic measurements in opera houses:


comparison between different techniques and equipment, Journal of
Sound and Vibration, vol. 232, p. 213229, 2000.

[13] B. Katz, International round robin on room acoustical impulse


response analysis software 2004, Acoustical Society of America,
vol. 5, n 4, pp. 158-164, 2004.

PG. 67
AVANCES del audio en Latinoamrica.

PG. 68
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

CONFERENCIA
LATINOAMERICANA
Resumen del evento
La conferencia anual AES Latinoamrica es el evento ms im-
portante del audio en Amrica Latina, el cual se realiz en
Competencias de grabacin y diseo
Tambin se realiz la tradicional competencia de grabacin y
Colombia en su edicin 2016, y en el que se reunieron con-
en sta oportunidad se incluy una competencia de diseo;
ferencistas y panelistas reconocidos, adems de fabricantes,
la competencia tuvo el apoyo de importantes empresas del
expositores, profesionales, aficionados y todos los interesa-
sector comercial de audio que contribuyeron con los premios
dos en el mundo del sonido para ampliar su conocimiento,
a los ganadores y participantes, entre ellas encontramos a
dar un vistazo a lo ltimo del mercado en audio profesional,
Audio Element con Izotope, AudioTechnica, Sennheiser, Retro
y asistir a mltiples actividades paralelas que le permitieron
Knob, Instituto Ene Audio, Genelec y VCR LTDA.
a los asistentes expandir su red de contactos profesionales.
La siguiente es la lista de ganadores en las diferentes cate-
Durante los tres das del evento se presentaron ms de 15
conferencistas internacionales y 25 nacionales quienes hi- goras.
cieron parte de las diferentes actividades programadas tales
como conferencias, demostraciones, paneles de discusin,
ponencias y sesiones de escucha. RESULTADOS COMPETENCIAS AES 2016
La Conferencia Latinoamericana AES 2016 se llev a cabo del Competencia de Grabacin
21 al 23 de julio en las instalaciones de la Universidad de Categora 1 - Grabacin Acstica Tradicional
San Buenaventura en la ciudad de Bogot-Colombia. Con- Ana Reyes Primer Puesto
ferencias, talleres, paneles de discusin, demostraciones, Segundo Puesto
Daniela Varela
competencias estudiantiles de diseo y grabacin, crticas
de grabacin, visitas tcnicas, documentos y carteles se pre- Luis Chaparro Tercer Puesto
sentaron en torno a cuatro temas principales durante los Categora 2 - Grabacin Tradicional en Estudio
tres das. Rodolfo Chaves Primer Puesto
Carlos Socot Segundo Puesto
Acstica, electroacstica y la psicoacstica
Refuerzo sonoro y Sonido en vivo Alfredo Neira Tercer Puesto
Produccin (grabacin, mezcla y masterizacin) Categora 3 - Grabacin Moderna en Estudio
Post-produccin (Cine, TV, Radio y videojuegos) Rafael Santamara Primer Puesto
Jossman Saac Segundo Puesto
Durante la conferencia, se presentaron invitados de renom-
bre internacional tales como: Jose Antonio Cordero Tercer Puesto
Vance Powell (EE.UU.) Categora 4 - Sonido para Medios Audiovisuales
Mathew Waters (EE.UU.) Esteban Caldern Primer Puesto
Ryan Hewitt (EE.UU.) Segundo Puesto
Andrs Marthe Gonzlez
Eduardo Vaisman (ARG)
Bruce Olson (EE.UU.) Daniel Castilla Tercer Puesto
Robert Gnreux (CAN)
Alex Lameira (BRA) Competencia de Diseo
Daniel Reis (BRA)
Mauricio Mag Ramrez (MEX) Categora 1 - Acstica
Alejandro Bidondo (ARG) Desierta
Valeria Palomino (MEX)
Rodrigo Casassus (CHI) Categora 2 - Electroacstica
Daniel Upegui Primer puesto
Por otra parte se presentaron ms de 25 profesionales loca-
les como Ana Jaramillo, Mauricio Ardila, Ricardo Escalln, C- Angie Guerrero Segundo puesto
sar Vilar, de Tony Pearredonda, Marcela Zorro, Carlos Silva, Nathalia Beltrn Mencin
Andrs Nez, Camilo Silva, Andrs Landinez y Andrs Milln,
entre otros. Juan Sierra Mencin

PG. 69
AVANCES del audio en Latinoamrica.

PG. 70
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

PG. 71
AVANCES del audio en Latinoamrica.

PG. 72
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

PG. 73
AVANCES del audio en Latinoamrica.

COMIT AES
ramas del sonido y afines de miembros activos de Bogot,
Medelln y Bucaramanga, y con un subcomit de la ciudad
de Medelln, nuestro pas se consolida como una de las
regiones ms fuertes y activas de Latinoamrica. El comit

COLOMBIA
de AES Colombia proyecta una expansin nacional de las
asociacin con la presentacin de la Conferencia Anual AES
Colombia 2017 en la ciudad de Medelln y con actividades en
Bogot, Bucaramanga y a lo largo de diversas ciudades del
El Comit de la Audio Engineering Society Seccin Colombia, territorio nacional. Por lo anterior, se demuestra la constancia
desde sus inicios a principios de la dcada de los 2,000, en actividades de las asociacin y la enorme proyeccin
ha trabajado para generar espacios de intercambio de que existe para la expansin del conocimiento a travs de
conocimiento, siempre con fines acadmicos, y enfocados a diversas actividades acadmicas y publicaciones como
estudiantes, profesionales, docentes e investigadores. AES sta, que mantendr una periodicidad anual y basada en la
Colombia ha desarrollado importantes actividades dentro presentacin de los proyectos de investigacin expuestos en
del marco Latinoamericano, partiendo de la 4ta Conferencia las conferencias anuales de AES Colombia.
Latinoamericana del ao 2010 en la Pontificia Universidad
Javeriana, hasta la Conferencia Latinoamericana AES 2016 ING. ANDRS FELIPE MILLN SILVA
en las instalaciones de la Universidad de San Buenaventura Presidente AES Colombia
Sede Bogot; sin dejar a un lado la constante presentacin
de conferencias, talleres, paneles de discusin y seminarios
individuales con panelistas nacionales e internacionales.

Ahora bien, con un comit renovado y conformado con


profesionales y docentes con experticia en las diferentes

PG. 74
LIBRO DE LA AUDIO ENGINEERING SOCIETY SECCIN COLOMBIA

PG. 75
AVANCES del audio en Latinoamrica.

PG. 76

Você também pode gostar