Escolar Documentos
Profissional Documentos
Cultura Documentos
27 de diciembre de 2016
Contacto: luiscolo12@gmail.com
El curso Acstica Musical puede ser seguido on-line en: Acstica Musical
ndice general
Prlogo
VIII
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
17
17
19
22
25
26
.
.
.
.
.
.
28
28
29
30
33
37
40
3.7. Conclusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4. El sonido simple
4.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . .
4.2. El sonido simple como fundamento del sonido musical
4.3. El Movimiento Armnico Simple (MAS) . . . . . . . .
4.3.1. Un ejemplo de Movimiento Armnico Simple
4.3.2. Parmetros del Movimiento Armnico Simple
4.4. El Movimiento Armnico Simple en el sonido . . . . .
4.4.1. Parmetros del sonido simple . . . . . . . . . .
4.5. Conclusin . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
47
47
48
51
51
56
58
58
61
.
.
.
.
.
.
.
62
62
63
65
66
69
71
74
. 74
.
.
.
.
76
78
80
82
84
. 84
. 86
. 87
. 91
. 91
6.5.
6.6.
6.7.
6.8.
6.9.
7. El sonido armnico
7.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.2. Sonidos armnicos y sonidos inarmnicos . . . . . . . . . . . . . . .
7.3. La serie armnica . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.3.1. Sonido formado por componentes consecutivos de la serie armnica: Seal en diente de sierra . . . . . . . . . . . . . . . .
7.3.2. Sonido formado por los componentes impares consecutivos
de la serie armnica: Seal rectangular . . . . . . . . . . . . .
7.3.3. Cualidad sonora derivada de los componentes de la serie armnica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.4. Componentes de la serie armnica y notas de la escala temperada . .
7.5. Intervalos entre los sucesivos componentes de la serie armnica . . .
7.6. Estructura armnica y reconocimiento de la altura tonal . . . . . . .
7.7. Las fronteras de lo armnico. La inarmonicidad en el sonido musical
7.8. Conclusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
122
122
124
128
129
131
132
133
138
141
144
148
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
152
. 155
. 160
. 164
. 165
. 170
.
.
.
.
175
183
188
192
.
.
.
.
.
193
193
195
199
204
208
209
209
211
215
219
223
224
225
227
232
. 232
. 235
. 242
. 247
. 254
.
.
.
.
257
257
263
265
266
266
267
271
271
273
278
284
287
287
292
294
295
299
304
. 304
.
.
.
.
.
.
305
308
312
314
319
324
325
. 325
. 327
. 330
. 334
. 337
. 340
. 344
. 346
347
II
Prlogo
Este curso pretende proporcionar al msico y al musiclogo los conocimientos de
acstica que pueden ser de inters para la realizacin de su trabajo. El sonido es el
material con el que se hace la msica, por lo que a cualquiera que le interese el arte
musical le puede resultar atractivo conocer todo lo que atae al sonido, tanto en
su realidad fsica es decir, al hecho de que sea una onda mecnica, como en su
realidad psquica, pues en un sentido estricto hablamos de sonido cuando esa onda
mecnica es percibida por nuestro sistema auditivo.
Ciertamente, no es necesario conocer nada de acstica para interpretar bien un instrumento, ni para investigar en la mayor parte de los aspectos de los que se ocupa la
musicologa, pero creo que todos estaremos de acuerdo en que saber en qu consiste el sonido, conocer cules son sus parmetros fsicos, comprender cmo nosotros
percibimos esos parmetros y, en denitiva, conocer cul es la relacin entre la naturaleza fsica del sonido y la manera en la que nuestro sistema auditivo lo percibe,
puede resultar de gran ayuda para la prctica del instrumento y tambin puede colaborar ecazmente en mltiples aspectos de la investigacin musicolgica. A mi
juicio, es difcil entender bien el lenguaje musical sin un conocimiento, aunque sea
elemental, del sonido musical. En este sentido, uno de los objetivos de este curso
es presentar las bases fsicas sobre las que se ha construido el lenguaje musical de
Occidente y tambin su sistematizacin terica.
La pregunta que podemos hacernos a continuacin es la siguiente: Es posible estudiar acstica sin utilizar el formulismo matemtico que normalmente acompaa
cualquier estudio fsico? Mi respuesta es que s. Creo que se puede entender bien la
naturaleza del sonido, y en particular del sonido musical, mediante la experiencia,
III
sin recurrir a ninguna frmula matemtica. Por eso este curso de acstica musical va
a prescindir de toda formulacin matemtica.
No se trata de realizar clculos, ni de desarrollar aplicaciones prcticas; el objetivo
de quien siga este curso de acstica musical va a ser entender las ideas fundamentales en torno a la naturaleza del sonido y, en particular, aquellos aspectos que han
sustentado nuestro lenguaje musical. Por ejemplo, desde mi punto de vista, se puede
entender razonablemente bien qu es la descomposicin espectral sin necesidad de
conocer la formulacin matemtica de la Transformada de Fourier. Es verdad que su
conocimiento sera ms profundo y estara mejor expresado si se utilizara el lenguaje
matemtico, pero esto slo sera as una vez que se hubieran entendido las ideas en las
que se basa la descomposicin espectral. Creo que para el msico es suciente con
este conocimiento y tambin que quien est interesado en la fsica del sonido, sin
un especial inters musical, le puede venir muy bien observar y experimentar muchos fenmenos que luego podrn ser formalizados matemticamente. Por ello en
este curso voy a procurar explicar todas las ideas de la manera ms intuitiva posible.
Pienso que, armados solamente con el sentido comn y con la ayuda de abundantes grcas y vdeos que nos permitan relacionar lo que omos con lo que vemos,
podremos entender las principales nociones de acstica musical.
Por todo ello este curso va a utilizar con mucha frecuencia vdeos, la mayor parte
de los cuales han sido elaborados a partir de imgenes obtenidas mediante Matlab.
Estos vdeos van a servir como una suerte de laboratorio de acstica y van a permitir
experimentar de primera mano todo lo que se explica en el texto. En ellos me he
esforzado en mostrar la relacin entre lo que se ve y lo que se oye. As pues, espero
que los conceptos ms importantes de acstica musical queden aanzados con ayuda
de las imgenes de estos vdeos, que presentan grcamente cmo es la naturaleza
del sonido y la manera en la que nosotros percibimos sus parmetros.
Los distintos captulos de este curso de acstica musical recorren el amplio camino
que va desde la explicacin de la naturaleza vibratoria del movimiento mecnico que
origina el sonido y el modo en el que se trasmite, con sus parmetros de frecuencia,
amplitud, periodo y fase, hasta las peculiaridades de la voz musical, es decir, el movimiento que transcurre intervlicamente de una a otra altura tonal y que da lugar a
la meloda, pasando por la explicacin de fenmenos acsticos de especial relevancia
en la formacin del sonido musical, tales como las ondas estacionarias, la resonancia,
IX
XII
Captulo 1
El sonido como vibracin
1.1.
Qu es el sonido?
sistema perceptivo por las pequeas y rpidas oscilaciones de la presin del aire
en torno a su valor medio.
Ahora bien, decimos que el sonido es movimiento, que la pared a travs de la que
llega a nuestros odos el ruido de la habitacin de al lado se est deformando, pero
no vemos que nada se deforme, no apreciamos que nada se mueva. Ello se debe a dos
peculiaridades de las vibraciones mecnicas que percibimos como sonido.
La primera es que las amplitudes de las vibraciones sonoras son, en general, muy pequeas. Por poner un ejemplo, la variacin de la presin sonora en una calle con un
trco moderado, debida al ruido de los coches y de los transentes, es aproximadamente una millonsima parte de la presin media del aire.
La segunda es que las vibraciones sonoras son muy rpidas para ser seguidas por
nuestra vista. Nosotros slo percibimos como sonidos las vibraciones mecnicas que
se producen dentro de un margen temporal adecuado a nuestra percepcin, en concreto, aqullas que realizan una oscilacin completa en un rango que va desde unas
20 veces por segundo hasta unas 20.000 veces por segundo.
Para obtener una imagen intuitiva de la vibracin sonora, podramos imaginar el
aire como si estuviera formado por pequeas bolitas o esferitas unidas por diminutos muellecillos, unas esferitas que estaran igualmente espaciadas en su posicin de
equilibrio y que oscilaran siguiendo el movimiento de la fuente sonora.
Este modelo es apropiado para simular las variaciones de la presin del aire que constituyen el sonido. El hecho de que las esferitas se aproximen entre s se corresponde
con un aumento de la densidad del aire y, por lo tanto, de la presin, mientras que el
que se alejen unas de otras representa la rarefaccin y la disminucin de la presin del
aire. Los muellecillos simulan la posibilidad de todo medio elstico de ser deformado,
as como su tendencia a recuperar la posicin de equilibrio.
Utilizando este modelo de las esferitas y los muelles, he confeccionado varios vdeos
didcticos, cuyos fotogramas han sido generados con Matlab. Estos vdeos nos ayudarn a asimilar los principales conceptos implicados en la vibracin sonora, los cuales
son estudiados en los apartados Simulacin de la vibracin del aire en un sonido
simple y Simulacin de la vibracin del aire en un fragmento sonoro complejo.
Espero que esta forma de representacin resulte til para entender en qu consiste la
2
vibracin del sonido y cmo se transmite por el aire el movimiento vibratorio desde
la fuente sonora hasta nuestros odos.
1.2.
Veamos un vdeo que simula a cmara lenta cmo vibra el aire cuando suena un
sonido simple, es decir, un sonido con una frecuencia y una amplitud estables y
sin armnicos. El vdeo sigue el modelo del aire formado por una serie de bolitas y
muellecillos que se desplazan cuando cambia la presin del aire como consecuencia
de la vibracin sonora.
El vdeo representa la vibracin del aire cuando suena la nota la4 generada articialmente, cuya frecuencia es de 440 Hz. He elegido para este ejemplo un sonido
simple porque, al ser su movimiento vibratorio muy sencillo y repetitivo, nos va a
permitir observar con facilidad los rasgos caractersticos de toda vibracin sonora y
de su propagacin. He ralentizado el movimiento 440 veces y he amplicado mucho
el desplazamiento de cada esferita para que se pueda apreciar la vibracin con facilidad. El sonido del vdeo, sin embargo, corresponde a la nota la4 tal cual, es decir, sin
ralentizar, por lo que la nalidad del sonido es meramente ilustrativa.
Figura 1.1: Vdeo que modeliza, ralentizada 440 veces, la vibracin del aire ocasionada por la nota
musical simple la4 .
Aunque la nalidad del vdeo es puramente didctica, he tratado de que el modelo sea
lo ms realista posible. Por ello cada cuadro del vdeo ha sido realizado con Matlab.
Este programa me ha permitido calcular la posicin instantnea de cada una de las
esferitas del modelo durante la emisin de este sonido. As, el vdeo simula lo que
ocurre en una imaginaria seccin cbica de aire de 2 metros de lado situada en un
espacio abierto, sin viento y sin obstculos, lo cual evita la necesidad de tener en
cuenta cualquier perturbacin en la propagacin del sonido.
Puesto que el sonido en realidad se propaga en todas las direcciones por igual, es
necesario pensar que el cubo est a gran distancia de la fuente sonora, de modo
que los movimientos de las esferitas puedan ser considerados como prcticamente
paralelos. Para ello suponemos que a la izquierda del cubo, a 100 metros o ms de
distancia, un altavoz potente est emitiendo la nota musical la4 que acabamos de or.
Suponemos tambin que la nota est ya sonando de una forma estable cuando el
vdeo se inicia.
Cada esferita del vdeo representa un volumen esfrico de aire de 2,8 cm de radio. En
su posicin de equilibrio la distancia entre los centros de estas esferas es de 9,69 cm.
He elegido esta distancia para que la longitud de onda del sonido analizado abarque
un nmero entero de esferitas en nuestra simulacin.
Ya que la propagacin de la vibracin se realiza de izquierda a derecha, en el vdeo
los muellecillos slo unen las esferitas en el sentido longitudinal. Esta es tambin
la razn de que las esferitas que se mueven sincronizadamente estn agrupadas en
paneles paralelos a las caras laterales del cubo.
Debemos suponer que la vibracin que vemos en esta simulacin est siendo provocada por la masa de aire que se encuentra a la izquierda del cubo, la cual, a su vez,
est siendo movida por el cono del altavoz que est emitiendo la nota musical la4 .
Cuando el cono del altavoz se desplaza a la derecha, desplaza a la derecha la masa de
aire que est en contacto inmediato con l, con lo que ste se comprime. Cuando se
comprime, su densidad aumenta y, por lo tanto, la presin que ejerce sobre lo que
le rodea se hace ms elevada. Ello hace que, a su vez, pero con un cierto retraso,
desplace y comprima el aire que sigue a continuacin, y as sucesivamente. Cuando
el cono del altavoz se desplaza hacia la izquierda, el vaco que deja atrae el aire de
1.2.1.
Los movimientos de la fuente sonora provocan una cadena de compresiones y rarefacciones que constituyen ondas de presin que se desplazan por el interior de la
masa de aire. Veamos cmo se producen.
Lo primero que observamos a simple vista en el vdeo es un cubo que vibra, estirndose y encogindose como si fuera una especie de fuelle, y lo hace de una manera
totalmente regular. La regularidad y simplicidad de esta vibracin es debida a que
estamos simulando un sonido simple, es decir, una nota musical sin armnicos.
Si nos distanciamos un poco de la pantalla para tener una visin de conjunto, podemos apreciar unas perturbaciones que se desplazan de izquierda a derecha. Estas
perturbaciones, que se corresponden con las alteraciones de la presin del aire, constituyen un movimiento ondulatorio, que es la manera en la que se propaga el sonido
desde la fuente sonora hasta nuestros odos.
En efecto, distinguimos varias reas donde los paneles de esferitas progresivamente se
amontonan, dando una sensacin de mayor densidad o, lo que viene a ser lo mismo,
de mayor presin. Estas reas de mayor densidad parecen surgir de la cara lateral
izquierda del cubo, viajar de izquierda a derecha y desaparecer por la cara lateral
derecha. Cada una de estas condensaciones que surge deja a su paso otra zona donde
los paneles de esferitas se van separando y en la que, por lo tanto, la densidad y la
presin del aire sern menores.
Podemos ver en el vdeo que estas condensaciones se renuevan una vez por segundo. En efecto, cada segundo parece surgir de la cara izquierda del cubo una nueva
condensacin, por lo que la frecuencia de las ondulaciones que apreciamos en este
vdeo es de 1 Hz. Teniendo en cuenta que en l se representa el movimiento vibratorio ralentizado 440 veces, la frecuencia real con la que se renuevan estas zonas de
presin en el aire ser de 440 veces por segundo, lo que coincide con la frecuencia
de la nota musical que est sonando, un la4 de 440 Hz.
1.2.2.
Sin embargo, si nos jamos en cada una de las esferitas nos daremos cuenta de que
no se van desplazando indenidamente hacia la derecha, sino que tienen nicamente
un movimiento oscilatorio horizontal en torno a su posicin de equilibrio: slo se
mueven realizando un sencillo vaivn de izquierda a derecha y de derecha a izquierda, en un rango muy reducido de desplazamiento respecto a su posicin central. Y
lo mismo ocurre con los paneles en los que se agrupan.
Adems, si observamos con un poco de detenimiento varias esferitas elegidas al azar
podremos comprobar que todas ellas realizan el mismo movimiento. Unas se mueven
antes y otras despus en funcin del panel en el que se encuentran, pero todas las
esferitas del cubo oscilan exactamente de la misma manera.
Dado que en nuestra simulacin hemos elegido un sonido simple, el movimiento de
cada esferita es un sencillo vaivn. Este sencillo vaivn repite el movimiento que ha
efectuado el cono del altavoz al emitir el sonido.
Para observar con detalle el movimiento de una esferita cualquiera he realizado un
vdeo en el que aparece la oscilacin de una esferita del cubo aislada, ralentizada ahora
880 veces, es decir, el doble que en el vdeo de la gura 1.1. Conforme va oscilando
se va dibujando la forma de su movimiento en el tiempo.
Tiempo
Desplazamiento
Figura 1.2: Vdeo con el movimiento de oscilacin de una esferita cualquiera del cubo de la gura
1, ralentizado 880 veces.
la frecuencia de vibracin del la4 que est sonando. Comprobamos, as pues, que la
frecuencia de oscilacin de las esferitas es la misma que la frecuencia del movimiento
ondulatorio de propagacin, es decir, la frecuencia con la que se renuevan las condensaciones en un punto del espacio que hemos visto en el apartado anterior.
1.2.3.
Al or la palabra ondulacin nos viene enseguida a la mente la imagen de las olas del
mar o la de los crculos concntricos que surgen en un estanque de agua al arrojar
una piedra. Pero en nuestra simulacin no vemos nada que ondule, nada que tenga la
forma de una onda; a lo ms, intuimos un cierto carcter ondulatorio en la sucesin
de condensaciones y rarefacciones. Ello se debe a que las ondas mediante las que
se propaga el sonido son ondas de presin longitudinales, mientras que las ondas
del estanque o del mar son principalmente transversales.
Voy a explicar a continuacin cmo son las ondas longitudinales mediante las que se
propaga el sonido. Veremos cmo surgen las ondas sonoras a partir del movimiento
individual de oscilacin, que reproduce la oscilacin de la fuente sonora, y de la
elasticidad del medio, en este caso, el aire. Comprenderemos, as mismo, que como
consecuencia de la elasticidad del medio, la forma de la onda en el espacio es la
misma que la forma de la oscilacin de la fuente sonora en el tiempo.
En trminos de nuestra simulacin, vamos a estudiar cmo a partir del movimiento
oscilatorio de cada una de las esferitas se genera el movimiento ondulatorio mediante
el que se propaga la perturbacin.
Para ello he fabricado un vdeo con una la aislada del cubo de la gura 1.1, en el que
las esferitas aparecen oscilando, pero ahora con el movimiento ralentizado 880 veces.
La oscilacin de cada una de las esferitas se va dibujando en el tiempo con trazos de
ocho colores distintos. La lnea ondulada verde que aparece por encima y por debajo
de las esferitas indica la variacin de la presin del aire a lo largo del espacio.
Tiempo
Espacio
Analicemos con un poco de detenimiento lo que vemos en este vdeo y lo que sucede
en la realidad que simula.
Podemos apreciar con claridad que la oscilacin de cada una de las esferitas se realiza en la misma direccin que la propagacin de las perturbaciones, en este caso,
de izquierda a derecha. Por eso los desplazamientos individuales de las esferitas, al
oscilar en torno a su posicin de equilibrio, se camuan en el movimiento general
de propagacin, lo que explica que en el cubo del aire vibrando de la gura 1.1 no
se observe ninguna forma ondulada en el espacio.
En la realidad, los pequesimos desplazamientos del aire, representados por la oscilacin de las esferitas, oscilan en la misma direccin en la que se propaga el sonido
por el espacio, repitiendo el movimiento de la fuente sonora. Este tipo de ondas se
llaman longitudinales y mediante ellas se propaga el sonido.
Tiempo
Tiempo
Para entender cmo surge la oscilacin de la presin a partir de los desfases derivados
de la elasticidad, presento un nuevo vdeo con un detalle ampliado del movimiento de
las dos primeras esferitas. En el rectngulo de la derecha se va trazando la separacin
entre ellas, o lo que es lo mismo, el grado de compresin o elongacin del muelle
que las une.
Desplazamiento
Figura 1.4: Vdeo con la oscilacin de las dos primeras esferitas y la evolucin de sus distancias.
10
Podemos apreciar en este nuevo vdeo cmo la evolucin en el tiempo del grado de
compresin o elongacin del muelle reproduce, aunque desfasada, la forma y el ritmo
de la oscilacin de las esferitas individuales. En este caso, como estamos analizando
un sonido simple, ambas oscilaciones tienen la forma de una sucesin de eses, que
repiten la oscilacin de la fuente sonora.
En efecto, en la vibracin real la presin del aire en cualquier punto del espacio
oscila con la misma forma y ritmo que los pequesimos desplazamientos de aire
provocados por la oscilacin de la fuente sonora.
c) La onda que se desplaza por el espacio tiene la misma forma que la oscilacin en el tiempo
Como consecuencia de los desfases debidos a la elasticidad, se produce una cadena de condensaciones y rarefacciones del aire que se extiende por el espacio. Estas
variaciones de la presin del aire a lo largo del espacio constituyen la onda sonora.
Podemos hacernos una idea intuitiva de lo que es la onda sonora si nos jamos en
la lnea ondulada verde del vdeo de la gura 1.3. All podemos ver tambin que la
forma de esta onda que se desplaza imita los dibujos de colores que las oscilaciones
de cada una de las esferitas van trazando en el tiempo.
En efecto, los retrasos producidos por la elasticidad de los muelles son tambin la
causa de que el movimiento oscilatorio que realizan las esferitas en el tiempo se dibuje en el espacio. Si miramos con un poco ms de atencin ese vdeo, podremos
apreciar que, en un instante cualquiera, la secuencia a lo largo del espacio de aproximaciones y separaciones entre las esferitas reproduce la secuencia de aproximaciones
y separaciones de las dos primeras esferitas a lo largo del tiempo.
Como la fuente sonora est a la izquierda, lo que est ms a la derecha en el espacio es
lo que ha sucedido antes en el tiempo, pues es lo que ha tardado ms en llegar. Puesto
que la evolucin de las distancias entre las esferitas repite el movimiento de la fuente
sonora, conforme se encuentren ms a la derecha o sea, ms lejos de la fuente,
su estado se corresponder con un momento anterior. Por poner un ejemplo, la distancia entre las dos ltimas esferitas de la derecha en un instante determinado es la
misma que la que haba en un instante anterior entre la penltima y la antepenl11
tima, que, a su vez, es la misma que en otro instante anterior se produca entre la
antepenltima y la que le antecede, y as sucesivamente.
As pues, en un instante dado, las distancias entre las sucesivas esferitas a lo largo de
la la reejan la historia del movimiento de la fuente sonora.
Podemos observar tambin en este vdeo que la secuencia de separaciones entre las
esferitas se va desplazando por el espacio. Lo que se desplaza a lo largo del espacio no son las esferitas, que slo tienen un pequeo movimiento oscilatorio, sino el
patrn de proximidad y lejana entre ellas. Lo mismo sucede en la vibracin real,
donde lo que se desplaza no son las masas de aire, sino la onda de presin y con ella
la informacin que lleva implcita, que no es otra sino la informacin de la fuente
sonora.
d) En un sonido simple la onda de presin del aire tiene forma de ese y una longitud definida
12
estar entre los muelles ms distendidos y la novena, de nuevo, entre los muelles ms
comprimidos.
Al margen de las imprecisiones debidas al reducido nmero de esferitas, este patrn
de compresiones y elongaciones representa la onda de presin sonora en el espacio.
Podemos observar en ese vdeo que los valores mximos de presin, representados
por los picos de la grca verde, vienen a coincidir con los puntos del espacio en
los que los muellecillos estn ms comprimidos, mientras que los valores mnimos
coinciden con aquellos puntos en los que los muelles estn ms estirados.
Para apreciar mejor la forma de la onda en el espacio en este sonido simple, presento
una instantnea de la cara frontal del cubo de la gura 1.1, en la que he trazado la
grca de la presin del aire. He teido cada esferita siguiendo la misma serie de
colores del vdeo de la gura 1.3, lo que facilita el reconocimiento del patrn.
Figura 1.5: Cara frontal del cubo con la grca de la onda de presin en el espacio.
1.3.
Figura 1.6: Vdeo que modeliza, ralentizada 440 veces, la vibracin del aire ocasionada por un
fragmento de 27 milsimas de segundo del inicio de la Quinta Sinfona de Beethoven.
Si nos jamos en el movimiento de oscilacin de la esferita ms iluminada, no encontramos nada parecido al sencillo vaivn del vdeo que simula un sonido simple.
En efecto, en el caso de un fragmento sonoro real, con toda su complejidad, los pequesimos desplazamientos de aire no consisten ya en una simple oscilacin de tipo
pendular que se repite una y otra vez, sino que se trata de una oscilacin bastante ms
compleja, que se va transformando con el transcurso del tiempo. Adems, y como
consecuencia de ello, tampoco la onda de presin en el espacio tendr una forma
ja, sino que ir cambiando constantemente. Por eso, conceptos como periodo y
frecuencia de la oscilacin o longitud de onda ya no sern tan evidentes.
Pero, lo esencial de todo movimiento ondulatorio se cumple tambin en el caso de
cualquier sonido complejo, sea o no musical.
Dado que en ambas simulaciones hemos supuesto las mismas condiciones para el aire,
podemos apreciar que en los dos casos el retraso ocasionado por la elasticidad de los
muellecillos es el mismo y, en consecuencia, la velocidad con la que se propagan las
perturbaciones es tambin igual.
Y lo que es ms importante, aunque el movimiento de oscilacin sea complejo, observamos que tambin ahora todas las esferitas del cubo repiten, cada una con su
retraso, el mismo movimiento, el movimiento que est inducido por la fuente. Esto
nos ilustra sobre lo que ocurre en la vibracin del aire. En el aire la oscilacin de la
presin en cualquier punto del espacio repite, con su correspondiente desfase
15
1.4.
Conclusin
Mediante la simulacin por ordenador de la vibracin sonora en el aire, hemos experimentado qu signica que el sonido sea una vibracin mecnica que se propaga
por un medio elstico. Hemos visto que el movimiento oscilatorio de la fuente sonora, sea simple o complejo, se repite en cualquier punto del medio elstico por el
que se propaga, dando lugar a oscilaciones de la presin. As mismo, hemos comprendido cmo en la transmisin del movimiento oscilatorio se generan ondas de
presin que toman la misma forma que la oscilacin de la fuente. En consecuencia,
podemos concluir que la informacin sonora est contenida tanto en la oscilacin de
la presin en cualquier punto del espacio, como en las formas que va adquiriendo la
onda al propagarse.
16
Captulo 2
La seal de audio
2.1.
Dada la rapidez y el reducido rango de las oscilaciones de la presin del aire que dan
lugar al sonido, nosotros no podemos observarlo directamente. Sin embargo, con
el avance de la tecnologa, se han desarrollado diversos sistemas capaces de registrar
el movimiento vibratorio que lo constituye, lo que ha permitido, por un lado, reproducirlo ms tarde a voluntad y, por otro, estudiarlo y hasta manipularlo. Todos
estos mtodos estn basados en conseguir que la forma de la vibracin sonora deje
un rastro, una huella, es decir, una seal.
En efecto, toda la informacin que lleva consigo el sonido est contenida dentro de
la forma de la vibracin. La seal de audio es el dibujo que esa vibracin traza
en el tiempo. En el caso del aire, la seal de audio viene dada por la forma de la
oscilacin de la presin en torno a su valor medio, en un punto determinado del
espacio. Bastar, as pues, con obtener el dibujo de esa oscilacin de la presin para
lograr una representacin del sonido. Cuando el contenido de la vibracin sonora es
una pieza o un fragmento de msica, a esa representacin del sonido se la denomina
seal musical.
Desde mediados del siglo XIX se desarrollaron varios ingenios para atrapar el sonido, es decir, para guardarlo y volver a reproducirlo posteriormente. Surgieron los
primeros fongrafos, que, como su nombre indica, pretendan escribir el sonido.
17
seal analgica. Mediante estas mediciones, que recogen con la precisin deseada el
movimiento vibratorio original, se digitaliza la seal sonora. Obtenemos as la lista
de nmeros que constituye la representacin digital de la vibracin y que recibe, por
ello, el nombre de seal digital de audio. Conforme mayor sea la cantidad de muestras obtenidas es decir, la frecuencia del muestreo, mejor ser la aproximacin al
movimiento vibratorio real que obtendremos.
La transformacin en nmeros de la vibracin sonora permite que el tratamiento del
sonido se pueda realizar simplemente mediante operaciones matemticas simples. Por
ejemplo, amplicar un sonido consiste en multiplicar cada una de sus muestras por
una cantidad constante; para mezclar dos grabaciones digitales slo hay que sumar
los valores correspondientes de cada una de sus muestras, etc. Adems, la seal digital
de audio, al tratarse solamente de una lista de nmeros, no se pierde ni se deteriora
por muchas veces que sea reproducida. Y a partir de esa lista de nmeros se pueden
generar con facilidad grcas e imgenes que facilitan la observacin y el estudio de
los sonidos.
2.2.
Figura 2.2: Vdeo que ilustra el proceso de digitalizacin sobre un fragmento de 20 ms de los
primeros compases de la Quinta Sinfona de Beethoven.
2.3.
El editor de sonido
Veamos ahora cmo podemos representar y observar con ayuda de un editor de sonido la seal digital de ese fragmento sonoro. Existen muchos editores de sonido,
algunos de ellos, como Audacity, de libre distribucin. Mediante cualquiera de ellos
podemos trazar, a partir de los nmeros que hemos guardado en el archivo del ordenador, la grca de la seal que hemos registrado.
Abrimos desde el editor de sonido el archivo con la seal de audio digital de ese
fragmento de msica. Elegimos una presentacin en la que podamos ver todo el
fragmento en una sola pantalla, para lo que, probablemente, necesitaremos hacer un
zoom negativo. Veremos y oiremos algo similar a lo siguiente:
22
Figura 2.3: Vdeo con la seal de audio de los compases iniciales de la Quinta Sinfona de Beethoven.
23
Figura 2.4: Fragmento de 50 ms de la seal de audio del inicio de la Quinta Sinfona de Beethoven.
24
2.4.
El osciloscopio
Pero lo que realmente nos interesara para estudiar el movimiento vibratorio que es
el sonido sera ver con este mismo detalle el dibujo de la seal de audio mientras
omos lo que est representando. Con el editor de sonido podemos conseguir algo
aproximado si hacemos que la ventana en la que se representa la seal se vaya actualizando conforme la msica va sonando. Pero la forma idnea de representar en vivo
las vibraciones sonoras es mediante un osciloscopio.
Un osciloscopio es un instrumento de observacin y medicin que hace pasar a tiempo real la seal de audio por una ventana de observacin. En Teora de Seal se llama
ventana de observacin a la funcin matemtica que recorta un fragmento de la seal
de un determinado tamao.
Para simular un osciloscopio he realizado un vdeo en el que podemos ver y escuchar
sincronizadamente la oscilacin de los mismos compases iniciales de la Quinta Sinfona de Beethoven del vdeo anterior. He elegido una ventana de observacin de
50 milsimas de segundo porque ese tamao es lo sucientemente corto como para
que se pueda apreciar el detalle de la vibracin y lo sucientemente largo como para
permitirnos observar la forma de las oscilaciones.
Figura 2.5: Vdeo con la representacin en un osciloscopio simulado de los compases iniciales de la
Quinta Sinfona de Beethoven.
25
Podemos entender de manera intuitiva en qu consiste un osciloscopio si imaginamos que la seal de audio, la grca de la vibracin, va pasando por delante de nuestra
ventana de observacin a la vez que va sonando, entrando por la derecha y saliendo
por la izquierda. Algo as como si tuviramos la grca de la seal de todo el fragmento sonoro escondida a la derecha de la ventana del osciloscopio (una ventana en
la que caben 50 milsimas de segundo) y la hiciramos pasar de derecha a izquierda
por delante de nuestra ventana a la misma velocidad con la que est sonando.
El hecho de ver casi simultneamente un fragmento de 50 milsimas de segundo nos
permite estudiar una realidad como la vibracin sonora que cambia tan rpidamente
que de otro modo sera imposible observar. Mediante esta especie de osciloscopio
digital podremos apreciar la forma de la vibracin que est sonando y su evolucin
conforme el sonido va cambiando. Podemos parar el vdeo en cualquier momento y
analizar la forma de la vibracin en las 50 milsimas de segundo correspondientes al
momento en el que lo hemos detenido.
Mediante este vdeo-osciloscopio podemos apreciar que cuando suena una nota musical aislada las formas de la vibracin tienden a repetirse, lo que nos produce la impresin de que en ese momento el movimiento de la grca se hubiera detenido o
ralentizado. En realidad estamos viendo pasar la grca a la misma velocidad que
antes, pero, como las formas de la oscilacin se repiten muchas veces con escasas
variaciones, la sensacin ptica que obtenemos es ms esttica.
Esta repeticin, unida al ritmo en el que se actualizan los cuadros en el vdeo y a
la persistencia en nuestra retina de las imgenes, nos produce diferentes ilusiones
pticas: a veces parece que las formas de la oscilacin se dirigieran a la derecha, otras
a la izquierda, otras parecen casi detenerse y en otras ocasiones da la impresin de
que se superpusieran dos vibraciones distintas. Pero estas ilusiones pticas no nos
interesan ahora, pues nuestra atencin solamente debe estar dirigida a la forma de la
vibracin y a su evolucin.
2.5.
Conclusin
Al margen de las numerosas utilidades prcticas en los campos del registro, edicin
y difusin de las obras musicales o de los acontecimientos sonoros de todo tipo, la
26
representacin digital del sonido ofrece muchas posibilidades para el estudio acstico.
Puesto que la seal de audio digital es una representacin dedigna de la vibracin
sonora, a partir de ella podemos obtener con facilidad todo tipo de grcas e imgenes
que nos ayudarn a entender el sonido y la relacin entre los parmetros fsicos de
la vibracin y nuestra percepcin. As mismo, podremos utilizar tcnicas numricas
para extraer la informacin que contiene.
27
Captulo 3
Caractersticas de los sonidos musicales
3.1.
Introduccin
Imaginemos que hacemos escuchar a un grupo de personas de distintas edades, culturas y formacin musical varios fragmentos sonoros y les pedimos que nos digan
en cada caso cundo se trata de msica y cundo no. Con independencia de instrumentos, de anaciones y escalas o de su procedencia cultural, nadie dudar en decir
si lo que est escuchando es msica o no lo es.
En efecto, distinguimos con facilidad los sonidos propios de la msica del ruido que
produce un atasco de trco, o del murmullo de una fuente de agua, o de las palabras
de una conversacin, por poner unos ejemplos. Ciertamente, hay circunstancias en
las que esta distincin no resulta tan obvia, como, por ejemplo, cuando en una obra
musical contempornea se utilizan los ruidos procedentes de una fbrica. Pero, al
margen de casos similares, todos sabemos reconocer si lo que est sonando son o no
son sonidos musicales.
Ahora bien, en qu consisten estas diferencias que percibimos? Las seales de audio
que contienen informacin musical tienen alguna particularidad que las hace distintas de otros tipos de seales sonoras? Por qu el ruido se considera lo opuesto al
sonido musical? Este captulo va a tratar de responder a estas cuestiones, mostrando
las peculiaridades que poseen las vibraciones de los sonidos que consideramos musicales.
28
3.2.
por medio del osciloscopio las vibraciones de los sonidos especcamente musicales
con las de otros sonidos que no lo son.
3.3.
Antes de entrar en la observacin de seales reales, voy a presentar dos sonidos generados articialmente que denen los polos opuestos entre los que se mueven los
sonidos naturales: el ruido blanco y el sonido simple. En un extremo, el ruido blanco
llamado as por analoga con la luz blanca contiene todas las frecuencias del espectro con la misma intensidad. En el otro extremo, el sonido simple posee una sola
frecuencia que se mantiene estable durante toda su duracin y es el paradigma del
sonido musical.
Para comparar cmo es la forma de la vibracin en ambos casos, he construido un
vdeo en el que se observa en el osciloscopio un fragmento de ruido blanco seguido
de un sonido simple de 440 Hz.
Figura 3.1: Vdeo que simula un osciloscopio con un fragmento de ruido blanco y otro de un sonido
simple de 440 Hz.
Durante toda la primera parte del vdeo, cuando suena el ruido blanco, resulta imposible identicar alturas tonales, notas musicales. Aun es ms, ni siquiera podramos
30
responder a la pregunta de si este sonido es agudo o grave. En principio, el chisporroteo de la parte aguda es lo que resulta ms evidente, pero con un poco de esfuerzo
podemos distinguir tambin el ronroneo de los graves. Esta diferencia de apreciacin
se debe a que nuestro odo no responde a todas las frecuencias por igual, sino que
es ms sensible a la banda situada entre los 2.000 y los 5.000 Hz. Pero, al margen de
las irregularidades de nuestra sensibilidad auditiva, en el vdeo podemos apreciar que
este sonido contiene todas las frecuencias del espectro audible, de la misma manera
que la luz blanca contiene todos los colores visibles.
En la segunda parte del vdeo, sin embargo, la situacin es completamente distinta.
Todos omos una nota musical, en concreto, un la4 anado a 440 Hz, la nota que
habitualmente sirve de referencia para denir la anacin estndar.
Atendamos ahora a la seal de audio, al dibujo que traza la vibracin y que se observa
en el osciloscopio. Cuando suena el ruido blanco la grca va cambiando aleatoriamente a lo largo del tiempo y no hay manera de reconocer en ella ningn orden.
Si paramos el reproductor del vdeo en un cuadro cualquiera, veremos una imagen
similar a la siguiente:
manera en la que ha sido generada esta seal: para calcular el valor de las muestras he
utilizado una secuencia de nmeros aleatorios, como si hubiera echado a suertes el
valor de cada muestra en una lotera en la que estuvieran todos los nmeros posibles,
sin que los valores que hubieran salido previamente inuyeran en las probabilidades
de los siguientes. As pues, la seal de audio del ruido blanco es completamente
aleatoria.
Por el contrario, en la segunda parte del vdeo, mientras suena el sonido simple,
la grca que dibuja la vibracin en la pantalla del osciloscopio tiene una forma
denida: una serie de eses iguales. Si paramos el reproductor del vdeo obtendremos
una imagen como sta:
Al ver la grca de esta nota simple podemos predecir con total seguridad cmo
va a continuar. Ello se debe a que los valores de las muestras de esta seal han sido
obtenidos mediante una funcin matemtica. Por ello decimos que la seal de audio
de un sonido simple es puramente determinista.
Y, lo que es ms importante, en esta grca distinguimos que la forma se repite en
intervalos de tiempo exactamente iguales, es decir, existe un periodo de repeticin.
Podemos apreciar que en las 50 milsimas de segundo de la grca se han sucedido 22
oscilaciones completas; en un segundo, por lo tanto, se habrn producido 440 oscilaciones. Vemos, as pues, que la frecuencia de este sonido, el nmero de oscilaciones
32
3.4.
Comparemos ahora dos situaciones acsticas naturales de ndole opuesta: por un lado,
el ambiente sonoro de una ciudad en un da de lluvia y con trco abundante y, por
otro, unas pocas notas de clarinete tomadas de los compases iniciales de la Rapsodia
para piano y clarinete de Claude Debussy.
33
Figura 3.4: Vdeo que simula un osciloscopio con ruido de trco en un da lluvioso, en la primera
parte, y cinco notas de clarinete de la Rapsodia para piano y clarinete de C. Debussy, en la segunda.
Durante la primera parte, el ambiente sonoro de fondo del trco con lluvia nos
recuerda el ruido blanco que hemos odo en el vdeo anterior. Sin embargo, nos
damos cuenta enseguida que ahora tienen ms presencia los componentes graves.
Podramos decir, siguiendo la analoga de los colores, que esta sonoridad tiende al
rojo, la parte inferior del espectro. Esto es debido a la aportacin que hace el trco
al sonido de la lluvia. Si detenemos el vdeo en los segundos iniciales observaremos
una imagen similar a la siguiente:
34
Vemos en esta seal que, igual que en el caso del ruido blanco, ni hay periodicidad
alguna ni resulta posible predecir con seguridad el valor de cualquier muestra a partir
de las que le preceden. Sin embargo, el grado de aleatoriedad es ahora menor, pues las
muestras anteriores s inuyen en las posibilidades de la que viene a continuacin. En
efecto, en la grca podemos apreciar, tomando como referencia una muestra cualquiera, que los valores ms prximos a las muestras inmediatamente anteriores son
ms frecuentes que los ms alejados. Esto explica que la grca, aun siendo una lnea
quebrada, mantenga una cierta continuidad. Cuando analicemos esta seal mediante
el anlisis espectral entenderemos mejor el signicado de todo esto.
Por otro lado, en medio de este ruido rojo de fondo, podemos distinguir varios acontecimientos sonoros. Omos el motor de un coche que acelera, con lo que su sonido
se va haciendo ms agudo y se incrementa su volumen. Omos tambin otros coches
ms lejanos. Y ya casi al nal de esta primera parte del vdeo escuchamos la bocina
de un coche. Si prestamos atencin, nos damos cuenta de que esta bocina est dando
una nota musical, en concreto, una nota que podramos situar entre un sol4 y un
lab4 . En el osciloscopio podemos ver que la seal, que hasta entonces era claramente
aleatoria, parece adquirir en ese momento cierta periodicidad.
En la segunda parte del vdeo, sin embargo, todos omos con claridad las cinco notas
del clarinete (la4 , si4 , solb4 , mib4 , re4 ). Puede que quien no tenga odo absoluto o sus
conocimientos de msica sean menores no sea capaz de darles nombre, es decir, no
pueda determinar si se trata de un la o de un si, pero todos sabemos que lo que suena
son notas musicales.
Podemos observar tambin que mientras est sonando cada una de las notas, la grca
que aparece en la pantalla del osciloscopio es bastante estable, pues la vibracin se
repite de manera parecida durante la duracin de la nota. Por eso, ahora tambin
podemos hablar de una forma de la vibracin, como ocurra en el caso del sonido
simple, si bien se trata de una forma ms compleja que una sencilla ese. Como se
explica en el captulo dedicado al sonido armnico, la forma de ese dibujo tiene que
ver con la cualidad del sonido, con el hecho de que sea ms suave o ms spero, por
poner un ejemplo.
Si paramos el reproductor del vdeo cuando suena la nota si4 , obtendremos una grca parecida a la siguiente:
35
Puesto que hay una forma que se repite, podremos hablar aqu tambin de periodo
de la oscilacin y, a partir de ah, deducir su frecuencia. En efecto, en esta grca,
que representa 50 milsimas de segundo, podemos distinguir casi 25 oscilaciones,
pues la ltima no est del todo completa, por lo que deducimos que en un segundo
se habrn producido un poco menos de 500 oscilaciones. Esta frecuencia de 500
Hz es ligeramente superior al valor que esperaramos para la nota si4 en la anacin
estndar (493,9 Hz), pero se aproxima bastante a la frecuencia real de la nota que
estamos escuchando (497 Hz).
Y, puesto que existe una forma, es posible tambin predecir cmo va a continuar
la seal en las prximas milsimas de segundo, a no ser, claro est, que se produzca
algn cambio repentino, como, por ejemplo, que empiece a sonar otra nota.
As pues, hemos podido observar que durante la primera parte del vdeo, en el trco con lluvia, predomina la aleatoriedad, por lo que la seal de audio que vemos en
el osciloscopio tiene muchos rasgos en comn con la del ruido blanco que hemos
analizado en el apartado anterior. Durante la segunda parte del vdeo, sin embargo, cuando suenan las notas del clarinete, hemos comprobado que la seal tiende a
ser de tipo determinista y tambin hemos podido apreciar con claridad su periodicidad.
Mediante los ejemplos que hemos estudiado hasta ahora podemos obtener la idea
general de que el ruido se corresponde con el desorden, con la aleatoriedad, con
36
3.5.
Ahora bien, son tan claras las cosas? Hay una lnea que delimita con nitidez las
vibraciones propias de los sonidos musicales? Podemos determinar con precisin
dnde empieza el sonido musical y dnde termina el ruido? E incluso ms, hay
siempre una separacin clara entre los sonidos peridicos y los que no lo son? La
respuesta es que no, que en medio hay un amplio territorio difuso. Ciertamente,
hay sonidos que no pueden ser considerados como ruidos, pero que tampoco son
propiamente peridicos; y hay sonidos que son claramente musicales, pero que estn
lejos de ser estrictamente peridicos.
A continuacin vamos a comparar dos sonidos que pertenecen a esta zona intermedia
que se encuentra lejos de los extremos opuestos de la pura aleatoriedad y la periodicidad estricta, es decir, lejos del ruido blanco y del sonido simple. Se trata del sonido
de una campana de iglesia y el de una nota de piano, en concreto un sol3 .
Figura 3.7: Vdeo que simula un osciloscopio con el sonido de una campana, en la primera parte, y
el de una nota de piano, en la segunda.
37
Podemos apreciar en el vdeo que existe un gran parecido en la forma en la que evoluciona la vibracin de los dos sonidos. Ciertamente, ambos son sonidos percutidos,
por lo que las vibraciones que observamos en el osciloscopio tienen bastantes semejanzas: el ataque es muy rpido y abrupto, ruidoso en ambos casos, y va seguido de
un decrecimiento inmediato que conduce a un nivel sonoro considerablemente ms
bajo; una vez alcanzado ese nivel, el sonido prolonga su duracin durante bastante
tiempo, decayendo lentamente.
Todo este proceso va acompaado de un cambio constante en la cualidad del sonido,
pues con el paso del tiempo se van extinguiendo progresivamente los componentes ms agudos. Por eso vemos en el osciloscopio que la forma de la vibracin se va
haciendo cada vez ms sencilla, hasta recordar al nal la grca de un sonido simple.
Pero, aunque el sonido de la campana y el del piano tienen todos estos rasgos en comn, ambos se diferencian en algo que es fundamental para discernir si son sonidos
musicales: la posibilidad de atribuirles una altura tonal. Cuando suenan las notas del
piano todos percibimos una altura tonal que permanece constante, aqu en concreto
un sol3 . Pero si tratamos de responder a la pregunta de qu nota est dando la campana, nos encontraremos que durante la mayor parte de su duracin no podemos
dar una respuesta, y slo al nal, en la parte que queda resonando, podemos apreciar
una altura tonal clara, un lab4 un poco bajo. Por ello, podemos armar que en el caso
del sonido de esta campana estamos al otro lado de la frontera que delimita el sonido
musical.
Esta diferencia que percibimos al or ambos sonidos responde a las diferencias que se
producen en la vibracin, como podemos observar en las dos seales de audio. En el
caso de la campana, a excepcin de la resonancia nal donde la forma de la vibracin
es similar a la de un sonido simple, no podemos reconocer en la grca ninguna
periodicidad, si bien comprobamos que est muy lejos de las grcas del ruido blanco
o del ruido de trco que hemos observado en los vdeos anteriores.
Para apreciar esto con claridad, veamos las grcas que se obtienen si paramos el
vdeo en un momento cualquiera en pleno sonido de la campana, primero, y del
piano, despus.
38
39
En la grca del piano la situacin es diferente. A pesar de que ni siquiera durante este
breve intervalo de 50 milsimas de segundo, la forma que dibuja la vibracin se repite
idnticamente igual, s es posible reconocer en ella una forma compleja que, aun con
variaciones, se renueva cada cierto intervalo exacto de tiempo. Por lo tanto, aunque
no podamos decir que esta seal sea estrictamente peridica, s podemos armar sin
ninguna duda que posee un periodo de oscilacin que se mantiene constante y que
posibilita el reconocimiento de una altura tonal. En efecto, en esta grca podemos
contar aproximadamente unas nueve oscilaciones y media, lo cual correspondera a
una frecuencia de 190 Hz, muy prxima a la frecuencia real del sol3 que est sonando,
196 Hz.
Movimiento vibratorio peridico, en un sentido estricto, signica que el movimiento
tiene que repetirse exactamente igual cada cierto intervalo de tiempo, su periodo.
Pero en el caso de una nota musical real, como sta que estamos observando, con
toda su complejidad, la periodicidad no es perfectamente estricta. Su oscilacin es
compleja, por lo que la forma que se repite no es exactamente igual, sino que va
evolucionando con el paso del tiempo, y eso es lo que le proporciona su riqueza
sonora. Y no slo su forma va cambiando, sino que tambin con el paso del tiempo
vara su amplitud.
No obstante, a pesar de todos estos cambios e inestabilidades, en ese intervalo de
tiempo de 50 milsimas de segundo que estamos observando, la forma de la vibracin
de esta nota de piano resulta lo sucientemente peridica como para poder percibir
una altura tonal. Este es el estado que predomina en los sonidos musicales reales, salvo
en los momentos en los que se producen cambios abruptos, como, por ejemplo, en
el inicio de una nueva nota.
As pues, la frontera que delimita el sonido musical reside en que su vibracin
sea lo suficientemente peridica como para poder percibir una altura tonal determinada.
3.6.
Habla y canto
Hemos visto hasta ahora que la periodicidad es esencial al sonido musical. Pero, podemos armar que todos los sonidos que muestran cierta periodicidad son musicales?
40
Qu sucede con los sonidos del habla? Vamos a comparar ahora en el osciloscopio
las vibraciones de los sonidos del habla con los del canto, a n de precisar con ms
nitidez qu es lo especco del sonido musical.
Para estudiar estas diferencias he fabricado un vdeo en el podremos observar con
detalle las particularidades que adquieren los sonidos del habla cuando reciben msica. En la primera parte se presenta la seal de audio de un breve fragmento hablado
de una locutora de radio y, en la segunda, la seal de un pequeo fragmento cantado, en concreto, el inicio del Lamento de Ariadna de Claudio Monteverdi. En ambos
casos se trata de sonidos propios del habla; la nica diferencia es que en el segundo
la prosodia natural del lenguaje hablado ha sido sustituida por la meloda del canto.
Mediante este vdeo podremos ver en qu se diferencia la vibracin de los sonidos en
los que podemos reconocer de qu vocal se trata (si es una a o es una e, por poner un
ejemplo) de otros sonidos en los que, adems de reconocer su fonema, percibimos
claramente una nota musical.
Figura 3.10: Vdeo que simula un osciloscopio con un fragmento de una locutora de radio, en la
primera parte, y el inicio del Lamento de Ariadna, en la segunda.
42
La parte de la seal correspondiente a cada fonema est delimitada por unos corchetes. Aunque es imposible una separacin precisa, responde bastante elmente a
la realidad de lo que omos. Podemos apreciar que existe una diferencia muy clara
entre la forma de la vibracin de las consonantes y la de las vocales: las vocales son
claramente peridicas, mientras que las consonantes no son peridicas y tienden al
ruido. Observamos tambin que las consonantes oclusivas, la t y la k, son muy breves,
mientras que la s es bastante ms larga y relativamente parecida al ruido blanco.
Si midiramos mediante un editor de sonido el periodo de cada una de las vocales y,
a partir de ello, dedujramos su altura tonal, comprobaramos que la slaba acentuada
es casi un semitono ms aguda que la vocal siguiente i y cerca de semitono y medio
ms alta que la tercera vocal a, cuya slaba, sin embargo, es la que tiene ms intensidad
sonora y mayor duracin.
Comprobamos que en espaol el acento de la palabra no se produce ni por una mayor
intensidad sonora ni por un alargamiento de la duracin, sino por una elevacin de
la altura tonal, lo cual justica que se llame slaba tnica a la que va acentuada. As
pues, al margen de la entonacin general propia de la prosodia, la relacin de agudeza
y gravedad entre los sonidos de la cadena hablada explica nuestra distincin entre
slabas acentuadas y sin acentuar, como podemos apreciar si volvemos a escuchar
con detenimiento cmo suena la palabra ticas.
43
Pero lo que interesa ahora es responder a la pregunta siguiente: las vocales, cuyo
movimiento vibratorio es peridico, son propiamente sonidos musicales? Lo cierto
es que no omos una nota musical cuando suenan. La razn de que, en principio, en
la cadena hablada no identiquemos una nota musical cuando se emite una vocal, a
pesar de que se trata de un sonido peridico, reside en la brevedad de la parte peridica. En efecto, vemos que cada vocal apenas llega a completar unos pocos ciclos.
Esto, debido al constante entrecortarse en su articulacin con el sonido consonntico vecino, impide que reconozcamos esa periodicidad y que la apreciemos como un
sonido musical.
Para observar un detalle de la forma de la vibracin cuando se emite la slaba ti,
presento una grca que tiene la misma duracin que la ventana de observacin de
los vdeos y en la que he hecho zoom en la amplitud, que ha quedado delimitada
entre -0,4 y 0,4.
que la seal permanece claramente estable al menos durante todo el tiempo que dura
la observacin.
Vemos que durante las 50 milsimas de duracin la seal permanece estable, lo cual
es suciente para que se pueda percibir una altura tonal. Conforme evolucione el
sonido, incluso durante la propia emisin de la vocal a, se modicar la forma, la
amplitud e incluso el periodo, pero, al margen de estas modicaciones, el sonido
en el canto es lo sucientemente estable y duradero como para permitirnos apreciar
con claridad una altura tonal. Por poner un ejemplo, si emitimos al hablar la vocal a,
no pensaremos que estamos dando una nota musical; ahora bien, si prolongamos la
duracin de la vocal y nos esforzamos en mantener constante la misma altura tonal,
enseguida nos daremos cuenta de que estamos emitiendo una nota musical.
As pues, el requisito de sucientemente peridico, que hemos reconocido en el
apartado anterior como necesario para determinar que un sonido sea musical, exige
tambin una cierta duracin, es decir, necesitamos que la periodicidad se mantenga durante el suficiente tiempo como para que nuestro sistema perceptivo
sea capaz de apreciar una frecuencia, y con ella, una altura tonal.
45
3.7.
Conclusin
A lo largo de este captulo hemos podido apreciar las caractersticas que posee el
sonido musical. Ayudndonos de la seal de audio que queda representada en el osciloscopio, hemos comparado lo que omos cuando escuchamos un sonido musical,
con lo que omos cuando se trata de sonidos ruidosos y de otros de cualidad intermedia, de modo que hemos podido experimentar que un sonido es considerado por
nuestra percepcin auditiva como musical cuando su vibracin es lo sucientemente
peridica y duradera cmo para que podamos reconocer una altura tonal.
46
Captulo 4
El sonido simple
4.1.
Introduccin
El sonido simple, tambin llamado sonido puro, es el sonido al que da lugar la vibracin ms sencilla posible, aquella que se comporta siguiendo lo que en Fsica se
denomina Movimiento Armnico Simple (MAS). El calicativo armnico para describir este movimiento procede precisamente de su vinculacin con la msica.
Empecemos observando cmo es un sonido simple. En el captulo 1, El sonido como
vibracin, he utilizado un sonido simple para estudiar la vibracin del aire, precisamente porque su oscilacin es muy sencilla y repetitiva, un simple vaivn. Volvamos,
pues, al vdeo de la gura 1.1 de ese captulo donde se simula a cmara lenta el movimiento del aire cuando suena un sonido simple generado articialmente, la nota
musical la4 a 440 Hz, sin armnicos y de frecuencia y amplitud totalmente estables.
En el vdeo de la gura 1.2 de ese captulo tenemos el detalle del movimiento oscilatorio de una de las esferitas de la simulacin, donde se ve cmo la oscilacin dibuja
en el tiempo una serie de eses enlazadas.
Veamos ahora un vdeo donde podemos apreciar en tiempo real mediante el osciloscopio la forma de la vibracin cuando suena esa misma nota.
47
Figura 4.1: Vdeo con un sonido simple, la4 a 440 Hz, visto en un osciloscopio.
4.2.
48
Veamos a continuacin brevemente las implicaciones que se derivan de las propiedades del sonido simple.
El sonido musical puede ser considerado como una composicin de sonidos simples
cuyas frecuencias mantienen entre s unas determinadas relaciones de conmensurabilidad. En este sentido, al sonido musical se le llama tambin sonido armnico,
pues la palabra griega harmona designaba, en origen, la buena mezcla que resulta de
una proporcin adecuada.
En efecto, al margen de fenmenos transitorios y de la parte de ruido que cualquier
sonido natural lleva consigo, todo sonido musical est formado por un conjunto de
sonidos simples denominados parciales. Salvo excepciones, las frecuencias de estos
49
50
Como veremos enseguida, el Movimiento Armnico Simple es la proyeccin unidimensional del Movimiento Circular Uniforme y comparte con l el atributo de
sencillez. Entiendo aqu por movimiento sencillo aqul que no cambia, o que cambia
lo menos posible y de la forma ms suave y continua posible. En este sentido, el sonido simple es la expresin sonora del movimiento ms elemental, sencillo y natural
que surge de las propias condiciones de simplicidad exigidas a la razn: el Movimiento Circular Uniforme. Por utilizar una metfora, el sonido simple es la forma
en la que suena lo que gira eternamente sobre s mismo.
Estas relaciones de anidad entre la vibracin del ms simple de los sonidos musicales
y el Movimiento Circular Uniforme iluminan en parte algunas de las armaciones
hechas por matemticos, fsicos y lsofos de todos los tiempos sobre la constitucin
armnica o musical del universo.
4.3.
4.3.1.
51
Figura 4.2: Vdeo que representa en esquema un MAS, su relacin con el Movimiento Circular
Uniforme y su desarrollo sinusoidal en el tiempo.
En el vdeo hay tres paneles, cada uno con su correspondiente bola roja. Las tres
bolas se mueven al mismo tiempo. Si atendemos nicamente al movimiento vertical
de las bolas rojas, veremos que las tres bolas se encuentran en cada instante a la misma
altura. La lnea de puntos verde que las une resalta este hecho.
Analicemos con detalle lo que vemos en cada uno de estos tres paneles:
a) Panel central
En el panel del medio vemos una pequea bola roja que simula estar suspendida de
un muelle colgado del techo. Suponemos que antes de comenzar el vdeo hemos
desplazado la bola hacia abajo, desde la posicin de equilibrio, que en la grca se
corresponde con la altura 0, hasta la altura -1. El vdeo empieza justo en el momento
en el que hemos soltado la bola y ha comenzado a oscilar.
Para entender lo que sucede es necesario tener presente un principio de carcter universal que constituye el fundamento de la Fsica, la Segunda Ley de Newton, la cual
dice que cualquier cuerpo sobre el que no acta ninguna fuerza conserva indenidamente su velocidad. Por otra parte, es necesario suponer tambin que hemos elegido
52
53
En ese punto justo la bola se detiene y su velocidad se hace 0. Pero esta pausa es
instantnea, pues la fuerza que la ha frenado sigue apuntando hacia abajo, por lo que
inmediatamente la bola comienza a descender. Y va ganando de nuevo velocidad,
ya que ahora, al apuntar la fuerza en la misma direccin que va la bola, no la frena,
sino que la acelera, hasta pasar de nuevo por la posicin de equilibrio, la altura 0, a
la misma velocidad mxima con la que haba pasado al subir.
Una vez superada la posicin de equilibrio, la bola comienza a ser frenada hasta llegar
a la altura -1, donde otra vez se detiene instantneamente. Y de nuevo comienza a
ascender. Y as sucesivamente.
Este movimiento continuara eternamente si no fuera por las fuerzas de friccin, entre otras la del aire, que progresivamente van atenuando la oscilacin de la bola.
b) Panel izquierdo
El panel izquierdo ilustra la conexin del Movimiento Armnico Simple con el Movimiento Circular Uniforme y muestra que el Movimiento Armnico Simple es la
proyeccin unidimensional del Movimiento Circular Uniforme. Este relacin
nos permite entender el concepto de fase instantnea de la oscilacin y nos muestra
que la altura que alcanza la bola en cada instante es el seno de esta fase.
En este panel de la izquierda vemos otra bola roja que va recorriendo una circunferencia. El radio de esta circunferencia es igual a la altura mxima que alcanza el
desplazamiento de la bola del panel central. Adems, ambas bolas, la que se desplaza
por la circunferencia y la del muelle, estn sincronizadas: la altura instantnea de la
bola que gira uniformemente alrededor de la circunferencia es la misma que la altura de la bola que oscila en el muelle. Dicho de otro modo, la altura de la bola es la
proyeccin en el eje vertical de la posicin de la bola en la circunferencia.
Pero, a diferencia de la bola que oscila en el muelle, la celeridad del movimiento de
la bola que se traslada por la circunferencia en el panel de la izquierda se mantiene
constante: en cada unidad de tiempo recorre un arco de circunferencia de la misma
longitud. Si lo expresamos en medidas angulares vemos que, en este ejemplo, recorre
90 en cada segundo, por lo que tarda 4 segundos en realizar una vuelta completa,
como podemos comprobar en el propio reloj del vdeo.
54
c) Panel derecho
El panel derecho sirve para ilustrar que el Movimiento Armnico Simple es una
funcin sinusoidal del tiempo.
La grca del panel de la derecha va describiendo las sucesivas alturas por las que pasa
la bola al oscilar a lo largo del tiempo. De hecho, si seguimos con el dedo esta grca, podemos vericar de manera intuitiva la descripcin del Movimiento Armnico
Simple que he presentado al comentar el desplazamiento de la bola en el panel central. En efecto, podemos apreciar, entre otras cosas, cmo el movimiento aumenta su
velocidad conforme se acerca a la posicin de equilibrio; cmo la disminuye cuando
se aleja de sta; cmo se detiene instantneamente y cambia de sentido al alcanzar
los desplazamientos mximos en los segundos 0, 2, 4, 6, 8, 10, 12.
Como hemos visto, la altura de la bola es la proyeccin en el eje vertical de su posicin
en la circunferencia. Esta proyeccin es el seno del ngulo que dene la posicin de
la bola en la circunferencia, la fase de la oscilacin. Dado que la celeridad de la bola al
recorrer la circunferencia es constante con independencia de que su movimiento
pueda ser ms o menos rpido, este movimiento giratorio depende linealmente
del tiempo, es decir, es la misma imagen del tiempo, como si fuera un reloj. Por
ello la descripcin de la evolucin temporal del Movimiento Armnico Simple que
realiza la bola en su ascender y descender es una funcin sinusoidal que depende del
tiempo.
4.3.2.
Ahora, con ayuda del vdeo, voy a explicar brevemente los parmetros que intervienen en el Movimiento Armnico Simple: amplitud, fase inicial, periodo y frecuencia.
a) Amplitud
este valor es 1, tanto cuando la bola del muelle va hacia arriba, como cuando va hacia
abajo.
b) Fase inicial
c) Periodo y frecuencia
57
4.4.
El sonido simple es una vibracin mecnica que se comporta segn el modelo oscilatorio que acabamos de estudiar. En efecto, el sonido simple es un caso particular
del Movimiento Armnico Simple. Ahora bien, para ser percibida por nosotros
como sonido, la oscilacin debe ser lo sucientemente rpida, en concreto, debe realizar entre 20 y 20.000 oscilaciones completas por segundo, que es aproximadamente
el rango en el que se mueve nuestro sistema auditivo.
As pues, el movimiento oscilatorio que he descrito con detenimiento en el ejemplo
de la bola y el muelle nos puede servir para entender cmo es la vibracin de un
sonido simple. En lugar de la bola oscilante pensemos ahora en un pequeo volumen
de aire que se comprime y se expande de la manera ms sencilla posible, es decir, con
un Movimiento Armnico Simple.
Cuando se emite un sonido simple, los valores que va tomando la oscilacin de la
presin del aire en un punto del espacio a lo largo del tiempo describen una grca
sinusoidal similar a la del panel derecho que aparece en el vdeo de la gura 4.2. En
efecto, en el sonido simple la presin del aire oscila segn una funcin sinusoidal del tiempo.
Examinemos ahora los parmetros del Movimiento Armnico Simple en el caso concreto de la vibracin sonora.
4.4.1.
Veamos los parmetros del sonido simple en una grca que muestra las primeras 50
milsimas de segundo de la seal de audio correspondiente a la nota la4 que hemos
observado en el osciloscopio de la gura 4.1.
58
Figura 4.4: Grca de los 50 ms iniciales de un sonido simple, la4 a 440 Hz, con la amplitud y el
periodo.
Esta grca representa la variacin, respecto a su valor medio, de la presin del aire en
un punto del espacio a lo largo del tiempo o, lo que podemos considerar equivalente,
el desplazamiento de la membrana de un micrfono situado en ese punto del espacio
que hubiera recogido esa variacin de la presin del aire.
a) Amplitud
59
La amplitud de un sonido depender del punto del espacio que tomemos como referencia, pues disminuir conforme mayor sea la distancia de la fuente sonora.
b) Fase inicial
c) Periodo y frecuencia
60
4.5.
Conclusin
61
Captulo 5
Altura tonal, intervalos y volumen sonoro
5.1.
Introduccin
5.2.
Puesto que nuestra sensacin auditiva se comporta de manera similar al resto de nuestros sentidos, comenzaremos estudiando las relaciones matemticas que se establecen
entre los estmulos fsicos y nuestras sensaciones. Me reero al carcter logartmico
de nuestro sistema sensorial, tal como ha quedado denido mediante la llamada Ley
de Weber-Fechner.
En la segunda mitad del siglo XIX Gustav Fechner, basndose en los trabajos previos
de Ernst Weber, expres una ley que relacionaba los estmulos fsicos con las sensaciones que experimentamos al recibirlos. Al margen de matizaciones y excepciones,
la Ley de Weber-Fechner establece que el estmulo debe crecer en progresin geomtrica para que la intensidad de la sensacin crezca en progresin aritmtica. Esto
signica que la relacin entre la variacin de los parmetros fsicos que actan
de estmulo y la de nuestras sensaciones no es lineal, sino logartmica.
Veamos con un ejemplo qu signica que nuestra sensacin responda logartmicamente al incremento o disminucin de los estmulos. Imaginemos que recibimos
cuatro estmulos sucesivos, a los que llamamos a, b, c y d. El parmetro fsico asociado
al estmulo a tiene una intensidad de 100; el de b, de 200; el de c, de 400; y el de d,
de 800. Podemos comprobar que cada uno de ellos es el doble del anterior, es decir,
que crecen manteniendo una progresin geomtrica cuya razn es 2 y cuyo primer
trmino es 100:
100; 100 2 = 200; 100 2 2 = 400; 100 2 2 2 = 800; ...
Cuando pasamos del estmulo a al b, entre los cuales hay una distancia aritmtica
de 100, nuestra sensacin aprecia una diferencia. Tomemos para nuestro ejemplo
63
esa diferencia sensorial como unidad y consideremos a partir de ahora que nuestra
sensacin se ha incrementado en un grado al pasar del estmulo a al estmulo b.
Examinemos ahora lo que suceder al pasar del estmulo b al c. La diferencia aritmtica
entre los parmetros fsicos del estmulo b y del estmulo c es de 200 (400-200), es
decir, el doble de la diferencia aritmtica que hay entre los estmulos a y b. Si nuestra
sensacin respondiera de forma lineal al incremento del parmetro fsico, cuando
pasramos del estmulo b al c tendramos que percibir un incremento de dos grados.
Sin embargo, esto no sucede as, sino que experimentamos un incremento de un
grado, el mismo que hemos percibido al pasar del estmulo a al b. Y este mismo
incremento de un grado es tambin el que percibiremos cuando pasemos del estmulo
c al d, aunque la diferencia aritmtica entre sus parmetros sea de 400 (800-400).
La explicacin reside en que nuestra sensacin reconoce como incremento de
un grado el cociente entre las intensidades de los estmulos, no su diferencia
aritmtica. Por eso, aunque en nuestro ejemplo hayamos tomado como unidad sensitiva el paso del estmulo a al b, lo signicativo no ha sido la diferencia aritmtica
que hay entre ambos estmulos (es decir, 100), sino la razn b/a que se establece entre
ellos, que es la misma que c/b y que d/c. En este caso, se trata de la razn doble, la
representada por el nmero 2:
200
400
800
2
=
=
=
100
200
400
1
Esto quiere decir que cada vez que el parmetro fsico se multiplique por 2, nuestra
sensacin se incrementar un grado.
Imaginemos ahora que tenemos un nuevo estmulo al que llamaremos e, cuya intensidad es de 3200, y queremos saber cuntos grados sensoriales de incremento percibir nuestra sensacin al pasar del estmulo a a ese estmulo e.
La razn entre el estmulo e y el estmulo a es 3200/100, es decir, la representada por
el nmero 32. Puesto que en nuestro ejemplo hemos tomado como unidad de grado
sensorial la razn 2/1, representada por el nmero 2, la pregunta que nos tenemos que
hacer ahora es: cuntas veces tenemos que multiplicar el nmero 2 por s mismo para
obtener el nmero 32? O, dicho de otra manera, a qu exponente hay que elevar el
nmero 2 para obtener el nmero 32?
64
La respuesta es el logaritmo en base 2 del nmero 32, el cual es 5: 25 = 32. Esto signica que si la intensidad del parmetro fsico pasa de 100 a 3200, nosotros sentiremos
un incremento de 5 grados. As pues, el paso del estmulo a al estmulo e provocar una sensacin 5 veces ms intensa que la que hemos experimentado al pasar del
estmulo a al estmulo b.
Generalizando, para saber cuntos grados sensoriales experimentamos cuando
el estmulo cambia de intensidad, basta obtener el logaritmo del cociente entre
el estmulo final y el inicial, logaritmo que ha de tener como base la razn
numrica que hemos elegido como unidad sensorial.
En efecto, el logaritmo, como su nombre indica, es el nmero que mide la razn (la
palabra logaritmo procede del griego lgos, razn, y arithms, nmero) y, por ello, el
logaritmo realiza la conversin de los valores de los parmetros fsicos a las unidades
en las que se miden nuestras sensaciones. Por eso se dice que nuestra percepcin es
logartmica.
Con todas las matizaciones, excepciones y limitaciones que sera necesario hacer en
cada caso, la Ley de Weber-Fechner tiene especial inters para conocer cmo omos la
msica, pues, como veremos enseguida, nuestra audicin percibe las diferencias de
frecuencia y de amplitud de modo logartmico.
5.3.
La altura tonal que percibimos al or un sonido peridico y con ella la nota musical
que reconocemos est determinada por el parmetro fsico de frecuencia (o por su
inversa, el periodo). Conforme mayor es la frecuencia de un sonido, ms aguda es la
altura tonal que apreciamos, y viceversa.
A continuacin vamos a analizar el modo en el que las notas y los intervalos musicales
estn vinculados con la frecuencia de los sonidos. Comenzaremos comprobando que,
dado el carcter logartmico de nuestro sistema perceptivo, los intervalos se denen
por las razones numricas que se establecen entre las frecuencias. Luego examinaremos las unidades musicales que habitualmente utilizamos para comparar intervalos
entre s: el intervalo de octava y sus divisiones. Y nalmente estudiaremos cmo se
65
establece mediante los intervalos una correspondencia directa entre las frecuencias
de los sonidos y las notas musicales.
5.3.1.
Aunque la altura tonal de una nota tiene un valor musical por s misma, lo cierto es
que los elementos que denen las escalas y los acordes musicales no son las alturas
absolutas de los sonidos, sino los intervalos que se producen entre ellas.
Igual que ocurre con la mayor parte de nuestro sistema sensitivo, en lo que concierne
a la percepcin del intervalo musical tambin est presente la Ley de Weber-Fechner:
la manera en la que percibimos las variaciones de la frecuencia no responde a una
escala lineal, sino a una escala logartmica. Esto explica que el intervalo musical no
sea la diferencia aritmtica entre sus frecuencias, sino su razn numrica, el cociente
que se establece entre ellas.
He fabricado un vdeo que nos va a permitir comprobar cmo percibimos las variaciones de la frecuencia y por qu las magnitudes de los intervalos musicales son
razones numricas. El vdeo est formado por una sucesin de sonidos simples agrupados de dos en dos para que se pueda distinguir con facilidad el intervalo que hay
entre ellos. Consta de dos partes separadas por una pausa larga. En la primera parte
se oyen en primer lugar dos sonidos seguidos, cuyas frecuencias son 220 Hz y 440
Hz, y tras una breve pausa, se oyen otros dos sonidos seguidos de 440 Hz y 660 Hz.
En la segunda parte del vdeo se oye primero otra vez la pareja de sonidos de 220 Hz
y 440 Hz, y luego otra nueva pareja que tiene como frecuencias 440 Hz y 880 Hz. A
medida que se van sucediendo los sonidos, se muestra en un recuadro la frecuencia
y la nota musical correspondiente.
66
Figura 5.1: Vdeo con una sucesin de sonidos simples agrupados por parejas que forman distintos
intervalos.
Podemos apreciar con claridad que percibimos mayor altura tonal en aquellos sonidos
que presentan las oscilaciones ms apretadas, es decir, los que tienen un periodo
menor y, por lo tanto, una mayor frecuencia. Pero, sobre todo, lo que nos interesa
experimentar mediante este vdeo es que el intervalo que percibimos entre dos notas
musicales no est denido por la diferencia aritmtica entre sus frecuencias, sino por
el cociente entre ellas.
En la primera parte del vdeo vemos que entre el primer sonido, el de 220 Hz, y
el segundo, el de 440 Hz, hay una diferencia aritmtica de 220 Hz. Apreciamos al
orlos un salto de altura tonal que es un intervalo de octava, en concreto, el que existe
entre el la3 y el la4 . Ahora bien, cuando escuchamos el salto entre los sonidos de la
segunda pareja entre el tercero, de 440 Hz, y el cuarto, de 660 Hz no percibimos
un intervalo de octava, a pesar de que su diferencia aritmtica es tambin de 220 Hz.
Nuestra sensacin nos dice que el salto ha sido bastante ms pequeo que el que se
produca entre el sonido de 220 Hz y el de 440 Hz. En efecto, ahora no reconocemos
el la5 , sino el mi5 , que est a una distancia intervlica de quinta respecto al la4 .
Sin embargo, al or los cuatro sonidos de la segunda parte del vdeo apreciamos la
misma diferencia intervlica entre la altura tonal de las dos parejas: entre el primer
sonido, cuya frecuencia es de 220 Hz, y el segundo, de 440 Hz, omos un intervalo
de octava, que es el mismo que omos entre el tercer sonido, de 440 Hz, y el cuarto,
de 880 Hz. Pero la diferencia aritmtica entre las frecuencias es distinta: mientras
67
que entre los dos primeros sonidos es de 220 Hz, entre los dos segundos es de 440
Hz.
Comprobamos que lo que ocurre es que la razn entre las frecuencias que denen los
dos intervalos de esta segunda parte del vdeo es la misma: el segundo sonido respecto al primero mantiene la misma razn numrica que el cuarto respecto al tercero,
exactamente la razn doble, 2/1, la cual es la propia del intervalo de octava:
880
2
440
=
=
220
440
1
Hemos podido experimentar que reconocemos el mismo intervalo, la misma distancia perceptiva, cuando entre los sonidos se mantiene la misma razn numrica. Esto
se debe a que lo que define el intervalo musical no es la diferencia aritmtica
entre sus frecuencias, sino la razn que hay entre ellas, su cociente.
En el vdeo, adems de los dos intervalos de octava, omos un intervalo de quinta, el
que hay entre la segunda pareja de sonidos, la4 (440 Hz) y mi5 (660 Hz). Si atendemos
a la relacin que se establece entre sus frecuencias vemos que estn en razn 3/2, que
es la razn que dene el intervalo de quinta natural:
3
660
=
440
2
As mismo, aunque no las oigamos seguidas, podemos ver que el intervalo que hay
entre la ltima nota de la primera parte, mi5 (660 Hz), y la ltima nota de la segunda
parte, la5 (880 Hz), es de una cuarta. Si nos jamos en sus frecuencias veremos que
mantienen la razn 4/3, que es la que dene el intervalo de cuarta natural:
880
4
=
660
3
Los intervalos que podemos considerar estructurales en nuestro sistema musical tienen una razn simple entre sus frecuencias: dos sonidos estn a un intervalo de octava
cuando sus frecuencias mantienen la razn doble, 2/1; estn a un intervalo de quinta
cuando mantienen la razn 3/2, la llamada razn sesquiltera; y estn a un intervalo
de cuarta cuando mantienen la razn 4/3, la llamada razn sesquitercia. Ahora bien,
68
5.3.2.
Unidades intervlicas
Como acabamos de ver, los intervalos se denen mediante las razones entre sus frecuencias, pero, en tanto que el intervalo es un elemento de nuestra percepcin musical, necesitamos una unidad perceptiva que nos permita comparar unos intervalos
con otros. En la msica disponemos de una unidad natural. Esta unidad natural es el
intervalo de octava, la razn 2/1 entre las frecuencias de los sonidos.
Sonidos que distan un intervalo de octava poseen una especial anidad reconocida en
la prctica totalidad de los sistemas musicales de las diferentes culturas. Hay que tener
presente que cuando dos sonidos que forman una octava son emitidos simultneamente, el ms ligero alejamiento de la relacin doble es percibido inmediatamente
como desanacin. As pues, la octava es una unidad intervlica de carcter uni-
69
De las propiedades de los logaritmos se deduce que para expresar un intervalo cualquiera en semitonos o en cents basta con tomar el logaritmo en base 2 de la razn de
70
3
12 = 7, 02
2
4
12 = 4, 98
3
Este resultado nos indica que el intervalo de cuarta natural es 2 cents menor que el
de cuarta temperada, que por denicin consta de 5 semitonos.
Una vez realizadas estas comparaciones, nos daremos cuenta de que el sistema temperado se caracteriza porque acorta muy ligeramente las quintas y alarga las cuartas,
exactamente 2 cents en ambos casos.
5.3.3.
Para determinar las frecuencias de las notas musicales de la escala, adems de conocer los intervalos que las separan, es necesario tambin elegir la frecuencia de una
nota que sirva de punto de partida para calcular todas las dems. La eleccin de la
frecuencia de esta nota determina la altura absoluta de toda la escala.
71
es 12 2:
12
215 = 2, 378414230005442
12
215 = 1046, 5
A continuacin presento una tabla con las frecuencias de las notas musicales en la
escala temperada estndar. Los nmeros de la la superior indican la octava a la que
corresponde cada nota. Aunque no hay unanimidad en la asignacin de los nmeros
de octava, he seguido el criterio que me parece ms acertado, el que hace corresponder el do central del piano con el inicio de la octava nmero 4.
72
Sobre fondo amarillo est destacada la frecuencia de la nota utilizada como referencia, el la4 . Las notas cuyo fondo est en color naranja coinciden con la extensin
completa de un piano moderno, que va del la0 al do8 . Las notas sobre fondo lila son
completamente excepcionales en la prctica musical: resulta muy difcil reconocer la
altura tonal de las ms agudas, mientras que las ms graves algunas de las cuales se
pueden encontrar en algn tubo de rgano casi no se perciben como sonido, sino
ms bien como un zumbido sordo.
do
16,4
32,7
65,4
130,8
261,6
523,3
1.046,5
2.093,0
4.186,0
do#
17,3
34,6
69,3
138,6
277,2
554,4
1.108,7
2.217,5
4.434,9
re
18,4
36,7
73,4
146,8
293,7
587,3
1.174,7
2.349,3
4.698,6
mib
19,4
38,9
77,8
155,6
311,1
622,3
1.244,5
2.489,0
4.978,0
mi
20,6
41,2
82,4
164,8
329,6
659,3
1.318,5
2.637,0
5.274,0
fa
21,8
43,7
87,3
174,6
349,2
698,5
1.396,9
2.793,8
5.587,7
fa#
23,1
46,2
92,5
185,0
370,0
740,0
1.480,0
2.960,0
5.919,9
sol
24,5
49,0
98,0
196,0
392,0
784,0
1.568,0
3.136,0
6.271,9
lab
26,0
51,9
103,8
207,7
415,3
830,6
1.661,2
3.322,4
6.644,9
la
27,5
55,0
110,0
220,0
440,0
880,0
1.760,0
3.520,0
7.040,0
sib
29,1
58,3
116,5
233,1
466,2
932,3
1.864,7
3.729,3
7.458,6
si
30,9
61,7
123,5
246,9
493,9
987,8
1.975,5
3.951,1
7.902,1
Tabla 5.1: Frecuencia de las notas musicales (Hz) en las diferentes octavas.
73
5.4.
El mayor o menor volumen sonoro, que es una sensacin subjetiva, est en relacin
directa con la intensidad de las ondas sonoras que llegan a nuestros odos. La intensidad es una magnitud fsica que mide la potencia sonora que transmite la onda por
unidad de supercie y se expresa en vatios por metro cuadrado (W/m2 ). Es decir, la
intensidad sonora es la cantidad de energa que, como consecuencia del movimiento
vibratorio que transmiten las ondas, uye en un instante dado a travs de un rea del
espacio, como puede ser el tmpano de nuestro odo.
Puesto que la intensidad de las ondas sonoras cuando se propagan por el aire es independiente de la frecuencia y, en el caso de un sonido simple, es directamente proporcional al cuadrado de la amplitud con la que la presin oscila, el volumen sonoro
que percibimos al escuchar un sonido simple viene determinado por el cuadrado de su amplitud.
Igual que ocurre con la altura tonal, tambin ahora est presente la Ley de WeberFechner, de modo que el cambio en el volumen sonoro que percibimos guarda una
relacin logartmica con la variacin de la intensidad o, lo que viene a ser lo mismo,
con la variacin del cuadrado de la amplitud, a la que la intensidad es directamente
proporcional. Por ello, lo que nuestro sistema perceptivo interpreta como un
grado en la variacin del volumen sonoro es el cociente entre las intensidades
de los sonidos, no su diferencia aritmtica.
5.4.1.
74
multiplicado por 2), por lo que es suciente multiplicar por 20 el logaritmo en base
10 de la razn 2/1 que hay entre las amplitudes:
10 log10
( )2
2
= 20 log10
( )
2
= 6, 02
1
Resumiendo, para expresar en decibelios las diferencias de volumen sonoro entre dos sonidos simples basta tomar el logaritmo en base 10 del cociente entre
sus amplitudes y multiplicarlo por 20.
5.4.2.
Los editores de sonido ofrecen la posibilidad de acompaar las grcas que representan la evolucin temporal de la amplitud de la presin sonora cuyos valores estn
generalmente normalizados entre 1 y -1 con una escala logartmica en decibelios
que indica la intensidad a la que corresponden. Esto nos permite comparar entre s las
amplitudes de varios sonidos de una manera ms prxima a la sensacin de volumen
que percibimos.
Para obtener los valores de intensidad relativa en una escala expresada en decibelios,
se aplica la frmula anterior, es decir, se calcula el logaritmo en base 10 del valor de
cada amplitud y se multiplica por 20. As, el valor de amplitud 1 equivale a 0 dB de
intensidad (el logaritmo en base 10 de 1 es 0); el valor 0,5 de amplitud corresponde a
-6,02 dB de intensidad relativa; y as sucesivamente. Los valores negativos se deben
a que el logaritmo de los nmeros inferiores a la unidad es negativo, de modo que 0
dB se corresponde con la amplitud mxima.
A continuacin presento una tabla de correspondencias entre los valores de amplitud
normalizados y su intensidad expresada en decibelios. En la columna de la izquierda
se muestran una serie de valores de amplitud normalizada que cubren el rango que
un sistema de 16 bits es capaz de digitalizar. Los valores van decreciendo de modo
que cada uno de ellos es la mitad del anterior, hasta llegar al valor mnimo que es
posible representar con 16 bits. En la columna de la derecha se expresa en decibelios
los correspondientes valores de intensidad. Podemos observar que las intensidades
76
van decreciendo de manera lineal, disminuyendo 6,02 dB cada vez que la amplitud
se reduce a la mitad.
Amplitud
Intensidad
normalizada
normalizada (dB)
1,000000
0,00
0,500000
-6,02
0,250000
-12,04
0,125000
-18,06
0,062500
-24,08
0,031250
-30,10
0,015625
-36,12
0,007813
-42,14
0,003906
48,16
0,001953
-54,19
0,000977
-60,21
0,000488
-66,23
0,000244
-72,25
0,000122
-78,27
0,000061
-84,29
0,000031
-90,31
0,000015
-96,33
77
5.4.3.
Por razones prcticas, hay algunas ocasiones en las que es conveniente referirse a la
intensidad del sonido en trminos absolutos, como por ejemplo para determinar si
el nivel sonoro de un lugar est dentro de la normativa legal. En estos casos es til
establecer una escala logartmica de intensidades absolutas adecuada a la manera en
la que nosotros percibimos el volumen sonoro.
Dado que el belio o el decibelio son unidades que miden intervalos entre intensidades, para expresar con ellas valores absolutos es necesario tomar una intensidad de
referencia con la que comparar las que queremos medir. Como sonido de referencia
al que se asigna el valor 0 dB, se ha elegido lo que se considera el umbral mnimo de
la audicin humana: un sonido simple de 1 pW de intensidad, a una frecuencia de
1000 Hz.
Para hacernos una idea de las intensidades que corresponden al volumen que percibimos en distintos ambientes sonoros, pongo debajo una escala de intensidades
absolutas y su correspondiente valor en dB, acompaada de unos ejemplos orientativos. En la columna de la izquierda se muestra la intensidad en W/m2 y en la del
medio la intensidad en dB, a partir del valor de referencia inicial de 0 dB para 1
pW/m2 . El valor de cada intensidad es 10 veces mayor que el de la la anterior, por
lo que el incremento en dB es de 10. Como la intensidad depende de la proximidad
o lejana de la fuente sonora, se indica la distancia o el lugar en el que se debera
hacer la medicin. Hay que insistir en el carcter meramente orientativo de cada
ejemplo, dada la gran variedad de intensidades que pueden darse en cada situacin
sonora.
78
Intensidad
2
Intensidad
W(m )
(dB)
0,000000000001
0,000000000010
10
0,000000000100
20
0,000000001000
30
0,000000010000
40
0,000000100000
50
0,000001000000
60
0,000010000000
70
0,000100000000
80
0,001000000000
90
0,010000000000
100
0,100000000000
110
1,000000000000
120
79
5.4.4.
Figura 5.2: Vdeo con la nota la3 a 220 Hz repetida con una amplitud que se reduce cada vez a la
mitad.
Para apreciar que los valores de amplitud e intensidad son relativos, nos basta con
subir o bajar el volumen del reproductor de sonido. Al hacer esto, aumenta o disminuye la presin sonora que el altavoz origina y, con ello, la intensidad que llega a
nuestros odos. Ahora bien, si escuchamos de nuevo todo el vdeo con el nuevo volumen, comprobaremos que percibimos el mismo grado de disminucin del volumen
sonoro al pasar de nota en nota. En efecto, el intervalo entre las intensidades sonoras,
lo que nosotros percibimos como un grado en el volumen sonoro, sigue siendo el
mismo: cada vez que la amplitud se reduce a la mitad nosotros percibimos el mismo
descenso de volumen sonoro, el que corresponde aproximadamente a 6 dB.
80
Hemos podido comprobar que nuestra percepcin del volumen sonoro guarda muchas similitudes con nuestra percepcin de la altura tonal. Sin embargo, hay varias
diferencias que conviene tener presente, debidas tanto a las peculiaridades fsicas del
sonido, como a las de nuestro sistema auditivo.
A diferencia de la frecuencia que, salvo situaciones excepcionales, se mantiene invariable en su transmisin a travs de las ondas, la amplitud y la intensidad disminuyen progresivamente conforme el sonido se aleja de la fuente: la amplitud
de forma lineal y la intensidad segn el cuadrado de la distancia. Adems, ambas magnitudes son muy sensibles a las mltiples incidencias que las ondas pueden
encontrase en su camino.
Por otra parte, nuestra sensacin no responde de igual manera a todos los sonidos de la misma intensidad, sino que el grado de volumen sonoro que percibimos depende en buena medida de la frecuencia. Para permitir comparar el
volumen sonoro en funcin de la frecuencia se ha establecido una unidad de referencia: el fon o fonio. Hay que tener en cuenta que el fonio no es una unidad fsica
objetiva, sino que se trata de una unidad establecida a partir de criterios psicoacsticos estadsticos. El nmero de fonios de un sonido simple es la sensacin de
volumen sonoro que experimenta un oyente medio cuando escucha un sonido
de 1000 Hz de ese nmero de decibelios de intensidad absoluta.
Por ello la escala de fonios coincide con el valor de intensidad sonora de un sonido a
1000 Hz. Por ejemplo, cuando hablamos de un sonido que provoca una sensacin de
volumen sonoro de 50 fonios, estamos rerindonos a un sonido simple de 1000 Hz
cuya intensidad sonora expresada en decibelios absolutos es de 50 dB. Si la frecuencia
del sonido fuera de 200 Hz, para provocar la misma sensacin de volumen sonoro
es decir, 50 fonios sera necesario que tuviera una intensidad de 60 dB, expresada
en unidades absolutas.
Podemos verlo en las grcas que habitualmente se establecen con los valores psicoacsticos de la percepcin del volumen sonoro en funcin de la frecuencia.
81
Figura 5.3: Grcas de la percepcin del volumen sonoro en las diferentes frecuencias.
La raya azul marca los 1000 Hz, la frecuencia de referencia donde el nmero de
fonios coincide con el valor de la intensidad sonora absoluta. Podemos observar que
en torno a los 4000 Hz es donde, con la misma intensidad sonora, la percepcin
del volumen es mayor, tal vez debido a la resonancia de nuestra canal auditivo. Por
otra parte, las zonas extremas, tanto graves como agudas, requieren una intensidad
mucho mayor para que el oyente experimente el mismo nmero de fonios, es decir,
la misma sensacin de volumen sonoro.
5.5.
Conclusin
A lo largo de este captulo hemos podido comprobar que nuestra percepcin musical
de los parmetros fsicos del sonido es logartmica. Percibimos razones intervlicas,
no diferencias aritmticas. Mientras la altura tonal es el correlato perceptivo de la
frecuencia, el volumen sonoro est en relacin directa con el cuadrado de la amplitud. En ambos casos, nuestra sensacin se incrementa de grado en grado cuando
se mantiene la misma razn en la variacin de los parmetros fsicos. El intervalo
meldico entre dos notas musicales queda determinado por la razn entre sus fre82
cuencias y puede ser expresado utilizando como unidad la octava la razn 2/1
o cualquiera de sus subdivisiones, como el semitono o el cent. As mismo, tambin
podemos denir el intervalo de volumen sonoro entre dos sonidos como la razn
entre el cuadrado de sus amplitudes y utilizar para medirlo el belio la razn 10/1
o el decibelio. El hecho de que, a diferencia de la amplitud, la frecuencia permanezca
invariable a lo largo de la transmisin ondulatoria ha posibilitado su codicacin en
las notas y escalas del lenguaje musical.
83
Captulo 6
Mezcla e interferencia de dos sonidos
simples
6.1.
Introduccin
Los sonidos que omos todos los das, sean o no musicales, no suelen ser sonidos
simples, sino el resultado de la superposicin de un conjunto de vibraciones que
coinciden en un momento dado. En el caso de la msica, que es lo que nos interesa
ahora, estas superposiciones se pueden producir en cualquier lugar: en el cuerpo
mismo de los instrumentos, en el espacio por el que se transmiten las ondas sonoras
o en el interior de nuestro odo.
Cuando se mezclan las vibraciones sonoras se producen diversos fenmenos acsticos, fenmenos que dan lugar a las diferentes cualidades sonoras que omos. Estas
mezclas, dependiendo de sus caractersticas, pueden ser combinaciones armnicas
que percibimos como notas musicales o pueden ser otro tipo de combinaciones en
las que apreciamos simplemente ruido. En efecto, los fenmenos acsticos derivados
de las distintas combinaciones de sonidos simples (es decir, de componentes sinusoidales) generan buena parte de la riqueza sonora de nuestro entorno. En lo que
concierne a la msica, los fenmenos que se crean al combinarse las vibraciones de
distintos sonidos o de distintos componentes de un mismo sonido constituyen buena
parte del fundamento acstico de nuestro sistema musical.
84
variaciones son interpretadas por nuestra percepcin como extraas a esa escala o
desanadas.
Experimentaremos tambin los lmites de nuestra capacidad para discernir individualmente sonidos simultneos, comprobando que estos lmites dependen de la anchura de la banda crtica correspondiente a cada zona frecuencial.
Y, por ltimo, mediante la introduccin de una distorsin articial en la seal, comprobaremos los efectos que sta puede ocasionar en la mezcla de sonidos simples, al
dar lugar a la aparicin de componentes espurios. Esta es la razn de que, para poder apreciar correctamente las caractersticas sonoras que se muestran en los vdeos,
sea necesario que la distorsin del equipo de audio en el que los reproduzcamos sea
pequea, como he indicado en el Prlogo de este libro.
A mi juicio, el modo ms sencillo que tenemos hoy en da para estudiar los fenmenos acsticos y psicoacsticos que se crean al mezclarse los sonidos es observar como
se comportan dos sonidos fabricados por ordenador. El hecho de utilizar sonidos
articiales nos garantiza su estabilidad y permite que sus parmetros estn perfectamente controlados. Mediante vdeos que simulan un osciloscopio creados a partir de
Matlab, a lo largo de este captulo vamos a escuchar cmo suenan las diferentes mezclas de inters musical de dos sonidos simples y observar la forma de la vibracin de
la seal resultante, atendiendo tanto a los fenmenos acsticos en s mismos, como a
la manera en la que nosotros los percibimos.
6.2.
Antes de analizar cada uno de los casos de inters musical que se producen cuando
se mezclan dos sonidos simples, vamos a prestar atencin brevemente al principio
general que rige toda mezcla de sonidos. Puesto que el sonido es un movimiento
vibratorio que se transmite en forma de ondas, cuando se mezclan dos sonidos en
las situaciones habituales se cumple el Principio de Superposicin Lineal de Ondas.
El Principio de Superposicin Lineal de Ondas dice que cuando en un tiempo
dado coinciden en un punto dos o ms ondas la alteracin total que se produce
en ese punto es igual a la suma de las alteraciones que cada onda individual
86
habra producido. Es decir, cuando dos ondas intereren, el comportamiento individual de cada una de ellas no se ve afectado por el de la otra.
Si pensamos en trminos de seal de audio, podemos decir que la seal que resulta
de la reunin de dos seales independientes es una nueva seal cuyas muestras son
simplemente la suma de las muestras de cada una de ellas.
Hay que tener en cuenta que para que se cumpla el Principio de Superposicin Lineal
de Ondas es necesario que el medio por el que se transmite el sonido no altere la
forma de la vibracin, es decir, que no distorsione la seal de audio. Si esto no se
cumple (por ejemplo, si el equipo reproductor de sonido presenta una distorsin
signicativa) surgirn componentes extraos no presentes en la seal original. Un
ejemplo de los efectos de tales distorsiones son los llamados Tonos de Tartini, que no
son componentes reales que pertenezcan a la vibracin sonora en s misma, sino el
resultado de la pequesima distorsin que introduce nuestro propio odo.
A continuacin vamos a estudiar una serie de fenmenos fsicos, todos ellos de inters musical, que surgen al mezclarse dos sonidos simples. Todos estos fenmenos, as
como la forma en la que nosotros los percibimos, dependen de tres factores: la distancia aritmtica entre las frecuencias de los sonidos que se mezclan; la razn numrica
que se establece entre sus frecuencias; y la regin frecuencial a la que pertenecen.
Generalizados a la mezcla de cualquier nmero de componentes, estos fenmenos y
la forma en la que nosotros los percibimos constituyen el fundamento acstico sobre
el que se ha construido nuestro Sistema Musical.
6.3.
87
Figura 6.1: Vdeo con dos sonidos unsonos que van incrementando su desfase.
Podemos ver en el osciloscopio dos seales nas sinusoidales de amplitudes muy parecidas, una magenta y otra azul, que representan los sonidos simples componentes.
88
Vemos tambin una seal ms gruesa de color verde, que es la resultante de la mezcla
y que corresponde al sonido que estamos escuchando en el vdeo.
En cada una de las cinco repeticiones percibimos un solo sonido simple. Comprobamos, as pues, que la mezcla de dos sonidos simples de la misma frecuencia produce
un sonido simple que conserva el mismo periodo y, por lo tanto, la misma frecuencia
que los componentes, en este caso 220 Hz. En efecto, en el osciloscopio vemos que
la grca de la seal resultante, de color verde, es tambin una seal sinusoidal. Al
escuchar como suenan podemos apreciar que la mezcla ha sido tan perfecta que los
sonidos que la han compuesto han sido fundidos, de modo que omos un solo sonido
simple.
Veamos ahora en qu se diferencian las distintas repeticiones de esa nota. Enseguida
nos damos cuenta de que el volumen sonoro que percibimos es diferente en cada
caso. No voy a explicar ahora cmo se puede calcular la amplitud y la fase inicial
del sonido resultante de la mezcla, pues no es relevante para nuestro objetivo; nos
basta comprobar en el osciloscopio que la amplitud de la seal verde, la del sonido
que omos, disminuye conforme aumentan los desfases en las sucesivas emisiones.
Como casos especiales podemos observar que cuando los dos sonidos estn en fase
la primera emisin, desfase de 0, la amplitud del sonido resultante es la suma
de las amplitudes de cada uno de los componentes (0,20 + 0,22 = 0,42), mientras
que cuando ambas seales estn en oposicin de fase la ltima emisin, desfase
de 180, la amplitud de la seal resultante es la diferencia de las amplitudes de los
componentes (0,22 0,20 = 0,02).
Para ver en detalle lo que sucede, la gura de abajo presenta una instantnea de la
forma de la vibracin en cada una de las cinco emisiones, de modo que cada grca
corresponde a uno de los desfases que hemos visto en el vdeo.
89
Figura 6.2: Formas de la vibracin de dos sonidos simples unsonos con diferentes desfases.
Puesto que cada muestra de la seal resultante es, segn el Principio de Superposicin
Lineal, la suma de las correspondientes muestras de las seales componentes, vemos
que, conforme se van incrementando los desfases, la prdida de sincrona da lugar
a que la amplitud resultante vaya disminuyendo. En la grca de la quinta la, en
la que ambas seales estn en oposicin de fase, podemos apreciar que los valores
de todas las muestras son prcticamente opuestos, de modo que resulta fcil deducir
que si ambos componentes hubieran tenido la misma amplitud, el sonido resultante
hubiera tenido una amplitud de 0, es decir, hubiera desaparecido por completo.
As pues, en este vdeo hemos podido observar que el resultado de la mezcla de dos
sonidos simples de igual frecuencia siempre es otro sonido simple de la misma frecuencia y que el cambio en la fase inicial slo modica la amplitud del sonido simple
resultante y, por lo tanto, solo repercute en el volumen sonoro que apreciamos, sin
que afecte a la cualidad sonora que percibimos.
Los cambios en el volumen sonoro derivados de los desfases entre dos sonidos unsonos explican algunos problemas que pueden surgir al realizar una grabacin en un
estudio. En el caso de que la misma fuente sonora sea recogida por dos micrfonos,
pudiera suceder que algunos componentes llegaran a cada micrfono casi en oposi90
cin de fase, lo que podra dar lugar a que, al realizarse la mezcla, esos componentes
quedaran signicativamente atenuados. Si esto ocurre se puede percibir una especie
de agujero acstico en el sonido grabado. Para evitar este problema las mesas de mezclas suelen llevar un dispositivo que permite invertir la fase de cada seal de entrada.
En la audicin directa este problema queda minimizado por el hecho de que disponemos de dos odos y porque los sonidos habitualmente llegan hasta nosotros con
mltiples desfases, debido a que, por regla general, provienen de diversos lugares,
como consecuencia de las reexiones en las paredes, techos y suelos.
6.4.
Mezcla de dos sonidos simples de frecuencias muy prximas: Batidos de primer orden
Vamos a estudiar ahora lo que ocurre cuando se mezclan dos sonidos simples cuyas frecuencias estn separadas entre s por una pequea distancia, menos de 15 Hz
aproximadamente. El fenmeno acstico que se produce se denomina batidos de
primer orden y ha sido empleado desde tiempos muy antiguos para la anacin de
los instrumentos musicales y la determinacin de las escalas.
6.4.1.
91
92
A excepcin del ltimo sonido, en todos los casos omos una especie de sonido tremolado, es decir, unos batidos o pulsaciones que se repiten de manera peridica y
que coinciden con la oscilacin de la amplitud de la seal verde que vemos en el osciloscopio. Si prestamos atencin al vdeo comprobamos que el nmero de batidos
por segundo que omos (es decir, la frecuencia de los batidos) coincide con la diferencia que hay entre la frecuencia de los dos componentes que han intervenido en
la mezcla. En efecto, en el primer caso omos 8 batidos por segundo; en el segundo
4; en el tercero 2; en el cuarto 1; en el quinto 1 batido cada dos segundos (es decir,
0,5 cada segundo); y en el ltimo los batidos desaparecen y los dos componentes se
quedan fundidos plenamente en un solo sonido estable y continuo.
Ahora bien, si detenemos el vdeo en cualquier momento, con independencia de que
haya o no batidos, observaremos que en todos los casos la vibracin sigue teniendo
una forma sinusoidal. Esto explica que en todos esos sonidos, incluso cuando estn
formados por dos componentes de diferente frecuencia, omos un solo sonido simple,
con una altura tonal bien denida.
En resumen, cuando se producen los batidos de primer orden la amplitud del
sonido oscila peridicamente, pero su frecuencia permanece estable durante
toda su duracin.
Si tenemos un odo muy no podremos apreciar que la altura tonal desciende ligersimamente de un sonido a otro, conforme se van aproximando ms las frecuencias
de los dos sonidos componentes. La frecuencia del sonido resultante depende de
la frecuencia y la amplitud de los componentes que lo forman. Si la amplitud de
ambos componentes hubiera sido la misma, la frecuencia resultante de la mezcla hubiera sido la media aritmtica de las frecuencias de los dos componentes; pero como
en todos los casos de este vdeo el componente ms grave tiene mayor amplitud, la
frecuencia resultante se aproxima ms a la de este componente. Por ello la frecuencia
de los seis sonidos que omos desciende ligeramente de un caso a otro: desde 222 Hz
en el primero, hasta 220 Hz en el ltimo cuando desaparecen los batidos y ambos
componentes suenan al unsono.
93
6.4.2.
Para ver en detalle a qu se debe este fenmeno, vamos a centrar nuestra atencin en
las seales del primer caso del vdeo, cuando las frecuencias de los dos componentes
estn a una distancia de 8 Hz. Veamos una grca que corresponde a 2 dcimas de
segundo de este primer sonido, en concreto, las que estn entre los segundos 1 y 1,2.
En esta grca las seales estn ms comprimidas que en la ventana del osciloscopio,
donde se representan slo 50 milsimas de segundo, con lo que ahora podremos
apreciar la forma de los batidos.
6.4.3.
Batidos y afinacin
Cualquier msico que tiene que anar su instrumento est habituado a poner el odo, es decir, a prestar atencin y escuchar las pequeas oscilaciones en el volumen
sonoro que se producen cuando las frecuencias de dos sonidos distintos que se emiten simultneamente estn muy prximas, pero no son idnticas. En efecto, como
el fenmeno de los batidos se produce de manera natural siempre que se mezclan
sonidos de frecuencias muy prximas, su observacin ha sido el mtodo habitualmente utilizado para anar los instrumentos musicales: si se conoce la frecuencia de
un sonido que se utiliza de referencia, este mtodo permite la determinacin precisa
de la frecuencia de otro.
El vdeo de la gura 6.3 nos sirve para entender cmo se utilizan los batidos para la
anacin. Por ejemplo, para anar la cuerda de una guitarra, tomando como referencia la nota ya anada de una cuerda inferior, empezaremos tensndola de manera
aproximada para acercarla al sonido de referencia y, una vez en ese rango, iremos
ajustando su tensin hasta que los batidos desaparezcan por completo. En el vdeo
vemos que, conforme las frecuencias de los componentes estn ms prximas, el
ritmo de los batidos va disminuyendo, hasta desaparecer cuando los sonidos estn
completamente anados.
Incluso cuando no se busca una coincidencia exacta, el nmero de batidos que se
produce cada cierto tiempo proporciona al msico una medida precisa de la diferencia entre las frecuencias de los dos sonidos. El nmero de batidos que se produce
por segundo (es decir, la frecuencia de los batidos) es un medio para determinar con
precisin el grado de desanacin.
Este procedimiento no slo es vlido para anar notas unsonas, sino tambin para
determinar la anacin de las principales consonancias musicales y, a partir de ah,
la escala entera. Aunque en este captulo estamos estudiando el modelo de dos sonidos simples cuyas frecuencias se superponen en un momento dado, tenemos que
tener presente que la mayora de los sonidos que emiten los instrumentos musicales no son simples, sino que estn formados por muchos componentes armnicos,
como se estudia en el captulo 7. Por ello, en la anacin natural la frecuencia de
algn importante componente armnico de una nota coincidir exactamente con la
frecuencia de otro armnico de la otra nota. En la anacin temperada, donde ya
96
no se produce esa coincidencia exacta, el nmero de batidos permite bajar con precisin las quintas, exactamente en la pequea cantidad requerida. ste es el mtodo
habitualmente utilizado por los anadores de pianos.
6.5.
Debido a las caractersticas de nuestro sistema auditivo, cuando se mezclan dos sonidos simples de diferente frecuencia es necesario que entre ellos exista suciente
distancia frecuencial para que podamos percibirlos individualmente. Esta separacin
mnima, a la que llamamos anchura de la banda crtica, no es igual en todas las
regiones frecuenciales, pues la capacidad de resolucin de nuestra percepcin auditiva depende de la zona frecuencial en la que estn situados los sonidos que se
mezclan.
En efecto, segn la separacin entre las frecuencias de dos sonidos simples emitidos
simultneamente, se pueden producir cuatro situaciones diferentes:
a) Cuando la diferencia es menor de unos 15 Hz omos un solo sonido tremolado, los batidos de primer orden que acabamos de ver.
b) A partir de 15 Hz, aproximadamente, de distancia entre ellos, dejamos de
or un solo sonido tremolado y empezamos a escuchar una especie de zumbido
spero, sin que todava seamos capaces de distinguir dos alturas tonales diferenciadas.
c) Cuando la separacin est cerca de la anchura de la banda crtica correspondiente a la zona frecuencial en la que se hallan los dos componentes que se
mezclan, comenzamos a distinguir ya dos sonidos, pero la cualidad sonora de la
mezcla sigue siendo spera y rugosa.
d) Conforme aumenta la distancia entre las frecuencias de los dos componentes,
la cualidad sonora se va haciendo cada vez menos rugosa, hasta que, una vez
97
Figura 6.5: Vdeo que muestra la importancia de la banda crtica en la percepcin individual de dos
sonidos prximos.
En el primer sonido, donde los componentes estn separados 13,1 Hz, omos una
nota simple tremolada, con unos batidos muy rpidos y muy profundos, similares a
los que hemos odo en los primeros casos del vdeo de la gura 6.3. En efecto, como
la distancia frecuencial es menor de 15 Hz, estamos ante un caso de una mezcla en la
98
que se percibe un solo sonido, pero en la que se producen batidos de primer orden,
como hemos visto en el apartado anterior. Lo he incluido aqu para que podamos
comparar su sonido con el de los siguientes casos. La altura tonal que percibimos
corresponde a una nota situada entre el la3 y el sib3 , pues, al ser igual la amplitud de
ambos componentes, la frecuencia del sonido resultante es la media aritmtica entre
ellos, es decir, 226,6 Hz.
En el segundo sonido, cuando la distancia entre las frecuencias de los dos componentes es de 26,9 Hz, no omos ya ninguna nota musical, ni una sola nota tremolada,
ni tampoco las dos notas por separado, sino un sonido spero y rugoso, como un
zumbido. Ello se debe a que, cuando la diferencia aritmtica entre las frecuencias de
los dos componentes supera los 15 Hz aproximadamente, la frecuencia de los batidos es tan rpida que nuestro sistema auditivo es incapaz de seguirlos. Por eso ya no
podemos distinguir un solo sonido simple tremolado, sino que omos un sonido sucio y rugoso, un zumbido borroso en el que no omos en absoluto los componentes
individuales de la mezcla.
En el tercer sonido, en el que la distancia entre las frecuencias es de 41,6 Hz, podemos
apreciar ya las dos notas por separado, el la3 y el do4 , aunque la cualidad de la mezcla
que omos sea sucia y borrosa.
En el cuarto sonido, sin embargo, cuando la distancia entre las frecuencias es de 91,1
Hz, distinguimos con nitidez dos notas individuales, el la3 y el mib4 , y el carcter
rugoso de la mezcla anterior ha desaparecido, siendo sustituido por una sonoridad
mucho ms clara y eufnica.
Estos fenmenos son de orden psicoacstico, es decir, se deben a las peculiaridades
de nuestro sistema auditivo, en concreto, a la siologa de nuestro odo interno.
Como consecuencia de ello, para poder distinguir dos sonidos simples simultneos
es necesario que la separacin entre ellos supere una distancia mnima. La anchura
de la banda crtica vara en funcin de la zona frecuencial de los sonidos que
se superponen, incrementndose conforme los sonidos son ms agudos. En los
casos del vdeo la anchura de la banda crtica est en torno a los 40 Hz. Ello explica que
no hayamos sido capaces de distinguir en el vdeo los componentes simples cuando
la distancia entre sus frecuencias era inferior a esta cantidad y, sin embargo, en el
99
6.6.
Cuando las distancias entre las frecuencias de dos sonidos simples que se superponen
sobrepasan holgadamente la anchura de la banda crtica, de modo que ya no percibimos zumbidos o rugosidades, hay ocasiones en las que se produce una mezcla
tan bien amalgamada que los dos sonidos casi parecen fundirse en uno. Esta mezcla
recibe el nombre de consonancia.
Antes de continuar, conviene hacer una aclaracin. El concepto de consonancia que
vamos a estudiar en estos captulos no hace referencia al carcter ms o menos eufnico que resulta de la mezcla de los sonidos, sino al especial acoplamiento fsico
entre las vibraciones sonoras que se produce cuando sus frecuencias son cercanamente conmensurables. Por ejemplo, el acorde de sptima disminuida puede perfectamente ser considerado hoy en da eufnico, pero nunca ser una combinacin
consonante.
Si bien las consonancias entre los sonidos reales de la msica, cada uno de ellos formado habitualmente por muchos componentes armnicos, se estudiarn ms adelante
(en el captulo dedicado al modo en el que reconocemos el sonido musical), primero es conveniente entender en qu consiste la consonancia entre sonidos simples.
As pues, a continuacin vamos comprobar, mediante nuestra experiencia auditiva
directa, que cuando se superponen dos sonidos simples cuyas frecuencias mantienen entre s una relacin de conmensurabilidad prxima se produce una
consonancia.
100
6.6.1.
Conmensurabilidad prxima
101
6.6.2.
102
En el vdeo de la gura 6.6 podemos escuchar las consonancias que se pueden establecer entre los cuatro primeros nmeros enteros positivos: la consonancia de octava,
la de doble octava, la de octava y quinta, la de quinta y la de cuarta.
En todos los ejemplos del vdeo la frecuencia del componente grave es 220 Hz (la3 ).
En el primer caso la frecuencia del componente agudo es 440 Hz (la4 ), por lo que
ambos sonidos mantienen la razn 2/1, que es la que dene el intervalo de octava. En
el segundo, el componente agudo tiene una frecuencia de 660 Hz (mi5 natural), por
lo que los dos componentes estn entre s en razn 3/1, la que dene el intervalo de
octava y quinta natural. En el tercero, el sonido agudo es de 880 Hz (la5 ) y la razn
respecto al componente grave es 4/1, por lo que entre ambos forman un intervalo de
doble octava. En el cuarto, el componente agudo es de 330 Hz (mi4 natural) y forma
respecto al grave una razn de 3/2, que corresponde al intervalo de quinta natural.
En el quinto caso, la frecuencia del sonido agudo es 293,3 Hz (re4 natural) y su razn
respecto al grave es 4/3, con el que forman un intervalo de cuarta natural. Para que se
distingan mejor los dos componentes, la amplitud de cada uno de ellos es diferente:
la del componente grave es 0,2 y la del agudo 0,1.
Figura 6.6: Vdeo con las consonancias denidas por los cuatro primeros nmeros enteros.
Si ponemos un poco de atencin, en todos estos ejemplos, adems del sonido resultante de la mezcla, tambin podemos or cada uno de los dos componentes por
separado. Solamente en el primer caso, cuando las frecuencias estn en razn 2/1,
103
predomina la tendencia a percibir un solo sonido, en lugar de dos sonidos simultneos distintos que se mezclan bien. Pero incluso ah, si orientamos un poco nuestra
escucha para hacerla ms analtica, podemos apreciar las dos notas individuales.
Para entender por qu percibimos en todos los casos la superposicin de los dos
sonidos componentes como una mezcla consonante, vamos a jarnos en la forma de
la vibracin de cada uno de los ejemplos que vemos en el osciloscopio del vdeo. Para
poder comparar unas formas con otras, la gura 6.7 representa un fragmento de la
seal de audio de cada uno de los ejemplos del vdeo.
Figura 6.7: Formas de la vibracin de las consonancias entre los cuatro primeros nmeros enteros.
En los tres primeros casos podemos observar que cada vez que el componente grave,
el de color magenta (el sonido de 220 Hz, que es comn a todos ellos) realiza un ciclo
completo, el componente agudo, el de color azul, completa exactamente un nmero
entero de ciclos: dos ciclos en el caso de la octava (de ah la razn 2/1); tres en el caso
de la octava y quinta natural (de ah la razn 3/1); y cuatro en el caso de la doble
octava (de ah la razn 4/1). Ello hace que en todos estos casos el sonido resultante de
la mezcla tenga el mismo periodo que el del componente ms grave, como podemos
comprobar en las grcas.
104
En la cuarta grca, en el caso de la quinta natural, vemos que cada dos ciclos del
componente grave, el componente agudo completa exactamente tres (de ah la razn
3/2). Por ello, el periodo del sonido resultante es el doble que el del componente ms
grave o, lo que es lo mismo, el triple del periodo del componente ms agudo.
En la ltima grca, en el caso de la cuarta natural, observamos que cada tres ciclos
del componente grave, el componente agudo completa exactamente cuatro (de ah
la razn 4/3). De esta forma, el periodo del sonido resultante es el triple del periodo
del componente ms grave y el cudruple del ms agudo.
As pues, en este vdeo y en las grcas correspondientes, hemos podemos observar
que la conmensurabilidad es la causa de la aparicin de una periodicidad en la
mezcla resultante.
Podra parecer que esta periodicidad debera haber dado lugar a la percepcin de la
altura tonal correspondiente a la mezcla. Si esto hubiera sido as, en el cuarto caso,
por ejemplo, deberamos haber odo la nota la2 , que correspondera al periodo de la
mezcla resultante, en lugar de las notas individuales la3 y mi4 bien amalgamadas y
formando la consonancia de quinta. Sin embargo, esto no ocurre as, salvo que el
equipo de msica en el que estemos oyendo los ejemplos distorsione y provoque la
aparicin de componentes espurios, como veremos un poco ms adelante. La explicacin de ello reside en que nuestra percepcin es frecuencial, de modo que, como
estudiaremos en el captulo correspondiente, omos dos notas y no una sola nota ms
grave correspondiente a la seal resultante.
6.6.3.
De la consonancia a la disonancia
Pero, debido a los mrgenes de nuestra percepcin, las fronteras entre lo que nos
suena consonante y lo que nos parece disonante son algo difusas.
Para observar donde acaba la consonancia y donde empieza la disonancia, he fabricado un vdeo con varios casos en los que se mezclan dos sonidos simples cuya distancia
intervlica est en torno a la quinta: la quinta natural o quinta justa (la que propiamente est en razn 3/2), la quinta temperada, la quinta disminuida y una quinta
desanada. He elegido el mbito intervlico de la quinta por dos razones: primero
porque la quinta justa es la consonancia en la que se pueden distinguir con ms faci105
lidad los dos componentes; y, segundo, porque en nuestro sistema musical tambin
se encuentran la quinta temperada y la quinta disminuida, por lo que estamos familiarizados con ellas y podemos compararlas. He aadido la quinta desanada para
permitir apreciar la diferencia.
En todos los ejemplos la frecuencia de la nota grave es 220 Hz (la3 ). En el primer caso
la frecuencia de la nota aguda es 330 Hz (mi4 natural), por lo que estn exactamente
en razn 3/2 y forman el intervalo de quinta natural o justa. En el segundo caso
la frecuencia de la nota aguda es de 329,6 (mi4 temperado) por lo que forman un
intervalo de quinta temperada (700 cent) con la nota grave (la quinta temperada est
solamente 2 cent por debajo de la quinta justa). En el tercer caso la frecuencia de
la nota aguda es 325,8 Hz (mi4 desanado) y forman un intervalo de quinta que
est 20 cent por debajo del que formara con el mi4 temperado. Y en el cuarto caso
la frecuencia de la nota aguda es 311,1 Hz (mib4 ) y forma un intervalo de quinta
disminuida (600 cent) con la nota grave. Para permitir que se distingan la amplitud
del componente grave es 0,2 y la del agudo 0,1.
En todos los casos omos los dos sonidos de forma independiente, pues la distancia
entre ellos excede con mucho la anchura de la banda crtica de esa zona frecuencial,
que est en torno a los 55 Hz, lo cual, como hemos visto en los apartados anteriores,
106
es una condicin necesaria para que podamos reconocer con claridad ambos sonidos.
Analicemos con un poco de detenimiento lo que ocurre en cada caso.
a) En el primer caso, cuando las frecuencias de los componentes estn exactamente en razn 3/2 y forman la consonancia de quinta natural, omos una
mezcla muy bien amalgamada y observamos en el osciloscopio que la forma
de la vibracin resultante permanece totalmente estable. En efecto, el mximo
comn divisor de las frecuencias de los dos componentes (220 y 330) es 110.
Esto quiere decir que la forma de la vibracin de la mezcla resultante se repite
110 veces por segundo y que, por lo tanto, su periodo es 1/110 s, o sea, redondeando, 9 milsimas de segundo. As pues, cada 9 ms aproximadamente ambos
componentes se sincronizan: el sonido grave completa 2 ciclos mientras que el
sonido agudo completa 3, como podemos comprobar en el osciloscopio si detenemos el vdeo. Este periodo de 9 ms est dentro del rango temporal en el que
nuestro sistema auditivo es capaz de detectar periodicidades en la forma de la vibracin. Por eso, aunque seguimos oyendo los dos componentes por separado,
percibimos que se combinan muy bien, por lo que obtenemos una clara sensacin de buena mezcla, una mezcla sin perturbaciones que no vara a lo largo del
tiempo.
b) En el segundo caso, en el que se mezclan dos sonidos que estn en intervalo de quinta temperada, la razn entre sus frecuencias, redondeadas a dcimas de hercio, es 3296/2200. Esta razn expresada como fraccin irreducible es
412/275, la cual no es para nada una razn sencilla, por lo que las frecuencias
de los componentes estn muy lejos de mantener una relacin de conmensurabilidad prxima. Sin embargo, la diferencia entre la frecuencia del componente
agudo (329,6 Hz) y la del componente agudo del caso de la consonancia de
quinta natural (330 Hz) es solamente de cuatro dcimas de hercio. En efecto,
bastara con subir 0,4 Hz la frecuencia de la nota aguda para obtener la razn
simple 3/2. Por ello tambin ahora omos un intervalo de quinta cuyas notas se
mezclan bien, lo que coincide con la cuasi-periodicidad que observamos en la
seal verde del vdeo. Ahora bien, la mezcla que omos ya no es totalmente estable como en el caso anterior, sino que, si prestamos atencin, podremos or que
va acompaada de una lenta y peridica evolucin de la cualidad sonora, lo cual
tambin se reeja en la cclica evolucin de la forma de la seal resultante que
107
6.6.4.
Nuestra percepcin auditiva no es igual para todas las consonancias, sino que el grado
de perfeccin de la consonancia disminuye conforme la conmensurabilidad entre
109
las frecuencias de los dos sonidos simples que se mezclan se hace ms lejana. Para
experimentar este fenmeno he confeccionado un vdeo con cinco ejemplos en los
que se mezclan dos componentes simples, dentro del rango de una octava. En todos
los casos sus frecuencias estn en una razn simple prxima y, por lo tanto, forman
una consonancia, pero su conmensurabilidad se va alejando, desde el unsono (1/1)
hasta la consonancia de tercera mayor natural (5/4).
En todos los ejemplos la frecuencia del componente grave es 440 Hz, un la4 en la
anacin habitual. La frecuencia del componente agudo va cambiando: en el primer
caso es tambin 440 Hz, por lo que ambas notas forman un unsono (1/1); en el
segundo, es 880 Hz, un la5 , por lo que forman una octava (2/1); en el tercero es
660 Hz, un mi5 , formando un intervalo de quinta natural (3/2); en el cuarto caso,
redondeando a dcimas de hercio, es 586,7 Hz, un re5 , por lo que forman un intervalo
de cuarta natural (4:3); y en el quinto caso la frecuencia aguda es 550 Hz, un do#5 ,
formando una tercera mayor natural (5:4). En este vdeo he elegido como nota grave
la4 , una nota que est en una octava ms aguda que la de los vdeos anteriores, para
evitar que en la consonancia de tercera mayor las frecuencias de los dos sonidos se
aproximaran a la anchura de la banda crtica y se generara alguna rugosidad en la
mezcla resultante. Como referencia para nuestro odo, a n de facilitar la escucha
individualizada de los componentes del intervalo de octava, he incluido tambin el
unsono.
Figura 6.9: Vdeo con las consonancias de unsono, octava, quinta, cuarta y tercera mayor.
110
En el osciloscopio del vdeo podemos apreciar que la forma de la vibracin permanece totalmente estable en todos los casos y que en cada uno de ellos omos con claridad
una mezcla consonante. En efecto, al mantener las frecuencias de los dos sonidos una
relacin de conmensurabilidad prxima, el periodo de la seal resultante est dentro
de los mrgenes en los que nuestro sistema auditivo es capaz de detectar la sincronizacin de ambas vibraciones, de modo que percibimos una buena mezcla.
Pero si escuchamos con un poco de atencin nos damos cuenta de que no todas
las mezclas son igualmente armoniosas, sino que, a medida que avanza el vdeo y
la conmensurabilidad entre las frecuencias se va alejando, se produce una prdida
progresiva de la sensacin de buena mezcla. Conforme la conmensurabilidad
de las frecuencias es ms alejada, el periodo de su sincronizacin es mayor y
la forma de la vibracin resultante adquiere mayor complejidad, por lo que
cada vez se hace ms difcil percibir las coincidencias peridicas entre los dos
sonidos. Ello da lugar a la progresiva disminucin de la sensacin de buena mezcla:
desde la octava, en la que la amalgama de los dos componentes es tan fuerte que
se hace difcil su escucha individualizada, hasta la tercera mayor natural, donde la
sensacin de buena mezcla es ya bastante dbil.
6.6.5.
Veamos ahora cmo afecta la fase inicial a las consonancias. En el caso de la mezcla
unsona hemos visto que la diferencia de fase entre los componentes modica notablemente la amplitud del sonido resultante y, en consecuencia, el volumen sonoro
que percibimos. Pero, a diferencia del unsono, los desfases entre dos componentes
consonantes, si bien modifican la forma de la vibracin resultante, no alteran
el volumen sonoro que omos, ni ninguna otra cualidad sonora, al menos de
un modo claramente perceptible.
Para observar que la forma de la vibracin viene determinada por la fase inicial de
los sonidos componentes y experimentar que nuestro odo no aprecia diferencias
signicativas, he confeccionado un vdeo con seis ejemplos en los que se mezclan dos
sonidos simples, todos ellos en consonancia de octava, pero con diferentes desfases
entre sus componentes.
111
En todos los casos las frecuencias de los sonidos son las mismas: 220 Hz (la3 ) y 440 Hz
(la4 ). La fase inicial del componente grave es siempre 0, pero el sonido agudo se va
adelantando sucesivamente 60 respecto al caso anterior: en el primero es tambin de
0; en el segundo es 60; en el tercero, 120; en el cuarto, 180; en el quinto, 240; y
en el sexto, 300. La amplitud del componente agudo es 0,3 y la del grave 0,1.
Figura 6.10: Vdeo de dos sonidos en consonancia de octava con diferentes desfases.
112
6.7.
Mezcla de dos sonidos simples cuyas frecuencias se alejan un poco de la conmensurabilidad prxima: Batidos de
segundo orden
Cuando las frecuencias de dos sonidos simples que se superponen se alejan ligeramente de las que deberan tener para estar en una razn de conmensurabilidad
prxima y ser, por lo tanto, consonantes se produce una modicacin peridica de
la forma de la vibracin resultante, la cual es percibida por nuestro odo como una
oscilacin regular de la cualidad sonora. Este fenmeno recibe el nombre de batidos de segundo orden. Estos fenmenos recuerdan mucho a las interferencias que
se producen entre sonidos muy prximos al unsono (es decir, los batidos de primer
orden), pero sus causas y sus efectos no son exactamente los mismos.
He fabricado un vdeo que nos va a permitir experimentar cmo se producen los batidos de segundo orden cuando se mezclan dos sonidos cuyas frecuencias estn muy
prximas a la consonancia de octava. En todos los casos la frecuencia del componente
ms grave es de 220 Hz (la3 ). En el primer caso la frecuencia del componente agudo
es de 446 Hz, con lo que la diferencia respecto a la frecuencia que debera tener para
estar en razn doble (440 Hz) es de 6 Hz; en el segundo caso la frecuencia del componente agudo es de 444 Hz, es decir, tiene una diferencia respecto a la consonancia
de octava de 4 Hz; en el tercer caso la frecuencia aguda es de 442 Hz con lo que
su diferencia es de 2 Hz; y en el cuarto caso la frecuencia del sonido agudo es de
440 Hz, con lo que la razn que mantiene con el sonido grave es exactamente la de
octava. Para que se distingan bien los dos componentes y para que se aprecie mejor
el fenmeno de los batidos de segundo orden, la amplitud de cada componente es
diferente: la del primero es 0,3 y la del segundo 0,1.
113
Figura 6.11: Vdeo con los batidos de segundo orden de dos sonidos cuyas frecuencias estn muy
prximas a la octava.
En los tres primeros sonidos podemos observar que la forma de la vibracin resultante
cambia peridicamente, como si se tratara de una goma elstica, mientras que su
amplitud, al margen de los cambios de posicin que acompaan la evolucin de
la forma, permanece prcticamente constante. En el ltimo caso, por el contrario,
cuando son perfectamente consonantes, la seal permanece totalmente estable. En
todos ellos, el ritmo con el que la forma de la vibracin evoluciona coincide con la
variacin peridica en la cualidad del sonido que omos. Estas variaciones peridicas
dan lugar a los batidos de segundo orden. Los batidos de segundo orden se repiten
tantas veces por segundo como la diferencia que hay entre la frecuencia que tiene
el sonido agudo y la que debera tener para mantener la razn exacta de octava (440
Hz): en el primer caso, 6 veces por segundo; en el segundo caso, 4 veces por segundo;
y en el tercero, 2 veces por segundo. En el ltimo caso, al mantener la frecuencia de
los dos sonidos la razn 2:1 exacta, desaparecen los batidos y los dos sonidos se funden
perfectamente.
Veamos la explicacin de este fenmeno. En el vdeo de la gura 6.10, donde los
dos sonidos mantienen exactamente la razn 2/1, hemos visto que los desfases entre
los sonidos dan lugar a diferentes formas en la vibracin resultante, pero, puesto que
esos desfases permanecen constantes durante la emisin de cada sonido, la forma de la
vibracin resultante se mantiene estable en todos los casos. Pero ahora las frecuencias
de los dos sonidos que se mezclan no estn exactamente en la razn 2/1, sino que el
114
sonido agudo diere en algunos hercios del que debera tener para que la mezcla
fuera exactamente una octava.
Esta ligera diferencia da lugar a que el desfase entre ambas seales vaya aumentando,
haciendo que la forma de la vibracin resultante no permanezca constante, sino que
vaya cambiando a lo largo del tiempo. Estas modicaciones en la forma de la vibracin se repiten cclicamente, pues el progresivo incremento de los desfases hace que
cada cierto periodo de tiempo ambos sonidos vuelvan a estar en fase y comience un
nuevo ciclo. Los batidos de segundo orden son los cambios cclicos en la forma
de la vibracin que nuestro odo percibe como una peridica oscilacin en la
cualidad sonora.
As pues, la razn por la que se producen tanto los batidos de primer orden como los
de segundo orden es la misma: la evolucin en el desfase entre los dos componentes
cuando se alejan ligeramente de los nmeros que denen las razones exactas del
unsono (1/1) o de las consonancias (2/1, 3/2, 4/3).
Sin embargo, la naturaleza de los batidos de primer orden (que se producen en lo
que podramos llamar cuasi-unsono) y los de segundo orden (que se dan en lo que
podramos llamar cuasi-consonancia) es distinta. Los primeros provocan una evolucin cclica de la amplitud y son percibidos por nuestro odo como un trmolo en
el sonido resultante, mientras que los batidos de segundo orden no afectan a la amplitud de la seal resultante, sino que producen una modicacin, tambin cclica,
de la forma de la vibracin y son percibidos por nuestro odo como una variacin
peridica de la cualidad sonora. En el captulo dedicado a la siologa de la audicin
estudiaremos la causa de que, siendo nuestra audicin frecuencial, percibamos estos
batidos de segundo orden.
En el caso de la cuasi-consonancia de octava, el nmero de batidos por segundo es
la diferencia entre la frecuencia que tiene el sonido ms agudo y la que debera tener
para mantener la relacin exacta 2/1, como hemos podido apreciar en el vdeo de la
gura 6.11.
En lo que respecta a la cuasi-consonancia de quinta, el nmero de batidos por segundo es el doble de la diferencia que hay entre la frecuencia del sonido agudo y la que
debera tener para mantener la razn exacta de 3/2. En efecto, si volvemos al vdeo
115
de la gura 6.8, podemos apreciar que la desanacin del intervalo de quinta provoca
batidos de segundo orden. Donde se perciben ms claramente es en el ejemplo en
el que la quinta est bajada 20 cent. All el componente agudo tiene una frecuencia
de 325,8 Hz, cuando debera tener 330 Hz para mantener la razn exacta de quinta,
3/2, con el componente grave de 220 Hz. La diferencia es de 4,2 Hz y el nmero de
batidos que percibimos por segundo es 8,4, el doble de esa diferencia. En el caso de
la quinta temperada la diferencia es de 0,4 Hz y el nmero de batidos por segundo
de 0,8.
En el caso de la cuasi-consonancia de cuarta el nmero de batidos por segundo que
percibimos es el triple de la diferencia entre la frecuencia que tiene el componente y
la que debera tener para mantener la razn exacta de la cuarta, 4/3.
6.8.
Por ltimo, para concluir este captulo quiero explicar, aunque sea brevemente, lo
que puede suceder en la mezcla de dos sonidos simples si el equipo de sonido que los
reproduce presenta una distorsin signicativa.
En un sentido amplio, distorsin es cualquier modicacin que sufre la seal de audio
al pasar por un sistema, como ocurre, por ejemplo, en un equipo de msica provisto de ecualizador, donde la intensidad de las diferentes bandas de frecuencia puede
ser amplicada a voluntad. De hecho, toda seal que pasa por un sistema que no
sea idealmente plano sufre algn tipo de distorsin, pues algunos componentes son
amplicados ms que otros. Por ejemplo, mediante un ecualizador, podemos reforzar la presencia de los graves o de los ms agudos, o bien de los medios, y todo ello
ocasionar modicaciones en la forma de la vibracin y en la cualidad del sonido
que omos. Sin embargo, en otras ocasiones la alteracin de la importancia de las
bandas de frecuencia puede ser un problema, como cuando la acstica de una sala
de conciertos refuerza en exceso unos determinados componentes en detrimento de
otros.
116
Pero ahora vamos a referirnos a la distorsin en un sentido ms limitado: aquellas deformaciones de la seal de audio que provocan la aparicin de nuevos componentes
frecuenciales que no estaban en la seal original. Esta distorsin es muy importante,
pues no se limita a teir o matizar los componentes de la seal original, sino que
introduce en ella componentes espurios.
Cuando la seal de audio consta de un solo componente sinusoidal esta distorsin
provoca que surjan en la seal nuevos componentes que son armnicos del componente original, por lo que recibe el nombre de distorsin armnica. Se llama armnica porque los componentes que se introducen son armnicos del sonido simple
original, es decir, sus frecuencias son mltiplos de ste. Como veremos en el captulo
dedicado al sonido armnico, esto quiere decir que si el sonido original es un sonido
simple de 220 Hz, por ejemplo, el sonido resultante ser un sonido que, adems de
este componente original, tendr otro u otros componentes cuyas frecuencias sean
mltiplos de la de ese componente original. Es decir, ser la suma del componente
original de 220 Hz, ms otro en 440 Hz, y tal vez otro en 660 Hz, y as sucesivamente
en funcin de la importancia de la distorsin.
En el caso de que la seal de audio est compuesta por dos o ms sonidos simples,
el resultado de la seal distorsionada estar formada no slo por los armnicos correspondientes a la distorsin de cada uno de los sonidos que intervienen en la mezcla, sino tambin por nuevos componentes que sern la suma y la diferencia de las
frecuencias de los componentes originales. Esta distorsin recibe el nombre de distorsin de intermodulacin y altera considerablemente la seal original, de tal modo
que, a partir de cierto nivel, diculta seriamente la audicin de la msica.
Si bien las razones de esta distorsin exceden nuestro objetivo, a continuacin voy
a mostrar un caso particular de distorsin de intermodulacin, la cual ha dado lugar
a que en ocasiones se haya interpretado mal el fenmeno de la mezcla de dos sonidos simples. Vamos a ver lo que puede suceder si el equipo reproductor presenta
cierta cantidad de distorsin cuando los dos componentes que se mezclan forman
un intervalo de quinta natural (3/2). En los vdeos de la gura 6.6 y de la gura 6.8
hemos podido apreciar que ambos se oyen como una consonancia de quinta. Sin
embargo ahora vamos a poder experimentar que si el equipo presenta una distorsin
relevante pueden ser odos como si se tratara de un solo sonido cuya frecuencia fuera
una octava ms grave que la del ms grave de los dos componentes. He elegido este
117
Figura 6.12: Vdeo que ilustra el efecto de la distorsin en la mezcla de dos sonidos simples.
En el osciloscopio podemos ver en color verde, en torno al valor de 0,4 la seal resultante que omos y debajo, en color azul, centrada en el valor -0,4, la seal original
tomada como referencia para apreciar el efecto de la distorsin. Si nuestro reproductor de sonido no distorsiona (en caso contrario igual es buena idea probar con
unos auriculares), en el primer caso debemos or dos notas consonantes muy bien
mezcladas. Vemos en el osciloscopio que la seal verde, la que estamos oyendo, y la
seal azul, la original, son totalmente idnticas.
En el segundo caso, en el que articialmente he provocado una distorsin de intermodulacin, omos un solo sonido que est a una octava ms grave que el la4 ,
es decir, omos el la3 , pero con una cualidad sonora ms rica que la de un sonido
simple. Si nos jamos en la forma de la vibracin (podemos parar el reproductor de
vdeo) y comparamos la seal resultante, ahora distorsionada, con la referencia original de color azul podremos apreciar que la seal verde no es capaz de continuar
118
6.9.
Conclusin
En este captulo hemos podido experimentar que cuando dos sonidos simples suenan
simultneamente se producen diferentes fenmenos acsticos y psicoacsticos, los
cuales dependen de la diferencia aritmtica entre sus frecuencias, de la anchura de la
119
banda crtica de nuestro odo en esas frecuencias y de la razn numrica que hay entre
ellas. Estos fenmenos, que fundamentan una parte importante de nuestro lenguaje
musical, pueden ser resumidos de la siguiente manera:
- Si los dos sonidos simples tienen la misma frecuencia, el resultado es un solo sonido simple de esa frecuencia, cuya amplitud depende no slo de la amplitud de sus
componentes, sino tambin del desfase que hay entre ellos.
- Si la diferencia aritmtica entre la frecuencia de los dos sonidos simples es menor de
unos 15 Hz, percibimos un solo sonido simple, cuya amplitud oscila sinusoidalmente
dando lugar a un efecto de trmolo (batidos de primer orden) y cuya frecuencia se
sita entre la de los dos componentes, aproximndose ms a la del que tiene mayor
amplitud. La frecuencia con la que se repite la oscilacin de la amplitud (el nmero
de batidos por segundo) es la diferencia aritmtica entre las frecuencias de los dos
sonidos componentes. Estos batidos, al permitir determinar con precisin la diferencia entre la frecuencia de los dos componentes, posibilitan anar con facilidad los
instrumentos musicales y establecer con exactitud los intervalos que dan lugar a las
escalas.
- Cuando la diferencia aritmtica entre las frecuencias de los dos sonidos simples
supera aproximadamente los 15 Hz, nuestro sistema auditivo no puede seguir el ritmo de los batidos y dejamos de percibir un solo sonido simple tremolado. Si esta
diferencia est dentro de la anchura de la banda crtica correspondiente a esa zona
frecuencial, omos un sonido spero y rugoso, a modo de zumbido, en el que no
podemos distinguir individualmente los dos componentes. Cuando esta diferencia
se aproxima al lmite de la anchura de la banda crtica, aunque la cualidad del sonido siga siendo rugosa, progresivamente pasamos a reconocer los dos componentes
individuales. Y cuando la diferencia supera con cierta holgura esa anchura de la banda crtica desaparece la sensacin de rugosidad y percibimos ya ntidamente los dos
componentes por separado.
- Cuando las frecuencias de los dos sonidos simples mantienen una relacin de conmensurabilidad prxima (razones entre los primeros nmeros enteros positivos), la
mezcla sonora resultante es peridica y la forma de la vibracin es lo sucientemente
sencilla como para que nuestro sistema auditivo pueda reconocer las coincidencias
peridicas entre los dos componentes. A consecuencia de ello, si las frecuencias de
120
121
Captulo 7
El sonido armnico
7.1.
Introduccin
La palabra griega harmona originalmente designaba al conjunto que resulta del buen
ensamblaje de sus partes. Por ello, en la Antigedad las escalas musicales, estructuradas mediante consonancias, eran llamadas armonas y la msica era considerada el
paradigma de lo armnico. En tanto que el sonido musical es un conjunto formado
por partes perfectamente ensambladas, hasta el punto de que es percibido como un
solo sonido, tambin es llamado sonido armnico.
Hasta ahora hemos estudiado la vibracin de un sonido simple y los fenmenos acsticos que se producen al superponerse dos vibraciones simples, pero la mayor parte de
los sonidos que omos son bastante ms complejos, pues en realidad son el resultado
de la combinacin de muchos sonidos simples.
Los sonidos simples cuando forman parte de un sonido compuesto reciben el nombre de parciales. Ahora bien, cualquier combinacin de sonidos simples no genera
un sonido musical, es decir, el sonido resultante no siempre vibra de una manera lo
sucientemente peridica como para que nuestro sistema auditivo sea capaz de reconocer una altura tonal. Para que se produzca un sonido musical es necesario que
las relaciones entre las frecuencias de los componentes simples que intervienen en la
mezcla sean armnicas, es decir, que sus frecuencias sean mltiplos de una frecuencia fundamental. En ese caso se crea una estructura armnica y los sonidos simples
122
123
He confeccionado mediante Matlab varios vdeos que nos van a permitir observar con
detenimiento qu es el sonido armnico. En la parte superior de todos ellos podremos
examinar la forma de la vibracin, es decir, la seal de audio, como en el osciloscopio
virtual que hemos visto en los vdeos de los captulos anteriores, y en la parte inferior
podremos ver unas grcas que representan la frecuencia y la amplitud de cada uno
de los componentes que constituyen ese sonido. El color de cada componente en
esas grcas viene determinado por su amplitud, siguiendo una escala que va del
negro (el valor cero) al blanco (el valor mximo que podra representarse en el eje
de ordenadas), pasando por los distintos colores que adquiere el hierro al calentarse:
negro rojizo, rojo oscuro, rojo claro, naranja, amarillo y, nalmente, blanco, con
todos sus matices intermedios. Este mapa de color es el que se utilizar en las grcas
de los captulos siguientes cuando sea necesario representar mediante colores el valor
de la amplitud.
7.2.
124
Figura 7.1: Vdeo que muestra la diferencia entre los sonidos armnicos y los inarmnicos.
En el segundo caso, por el contrario, todos omos claramente una nota musical, en
concreto, el la3 a 220 Hz. Aunque un buen odo analtico muy entrenado podra
identicar aisladamente cada componente, lo cierto es que los percibimos como un
nico sonido musical, pues han amalgamado perfectamente bien. Se ha producido
la mezcla armnica.
Si nos jamos en las grcas de arriba, las del osciloscopio, comprobamos que hay una
evidente diferencia en la forma de la seal entre el primer sonido y el segundo. En el
caso del sonido inarmnico, vemos que la forma de la vibracin no es estable, sino
que va cambiando constantemente, de modo que es imposible reconocer ninguna
periodicidad en ella. En el caso del sonido armnico, por el contrario, la forma de
la vibracin permanece constante, con lo que podemos apreciar la estabilidad de su
dibujo, es decir, su periodicidad.
En la grca de abajo apreciamos la disposicin espacial de los componentes. Tambin ahora las diferencias son claras. Vemos que en el caso del sonido inarmnico los
componentes mantienen entre s distancias totalmente desiguales, sin que podamos
encontrar ningn patrn espacial, mientras que en el caso del sonido armnico todos los componentes estn igualmente espaciados. Conviene jarnos en que, en este
segundo caso, la distancia entre los componentes armnicos es la misma que la que
hay entre 0 y la frecuencia del primer componente, es decir, 220 Hz.
Para entender lo que sucede podemos jarnos en un pequeo fragmento de la seal
de la segunda parte del vdeo, cuando se produce la superposicin de cuatro componentes parciales armnicos:
126
Vemos que, mientras el componente ms luminoso y de mayor amplitud, representado en amarillo claro (el de 220 Hz), realiza un ciclo completo, el componente
amarillo oscuro (el de 440 Hz) realiza exactamente dos ciclos, el naranja (el de 660
Hz), tres ciclos exactos, y el rojo (el de 880 Hz), cuatro ciclos. Todos los componentes se sincronizan con total precisin cada vez que el de 220 Hz empieza un nuevo
ciclo.
Esta sincronizacin hace que la seal verde, la resultante de la mezcla de los cuatro
componentes, se repita exactamente igual cada cierto tiempo. En efecto, esta seal
verde es peridica y su periodo, como podemos observar en la grca, es aproximadamente de 4,5 milsimas de segundo (1/220). Podemos apreciar que ese periodo es
la inversa de la frecuencia del componente ms grave, el fundamental. Y puesto que
los componentes han amalgamado bien formando un solo sonido, una mezcla armnica, podemos atribuirle una frecuencia. De ah que en la segunda parte del vdeo
oigamos una nota de 220 Hz, el la3 en nuestra anacin estndar.
Fijmonos ahora en la forma de la seal cuando se mezclan componentes sinusoidales
que no mantienen entre s una relacin armnica, como ocurre en la primera parte
del vdeo.
127
En la gura 7.3 no apreciamos ninguna regularidad: al no haber ninguna sincronizacin entre los componentes individuales, sino que que cada uno lleva su propio
ritmo de repeticin, en la seal verde resultante no existe ninguna forma que se repita. Este sonido carece de periodicidad y, por lo tanto, no podemos asignarle una
frecuencia y no omos una altura tonal concreta.
7.3.
La serie armnica
7.3.1.
Figura 7.4: Vdeo que muestra la generacin de una seal en diente de sierra a partir de los componentes consecutivos de la serie armnica.
Podemos apreciar que el carcter puro, seco y ms bien mate del sonido simple aislado que omos al inicio, se va perdiendo con la adquisicin de nuevos componentes.
Observamos que progresivamente el sonido va adquiriendo ms cuerpo y nos va
transmitiendo una sensacin de mayor grosor y de mayor brillo. En efecto, la incorporacin del segundo armnico elimina ya la sequedad del sonido simple y le otorga
una cualidad dulce y redondeada. Con el tercer armnico se introduce una clara
sensacin de nasalidad. El cuarto armnico refuerza el carcter redondo y compacto,
atenuando un poco la nasalidad que haba introducido el tercer armnico. El quinto
aporta plenitud al sonido, producindonos la sensacin de una sonoridad compacta
y llena. El sexto aade de nuevo nasalidad. El sptimo introduce, por primera vez,
una sensacin de aspereza. Y el octavo refuerza la coherencia total del sonido, aumentando el brillo y la luminosidad del conjunto.
En lo que respecta a la forma de la seal que vemos en el osciloscopio, comprobamos que conforme se van aadiendo nuevos armnicos, va hacindose ms y ms
compleja, adquiriendo nuevas ondulaciones y alejndose de la forma sinusoidal que
tena al principio. El hecho de que todos componentes que introducimos estn en
fase y que la relacin entre sus amplitudes se decremente proporcionalmente al nmero del armnico, hace que esas ondulaciones tiendan a aproximarse a una forma
rectilnea, conforme aumenta el nmero de armnicos que se incorporan. Aunque
130
en este vdeo para construir el sonido compuesto slo he sumado ocho armnicos,
podemos darnos cuenta de que la incorporacin de un nmero mayor nos permitira
aproximarnos cada vez ms a una seal que tuviera la forma de dientes de sierra.
7.3.2.
Figura 7.5: Vdeo que muestra la generacin de una seal rectangular a partir de los componentes
impares de la serie armnica.
Podemos apreciar que la incorporacin del tercer armnico hace que el sonido tenga
un carcter nasal muy destacado. As mismo, la ausencia del segundo armnico nos
produce un efecto de hueco. El quinto armnico aporta tambin ahora una sensacin de acabado, pero dentro de una cualidad sonora dominada por la nasalidad. Los
restantes armnicos que se van incorporando (el sptimo, el noveno, el undcimo, el
decimotercero y el decimoquinto) proporcionan cada vez ms brillo al sonido, pero
el resultado es tambin progresivamente ms spero.
131
Respecto a la forma de la vibracin, observamos que va evolucionando con la incorporacin de nuevos armnicos, hasta adquirir un aspecto rectilneo, una seal
rectangular. Esta forma rectangular se debe a la concentracin de las ondulaciones
en los tramos superior e inferior de la seal, unas ondulaciones que van aumentando
en nmero y atenundose en amplitud con cada nueva incorporacin de armnicos.
Igual que en el caso de la seal en dientes de sierra, tambin ahora podemos imaginar que si se siguieran aadiendo componentes armnicos impares, manteniendo la
misma proporcin en el decremento de la amplitud, podramos aproximarnos cunto
quisiramos a una seal rectangular.
El predominio de los armnicos impares es un rasgo caracterstico del timbre de
algunos instrumentos como, por ejemplo, el clarinete.
7.3.3.
Como hemos podido experimentar en los dos vdeos anteriores, la presencia o ausencia de unos u otros componentes inuye decisivamente en la cualidad sonora de
la mezcla armnica. Pero hay que tener en cuenta que la coloracin que aade cada
componente a la mezcla armnica se ve matizada por otras circunstancias, en especial, la anchura de la banda crtica en la que est localizado o la existencia o no
de componentes vecinos dentro de su banda frecuencial con los que pueda interferir.
Dejando al margen esto, podemos generalizar lo que hemos observado en los vdeos
y deducir cmo afecta cada uno de los componentes de la serie armnica a la cualidad
sonora de la mezcla resultante:
a) En lneas generales, el incremento del nmero de armnicos aumenta la brillantez del sonido.
b) Los armnicos segundo, cuarto, octavo, decimosexto, etc. es decir, los que
mantienen una relacin de octava con el fundamental refuerzan la coherencia
tonal del sonido.
132
c) Los armnicos tercero, sexto, duodcimo, etc. es decir, los que estn en
relacin de octava con el tercer armnico aportan un carcter nasal (llamado
as por recordar al que se produce en el habla al emitir los sonidos nasales).
d) Los armnicos quinto y dcimo aaden una sensacin de plenitud.
e) El resto de los armnicos aaden cierto matiz de aspereza.
f) Un sonido con numerosas lagunas entre sus armnicos tiende a producir una
sonoridad hueca, mientras que un sonido ms completo produce una sonoridad
plena y maciza.
Hay que tener presente que si hubiramos alterado la fase inicial de los componentes armnicos, hubiramos cambiado la forma de la vibracin, pero la cualidad del
sonido resultante no hubiera sufrido ninguna modicacin relevante.
Por otra parte, mediante estos dos vdeos podemos comprender que cualquier forma
de vibracin peridica, por alejada que est de la sinusoidal, puede ser generada a
partir de componentes armnicos. Y, a la inversa, podemos deducir tambin que
cualquier forma de vibracin peridica puede ser descompuesta en sus componentes
armnicos, como los que aparecen en la ventana inferior de los dos vdeos.
7.4.
Una vez que hemos visto que los sonidos musicales complejos se forman combinando
diversos componentes de la serie armnica, nos interesa conocer la correspondencia
entre esos componentes y las notas e intervalos de la escala musical temperada, la
habitual en nuestra msica.
Muchos tericos de la Armona han considerado que los acordes imitan en cierta
manera la estructura armnica de los sonidos musicales, por lo que es comn que los
tratados de Armona comiencen enumerando los componentes de la serie armnica
e indicando las notas de la escala a las que ms se aproximan. Aunque estas consideraciones hoy en da estn en desuso, lo cierto es que existe una gran anidad entre los
133
elementos de nuestro lenguaje musical y la organizacin intervlica de la serie armnica. Esta anidad se debe a que la estructura cognitiva que posibilita la percepcin
unitaria de un sonido armnico es la misma que la que est detrs de la construccin
de nuestro lenguaje musical.
Por otra parte, conocer la correspondencia entre los componentes de la serie armnica y las notas de la escala musical nos va a permitir entender por qu omos
consonancias o disonancias cuando se mezclan notas musicales. Puesto que habitualmente las notas de las voces y de los instrumentos musicales constan de mltiples
componentes armnicos, cuando se emiten simultneamente dos o ms notas se va a
producir la mezcla e interferencia entre sus respectivos componentes. La coincidencia o divergencia entre los armnicos de cada una de esas notas determinar el grado
de consonancia que se establezca entre ellas.
Para ver las correspondencias entre los componentes armnicos y las notas de
la escala temperada, primero debemos traducir a semitonos temperados los intervalos que forman cada uno de los componentes de la serie armnica con el
fundamental o primer armnico. Las razones que denen estos intervalos vienen
dadas por las que se establecen entre sus respectivos nmeros de armnico: el intervalo del segundo armnico con el fundamental tiene la razn 2/1 (o sea, 2); el del
tercero con el fundamental, la razn 3/1 (o sea, 3); el del cuarto, la razn 4/1 (o sea,
4); y as sucesivamente. Como hemos visto en el captulo 5, para expresar estas razones en semitonos temperados bastar tomar el logaritmo en base 2 de los sucesivos
enteros positivos que constituyen la serie armnica y multiplicar el resultado por 12.
Por ejemplo, para expresar en semitonos temperados el intervalo que forma el tercer
armnico con el fundamental, tomaremos el logaritmo en base 2 del nmero 3 y
multiplicaremos el resultado por 12, lo que nos dar, redondeado a centsimas de
semitono, 19,02 semitonos.
En la tabla de abajo presento el nmero de semitonos temperados, redondeados a
cents, que tiene el intervalo que forma cada uno de los componentes de la serie
armnica con el fundamental.
134
Armnico
Nmero de
Diferencia en
semitonos
cents entre el
con el fundamental
temperados
intervalo natural
y el temperado
Unsono
Octava
12
19,02
+2
Doble octava
24
27,86
-14
31,02
+2
33,69
-31
Triple octava
36
38,04
+4
10
39,86
-14
11
41,51
-49
12
43,02
+2
13
44,41
+41
14
45,69
-31
15
46,88
-12
16
Cudruple octava
48
Tabla 7.1: Intervalos que se establecen entre los componentes de la serie armnica y el fundamental.
135
As, por ejemplo, en la quinta la, el ordinal 5 indica que se trata del quinto componente armnico y que, por lo tanto, la razn con el fundamental es 5/1. En la segunda
columna gura el nombre habitual de ese intervalo, en este caso, doble octava ms
tercera mayor natural. En la tercera columna se presenta el nmero de semitonos
temperados de este intervalo, que es el resultado de tomar el logaritmo en base 2 de 5
y multiplicarlo por 12, lo que nos da un valor, redondeado a centsimas de semitono,
de 27,86 semitonos. Esta cantidad ser de utilidad para averiguar cul es la nota musical de nuestra escala temperada que ms se aproxima a ese componente en una serie
armnica concreta, es decir, una serie armnica con un componente fundamental
determinado (por ejemplo, la serie armnica que comienza en do2 que podemos ver
en la gura 7.6). En la cuarta columna se presenta la diferencia en cents entre el
intervalo que forma ese componente armnico con el fundamental y el intervalo
temperado ms prximo (recordemos que por denicin todo intervalo temperado
tiene un nmero entero de semitonos). Puesto que en este caso el valor en semitonos
que forma el quinto armnico con el fundamental es de 27,86, la diferencia con el
intervalo temperado ms prximo, el de 28 semitonos, ser de -14 cents, tal como
aparece en la cuarta columna. Dicho de otra manera el intervalo natural de 5/1 es
14 cents menor que el intervalo de 28 semitonos, el intervalo de doble octava ms
tercera mayor temperada.
Una vez que hemos expresado en semitonos temperados el valor intervlico de cada
armnico con el fundamental, es sencillo asignar el primer armnico a una nota
cualquiera y, a partir de ah, determinar la nota musical que ms se aproxima a cada
uno de los componentes armnicos.
La gura que presento a continuacin nos va a permitir observar que la frecuencia
de algunos componentes armnicos coincide exactamente con la frecuencia de una
nota de la escala temperada, que la de otros se aproxima mucho, pero que la frecuencia de otros se aleja signicativamente de la de cualquier nota de esa escala. Estas
coincidencias y divergencias entre las frecuencias de los componentes armnicos y
las de sus correspondientes notas de la escala temperada condicionan el grado de
consonancia que se establece entre las notas musicales, como se explica en el captulo
que trata de la consonancia entre sonidos compuestos.
Para minimizar el nmero de bemoles y sostenidos, suele ser habitual presentar las
notas de la serie armnica tomando como referencia la nota do. He elegido como
136
fundamental el do2 , para evitar sobrepasar en exceso los lmites del pentagrama. La
serie armnica que presento a continuacin se extiende hasta los primeros diecisis
componentes armnicos.
Figura 7.6: Serie armnica con fundamental en do2 y diferencias entre las notas naturales correspondientes a cada armnico y las temperadas.
Debajo del pentagrama vemos el nmero del armnico al que se asigna cada nota.
Los colores de las notas representan la cualidad sonora caracterstica que aporta cada
armnico a la mezcla: en negro estn los que proporcionan coherencia al sonido; en
magenta, los que aaden una sensacin de nasalidad; en azul, los que aportan una
impresin de plenitud; y en rojo, los que introducen cierto matiz de aspereza.
En la la que est situada inmediatamente encima del pentagrama se indica la frecuencia de cada nota en la escala temperada estndar (la4 = 440 Hz), redondeada
a dcimas de hercio. En la siguiente la, se muestra la frecuencia del componente
armnico al que podemos llamar la nota natural, la cual es el resultado de multiplicar la frecuencia de la nota do2 (130,8 Hz) por el nmero del armnico, redondeada
tambin a dcimas de hercio. En la tercera la se indica, cuando la hay, la diferencia
en hercios entre la frecuencia del componente armnico y la frecuencia de la nota
temperada, redondeada a dcimas de hercio. Y en la la superior, destacada en color
137
azul, se presenta, expresado en cents, el intervalo que hay entre la nota natural es
decir, el componente armnico y la nota temperada ms prxima. Puesto que este
intervalo es el mismo que la diferencia que hay entre el intervalo natural que forma el
componente armnico con el fundamental y el intervalo temperado ms prximo,
podemos ver que estos valores coinciden con los de la cuarta columna de la tabla
7.1.
Por ejemplo, vemos que el quinto componente armnico se corresponde, aproximadamente, con la nota mi4 temperada, cuya frecuencia es 659,3 Hz. Como la frecuencia del quinto armnico es 654,1 Hz, comprobamos que es 5,2 Hz menos que la de la
nota mi4 temperada. El intervalo que hay entre la nota natural, es decir, la correspondiente al componente armnico, y la nota temperada es de -14 cents (27,86 - 28 =
-14). Podemos vericarlo tambin calculando el intervalo que hay entre la frecuencia
de la nota natural y la frecuencia de la nota temperada, tomando el logaritmo en base
2 de la razn entre sus frecuencias (654,1/659,3) y multiplicando el resultado por 12,
con lo que obtendremos el mismo resultado de -14 cents. As pues, el nmero -14
que est sobre la nota mi4 indica que la nota correspondiente al quinto armnico de
la serie est 14 cents por debajo del mi4 de nuestra escala temperada.
7.5.
Dadas las anidades entre la constitucin de la serie armnica y la estructura intervlica que da lugar a las escalas y acordes de nuestro lenguaje musical, nos interesa
comparar las relaciones intervlicas que se establecen entre los sucesivos componentes armnicos con los intervalos de nuestra escala temperada. Para ello vamos a
utilizar la la superior de la gura 7.6, en color azul, donde se indica, redondeado a
cents, el intervalo de diferencia que hay entre la nota de la serie armnica y la nota
temperada correspondiente. As mismo, para diferenciar con claridad cundo estamos rerindonos a la nota de la serie armnica y cundo a la nota correspondiente
de nuestra escala temperada, utilizar el adjetivo natural para las notas de la serie
armnica y el adjetivo temperada para las de la escala temperada.
138
un acorde de sptima de dominante, aunque su correspondiente sptima temperada est ya muy lejos de la sptima natural, en concreto la sptima natural
es 31 cents inferior a la sptima temperada. En la gura 7.6 corresponden a las
notas do4 , mi4 , sol4 , sib4 , todas ellas naturales.
e) Entre el noveno y el octavo armnico se establece el tono de 9/8, tambin llamado tono pitagrico, que resulta de la composicin de dos quintas
naturales a la que posteriormente se sustrae una octava. En nuestra serie armnica corresponde al intervalo que se establece entre re5 do5 , ambos naturales.
Podemos construir este tono de 9/8 si aadimos a la quinta natural que hay entre el cuarto y el sexto armnico (do4 sol4 naturales), la quinta natural que hay
entre el sexto armnico y el noveno armnico (sol4 re5 naturales), con lo que
obtenemos un intervalo de octava ms un tono diatnico. Luego, al ascender
una octava el sonido ms grave del intervalo as formado (el do4 pasa a ser do5 ),
dejamos solamente el tono diatnico. Como cada quinta natural excede en 2
cents a la quinta temperada, este tono pitagrico ser 4 cents mayor que el tono
temperado.
f) Entre el dcimo y el noveno armnico se forma un intervalo de tono de
10/9, el llamado tono menor. En nuestra serie armnica corresponde al intervalo que se establece entre mi5 re5 naturales. Este intervalo es 18 cents menor
que el tono temperado. En efecto, puesto que el noveno armnico (re5 natural)
es 4 cents ms alto que la correspondiente nota temperada (re5 temperado) y
el dcimo armnico (mi5 natural) es 14 cents ms bajo que su correspondiente
nota temperada (mi5 temperado), la diferencia respecto al tono temperado es de
18 cents.
g) Entre el decimosexto y el decimoquinto armnico se produce un intervalo de semitono de 16/15, el llamado semitono mayor que se usaba en
algunas escalas musicales antiguas. En nuestra serie armnica corresponde al
intervalo que se establece entre do6 si5 naturales. Este intervalo excede en 12
cents al semitono temperado, pues el si5 natural es 12 cents ms bajo que el si5
temperado.
h) El resto de los intervalos que se forman entre los sucesivos armnicos
quedan lejos de los intervalos usados en nuestras escalas musicales.
140
7.6.
Figura 7.7: Vdeo que muestra que la percepcin de la altura tonal del sonido armnico no se ve
afectada por la ausencia del componente fundamental o incluso de los primeros componentes.
Como era de esperar, la primera nota que omos es un la3 , pues esa es la frecuencia
del componente fundamental, tal como aparece indicado en la leyenda. Si atendemos a la grca de abajo y nos jamos en su estructura armnica, vemos que todos
los componentes son mltiplos de 220 Hz y que estn presentes los ocho primeros
armnicos de su serie. En la ventana del osciloscopio podemos ver que la forma de
la vibracin es totalmente peridica. En efecto, si detenemos el vdeo en cualquier
momento, y hacemos un clculo aproximado, podremos ver que su periodo ocupa
un poco menos de la anchura de un rectngulo de la retcula, es decir, un poco menos de 5 milsimas de segundo, lo cual es coherente con el periodo correspondiente
a la frecuencia de 220 Hz, es decir, 4,5 milsimas de segundo (1/220 = 0,0045).
142
La segunda nota que omos es un la2 . La estructura armnica de esta nota est formada tambin por ocho componentes consecutivos, pero ahora el primer componente
de esa serie armnica est ausente. En efecto, vemos que las frecuencias de todos los
componentes son mltiplos de 110, y no de 220. O lo que es lo mismo, el mximo
comn divisor de las frecuencias de todos los componentes de esta estructura armnica es 110. As pues, deducimos que la frecuencia del componente fundamental de
la serie armnica a la que pertenece esta nota es 110 Hz y que en este caso est ausente. En efecto, los componentes presentes en esta estructura armnica comienzan
con el segundo armnico, el de 220 Hz, y consecutivamente llegan hasta el noveno,
el de 990 Hz. En el osciloscopio vemos que la seal es tambin claramente peridica,
pero que el periodo es el doble del periodo del caso anterior, aproximadamente, 9
milsimas de segundo, como corresponde a una frecuencia de 110 Hz (1/110 = 0,009,
redondeando a milsimas).
La tercera nota que omos es el la1 . En este caso el mximo comn divisor de todos los
componentes que forman la estructura armnica de ese sonido es 55, de modo que la
frecuencia del componente fundamental de la serie armnica a la que pertenece es 55
Hz. Pero este componente no est. Podemos tambin observar que el componente
ms grave que est presente en la estructura armnica de esta nota musical es el cuarto
armnico. A partir de l estn los sucesivos componentes hasta el undcimo, el de 605
Hz. As pues, en este caso, no slo falta el fundamental, sino que tambin faltan los tres
primeros componentes. Pero nosotros omos con total claridad una nota que es una
octava ms grave que la anterior, es decir, un la1 . Si nos jamos en la periodicidad,
vemos que tambin se corresponde con la frecuencia del fundamental ausente. En
el osciloscopio podemos observar que el periodo de esta seal es el doble del de la
anterior, aproximadamente 18 milsimas de segundo (1/55 = 0,018, redondeando a
milsimas).
Mediante este ejemplo hemos podido experimentar que la altura tonal que percibimos en un sonido armnico es independiente de la existencia o no del componente
fundamental o incluso de los componentes ms graves. Ello explica que seamos capaces de or notas graves con cualquier sistema de reproduccin de sonido, por muy
deciente que sea: aunque la calidad sonora saldr perjudicada, la percepcin de la
nota de la que se trata no se ve modicada. Por poner un ejemplo, la mayor parte de
los reproductores de sonido econmicos son incapaces de dar frecuencias inferiores
143
a 100 Hz; sin embargo, en esos reproductores nosotros no omos las notas graves
cambiadas de octava, sino que, incluso en el peor equipo de msica, reconocemos,
pongamos por caso, el la1 del piano, cuya frecuencia fundamental est en 55 Hz y
no lo confundimos con el la2 , cuya frecuencia es 110 Hz. Ahora bien, la cualidad, el
color del sonido, no ser el mismo si estn o no estn presentes los componentes ms
graves.
7.7.
A continuacin me propongo mostrar que la estructura armnica del sonido puede deformarse hasta cierto punto sin que desaparezca la percepcin de una
altura tonal definida. Observaremos, adems, que esa deformacin, debida al estiramiento progresivo de la distancia frecuencial entre los componentes, produce una
modicacin de la cualidad sonora.
Como acabamos de ver, la altura tonal de un sonido musical queda denida por la
distancia frecuencial entre los componentes que constituyen su estructura armnica,
al margen de los posibles huecos que pueda haber en ella. Ahora bien, en la realidad, los sonidos de algunos instrumentos deforman esa estructura, incrementando la
distancia entre sus componentes. Y, adems, lo hacen de una forma no lineal: conforme mayor es el ordinal del armnico, mayor es el intervalo musical en el que se
alejan.
Por poner un ejemplo, en el caso del piano la deformacin ocasionada por la rigidez
de sus cuerdas metlicas puede dar lugar en una nota grave a que la frecuencia del armnico decimoquinto, pongamos por caso, sea 16 veces la frecuencia del fundamental, es decir, la frecuencia que debera tener el armnico decimosexto. Ahora bien, la
deformacin de la estructura armnica, cuando se mantiene dentro de unos lmites,
no impide el reconocimiento de una nota musical, si bien es cierto que la altura tonal
que se percibe es ligeramente ms aguda que la correspondiente a la frecuencia del
componente fundamental. Adems esta inarmonicidad modica la cualidad sonora:
cuando es muy ligera aporta un cierto grosor y hace que el sonido sea ms clido;
144
Figura 7.8: Vdeo que muestra que la introduccin de una ligera inarmonicidad en un sonido armnico no impide la percepcin de una altura tonal.
La leyenda que aparece a la derecha de la ventana inferior del vdeo muestra la frecuencia de los componentes y su nmero de armnico, as como la desviacin en
hercios de cada uno de ellos respecto a la frecuencia que tendra el armnico sin
deformar y su correspondiente distancia intervlica expresada en cents.
145
En el primer caso omos un sonido estable y claro, una nota musical, en concreto,
un la3 a 220 Hz. En la ventana del osciloscopio podemos apreciar que la forma de
la vibracin permanece siempre idntica a s misma, totalmente estable. Si paramos
el vdeo en cualquier momento y atendemos a la leyenda, comprobaremos que los
componentes de este sonido son los ocho armnicos consecutivos exactos, mltiplos
sucesivos de la frecuencia fundamental. Por eso en todos ellos la desviacin es 0. En
resumen, la deformacin de la estructura armnica en este caso es nula.
Si comparamos el segundo caso con el anterior, notamos que son muy similares.
Aunque tenemos una cierta sensacin de que la altura se ha elevado muy ligeramente, seguimos oyendo sin ninguna duda una nota musical clara. Ahora bien, si
prestamos un poco ms de atencin, apreciamos que la cualidad sonora se ha modicado sensiblemente respecto al sonido anterior: se ha hecho ms clida y ha adquirido
una coloracin que nos recuerda algo al efecto producido por los batidos de segundo
orden cuando se mezclan dos sonidos consonantes que se apartan ligersimamente
de la conmensurabilidad exacta. En la ventana del osciloscopio apreciamos que ahora la forma de la vibracin cambia a cada momento, si bien el periodo se mantiene
constante.
Podemos parar el vdeo y ver en la leyenda que ahora ya hay una desviacin en la
frecuencia de los componentes, una desviacin que es muy pequea en los primeros
armnicos y que va creciendo, tanto en hercios como en cents, a medida que aumenta
su ordinal. Pero nos damos cuenta de que incluso en el ltimo componente, que es
donde se produce la desviacin mxima, el intervalo que se desva respecto al valor
que le correspondera al octavo armnico exacto es solo de 16 cents. Vemos, as pues,
que en este sonido la estructura armnica se ha deformado ligeramente. En efecto,
cuando he generado este sonido, he elegido a propsito los valores de deformacin
de cada componente para que simulara aproximadamente el estiramiento que se suele
producir en una cuerda media del piano. Para ello he usado una variante de la frmula
habitualmente utilizada para calcular la frecuencia de cada uno de los componentes
de una nota de piano a partir de un coeciente dado de inarmonicidad.
En el tercer caso, si atendemos a nuestra percepcin auditiva, comprobamos que
resulta todava posible asignar al sonido una altura tonal, aunque ya de una forma
ms confusa que en los dos casos anteriores. Observamos que esta altura tonal es
ms elevada. Al poner un poco ms de atencin apreciamos que la cualidad clida
146
hace que tenga una frecuencia propia y, en consecuencia, que tenga sentido atribuirle una altura tonal. La diferencia respecto a los batidos de segundo orden reside en
que la complejidad de los desfases, debida al elevado nmero de componentes, evita
una rotacin repetida de la forma de la vibracin, por lo que no percibimos batidos,
sino solamente un sonido ms clido.
Conforme la inarmonicidad aumenta la periodicidad tiende a desaparecer y se complica la percepcin de una altura tonal, pues nuestro sistema auditivo tiene dicultades para organizar los componentes en un patrn armnico. En el ltimo ejemplo de
este vdeo, la deformacin de la estructura es tan importante que el patrn armnico
es percibido ya de una manera difusa, totalmente alejada de la percepcin ntida con
la que se percibe en el primer caso.
7.8.
Conclusin
A lo largo de este captulo hemos podido comprobar que la Armona est presente
incluso en la constitucin misma del sonido musical. Hemos visto que los sonidos
armnicos o musicales son el resultado de la buena mezcla, mientras que los inarmnicos son aquellos cuyos componentes no se mezclan bien, no amalgaman unos con
otros.
Hemos podido observar cmo al combinarse varias vibraciones que guardan entre s
determinadas razones y proporciones se produce una nueva entidad, una nota musical clara y diferenciada. Lo que hace musical a la vibracin que resulta de esta mezcla
es la estructura armnica que posee, una estructura que en s misma no es otra cosa
que unas determinadas relaciones de conmensurabilidad. Por eso los componentes
del sonido armnico no desaparecen, sino que pueden ser de nuevo descompuestos,
tal como hace nuestro sistema auditivo y como podemos realizar mediante las herramientas matemticas propias del anlisis frecuencial. Es por ello por lo que la rama
de las matemticas que se ocupa de la descomposicin de funciones en componentes
sinusoidales se denomina Anlisis Armnico.
Puesto que la estructura armnica, que es lo propio del sonido musical, se crea por
la conmensurabilidad de las frecuencias de todos los componentes respecto al fundamental, y puesto que esa conmensurabilidad permite que amalgamen bien unos
148
componentes con otros, podemos considerar que el sonido armnico viene a ser la
generalizacin a un nmero indeterminado de componentes de la buena mezcla
que se produce entre dos sonidos simples consonantes. En ambos casos la conmensurabilidad da lugar a la sincronizacin de las fases de los distintos componentes, y
esa sincronizacin posibilita su buena mezcla. En este captulo hemos visto que los
intervalos que hay entre los primeros componentes de una serie armnica son precisamente los principales intervalos consonantes (2/1, 3/1, 4/1, 3/2, 4/3), de modo que
la estructura sonora que se crea mediante la mezcla de cualquier nmero de componentes pertenecientes a la misma serie armnica da como resultado un sonido en el
que se ha producido la buena mezcla, un sonido musical.
Mediante los ejemplos que se presentan en los vdeos de este captulo hemos podido
experimentar que la vibracin del sonido armnico o musical mantiene siempre una
periodicidad y que, por lo tanto, posee una frecuencia concreta, con lo que se le puede
atribuir una altura tonal. Dado que nosotros no somos capaces de seguir al detalle el
desarrollo temporal del movimiento vibratorio para captar su periodicidad, sino que
nuestro sistema auditivo extrae su estructura frecuencial, podemos considerar que la
estructura armnica sirve de puente entre la naturaleza peridica del sonido y nuestra
percepcin de la altura tonal.
Nuestra especial facultad para reconstruir intuitivamente la serie armnica explica la
abundante presencia en las acciones de los hombres del sonido armnico: silbar, gritar, cantar, vocalizar, todas estas acciones producen una vibracin armnica a la que
dotamos de sentido y de signicacin. Esta facultad tambin pudiera tener que ver
con la invariabilidad de la frecuencia a lo largo de todo el recorrido de la vibracin
sonora, desde la emisin hasta su recepcin. El sonido puede perder amplitud con
la distancia, puede perder componentes frecuenciales por el camino, pero en condiciones normales nunca modica su periodo de vibracin, o sea, su frecuencia.
Las coincidencias que hemos podido observar entre los armnicos y las notas e intervalos de nuestro lenguaje musical contribuyen a explicar que el mismo sistema
cognitivo que posibilita la percepcin unitaria de un sonido compuesto por varios
componentes armnicos est presente en la constitucin de nuestro lenguaje musical, tanto en la determinacin de los elementos estructurales de las escalas, como en
la construccin de los acordes.
149
Captulo 8
Ondas estacionarias y resonancia:
Generacin del sonido armnico
8.1.
Introduccin
150
En cierto modo podemos decir que todo sonido armnico se produce mediante
un proceso de resonancia, un proceso por el cual la onda excitadora se acopla
con sus sucesivos reflejos, dando lugar a la aparicin de ondas estacionarias.
A lo largo de este captulo vamos a examinar por qu se produce el sonido armnico. Para ello estudiaremos el mecanismo fsico mediante el cual surgen las ondas
estacionarias y el fenmeno de la resonancia. Comprenderemos que determinadas
propiedades fsicas y geomtricas de los cuerpos que vibran posibilitan la aparicin
de ondas estacionarias con unos modos de resonancia que son armnicos entre s
y que cuando estos modos naturales de vibracin son excitados por algn agente
surgen sonidos armnicos.
Mediante vdeos ilustrativos que he elaborado con Matlab y que simulan el comportamiento de una cuerda tensada y ja en sus extremos, podremos experimentar
qu son las ondas estacionarias y en qu consiste el fenmeno de la resonancia. Los
vdeos nos van a permitir observar cmo las ondas estacionarias surgen de la interferencia reiterada de una onda sinusoidal con su reejo. Veremos tambin que la
cuerda tensada, como todo sistema vibratorio unidimensional, posee por naturaleza
unos modos de vibracin que son armnicos. Observaremos que la resonancia se
produce cuando un sistema vibratorio es excitado por cualquier perturbacin, por
pequea que sea, que coincida con una de sus frecuencias naturales de vibracin.
Y comprenderemos por qu, al ponerse a vibrar en las frecuencias de estos modos
naturales de vibracin, la cuerda produce un sonido peridico y musical.
Finalmente, antes de entrar en materia, me gustara sealar que el fenmeno de la
resonancia no slo es importante para la acstica musical, sino que atae a toda la
acstica e incluso a la fsica en su conjunto y, de una u otra manera, a la ciencia en
general. La nocin de resonancia ha salido del campo estrictamente acstico y ha
servido para explicar multitud de fenmenos en todas las reas de las ciencias, desde
fenmenos electromagnticos hasta los que conciernen a la fsica de partculas, a la
astronoma, e incluso a la biologa molecular. All donde est presente la vibracin o
la oscilacin est tambin presente el fenmeno de la resonancia.
151
8.2.
Para estudiar los fenmenos de las ondas estacionarias y de la resonancia vamos a analizar lo que ocurre en una simple cuerda tensada y ja en sus extremos. Este modelo
puede ser considerado como paradigma de un sistema vibratorio unidimensional.
Dado que los sonidos musicales suelen ser producidos por sistemas vibratorios unidimensionales, si analizamos el comportamiento de una cuerda cuando es inducida
a vibrar podremos comprender los mecanismos mediante los cuales se produce el
sonido armnico.
En todo movimiento ondulatorio hay que distinguir entre el movimiento de propagacin de la onda y el movimiento oscilatorio que realiza cada una de las partculas
que se ven afectadas por el paso de la onda. Cuando la direccin de ambos movimientos es la misma, decimos que las ondas son longitudinales, como vimos que ocurre
con las condensaciones y rarefacciones en el aire al transmitir un sonido. Cuando la
direccin del movimiento oscilatorio es perpendicular a la del movimiento propagatorio, decimos que las ondas son transversales.
Por otra parte, la propagacin de las ondas puede producirse en las tres dimensiones
del espacio, en dos dimensiones o solamente en una: las condensaciones y rarefacciones que se producen al propagarse un sonido por el aire en un espacio abierto
son de carcter tridimensional, pues se extienden de forma radial por todo el espacio circundante; la ondulacin que se propaga por las aguas de un estanque o por
la membrana de un tambor es bidimensional, pues viaja a lo largo y ancho de una
supercie; y las perturbaciones que se propagan a travs de una cuerda tensada o en
el aire contenido en el tubo de una auta son unidimensionales, pues viajan en una
sola direccin del espacio.
Al margen de que sean transversales o longitudinales, los sistemas vibratorios unidimensionales tienden a producir ondas estacionarias con modos normales de vibracin
armnicos. Por eso los sonidos musicales son generados por sistemas vibratorios unidimensionales, tales como los instrumentos de cuerda y los de viento. Habitualmente
las cuerdas de los instrumentos al excitarse dan lugar a ondas transversales: el macillo
en un piano golpea la cuerda y la desplaza transversalmente; lo mismo sucede al ser
152
frotada la cuerda de un violn con un arco o al ser pulsada la cuerda de una guitarra
con el dedo. En el caso de los instrumentos de viento, sin embargo, las ondas que se
producen son longitudinales, pues la oscilacin de las partculas de aire se produce
en la misma direccin en la que se propagan las variaciones de la presin, es decir, a
lo largo de la propia longitud de la masa de aire que est contenida en el tubo.
Para estudiar cmo se genera el sonido armnico me ha parecido oportuno tomar
como ejemplo un sistema constituido por una cuerda tensada que est ja en ambos
extremos, como puede ser la cuerda de un piano, de una guitarra o de cualquier otro
instrumento similar. Se trata de un sistema vibratorio unidimensional y transversal.
Dado que en las ondas transversales las partculas oscilan de forma perpendicular a la
direccin de propagacin, son ms fciles de observar que las ondas longitudinales,
donde la oscilacin de las partculas tiende a camuarse con el movimiento de la onda
que propaga la perturbacin. Aunque al estudiar el comportamiento de la cuerda
tensada nos centraremos en las ondas transversales, las ideas que vamos a examinar
pueden ser generalizadas al caso de las ondas longitudinales unidimensionales, como
las que se producen en el interior de los tubos de los instrumentos de viento.
As pues, con el propsito de permitir entender con facilidad cmo se producen las
ondas estacionarias y en qu consiste el fenmeno de la resonancia, he fabricado varios vdeos en los que se simula a cmara lenta el movimiento de una cuerda cuando
se provocan en ella diversas perturbaciones transversales. Supondremos que se trata
de una cuerda de piano sin encorchar de un metro de longitud como podra ser
cualquiera de las cuerdas que dan una nota en la octava que va de do3 a do4 y que
ha sido extrada del instrumento y sujetada por sus extremos a unos soportes que la
mantienen tensada. Supondremos tambin que estos soportes pueden ser desplazados
arriba y abajo mediante algn artilugio mecnico para inducir en la cuerda diversos
tipos de perturbaciones. La perturbacin se provocar mediante el desplazamiento
vertical del soporte izquierdo al que est unida la cuerda o, en alguna ocasin, de los
dos soportes. Una vez que la perturbacin haya sido introducida, los soportes volvern a quedar jos. A n de modelizar la inercia y la elasticidad, podemos considerar
que la cuerda est constituida por un conjunto de bolitas unidas por pequeas gomas
o muellecillos que se estiran y se encogen.
En el eje vertical de la grca que aparecen en los vdeos se representa el desplazamiento vertical de las partculas que suponemos forman la cuerda. Como nos interesa
153
rencia de una onda sinusoidal con su reejo, cuando, en el tiempo que tarda una
oscilacin en completarse, la onda recorre exactamente una parte entera del camino
de ida y vuelta a lo largo de la cuerda. A continuacin veremos que la cuerda tensada,
en funcin de la velocidad de propagacin ondulatoria, posee unos modos normales
de vibracin propios, cuyas frecuencias siguen la serie armnica. Despus podremos
observar que, cuando una cuerda es excitada en cualquiera de esos modos de resonancia naturales, basta una mnima perturbacin para producir una gran ondulacin.
Y nalmente, podremos ver el movimiento de una cuerda cuando resuena simultneamente en varios de sus modos naturales de vibracin, como sucede habitualmente
en las cuerdas de los instrumentos musicales.
8.3.
Para estudiar cmo se propaga una perturbacin transversal a lo largo de una cuerda
y cmo se reeja al llegar a un punto jo que le impide seguir en el mismo sentido, he
fabricado un vdeo en el que se simula el comportamiento de nuestra cuerda cuando
se introduce en ella una perturbacin de 1,5 milsimas de segundo de duracin.
Imaginemos que para iniciar la perturbacin hemos desplazado, con ayuda de un
artilugio mecnico, 1 mm hacia arriba el soporte al que est sujeta la cuerda por la
izquierda y luego lo hemos hecho descender hasta su posicin original. Dado que la
simulacin est ralentizada 400 veces, la duracin del impulso en el vdeo de nuestra
simulacin es de 0,6 segundos. Los 20 segundos que dura el vdeo corresponden a las
primeras 50 milsimas de segundo del movimiento de la supuesta cuerda real.
Para que se apreciara claramente en el vdeo que la perturbacin se invierte cuando se
reeja en los soportes jos de los extremos, interesaba que el impulso inicial fuera slo
hacia arriba, sin que al descender sobrepasara la posicin de equilibrio de la cuerda,
de manera que antes de reejarse por primera vez la perturbacin viajara slo por
la parte superior. Para ver cmo es el impulso que ha generado la perturbacin, es
decir, el movimiento vertical que ha realizado el soporte de la cuerda, presento una
grca que muestra el desplazamiento del soporte en funcin del tiempo.
155
Podemos apreciar que el desplazamiento del soporte es simtrico y que tiene forma
de campana de Gauss. Las unidades del eje horizontal corresponden al tiempo de la
simulacin en el vdeo.
Veamos ahora el vdeo que simula el comportamiento de la cuerda.
Figura 8.2: Vdeo que simula la propagacin de una perturbacin en una cuerda tensada y su reejo
cuando alcanza un extremo jo.
156
Podemos observar en el vdeo que el movimiento vertical del soporte izquierdo provoca una perturbacin en la cuerda que se transmite a lo largo de ella por la parte
superior hasta alcanzar el soporte derecho. All la perturbacin, al no poder continuar, se reeja de modo invertido, regresando por la parte inferior hasta alcanzar el
soporte izquierdo, donde se vuelve a reejar para invertirse de nuevo y seguir por
la parte superior. Dado que no hemos contemplado ningn tipo de amortiguacin,
la propagacin de la perturbacin se repite constantemente, reejndose de modo
invertido cada vez que alcanza un extremo.
La propagacin de la perturbacin es consecuencia de la elasticidad de la cuerda. En nuestra simulacin podemos apreciar que la elasticidad introduce un retraso
en la comunicacin del movimiento de una bolita a la siguiente, de modo que las
bolitas van repitiendo sucesivamente, pero con su correspondiente demora, el desplazamiento vertical del impulso inicial, como podemos apreciar en el vdeo si atendemos al movimiento individual de cualquiera de ellas. De esta manera el movimiento
temporal que ha realizado el soporte, la campana de Gauss que hemos visto en la
gura 8.1, queda dibujado en el espacio. As mismo, la anchura de la perturbacin
que dibuja la cuerda depende tambin de los retrasos que introduce la elasticidad,
los cuales determinan la velocidad con la que se propaga cualquier perturbacin a
lo largo de esa cuerda. En la simulacin ralentizada de nuestro vdeo, dado que la
velocidad de transmisin es de 1 m/s y que el impulso dura 0,6 segundos, la anchura
de la deformacin provocada en la cuerda es de 0,6 metros.
La reexin se produce cuando la perturbacin que se transmite a lo largo de la
cuerda encuentra un obstculo que no puede mover. En nuestro caso, cuando la
perturbacin llega al extremo derecho de la cuerda no puede desplazar el soporte.
Puesto que, segn la Tercera Ley de Newton, la fuerza ejercida hacia arriba por la
cuerda sobre el soporte es la misma que la que el soporte ejerce hacia abajo sobre la
cuerda, el resultado es que el soporte, al no poder moverse, hace que la cuerda rebote
hacia abajo, con lo que la perturbacin se invierte y retorna por la parte inferior. La
misma situacin se repite cuando la cuerda llega de nuevo al soporte izquierdo, el
cual, una vez introducido el impulso inicial, ha quedado tambin jo. De nuevo la
perturbacin rebota y sigue su recorrido, ahora por la franja superior.
Podemos tambin interpretar el fenmeno de la reexin como el resultado de la
superposicin de dos perturbaciones simtricas que viajaran en sentido opuesto a lo
157
largo de dos cuerdas virtuales. Esta forma de entenderlo es ms intuitiva y nos sirve
para explicar los desplazamientos que sufre la cuerda en los momentos en los que se
solapa la perturbacin incidente y la reejada, lo cual nos va a facilitar el estudio de
las ondas estacionarias.
Estas dos cuerdas virtuales, que no estaran sujetas a ningn soporte, se prolongaran
por un espacio imaginario que existira ms all del obstculo jo en el que se reeja la
perturbacin real. La prolongacin sera igual a lo que mide la cuerda real, por lo que
las cuerdas imaginarias mediran el doble de sta. Por una de estas cuerdas imaginarias
viajara la perturbacin incidente, que se prolongara por el espacio imaginario sin
ser inuida por la existencia del obstculo; por la otra viajara en sentido opuesto
la perturbacin reejada, una perturbacin idntica a la real, pero invertida, que se
habra originado simultnea y simtricamente en esta segunda cuerda imaginaria. En
todo momento el desplazamiento de cada punto de la cuerda real sera el resultado
de la superposicin lineal de ambas cuerdas virtuales.
Entenderemos mejor esta idea si imaginamos que en el punto del espacio en el que se
halla el obstculo que la perturbacin no puede mover en nuestro caso, el soporte
derecho al que est jada la cuerda existiera una suerte de espejo que separara el
espacio real del espacio virtual. Veamos un vdeo de carcter didctico en el que se
ilustra lo que ocurre cuando la misma perturbacin del vdeo anterior se reeja en
el soporte derecho. Para poder apreciar los detalles, la velocidad del vdeo ha sido
ralentizada 5 veces respecto al anterior.
Figura 8.3: Vdeo que ilustra el reejo especular de una perturbacin que viaja por una cuerda
cuando alcanza un extremo jo.
158
En el vdeo podemos ver dos planos claramente diferenciados y separados por una
lnea blanca vertical que representa el espejo. A la izquierda aparece el plano de la
realidad, cuyo fondo est en color azul oscuro, el mismo color que el del resto de
los vdeos que simulan el comportamiento de la cuerda, y a la derecha est el plano
virtual, el del otro lado del espejo, en color gris.
La cuerda est representada en el mundo de la realidad por las mismas bolitas y gomillas que en el vdeo anterior. Las dimensiones coinciden: la longitud es de 1 metro y la
anchura de la perturbacin es de 0,6 metros. Junto a la cuerda, por encima y por debajo, vemos unas lneas de puntos que representan las cuerdas imaginarias por donde
viajan las perturbaciones virtuales. Ambas lneas deberan coincidir exactamente con
la cuerda, pero, para que resultara ms fcil distinguirlas, las he dibujado ligeramente
por encima y por debajo de la cuerda real. Por la lnea de arriba, en color amarillo,
va la perturbacin incidente, la que va de la realidad al espejo, la cual contina su camino cuando se encuentra con el soporte jo, como si no hubiera obstculo alguno.
Por la lnea de abajo, en color turquesa, viaja la perturbacin reejada, la originada
al otro lado del espejo y que se dirige al plano de la realidad.
Observamos que, a la vez que se introduce una perturbacin que afecta a la cuerda
real de nuestra simulacin y a la lnea de puntos amarilla, al otro lado del espejo se
inicia la misma perturbacin, pero invertida, una perturbacin que viaja por la lnea
de puntos de color turquesa con la misma velocidad que la perturbacin original.
Vemos que ambas perturbaciones siguen por su lnea de puntos como si no hubiera
ningn obstculo, atravesando en el mismo instante la separacin entre la realidad y
el mundo del espejo.
Vemos que la cuerda real, la que est formada por las bolitas, se comporta como si
fuera el resultado de sumar los desplazamientos de ambas perturbaciones virtuales, la
que va por la lnea de puntos amarilla y la que va por la lnea de puntos turquesa. Esto
es de especial inters para explicar lo que sucede en el tiempo en el que la perturbacin incidente y la reejada se solapan. Podemos apreciar que ambas perturbaciones,
la incidente y la reejada, alcanzan a la vez el soporte jo de la cuerda, es decir, la
frontera entre el mundo imaginario y el real, y a partir de ese momento empiezan
a solaparse hasta que cada una termina de pasar totalmente al otro lado. Esto ocurre porque ambas perturbaciones han sido producidas simultneamente a la misma
distancia del punto del reejo y viajan a la misma velocidad. As mismo, puesto que
159
8.4.
160
Figura 8.4: Vdeo que simula la interferencia constructiva de dos impulsos que viajan a lo largo de
una cuerda.
En este vdeo podemos ver que las perturbaciones provocadas en la cuerda por el
desplazamiento hacia arriba de ambos soportes viajan por la parte superior en sentidos
opuestos, se superponen cuando se cruzan, continan su camino sin alterarse y se
reejan al llegar a los extremos jos, viajando entonces ambas por la parte de abajo.
Para apreciar con detalle lo que sucede es necesario reconocer primero cada una de
las dos perturbaciones por separado. Puede servirnos de ayuda ralentizar la velocidad
del reproductor, tal como ocurre en el vdeo de la gura 8.5, que es una repeticin a
cmara lenta de los momentos iniciales del vdeo de la gura 8.4.
Figura 8.5: Momentos iniciales del vdeo de la gura 8.4 ralentizado cinco veces.
161
Este vdeo auxiliar est ralentizado cinco veces respecto al anterior, lo que signica
que la perturbacin que vemos viaja 2.000 veces ms despacio que la de la cuerda real.
Ahora podemos observar con ms facilidad que cada una de las dos perturbaciones,
cuando no se solapa con la otra, mantiene la amplitud con la que ha sido generada:
la que procede de la izquierda es siempre de 1 mm y la que procede de la derecha es
siempre de 0,7 mm. Vemos tambin que la perturbacin ms amplia, la que procede
de la izquierda, circula de izquierda a derecha cuando va por la franja superior y
de derecha a izquierda cuando va por la inferior, mientras que la perturbacin ms
pequea, la que procede de la derecha, circula de derecha a izquierda cuando viaja
por la franja inferior y de izquierda a derecha cuando lo hace por la franja superior.
Dicho de otra forma, la perturbacin mayor sigue siempre el sentido de las agujas
del reloj y la menor el sentido contrario al de las agujas del reloj.
Una vez que hemos identicado ambas perturbaciones, podemos observar que cuando se cruzan el desplazamiento que sufre cada punto de la cuerda es la suma de
los desplazamientos que hubiera provocado en ella cada una de las perturbaciones por separado, es decir, las dos perturbaciones se superponen linealmente.
Como ambas perturbaciones viajan siempre por la misma franja del espacio, las dos
por arriba o las dos por abajo, intereren entre s de manera constructiva. Y puesto
que las dos perturbaciones han comenzado a la vez y se propagan a la misma velocidad, necesariamente se cruzan en la mitad de su camino, en el punto que est a
0,5 m, y es en ese punto donde la perturbacin resultante alcanza su desplazamiento
mximo. Dado que la amplitud de la perturbacin iniciada en el soporte izquierdo
es de 1 mm y la provocada por el soporte derecho es de 0,7 mm, la amplitud mxima
de la perturbacin resultante es de 1,7 mm, que corresponde a un desplazamiento ascendente de la cuerda cuando las perturbaciones se encuentran en la franja superior
o a un desplazamiento descendente cuando se encuentran en la franja inferior. Una
vez superado su solapamiento cada una de las perturbaciones sigue su camino conservando su individualidad. Hemos podido observar que, como consecuencia de la
elasticidad, la perturbacin se sigue transmitiendo a travs de las fuerzas que ejercen
unas bolitas sobre las siguientes, por lo que, cuando cesa la coincidencia de ambas
perturbaciones, cada una sigue su camino.
Veamos ahora el vdeo en el que podemos observar cmo se producen las interferencias destructivas.
162
Figura 8.6: Vdeo que simula la interferencia destructiva de dos impulsos que viajan a lo largo de
una cuerda.
Este vdeo solo se diferencia del de la gura 8.4 en que ahora los dos impulsos se
dan en sentidos verticales opuestos: mientras que el impulso del soporte izquierdo
desplaza la cuerda hacia arriba de su posicin de equilibrio, el del soporte derecho
la desplaza hacia abajo. Esto hace que las perturbaciones no solo viajen en sentidos
opuestos a lo largo de la cuerda, sino que los desplazamientos verticales provocados
por las perturbaciones siempre sean opuestos. Podemos observar que ambas perturbaciones se desplazan ahora en el sentido de las agujas del reloj, pero que cuando
una se propaga por la franja superior, la otra lo hace por la inferior, y viceversa. Por
eso, cuando ambas se cruzan en el punto central de la cuerda, el desplazamiento que
sufre sta es la diferencia de las amplitudes de ambas perturbaciones. Podemos apreciar que cuando la superposicin de las dos perturbaciones coincide plenamente, el
desplazamiento del punto central de la cuerda es de 0,3 mm (1 0,7 = 0,3), hacia
arriba o hacia abajo en funcin de la franja por la que circulen las perturbaciones.
Tambin ahora vemos que, una vez que ha concluido el cruce, cada perturbacin
sigue su camino sin haber sufrido ninguna alteracin, hasta reejarse en el extremo
correspondiente.
163
8.5.
164
tiempo que tarda en completarse una oscilacin sinusoidal, la onda recorre exactamente el camino de ida y vuelta a lo largo de la cuerda o una parte entera de este
camino. Veremos, as mismo, que las frecuencias de las ondas estacionarias que se
pueden producir en una cuerda dada siguen la serie armnica, pues todas ellas
son mltiplos de la frecuencia fundamental, que es la frecuencia de la onda
estacionaria cuya longitud es el doble de la longitud de la cuerda.
Recordemos que la cuerda ideal sobre la que estamos haciendo la simulacin mide
un metro de longitud y que la velocidad con la que se propaga por ella cualquier
perturbacin transversal es de 400 m/s. Por ello, en los vdeos ralentizados 400 veces, la velocidad de la propagacin de la onda que observaremos ser de 1 m/s, y la
duracin de 20 segundos corresponder a las primeras 50 milsimas de segundo de
la vibracin real. En los vdeos ralentizados 2.000 veces, la velocidad de propagacin
ser de 0,2 m/s y la duracin de 30 segundos representar las primeras 15 milsimas de segundo del movimiento real de la cuerda. En todos ellos la amplitud de las
oscilaciones sinusoidales introducidas es de 1 mm.
8.5.1.
Pero antes de estudiar las ondas estacionarias vamos a examinar cmo se produce la
reexin de una onda sinusoidal en un extremo jo de la cuerda cuando la longitud
de la onda introducida no es una parte entera del doble de la longitud de la cuerda.
Como lo que nos interesa ahora es ver lo que sucede al solaparse la onda incidente
con la reejada, elegiremos una onda cuya longitud sea menor que la longitud de la
cuerda. De esta manera, podremos apreciar por separado los momentos en los que se
produce el solapamiento de las dos ondas (la incidente y la reejada) y los momentos
en los que solo est presente una de ellas. Por ello, he elegido una onda cuya longitud
es de 0,6 metros, la misma que la del impulso gaussiano de los apartados anteriores.
El periodo de la oscilacin introducida tendr que ser, por lo tanto, de 1,5 ms. En
efecto, dado que la velocidad de propagacin de las perturbaciones transversales en
nuestra cuerda es de 400 m/s, cuando la oscilacin del soporte termine, la onda habr
recorrido 0,6 m (0,0015 x 440 = 0,6). Aunque no sea relevante en este caso, este
165
Figura 8.7: Vdeo que simula ralentizada 400 veces la propagacin a lo largo de una cuerda de
una perturbacin sinusoidal cuya longitud de onda es inferior a la longitud de la cuerda y no es una
parte entera del doble de esta longitud.
En el vdeo vemos que una perturbacin en forma de onda sinusoidal que ha sido
generada por el desplazamiento vertical del soporte izquierdo recorre ininterrumpidamente la longitud de la cuerda, reejndose de forma invertida cada vez que
alcanza uno de los extremos jos. A diferencia de los vdeos anteriores, ahora nos
sorprende el carcter articial del movimiento que realiza la cuerda. Ello se debe a la
introduccin repentina de una nica oscilacin sinusoidal y a su cese instantneo, sin
transicin alguna, ni al comienzo ni al nal. Aunque he procurado dotar de la mayor
verosimilitud posible al movimiento de la cuerda, no podemos olvidar que estamos
ante una simulacin de carcter didctico, en la que es necesario aislar el fenmeno
que nos interesa estudiar, aun a consta de una apariencia articiosa.
166
Figura 8.8: Vdeo que simula ralentizada 2.000 veces la propagacin a lo largo de una cuerda de
una perturbacin sinusoidal cuya longitud de onda es inferior a la longitud de la cuerda y no es una
parte entera del doble de esta longitud, con el aadido de dos cuerdas virtuales que ilustran lo que
sucede en la reexin.
167
Igual que en el vdeo anterior, vemos que sobre la cuerda real representada por las
bolitas unidas por muellecillos se desplaza una onda sinusoidal que se reeja cada
vez que alcanza uno de los extremos jos. Vemos tambin dos cuerdas virtuales que
no estn sujetas a ningn soporte y que, como en el vdeo de la gura 8.3, debemos
imaginar prolongndose por ambos lados a travs de un espacio imaginario que no
est representado en este vdeo. Por la cuerda amarilla viaja, de izquierda a derecha,
la perturbacin original en los primeros segundos del vdeo, y luego los sucesivos
reejos que se producen en el soporte izquierdo (esto es, las ondas sinusoidales provenientes del otro lado del hipottico espejo situado a la izquierda de la cuerda). Por
la cuerda turquesa viajan, de derecha a izquierda, las ondulaciones reejadas en el
soporte derecho (es decir, las ondas que llegan desde el espacio imaginario de la derecha), las cuales son del mismo periodo, amplitud y longitud de onda que las de la
cuerda amarilla, pero invertidas. Ya he explicado, a propsito del vdeo de la gura
8.3, la razn por la que la suma de los desplazamientos de las cuerdas auxiliares en los
puntos extremos jos es siempre cero.
Ahora vamos a prestar atencin a lo que sucede cuando se produce la superposicin
entre la onda incidente y la reejada en los extremos jos de la cuerda. Si nos jamos en el soporte de la derecha, vemos que en el momento en el que la onda que
viaja por la cuerda amarilla comienza a atravesar el soporte, tambin lo hace la onda
turquesa que, invertida, proviene del otro lado del supuesto espejo. Como una onda
es la inversa de la otra y ambas viajan a la misma velocidad en sentidos opuestos,
en el momento en el que ambas estn a la mitad del cruce, las dos, que en ese momento tienen la forma de una semionda sinusoidal inferior, coinciden exactamente.
Lo mismo sucede en el soporte derecho, con la nica diferencia de que, en ese caso,
las semiondas que coinciden son las superiores. En ambos momentos, vemos que la
cuerda adquiere su desplazamiento mximo, hacia abajo o hacia arriba, respectivamente.
Veamos una instantnea de este ltimo vdeo que representa un momento inmediatamente anterior a producirse la coincidencia exacta de las dos ondas virtuales cuando
se cruzan en el soporte derecho (si fuera en el momento exacto no podramos distinguir las dos cuerdas virtuales, pues coincidiran exactamente).
168
Figura 8.9: Instantnea del vdeo de la gura 8.8 en el momento anterior a producirse la coincidencia
entre la semionda incidente y la reejada.
169
8.5.2.
170
Figura 8.10: Vdeo que simula ralentizada 400 veces la propagacin a lo largo de una cuerda de
una perturbacin sinusoidal cuya longitud de onda es el doble de la longitud de la cuerda.
crea la onda estacionaria. En l aparecen las cuerdas virtuales que hemos visto antes
y que nos van a ayudar a entender cmo las constantes interferencias entre las ondas
reejadas en ambos extremos jos dan lugar a la onda estacionaria.
Figura 8.11: Vdeo que simula ralentizada 2.000 veces la propagacin a lo largo de una cuerda
de una perturbacin sinusoidal cuya longitud de onda es el doble de la longitud de la cuerda, con el
aadido de dos cuerdas virtuales que ilustran lo que sucede en la reexin.
Con ayuda de las cuerdas virtuales auxiliares, en el vdeo podemos ver que lo que est
sucediendo por debajo de esa apariencia de estabilidad es que los sucesivos reejos
de la onda viajera estn interriendo entre s, dando lugar a la formacin de esa
onda que parece haberse detenido. En el vdeo vemos que, como consecuencia de los
sucesivos reejos, la onda sinusoidal amarilla viaja ininterrumpidamente de izquierda
a derecha, y la turquesa de derecha a izquierda.
En los momentos iniciales del vdeo, podemos apreciar que cuando la onda incidente,
la de color amarillo, alcanza el soporte derecho, comienza a surgir invertida la onda
reejada, la de color turquesa. Como he explicado a propsito del vdeo de la gura
8.8, cuando ambas ondas imaginarias completan la mitad de su recorrido, coinciden
plenamente y la cuerda real, la de las bolitas, adquiere la forma de una semionda
sinusoidal inferior. Dado que, en este caso, la longitud de la onda es de 2 metros, la
semionda abarca la longitud entera de la cuerda y, por lo tanto, se termina de formar
en el instante exacto en el que el soporte izquierdo ha completado su oscilacin. Esta
coincidencia que se produce como consecuencia de que el periodo de la oscilacin
172
Figura 8.12: Instantnea del vdeo de la gura 8.11 en el momento anterior a producirse la coincidencia entre la semionda incidente y la reejada.
Vemos que la cuerda entera est a punto de adquirir la forma de una semionda sinusoidal y que, al coincidir las dos ondas virtuales, su amplitud alcanza el valor mximo,
2 mm.
Tenemos que entender ahora por qu esta forma que adquiere la cuerda no se diluye,
como en el caso del vdeo de la gura 8.8, sino que la ondulacin de la cuerda va
modicando su amplitud y alternando su forma entre una semionda inferior y una
semionda superior.
Para ello, tenemos que tener presente que la suma de dos ondas sinusoidales de la
misma longitud de onda es otra onda sinusoidal de esa misma longitud, cuya amplitud depende de la diferencia de fase entre las dos ondas componentes. Al viajar las
dos ondas en direccin opuesta, el desplazamiento hacia la derecha de la onda que va
173
Figura 8.13: Instantnea del vdeo de la gura 8.11 en el momento anterior a producirse la oposicin
entre la semionda incidente y la reejada.
174
Por otra parte, dado que el desplazamiento de cualquier punto de la cuerda real es
la suma de los desplazamientos de los puntos correspondientes de la onda incidente
y la reejada, en toda onda estacionaria hay puntos cuyo desplazamiento es siempre
nulo y otros cuyo desplazamiento alcanza el valor mximo. Los puntos que son jos
se denominan nodos, y en este modo fundamental de vibracin son slo los puntos
extremos de la cuerda. Los puntos que oscilan con una amplitud mxima se denominan vientres o antinodos, y en este modo, slo lo es el punto medio, aqul en el que
siempre se cruzan las dos ondas virtuales. La amplitud con la que oscila este punto es
el doble de la amplitud de la oscilacin introducida, en este caso podemos ver que es
de 2 mm.
As pues, el modo primero de vibracin se caracteriza porque la cuerda entera
oscila de forma unitaria. En consecuencia, tiene un solo vientre en el punto
central de la cuerda y dos nodos que estn situados en los puntos extremos.
La frecuencia de este primer modo de vibracin es la que corresponde a una
longitud de onda doble de la longitud de la cuerda. En nuestra cuerda ideal, sobre la que estamos realizando la simulacin, la frecuencia de este primer modo de
vibracin es de 200 Hz.
8.5.3.
Ahora vamos a comprobar que tambin se producen ondas estacionarias en nuestra cuerda cuando la oscilacin que introducimos al desplazar el soporte izquierdo
da lugar a una onda cuya longitud es una parte entera del doble de la longitud de
la cuerda. O, dicho de otra manera, cuando introducimos oscilaciones sinusoidales
cuyo periodo es tal que, al reejarse la perturbacin en los extremos jos de la cuerda, se crean un nmero entero de semiondas. Para que este requisito se cumpla, el
periodo de las oscilaciones iniciales tendr que ser la mitad, la tercera parte, la cuarta
parte o cualquier parte entera del periodo que ha producido la onda estacionaria en el
modo de vibracin fundamental. Por ello, la frecuencia de estas oscilaciones iniciales
que ser la misma con la que oscilar la cuerda cuando se formen en ella las ondas
estacionarias tendr que ser el doble, el triple, el cudruple o cualquier otro mlti-
175
plo entero de la frecuencia fundamental de vibracin. Ello explica que estos modos
naturales de vibracin se denominen armnicos.
Vamos a detenernos a continuacin en observar cmo se produce el segundo modo
de vibracin y luego generalizaremos los conceptos aprendidos al resto de los modos
armnicos.
Para lograr que nuestra cuerda ideal se ponga a vibrar en el segundo modo de vibracin, la longitud de la onda que deberemos generar tendr que ser de 1 metro.
Por ello, el periodo con el que deber oscilar el soporte izquierdo para introducir la
perturbacin tendr que ser de 2,5 ms. En efecto, dado que la velocidad de la cuerda
es de 400 m/s, en 2,5 ms la onda habr recorrido 1 metro (400 x 0,0025 = 1). La
frecuencia de la oscilacin inicial ser, por lo tanto, de 400 Hz. Tenemos que tener
en cuenta tambin que, para que se produzca el solapamiento de la onda incidente
con la reejada en el segundo modo de vibracin, deberemos introducir en la cuerda
dos oscilaciones completas.
He fabricado un vdeo que simula el comportamiento de nuestra cuerda ideal cuando
se introducen en ella dos oscilaciones sinusoidales de ese periodo de 2,5 ms. Tambin
ahora el movimiento de la cuerda est ralentizado 400 veces, con lo cual el periodo
de la oscilacin que observaremos ser de 1 segundo y su frecuencia, por lo tanto, de
1 Hz.
Figura 8.14: Vdeo que simula ralentizada 400 veces la propagacin a lo largo de una cuerda de
una perturbacin sinusoidal cuya longitud de onda es la misma que la longitud de la cuerda.
176
En el vdeo podemos observar que en el mismo instante en el que el soporte izquierdo ha terminado de realizar las dos oscilaciones y se ha quedado jo, en la cuerda se
han formado dos semiondas, una inferior y otra superior, es decir, se ha creado una
onda sinusoidal entera. De modo similar a lo que hemos visto en el caso de la onda
estacionaria en el modo fundamental de vibracin, a partir de ese momento desaparece el carcter viajero de la onda y la cuerda comienza a oscilar. La diferencia reside
en que ahora oscila como si estuviera dividida en dos partes. La forma que adquiere
la cuerda en su oscilacin es la de una onda completa.
Ahora hay un nuevo punto jo, un nodo, que est en el medio de la cuerda (con lo
que en total hay tres nodos), y dos puntos de desplazamiento mximo, dos antinodos
o vientres, que estn en la mitad de cada semionda, uno a 0,25 m y el otro a 0,75
m.
La frecuencia con la que vemos oscilar la cuerda en este vdeo es el doble de la que
tena en el anterior: ahora es de 1 Hz, que corresponde, en la cuerda de la realidad,
a 400 Hz. Esta frecuencia es la misma que la de las oscilaciones iniciales que han
generado la onda estacionaria.
Dado que en el modo segundo de vibracin la cuerda adquiere la forma de una
onda sinusoidal completa, podremos apreciar ms claramente cmo surge una onda
estacionaria. Para verlo con ms detalle he fabricado un vdeo con los momentos
iniciales del movimiento de la cuerda, ralentizados 5 veces respecto al vdeo anterior
o, lo que es lo mismo, 2.000 veces respecto al movimiento de la cuerda real. Este vdeo
corresponde a las primeras 15 milsimas de segundo del movimiento de la cuerda
real. Tambin ahora la cuerda real, representada por las bolitas, va acompaada de
las cuerdas virtuales auxiliares, la amarilla y la azul turquesa.
177
Figura 8.15: Vdeo que simula ralentizada 2.000 veces la propagacin a lo largo de una cuerda de
una perturbacin sinusoidal cuya longitud de onda es la misma que la longitud de la cuerda, con el
aadido de dos cuerdas virtuales que ilustran lo que sucede en la reexin.
178
Figura 8.16: Instantnea del vdeo de la gura 8.15 en el momento anterior a producirse la coincidencia entre la onda incidente y la reejada.
En la gura podemos apreciar que en ese instante las cuerdas virtuales prcticamente
coinciden, con lo que, al sumarse los desplazamientos de ambas, el desplazamiento
vertical de cada uno de los puntos de la cuerda real alcanza su valor mximo, dando
como resultado una onda sinusoidal cuya amplitud es el doble de la amplitud de la
oscilacin introducida, es decir, 2 mm.
Si volvemos al vdeo de la gura 8.15, podemos jarnos en que, a partir del momento en el que la cuerda adquiere la forma de una onda completa, el desplazamiento
hacia la derecha de la onda virtual incidente la que viaja por la cuerda amarilla
es compensado por el desplazamiento hacia la izquierda de la onda virtual reejada
la que viaja por la cuerda turquesa, de modo que desde ese momento la cuerda,
que parece estar dividida en dos partes, oscila de forma estable, como si ya no se
propagara ninguna perturbacin por ella.
Atendamos ahora a lo que ocurre cuando la cuerda oscila. Nos damos cuenta de que
pasa por dos situaciones extremas. Una es el momento en el que las cuerdas auxiliares
coinciden completamente, con lo que la ondulacin de la cuerda real alcanza su
mxima amplitud, como hemos visto en la gura 8.16; otra es el momento en el
que las cuerdas virtuales estn en oposicin de fase, con lo que los desplazamientos
179
de todos los puntos de la cuerda se anulan y sta pasa por su posicin de equilibrio,
como podemos ver en la gura de abajo.
Figura 8.17: Instantnea del vdeo de la gura 8.15 en el momento anterior a producirse la oposicin
entre la onda incidente y la reejada.
Figura 8.18: Vdeo que simula ralentizada 400 veces la propagacin a lo largo de una cuerda de
una perturbacin sinusoidal cuya longitud de onda es la tercera parte del doble de la longitud de la
cuerda.
Podemos observar que, al terminar de completarse las tres oscilaciones iniciales del
soporte, la cuerda comienza a vibrar sin que parezca que se propague ya ninguna
perturbacin por ella. En este caso la cuerda adquiere la forma de tres semiondas si181
Figura 8.19: Vdeo que simula ralentizada 400 veces la propagacin a lo largo de una cuerda de
una perturbacin sinusoidal cuya longitud de onda es la mitad de la longitud de la cuerda.
8.6.
La resonancia
cin que ese cuerpo posee, de modo que la perturbacin no se limita a pasar a
travs de l, sino que se retroalimenta positivamente, dando lugar a una onda
estacionaria cuya amplitud se va incrementando con el paso del tiempo. La
resonancia despierta los modos de vibracin que por naturaleza posee cada objeto y
por eso a estos modos normales o naturales de vibracin se les llama tambin modos
de resonancia.
Un ejemplo tomado de la vida cotidiana que nos puede servir para comprender el
fenmeno de la resonancia es el de un columpio. Pensemos que tenemos a un nio
columpindose y queremos que cada vez gane ms altura y que el columpio se balancee ms y ms. El columpio, al igual que cualquier pndulo, tiene una frecuencia
natural de oscilacin, la cual depende de su longitud. Si empujamos el columpio de
forma peridica, haciendo que nuestros impulsos se produzcan siempre en el mismo estado de la oscilacin, el columpio ir ganando en altura; si, por el contrario,
impulsamos el columpio cuando se nos ocurra, con total independencia del estado
de oscilacin, no incrementaremos la amplitud de sus oscilaciones, sino que probablemente lo frenaremos. En denitiva, si impulsamos el columpio siempre con la
misma frecuencia y sta coincide con la frecuencia natural de oscilacin de ese columpio concreto (por ejemplo, si lo impulsamos siempre cuando pasa lo ms prximo
al suelo), el columpio ir acumulando esa energa y progresivamente la amplitud de
sus oscilaciones aumentar.
Examinemos ahora cmo se produce la resonancia en la cuerda que estamos utilizando para nuestras simulaciones. Recordemos que mide 1 m de longitud, que est
ja en sus extremos y que tiene, por razn de su masa y de la tensin a la que est
sometida, una velocidad de propagacin de las perturbaciones transversales de 400
m/s. Como consecuencia de ello, tal como hemos visto en el apartado anterior, en
nuestra cuerda se puedan crear ondas estacionarias en frecuencias que sean mltiplos
enteros de 200 Hz. Y esto quiere decir que cuando la cuerda entre en contacto con
una vibracin en alguna de estas frecuencias, se pondr en resonancia con ella y empezar a vibrar por simpata: con una frecuencia de 200 Hz dar el primer modo de
resonancia o fundamental; con una de 400 Hz, el segundo modo de resonancia; con
600 Hz, el tercero, y as sucesivamente. As pues, si en nuestra simulacin hacemos
que la frecuencia con la que oscila el soporte que introduce la perturbacin coincida
184
Figura 8.20: Vdeo que simula la creacin por resonancia de una onda estacionaria en el primer
modo de vibracin.
Vemos que enseguida se crea una onda estacionaria en el primer modo de resonancia,
por lo que la cuerda entera oscila de manera unitaria. Pero vemos tambin, y esto
es lo ms importante, que la amplitud de la oscilacin crece de manera muy rpida,
de tal forma que cuando el soporte se detiene al concluir los primeros 50 ms de la
realidad (o los primeros 20 segundos del vdeo), la amplitud de la oscilacin de la
cuerda ha alcanzado ya 2 mm. Es decir, han bastado 50 ms de oscilacin del soporte
185
para multiplicar la amplitud de esa oscilacin inicial por 20 veces. Sucede que el
movimiento del soporte se acopla con las sucesivas reexiones de la cuerda, de tal
modo que la energa se acumula y eso hace crecer la oscilacin de la cuerda, de
modo semejante a lo que ocurre en el columpio.
Ahora examinaremos lo que sucede cuando el soporte oscila con otra de las frecuencias de resonancia naturales de nuestra cuerda, en este caso 400 Hz, que corresponde
al segundo modo de resonancia. En el vdeo, ralentizado 400 veces, la frecuencia ser
de 1 Hz.
Figura 8.21: Vdeo que simula la creacin por resonancia de una onda estacionaria en el segundo
modo de vibracin.
Vemos que en este caso se crea tambin una onda estacionaria, ahora en el modo
segundo. En efecto, la cuerda oscila dividida por la mitad en dos partes. Cuando el
soporte deja de moverse el punto medio permanece ya estable y se crea en l un nodo.
Tambin ahora podemos apreciar que la mnima amplitud con la que oscila el soporte
es capaz de provocar una gran respuesta en la oscilacin de la cuerda. Comprobamos,
pues, que la cuerda resuena tambin a la frecuencia de 400 Hz.
Para experimentar que la resonancia se produce solo cuando la oscilacin que introducimos tiene una frecuencia que coincide con alguno de los modos de resonancia
naturales de nuestra cuerda, vamos a ver lo que sucede cuando forzamos a la cuerda
a vibrar a una frecuencia alejada de cualquiera de esos modos. En concreto, vamos a
186
forzar a la cuerda mediante una oscilacin constante del soporte izquierdo a 285 Hz
de frecuencia. En el vdeo, al estar ralentizado 400 veces, la frecuencia del soporte
ser aproximadamente de 0,7 Hz.
Figura 8.22: Vdeo que muestra que no hay resonancia si la frecuencia de la oscilacin introducida
no coincide con ningn modo natural de vibracin de la cuerda.
La resonancia se produce siempre en un contexto de oscilaciones forzadas. La resonancia implica dos partes. Por un lado, la parte activa: un cuerpo o sistema que
vibra y que con sus vibraciones excita o impulsa a otro. Por otro, la parte pasiva:
un cuerpo o sistema que, por su propia constitucin, posee una o varias frecuencias
naturales de vibracin. Al poner en relacin estas dos partes, siempre el resultado ser
que la frecuencia de la vibracin del cuerpo o sistema pasivo ser la misma que la del
sistema impulsor o activo, con independencia de cul fuera su frecuencia natural de
vibracin. Ahora bien, cuando la frecuencia del sistema impulsor se aproxima mucho a una de las frecuencias naturales del sistema pasivo, la facilidad con la que la
energa del sistema impulsor se transmite al sistema pasivo hace que la amplitud de
las vibraciones de este sistema pasivo crezca de forma extraordinaria.
Como conclusin podemos decir, que, en lneas generales, cuando coincide la frecuencia de la fuerza excitante y la frecuencia natural del sistema pasivo, se
produce un cambio cualitativo importante. La resonancia nos muestra como
una fuerza en s misma pequea puede crear un efecto grande. Este efecto ser
ms evidente conforme las fuerzas de friccin o cualquier otra que se oponga al movimiento sean menores. En el caso de nuestra cuerda ideal en la que hemos descartado
cualquier fuerza de amortiguacin este crecimiento es mximo.
8.7.
Una vez que hemos visto que la cuerda, por sus propias caractersticas fsicas, posee
unos modos naturales de vibracin que son armnicos y que estos modos resuenan
cuando coinciden con alguna o algunas de las frecuencias que estn presentes en la
perturbacin que la excita, estamos en condiciones de entender en qu consiste y
cmo se produce la vibracin armnica.
Habitualmente una cuerda, como cualquier otro cuerpo capaz de vibrar, vibra simultneamente en varios modos de resonancia. Esto da lugar a que el movimiento
de la cuerda evolucione de una forma aparentemente compleja.
Vamos a comenzar observando un caso sencillo: el movimiento a cmara lenta que
realiza la cuerda de nuestra simulacin cuando vibra simultneamente en los dos primeros modos de resonancia. Para ello, he fabricado un vdeo en el que el movimiento
188
Figura 8.23: Vdeo que simula la vibracin de una cuerda en los dos primeros modos de resonancia.
En el vdeo, que est ralentizado 400 veces respecto al movimiento real de nuestra
cuerda, podemos observar cmo se superponen los dos primeros modos de vibracin.
Al entrar en resonancia por la accin del soporte, el movimiento de la cuerda va incrementando rpidamente su amplitud. Cuando el soporte se detiene, lo cual ocurre
en el segundo 20 del vdeo o en el 50 ms de la realidad, y dado que no hemos tenido en cuenta ninguna fuerza de amortiguacin, la amplitud de la onda permanece
estable durante el resto del vdeo.
Vemos que el conjunto de la cuerda oscila arriba y abajo una vez cada 2 segundos,
como corresponde a la frecuencia fundamental. Esto lo podemos ver mejor si nos
jamos en el punto central de la cuerda, el que est en 0,5 m: podemos apreciar en el
vdeo que este punto oscila arriba y abajo haciendo un Movimiento Armnico Simple (MAS) con la frecuencia del primer modo de resonancia de nuestra cuerda, que
189
coincide con la frecuencia fundamental de la oscilacin del soporte que est introduciendo la perturbacin, es decir, 0,5 Hz en el vdeo o 200 Hz en la realidad.
Pero, a la vez, observamos que la cuerda se divide por el medio en dos partes iguales
y que cada una de estas partes oscila, de forma complementaria una de la otra, a una
frecuencia doble de la que tiene el conjunto de la cuerda, es decir, a 400 Hz en la
realidad o a 1 Hz en el vdeo. Este movimiento es similar al que tendra la cuerda si solo se hubiera introducido en ella el segundo modo de resonancia y pivotara en torno
al punto central (como podemos ver en la gura 8.21). Pero este punto central en el
modo segundo sera un nodo y, por lo tanto, permanecera inmvil. La diferencia
reside en que ahora este punto central oscila tambin arriba y abajo, en cuanto que
es el punto de mxima amplitud, el vientre, del primer modo de resonancia.
En este caso sencillo en el que se combinan solamente los dos primeros modos de
resonancia, nos resulta fcil apreciar que el movimiento total de la cuerda es el resultado de la composicin de estos dos movimientos, pero a medida que el nmero de
los componentes que vibran aumenta, la vibracin de la cuerda se hace ms y ms
compleja, hasta un punto en el que ya no es posible discernirlos ni siquiera en un
vdeo ralentizado.
Por otra parte, hay que tener en cuenta que en nuestra simulacin solamente hemos
contemplado el caso de que la excitacin que genera la onda sobre la cuerda se realice
a travs de uno de los extremos jos de la cuerda. Pero la cuerda de un instrumento
musical real puede ser excitada de mltiples maneras, bien por un golpe tal como
el que realiza el macillo en el piano, bien al ser pulsada como en el caso de la
guitarra o del clavecn o bien al ser frotada como ocurre en el violn. El lugar
en el que se produce la excitacin de la cuerda tambin es relevante para la sonoridad
que se obtiene, pues, dependiendo de la posiciones en las que se produce el estmulo
y de las intensidades de ste, se potenciarn o se atenuarn unos u otros modos de
resonancia de la cuerda, con lo que se despertarn en mayor o menor medida unos
u otros armnicos.
Veamos ahora un vdeo que simula de una forma ms completa el movimiento de
una cuerda real cuando produce un sonido armnico. En l se observa la vibracin
de nuestra cuerda cuando es excitada por una perturbacin constituida por un conjunto numeroso de componentes, alguno de los cuales coinciden con sus modos de
190
resonancia, mientras que otros estn alejados. La cuerda amplica solamente aquellas
frecuencias que coinciden o estn muy prximas a sus modos de resonancia y deja
pasar sin amplicar aquellas otras que estn alejadas. De esta manera, como las frecuencias naturales de la cuerda son armnicas, la vibracin resultante ser tambin
armnica, dando lugar a una nota musical. La frecuencia de esta nota es de 200 Hz,
la frecuencia fundamental que por naturaleza tiene la cuerda de nuestra simulacin.
A n de facilitar la observacin en el vdeo, he diseado el movimiento del soporte para que la cuerda responda de forma signicativa a los ocho primeros modos
de resonancia y, adems, para que los componentes de ms frecuencia disminuyan
progresivamente su amplitud.
Figura 8.24: Vdeo que simula la vibracin de una cuerda en mltiples modos de resonancia.
8.8.
Conclusin
192
Captulo 9
Envolventes de amplitud y de frecuencia
9.1.
Introduccin
generados a propsito para que slo se diferencien en el rasgo especco que debemos
observar.
9.2.
Figura 9.1: Vdeo que muestra las diferencias tmbricas a las que dan lugar dos envolventes de
amplitud distintas sobre el mismo sonido simple.
Podemos observar que la grca amarilla, la que representa la evolucin de la amplitud, parece perlar la mitad superior de la seal de audio, como si la envolviera.
En efecto, si bien la relacin de envoltura solo es rigurosamente cierta para la evolucin de la amplitud de sonidos simples, el nombre de envolvente ha pasado a
designar tambin la evolucin de la amplitud de cualquier tipo de sonido, e incluso
la evolucin de la frecuencia, donde en realidad no se produce ninguna relacin de
envoltura, como veremos enseguida.
En el primer ejemplo vemos que el ataque es muy rpido. En efecto, si detenemos
el vdeo en el momento preciso en el que se inicia el sonido, comprobamos que
tarda slo 5 milsimas de segundo en alcanzar su amplitud mxima, y que a partir
de ah comienza inmediatamente a decaer de forma exponencial, hasta extinguirse
lentamente. Como es propio de la amortiguacin exponencial, la tasa de cada en
196
En este ejemplo el sonido mantiene la amplitud estable, pero tambin podra haberse producido un trmolo, es decir, una oscilacin de la amplitud en torno al valor
medio del mantenimiento.
Por ltimo, se inicia la etapa de extincin del sonido, que en este caso se prolonga
durante bastante tiempo, desde aproximadamente 6,6 s hasta 7,4 s. La duracin de esta
ltima etapa puede depender no slo del instrumento o de la voluntad del ejecutante
quien puede prolongar la duracin de la nota amortigundola poco a poco si el
instrumento lo permite, sino tambin del entorno sonoro en el que se emite la nota.
Por ejemplo, si la nota se emite en una sala cerrada grande, cuyas paredes reejan
una parte importante del sonido que reciben, se producir una reverberacin que
prolongar considerablemente esta etapa de extincin.
El sonido de este segundo ejemplo nos recuerda al de una nota de auta, una nota
que el intrprete ha atacado con delicadeza y que luego se ha esforzado en mantener
estable durante toda su duracin. La prolongacin de la etapa de extincin nos hace
imaginar una sala grande y vaca con mucha reverberacin.
Con estos dos ejemplos hemos podido ver que los rasgos acsticos derivados de la
evolucin de la amplitud global de un sonido armnico contribuyen a caracterizar
la cualidad sonora que escuchamos. Si reconocemos un determinado rasgo tmbrico y lo asociamos a un instrumento o a una accin del intrprete es porque nuestro
sistema auditivo est entrenado para detectar en los sonidos del entorno toda la informacin til que podamos extraer y que nos permita identicarlos. Por eso, cuando
la evolucin de la amplitud sigue la ley natural de extincin exponencial, como en
el primer sonido del vdeo, reconocemos, sin ser conscientes de ello, que la fuente
sonora no ha sido modicada durante su emisin, y esa informacin es percibida como una caracterstica diferencial de ese sonido. Cuando, por el contrario, el sonido
mantiene un cierto nivel de amplitud durante buena parte de su duracin, como es el
caso del segundo ejemplo, interpretamos que la fuente sonora est siendo alimentada
constantemente con energa. Y en funcin de las variaciones de la fase de mantenimiento nos hemos acostumbrado a distinguir si es el resultado de la intervencin
del ejecutante o si viene dado por la dinmica propia del instrumento. As mismo,
la forma de la extincin y su duracin nos aporta informacin sobre la accin del
intrprete y sobre el entorno espacial en el que ese sonido se encuentra.
198
Cualquier forma de la envolvente que no responda a la dinmica propia del comportamiento fsico esperable nos habla de una intervencin por parte del intrprete. Por
poner un ejemplo, nuestro sistema perceptivo distingue entre el sonido producido
por un rgano de iglesia y el producido por una auta, con independencia del color
es decir, del nmero y peso de los armnicos, simplemente por las variaciones
que, por mnimas que sean, acompaarn siempre al sonido de la auta. As, en el
segundo ejemplo, la suavidad del ataque con esa forma de ese y la ligera primera
cada son sucientes para atribuir a ese sonido una voluntad humana, y por eso lo
relacionamos con el sonido de una auta en la que el intrprete ha podido modicar
la evolucin de la amplitud. Aunque se trata de un sonido generado articialmente,
nunca lo confundiramos con otro que simulara el producido por el tubo de un rgano de iglesia. En realidad, si en lugar de haber sido la envolvente de amplitud tan
esquemtica, sus etapas de declive y de mantenimiento hubieran presentado algunas
inexiones, nos hubiera recordado ms al sonido producido por una auta real.
9.3.
199
200
Figura 9.2: Vdeo que muestra la inuencia en el timbre del desfase en la extincin de los componentes de un sonido.
En este vdeo observamos dos repeticiones de la nota la3 a 220 Hz, pero si prestamos
atencin advertimos que su sonoridad es claramente diferente. En ambos casos el nmero de armnicos y su amplitud mxima es la misma: el primer armnico, el de 220
Hz, tiene una amplitud mxima de 0,24; el segundo, el de 440 Hz, de 0,21; el tercero,
el de 660 Hz, de 0,18; y el cuarto, el de 880 Hz, de 0,15. La nica diferencia entre
ambos sonidos es que en el primero la velocidad con la que se amortiguan los cuatro
componentes es similar, mientras que en el segundo la extincin de cada armnico
sigue un ritmo diferente, de modo que los armnicos superiores se extinguen ms
rpidamente que los inferiores.
En la primera emisin de la nota apreciamos que durante toda su duracin la cualidad
del sonido es la misma. En la parte inferior podemos observar que el peso relativo
de los diferentes armnicos no vara sustancialmente. Podemos apreciar tambin en
el osciloscopio que la forma de la vibracin no cambia a lo largo de todo el sonido,
aunque su amplitud vaya disminuyendo progresivamente.
En la segunda emisin de la nota, por el contrario, si realizamos una escucha atenta
nos damos cuenta de que la cualidad sonora va cambiando a lo largo de la duracin.
Comienza con una sonoridad plena, resultado de que los cuatro componentes que
forman la nota tienen un peso similar, pero luego va perdiendo cuerpo hasta que la
nota se transforma en un sonido simple. Esta evolucin de la cualidad es percibida por
201
nuestro odo como un rasgo caracterstico del timbre de esa nota, algo que la hace
diferente de la anterior. En el osciloscopio se puede observar tambin que la forma de
la vibracin cambia a largo de su duracin. En efecto, al principio de la nota la forma
de la vibracin es compleja, pero luego, conforme la amplitud se va atenuando, su
forma se va simplicando progresivamente, hasta llegar a una sinusoide pura.
El segundo vdeo muestra un caso en el que se produce un retraso de los componentes
superiores en el momento del ataque:
Figura 9.3: Vdeo que muestra la inuencia en el timbre del desfase en el ataque de los componentes
de un sonido.
Ahora tambin se repite dos veces la misma nota, el la3 a 220 Hz constituido por
los cuatro primeros componentes. La amplitud mxima en ambos casos es la misma:
0,24 en el primer armnico, el de 220 Hz; 0,18 en el segundo, el de 440 Hz; 0,12 en
el tercero, el de 660 Hz; y 0,08 en el cuarto, el de 880 Hz.
Como podemos apreciar en las grcas de las envolventes que aparecen en la parte
inferior del vdeo, la nica diferencia ente los dos sonidos reside en que en la segunda
repeticin de la nota los armnicos se retrasan progresivamente en el momento del
ataque, de modo que los armnicos superiores alcanzan su mximo ms tarde que
los inferiores. Este retraso provoca un cambio en la cualidad del sonido debido al
202
diferente peso relativo que adquieren los componentes a lo largo del breve intervalo
de tiempo que dura el ataque.
Si nos jamos en el rea del osciloscopio, podremos observar que durante la emisin del primer sonido no cambia la forma de la vibracin, mientras que el ataque
del segundo se inicia con una vibracin puramente sinusoidal que rpidamente se
transforma en una forma ms compleja, similar a la del primer sonido.
Aunque reconocemos que se trata de la misma nota, si escuchamos con atencin percibiremos una diferencia apreciable en el timbre de ambos sonidos. Nuestro sistema
perceptivo ha reconocido en el segundo sonido un cambio rpido en la cualidad sonora que nos recuerda el efecto wah de una trompeta al destapar la sordina o el de
un pedal wah wah de guitarra elctrica. As pues, percibimos el retraso en el ataque
de los armnicos superiores como un rasgo tmbrico peculiar que diferencia ambos
sonidos, que son por lo dems idnticos.
El tercer vdeo muestra el caso de un sonido en el que la amplitud de los armnicos
superiores durante la etapa de mantenimiento sigue una evolucin opuesta a la del
fundamental. Aunque en los sonidos reales de los instrumentos y de las voces estos cambios acostumbran a ir unidos a modicaciones en la intensidad sonora, para
aislar el rasgo tmbrico que se deriva de la diferente evolucin de los componentes
parciales he procurado mantener constante la amplitud global durante la etapa de
mantenimiento.
Figura 9.4: Vdeo que muestra la inuencia en el timbre de las modicaciones en el peso de los
componentes de un sonido durante su etapa de mantenimiento.
203
En este vdeo escuchamos una sola nota, la misma que en los vdeos anteriores, un la3
a 220 Hz constituido por los cuatro primeros armnicos. En la parte inferior del vdeo
podemos observar que las envolventes de amplitud de los tres armnicos superiores
tienen una forma opuesta a la del componente fundamental. Vemos que durante la
etapa de mantenimiento el componente fundamental decae progresivamente desde
su valor mximo, alcanzado tras el ataque, hasta llegar a su valor mnimo, lo que
sucede en torno a la mitad de la duracin del sonido, para desde all volver a crecer
y alcanzar de nuevo su valor mximo antes de iniciar la extincin. Sin embargo,
las envolventes de amplitud de los restantes armnicos realizan el camino inverso:
crecen hasta llegar a un mximo hacia la mitad del sonido y a partir de all decrecen.
En este recorrido vemos que el segundo y el tercer armnico llegan a superar al
primero, e incluso que el tercer armnico supera al segundo.
Estos cambios hacen que el peso relativo de cada componente en el conjunto se modique a lo largo de la emisin de la nota, con la correspondiente modicacin en su
cualidad sonora. En efecto, percibimos que estos cambios durante la etapa de mantenimiento dan lugar a una modicacin gradual y constante de la cualidad sonora:
en la parte inicial y nal de esta etapa el peso del sonido recae mayoritariamente
en el componente fundamental, lo que proporciona al sonido una cualidad slida;
progresivamente los armnicos superiores van adquiriendo mayor importancia en
detrimento del fundamental, lo que proporciona al sonido una cualidad cada vez
ms hueca e incluso nasal, cuando predomina el tercer armnico, cosa que sucede
hacia la mitad de la duracin del sonido.
Los casos que hemos examinado en estos tres vdeos son solamente una muestra de
laboratorio de los rasgos acsticos que se derivan de las diferencias entre las envolventes de amplitud parciales. Estas diferencias provocan que la cualidad sonora de una
nota cambie a lo largo de su duracin y estos cambios son habitualmente percibidos
como un rasgo tmbrico.
9.4.
Envolvente de frecuencia
Aunque, como hemos visto, lo que dene una nota musical es la permanencia de
una frecuencia estable durante un periodo de tiempo lo sucientemente grande como para que podamos reconocer una determinada altura tonal, lo cierto es que en la
voz y en algunos instrumentos musicales esa permanencia puede ir adornada con oscilaciones en torno a su valor medio o con inexiones expresivas que pueden incluso
recorrer momentneamente las frecuencias de otras notas vecinas.
El hecho de que sean posibles esas modicaciones frecuenciales durante la emisin de
una nota, constituye ya un rasgo sonoro caracterstico de un grupo de instrumentos,
los llamados instrumentos de anacin libre como es el violn, un rasgo que los
diferencia de aquellos otros cuya frecuencia se mantiene totalmente estable a lo largo
de toda la duracin de la nota, los instrumentos de anacin ja, como por ejemplo, el
piano. Incluso la mayor o menor libertad en la modicacin de la frecuencia tambin
constituye un rasgo tmbrico. As, por ejemplo, mientras el violn puede modicar
libremente la frecuencia de una nota sin interrumpir su emisin hasta el extremo de
que la transicin entre las notas puede realizarse de forma continua, sin necesidad de
una nueva emisin, la auta o el saxofn solamente pueden modicar ligeramente
la frecuencia durante la misma emisin de la nota. As pues, se puede decir que la
modificacin de la frecuencia en los instrumentos de afinacin libre constituye
un elemento expresivo de primer orden a disposicin del intrprete.
Para experimentar los rasgos acsticos que se derivan de los cambios en la frecuencia
de una nota a lo largo de su duracin he fabricado dos vdeos. De manera semejante
a los vdeos anteriores, en cada uno de ellos en la parte de arriba se presenta la forma
de la vibracin, a modo de osciloscopio, y en la parte inferior las correspondientes
envolventes de frecuencia. En ambos vdeos la nota que escuchamos sigue siendo un
la3 con una frecuencia de 220 Hz. En el primer vdeo se presenta el caso de un sonido
simple y en el segundo el de una nota formada por los tres primeros armnicos.
Con la nalidad de aislar los rasgos tmbricos especcos que se originan por la evolucin de la frecuencia, empezaremos examinando una nota musical constituida por
un solo componente. En el vdeo que presento a continuacin podemos escuchar
tres sonidos simples que dan la misma nota, donde la nica diferencia que hay entre
ellos reside en la envolvente de frecuencia.
205
Figura 9.5: Vdeo que muestra la inuencia en el timbre de la envolvente de frecuencia en el caso
de un sonido simple.
206
As pues, hemos podido apreciar mediante este vdeo que las variaciones en la frecuencia de una nota a lo largo de su emisin producen efectos acsticos que contribuyen a caracterizar el timbre de un instrumento y que proporcionan al sonido una
particular carga emotiva.
Para ver cmo se comporta la envolvente de frecuencia de cada uno de los componentes de un sonido armnico compuesto he confeccionado un vdeo que presenta
el vibrato de una nota formada por los tres primeros armnicos. El objetivo de este vdeo es mostrar que la evolucin de la frecuencia en los distintos componentes
presenta la misma forma, si bien sus valores estn escalados.
Figura 9.6: Vdeo que muestra la inuencia en el timbre de la envolvente de frecuencia en el caso
de un sonido compuesto.
Las dos repeticiones de la misma nota se diferencian slo por la envolvente de frecuencia. El primer sonido sirve tambin ahora de referencia para permitirnos la comparacin. Se trata de un sonido en el que no ha habido modicacin de la frecuencia
a lo largo de su emisin y por eso en la parte inferior, donde aparecen las envolventes
de frecuencia de los tres componentes, solamente se dibujan tres lneas horizontales
igualmente espaciadas.
El segundo sonido tiene un vibrato similar al del primer vdeo. Vemos que, como en
el anterior sonido, la frecuencia del segundo armnico es doble que la del primero
207
y la del tercero, triple. Dado que en las notas musicales los componentes, salvo ligeras matizaciones, son armnicos, sus envolventes de frecuencia mantienen la misma
forma y slo se diferencian en el escalado correspondiente a su nmero armnico.
As, en este caso, como la profundidad del vibrato del primer armnico es de 8 Hz,
la del segundo armnico es de 16 Hz y la del tercero de 24 Hz.
9.5.
Conclusin
A lo largo de este captulo hemos podido comprobar la inuencia de la envolvente de frecuencia y de la envolvente de amplitud, tanto la general como la de cada
componente, en la cualidad tmbrica de las notas musicales. Estas envolventes constituyen una parte importante de la caracterizacin de los instrumentos musicales y
sirven tambin como vehculo expresivo de las intenciones del intrprete.
208
Captulo 10
Anlisis espectral de los sonidos
musicales
10.1.
Introduccin
musicales reales, aunque son mucho ms estables que los del habla, generalmente la
estabilidad no se mantiene ms all de unos 50 milisegundos, por lo que, salvo circunstancias excepcionales, la longitud del fragmento no debe ser mucho mayor que
esa cantidad, de forma que podamos considerar, aunque slo sea de forma aproximada, que los parmetros han permanecido constantes durante el intervalo de tiempo
analizado.
En este captulo veremos, en primer lugar, en qu consiste el anlisis espectral y cmo se puede realizar mediante el fenmeno de la resonancia. Despus estudiaremos
la cuestin esencial de los lmites de su capacidad de resolucin. A continuacin veremos cmo mediante el espectrograma es posible obtener una representacin de la
evolucin de los distintos componentes simples a lo largo del tiempo. Por ltimo,
para ejemplarizar las ideas expuestas y para preparar la utilizacin de esta nueva herramienta en el estudio de los sonidos reales, presentar los espectrogramas de varios
sonidos caractersticos.
10.2.
Imaginemos que disponemos de un piano ideal en el que las cuerdas vibran con toda facilidad, pues no hay apagadores. Adems, las cuerdas de este piano imaginario
slo tendran un modo de vibracin, el modo fundamental, es decir, slo resonaran
cuando la frecuencia que las excitara coincidiera con su frecuencia natural o estuviera
prxima a ella. Las cuerdas de este piano imaginario, en lugar de estar espaciadas siguiendo la escala cromtica, estaran separadas de hercio en hercio (aunque tambin
podran haber estado separadas de dcima de hercio en dcima de hercio o de cualquier otra forma). Evidentemente este piano imaginario poseera miles de cuerdas,
tantas como quisiramos. Lo que acabo de describir ser nuestro analizador espectral
ideal.
Delante de este piano haremos sonar, imaginariamente claro est, los sonidos que
vayamos a analizar y luego mediremos la amplitud con la que vibra cada una de las
211
cuerdas que se han quedado resonando, representando los resultados en una grca.
En las grcas de componentes frecuenciales que presentar a partir de ahora consideraremos que cada uno de los pequeos palitos que las constituyen corresponde
a una cuerda de nuestro piano imaginario. La altura que alcance cada uno de esos
palitos reejar la amplitud relativa con la que se ha quedado resonando la cuerda
correspondiente, en una escala que va del 0 al 1. He asociado, de manera similar a
las grcas del captulo 7, un color a cada amplitud, dentro de una escala que se corresponde con la de los colores por los que pasa el hierro al calentarse: el cero ser el
negro absoluto; los valores prximos a cero sern de un rojo muy oscuro; progresivamente, conforme los valores se incrementen, el rojo pasar a ser ms brillante;
luego el rojo se transformar en amarillo; y nalmente, a medida que los valores se
van aproximando al 1, el amarillo se ir aclarando hasta llegar al blanco absoluto, que
representar el valor mximo, el 1.
Supongamos que delante de nuestro imaginario piano hacemos sonar durante un
segundo de duracin un sonido simple de 220 Hz, un la3 formado por un nico
componente. La eleccin de un segundo no ha sido algo casual, pues, como veremos
en el apartado siguiente, la duracin del fragmento sonoro puede condicionar en
determinadas circunstancias la abilidad del anlisis. La duracin temporal que se
elige recibe habitualmente el nombre de ventana de observacin o ventana de
anlisis.
Ahora nos interesa comprobar cmo responde este analizador de espectro ideal al
sonido propuesto y averiguar si localiza bien la frecuencia. La grca de abajo representa las amplitudes de las cuerdas que quedarn resonando en el piano ideal. He
limitado la grca a la representacin de los primeros 1.000 Hz.
212
213
Figura 10.2: Detalle de la grca del anlisis frecuencial de un sonido simple de 1 segundo.
Ahora distinguimos con claridad la representacin de cada una de las cuerdas del
piano que han quedado resonando. Apreciamos que la cuerda que resuena con ms
fuerza es la de 220 Hz. Pero, como podemos observar en la grca, al estar las cuerdas
de este piano separadas de hercio en hercio, en realidad solo podemos saber que la
frecuencia del componente del sonido analizado habr sido mayor que 219,5 Hz y
menor que 220,5. En efecto, el margen de precisin de nuestro piano analizador de
espectro es de un hercio, aunque nada nos habra impedido aadir en medio muchas
ms cuerdas a este piano imaginario y obtener la precisin que deseramos.
As pues, de este anlisis se desprende que el componente presente en el sonido que
estamos analizando se corresponde con el pico destacado en la grfica de las
amplitudes de las cuerdas resonantes. Pero eso no es todo. Tambin observamos
que, en menor medida, algunas de las cuerdas laterales han obtenido cierta amplitud.
Esto parece intuitivamente coherente, pues el efecto de la resonancia tambin hace
vibrar las cuerdas cuya frecuencia es muy prxima a la del componente del sonido
que estamos analizando.
Cada una de las cuerdas de este hipottico piano resonar cuando en el sonido que
queramos analizar est presente un componente sinusoidal muy prximo a su frecuencia natural de vibracin. En este caso la cuerda que resonar con ms fuerza ser
aquella que tenga una frecuencia natural lo ms cercana a 220 Hz; pero las cuerdas
prximas, como es fcil de intuir, tambin resonarn, aunque sea en menor medida.
214
10.3.
Ahora bien, la pregunta es: Siempre esto es as? Todo resulta tan fcil? Disponemos, o mejor dicho, dispone la naturaleza de un medio tan sencillo para determinar
con precisin los componentes sinusoidales presentes en cualquier fragmento sonoro? La respuesta, desafortunadamente, es que no. Voy a realizar ahora el anlisis del
mismo sonido de un solo componente de 220 Hz, pero acortando la duracin del
fragmento a analizar: ahora har sonar delante de nuestro piano imaginario slo 50
milsimas de segundo (es decir, la ventana de anlisis ser de 0,05 s). Veamos lo que
ocurre en la grca de abajo.
215
Figura 10.4: Detalle de la grca del anlisis frecuencial de un sonido simple de 50 milisegundos.
Figura 10.5: Grca del anlisis frecuencial de dos sonidos simples muy prximos de 50 milisegundos.
Comprobamos que el anlisis efectuado con este tamao de ventana ha sido incapaz de distinguir los dos componentes, el de 220 Hz y el de 233 Hz, que sabemos
que existen en la seal a analizar, y que, en su lugar, ha salido un solo componente
cuya frecuencia es la media aritmtica de los otros dos, 226,5 Hz. Ciertamente, si
hubiramos podido analizar un segundo entero de duracin no habramos tenido
ningn problema para distinguir ntidamente los dos componentes. En la siguiente
grca podemos ver el resultado de realizar el mismo anlisis durante un segundo de
duracin.
217
Figura 10.6: Grca del anlisis frecuencial de dos sonidos simples muy prximos de 1 segundo.
En efecto, aqu los dos componentes han sido resueltos y adems con toda la precisin
que haba requerido al anlisis.
Veamos ahora otro ejemplo de dos componentes un poco ms separados. Vamos a
analizar una seal constituida por un componente de 220 Hz (la3 ) y otro de 262 (do4 ).
La duracin del anlisis va a ser tambin de 50 ms.
Figura 10.7: Grca del anlisis frecuencial de dos sonidos simples de 50 milisegundos.
218
En este caso el anlisis s que ha sido capaz de distinguir los dos componentes. Ahora
bien, si nos jamos en la localizacin de los picos mximos vemos que el componente
de 220 Hz ha sido desplazado a 232 Hz y el de 262 Hz a 250 Hz. Es decir, observamos
que la presencia de un componente prximo altera de manera notable la abilidad
del resultado obtenido.
Resumiendo, nos encontramos con que al reducir el tamao de la ventana de
anlisis disminuye su capacidad para discernir componentes distintos y la precisin con la que puede determinar su frecuencia. Este problema plantea una
cuestin esencial: si queremos obtener una buena resolucin en frecuencia necesitamos una duracin temporal larga. Pero la realidad es que el sonido musical va evolucionando con el tiempo y los parmetros de sus componentes solamente permanecen
relativamente estables durante un tiempo pequeo, unas cincuenta milsimas de segundo.
As pues, a la hora de efectuar un anlisis frecuencial de un fragmento musical siempre hemos de buscar una opcin de compromiso. Podremos utilizar una ventana de
mayor duracin, pero en ese caso tendremos que asumir que lo que obtendremos
en el anlisis ser una especie de promediado de la evolucin de los acontecimientos
sonoros que se hayan producido en ese tiempo. Podremos elegir una ventana de corta duracin para garantizar que el fragmento analizado sea sucientemente estable,
pero en ese caso deberemos asumir que si coinciden componentes prximos puede
que el anlisis no sea capaz de distinguirlos o al menos que pierda precisin en su
localizacin.
10.4.
El espectrograma
Como he dicho ya, los parmetros de los componentes sonoros en los sonidos reales
no suelen permanecer estables, sino que evolucionan a lo largo de su duracin. Por
ello, para analizar un fragmento sonoro nos interesar muchas veces obtener una representacin que muestre la evolucin de los valores de amplitud y de frecuencia de cada componente durante el tiempo que dura el sonido. Habitualmente
esta representacin recibe el nombre de espectrograma.
219
220
Recomiendo ir parando el vdeo en el momento que se considere oportuno para entender mejor lo que sucede. Encontraremos una imagen similar a la siguiente.
221
En el panel de la izquierda tenemos la representacin temporal de la vibracin a modo de osciloscopio, es decir, la forma de la vibracin a lo largo del tiempo. Al estar en
la gura 10.9 la imagen detenida, he podido aadir la localizacin temporal precisa:
el fragmento de seal analizado en este cuadro del vdeo corresponde al intervalo
de tiempo transcurrido entre el segundo 10,360 y el 10,410. En total son las 50 milsimas de segundo que constituyen la duracin de los fragmentos que analizamos.
Podemos observar que en esta ocasin la forma de la vibracin ha permanecido casi
prcticamente estable durante ese intervalo de tiempo. Sin embargo, si hubiramos
detenido el vdeo en algn otro momento, especialmente en el ataque de alguna
nota, nos hubiramos encontrado con una situacin ms inestable.
En el panel de la derecha tenemos la representacin frecuencial, es decir, los componentes que constituyen la seal que estamos viendo en el panel de la izquierda. Esta
representacin sigue los mismos criterios que acabamos de ver en los apartados anteriores, es decir, muestra el anlisis frecuencial. He aumentado proporcionalmente
la amplitud para que en el espectrograma inferior resaltaran ms los componentes
pequeos. En esta ocasin vemos que aparecen destacados 6 picos que corresponden a los 6 primeros armnicos de la nota re4 , cuya frecuencias son, redondeando
en hercios: 294,7 Hz, 587,4 Hz, 881,1 Hz, 1174,8 Hz, 1.468,5 Hz, 1.762,2 Hz. Las
amplitudes estn tambin acompaadas de una escala de colores, como la que he descrito antes. El componente primero se ve claramente destacado y el pico presenta un
color amarillo luminoso que se aproxima ya al blanco. Los componentes segundo y
el tercero tienen tambin una amplitud considerable y su color es un rojo brillante, siendo ligeramente mayor el tercero que el segundo. Los componentes cuarto,
quinto y sexto van progresivamente perdiendo amplitud y sus colores van siendo
cada vez ms oscuros. A lo largo del vdeo podemos ver como esta grca va evolucionando siguiendo los cambios en el sonido. Dicho de otra manera, conforme el
sonido va pasando por el panel izquierdo, la representacin frecuencial de la derecha
se va actualizando.
En el panel de abajo vemos cmo se va construyendo el espectrograma del fragmento. Si nuestro reproductor de vdeo nos permite avanzar de cuadro en cuadro
veremos que en cada cuadro tenemos un desplazamiento de la seal hacia la izquierda
en la ventana temporal del panel de la izquierda, una actualizacin de su representacin frecuencial en el panel de la derecha y, por ltimo, una nueva columna de
222
pxeles en el panel inferior. Esa nueva columna de pxeles presenta los valores frecuenciales correspondientes al anlisis frecuencial del cuadro que estamos analizando,
utilizando simplemente los mismos colores que hemos obtenido en la representacin
frecuencial, de tal forma que aqu prescindimos de la longitud del componente y la
representamos nicamente por el color. As por ejemplo, si en el visor de imgenes
con el que estamos examinando esta grca hacemos un zoom considerable, hasta el
extremo de poder ver pxeles aislados, y nos jamos nicamente en la ltima columna de pxeles del espectrograma que estamos construyendo y que hemos detenido,
veremos que los picos que hemos visto en el panel de las frecuencias se corresponden,
con sus mismos colores, con los pxeles que vemos destacados en esta ltimo columna
de la imagen. Tal vez el componente ms agudo nos aparezca un poco desvado, pero aun con todo nos resultar fcil ver cmo esta columna de pxeles se corresponde
y representa la amplitud de cada componente frecuencial analizado en el panel de la
derecha.
Esta forma de representacin nos permite dejar un rastro de lo que hemos visto que
ha ido sucediendo a lo largo del tiempo en el panel de las frecuencias. De este modo
tenemos una representacin frecuencial actualizada con el paso del tiempo. Y esto es
ya similar a la manera en la que nosotros omos y a la que en la realidad se producen
la mayor parte de los acontecimientos sonoros. As pues, el espectrograma es la forma
de representacin ms idnea del sonido de un fragmento musical.
10.5.
223
Figura 10.10: Vdeo con el espectrograma de la generacin de una seal en diente de sierra a partir
de los componentes consecutivos de la serie armnica.
En este espectrograma podemos observar que cada componente aparece representado por una lnea horizontal, lo que indica que la frecuencia de todos ellos permanece
constante durante la emisin de cada nota. As mismo, por el color podemos apreciar que la amplitud de cada componente es la misma en todas las repeticiones de la
nota en las que est presente, y tambin que la amplitud de los componentes que van
apareciendo es progresivamente menor. As vemos que el primer armnico o fundamental presenta la mayor amplitud, pues su color es casi blanco, que el color con
el que est representado el segundo armnico es amarillo dorado y que los siguientes
son rojos cada vez ms oscuros.
224
Figura 10.11: Vdeo con el espectrograma de tres sonidos armnicos formados por componentes
cuya amplitud evoluciona de diferentes formas.
225
A diferencia de la representacin de la seal en el tiempo que veamos en el osciloscopio, donde no podamos distinguir los componentes individuales, este espectrograma
nos muestra de forma clara la evolucin de la amplitud de cada componente que forma el sonido. En primer lugar podemos observar que en todos los casos estamos ante
un sonido armnico, pues las distancias entre los componentes son iguales. Por otro
lado, los cambios en el color de cada componente a lo largo de su duracin nos indican que ha variado su amplitud. En el espectrograma se puede distinguir tambin
el carcter ms o menos abrupto del ataque y de la extincin de las notas.
Si pasamos a analizar caso por caso, nos encontramos con que en el primer sonido la
amplitud de los componentes superiores es progresivamente menor, pues vemos que
el componente primero es el que presenta mayor luminosidad, mientras que el ltimo
es el ms oscuro. Se aprecia tambin claramente en el momento del ataque un retraso
de los sucesivos componentes, siendo el fundamental el primero que entra. Por el
contrario, vemos que en la extincin del sonido todos los componentes se apagan
simultneamente (si bien los componentes de mayor amplitud parecen prolongarse
un poco ms, esto se debe solamente a que los colores ms oscuros se funden antes con
el negro). Vemos tambin que las lneas que representan los componentes cambian
de color durante la parte inicial del sonido, aproximadamente en la primera dcima
de segundo, desde un rojo muy oscuro que se funde casi con el negro del fondo,
hasta llegar al color que mantendrn durante la mayor parte de la emisin. Esto es
indicativo de que el ataque de la nota ha sido ms bien suave, tal como apreciamos
al orla. As mismo, en la etapa nal de la nota vemos que los componentes van
perdiendo luminosidad, lo que hace que parezca que se vayan adelgazando. Esto
corresponde a la extincin suave que omos.
En el segundo sonido los ataques de los componentes son simultneos y menos suaves que en el primero, como podemos observar en el hecho de que se alcanza ms
rpidamente el color que mantendr cada componente durante la emisin. As mismo, vemos que la forma en la que se extinguen es similar a la del sonido primero.
Los cambios de color que observamos durante su etapa intermedia nos indican que
la amplitud de los componentes superiores, en especial el segundo y el tercero, se va
haciendo progresivamente mayor, hasta superar, aproximadamente a la mitad de la
duracin del sonido, a la del fundamental; luego vemos que se invierte la tendencia
y se recupera la situacin inicial. Esto coincide con el cambio de cualidad sonora que
226
227
Figura 10.12: Vdeo con el espectrograma de varios sonidos cuya frecuencia evoluciona de diferentes
formas.
228
La representacin espectral del ruido blanco es el granulado de la izquierda, mientras que la lnea blanca de la derecha corresponde al sonido simple. Si hubiramos
extendido la representacin del espectrograma ms all de los 4.000 Hz hubiramos
seguido observando ese mismo granulado en toda la franja audible. Idealmente un
ruido blanco contiene todas las frecuencias con la misma amplitud, por lo que deberamos haber visto, en lugar de este granulado, un rectngulo plano de un color
uniforme. Pero la aleatoriedad absoluta slo es posible en la idealidad. Para ello deberamos haber dispuesto de una duracin innita y haber tenido una garanta total
229
de que los nmeros que hemos obtenido para generar el ruido blanco fueran perfectamente aleatorios, no pseudo-aleatorios, como los que hemos utilizado. As mismo,
cuando observamos el componente aislado, un sonido simple, deberamos haber visto una lnea innitamente na, la correspondiente solamente a esa precisa frecuencia.
Sin embargo, en los espectrogramas siempre vemos para cada componente una lnea
con un cierto grosor. Estas son las aproximaciones con las que vamos a ver las seales
en los espectrogramas que realicemos habitualmente.
Figura 10.14: Vdeo con un espectrograma de ruido de trco y de una locutora de radio.
En la primera parte vemos con claridad el ruido blanco producido por la lluvia, que
cubre todo el espectro de frecuencias de una manera homognea. En la parte de abajo
del espectro vemos una forma granulada, correspondiente tambin a ruido, pero que
230
se sita en una zona de ms bajas frecuencias. Es el ruido propio del trco. Vemos
tambin como el motor de un coche, al acelerar, se reeja en la aparicin de unos
componentes que suben rpidamente su frecuencia. Y omos en medio de ese ruido
un sonido armnico, la bocina de un coche, como se puede apreciar con claridad
por la distribucin vertical de componentes igualmente espaciados que se observan
en torno al segundo nueve y con menos claridad un poco antes del segundo 4.
En la segunda parte del espectrograma, cuando omos hablar a la locutora, vemos una
alternancia entre breves fragmentos de sonidos armnicos y un granulado organizado en barras verticales. Es la alternancia entre ruido y sonido armnico caracterstica
del habla, simplicando un poco, la alternancia entre consonantes y vocales. Vemos
tambin que las vocales cambian de frecuencia siguiendo unos esquemas ascendentes y descendentes dentro de unos pequeos mrgenes. Estos esquemas son los que
constituyen la entonacin del habla.
10.6.
Conclusin
En este captulo hemos estudiado cmo se puede descomponer una vibracin cualquiera en la suma de los componentes sinusoidales que la constituyen, cada uno con
su propia frecuencia y amplitud. Al hacer esto hemos obtenido una representacin
frecuencial del sonido analizado. As mismo, dado que habitualmente los parmetros
de los componentes armnicos que constituyen el sonido musical cambian a lo largo
del tiempo, hemos visto que el espectrograma es una forma adecuada de representar
esta evolucin, pues muestra para cada instante la frecuencia y la amplitud de los
componentes que forman el sonido.
231
Captulo 11
El timbre
11.1. Introduccin
El sonido de los instrumentos musicales, entre los que hay que incluir el de la voz
humana en el canto, es una realidad acstica mucho ms compleja que el sonido generado articialmente que hemos utilizado en la mayor parte de los ejemplos de los
captulos anteriores. El sonido habitual que omos en las notas que forman una pieza
musical interpretada por instrumentos acsticos posee unas cualidades que le proporcionan, por as decir, un grosor y una textura que lo hacen rico y variado, tiene
algo que percibimos como vivo y de lo que suelen carecer los sonidos articiales.
Estas cualidades son las que dotan a cada sonido musical de una individualidad, una
individualidad que va a conservar incluso cuando se mezcle con otros sonidos, como
ocurre, por ejemplo, en los acordes dados en el mismo instrumento o cuando la misma nota es emitida simultneamente por dos instrumentos distintos. Este conjunto
de cualidades sonoras constituyen lo que llamamos el timbre del sonido.
La palabra timbre se suele usar en sentido estricto para designar los rasgos especcos que caracterizan los sonidos propios de uno u otro instrumento. As, se habla
del timbre del violn, del clarinete, del piano, etc. Sin embargo, el trmino timbre
tambin puede ser utilizado para nombrar el conjunto de marcas diferenciadoras que
individualizan el sonido de cada nota musical concreta, al margen de su altura tonal o
de su volumen sonoro. Estas marcas tmbricas no slo diferencian un sonido de otro
232
dentro del mismo instrumento, sino que hacen que una misma nota dada en el mismo instrumento posea una cualidad sonora particular dependiendo del toque del
intrprete, el cual puede hacer incluso que suene de diferente modo en los distintos
momentos de su interpretacin.
La palabra timbre signica precisamente esto: sello. Podemos considerar, as pues,
que el timbre es el sello propio que posee cada sonido, bien sea por su pertenencia a un tipo de instrumentos o a un instrumento concreto, o bien incluso
por la accin intencionada del instrumentista. En este ltimo sentido decimos
que el instrumentista timbra de una u otra manera cada uno de los sonidos que
ejecuta, dotndolos de unas marcas especcas que forman parte del sello de su interpretacin.
En lneas generales, podemos decir que los sonidos producidos por la prctica totalidad de los instrumentos musicales son el resultado de la interaccin de dos sistemas:
uno, la fuente de excitacin sonora, aquellos mecanismos mediante los cuales se provoca y se mantiene la vibracin, como son, por ejemplo, las cuerdas en el piano; otro,
las estructuras que actan de resonadores y que modican la composicin del sonido
emitido por la fuente, como es, por ejemplo, la caja de resonancia. Las posibilidades
de accin sobre cada uno de estos sistemas que ofrece cada instrumento al intrprete
completan su caracterizacin tmbrica, como ocurre, por ejemplo, con el vibrato en
los instrumentos de anacin libre. Estas posibilidades son los recursos expresivos
con los que cuenta el intrprete para transmitir su idea musical.
Pero no todos los instrumentos permiten al intrprete las mismas posibilidades. En
unos casos puede modicar los parmetros acsticos a lo largo de la emisin de un
sonido, como ocurre en la voz humana, el ms verstil de los instrumentos, donde el
cantante puede controlar la amplitud y la frecuencia de la fuente sonora (sus cuerdas
vocales), pero tambin, y especialmente, puede modicar la forma de los resonadores (su rgano bucal). Esto ltimo le permite incrementar o disminuir la amplitud
de unos u otros componentes frecuenciales, modicando a su voluntad y de forma
constante la cualidad tmbrica del sonido que est emitiendo. El caso opuesto es el
del clavecinista, por ejemplo, quien dispone casi exclusivamente de la posibilidad de
disparar el mecanismo de produccin del sonido mediante su accin sobre la tecla,
pero, a partir de ah, todo lo que sucede en el sonido viene ya determinado por la
233
En primer lugar me ocupar del conjunto de rasgos que pertenecen a lo que habitualmente se denomina el contenido espectral de un sonido y que determinan sus
cualidades sonoras, su color. Puesto que el espectrograma nos ofrece una imagen
bastante completa de la vida del sonido musical, utilizar varios vdeos con espectrogramas que nos permitirn observar los rasgos tmbricos que estn vinculados a la
estructura y a la evolucin individual de los componentes frecuenciales, as como la
posible presencia de ruidos caractersticos que acompaan a la emisin. En segundo
lugar mostrar la importancia que para la caracterizacin del timbre tiene la evolucin temporal de los parmetros del sonido en su conjunto, es decir, la envolvente
de amplitud y la envolvente de frecuencia.
ligadas, de las cuales las segundas son el resultado de abrir el portavoz sin modicar
la posicin. La primera pareja la forman el re3 , la nota ms grave del clarinete en sib
con todos los oricios tapados, y el la4 , la misma posicin con el portavoz abierto.
La segunda pareja est compuesta por el mib3 y el sib4 .
Para cada uno de los tres ejemplos presentar dos vdeos con sus correspondientes
espectrogramas, a n de mostrar, mediante la modicacin de la escala de color, diferentes aspectos de su contenido espectral. En todos los espectrogramas la duracin
de la ventana de anlisis ha sido de 50 milsimas de segundo, lo que, como vimos,
da como resultado un compromiso aceptable entre la resolucin en tiempo y en frecuencia. De esta forma podremos distinguir con suciente claridad los componentes
que constituyen cada sonido y a la vez seguir su evolucin temporal.
En el primero de los dos espectrogramas de cada ejemplo la escala de colores reeja
linealmente las amplitudes de cada componente, desde el negro, que corresponde
al 0, hasta el blanco, que corresponde al 1, con todas las gradaciones intermedias,
como indiqu en el captulo dedicado al anlisis espectral. Dado que, en general, la
amplitud relativa de los componentes muy agudos es muy pequea, con esta escala
de colores no se observa prcticamente ningn componente ms all de los 5.000
Hz, por lo que he limitado el rango de estos espectrogramas a esta frecuencia.
El segundo espectrograma de cada ejemplo nos va a permitir observar con claridad
los componentes que estn en la banda alta de frecuencias. Aunque la amplitud de
estos componentes muy agudos es, en general, muy pequea, nuestro odo es muy
sensible a su presencia y, si bien su importancia para el reconocimiento de la altura
tonal es escasa, inuyen mucho en el color del sonido. Si los componentes que se
encuentran en esas zonas superiores del espectro no fueran importantes para nuestra
percepcin acstica, no tendra sentido que los reproductores de msica de calidad
se distinguieran, entre otras cosas, por su capacidad para reproducir con delidad
los componentes ms agudos. Para hacer visibles estos componentes muy agudos he
modicado la escala de colores, de tal forma que el color blanco representa ahora
cualquier amplitud superior a una centsima, dentro de la escala normalizada del 0
al 1. Al hacerlo as, surgen del fondo oscuro del espectrograma nuevos componentes
que antes estaban fundidos con el color negro. Ahora bien, desaparecen las diferencias entre las amplitudes que se pueden apreciar con la escala de color sin alterar de
los primeros espectrogramas, ya que cualquier valor superior a una centsima queda
236
representado ahora por el color blanco. Esto explica el engrosamiento que se observa
en los componentes ms graves. Esta escala de color nos permitir tambin apreciar
mejor la presencia de ruido y su inuencia en la caracterizacin de los sonidos musicales. No obstante, he limitado el rango de estos segundos espectrogramas a los
10.000 Hz, pues, aunque desde el punto de vista de la calidad de la reproduccin sonora son muy importantes los componentes que estn por encima de esta frecuencia,
para nuestro estudio sobre las marcas tmbricas este lmite es suciente.
Veamos, pues, uno detrs de otro los vdeos con los tres ejemplos sonoros y sus correspondientes espectrogramas. Recomiendo ver y escuchar con detenimiento cada
uno de los vdeos para adquirir familiaridad a la hora de relacionar lo que se ve con
lo que se oye.
237
Figura 11.1: Vdeo con el espectrograma de una meloda de piano en el registro medio-grave.
Figura 11.2: Vdeo con el espectrograma de banda alta de la meloda de piano de la gura 11.1.
238
Figura 11.3: Vdeo con el espectrograma de una meloda de piano en el registro medio-agudo.
Figura 11.4: Vdeo con el espectrograma de banda alta de la meloda de piano de la gura 11.3.
239
Figura 11.6: Vdeo con el espectrograma de banda alta de las notas de violn y clarinete de la gura
11.5.
Lo primero que podemos observar es que todos estos espectrogramas son de sonidos
naturales, es decir, de sonidos producidos por instrumentos acsticos, pues podemos
apreciar imperfecciones, ruidos y variaciones que lo hacen rico y vivo. As, en el
espectrograma de banda alta del primer ejemplo, el de la gura 11.2, observamos que
240
aproximadamente en el segundo 12,5 aparece una pequea franja vertical. Si el volumen del altavoz de nuestro reproductor es lo sucientemente alto, reconoceremos
en ese momento el ruido que se ha producido al levantar la tecla que ha dado el re3 .
Un poco ms adelante (en la penltima nota, en torno al segundo 16,7, casi al nal de
la duracin del dob4 ) omos un pequeo ruido sordo que enmascara momentneamente el sonido de la nota y que se corresponde con una pequea franja vertical en el
espectrograma. Y al nalizar el pasaje, en la ltima nota (un poco antes del segundo
18) omos y vemos en el espectrograma un pequeo chasquido ambiental. Por otra
parte, el granulado que est por debajo de los componentes ms graves en todo el
espectrograma coincide con el ruido ambiente de la grabacin domstica.
Ciertamente, en medio del sonido emitido por los instrumentos musicales hay muchas formas de ruido, todas ellas caracterizadas por una acumulacin de componentes en una determinada zona del espectro. En el caso del piano, por ejemplo, como
veremos enseguida, determinados tipos de ruido forman parte de su propia caracterizacin tmbrica.
Con la ayuda de estos ejemplos vamos a examinar a continuacin los rasgos tmbricos
a mi juicio ms relevantes que se aprecian en el contenido espectral del sonido de
los instrumentos musicales. Estos rasgos son, en parte, resultado de la constitucin
de cada instrumento y, en parte, resultado de las acciones del intrprete.
En primer lugar nos ocuparemos de las peculiaridades espectrales que comparten los
sonidos del mismo instrumento, es decir, aquellas caractersticas que poseen los sonidos del piano por ser de piano, los del violn por ser de violn o los del clarinete por
ser de clarinete. Para no alargar en exceso este captulo, me centrar en las marcas
especcas del sonido del piano. En segundo lugar estudiaremos las diferencias en
contenido espectral que presentan cada sonido individual del mismo instrumento.
Veremos cmo la cualidad sonora de una nota del piano es diferente de la de otras
notas del mismo piano, igual que cada nota del violn es diferente de otras del mismo violn, y lo mismo en el caso del clarinete. Y en tercer lugar analizaremos las
diferencias en el contenido espectral que son resultado de las acciones intencionadas
que realiza el intrprete al emitir cada nota segn sus propsitos expresivos en cada
momento de la interpretacin.
241
244
Figura 11.7: Vdeo con el espectrograma de ventana muy larga de la nota sol3 dada primero por
un piano y luego por un violn.
245
Piano serie
Piano
Violn serie
Violn
armnica (Hz)
medido (Hz)
armnica (Hz)
medido (Hz)
195,5 x 1 = 195,5
195,5
195,9 x 1 = 195,9
195,9
195,5 x 2 = 391,0
391,3
195,9 x 2 = 391,8
391,8
195,5 x 3 = 586,5
587,5
195,9 x 3 = 587,7
587,7
195,5 x 4 = 782,0
784,4
195,9 x 4 = 783,6
783,6
195,5 x 5 = 977,5
982,1
195,9 x 5 = 979,5
979,5
195,5 x 6 = 1.173,0
1.180,9
195,9 x 6 = 1.175,4
1.175,4
195,5 x 7 = 1.368,5
1.381,4
195,9 x 7 = 1.371,3
1.371,3
195,5 x 8 = 1.564,0
1.583,5
195,9 x 8 = 1.567,2
1.567,2
195,5 x 9 = 1.759,5
1.786,8
195,9 x 9 = 1.763,1
1.763,1
Si comparamos los valores de las columnas correspondientes a los instrumentos medidos con los respectivos valores de referencia segn la serie armnica, podemos
vericar que los componentes de la nota de violn son armnicos hasta la dcima de
hercio, mientras que los del piano se van apartando cada vez ms, de modo que la
diferencia es bastante signicativa en los componentes superiores, exactamente de
27,3 hercios en el noveno armnico.
Esta inarmonicidad, que es consecuencia de la rigidez de las cuerdas del piano, da al
instrumento un sonido ligeramente metlico muy caracterstico. La inarmonicidad
del piano provoca tambin problemas en la anacin y obliga al anador a estirar
artesanalmente las octavas.
246
11.2.2. Diferencias del contenido espectral entre las distintas notas del mismo instrumento
Las notas de un clarinete suenen todas a clarinete y las de un piano suenen todas a
piano, pero cada instrumento e incluso cada nota del mismo instrumento posee
un color propio, unos matices que le otorgan una sonoridad peculiar.
Como se explica en el captulo dedicado al sonido armnico, la mayor o menor importancia que posee cada componente dentro del conjunto es decir, su jerarqua
determina la cualidad sonora que percibimos, su color. En efecto, el contenido espectral de todas las notas del mismo instrumento no es idntico. De un instrumento a otro y de una nota a otra cambia la importancia relativa que cada
componente posee respecto al conjunto. Para observar que esto es as volveremos a los tres ejemplos sonoros que he presentado al principio y a sus respectivos
espectrogramas (guras 11.1 a 11.6). Comprobaremos que el hecho de que vare
el contenido espectral de una nota a otra dentro del mismo instrumento hace que
cambie su cualidad sonora.
Primero vamos a examinar las diferencias de sonoridad que se producen entre notas
cuya tesitura est alejada y luego las que existen entre notas muy cercanas. Por ltimo, comentar brevemente las causas de estas diferencias entre sonidos del mismo
instrumento.
a) Diferencias tmbricas entre notas pertenecientes a distintos registros del mismo instrumento
Para explicar la inuencia del registro tonal en la cualidad tmbrica de las notas emitidas por el mismo instrumento voy mostrar los que ocurre en el piano y en el violn
mediante los ejemplos sonoros de los vdeos que he presentado antes.
Empezaremos estudiando al caso del piano. En los vdeos con los dos ejemplos de
piano (los espectrogramas de las guras 11.1 a 11.4) podemos apreciar la diferencia
de sonoridad que hay entre las notas del registro medio-grave y las notas del registro
medio-agudo.
247
Atendamos a los espectrogramas de los dos ejemplos de piano en los que la escala
de color no est alterada (los de las guras 11.1 y 11.3). Podemos apreciar que la
mayor parte de las notas que pertenecen al registro medio-grave (las del primer caso)
presentan abundantes armnicos visibles, diez o incluso ms, mientras que en las
notas que pertenecen al registro medio-agudo (las del segundo caso) el nmero de
armnicos que se pueden distinguir con claridad est en torno a tres o cuatro.
Examinemos ahora los espectrogramas que nos permiten apreciar mejor la banda alta
del espectro de esos dos ejemplos de piano (el de las guras 11.2 y 11.4). Puesto que
la escala de color ahora representa como blanco todo valor de amplitud superior a
una centsima, vemos que aparecen los componentes de la banda alta, cuya amplitud
es generalmente muy reducida y que no se vean en los espectrogramas anteriores.
Podemos comprobar tambin ahora que el nmero de componentes visibles es notablemente mayor en las notas del registro medio-grave (las del espectrograma de la
gura 11.2) que en las del registro medio-agudo (las del espectrograma de la gura
11.4).
En estos dos ejemplos podemos observar que lo que vemos en los espectrogramas
coincide plenamente con lo que omos en los respectivos vdeos: mientras que las
notas del primer ejemplo suenan ms llenas, ms redondas, las del segundo tienen
una sonoridad ms clara, ms perlada. En resumen, podemos concluir que el color
de las notas del piano es muy diferente en el registro medio-grave y en el registro medio-agudo, a pesar de la proximidad que hay entre ambos registros. Las
diferencias hubieran sido mucho ms exageradas si hubiramos comparado notas del
piano de los registros extremos, el ms grave y el ms agudo, pero me ha parecido
oportuno situar los ejemplos dentro del rango habitual de la msica de piano.
Por otra parte, en estos ltimos espectrogramas podemos apreciar que el ruido, que
acompaa el ataque de la nota en todos los sonidos de piano y que es un elemento caracterstico del timbre de este instrumento, no tiene la misma importancia en las notas agudas que en las graves. Si nos jamos en el espectrograma
de la gura 11.4 (el del registro medio-agudo del piano) observamos que el inicio de
cada nota va acompaado de una serie de emborronamientos y sombreados de tendencia vertical que se diluyen al cabo de muy poco tiempo y que sealan la presencia
de ruido. Ahora bien, aunque este ruido de ataque se puede observar tambin en el
espectrograma de banda alta que corresponden al primer ejemplo del piano (el de la
248
gura 11.2), donde se dan notas del registro medio-grave, podemos comprobar que
su incidencia es claramente menor. Esa diferente presencia del ruido de ataque en
ambos registros es tambin una marca tmbrica que distingue nuestro odo.
Veamos ahora en el caso del violn cmo se aprecian las diferencias tmbricas entre
notas de distintos registros tonales, pero del mismo instrumento. Volvamos a las notas
que suenan en la primera parte del tercer ejemplo que he presentado antes (el que
corresponde a los espectrogramas de las guras 11.5 y 11.6). Hay una distancia de
casi dos octavas entre la primera y la segunda nota: primero suena la nota ms grave
de este instrumento, el sol3 , dado con la cuarta cuerda al aire, y luego el fa#5 seguido
del sol5 , dadas ambas con la primera cuerda presionada con los dedos para acortar su
longitud.
Si analizamos el contenido espectral de la nota sol3 del violn del espectrograma de
la gura 11.5, encontramos que el primer armnico es inapreciable y que el componente ms destacado es el segundo; el tercero, cuarto y quinto armnico tienen
una escasa presencia, mientras que el sexto aparece con claridad; el sptimo, octavo
y noveno armnico casi pasan desapercibidos, pero el dcimo y el undcimo se observan con bastante nitidez. Ahora bien, el contenido armnico de las notas agudas
del violn, el fa#5 y el sol5 , es totalmente distinto: en ambos casos los cuatro primeros
armnicos tienen una presencia destacada, mientras que el quinto y el sexto estn
ms atenuados.
Comprobamos que la sonoridad de los dos grupos de notas es tambin muy distinta:
el fa#5 y el sol5 tienen una cualidad sonora brillante, casi hiriente, mientras que el
sonido del sol3 es ms clido y envolvente. Entenderemos mejor la razn de la sonoridad agresiva de esas notas del registro agudo si nos jamos en el otro espectrograma
del mismo ejemplo (el de la gura 11.6). Vemos que en esas notas hay una presencia
destacada de armnicos en toda la banda superior, lo que explica esa sonoridad casi
hiriente.
As pues, hemos podido experimentar en el caso del piano y del violn que las diferencias en el contenido espectral de notas de diferentes registros dan lugar a
unas marcas tmbricas especficas.
249
Una vez que hemos examinado la diferente cualidad sonora de notas del mismo instrumento que pertenecen a regiones de la voz alejadas, vamos a ver que tambin
existen diferencias entre notas que son casi consecutivas. Estas diferencias son ms
difciles de apreciar por el odo y requieren una audicin ms atenta, capaz de hacer abstraccin de la diferente altura tonal para prestar atencin exclusivamente a la
cualidad sonora.
Comenzar con la frase de clarinete que aparece en la segunda parte del tercer ejemplo (guras 11.5 y 11.6). Las notas forman una doble pareja que distan entre s un
semitono. La primera pareja, el re3 y el la4 , han sido producidas con toda la longitud
del tubo, en el caso del re3 con todos los agujeros tapados y en el caso del la4 continuando con todos los oricios tapados excepto el portavoz (el oricio cuya apertura
provoca en el clarinete la emisin del tercer armnico, la nota que est a una distancia de octava y quinta). La otra pareja, el mib3 y el sib4 , ha sido producida de forma
similar, pero con el acortamiento del tubo sonoro.
Como ahora pretendo mostrar la diferente cualidad sonora entre notas que estn muy
prximas, no voy a analizar las diferencias de sonoridad que existen entre las notas
del registro grave del clarinete el llamado chalumeau y las del registro agudo,
el registro clarn que da nombre a este instrumento y que se producen al abrir el
portavoz. Atenderemos al diferente contenido espectral entre notas que pertenecen
al mismo registro, es decir, el re3 y mib3 , por un lado, y el la4 y sib4 , por otro.
Un rasgo caracterstico del sonido del clarinete es la prevalencia de los armnicos
impares. Fijmonos, en primer lugar, en el mib3 , la tercera de las notas emitidas por
el clarinete. En efecto, en el espectrograma se observan casi exclusivamente los armnicos impares: primero, tercero, quinto, etc, hasta el undcimo, y acaso parece
vislumbrarse un poco el duodcimo. En el caso del re3 , la primera nota, observamos,
as mismo, la prevalencia de los armnicos impares, pero comprobamos que tambin
hay una cierta presencia de los armnicos pares: el sexto, el octavo, el dcimo y el
duodcimo. Como hemos experimentado hasta ahora, estas diferencias en la importancia de los componentes armnicos deberan ser percibidas por nuestro odo como
diferencias en la cualidad sonora.
250
Figura 11.8: Vdeo con el espectrograma de dos notas de clarinete con diferente contenido espectral.
Ahora podemos distinguir bastante bien la diferente cualidad sonora de ambas notas.
En efecto, omos dos notas de igual altura tonal, pero con distintos matices de color:
mientras la primera tiene un sonido ms bien profundo y lleno, la segunda resulta
ms spera.
Si comparamos el contenido espectral de las otras dos notas del clarinete, las del registro agudo, vemos que en el la4 aparece el segundo armnico, un armnico par
que est ausente en el sib4 . Tambin observamos que el componente ms destacado
del la4 es el fundamental, mientras que en el sib4 es el tercer armnico el que tiene
ms relevancia. Estas diferencias en el contenido espectral explican las distintas
cualidades sonoras que omos en dos notas consecutivas.
Veamos por ltimo cmo dos notas prximas de piano tienen una cualidad sonora diferente. Volvamos al vdeo de la gura 11.3, donde se repite una pequea frase ligada
251
formada por notas predominantemente seguidas. Todas las notas de la primera frase
han sido dadas con el mismo toque, por lo que las diferencias de sonoridad que apreciemos se tienen que deber necesariamente a la propia constitucin del instrumento.
Prestemos atencin en el espectrograma, por ejemplo, a la jerarqua armnica de las
tres primeras notas: la4 , si4 y do5 . Observamos que en el la4 , aunque en el momento
del ataque el armnico primero es el que tiene una presencia mayor, el que termina
prevaleciendo es el segundo; en el si4 el armnico ms importante es el tercero; y en
el do5 el que posee mayor importancia es claramente el primer armnico. As pues,
la diferente jerarqua en el contenido espectral de estas tres notas es la razn de que
oigamos una cualidad sonora distinta en cada una de ellas.
Esta diferente cualidad sonora de cada una de las notas del mismo piano explica,
por ejemplo, que algunos pianistas que no poseen odo absoluto es decir, que no
son capaces de identicar una nota aislada de un instrumento cualquiera sin una
referencia previa puedan reconocer sin ninguna dicultad cualquiera de las notas
del instrumento en el que habitualmente interpretan.
El estudio detenido de las causas fsicas que explican las diferencias de sonoridad entre
las notas de un instrumento excede el objetivo de este captulo. Pero si atendemos a
lo que sucede, por ejemplo, en el caso del violn, podemos hacernos una idea, aunque
sea vaga, de las razones de esa peculiaridad tmbrica. Por un lado, todo violinista sabe
que no suena lo mismo una nota tocada en una cuerda que esa misma nota tocada en
otra cuerda del mismo instrumento. Ocurre que cada cuerda del violn vibra de forma
distinta, debido a su grosor, a su constitucin material, por estar o no entorchada,
etc. Y esa diferente vibracin produce un contenido espectral distinto del de las otras
cuerdas del mismo instrumento y, por lo tanto, una sonoridad particular.
Por otro lado, hay que tener en cuenta que no omos directamente la vibracin de
la cuerda de un violn, la cual solo podra poner en movimiento una pequesima
cantidad de aire; lo que realmente omos son las vibraciones que la cuerda provoca
en la caja de resonancia del instrumento a travs del puente, vibraciones que ya son
capaces de mover una cantidad de aire suciente como para que llegue con claridad
a nuestro odo. Pero esa caja de resonancia tiene sus frecuencias propias de vibracin,
252
por lo que resonar ms o menos con los diferentes componentes de la cuerda que
vibra, amplicando unos y disminuyendo otros, de manera que transforma el contenido espectral original de la cuerda, alterando su jerarqua y dejando en el sonido
su propia huella. Las resonancias destacadas de la caja constituyen una caracterstica
fundamental de los instrumentos musicales y reciben el nombre de formantes. Igual
que en el caso del habla estos formantes son decisivos a la hora de distinguir las diferentes vocales, en el caso de los instrumentos inuyen de una manera muy marcada
en el color de las notas que emiten.
Un ejemplo interesante de la inuencia de estos formantes que denen las frecuencias
de resonancia de cada instrumento nos la ofrece el vibrato del violn sobre la nota sol5
en el vdeo de la gura 11.5, en torno al segundo 4. Si observamos el vibrato sobre
el sol5 vemos que, adems de la ondulacin caracterstica que muestra la variacin de
la frecuencia, en la parte ms baja del tercer armnico hay como unos puntos de luz
casi blanca. Estos puntos indican que en esos instantes se ha producido una amplitud
mxima en ese componente. Dicho de otra manera, el vibrato no slo ha ocasionado
una variacin de la frecuencia, sino que tambin ha oscilado el color del sonido, es
decir, la mayor o menor prevalencia de unos u otros componentes.
Esta oscilacin de la cualidad sonora que posee el vibrato del violn es un rasgo caracterstico de este instrumento. Si lo comparamos con el vibrato menos profundo
del clarinete que podemos observar tambin en el mismo espectrograma (o incluso
mejor en el de banda alta de la gura 11.6) sobre las notas la4 , en torno al segundo
8, y sib4 , en torno al segundo 13, vemos que en el clarinete no hay cambio de color, sino que la cualidad sonora se mantiene igual a lo largo de toda la emisin de
la nota y solo oscila la altura tonal. La explicacin fsica de este rasgo caracterstico
del violn reside en las propiedades de su caja de resonancia, que responde de diferente manera a componentes frecuenciales muy prximos. En este caso, el tercer
armnico resuena mucho ms cuando el vibrato est en la parte baja de su oscilacin, debido a que en ese instante su frecuencia coincidir con la frecuencia de una
de las mltiples resonancias naturales de la caja del violn. En consecuencia, el tercer
armnico adquiere en esos momentos una funcin predominante en la jerarqua de
los componentes.
253
255
En el ejemplo de violn de las guras 11.5 y 11.6 hemos visto que la diferente sonoridad que omos entre el sol3 , por un lado, y el fa#5 y sol5 , por otro, se debe a la
diferencia entre las cuerdas y al hecho de haber sido tocadas al aire o pulsadas con el
dedo. Pero otra parte importante de la cualidad sonora peculiar de cada una de estas
notas viene dada por la mayor presin o velocidad con la que el arco ha frotado la
cuerda en las notas superiores. Dicho de otra forma, el alto contenido armnico en
la zona superior del espectro es consecuencia de esa mayor energa del arco que ha
empleado el violinista.
Por otra parte, en algunos instrumentos el intrprete puede modicar el contenido
espectral durante la emisin del sonido. El violinista y el clarinetista, por ejemplo, tienen que aportar energa constantemente para mantener el sonido, por lo que pueden
cambiar el volumen sonoro a voluntad. As mismo, dentro de unos mrgenes limitados por la naturaleza del instrumento, pueden tambin alterar su contenido espectral
a lo largo del tiempo que dura la emisin de la nota. Por poner un ejemplo sencillo,
en la segunda parte de los vdeos y espectrogramas de las guras 11.5 y 11.6 podemos
apreciar que cuando el clarinetista apaga lentamente la segunda nota de cada pareja,
el la4 y el sib4 , se produce una desaparicin progresiva de los armnicos superiores.
El clarinete sigue, as pues, tambin la norma general de que el incremento en el
volumen va unido a un incremento en el nmero y prevalencia de los armnicos
superiores, y viceversa, como ocurre en este ejemplo.
Realmente cuando escuchamos un sonido nuestra imaginacin tiende a reconstruir
la accin que lo ha producido. sta es precisamente una de las formas en las que se
transmite la informacin emotiva del intrprete. Sin necesidad de verlo tocar, nosotros, al or su msica, imaginamos el gesto que est haciendo en el instrumento.
Por ejemplo, en el teclado de un piano omos-vemos al intrprete acariciando las
teclas en los pasajes delicados, golpeando sin piedad en los fortsimos-staccato, pasando
con ligereza en los pasajes pianos y ligados, etc. Esta gestualidad nos llega a travs
de las marcas de los sonidos. Entre esas marcas est habitualmente el hecho de que
el nmero de armnicos superiores crezca en funcin de la energa con la que se ha
atacado la tecla, ataque y energa que cambian constantemente a lo largo de una interpretacin. Hablando en general, el nmero y la importancia de los armnicos no
es una caracterstica ja propia del sonido de un instrumento, ni siquiera de la misma
256
nota del mismo instrumento, sino que en buena medida depende de la voluntad del
intrprete.
257
258
En ambas guras vemos que en un tono azul grisceo, que se funde casi con el azul del
fondo de la grca, se ha trazado la seal de audio, es decir, la forma de la vibracin de
ese sonido. En esta ocasin la representacin de la seal de audio no permite apreciar
los detalles de la vibracin, como suceda en las representaciones de los osciloscopios
simulados que hemos visto en los captulos anteriores, sino que es el resultado de
haber hecho un gran zoom negativo sobre ella, como si observramos la seal desde
muy lejos. Se ha perdido todo el detalle y solamente se aprecia el aspecto global de
la evolucin de la amplitud, que es precisamente lo que nos interesa ahora.
La lnea que se destaca en amarillo representa la envolvente de amplitud, la evolucin
de la amplitud a lo largo del tiempo. Podemos comprobar que, en lneas generales,
la grca de la envolvente sigue bastante de cerca la forma de la seal de audio comprimida, como si quisiera envolverla. Si escuchamos con atencin las notas del vdeo
de la gura 11.7 mientras vemos estas grcas de sus envolventes de amplitud, reconoceremos con facilidad que reejan lo que omos.
En las dos grcas observamos al principio y al nal unas pequesimas oscilaciones
de la lnea amarilla, que corresponden al ruido de ambiente presente en el lugar en el
que se han hecho las grabaciones (ambas han sido grabaciones domsticas realizadas
con un micrfono de nivel medio del tipo USB para ordenador).
Fijmonos primero en la grca de la envolvente del piano (gura 11.9). Podramos
distinguir tres partes en esta grca amarilla. La primera parte, que corresponde al
ataque inicial, tiene un carcter muy abrupto, pues crece bruscamente desde el inicio
de la nota hasta el pico mximo, que en esta grca se sita aproximadamente en el
segundo 1,3. Ahora bien, su crecimiento no es uniforme. Comienza con una lnea
casi vertical que se queda en torno a un valor de 0,18, sin llegar todava a su valor
mximo, una lnea que reeja un cambio casi instantneo y que se corresponde con
el ruido inicial que acompaa al ataque en la nota de piano, como hemos visto al
analizar el contenido espectral. Luego la grca sigue todava creciendo de forma
rpida, pero ya no tan abrupta, hasta alcanzar en el segundo 1,3 el pico mximo, es
decir, una amplitud de aproximadamente 0,34. La segunda parte de la grca comienza en este pico mximo, cuando se inicia un declive con bastante pendiente,
y dura aproximadamente hasta el segundo 2. Y en la tercera parte, que comienza
en este segundo 2, la grca contina descendiendo, pero ahora de una forma mucho ms lenta y mantenida, hasta que se produce el levantamiento de la tecla, lo que
259
ocurre poco antes del segundo 5. Esta evolucin de la envolvente de amplitud es caracterstica de las notas del piano. En esencia consiste en un ataque muy rpido y una
doble amortiguacin, la primera relativamente rpida y la segunda muy prolongada
y sostenida.
Si comparamos la grca de la envolvente de amplitud del piano con la de la envolvente de la nota de violn (gura 11.10) nos damos cuenta de que las diferencias
son muy grandes. El ataque es ahora suave y va creciendo poco a poco; las formas
generales son poco marcadas y ms bien redondeadas; la evolucin de la amplitud
general se aproxima aqu a una forma circular; y, lo que viene a ser el rasgo ms
caracterstico de la envolvente de amplitud del violn, la lnea general de la evolucin est constantemente llena de alteraciones, que se corresponden con apreciables
oscilaciones en el volumen sonoro de la nota, resultado de la variacin de la presin
del arco sobre la cuerda.
Pero creo que conviene insistir un poco ms en la importancia que tiene para nuestra percepcin de la cualidad tmbrica de un sonido su envolvente de amplitud. En
efecto, si modicamos articialmente la evolucin de la amplitud general de un sonido, el cambio en el timbre que percibiremos ser enorme. Voy a poner un ejemplo
muy sencillo que servir para comprobar la decisiva inuencia que posee la evolucin de la amplitud general en la determinacin del timbre. Este ejemplo, de paso,
nos ayudar tambin a entender cmo nuestra percepcin auditiva est congurada
para colaborar con el resto de los sistemas sensoriales en la tarea de captar la evolucin
de la realidad externa. He grabado una pequea frase de piano con ocho notas que
alternan los valores de blancas y negras formando un ritmo troqueo constante. Las
notas son las siguientes: re4 , do4 , mi4 , fa4 , sol4 , la4 , re4 , la3 . Con ayuda de un editor
de audio he copiado la seal y la he pegado a continuacin, pero ahora invirtiendo
el orden temporal, es decir, haciendo que la seal vaya de atrs a adelante, con lo
que el resultado que he obtenido ha sido una seal formada por dos partes iguales
simtricas.
260
Como se puede comprobar en el vdeo, las dos partes son totalmente idnticas, a
excepcin de que la segunda es una repeticin de la primera, pero en el orden inverso.
Esto resulta tambin claro si nos jamos en el orden y en el ritmo de las notas. El ritmo
en la segunda parte es una sucesin de yambos, es decir, de negras y blancas. Las notas
son las mismas que las de la primera parte, pero en orden inverso: la3 , re4 , la4 , sol4 , fa4 ,
mi4 , do4 , re4 . El nmero de componentes armnicos de cada nota y su importancia
relativa tiene que ser, por lo tanto, el mismo y, sin embargo, el sonido es totalmente
distinto. Cuando escuchamos la segunda parte del vdeo nunca pensaramos que est
sonando un piano. Tal vez, si acaso, una armnica o algn instrumento similar. Para
facilitar este efecto he elegido a propsito una frase musical que al ser oda en orden
inverso tenga un cierto aire de meloda de pelcula del oeste. Pongo a continuacin
la grca de las correspondientes envolventes de amplitud.
261
Figura 11.12: Envolvente de amplitud de las melodas, directa y retrgrada, del vdeo de la gura
11.11.
262
263
11.4. Conclusin
El timbre del sonido es como su sello particular. En este captulo hemos podido
observar que el conjunto de marcas tmbricas dejan su huella principalmente en el
contenido espectral de cada sonido musical y en sus envolventes de frecuencia y amplitud. Estas marcas diferencian la sonoridad caracterstica de un tipo de instrumento
de la de otro, la de cada instrumento particular, la de las distintas notas que emite cada
instrumento, la propia de cada instrumentista e incluso la que posee la misma nota emitida en el mismo instrumento por el mismo instrumentista en los diferentes
momentos de su interpretacin.
265
Captulo 12
Fisiologa de la audicin
12.1.
Introduccin
266
12.2.
El odo humano
Nuestro odo est formado por tres partes anatmica y funcionalmente diferentes:
el odo externo, el odo medio y el odo interno. Veamos un dibujo esquemtico de
las partes del odo. Es una adaptacin de la Figura 1 del captulo 2 de Structure and
function del curso Hearing, en Open Learn (The Open University).
a) El odo externo
En el odo externo el pabelln auditivo concentra, a modo de trompa, las ondas sonoras del exterior y las encauza a travs del canal auditivo externo hasta
el tmpano, la membrana que separa el odo externo del odo medio. El canal
auditivo externo mide aproximadamente 25 mm de longitud y 7 mm de dimetro.
267
La membrana timpnica tiene una forma ligeramente cnica y se mueve hacia dentro y hacia fuera siguiendo las variaciones de la presin del aire que constituyen la
vibracin sonora y que le llegan por el canal auditivo.
b) El odo medio
El odo medio es una cmara llena de aire en cuyo interior se halla una cadena de
huesecillos u osculos, llamados por su forma martillo, yunque y estribo, que sirven
para transmitir las vibraciones sonoras desde la membrana timpnica hasta el odo
interno. Para lograrlo, el mango del martillo est unido al tmpano, mientras que la
base del estribo est en contacto con la membrana de la ventana oval, a travs de
la cual penetran las vibraciones sonoras en la cclea, que es la parte del odo interno
dedicada a la audicin.
La principal funcin del odo medio es posibilitar el incremento de presin
necesario para que la energa de la vibracin sonora del aire exterior se transmita eficazmente a los fluidos acuosos que llenan el odo interno. En efecto,
puesto que el agua tiene mayor impedancia acstica que el aire (es decir, presenta
mucha ms resistencia a la transmisin de la vibracin), si no hubiera un mecanismo
que aumentara la presin de las vibraciones, una gran parte de la energa sonora sera
absorbida o reejada por los uidos acuosos de la cclea, tal como sucede si tratamos
de hablar a una persona que est sumergida en el agua.
Este incremento de la presin se logra principalmente porque la supercie del tmpano que vibra (la membrana que est en contacto con el aire exterior) es unas 17
veces mayor que la supercie de la membrana de la ventana oval (la que est en contacto con el lquido acuoso que hay en el interior de la cclea). De esta manera se
consigue un aumento de presin de unas 17 veces. Adems, la accin de palanca que
ejerce la cadena de huesecillos del odo medio tambin contribuye al incremento de
presin. En su posicin habitual, los osculos pueden aumentar 1,3 veces aproximadamente la presin que llega hasta la ventana oval. As pues, la accin combinada de
ambos mecanismos puede lograr un aumento de presin de unas 22 veces, con lo
que la membrana de la ventana oval va a ser ya capaz de transmitir de forma ecaz
la vibracin sonora a los lquidos que estn en el interior de la cclea.
268
Otra funcin muy importante del odo medio es la proteccin del delicado odo
interno frente a sobrepresiones que podran daarlo. Cuando la intensidad sonora
excede los niveles de tolerancia se activa un mecanismo reejo mediante el cual dos
pequeos msculos que actan sobre el martillo y sobre el estribo (no incluidos en
el dibujo) pueden bloquear la articulacin de los osculos, limitando en gran medida
la transmisin de las vibraciones.
El odo medio comunica con el exterior a travs de la trompa de Eustaquio, un conducto de unos 4 mm de longitud que termina en la regin nasofarngea. La trompa
de Eustaquio, que habitualmente est cerrada, se abre con la deglucin y con el bostezo. Tiene la nalidad de igualar la presin de aire del odo medio con la del exterior
y as permitir que el tmpano pueda vibrar libremente en su posicin idnea.
c) El odo interno
El odo interno, tambin llamado laberinto, est formado por una estructura sea
hueca situada en el hueso temporal y consta de diferentes partes delimitadas por conguraciones seas y membranosas. Su interior est lleno de dos lquidos acuosos: la
perilinfa en las zonas exteriores, que estn en contacto con el hueso; y la endolinfa en
las interiores, rodeadas por membranas. Mientras que la composicin de la perilinfa
es similar a la de otros uidos extracelulares del cuerpo humano, como el lquido cefalorraqudeo, la endolinfa es una sustancia especca del odo interno y se caracteriza
por contener una cantidad muy elevada de iones positivos de potasio (K+).
El odo interno cumple dos funciones. Por un lado, sirve para contribuir al mantenimiento del equilibrio corporal, lo cual se realiza mediante el sistema vestibular o
laberinto posterior, que est formado por el vestbulo y los tres canales semicirculares. Por otro lado, y en lo que a la actividad acstica se reere, el odo interno sirve
para transformar las vibraciones mecnicas que provienen del odo medio en
impulsos elctricos, lo que se produce en el laberinto anterior, llamado por su
forma cclea o caracol. Ambas tareas son llevadas a cabo por clulas sensoriales pilosas capaces de trasformar los movimientos mecnicos en variaciones de la tensin
elctrica, las cuales son codicadas y transmitidas al cerebro por los nervios vestibular
y coclear respectivamente. Estos dos nervios se juntan inmediatamente despus del
269
odo y forman el nervio vestibulococlear, tambin llamado VIII par craneal, el cual
conduce la informacin procedente del odo interno al cerebro.
Puesto que en este captulo nos estamos ocupando de la siologa de la audicin,
dejaremos de lado lo que concierne al sistema vestibular, el encargado del equilibrio,
para dedicarnos a la parte del odo interno en el que se producen los fenmenos
relacionados con la audicin, es decir, a la cclea.
Pero antes de examinar con ms detalle la estructura de la cclea, veamos un vdeo
didctico que nos explica muy bien el mecanismo mediante el cual las ondas sonoras
procedentes del exterior son transmitidas por las distintas partes del odo y transformadas en impulsos elctricos, fenmeno que se denomina transduccin auditiva.
El vdeo Auditory Transduction ha sido creado por Brandon Pletsch y los subttulos
en espaol se deben a Hermes Carreo y Oscar Guillermo.
270
12.3.
La cclea
La cclea es la parte del odo interno donde se transforma la informacin auditiva que contiene la vibracin sonora en impulsos nerviosos. En primer lugar,
la cclea acta como un analizador mecnico de frecuencias, descomponiendo mediante resonancias la forma de la vibracin sonora en sus componentes sinusoidales;
en segundo lugar, transforma esa informacin frecuencial en seales elctricas; y,
nalmente, codica todo ese conjunto de datos en impulsos nerviosos que son transmitidos al cerebro.
Para estudiar cmo est constituida la cclea voy a ir presentando una serie de ilustraciones en las que podremos observarla desde diferentes perspectivas. En ellas iremos
avanzando desde una visin general a otra cada vez ms detallada. En todas las ilustraciones he utilizado los mismos colores para representar las distintas partes de la
cclea: en color beige estn las partes seas; en color rojizo, las membranosas; en
color amarillo, las nerviosas; en azul, las reas ocupadas por la perilinfa; y en verde,
las ocupadas por la endolinfa.
271
273
donda, los uidos acuosos del interior de la cclea, al ser incompresibles, no podran
vibrar.
El canal medio o conducto coclear es un contenedor de endolinfa. A pesar de la nura
de la membrana de Reissner, su impermeabilidad impide a la endolinfa mezclarse con
la perilinfa del canal vestibular. Por su diferente constitucin electroqumica, entre
la endolinfa y la perilinfa existe una diferencia de potencial de unos 80 mV, y gracias
a esa diferencia de potencial la cclea puede realizar la transduccin de las seales
mecnicas en seales elctricas, como veremos ms adelante.
Hay que tener en cuenta, por otra parte que, debido a su nura, la membrana de
Reissner no supone obstculo alguno a la vibracin de los uidos. De esta forma, en
lo que concierne a la funcin de la cclea como analizador mecnico de espectro, el
canal vestibular y el canal medio se comportan como si se tratara de un solo canal, el
canal superior del dibujo de la izquierda de la gura 12.3.
En la gura 12.4 podemos ver tambin, ligeramente dibujadas, las bras nerviosas que
salen de la cclea y que forman el nervio coclear. Este nervio ser el encargado de
llevar al cerebro la informacin auditiva convertida ya en impulsos nerviosos.
Pero para apreciar mejor cmo se organizan estas estructuras nerviosas, es oportuno
observar el interior de la cclea desde otra perspectiva. Veamos una ilustracin que
representa las dos vueltas y medio de la cclea cortada transversalmente. En ella, para
mostrar las estructuras nerviosas, se ha prescindido de la pared sea interior y de la
lmina espiral. Los autores son Guy Rebillard y Rmy Pujol y la ilustracin procede
de Voyage au centre de laudition.
275
Podemos distinguir en cada vuelta de la cclea los tres canales que hay en su interior
el canal vestibular, el canal medio y el canal timpnico, cada uno de ellos pintado
en el color que representa el uido acuoso que contiene. Pero lo ms interesante de
esta ilustracin es que nos permite apreciar cmo es el ganglio espiral, el cual se
forma de la reunin de las bras nerviosas que se conectan al epitelio sensorial de la
membrana basilar, el llamado rgano de Corti. Vemos que el ganglio espiral recorre
prcticamente toda la longitud de la cclea y tambin que de l surge el haz nervioso
que forma el nervio coclear.
Y para concluir el estudio de la organizacin interna de la cclea, examinemos sus
partes con un poco ms de detalle. Veamos un dibujo esquemtico de las reas que se
podran distinguir en un corte transversal de una sola vuelta de la cclea. Est basada
en un dibujo muy difundido en internet. Lo he modicado para hacer coincidir los
colores con los del resto de las ilustraciones de la cclea y, sobre todo, para delimitar
276
con precisin las zonas ocupadas por la endolinfa de aquellas otras ocupadas por la
perilinfa, particularmente en la zona inferior del canal medio.
En la gura reconocemos las partes de la cclea que hemos visto en los dibujos anteriores, si bien ahora, al ser representadas desde otra perspectiva, podemos apreciarlas
mejor. As, reconocemos la cclea sea, con la pared exterior, el modiolo y la lmina
espiral que sale de l; la membrana basilar, de la cual ahora podemos ver con claridad
que completa la divisin del interior del cilindro coclear en los dos canales principales; los tres canales llenos de lquido del interior de la cclea, el canal vestibular,
el canal medio y el canal timpnico; el ligamento espiral, que sujeta la membrana
basilar a la pared exterior de la cclea; y el ganglio espiral, situado en el interior del
modiolo, que va a converger en el nervio coclear.
Pero adems, esta ilustracin nos muestra otras estructuras que hasta ahora o no haban sido representadas o no lo haban sido con suciente claridad. Vemos la estra
vascular, el epitelio que recubre el ligamento espiral y que cierra el recinto del canal
medio por la parte externa, encargndose de dotar de abundantes iones positivos de
potasio a la endolinfa de ese canal. Tambin podemos ver con claridad el epitelio
sensorial situado sobre la membrana basilar, el rgano de Corti, en el que pode277
mos identicar las clulas pilosas externas e internas, as como los espacios llenos de
perilinfa que hay entre ellas. As mismo, ahora est dibujada la membrana tectorial, una estructura gelatinosa contra la que chocan las vellosidades las clulas pilosas
del rgano de Corti. Y, nalmente, podemos apreciar las terminaciones nerviosas
que conectan las clulas sensoriales del rgano de Corti y que forman el ganglio
espiral.
Por otra parte, este dibujo es muy til para determinar con precisin qu zonas del
interior de la cclea estn ocupadas por perilinfa y cules otras estn ocupadas por la
endolinfa. En efecto, ahora podemos apreciar con ms exactitud los lmites del canal
medio, en el que est encerrado el uido endolinftico, lo cual es muy importante
para entender cmo se realiza la transduccin mecano-elctrica.
Podemos distinguir sin dicultad los lmites del canal medio por la zona superior
y por la exterior: por un lado, la membrana de Reissner separa por arriba el canal
medio del canal vestibular y, por el otro, la estra vascular delimita el canal medio
por la zona exterior de la cclea.
Y ahora podemos delimitar con ms claridad los bordes inferiores del canal medio, en
la zona donde est ubicada la membrana basilar y el rgano de Corti. En el dibujo este
lmite inferior aparece delineado en color rojo. En lneas generales, se puede decir
que ese lmite est formado por la parte superior del epitelio sensorial que recubre la
membrana basilar. Pero, si nos jamos un poco, podemos apreciar que no es todo el
epitelio sensorial, sino que las vellosidades de las clulas sensitivas del rgano de Corti
estn dentro del canal medio y, por lo tanto, estn baadas en endolinfa, mientras
que el cuerpo de esas clulas ya permanece fuera del canal medio, en contacto directo
o indirecto con la perilinfa que proviene del canal timpnico. Pero esto lo veremos
con ms detalle a continuacin, al estudiar el rgano de Corti.
sern codicadas por las neuronas del ganglio espiral y convertidas en impulsos nerviosos. Para entender cmo se produce la transduccin mecano-elctrica es conveniente estudiar antes, con un poco de detenimiento, cmo est organizado el rgano
de Corti.
Veamos una ilustracin de un pequeo segmento del rgano de Corti, creada por
Robert Jackler y Christine Gralapp, que se encuentra en la pgina Ear Anatomy,
Stanford School of Medicine. He cambiado algunos colores para adecuarlos a los ilustraciones anteriores.
A la izquierda del dibujo tendramos el modiolo, como podemos deducir por la presencia del ganglio espiral, mientras que a la derecha se encontrara la pared exterior
de la cclea.
En el rgano de Corti hay dos tipos de clulas: las clulas sensitivas, llamadas por
su aspecto clulas pilosas, y otros tipos de clulas que les sirven de aislamiento, de
soporte y de relleno.
279
Las clulas pilosas son las clulas mediante las cuales propiamente se realiza la
transduccin mecano-elctrica. En todo el epitelio sensorial hay unas 15.000 o
16.000 clulas pilosas. La longitud media de estas clulas es de unos 50 micrmetros.
Su dimetro es inferior a los 10 micrmetros. De la membrana de la parte superior
de cada una de las clulas pilosas salen una especie de vellosidades rgidas, llamados
estereocilios. En cada clula pilosa hay aproximadamente un centenar de estereocilios, unidos entre s y agrupados en un ramillete. Los estereocilios de cada ramillete
tienen distinta longitud (los ms largos miden unos 6 micrmetros) y estn ordenados por su altura, de tal modo que el estereocilio ms largo est hacia el exterior de
la cclea y los ms cortos hacia el interior.
Por su forma y su funcin se distinguen dos tipos de clulas pilosas: las clulas pilosas
internas, ms prximas a la pared interna de la cclea, y las clulas pilosas externas,
ms prximas a la pared externa.
Las clulas pilosas internas son clulas exclusivamente sensoriales. Tienen una forma
bulbosa, similar a la de una pera, y se disponen en una sola hilera. En total hay unas
3.500 clulas pilosas internas dispuestas a lo largo de la membrana basilar. Su tamao
no presenta muchas variaciones. Estn rodeadas por otras clulas no sensoriales que
les sirven de soporte y de aislamiento. Hacia la parte exterior se encuentran las clulas
pilares que forman el tnel de Corti, un hueco que est lleno de perilinfa.
Por su parte, las clulas pilosas externas tienen un cuerpo cilndrico. Se agrupan en
las de tres o de cuatro clulas y tambin se disponen en hileras. Hay unas 12.000
clulas pilosas externas, distribuidas a lo largo de la membrana basilar. Las clulas
pilosas externas estn ancladas en otras clulas que las soportan. Entre ellas hay espacios llenos de perilinfa, los llamados espacios de Nuel. La altura de las clulas pilosas
externas vara de la zona basal a la apical de la cclea: en la zona basal miden unos 30
micrmetros, mientras que en la apical llegan a tener hasta los 70 micrmetros.
La caracterstica de las clulas pilosas externas es que son clulas contrctiles: no solamente captan mediante sus estereocilios el estmulo mecnico que reciben, sino que
tambin reaccionan, acortndose o alargndose, en respuesta al estmulo recibido,
de modo que retroalimentan el movimiento mecnico de la membrana basilar en
la localizacin exacta en la que se hallan. Con ello logran que la resonancia en ese
punto sea ms acentuada.
280
Tanto en las clulas pilosas externas como en las internas, los estereocilios estn separados del cuerpo de la clula a la que pertenecen por una especie de pletina. Esta
pletina est unida estrechamente a la supercie de las clulas que bordean cada clula
sensorial y que la aslan de sus vecinas. Mediante esa estrecha unin se crea una lmina
impermeabilizadora capaz de cerrar el canal medio por su parte inferior, impidiendo
a la endolinfa de ese conducto mezclarse con la perilinfa que llena las lagunas que
existen entre las clulas del rgano de Corti, es decir, el tnel de Corti y los espacios
de Nuel. De estas manera, mientras que los estereocilios de cada clula pilosa
estn dentro del canal medio y estn baados por el lquido endolinftico de
ste, el cuerpo de la clula est en contacto directo o indirecto con la perilinfa
que procede del canal timpnico.
Como veremos cuando estudiemos la transduccin mecano-elctrica, esta lmina
impermeable hace que los iones positivos de Potasio (k+) que abundan en la endolinfa solamente puedan pasar al otro lado a travs del cuerpo de las clulas pilosas.
La exin de los estereocilios al chocar contra la membrana tectorial, como consecuencia de la vibracin de la membrana basilar, abrir o cerrar los canales inicos,
permitiendo o impidiendo el establecimiento de una corriente elctrica entre la endolinfa y la perilinfa.
Para hacernos una idea de la disposicin de los estereocilios de las clulas pilosas
internas y externas, veamos una fotografa realizada con microscopio electrnico de
la parte superior del rgano de Corti, en la que se ha retirado la membrana tectorial.
Est obtenida de la galera de imgenes de Yale Medical Cell Biology.
281
Figura 12.8: Fotografa de las clulas pilosas del rgano de Corti vistas desde arriba.
Vemos la parte superior de las clulas pilosas y de las clulas de soporte, as como
la pelcula impermeabilizadora que forman. Observamos que los estereocilios de las
clulas sensoriales internas estn dispuestos casi en hilera. Y tambin que los estereocilios de las clulas externas tienen una forma casi de uve doble. Aunque ni en
esta fotografa ni en la ilustracin anterior estn representados, los estereocilios estn unidos entre s por unos enlaces exibles situados aproximadamente en el medio
de su longitud, mediante los cuales estn agrupados unos con otros formando un
ramillete.
Adems, los estereocilios poseen en su extremo superior unas pequeas aberturas
cuya puerta, por as decir, est unida mediante un microlamento protenico, el tip
link, al estereocilio contiguo ms alto. Estas aberturas son los canales inicos y se
abren o se cierran en funcin de la mayor o menor separacin de los estereocilios
segn el momento de la oscilacin, permitiendo o impidiendo el paso de los iones
positivos al interior del cuerpo celular.
282
Figura 12.9: Ilustracin de la apertura y cierre de los canales inicos de los estereocilios.
Se podra considerar que las clulas pilosas son los micrfonos de nuestro sistema auditivo. De algn modo, podramos decir que nuestro membrana basilar est equipada
con unos 15.000 micrfonos colocados sobre ella, capaces de recoger y transformar
en seales elctricas las vibraciones de cada una de las localizaciones de esta membrana. Las clulas pilosas internas estn dispuestas de tal modo que forman algo as
como una hilera de 3.500 micrfonos situados sobre la membrana basilar y son la
principal y ms directa fuente de informacin del movimiento de oscilacin de cada
zona de esta membrana. Teniendo en cuenta que la longitud media de la membrana basilar es de 35 mm, la separacin entre las clulas pilosas internas es de unas 10
micras, una separacin ligeramente superior al dimetro de cada clula. As pues, podramos decir que cada 10 micras una clula sensorial recoge, a modo de micrfono,
el movimiento resonante de esa zona de la membrana basilar.
283
284
En esta ilustracin podemos apreciar el ganglio coclear, con las dendritas que salen
de l a lo largo de todo su recorrido espiral y los axones que, reunidos en forma de
haz, constituyen el nervio coclear.
Las neuronas aferentes del ganglio espiral codican las seales elctricas recibidas
de las clulas sensoriales del rgano de Corti y transmiten la informacin hacia los
ncleos auditivos del cerebro, en concreto, hacia el ncleo coclear. Por su parte,
las neuronas eferentes reciben informacin desde el complejo olivar superior y la
comunican a las clulas pilosas.
En el ganglio espiral existen dos tipos de neuronas que se diferencian por su morfologa y su constitucin: las llamadas neuronas cocleares de tipo I, bipolares, caracterizadas por tener una dendrita y un axn, ambos gruesos y mielinizados; y las
neuronas cocleares de tipo II, unipolares, con un axn delgado y sin mielina dividido en dos ramas, una de las cuales cumple la funcin de dendrita. Debido a ello,
mientras las neuronas de tipo I dan lugar a bras de conduccin rpida, las bras de
las neuronas de tipo II son ms lentas. El 90 % de las neuronas del ganglio espiral son
del tipo I. Las neuronas eferentes son todas del tipo II, pero las aferentes pueden ser
tanto del tipo I como del tipo II.
La inervacin de las clulas pilosas del rgano de Corti es diferente segn sean internas o externas.
Cada clula pilosa interna es inervada por entre 10 y 15 bras nerviosas aferentes
del tipo I. Adems, cada una de estas bras est conectada solamente con una clula
sensorial interna. De esa manera, para transmitir la informacin que ha generado,
cada clula sensorial interna dispone de entre 10 15 lneas de comunicacin independientes y rpidas. Esto explica el gran porcentaje de neuronas del tipo I que hay
en el ganglio espiral.
Por su parte, cada clula pilosa externa se conecta a unas 6 bras nerviosas aferentes.
Pero la clula tiene que compartir cada bra con unas 10 20 clulas pilosas externas
ms y, adems, las bras nerviosas aferentes son ahora neuronas del tipo II. Por ello la
informacin que transmiten las bras nerviosas que proceden de las clulas sensoriales
externas es mucho ms lenta y mucho menos especializada que la enviada por las
bras nerviosas que proceden de las clulas sensoriales internas.
285
Tanto las clulas pilosas externas como las internas tienen conexiones con neuronas
eferentes, todas ellas del tipo II. En las clulas pilosas internas la conexin no se establece directamente con la clula sensorial, sino con alguna bra nerviosa a la que
est unida. En ese caso la nalidad de estas bras eferentes parece ser el control de las
sinapsis aferentes. En las clulas pilosas externas, que son contrctiles, parece que la
funcin de las neuronas eferentes es el control de su motilidad.
Veamos un sencillo esquema de las conexiones de las clulas sensoriales del rgano
de Corti con las neuronas del ganglio espiral donde se procesa la informacin auditiva.
286
12.4.
El anlisis espectral es la primera de las tres tareas que debe realizar la cclea
para transformar en impulsos nerviosos la informacin sonora contenida en
la vibracin mecnica. Para llevar a cabo este trabajo la cclea cuenta con la membrana basilar y con los uidos acuosos que llenan sus canales.
Este anlisis da lugar a que la informacin frecuencial que contiene la seal en el
tiempo se traduzca en informacin espacial, dando como resultado una organizacin
tonotpica de la membrana basilar. En cierto sentido, el comportamiento de la cclea
como analizador mecnico de frecuencias se asemeja al del piano imaginario de miles
de cuerdas utilizado para explicar la descomposicin espectral en el captulo Anlisis
espectral de los sonidos musicales.
En ambos casos, la deteccin de los componentes frecuenciales que constituyen la vibracin sonora se logra mediante un sistema mecnico de resonancias: en el caso del
piano ideal entran en resonancia las cuerdas que estn anadas a la frecuencia de los
componentes sinusoidales presentes en el sonido analizado; en el caso de la cclea
resuenan aquellas pequeas secciones de la membrana basilar cuyas frecuencias naturales de vibracin coinciden con las de los componentes de la onda
sonora que penetra en el canal vestibular por la ventana oval.
Ahora bien, a diferencia de las cuerdas del piano, la membrana basilar es un continuo.
Su frecuencia de resonancia en cada punto a lo largo de su longitud (la anacin de
ese punto, por decirlo as) depende tanto de la elasticidad de la membrana en esa
localizacin concreta, como de su distancia respecto a la ventana oval. As mismo,
las frecuencias de resonancia de la membrana basilar no se distribuyen linealmente
como en nuestro piano ideal, sino logartmicamente. De hecho, si tomamos como
inicio la zona apical de la membrana basilar, cada 3,5 mm aproximadamente se dobla
la frecuencia, es decir, se aumenta una octava.
rigidez variable pueda resonar en diferentes localizaciones en funcin de los componentes frecuenciales de la seal de entrada? Recordemos que, en lo que concierne a la
transmisin de la vibracin mecnica, el canal vestibular y el canal medio funcionan
como si se tratara de uno solo, ya que la membrana de Reissner, debido a su nura, no supone obstculo alguno a la transmisin de las vibraciones entre los uidos
acuosos.
Mi exposicin va a seguir el planteamiento propuesto por Jan Schnupp, Israel Nelken y Andrew King en su libro Auditory Neuroscience, Making Sense of Sound (The
MIT Press, 2011), segn el cual la vibracin sonora se propaga por el uido del canal superior y pasa al canal inferior a travs de la membrana basilar justamente en
aquellas localizaciones cuya frecuencia natural de vibracin coincide con la de los
componentes frecuenciales presentes en el sonido analizado.
Veamos, as pues, las razones por las que la membrana basilar resuena en distintas
localizaciones segn la frecuencia de la vibracin que recibe.
Como todo movimiento ondulatorio, la vibracin sonora tiende a buscar el camino
ms fcil, aqul que presenta un obstculo menor. En la cclea, la transmisin de la
onda desde el canal superior al inferior se ve afectada por dos fuerzas cuyos gradientes
van en sentido contrario. Por un lado, la rigidez de la membrana basilar disminuye
conforme se aleja de la ventana oval ofreciendo menos resistencia a la vibracin. Por
otro, la inercia de los lquidos que llenan los canales es mayor conforme la zona est
ms alejada de la ventana oval, pues la cantidad de lquido que la vibracin tendr
que mover ser mayor.
As mismo, el obstculo que supone la inercia depende de la frecuencia de la vibracin: cuanto mayor sea la frecuencia, ms difcil le resultar a la vibracin mover
los lquidos que llenan los canales de la cclea. Para entender esto ltimo nos basta
recurrir a una sencilla experiencia: si tratamos de desplazar en vaivn el lquido de
una botella a medio llenar comprobaremos que, conforme ms rpido lo queramos
hacer oscilar, ms nos costar.
Por todo ello, para una frecuencia determinada de la onda vibratoria, el punto en el que la inercia de los fluidos y la rigidez de la membrana basilar se
compensan ser el punto en el que sta se deformar ms, oscilando en re-
288
En el vdeo podemos observar que las vibraciones que penetran en el cilindro pasan
del canal superior al inferior por una u otra zona en funcin de su frecuencia, haciendo resonar la membrana en diferentes localizaciones, a excepcin del primer caso
donde la transmisin de la vibracin se realiza por la abertura del nal que simula el
helicotrema, de modo que la membrana no se ve afectada.
Al estar el vdeo muy ralentizado, podemos apreciar cmo la vibracin introducida
a travs de la ventana elstica superior se compensa mediante la ventana elstica inferior. Vemos que cada vez que, como consecuencia del movimiento vibratorio, la
ventana superior penetra en el cilindro, el aumento de la presin que se crea en su
interior hace que la ventana inferior se mueva hacia fuera; y, a la inversa, cada vez que
la ventana superior sale hacia fuera, la ventana inferior se mueve hacia dentro.
El inicio del vdeo muestra una situacin en la que la frecuencia de la vibracin real
estara por debajo del rango de los sonidos audibles, es decir, sera menor de 20 Hz.
290
Dado que se trata de una frecuencia muy baja, el obstculo que supone la inercia
del lquido es escaso, por lo que el camino elegido por la vibracin para pasar del
conducto superior al inferior es la abertura del nal. En esta situacin la membrana
no sufre ninguna deformacin y, por lo tanto, tampoco hay ninguna percepcin de
sonido.
El segundo caso ilustra lo que sucede con una frecuencia vibratoria de 220 Hz. Ahora la inercia del uido ya supone cierto obstculo, un obstculo lo sucientemente
importante como para que la vibracin preera vencer la rigidez de la membrana
elstica y pasar a travs de ella al canal inferior. Esa zona en la que vemos oscilar la
membrana es la que posee una frecuencia natural de resonancia de 220 Hz, resultado de la conjuncin de las dos fuerzas que crecen o decrecen en sentido opuesto: la
inercia de los uidos en esa zona para esa frecuencia y la rigidez de la membrana en
ese punto.
El tercer caso se corresponde con un sonido dos octavas ms agudo, de 880 Hz, por lo
que el movimiento oscilatorio que vemos en el vdeo es cuatro veces ms rpido que
en el caso anterior. Ahora la oscilacin es tan rpida que el obstculo que presenta la
inercia del lquido es mucho ms importante, por lo que a la onda vibratoria le resulta
ms ecaz pasar al canal inferior en una localizacin ms prxima a la entrada de la
vibracin, pues, a pesar de que en ese punto la membrana presenta ya una resistencia
bastante grande, la cantidad de lquido que debe mover es mucho menor.
El cuarto caso presenta la situacin correspondiente a un sonido de 3.520 Hz, es
decir, un sonido cuya frecuencia de vibracin es cuatro veces mayor que la del caso
anterior y diecisis veces mayor que el segundo caso del vdeo. Al ser la vibracin
muy rpida, el obstculo derivado de la inercia de los lquidos es muy grande, por
lo que la onda vibratoria elige un punto donde tiene que mover menos cantidad de
lquido, aunque ahora la resistencia de la membrana sea ya muy grande.
Este vdeo nos ayuda a entender por qu cada localizacin de la membrana basilar a
lo largo de su longitud posee una frecuencia natural de resonancia, lo cual explica la
capacidad de la cclea para transformar los componentes sinusoidales presentes en la
vibracin en localizaciones espaciales. A esto es a lo que llamamos la tonotopa de la
membrana basilar.
291
292
Para ilustrar la manera en la que vibra la membrana basilar ante un sonido formado
por varios componentes sinusoidales, he creado un vdeo en el que se simula su movimiento oscilatorio ante una onda vibratoria que se va haciendo progresivamente ms
compleja. Se trata de la nota la3 , de 220 Hz, en la que se van introduciendo nuevos
componentes armnicos, con amplitudes y fases diferentes. El vdeo est ralentizado
y el sonido es solamente ilustrativo.
294
12.5.
Esta transformacin se realiza gracias a dos tareas complementarias que llevan a cabo
las clulas sensoriales del rgano de Corti: en primer lugar, se produce una transformacin exclusivamente mecnica, mediante la cual los movimientos ascendentes y
descendentes de una localizacin concreta de la membrana basilar se convierten en
movimientos transversales de los estereocilios de las clulas pilosas que estn sobre
ella; en segundo lugar, se origina la transformacin elctrica propiamente dicha, mediante la cual los movimientos de izquierda y derecha de los estereocilios sirven para
modular la corriente que circula a travs del cuerpo de las clulas sensoriales.
La primera parte, la conversin de los desplazamientos verticales de la membrana basilar en movimientos transversales de los estereocilios, se produce como consecuencia de la fuerza ejercida sobre ellos por la membrana tectorial.
Esta membrana pivota ligeramente arriba y abajo, pero su pivote es independiente
de la membrana basilar, de modo que cuando sta asciende, la membrana tectorial
crea una fuerza de cizalladura sobre los estereocilios que los obliga a inclinarse hacia
el lado externo de la cclea es decir, hacia el estereocilio ms alto, mientras que
cuando la membrana basilar desciende, los hace inclinarse hacia el lado interno. Veamos un diagrama esquemtico de este movimiento en una imagen obtenida del curso
Hearing en OpenLearn Works, de la que solamente he traducido los nombres.
296
El dibujo presenta las tres situaciones caractersticas del movimiento derivado de las
fuerzas de cizalladura en una sola clula pilosa.
En la posicin de equilibrio (b), vemos que la zona de la membrana basilar donde
se encuentra la clula sensorial mantiene su horizontalidad y que los estereocilios de
esa clula estn en vertical.
Cuando esa zona de la membrana basilar asciende (a), desplazndose hacia el canal
vestibular, los estereocilios empujan hacia arriba la membrana tectorial, que, al pivotar ligeramente en el sentido contrario al de las agujas del reloj, se desplaza un poco
tambin hacia arriba, con lo que provoca una fuerza de cizalladura sobre los estereocilios que los hace inclinarse en el sentido del estereocilio ms alto, es decir, hacia
el exterior de la cclea (en el dibujo hacia la derecha). Aunque en el esquema no se
puede apreciar, hay que pensar que, al inclinarse en este sentido los estereocilios, se
separan ligeramente unos de otros, de modo que los lamentos que unen la puerta
del canal inico de cada uno de ellos con su correspondiente estereocilio adyacente
se abre ms.
Cuando esa zona de la membrana basilar desciende (c), la membrana tectorial pivota ligeramente en el sentido de las agujas del reloj, desplazndose hacia abajo, de
modo que ahora la fuerza de cizalladura sobre los estereocilios se produce en sentido
inverso, es decir, hacia el interior de la cclea (en el dibujo hacia la izquierda). Entonces los estereocilios se juntan unos con otros, cerrndose las puertas de los canales
inicos.
As pues, estas deecciones de los estereocilios siguen el ritmo y la amplitud de los
movimientos oscilatorios de la membrana basilar donde se asientan. Hay que tener
en cuenta que, conforme mayor sea la amplitud del movimiento de ascenso o descenso de una determinada localizacin de la membrana basilar, mayor ser tambin
la amplitud del movimiento transversal de los estereocilios. Por otra parte, aunque
este desplazamiento de los estereocilios es muy pequeo (en un sonido muy intenso
el desplazamiento mximo en la parte superior del estereocilio ms alto es del orden 100 nm), basta que se desplacen menos de un nanmetro para que percibamos
sonido.
La segunda parte, la transformacin elctrica a partir del movimiento transversal de los estereocilios, es posible gracias a la diferencia de potencial (de
297
unos 80 mV) que existe entre el lquido endolinftico del canal medio, muy
rico en iones positivos de potasio (K+), y el lquido perilinftico del canal timpnico, cuyo contenido en iones positivos de potasio es muy escaso. Debido a
que los estereocilios de las clulas pilosas estn dentro de la endolinfa, mientras que
el cuerpo de estas clulas est en contacto directo o indirecto con la perilinfa y, al
ser totalmente impermeable la lmina que separa ambos lquidos, la nica forma en
la que se puede establecer una corriente elctrica entre estos uidos es a travs del
interior de las clulas sensoriales, cuyos canales inicos abiertos en sus estereocilios
permiten que penetre un mayor o menor nmero de iones positivos.
En efecto, los iones positivos de la endolinfa son atrados por la mayor negatividad
del cuerpo de las clulas pilosas. Cuando el cuerpo celular recibe estos iones se positiviza y, en consecuencia, los iones positivos son atrados por las cargas negativas del
lquido semejante a la perilinfa que llena las lagunas del rgano de Corti. Finalmente, los iones positivos son asimilados por la perilinfa del canal timpnico, debido a la
permeabilidad de la membrana basilar al paso de los iones. Y mientras tanto, la estra
vascular se encarga de suministrar constantemente nuevos iones positivos de potasio
a la endolinfa, reponiendo los que va perdiendo.
Pero esa corriente elctrica no es constante, sino que vara segn el movimiento de los
estereocilios de las clulas sensoriales. El movimiento de vaivn de los estereocilios,
producido como consecuencia de la oscilacin de la localizacin de la membrana
basilar donde se encuentra la clula sensorial, abre ms o menos los canales inicos,
como acabamos de ver, modulando de ese modo el paso de la corriente desde la
endolinfa a la perilinfa.
Cuando esa localizacin de la membrana basilar est en una posicin de equilibrio
y los estereocilios estn en vertical, el ujo de iones de potasio que penetra a travs
de sus canales inicos es reducido, con lo que la corriente elctrica que atraviese el
cuerpo de la clula ser moderada. Cuando esa zona asciende hacia el canal vestibular, abrindose ms los canales inicos en los estereocilios, penetran por ellos muchos
ms iones de potasio positivos, aumentando la corriente elctrica. Y, por el contrario, cuando esa zona de la membrana basilar se desplaza hacia abajo y se tienden a
cerrar los canales inicos, penetran por ellos una cantidad ms reducida de iones positivos, quedando entonces el ujo de la corriente muy atenuado. De este modo, el
298
12.6.
sistema auditivo se comportan, como todas las dems neuronas, de una manera que
podramos calicar de discontinua o digital. En efecto, las neuronas siempre siguen
la ley de todo o nada, es decir, disparan un impulso o no lo disparan.
Los medios de los que dispone cada una de las neuronas del sistema auditivo para codicar la informacin que proporcionan las clulas sensoriales y transmitirla a otras
neuronas ubicadas en sus respectivos centros de proceso son bsicamente dos: el nmero de veces que cada neurona se excita por segundo, es decir, su tasa de disparos;
y el momento preciso en el que lo hace, es decir, la circunstancia concreta en la que
dispara el impulso, como por ejemplo, cuando la oscilacin de la corriente elctrica
en la clula sensorial con la que est conectada alcanza un mximo.
Junto a estos medios individuales, hay otro muy importante en el que estn implicadas todo el conjunto de neuronas que se comunican con las clulas sensoriales del
rgano de Corti: la disposicin tonotpica de las neuronas del sistema auditivo. En
efecto, estas neuronas mantienen a lo largo de su recorrido, hasta llegar a la capa
exterior del cortex auditivo, la organizacin tonotpica que posee la membrana basilar. Dicho de otra manera, cada neurona va asociada a una determinada frecuencia
de resonancia de la membrana basilar y esta asociacin se mantiene de neurona en
neurona, dando lugar a una especie de mapa de frecuencias en la zona del cerebro
especializada en la audicin.
Puesto que cada clula pilosa interna transmite su informacin a unas 10 o 12 bras
nerviosas aferentes que son exclusivas para esa clula concreta, la tonotopa por s
sola podra explicar nuestra capacidad para apreciar los componentes frecuenciales.
Teniendo en cuenta que el rango de frecuencias que distinguimos los humanos va
desde 20 Hz a 20.000 Hz (es decir, prcticamente 10 octavas 120 semitonos) y puesto que contamos con una hilera de aproximadamente 3.500 clulas pilosas internas,
podemos deducir que la separacin intervlica entre las clulas sensoriales internas
se corresponde aproximadamente a unas tres centsimas de semitono (120/3500 =
0,0343). Este margen viene a coincidir con las mediciones psicoacsticas sobre nuestra capacidad para apreciar las diferencias mnimas entre intervalos sucesivos.
Adems, la informacin sobre la frecuencia tambin lleva consigo la informacin
sobre la amplitud. Una parte importante de esas 10 12 neuronas que hacen sinapsis
con cada clula pilosa interna transmiten la informacin de la amplitud mediante
300
301
Hay que tener en cuenta que, aunque como consecuencia del derrame espectral las
clulas pilosas internas vecinas tambin oscilarn, lo harn no a su frecuencia natural
de resonancia, sino a la del componente frecuencial presente en la seal de entrada.
Por ello, el tren de impulsos enviado por las neuronas vecinas especializadas en este
mecanismo de bloqueo de fase tendr siempre la misma frecuencia, lo que explicara,
entre otras cosas, la percepcin de los batidos de segundo orden.
Por otra parte, en lo que concierne a la codicacin de la amplitud, contamos con
dos medios complementarios. El primero es la mayor o menor extensin de la
zona afectada por el derrame espectral, es decir, el nmero de clulas vecinas
estimuladas por la presencia de un determinado componente frecuencial presente en la seal de entrada. Conforme mayor sea la amplitud del componente,
mayor nmero de clulas vecinas se vern afectadas. El segundo es que la informacin que transmite la neurona aferente conectada a un pequeo grupo de
clulas pilosas externas contribuye a codificar la mayor o menor amplitud de la
pequea zona en la que estn ubicadas. Dado que estas clulas pilosas externas son
las encargadas de retroalimentar los movimientos resonantes de la membrana basilar,
la mayor o menor tasa de disparos de la neurona a la que estn conectadas contribuir
a informar sobre la mayor o menor amplitud de la oscilacin en esa zona.
As pues, la forma en la que se realiza la codicacin de la informacin auditiva explica que, a pesar de que nuestra audicin es esencialmente frecuencial (es decir, procede
del anlisis espectral realizado mecnicamente por la membrana basilar), haya tanta
coincidencia, como hemos podido comprobar en otros captulos, entre lo que vemos
en la forma temporal de la vibracin sonora y el sonido que percibimos.
Todo este conjunto de mecanismos neuronales que sirven para codicar las seales
analgicas provenientes de las clulas pilosas del rgano de Corti suministran la base
sobre la cual se realizan complejos algoritmos de procesamiento de la informacin
auditiva, a lo largo de los diversos centros cerebrales por los que atraviesa. Pero el
funcionamiento preciso de todo ello no es todava sucientemente conocido y se
escapa del objetivo de este captulo.
302
12.7.
Conclusin
303
Captulo 13
Psicoacstica musical
13.1.
Introduccin
A pesar de que la informacin musical llega hasta nuestros odos totalmente mezclada
en la vibracin mecnica sobre la que viaja, nuestro sistema auditivo es capaz de
determinar los sonidos musicales que contiene. De la misma manera que en la visin
tenemos la capacidad de distinguir la gura del fondo e individualizar los mltiples
objetos que ocupan la escena visual, en la percepcin auditiva podemos aislar cada
una de las entidades sonoras del entorno acstico en el que estn inmersas, as como
recuperar la unidad de los sonidos musicales dados por la voz o los instrumentos, los
cuales, debido a la propia siologa de nuestro odo, han sido previamente divididos
en sus componentes frecuenciales.
Este captulo estudia la capacidad de nuestra percepcin para reconocer objetos musicales en un contexto sonoro y para reconstruir su unidad. Si bien en cierta medida
esta capacidad est condicionada por las caractersticas siolgicas de nuestra audicin, el proceso mediante el cual percibimos el sonido musical es de orden superior.
En efecto, nuestra percepcin musical es el resultado de la manera en la que nuestro cerebro procesa los impulsos nerviosos producidos por la cclea al codicar la
vibracin sonora. A da de hoy slo tenemos ideas de carcter muy general sobre
el proceso que realizan los diferentes ncleos cerebrales relacionados con la audicin. Pero, aunque conociramos con detenimiento los mecanismos neurolgicos
304
mediante los cuales se procesa la informacin acstica en el cerebro, lo que nos interesara siempre conocer es la imagen psicoacstica que construimos a partir de esa
informacin.
Examinaremos, en primer lugar, las limitaciones para la percepcin del objeto sonoro que vienen dadas por la siologa de nuestro odo, tales como las que afectan a la
identicacin de un sonido simple en un ambiente ruidoso o, dicho de otra manera, el enmascaramiento al que da lugar la coexistencia de diversos componentes en
zonas prximas del espectro. En segundo lugar, veremos que nuestra capacidad para
recuperar la unidad del objeto sonoro musical viene dada por nuestra predisposicin
natural para el reconocimiento del patrn armnico. Y en tercer lugar estudiaremos
cmo el reconocimiento de un patrn armnico, o de una estructura que lo recuerde, explica la percepcin de la consonancia entre sonidos armnicos compuestos y
cmo tambin en las consonancias musicales podemos seguir percibiendo la individualidad de cada uno de los sonidos que forman parte de la mezcla gracias a nuestra
capacidad para detectar las marcas tmbricas que los individualizan.
Vamos a dejar al margen las cuestiones relacionadas con la percepcin de la espacialidad y con todo lo que se deriva del hecho de que tengamos dos odos. La capacidad
de nuestro sistema auditivo para localizar la procedencia de la fuente sonora es un
tema de inters para la tecnologa musical, en especial para lograr una reproduccin
sonora que nos devuelva el sonido de la forma ms natural posible. Pero, dado que
esta cuestin no es determinante para comprender los fundamentos psicoacsticos
del lenguaje musical, vamos a prescindir en este captulo de ella.
Finalmente, hay que tener en cuenta que la capacidad de reconocimiento del sonido
musical depende, en buena medida, del entrenamiento del oyente, es decir, de su
mayor o menor dedicacin a la msica.
13.2.
Debido a la constitucin de nuestro sistema auditivo, la presencia de otros componentes frecuenciales en zonas del espectro prximas al sonido que tratamos de perci305
bir nos diculta o incluso nos impide su reconocimiento. Como ya pudimos ver en
el captulo dedicado a la interferencia entre sonidos simples, nuestro odo requiere
que exista cierta separacin entre los componentes frecuenciales para poder
distinguir ntidamente los sonidos. La anchura de la banda crtica es la distancia mnima que sirve de lmite para que dos componentes sinusoidales puedan
ser distinguidos con claridad. Esta distancia mnima est en relacin directa con
el hecho de que la resonancia de la membrana basilar en un punto afecta tambin
a los puntos que estn prximos, tal como hemos visto en el captulo dedicado a la
siologa de la audicin.
Para permitir experimentar este fenmeno voy a presentar, a modo de ejemplo, un
vdeo con el caso ms sencillo de distincin de fondo y gura en el paisaje sonoro: la
percepcin de un sonido simple en un entorno ruidoso. Ahora nos interesa solamente
comprobar que la percepcin de un sonido simple con una determinada intensidad
mantenida se facilita de forma signicativa cuando se encuentra en una zona libre de
otros componentes. Este caso, realizado con sonidos de laboratorio, nos servir para
entender la manera en la que nuestra percepcin est condicionada por la siologa
de nuestro odo. Para evitar que los otros componentes puedan provocar efectos
de batidos e interferencias que obstaculizaran nuestra percepcin del fenmeno, he
elegido como elemento perturbador una banda de ruido. En este ejemplo el fondo
consiste precisamente en esta banda de ruido, mientras que la gura est formada por
dos sonidos simples que a lo largo de todo el vdeo mantienen la misma amplitud y,
por lo tanto, la misma intensidad. Se trata de un la4 (440 Hz) cuya amplitud es de
0,005 (en unidades arbitrarias normalizadas como siempre entre 0 y 1) y de un la6
(1.760 Hz) cuya amplitud es de 0,3. La diferencia entre la intensidad de ambas seales
es de 36 dB. La banda de ruido se extiende durante los seis primeros segundos unos
1.000 Hz arriba y abajo del componente agudo. A partir del segundo 6 se abre un
hueco en esta banda de ruido que va progresivamente separndose del componente
agudo.
Al disminuir la anchura de banda del ruido, disminuye tambin su intensidad. Si el
objetivo de este vdeo fuera ser utilizado como un test para ver en qu condiciones es
posible identicar un componente es decir, medir la anchura de la banda crtica,
la intensidad del ruido debera haberse mantenido constante, aunque disminuyera la
anchura de su banda. Pero nuestro objetivo ahora es simplemente ilustrar la diferencia
306
entre la percepcin que se produce en una banda ocupada y en otra sin ocupar. Que
la intensidad del ruido no se adapte a la disminucin de su anchura de banda nos
facilita esta tarea.
Figura 13.1: Vdeo que permite experimentar la percepcin de sonidos simples en presencia de ruido.
Durante los primeros 6 segundos del vdeo podemos comprobar que el componente
de 440 Hz (la nota la4 que en el espectrograma corresponde a la lnea horizontal inferior que casi no se ve) se oye con toda claridad, acompaada de un ruido de carcter
ms agudo; sin embargo, no somos capaces de or el componente de 1.760 Hz, a
pesar de que en el espectrograma lo podemos ver sin dicultad en medio de la banda
ruidosa. A partir del segundo 6 el carcter del ruido va cambiando: en el espectrograma vemos que en medio del ruido va abrindose un hueco que se va ensanchando
progresivamente para dejar libre las bandas prximas al componente de 1.760 Hz.
Por ello el componente de 440 Hz siguen oyndose con el mismo volumen sonoro
que antes, pero hasta pasado el segundo 10 no empezamos a percibir ligeramente
el componente agudo de 1.760 Hz, el corrrespondiente a la nota la6 (dependiendo
del volumen de nuestro reproductor y de la atencin que prestemos a su aparicin
podemos orlo un poco antes o un poco despus). Nuestra percepcin del componente agudo llega a ser cada vez ms clara, hasta que, en un momento determinado,
307
13.3.
308
La identificacin de un sonido armnico no se debe a que percibamos su periodicidad en la forma de la vibracin resultante, sino a que la estructura de sus
componentes frecuenciales se corresponde con una estructura armnica. As
pues, el reconocimiento del patrn armnico se produce por los intentos de nuestro
sistema perceptivo por organizar en estructuras armnicas todo el material sonoro
que recibe.
En lneas generales, el reconocimiento del patrn armnico obedece a las leyes de la
Gestalt en su aplicacin al material sonoro. Vamos a ver a continuacin que La ley
de la completitud de la gura explica cmo reconstruimos un patrn armnico en un
sonido en el que hay muchos huecos dentro de la serie armnica. Voy a presentar
dos vdeos que nos van a permitir observar la manera en la que nuestra percepcin
auditiva organiza el material sonoro segn la serie armnica, completando los huecos
que el sonido musical pudiera tener. En el primero mostrar cmo reconocemos
una nota musical en un sonido en el que faltan un buen nmero de los primeros
componentes. En el segundo veremos que seguimos identicando la misma nota
incluso cuando se le quitan sus primeros armnicos.
En el primer vdeo tenemos el espectrograma de la nota ms grave de un sonido
de piano, el la0 , cuya frecuencia es de 27,5 Hz. El sonido procede de una grabacin domstica realizada con un piano vertical, donde el nmero e importancia de
los componentes graves es considerablemente menor que en un piano de gran cola.
El espectrograma ha sido realizado con una ventana de larga duracin (0,2 segundos), pues aqu nos interesa observar la frecuencia de los componentes, ms que su
evolucin temporal.
309
Todos reconoceramos aqu un la0 , la nota ms grave del piano, con lo que, en principio, deberamos ver en el espectrograma su primer armnico, es decir, el componente
de 27,5 Hz. Sin embargo, el armnico ms grave que aparece en el espectrograma
es el cuarto, con una frecuencia de 110 Hz; luego el quinto, el sexto y el sptimo,
separados aproximadamente por una distancia de 27,5 Hz. El octavo armnico no
est, pero desde el noveno hasta el decimosexto vemos que son todos consecutivos.
Si seguimos hacia la parte alta del espectro observamos una considerable cantidad de
componentes armnicos, todos ellos separados entre s, salvo en los casos en los que
hay huecos, por una distancia de 27,5 Hz o un poco ms (hay que tener en cuenta
que la ligera inarmonicidad del piano hace que se vayan separando progresivamente).
En cuanto a la energa que aporta cada armnico al sonido y que afecta a su timbre,
podemos apreciar que el duodcimo es el que tiene mayor amplitud y, por lo tanto,
mayor intensidad.
Ahora bien, a pesar de las importantes lagunas en la estructura armnica de esta nota
la0 e incluso de la ausencia de los primeros armnicos, nuestro sistema perceptivo ha
apreciado varios rasgos que le han ayudado en la tarea de su reconstruccin y en la
recuperacin de la unidad de esa nota la0 . Ha reconocido que la distancia que ms
abunda entre los diferentes componentes es de unos 27,5 Hz. Tambin ha apreciado
los rasgos comunes que hay entre los componentes de la nota la0 : coincidencia en el
310
tiempo del ataque, forma similar en el ataque, horizontalidad, atenuacin exponencial, etc. Y a partir de todo ello ha reconocido que todos esos componentes forman
parte de la nota de piano la0 , con independencia de que sepamos nombrarla o no.
Gracias a esta capacidad de nuestra percepcin auditiva podemos or las notas graves
de cualquier obra musical en un reproductor de msica de no muy buena calidad, a
pesar de que, en lneas generales, stos no acostumbran a reproducir frecuencias ms
bajas de 50 Hz.
En el segundo vdeo he elegido un ejemplo diferente. Empezamos oyendo la nota
la2 del piano (110 Hz), pero en los sucesivos ataques le he ido quitando de forma articial diferentes componentes de la estructura armnica. La duracin de la ventana
de anlisis ha sido en esta ocasin 0,08 segundos, pues he pensado que, al estar los
componentes ms separados, esta duracin era ya suciente para apreciar con claridad la estructura armnica (insisto en que ahora nos interesa ver los componentes
frecuenciales de la estructura, no su evolucin temporal).
Figura 13.3: Vdeo con el espectrograma de la nota la2 de un piano a la que se le quitan progresivamente sucesivos armnicos.
Podemos comprobar que, aunque vayan cambiando las cualidades sonoras de la nota,
en las tres ocasiones escuchamos un la2 . En el primer caso, tenemos la nota emiti311
13.4.
El concepto de consonancia del que voy a ocuparme a continuacin no tiene nada que ver con la consonancia entendida como eufona, es decir, con el hecho de
que dos o ms sonidos emitidos simultneamente nos suenen mejor o peor. Hay
disonancias claramente eufnicas. Por poner un ejemplo, en mi opinin, el acorde
de sptima disminuida suena deliciosamente bien y es un autntico paradigma de
la disonancia. Por otra parte, no voy a tratar aqu de las convenciones que en cada momento histrico del desarrollo de nuestro lenguaje musical han considerado
consonantes o disonantes determinados intervalos musicales, o unas u otras agrupaciones de sonidos. Por ejemplo, en unos contextos armnicos el intervalo de cuarta
es tratado como disonante y exige resolucin, mientras que en otros es considerado
como consonante.
Aqu vamos a atender a los fundamentos acsticos y psicoacsticos de la consonancia entre sonidos musicales, es decir, tanto lo que concierne a su propia constitucin
fsica como a las caractersticas de nuestra percepcin musical que permiten que reconozcamos la consonancia, con total independencia de los criterios estticos de cada
312
313
314
Figura 13.4: Vdeo con el espectrograma de una nota de piano y otra de violn al unsono.
Oigamos cmo suenan y paremos luego el vdeo en cualquier momento para ver
el espectrograma. La columna izquierda del espectrograma corresponde al sol3 del
piano, la columna del medio al sol3 del violn y la de la derecha a la emisin simultnea de ambas notas. En el espectrograma observamos que el nmero y la estructura
de los componentes frecuenciales de las dos notas simultneas (los armnicos de la
columna de la derecha) vienen a ser el resultado de la combinacin de los componentes de las dos notas emitidas por separado (los de las columnas de la izquierda y
del medio). Enseguida entendemos por qu las dos notas se han mezclado tan bien.
En efecto, comprobamos que ambas notas comparten un buen nmero de sus componentes frecuenciales, lo que era de esperar al tratarse de un unsono. Observamos,
adems, que la combinacin resultante tambin posee un patrn armnico. En una
primera ojeada, y especialmente si atendemos solo a los siete primeros componentes,
podramos pensar que estamos ante un nico sonido individual, pues en la estructura
frecuencial no encontramos nada de particular diferente de la que posee un nico sonido armnico compuesto. La capacidad de nuestra percepcin musical para
reconocer el patrn armnico ha funcionado tambin aqu: ha reunicado los componentes frecuenciales y ha reconstruido una nueva unidad.
Ahora bien, la cosa no es tan sencilla. Con esto queda explicada solamente la parte
unitaria de la mezcla consonante, el hecho de que estos sonidos se mezclen bien y
315
den como resultado una nueva unidad; pero nos falta entender por qu en la mezcla
se sigue reconociendo el sonido de las dos notas, la de piano y la de violn, es decir,
por qu, a pesar de esa buena mezcla, se conservan los elementos individuales. En
efecto, si volvemos a escuchar el ejemplo, nos damos cuenta de que en la emisin
simultnea tambin podemos seguir oyendo con claridad cada una de las dos notas:
en funcin de sus propias dinmicas hay momentos en los que el piano se destaca ms
(como por ejemplo, en el ataque) y hay otros en los que es el violn el que domina
(como sucede cuando el volumen de la nota de violn se mantiene elevado mientras
la nota de piano se encuentra ya muy amortiguada).
Tendremos que jarnos con ms detenimiento en el espectrograma para entender
por qu se siguen oyendo las dos notas individuales. En muchos componentes de
la columna de la derecha (la de las dos notas simultneas) reconocemos las mismas
marcas tmbricas especcas del piano o del violn que estn en los respectivos componentes de las notas dadas por separado (las columnas izquierda y central). Por ejemplo, vemos que ese punto luminoso que destaca en el primer componente de la nota
de piano sola o esa lnea vertical que seala el ruido inicial del ataque aparecen de
nuevo en los componentes del sonido mezclado; y tambin que ese dibujo de la nota
de violn solo, que indica que se est manteniendo la amplitud sin amortiguacin, se
repite en los componentes de las dos notas mezcladas, igual que se repite el elevado
nmero de componentes armnicos superiores y su permanencia en el tiempo. Podemos concluir, as pues, que en la mezcla consonante se conservan buena parte de
los rasgos tmbricos de cada uno de los sonidos individuales que la componen, lo que
explica que percibamos una nota de piano y otra de violn dadas simultneamente y
no un nico sonido con otro timbre diferente.
Pero hay tambin otros elementos que se pueden observar en la mezcla y que no
estn en los sonidos individuales. Podramos decir que son algo as como los efectos
colaterales de la mezcla. En el armnico sexto y en otros superiores podemos observar
unas discontinuidades que en el odo se traducen en la percepcin de pequeos
batidos, las cuales son el resultado de la inarmonicidad de los componentes del
piano interactuando con la armonicidad casi total de los componentes de violn. En
efecto, la progresiva desanacin de los componentes superiores del piano choca
con la anacin casi perfecta del violn y provoca esas interferencias. Este abrirse de
los componentes frecuenciales de las notas del piano, que contribuye a mantener la
316
individualidad de cada una de las notas emitidas, llega a plasmarse en los armnicos
superiores en las dos lneas distintas y prximas que se aprecian en la columna derecha
del espectrograma.
As pues, hasta aqu hemos podido comprobar que la consonancia consiste en la combinacin de dos condiciones aparentemente opuestas. Por un lado, la posibilidad de
que dos sonidos distintos emitidos simultneamente sean reconocidos como uno solo: al compartir un buen nmero de componentes frecuenciales y al poseer un patrn
armnico, el resultado de la combinacin de dos sonidos consonantes es una nueva
entidad sonora unitaria. Y, por otro, la pervivencia en la mezcla, en esa nueva entidad sonora que ha surgido, de ciertos rasgos propios de cada uno de los sonidos
individuales, lo que impiden la disolucin total de las partes. Todo esto explica que
haya instrumentos que se amalgamen ms o menos, que empasten entre s mejor o
peor. Y tambin que la combinacin de piano y violn, en la que se mantiene muy
bien la individualidad de los sonidos, haya obtenido un amplio reconocimiento en
la literatura musical clsica.
Veamos el caso opuesto, aqul en el que las notas no se mezclan y se produce la
disonancia. Utilizo la misma combinacin de piano y violn.
Figura 13.5: Vdeo con el espectrograma de una nota de piano y otra de violn formando un intervalo
de sptima menor.
317
Comprobamos en el espectrograma que ambos sonidos no comparten apenas material sonoro. Adems, ahora no se puede distinguir en el sonido compuesto un nico
patrn armnico. Por el contrario, en este sencillo caso es perfectamente posible reconocer los dos patrones armnicos de cada nota por separado. Los dos sonidos se
producen simultneamente, pero sus componentes no se mezclan prcticamente nada. Si comparamos las columas de la izquierda (la nota del piano) y del medio (la nota
de violn) con la columna de la derecha del espectrograma (las dos notas simultneas)
podemos apreciar con claridad a qu instrumento pertenece cada componente de esta ltima columna. Tenemos en este caso dos notas que suenan perfectamente bien
al ser emitidas simultneamente, pero que no son para nada consonantes, pues no se
han mezclado en absoluto.
En resumen, la consonancia supone la mezcla de dos o ms sonidos, mientras que en
la disonancia existe solamente una reunin simultnea, pues los sonidos permanecen
sin mezclarse. Para que exista consonancia se han de producir dos condiciones: 1) que
los dos sonidos compartan buena parte de su material sonoro, es decir, que tengan
en comn la mayor parte de sus componentes; 2) que la mezcla resultante guarde un
patrn armnico.
Pero la consonancia es una categora relativa: unas mezclas son ms consonantes
que otras. Existe, por decirlo de algn modo, una cierta degradacin en los niveles
de consonancia, una creciente imperfeccin de la mezcla, desde el unsono hasta la
disonancia. Conforme las dos notas compartan mayor nmero de componentes y
conforme el patrn armnico del sonido resultante sea ms completo, sin huecos en
su estructura, mayor ser el grado de su consonancia. Lo que hace que dos notas sean
ms o menos consonantes es el grado de conmensurabilidad entre sus frecuencias:
cuanto ms prxima, ms consonante es la mezcla. La progresin es la siguiente:
unsono 1:1 (igual); octava 2:1 (doble); octava y quinta 3:1 (triple); doble octava 4:1
(cudruple); quinta 3:2 (sesquiltera); y cuarta 4:3 (sesquitercia). Ms all de estas razones la consonacia desaparece. Los nombres de los intervalos consonantes proceden
de su orden en la escala de referencia que fue ya formulada por los tericos musicales
griegos.
318
Figura 13.6: Vdeo con el espectrograma de una nota de violn y otra de clarinete formando un
intervalo de octava.
319
Los componentes de una nota que est a un intervalo de octava superior tienen todos la frecuencia doble del componente equivalente de la nota que est una octava
baja. Lo podemos vericar fcilmente al observar la estructura de los componentes correspondiente a la nota de clarinete emitida sola. Recordemos tambin que el
sonido del clarinete se caracteriza, en general, por el predominio de los armnicos
impares, como tambin podemos observar en este espectrograma. No obstante, en la
estructura de los componentes correspondiente a las dos notas emitidas simultneamente tambin vemos con claridad la presencia de un patrn armnico. En principio
podramos decir que se trata de un solo sonido armnico. El primer armnico pasa
casi totalmente desapercibido, pues tambin pasa desapercibido en la nota aislada de
violn y el clarinete no puede aadir nada, ya que su espectro no forma parte de la
composicin de esa nota que est a octava superior. Pero el resto de los componentes
s estn presentes, con mayor o menor importancia. Esa estructura armnica hace
que nuestra percepcin reconozca all una unidad sonora, un sonido armnico. El
grado de integracin de los componentes es tambin muy elevado, casi equiparable
al del unsono. Y tambin observamos ahora la permanencia de las marcas tmbricas individuales de cada uno de los sonidos. As, por ejemplo, podemos jarnos en
el predominio de los componentes impares, propio de la sonoridad del clarinete, o
en la riqueza de los armnicos superiores caracterstica de la nota de violn. Por otra
parte, surgen tambin una serie de fenmenos nuevos resultantes de la mezcla, como
la aparicin de esas intermitencias en numerosos componentes que son el resultado
de las ligeras diferencias en anacin entre los dos instrumentos, como hemos visto
al estudiar los batidos. Resumiendo, podemos decir aqu algo muy similar a lo que
dijimos acerca del unsono: se reconoce claramente un patrn armnico que explica
la fusin y se mantienen a la vez ciertas peculiaridades tmbricas que justican la permanencia de la individualidad de cada uno de los sonidos constitutivos de la mezcla.
La relacin de octava es decir, la relacin 2 a 1, que es una conmensurabilidad muy
cercana da lugar a un intervalo claramente consonante.
Veamos ahora lo que sucede en el caso de intervalos cuya conmensurabilidad no es
ya tan inmediata. Los ejemplos que voy a presentar a continuacin tienen como caracterstica comn que los sonidos que constituyen el intervalo consonante proceden
del mismo instrumento, un piano. En el primer ejemplo examinaremos lo que sucede
en un intervalo de quinta, donde la relacin entre sus frecuencias es de 3:2 (relacin
320
Figura 13.7: Vdeo con el espectrograma de dos notas de piano formando un intervalo de quinta.
322
Figura 13.8: Vdeo con el espectrograma de dos notas de piano formando un intervalo de cuarta.
Como conclusin podramos decir que para que se produzca la consonancia es necesario el reconocimiento de un patrn armnico en el sonido resultante de la mezcla,
el mismo que constituye necesariamente todo sonido musical, todo sonido que tiene
una frecuencia determinada y que es percibido por nuestro sistema cognitivo como
una nota. De ese modo percibiremos la mezcla como una unidad. Nuestro cerebro ha
aprendido a reconocer el patrn de la serie armnica (de uno u otro modo, ya sea
porque la serie armnica est presente en todos los mbitos de la naturaleza, ya porque culturalmente estamos desde nada ms nacer inmersos en la msica que ha sido
compuesta mediante la serie armnica). Por lo tanto, hay una tendencia a entender
como unicador todo aquello que tenga que ver con ese patrn de la serie armnica.
La percepcin de una mezcla de sonidos consonantes se asemeja hasta cierto punto
a la percepcin unitaria de un solo sonido armnico compuesto de componenetes
frecuenciales, pues, en tanto que se mezclan bien, percibimos como unidades aquellos sonidos cuyas frecuencias son mltiples o conmensurables prximas. Pero, a la
vez, en la percepcin de la consonancia hay un reconocimiento de la individualidad
de cada sonido, de cada voz, que la diferencia de la percepcin de un sonido compuesto, donde no se aprecia ninguna parte constituyente. Si ese reconocimiento de
la individualidad no se produce estaremos ms prximos a hablar de un sonido coral,
es decir, de un conjunto de sonidos individuales fundidos en una sola voz, la voz del
coro.
13.5.
Conclusin
En este captulo hemos estudiado cmo percibimos el sonido musical en un entorno acstico, identicndolo por sus marcas tmbricas y reconstruyendo su patrn
armnico, con los lmites que nuestro sistema auditivo tiene para distinguir componentes prximos. As mismo hemos podido experimentar que reconocemos dos
sonidos musicales como consonantes cuando su estructura armnica posee sucientes elementos en comn como para que nuestra percepcin auditiva sea capaz de
percibir una nueva estructura lo sucientemente armnica, a la vez que seguimos
reconociendo su individualidad gracias a sus marcas tmbricas.
324
Captulo 14
La voz musical
14.1.
Introduccin
Para ilustrar el concepto de voz musical y para poder entender con claridad en qu
sentido la msica surge al establecer nmeros sobre el movimiento de la voz, he elegido cuatro ejemplos que, debido a las caractersticas del instrumento y de la interpretacin, muestran una progresin clara desde el movimiento totalmente continuo
de la voz en el habla (ejemplo 1) hasta la estabilidad de las alturas tonales en el piano
(ejemplo 4).
Por otra parte, para permitir apreciar cmo es la voz en cada caso he realizado mediante Matlab un tipo de representacin grca que dibuja el movimiento de la voz,
a la que podramos llamar melograma (del griego mlos, meloda, y grmma, dibujo), y que atiende especialmente a nuestra cognicin musical. Si el espectrograma se
asemeja a la manera en la que nuestro sistema auditivo descompone el sonido, como hemos visto en el captulo dedicado a la siologa de la audicin, esta forma de
representacin va a integrar de nuevo el objeto musical armnico y va a mostrar la
evolucin de sus parmetros a lo largo del tiempo.
Como en el espectrograma, tambin en el melograma la coordenada horizontal representar el tiempo, la vertical la frecuencia (traducida ahora a altura tonal y por
ello expresada en cents) y la escala de color la mayor o menor intensidad, ahora vista
como volumen sonoro. La transformacin en altura tonal y en volumen sonoro de
la frecuencia y la intensidad utilizar la escala logartmica que vimos en el captulo
5. Tomar como punto de partida la nota la0 a la que asignar 0 cents y desde all el
nmero de cents ir incrementndose. As, por ejemplo, 1.200 cents corresponder
a la1 , 2.400 a la2 , y as sucesivamente. Para mayor claridad, a la izquierda del nmero
de cents gurar el nombre de la nota correspondiente en nuestra escala temperada.
Respecto al volumen sonoro ser el resultado de la traduccin de la intensidad sonora a decibelios, expresados utilizando la misma escala de color, habitual ya en los
espectrogramas.
Tenemos tambin que tener presente que el melograma slo representa aquellos momentos en los que la voz est constituida por sonidos armnicos, es decir, en los
que es posible denir una frecuencia y en consecuencia percibimos una altura tonal,
mientras que aquellas partes en las que domina el ruido no estn representadas, como es el caso de la mayora de las consonantes o el del ataque inicial de las notas de
piano.
326
14.2.
Dos son las razones que justican que el concepto de voz sea el fundamento de
nuestra teora musical. La primera y ms importante es que el discurrir de la voz, y
no los sonidos aislados, es la realidad ms inmediata con la que nos encontramos en la
msica. La segunda es que el modelo sobre el que se ha construido nuestro lenguaje
musical es la voz humana en el habla. En nuestra msica hablamos de voz o voces
para referirnos a las diferentes estructuras meldicas que conviven en el desarrollo de
una pieza musical, pero que mantienen su identidad y su sentido. Y se llaman voz o
voces precisamente porque su referencia es la voz humana en el habla, con toda su
expresividad, emotividad y matices retricos.
En efecto, la asignacin de voces es la forma inicial en la que organizamos el
material sonoro con la finalidad de hacerlo inteligible. Por naturaleza nuestra
percepcin busca siempre distinguir voces en medio del fondo sonoro, de la misma
manera que busca guras en las imgenes visuales. Es la manera de poner orden en el
complejo sonoro que llega a nuestros odos, de darle forma y dotarlo de signicacin.
Si prestamos atencin al ruido de trco de una carretera, por ejemplo, lo primero
que nos surgen son voces en medio del ruido: la voz de la motocicleta, la voz
del camin, etc. Organizamos cualquier material sonoro diverso en voces, es decir,
en protagonistas, en personajes.
Encontramos, as pues, que la voz lleva asociada la idea de identidad, la de individualidad. La voz posee una marca, un distintivo, lo que hoy llamamos, precisamente
por eso, un timbre, algo que le da una personalidad propia capaz de ser distinguida
en medio de otras voces o de un ruido confuso. La palabra voz nos trae a la mente
que hay un sujeto que est detrs, que hay un alguien que dice algo o, en msica,
que canta algo. Entre todas las informaciones que transmite la voz, hay una de especial relevancia: es su propio auto-identicador. La voz est diciendo constantemente
quin es, y esto lo hace de mltiples maneras, de las cuales el timbre es quizs la ms
evidente. Por ejemplo, la voz del contralto puede ascender por encima de la del tiple
y la del tiple, obviamente, descender por debajo de la del contralto, pero la voz del
contralto seguir siendo la del contralto y la del tiple la del tiple y el oyente no tiene
ningn problema, incluso aunque se mezclen unas con otras, en reconocer cada una
de esas voces.
327
En medio de una partitura, con sonidos simultneos que suben y bajan y se entrelazan en todas las direcciones, podemos distinguir el desarrollo de cada una de las
voces. No en vano cantar las voces es uno de los objetivos ms importantes de todo instrumentista, muchas veces lo que diferencia al buen intrprete del mediocre.
Por ejemplo, cualquiera que est aprendiendo a tocar el piano lo primero con lo que
se encuentra es con la dicultad de dar las notas. Solo ms tarde esas notas pasan a
formar parte de ideas musicales, y todava mucho ms tarde, y despus de mucho
esfuerzo, surge en l la capacidad de entender y de contar la multiplicidad de ideas
que laten en medio de la maraa de una partitura compleja y que se ponen de maniesto en el juego de las diferentes voces. En efecto, estas ideas habitan la partitura
de mil formas: unas veces en las voces intermedias, donde pasan casi desapercibidas; otras, perladas por notas que a veces estn distanciadas entre s por compases
enteros; otras entre los extremos de los arpegios que acompaan muchas veces a las
melodas; etc. Entonces es cuando la partitura comienza a tomar vida y deja de ser
una amalgama de sonidos incomprensibles y mecnicamente ejecutados, para pasar
a ser un conjunto de voces trabadas en el que cada una cumple su funcin y dice sus
ideas. Esto, que puede parecer propio solo de los instrumentos capaces de dar notas
simultneas como el piano, se da tambin en instrumentos tan aparentemente poco
dotados para la polifona como el violn. Cuntas veces hemos odo alabar la interpretacin de un violinista diciendo que pareca un dueto! Cmo podemos or en
un simple violn una fuga a tres voces? La msica es cosa de voces y la tarea del instrumentista es decir las voces y expresar mediante ellas emociones y sentimientos.
Algo parecido podramos haber dicho del que aprende a escuchar msica, porque
aprender a escuchar msica no es otra cosa que aprender a or voces y a distinguir las
ideas musicales que ellas van diciendo. As es como cobra su pleno sentido la emocin
de la msica.
Dejando ya los aspectos cognitivos que justican el carcter primigenio del concepto
de voz en msica, pasar ahora a explicar en qu sentido digo que la voz humana ha
sido el modelo sobre el que se ha construido nuestro sistema musical. La voz ha sido
nuestra principal herramienta de comunicacin con el mundo, en un proceso evolutivo que probablemente ha ido desde los primeros gruidos, gritos y dems ruidos
inarticulados, hasta las construcciones ms elaboradas del habla y de la msica.
328
En el habla la voz ha codicado principalmente tipos de ruidos distintos (las diferentes consonantes) y posiciones distintas de resonancias del rgano vocal (las diferentes
vocales). Mediante combinaciones de ambos elementos hemos ido adquiriendo la
capacidad de nombrar las cosas y de contar nuestras experiencias. Por ejemplo, si
decimos la frase quiero esto, estamos utilizando el ruido k para empezar, luego el
ruido r, despus la especie de silbido s, y por ltimo el ruido t. Para ayudarnos
a articular estos ruidos, especialmente aquellos de muy corta duracin, nos servimos
de unos sonidos voclicos, los cuales, a diferencia de los ruidos de las consonantes, s
poseen una altura tonal y tienen una duracin suciente. No obstante, no diferenciamos estos sonidos voclicos por su altura tonal, sino por la manera en la que los
hacemos resonar variando la posicin de nuestro aparato fonador. En este ejemplo
hemos utilizado tres conjuntos de resonancias voclicas distintas: las propias de la
i, las de la e y las de la o. No es posible explicar aqu qu son las resonancias
especcas de cada vocal, ni cmo son ni en qu consisten las articulaciones de los
sonidos que constituyen la cadena hablada; ahora nos interesa atender slo a aquellos
aspectos del habla que van a tener mayor repercusin en la msica, en concreto, la
altura tonal de los sonidos voclicos.
As pues, la voz hablada no consta slo de ruidos, sino tambin de sonidos voclicos
que, aunque se distinguen por la forma de su resonancia (los denominados formantes
propios de cada vocal) poseen una altura tonal. Pero en el habla la altura tonal en la
mayora de las lenguas no est prcticamente codicada y no lleva, por lo tanto, una
parte importante de signicacin lxica. Aunque s posee otra funcin muy importante: la altura tonal es la que organiza las palabras y las frases y, sobre todo, permite
unir a la expresin de los conceptos los matices emotivos del hablante. La altura tonal,
junto con la intensidad sonora y la duracin temporal de las slabas, constituyen los
aspectos ms importantes de lo que en general se denomina prosodia del habla.
En el caso de la msica occidental el modelo sobre el que se ha construido el lenguaje
musical ha sido la voz humana en el habla. Con esto no quiero decir que todo lenguaje musical tenga que surgir necesariamente ligado al habla, sino slo que nuestro
sistema musical lo ha hecho as: ha nacido en ntima relacin con los aspectos prosdicos del griego antiguo, tanto en lo que concierne a las alturas tonales como a las
duraciones. Los elementos de nuestro lenguaje musical (sonidos, intervalos, escalas,
tiempos, compases) son el resultado de una abstraccin de los aspectos prosdicos de
329
la voz hablada, es decir, de aquellos aspectos que, como su nombre indica, son anes
al canto (prosodia viene de d, canto), los cuales son precisamente los que llevan
en mayor medida la signicacin emotiva. Esta abstraccin ha consistido en jar numricamente las alturas tonales y las duraciones, y en establecer entre ellas un sistema
de proporciones. Con independencia de su evolucin histrica, esta abstraccin es
un proceso lgico que ha dado lugar a un sistema de codicaciones capaz de expresar
y transmitir una signicacin emotiva. As pues, la voz musical, a diferencia de
la voz del habla, es el resultado de la codificacin de las alturas tonales de los
sonidos y de sus duraciones.
14.3.
330
La declamacin es ms lenta que lo habitual en un poema y las pausas entre versos son
tambin muy exageradas, pues he pretendido principalmente mostrar con claridad
cmo discurre el movimiento de la voz hablada. Pero hemos de tener en cuenta que
la prosodia de la voz recitada ya tiene algo de musical: las palabras del poema han
sido elegidas por el poeta teniendo en cuenta su sonoridad, su entonacin y el ritmo
que se deriva de la ordenacin de los acentos (por eso se valora la musicalidad de
una poesa). As mismo, en un poema la rima establece la periodicidad del verso, sin
necesidad de interrumpir de una manera tan grande como se ha hecho aqu la cadena
hablada. Nada de esto se produce en el habla ordinaria, por lo que si hubiera elegido
un fragmento del habla comn, este tipo de formas que aqu apreciamos con claridad
quedaran algo desdibujadas.
En el espectrograma vemos claramente separados los cinco versos de la estrofa y
podemos distinguir tambin las diferentes slabas, tal como han sido pronunciadas.
Si nos jamos, por ejemplo, en el primer armnico, en el componente ms grave,
podemos tambin hacernos una idea aproximada del movimiento de la voz.
Pero un espectrograma no es la forma de representacin idnea para el movimiento de la voz, pues contiene mucha informacin que nos complica su observacin.
Ciertamente podemos apreciar que hay una relacin clara entre lo que vemos y lo
331
que omos, pero a la hora de recuperar el mensaje sonoro nuestro cerebro da un paso ms que no est recogido en el espectrograma. Como hemos visto en el mdulo
acerca de la percepcin del sonido musical, nuestra mente integra el conjunto de
armnicos para recuperar la unidad del sonido y seguir la evolucin en el tiempo
de los parmetros de ese sonido. Por eso nos viene muy bien utilizar el melograma,
una forma de representacin grca ms apropiada para el movimiento de la voz,
que reproduzca, aunque sea de manera aproximada, la evolucin de los parmetros
sonoros que realiza el intrprete y su recuperacin por parte de nuestro cerebro. En
el vdeo que presento a continuacin se muestra el melograma del primer verso de
este recitado. Al tratarse de un fragmento de escasa duracin podemos apreciar con
claridad los detalles del movimiento de la voz. Recordemos que los huecos de la grca se corresponden con los sonidos consonnticos que carecen de una altura tonal
denida.
Figura 14.2: Vdeo con el melograma de la recitacin del primer verso de la Oda a la or de Gnido
de Garcilaso de la Vega.
Pasemos ahora a analizar las caractersticas del movimiento de la voz en el habla que
se pueden observar en el espectrograma y en el melograma del recitado de estos
versos de Garcilaso, atendiendo especialmente a aquellas que poseen cierta validez
general.
332
14.4.
El siguiente ejemplo lo constituyen los seis primeros compases del Lamento de Ariadna de Claudio Monteverdi, compositor representativo de la nueva corriente musical
que en la frontera de los siglos XVI y XVII intenta recuperar la msica griega antigua y, en especial, el teatro musical griego. Podemos observar los rasgos de este
intento en el carcter homfono de esta nueva forma de hacer msica, caracterizada
por una voz sola acompaada de un bajo continuo que lleva el soporte armnico y
por el cromatismo intenso que intenta imitar los gneros cromtico y enarmnico
que se atribuan a la tragedia griega. La razn principal por la que he elegido este
fragmento es por su proximidad a la prosodia del habla. En efecto, se trata de voz
cantada, pero, al ser un lamento, es casi un recitativo: el tempo es lento, y el ritmo y
la modulacin de la voz son muy exibles. Veamos primero la partitura y luego un
espectrograma del fragmento entero y un melograma en el que podremos apreciar
el detalle del movimiento de la voz de la segunda frase.
Figura 14.3: Partitura de los compases iniciales del Lamento de Ariadna de Monteverdi.
334
Figura 14.4: Vdeo con el espectrograma de los compases iniciales del Lamento de Ariadna de
Monteverdi.
Figura 14.5: Vdeo con el movimiento de la voz de la segunda frase del Lamento de Ariadna de
Monteverdi.
Comenzar por lo ms evidente que podemos ver en ambas representaciones. El registro en el que se sita es mucho ms alto que el recitado del poema de Garcilaso.
Evidentemente la diferencia de altura tonal entre una voz de hombre y una de mujer es grande, aproximadamente una octava, pero la altura en la que se mueve este
335
lamento es ya muy elevada para una voz hablada. Simplemente, si oyramos hablar
a alguien con una entonacin en este registro nos resultara como mnimo sorprendente.
As mismo, el mbito de esta idea musical es tambin superior al de la prosodia: a
pesar de su austeridad, aqu recorre la octava entera con agilidad. Por otra parte, los
saltos de altura tonal entre slabas o palabras son impensables en la prosodia del habla
(entre sib4 y fa4 , entre mi4 y si4 , y entre re5 y fa4 ). Solamente estos rasgos estableceran
ya una diferencia clara entre este pasaje y el de la voz hablada.
Pero vamos ahora ya a lo que ms nos interesa, el tipo de movimiento de la voz.
Si nos jamos en el melograma de la gura 14.5 vemos que la voz sigue teniendo
un cierto carcter continuo, y de hecho no permanece ja prcticamente nunca.
No obstante, hay una considerable diferencia con el movimiento de la voz en la
declamacin del poema anterior: en general, la voz tiende a mantener ahora unas
lneas ms o menos horizontales. El lenguaje musical ha construido estas lneas
y ha denido las alturas tonales precisas sobre las que la voz se ha de mantener, o ha
de girar en torno, durante un espacio de tiempo lo sucientemente prolongado para
ser reconocidas como notas.
En este ejemplo, esta tendencia a la horizontalidad parece clara, hasta el extremo
de que podramos aventurar en el melograma las notas que constituyen la meloda.
Ahora bien, su altura tonal se modica a lo largo de la emisin, bien ascendiendo o
descendiendo ligeramente, bien oscilando en torno a un valor medio. En la interpretacin de estas notas vemos que, por un lado, la cantante ha tendido a imitar la
continuidad de la prosodia hablada, deslizando la voz, pero, por otro, ha utilizado un
recurso especcamente musical, un vibrato muy rpido y muy amplio.
Resumiendo, en la comparacin de este fragmento cantado con la declamacin anterior, vemos que hay acontecimientos denidos y, en general, separados, que nos
permiten identicar como notas musicales cada una de los dibujos del melograma.
Podemos tambin establecer un cierto valor medio en la altura tonal de las notas,
pero las libertades expresivas de la interpretacin hacen que la determinacin precisa
de la altura tonal no sea posible en todos los casos.
336
14.5.
El movimiento de la voz en el inicio del Adagio de la Sonata I para violn solo (BWV 1001) de J. S. Bach
El ejemplo siguiente corresponde al inicio del Adagio de la Sonata I para violn solo de
J. S. Bach, BWV 1001. El violn y lo mismo podramos decir de los dems miembros de su familia es el instrumento que ms se asemeja en posibilidades expresivas
a la voz humana. No en vano su desarrollo est muy ligado al estilo homofnico que
triunfa a partir de 1600 (la seconda prattica que he mencionado a propsito del fragmento de Monteverdi). En efecto, al carecer de trastes, el violn puede dar cualquier
altura tonal intermedia dentro de su tesitura (la primera dicultad a la que se enfrenta
el violinista es la de anar bien) y el intrprete puede modicarla con toda libertad
a lo largo de su emisin, deslizando la voz de nota en nota o hacindola oscilar a
voluntad. Tambin, al igual que en el canto, puede modicar libremente a lo largo
de la emisin la intensidad del sonido e incluso la cualidad sonora, aumentando o
disminuyendo el nmero de sus armnicos.
Veamos, igual que en el ejemplo anterior, la partitura, un vdeo con el espectrograma
del fragmento entero y otro con el melograma en el que vemos el movimiento de
la voz principal de la primera parte de la frase inicial. Como ahora el espectrograma es un poco ms complicado, me ha parecido oportuno etiquetar las notas de la
meloda.
Figura 14.6: Partitura de la primera frase del Adagio de la Sonata I para violn solo (BWV 1001)
de J. S. Bach.
337
Figura 14.7: Vdeo con el espectrograma de la primera frase del Adagio de la Sonata I para violn
solo (BWV 1001) de J. S. Bach.
Figura 14.8: Vdeo con el melograma que representa el movimiento de la voz del inicio de la
primera frase del Adagio de la Sonata I para violn solo (BWV 1001) de J. S. Bach.
Una comparacin supercial de este ejemplo con el anterior nos muestra ahora una
definicin ms clara de las alturas tonales y de las duraciones. As mismo, salvo
alguna pequea excepcin en notas muy rpidas y seguidas, el movimiento de la
voz es intervlico, es decir, la voz va a saltos. La voz se establece con claridad en una
338
14.6.
Como ltimo ejemplo he elegido un pasaje muy cantabile, el inicio del Nocturno op.
9 n 1 de Fr. Chopin. Presento en primer lugar la partitura y luego el espectrograma
y la representacin del movimiento meldico en el melograma.
339
Figura 14.9: Partitura del inicio del Nocturno op. 9 n 1 de Fr. Chopin.
Figura 14.10: Vdeo con el espectrograma del inicio del Nocturno op. 9 n 1 de Fr. Chopin.
340
Figura 14.11: Vdeo con el melograma del inicio del Nocturno op. 9 n 1 de Fr. Chopin.
Las imgenes de ambos vdeos presentan unas caractersticas muy distintas de todo
lo que hemos visto hasta ahora. En el espectrograma vemos que predomina la lneas
horizontales, y en el melograma vemos con total claridad un conjunto de lneas horizontales que precisamente se superponen a la retcula que dene las alturas tonales
de nuestras notas del sistema temperado en el diapasn estndar.
Esta horizontalidad en este caso vienen determinada por la naturaleza del instrumento. El piano es un instrumento de anacin ja, en el que el principal parmetro sobre
el que puede actuar el pianista es la velocidad de ataque, es decir, la rapidez con la
que baja la tecla. Una vez que el macillo queda libre de la tecla mediante el mecanismo de escape ya no hay posibilidad alguna de modicar el sonido (salvo apagarlo
antes o despus al soltar la tecla y liberar el apagador). Por ello, la mayor parte de la
informacin que el intrprete aporta queda condensada en las milsimas iniciales de
su ataque.
Si en este ejemplo se nos pidiera de nuevo precisar las alturas tonales del movimiento
de la voz utilizando solamente el espectrograma, la respuesta no planteara ninguna
dicultad. En el caso del espectrograma nos bastara con trazar lneas horizontales
que pasaran por el medio de cada gura o mancha de luz. En el melograma la respuesta sera todava ms evidente. Observamos, adems, que, como es lgico, todas
las notas con el mismo nombre estn ahora a la misma altura tonal. Efectivamente, las
alturas tonales estn ahora totalmente denidas. As pues, en este ejemplo podramos
341
asignar un nmero preciso a cada nota, su altura tonal expresada en cents. De hecho, realmente es al revs: es esta posibilidad de tener alturas tonales jas, expresables
numricamente, la que nos permite dar nombre a las notas.
Podramos observar tambin algunas pequeas diferencias respecto al modelo ideal
de lneas horizontales. Por ejemplo, las lneas correspondientes a las notas ms agudas
parecen estar ligeramente por encima de la retcula que marca la anacin temperada
estndar (con el la4 a 440 Hz). Esto se debe a la inarmonicidad del piano que hace
que la anacin de las notas superiores se vaya estirando un poco. Podramos tambin
apreciar algunas ligeras indecisiones en la anacin de algunas notas que parecen incluso oscilar ligeramente. Ello es debido al problema del derrame espectral que unido
al ruido que acompaa el ataque de cada nota provoca una cierta indeterminacin en
la precisin del reconocimiento de la frecuencia. Y todava ms, dejando al margen
estas cuestiones, incluso las notas de un piano, en una escala minscula cierto es, presentan tambin una cierta evolucin en la frecuencia. Pero no es momento de tratar
estas cuestiones ahora. Lo que nos interesa es que aqu si que vemos ya los elementos del lenguaje musical: las alturas tonales denidas con claridad que determinan las
notas y que constituyen la referencia que se crea en nuestra mente musical y que nos
permite entender y dar sentido incluso a los movimientos de la voz musicales que se
alejan de este modelo y se acercan ms al del habla.
Por otra parte, resulta tambin claro que aqu nos sera muy fcil especicar con toda
seguridad la duracin de cada nota (teniendo en cuenta, claro est, que lo que debemos medir es la distancia entre sucesivos ataques). Ya he explicado en el ejemplo del
violn a qu se debe la superposicin de algunas notas en el espectrograma. Aqu, en
este ejemplo, la utilizacin del pedal hace que las notas tiendan a superponerse ms
que en el caso del violn. Pero tambin podra haber sucedido lo contrario, y la ejecucin de las notas haber sido ms picada. Ahora bien, desde el punto de vista mtrico
ambas situaciones son irrelevantes: afectan slo al carcter de las notas, a la expresin,
pero no al ritmo, es decir, no alteran la codicacin mtrica. As mismo, resulta aqu
tambin ms clara todava la existencia de una repeticin de determinadas duraciones. Dar un paso ms y ver que esas duraciones guardan entre s las proporciones
sencillas de doble, triple, etc., requerira simplemente el uso de la regla.
Es importante destacar que en este ejemplo, en el que las altura tonales son claramente
estables y denidas numricamente, debemos seguir hablando de movimiento de la
342
voz. Aunque sea a saltos, aunque ya estemos muy lejos de los rasgos de la prosodia,
aunque no tengamos la versatilidad de la voz cantada, ni su imitacin como hace la
voz en el violn, tambin aqu hay un movimiento de la voz. El intrprete de piano
tiene que hacer todo lo posible para que el instrumento cante. Sin el movimiento
de la voz no existira msica en su sentido pleno, sino solamente una sucesin de
sonidos carentes de signicacin. El piano es, de algn modo, el instrumento de
referencia de nuestro sistema musical y en ese sentido tiene un papel equivalente al
que tena la lira en la Antigedad.
As pues, si volvemos al ejemplo del recitado del poema, donde la voz discurre sin
solucin de continuidad y la comparamos con el movimiento puramente intervlico
de la voz en un instrumento de anacin ja como es el piano, podemos ver cmo
nuestro lenguaje musical es el resultado de la cuanticacin de la altura tonal y, a
partir de ella, de la duracin.
14.7.
Para concluir este captulo, y con ello este curso, voy hacer ahora una breve reexin sobre lo que hemos observado en todas estas grcas de los distintos tipos de
movimiento de la voz.
Los melogramas nos han permitido intuir una nocin muy prxima a la realidad
sonora: el espacio musical, es decir, el lugar en el que se produce la signicacin
de la msica. El movimiento de la voz o de las voces discurre a lo largo del tiempo
en un espacio sonoro que va del grave al agudo. Nuestro sistema notacional, nuestra
partitura, representa de algn modo esta nocin de espacio musical: el tiempo con la
dimensin horizontal y la altura tonal con la dimensin vertical. Pero lo que tenemos
en una partitura es la obra musical, la idea musical, una elaboracin mental, no es
su realizacin fsica, sonora, no es su interpretacin. En el melograma, sin embargo,
vemos el espacio de la msica sonando, interpretada, hecha sonido.
Adems, ese espacio musical, tal como queda representado en el melograma, es el espacio de nuestra sensacin auditiva, no el del hecho fsico, no es la vibracin sonora.
La msica debe muchas de sus propiedades a la fsica del sonido, pero su verdadero punto de partida es nuestra sensacin, la manera en la que nosotros percibimos
343
los acontecimientos sonoros. El movimiento de la voz que hemos visto en todos los
melogramas es movimiento respecto a nuestra percepcin, es decir, es la variacin
dentro de una escala temporal adecuada a nuestra percepcin de uno de los parmetros caractersticos del sonido: la frecuencia instantnea. Al margen de que desde el
punto de vista fsico el sonido sea movimiento ms exactamente movimiento vibratorio, el movimiento que interesa a la msica es el movimiento de la
voz que percibimos, es decir, la variacin en el tiempo de su altura tonal.
El melograma nos ha permitido tambin ilustrar con imgenes el proceso de abstraccin que conduce desde la prosodia de la voz hablada hasta la constitucin del sistema
musical. La permanencia de la voz en alturas tonales determinadas permite establecer medidas y proporciones entre ellas. Estos nmeros son los que codican
las alturas tonales y determinan un conjunto de intervalos a los que el sistema musical dar signicacin, organizando las escalas. El lenguaje musical se crea a partir
del espritu de la voz humana en el habla, pero adquiere su ordenacin precisa es
decir, se codica, se hace propiamente sistema (escala) mediante un instrumento
de anacin ja que permite precisar las alturas tonales. En el caso de su creacin
histrica, este instrumento fue la lira; hoy es el piano del que podemos considerar,
en este sentido, que la lira fue un antecedente.
Por otra parte, hemos visto en el ejemplo del poema recitado dos caractersticas de
la voz hablada que van a tener muchas consecuencias en la creacin de nuestro sistema musical: una es el reducido mbito tonal en el que se mueve la
entonacin de cada unidad sintagmtica en el habla, un mbito de aproximadamente una cuarta o una quinta; otra, la frmula cadencial descendente con
la que se delimitan estas unidades. Por las noticias que nos han llegado de los tericos musicales y de los gramticos antiguos, estas caractersticas se daban tambin
en el griego antiguo, lengua que sirvi de fundamento a la construccin de nuestro
sistema musical. La primera explicar en parte la importancia del tetracordio y de la
consonancia de cuarta en las primeras formas escalares antiguas. La segunda se reejar en el carcter descendente de todas las resoluciones: las cadencias descendentes
van a dominar por completo el lenguaje musical de Occidente hasta la aparicin de
los primeros atisbos de la sensible ascendente en la msica de los trovadores. Pero las
consecuencias de esta cuestin pertenecen ya al estudio de la teora musical.
344
As mismo, estos ejemplos nos han permitido acercarnos mejor a un asunto que tiene
que ver con la interpretacin. Consideramos que una cualidad del intrprete es hacer hablar al instrumento. Mediante los melogramas hemos podido comprobar hasta
qu punto esto es literal: hacer hablar al instrumento es acercarse a la prosodia
del habla, es decir, alterar las alturas tonales o las duraciones de las notas que corresponderan al patrn escalar o rtmico, bien a travs de inexiones o desviaciones
de la voz, bien a travs de modicaciones de los tiempos (rubato, ritandando, etc.),
para aproximarnos a la naturalidad del movimiento de la voz en el habla, adquiriendo mediante este pequeo alejamiento del cdigo musical una alta signicacin
emotiva.
14.8.
Conclusin
paso hemos aprendido a observar unas representaciones grcas del sonido, el espectrograma y el melograma, que pueden ser de gran utilidad al msico y al musiclogo
para realizar el anlisis sonoro de una interpretacin musical.
Aqu nos quedamos, pues, a las puertas del estudio de la Teora Musical, que debe dar
cuenta del lenguaje que permite dotar de sentido a los sonidos de la msica.
346
Bibliografa
[1] HRNN, WII M., Principles of Musical Acoustics, Springer, 2013.
[2] JHNSN, I., Measured Tones: The Interplay of Physics and Music, 3rd Edition,
CRC Press, 2009.
[3] RRR, JN G., The Physics and Psychophysics of Music. An Introduction, 4th
Edition, Springer, 2008.
[4] RSSING, THS D., MR, F. RIHR y WHR, P A., The Science of
Sound, 3rd Edition, Pearson, 2013.
[5] SHN, JN, NN, ISR y KING, ANR, Auditory Neuroscience: Making
Sense of Sound, The MIT Press, 2011.
347