Acustica Musical

Acstica Musical
Luis Colomer Blasco
27 de diciembre de 2016
Contacto: luiscolo12@gmail.com
El curso Acstica Musical puede ser seguido on-line en: Acstica Musical
Este documento esta realizado bajo licencia Creative

Commons Reconocimiento-CompartirIgual 4.0 Internacional.
Sobre los materiales multimedia

Este curso multimedia va acompaado de 141 archivos de vdeo e imgenes. Los
archivos de vdeo estn en formato .mp4 y los de imgenes en formato .png. Se
puede acceder a los vdeos y a las imgenes en tamao original haciendo clic en el
pie de cada gura.
Tambin se puede descargar el curso entero, con el texto en .pdf y los materiales
multimedia, desde la pgina de Descargas de la versin on-line del curso Acstica
Musical o, directamente, en esta direccin. Para que funcionen los enlaces del texto,
no se puede cambiar el nombre de la carpeta Materiales ni el de los archivos que
contiene. El archivo .pdf del curso y la carpeta Materiales deben estar, a su vez,
dentro de la misma carpeta, a la que se le puede llamar, por ejemplo, Acstica Musical. Al intentar descargar el archivo zip, puede salir un aviso que dice: Google
Drive no puede analizar este archivo en busca de virus. Materiales.zip (541M) supera el tamao mximo de archivo que puede analizar Google. Quieres descargar
el archivo de todos modos?. Basta con aceptar para descargarla, pues al contener
solamente archivos de vdeo del tipo .mp4 o imgenes del tipo .png no puede tener
ningn virus.
ndice general
Prlogo
VIII
1. El sonido como vibracin

1
1.1. Qu es el sonido? . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Simulacin de la vibracin del aire en un sonido simple . . . . . . . . 3
1.2.1. Propagacin de la perturbacin a travs del aire . . . . . . . . 5
1.2.2. Movimiento individual de oscilacin . . . . . . . . . . . . . . 6
1.2.3. De la oscilacin individual a la propagacin ondulatoria . . . 8
1.3. Simulacin de la vibracin del aire en un fragmento sonoro complejo 14
1.4. Conclusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2. La seal de audio
2.1. Representacin del sonido . .
2.2. Un ejemplo de registro digital
2.3. El editor de sonido . . . . . .
2.4. El osciloscopio . . . . . . . .
2.5. Conclusin . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3. Caractersticas de los sonidos musicales

3.1. Introduccin . . . . . . . . . . . . . .
3.2. Ruido y sonido musical . . . . . . . .
3.3. Ruido blanco y sonido simple . . . . .
3.4. Trco con lluvia y notas de clarinete
3.5. Campanadas y notas de piano . . . . .
3.6. Habla y canto . . . . . . . . . . . . . .
II
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
17
17
19
22
25
26
.
.
.
.
.
.
28
28
29
30
33
37
40
3.7. Conclusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4. El sonido simple
4.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . .
4.2. El sonido simple como fundamento del sonido musical
4.3. El Movimiento Armnico Simple (MAS) . . . . . . . .
4.3.1. Un ejemplo de Movimiento Armnico Simple
4.3.2. Parmetros del Movimiento Armnico Simple
4.4. El Movimiento Armnico Simple en el sonido . . . . .
4.4.1. Parmetros del sonido simple . . . . . . . . . .
4.5. Conclusin . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5. Altura tonal, intervalos y volumen sonoro

5.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2. Relacin entre estmulo y sensacin: la Ley de Weber-Fechner . . . .
5.3. Frecuencia y altura tonal: notas e intervalos . . . . . . . . . . . . .
5.3.1. El intervalo musical como razn numrica . . . . . . . . . .
5.3.2. Unidades intervlicas . . . . . . . . . . . . . . . . . . . . .
5.3.3. Las frecuencias de las notas musicales . . . . . . . . . . . . .
5.4. Amplitud y volumen sonoro . . . . . . . . . . . . . . . . . . . . . .
5.4.1. Unidades intervlicas de intensidad sonora: el belio y el decibelio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.4.2. Correspondencia entre la amplitud normalizada y la intensidad en decibelios . . . . . . . . . . . . . . . . . . . . . . . .
5.4.3. Valores absolutos de intensidad sonora . . . . . . . . . . . .
5.4.4. La percepcin del volumen sonoro . . . . . . . . . . . . . .
5.5. Conclusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6. Mezcla e interferencia de dos sonidos simples
6.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.2. El Principio de Superposicin Lineal de Ondas . . . . . . . . . . .
6.3. Mezcla de dos sonidos simples de la misma frecuencia: Unsono . .
6.4. Mezcla de dos sonidos simples de frecuencias muy prximas: Batidos
de primer orden . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.4.1. Los batidos de primer orden . . . . . . . . . . . . . . . . . .
III
.
.
.
.
.
.
.
.
47
47
48
51
51
56
58
58
61
.
.
.
.
.
.
.
62
62
63
65
66
69
71
74
. 74
.
.
.
.
76
78
80
82
84
. 84
. 86
. 87
. 91
. 91
6.5.
6.6.
6.7.
6.8.
6.9.
6.4.2. Causas de los batidos de primer orden . . . . . . . . . . . . . 94

6.4.3. Batidos y anacin . . . . . . . . . . . . . . . . . . . . . . . . 96
Mezclas de dos sonidos simples en funcin de la distancia entre sus
frecuencias y de la anchura de su banda crtica . . . . . . . . . . . . . 97
Mezcla de dos sonidos simples cuyas frecuencias estn en relacin de
conmensurabilidad prxima: Consonancias . . . . . . . . . . . . . . 100
6.6.1. Conmensurabilidad prxima . . . . . . . . . . . . . . . . . . 101
6.6.2. Consonancias entre sonidos simples . . . . . . . . . . . . . . 102
6.6.3. De la consonancia a la disonancia . . . . . . . . . . . . . . . . 105
6.6.4. Grados de consonancia segn la conmensurabilidad . . . . . . 109
6.6.5. La fase inicial en la mezcla consonante . . . . . . . . . . . . . 111
Mezcla de dos sonidos simples cuyas frecuencias se alejan un poco de
la conmensurabilidad prxima: Batidos de segundo orden . . . . . . 113
Distorsin y componentes espurios en la mezcla de dos sonidos simples116
Conclusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
7. El sonido armnico
7.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.2. Sonidos armnicos y sonidos inarmnicos . . . . . . . . . . . . . . .
7.3. La serie armnica . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.3.1. Sonido formado por componentes consecutivos de la serie armnica: Seal en diente de sierra . . . . . . . . . . . . . . . .
7.3.2. Sonido formado por los componentes impares consecutivos
de la serie armnica: Seal rectangular . . . . . . . . . . . . .
7.3.3. Cualidad sonora derivada de los componentes de la serie armnica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.4. Componentes de la serie armnica y notas de la escala temperada . .
7.5. Intervalos entre los sucesivos componentes de la serie armnica . . .
7.6. Estructura armnica y reconocimiento de la altura tonal . . . . . . .
7.7. Las fronteras de lo armnico. La inarmonicidad en el sonido musical
7.8. Conclusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
122
122
124
128
129
131
132
133
138
141
144
148
8. Ondas estacionarias y resonancia: Generacin del sonido armnico 150

8.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
I
8.2. La cuerda como paradigma de un sistema vibratorio unidimensional

8.3. Propagacin y reexin de una perturbacin transversal sobre una
cuerda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4. Superposicin de dos perturbaciones que viajan en sentido opuesto
sobre una cuerda . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.5. Formacin de ondas estacionarias sobre una cuerda . . . . . . . . .
8.5.1. Reexin de una onda sinusoidal cuya longitud no es una
parte entera del doble de la longitud de la cuerda . . . . . .
8.5.2. Generacin de una onda estacionaria en el modo fundamental
de vibracin . . . . . . . . . . . . . . . . . . . . . . . . . .
8.5.3. Generacin de ondas estacionarias en los modos de vibracin
armnicos . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.6. La resonancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.7. Generacin del sonido armnico . . . . . . . . . . . . . . . . . . .
8.8. Conclusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9. Envolventes de amplitud y de frecuencia
9.1. Introduccin . . . . . . . . . . . . . .
9.2. Envolvente de amplitud general . . . .
9.3. Envolventes de amplitud parciales . . .
9.4. Envolvente de frecuencia . . . . . . .
9.5. Conclusin . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
152
. 155
. 160
. 164
. 165
. 170
.
.
.
.
175
183
188
192
.
.
.
.
.
193
193
195
199
204
208
10. Anlisis espectral de los sonidos musicales

10.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.2. Un modelo ideal de analizador espectral mediante resonancias . . . .
10.3. Relacin entre duracin temporal y resolucin frecuencial . . . . . .
10.4. El espectrograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.5. Interpretacin de los espectrogramas . . . . . . . . . . . . . . . . . .
10.5.1. Espectrograma de sonidos armnicos estables . . . . . . . . .
10.5.2. Espectrograma de sonidos armnicos cuyos componentes cambian de amplitud . . . . . . . . . . . . . . . . . . . . . . . . .
10.5.3. Espectrograma de sonidos cuyos componentes modican su
frecuencia . . . . . . . . . . . . . . . . . . . . . . . . . . . .
209
209
211
215
219
223
224
225
227
10.5.4. Espectrograma de ruido blanco y sonido simple . . . . . . . . 229

10.5.5. Espectrograma de ruido de trco y de habla . . . . . . . . . 230
10.6. Conclusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
11. El timbre
11.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.2. Rasgos tmbricos derivados del contenido espectral . . . . . . . . .
11.2.1. Rasgos espectrales caractersticos del tipo de instrumento . .
11.2.2. Diferencias del contenido espectral entre las distintas notas
del mismo instrumento . . . . . . . . . . . . . . . . . . . .
11.2.3. Modicacin del contenido espectral por la accin del intrprete . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.3. Rasgos tmbricos dependientes de la evolucin de los parmetros del
sonido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.3.1. Marcas tmbricas y envolvente de amplitud . . . . . . . . .
11.3.2. Marcas tmbricas y envolvente de frecuencia . . . . . . . . .
11.4. Conclusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
232
. 232
. 235
. 242
. 247
. 254
.
.
.
.
257
257
263
265
12. Fisiologa de la audicin

12.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.2. El odo humano . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.3. La cclea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.3.1. Descripcin general de la cclea . . . . . . . . . . . . . . . .
12.3.2. Estructura interna de la cclea . . . . . . . . . . . . . . . . .
12.3.3. El rgano de Corti . . . . . . . . . . . . . . . . . . . . . . . .
12.3.4. El ganglio espiral . . . . . . . . . . . . . . . . . . . . . . . . .
12.4. La cclea como analizador mecnico de frecuencias . . . . . . . . . .
12.4.1. Tonotopa de la membrana basilar . . . . . . . . . . . . . . .
12.4.2. Comportamiento de la membrana basilar ante un sonido complejo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.4.3. Retroalimentacin de las clulas pilosas externas sobre la membrana basilar . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.5. Transduccin mecano-elctrica en la cclea . . . . . . . . . . . . . .
12.6. Codicacin de la informacin sonora en impulsos elctricos . . . . .
266
266
267
271
271
273
278
284
287
287
292
294
295
299
12.7. Conclusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303

13. Psicoacstica musical
13.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13.2. Limitaciones en la percepcin del objeto sonoro debidas a la siologa
del odo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13.3. El reconocimiento del patrn armnico . . . . . . . . . . . . . . .
13.4. Percepcin de la consonancia entre sonidos musicales . . . . . . . .
13.4.1. Consonancia y disonancia . . . . . . . . . . . . . . . . . . .
13.4.2. Consonancia de octava, de quinta y de cuarta . . . . . . . .
13.5. Conclusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14. La voz musical
14.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14.2. El concepto de voz musical . . . . . . . . . . . . . . . . . . . . . .
14.3. El movimiento de la voz en el recitado de la primera estrofa de la Oda
a la or de Gnido de Garcilaso de la Vega . . . . . . . . . . . . . . .
14.4. El movimiento de la voz en los compases iniciales del Lamento de
Ariadna de Monteverdi . . . . . . . . . . . . . . . . . . . . . . . . .
14.5. El movimiento de la voz en el inicio del Adagio de la Sonata I para
violn solo (BWV 1001) de J. S. Bach . . . . . . . . . . . . . . . . .
14.6. El movimiento de la voz en el inicio del Nocturno op.9, n 1 de Fr.
Chopin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14.7. El espacio de la signicacin musical . . . . . . . . . . . . . . . .
14.8. Conclusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Bibliografa
304
. 304
.
.
.
.
.
.
305
308
312
314
319
324
325
. 325
. 327
. 330
. 334
. 337
. 340
. 344
. 346
347
II
Prlogo
Este curso pretende proporcionar al msico y al musiclogo los conocimientos de
acstica que pueden ser de inters para la realizacin de su trabajo. El sonido es el
material con el que se hace la msica, por lo que a cualquiera que le interese el arte
musical le puede resultar atractivo conocer todo lo que atae al sonido, tanto en
su realidad fsica es decir, al hecho de que sea una onda mecnica, como en su
realidad psquica, pues en un sentido estricto hablamos de sonido cuando esa onda
mecnica es percibida por nuestro sistema auditivo.
Ciertamente, no es necesario conocer nada de acstica para interpretar bien un instrumento, ni para investigar en la mayor parte de los aspectos de los que se ocupa la
musicologa, pero creo que todos estaremos de acuerdo en que saber en qu consiste el sonido, conocer cules son sus parmetros fsicos, comprender cmo nosotros
percibimos esos parmetros y, en denitiva, conocer cul es la relacin entre la naturaleza fsica del sonido y la manera en la que nuestro sistema auditivo lo percibe,
puede resultar de gran ayuda para la prctica del instrumento y tambin puede colaborar ecazmente en mltiples aspectos de la investigacin musicolgica. A mi
juicio, es difcil entender bien el lenguaje musical sin un conocimiento, aunque sea
elemental, del sonido musical. En este sentido, uno de los objetivos de este curso
es presentar las bases fsicas sobre las que se ha construido el lenguaje musical de
Occidente y tambin su sistematizacin terica.
La pregunta que podemos hacernos a continuacin es la siguiente: Es posible estudiar acstica sin utilizar el formulismo matemtico que normalmente acompaa
cualquier estudio fsico? Mi respuesta es que s. Creo que se puede entender bien la
naturaleza del sonido, y en particular del sonido musical, mediante la experiencia,
III
sin recurrir a ninguna frmula matemtica. Por eso este curso de acstica musical va
a prescindir de toda formulacin matemtica.
No se trata de realizar clculos, ni de desarrollar aplicaciones prcticas; el objetivo
de quien siga este curso de acstica musical va a ser entender las ideas fundamentales en torno a la naturaleza del sonido y, en particular, aquellos aspectos que han
sustentado nuestro lenguaje musical. Por ejemplo, desde mi punto de vista, se puede
entender razonablemente bien qu es la descomposicin espectral sin necesidad de
conocer la formulacin matemtica de la Transformada de Fourier. Es verdad que su
conocimiento sera ms profundo y estara mejor expresado si se utilizara el lenguaje
matemtico, pero esto slo sera as una vez que se hubieran entendido las ideas en las
que se basa la descomposicin espectral. Creo que para el msico es suciente con
este conocimiento y tambin que quien est interesado en la fsica del sonido, sin
un especial inters musical, le puede venir muy bien observar y experimentar muchos fenmenos que luego podrn ser formalizados matemticamente. Por ello en
este curso voy a procurar explicar todas las ideas de la manera ms intuitiva posible.
Pienso que, armados solamente con el sentido comn y con la ayuda de abundantes grcas y vdeos que nos permitan relacionar lo que omos con lo que vemos,
podremos entender las principales nociones de acstica musical.
Por todo ello este curso va a utilizar con mucha frecuencia vdeos, la mayor parte
de los cuales han sido elaborados a partir de imgenes obtenidas mediante Matlab.
Estos vdeos van a servir como una suerte de laboratorio de acstica y van a permitir
experimentar de primera mano todo lo que se explica en el texto. En ellos me he
esforzado en mostrar la relacin entre lo que se ve y lo que se oye. As pues, espero
que los conceptos ms importantes de acstica musical queden aanzados con ayuda
de las imgenes de estos vdeos, que presentan grcamente cmo es la naturaleza
del sonido y la manera en la que nosotros percibimos sus parmetros.
Los distintos captulos de este curso de acstica musical recorren el amplio camino
que va desde la explicacin de la naturaleza vibratoria del movimiento mecnico que
origina el sonido y el modo en el que se trasmite, con sus parmetros de frecuencia,
amplitud, periodo y fase, hasta las peculiaridades de la voz musical, es decir, el movimiento que transcurre intervlicamente de una a otra altura tonal y que da lugar a
la meloda, pasando por la explicacin de fenmenos acsticos de especial relevancia
en la formacin del sonido musical, tales como las ondas estacionarias, la resonancia,
IX
los batidos, la consonancia, las envolventes de amplitud y de frecuencia, etc. A la vez,

se presentan algunas herramientas que nos permiten observar el sonido musical, tales
como el espectrograma y el melograma, y se proporciona un conocimiento bsico
sobre cmo funciona nuestra percepcin auditiva.
Pero querra, antes de comenzar, hacer algunas aclaraciones. La primera se reere a lo que hay que entender en este curso por sonido musical. Si bien es cierto
que la msica puede utilizar cualquier tipo de sonido (y no tenemos ms que pensar
en las msicas de vanguardia), es necesario aclarar que aqu cuando hablo de sonido musical me estoy reriendo exclusivamente al sonido armnico, es decir, aqul
que posee una altura tonal denida y del que, por lo tanto, podemos decir que es
un re, un fa, un mi, o cualquier otra altura tonal, lo que usualmente llamamos una
nota. No descarto en absoluto la posibilidad de que se pueda utilizar musicalmente
cualquier material sonoro, como hace una parte importante de la msica contempornea. Menos todava niego la posibilidad de una msica puramente rtmica, en
la cual cualquier sonido o ruido puede servir para marcar el tiempo. Sin embargo,
puesto que uno de los objetivos de este curso es proporcionar las bases acsticas convenientes para el estudio de nuestro lenguaje musical estndar, creo que es oportuno
y resulta cmodo restringir la denicin de sonido musical al sonido formado por
componentes armnicos.
Lo siguiente que quiero decir es que en este curso me voy a limitar a analizar el
sonido musical desde el punto de vista fsico y psicoacstico, sin entrar para nada
en el lenguaje musical. Cualquier sonido obtendr su valor dentro de una escala o
de un acorde, y all pasar a adquirir un signicado por su posicin en el sistema
correspondiente. Pero estas cuestiones pertenecen ya a la teora musical, por lo que
aqu atender nicamente a las caractersticas fsicas del sonido y a los aspectos psicoacsticos de nuestra audicin que van a repercutir en la conguracin de nuestro
lenguaje musical. Me voy a centrar en cuestiones como, por ejemplo, en qu consiste
la especicidad del sonido musical o armnico, cules son los elementos bsicos de
todo sonido musical, qu relacin hay entre frecuencia y altura tonal, o entre amplitud y volumen sonoro, qu razones numricas deben cumplir los componentes de
los sonidos musicales o armnicos, cmo es posible lograr una buena anacin es
decir, determinar con precisin las frecuencias de los sonidos, qu relacin hay
entre el hecho fsico de la vibracin y nuestra forma de percibir los acontecimientos

sonoros, cules son los fundamentos fsicos de las consonancias, si los hay, etc.
Y por ltimo, una advertencia para poder apreciar correctamente los ejemplos sonoros que aparecen en los vdeos. Es necesario utilizar un sistema de reproduccin
sonora que tenga una distorsin razonablemente pequea. Puede valer un telfono
mvil, un iPad o cualquier otra tableta con un sistema de audio razonable, pero es
necesario que disponga de un altavoz mnimamente decente o, en caso contrario,
los ejemplos deben ser escuchados a travs de unos auriculares. Si se reproducen los
vdeos en un ordenador tambin es conveniente que tenga unos altavoces de cierta
calidad. La razn es que la distorsin que introduce un sistema sonoro deciente da
lugar a la aparicin de componentes espurios, es decir, componentes que no estn
presentes en la seal original. Se producen principalmente dos efectos no deseados
debidos a la distorsin, con posibles repercusiones en la audicin de los ejemplos sonoros. En primer lugar, en el caso de un sonido simple, la distorsin puede aadir
armnicos, producindose la llamada distorsin armnica, que provocar que no
los oigamos con la pureza con la que debe sonar un sonido simple autntico (que
debera tener una cualidad sonora similar a la de un diapasn metlico de los utilizados para anar), sino que escuchemos un sonido ms spero y complejo. En segundo
lugar, en el caso de sonidos compuestos o de las mezclas de sonidos, la distorsin
puede provocar la aparicin de nuevos componentes, la llamada distorsin de intermodulacin y, en especial en los ejemplos de mezclas de sonidos simples, esta
distorsin puede hacer aparecer un nuevo componente grave, precisamente con una
frecuencia que sera el resultado de la diferencia entre las frecuencias de los sonidos
mezclados. Algunas leyendas sobre la posibilidad de obtener sonidos muy graves a
partir de los tonos de diferencia son simplemente provocadas por la distorsin de los
equipos de reproduccin. Para mitigar este ltimo problema, cuando he podido, he
procurado elegir las frecuencias de los sonidos utilizados en los ejemplos de tal forma que estos sonidos espurios de diferencia tuvieran una frecuencia por debajo del
lmite de graves que un reproductor de audio mediocre es capaz de dar. Para probar
si nuestro equipo distorsiona ms de lo aceptable, podemos atender, por ejemplo, al
vdeo de la gura 9 del captulo 6, en concreto, cuando se superponen dos sonidos
simples cuyas frecuencias estn en razn 3/2 (quinta) y 4/3 (cuarta). En ambos casos
tenemos que or solamente las dos notas por separado, de modo que si omos un terXI
cer componente ms grave, debemos atribuirlo a la distorsin de intermodulacin

provocada por la pobre calidad del equipo.
Espero que este curso sea de utilidad a todas las personas que se animen a seguirlo.
Mi recomendacin es hacer en primer lugar una lectura supercial del captulo que
queramos trabajar, luego atender especialmente a los materiales didcticos y nalmente repasar de nuevo el texto. Si hay algn profesor que le interese para sus clases
algunos de los vdeos, puede utilizarlos tambin con toda libertad y complementarlos
con sus propias explicaciones.
XII
Captulo 1
El sonido como vibracin
1.1.
Qu es el sonido?
Empecemos conociendo qu es el sonido, cualquier sonido, sea o no musical. La

primera cuestin que es necesario tener clara es que el sonido es una vibracin
mecnica que se propaga en un medio elstico.
Si nos molesta el ruido que hace alguien que est en la habitacin de al lado es porque
la pared que nos separa se est moviendo, se est deformando, est vibrando. Bien,
es cierto, se mueve muy poco, las deformaciones son mnimas, pero son lo sucientemente intensas como para que, a su vez, estas vibraciones mecnicas hagan vibrar
el aire de nuestra habitacin y el ruido de la habitacin de al lado llegue a nuestros
odos.
Toda vibracin es posible porque el medio que vibra es elstico. En efecto, el aire es
elstico: el aire se comprime y se expande, aumentando y disminuyendo la presin
que ejerce sobre todo lo que rodea. Y la pared, aunque no lo parezca a simple vista,
tambin es elstica.
As pues, cualquier vibracin mecnica, hablando en trminos generales, es sonido.
Pero como habitualmente el medio por el que se transmite el sonido es el aire y como
lo que nos interesa ahora es el sonido que los humanos somos capaces de percibir, para
simplicar podemos pensar que el sonido es la alteracin producida en nuestro
1
sistema perceptivo por las pequeas y rpidas oscilaciones de la presin del aire
en torno a su valor medio.
Ahora bien, decimos que el sonido es movimiento, que la pared a travs de la que
llega a nuestros odos el ruido de la habitacin de al lado se est deformando, pero
no vemos que nada se deforme, no apreciamos que nada se mueva. Ello se debe a dos
peculiaridades de las vibraciones mecnicas que percibimos como sonido.
La primera es que las amplitudes de las vibraciones sonoras son, en general, muy pequeas. Por poner un ejemplo, la variacin de la presin sonora en una calle con un
trco moderado, debida al ruido de los coches y de los transentes, es aproximadamente una millonsima parte de la presin media del aire.
La segunda es que las vibraciones sonoras son muy rpidas para ser seguidas por
nuestra vista. Nosotros slo percibimos como sonidos las vibraciones mecnicas que
se producen dentro de un margen temporal adecuado a nuestra percepcin, en concreto, aqullas que realizan una oscilacin completa en un rango que va desde unas
20 veces por segundo hasta unas 20.000 veces por segundo.
Para obtener una imagen intuitiva de la vibracin sonora, podramos imaginar el
aire como si estuviera formado por pequeas bolitas o esferitas unidas por diminutos muellecillos, unas esferitas que estaran igualmente espaciadas en su posicin de
equilibrio y que oscilaran siguiendo el movimiento de la fuente sonora.
Este modelo es apropiado para simular las variaciones de la presin del aire que constituyen el sonido. El hecho de que las esferitas se aproximen entre s se corresponde
con un aumento de la densidad del aire y, por lo tanto, de la presin, mientras que el
que se alejen unas de otras representa la rarefaccin y la disminucin de la presin del
aire. Los muellecillos simulan la posibilidad de todo medio elstico de ser deformado,
as como su tendencia a recuperar la posicin de equilibrio.
Utilizando este modelo de las esferitas y los muelles, he confeccionado varios vdeos
didcticos, cuyos fotogramas han sido generados con Matlab. Estos vdeos nos ayudarn a asimilar los principales conceptos implicados en la vibracin sonora, los cuales
son estudiados en los apartados Simulacin de la vibracin del aire en un sonido
simple y Simulacin de la vibracin del aire en un fragmento sonoro complejo.
Espero que esta forma de representacin resulte til para entender en qu consiste la
2
vibracin del sonido y cmo se transmite por el aire el movimiento vibratorio desde
la fuente sonora hasta nuestros odos.
1.2.
Simulacin de la vibracin del aire en un sonido simple
Veamos un vdeo que simula a cmara lenta cmo vibra el aire cuando suena un
sonido simple, es decir, un sonido con una frecuencia y una amplitud estables y
sin armnicos. El vdeo sigue el modelo del aire formado por una serie de bolitas y
muellecillos que se desplazan cuando cambia la presin del aire como consecuencia
de la vibracin sonora.
El vdeo representa la vibracin del aire cuando suena la nota la4 generada articialmente, cuya frecuencia es de 440 Hz. He elegido para este ejemplo un sonido
simple porque, al ser su movimiento vibratorio muy sencillo y repetitivo, nos va a
permitir observar con facilidad los rasgos caractersticos de toda vibracin sonora y
de su propagacin. He ralentizado el movimiento 440 veces y he amplicado mucho
el desplazamiento de cada esferita para que se pueda apreciar la vibracin con facilidad. El sonido del vdeo, sin embargo, corresponde a la nota la4 tal cual, es decir, sin
ralentizar, por lo que la nalidad del sonido es meramente ilustrativa.
Figura 1.1: Vdeo que modeliza, ralentizada 440 veces, la vibracin del aire ocasionada por la nota
musical simple la4 .
Aunque la nalidad del vdeo es puramente didctica, he tratado de que el modelo sea
lo ms realista posible. Por ello cada cuadro del vdeo ha sido realizado con Matlab.
Este programa me ha permitido calcular la posicin instantnea de cada una de las
esferitas del modelo durante la emisin de este sonido. As, el vdeo simula lo que
ocurre en una imaginaria seccin cbica de aire de 2 metros de lado situada en un
espacio abierto, sin viento y sin obstculos, lo cual evita la necesidad de tener en
cuenta cualquier perturbacin en la propagacin del sonido.
Puesto que el sonido en realidad se propaga en todas las direcciones por igual, es
necesario pensar que el cubo est a gran distancia de la fuente sonora, de modo
que los movimientos de las esferitas puedan ser considerados como prcticamente
paralelos. Para ello suponemos que a la izquierda del cubo, a 100 metros o ms de
distancia, un altavoz potente est emitiendo la nota musical la4 que acabamos de or.
Suponemos tambin que la nota est ya sonando de una forma estable cuando el
vdeo se inicia.
Cada esferita del vdeo representa un volumen esfrico de aire de 2,8 cm de radio. En
su posicin de equilibrio la distancia entre los centros de estas esferas es de 9,69 cm.
He elegido esta distancia para que la longitud de onda del sonido analizado abarque
un nmero entero de esferitas en nuestra simulacin.
Ya que la propagacin de la vibracin se realiza de izquierda a derecha, en el vdeo
los muellecillos slo unen las esferitas en el sentido longitudinal. Esta es tambin
la razn de que las esferitas que se mueven sincronizadamente estn agrupadas en
paneles paralelos a las caras laterales del cubo.
Debemos suponer que la vibracin que vemos en esta simulacin est siendo provocada por la masa de aire que se encuentra a la izquierda del cubo, la cual, a su vez,
est siendo movida por el cono del altavoz que est emitiendo la nota musical la4 .
Cuando el cono del altavoz se desplaza a la derecha, desplaza a la derecha la masa de
aire que est en contacto inmediato con l, con lo que ste se comprime. Cuando se
comprime, su densidad aumenta y, por lo tanto, la presin que ejerce sobre lo que
le rodea se hace ms elevada. Ello hace que, a su vez, pero con un cierto retraso,
desplace y comprima el aire que sigue a continuacin, y as sucesivamente. Cuando
el cono del altavoz se desplaza hacia la izquierda, el vaco que deja atrae el aire de
sus inmediaciones, con lo que su densidad disminuye y su presin desciende. Esta

disminucin de la presin provoca, a su vez, la atraccin del aire vecino.
1.2.1.
Propagacin de la perturbacin a travs del aire
Los movimientos de la fuente sonora provocan una cadena de compresiones y rarefacciones que constituyen ondas de presin que se desplazan por el interior de la
masa de aire. Veamos cmo se producen.
Lo primero que observamos a simple vista en el vdeo es un cubo que vibra, estirndose y encogindose como si fuera una especie de fuelle, y lo hace de una manera
totalmente regular. La regularidad y simplicidad de esta vibracin es debida a que
estamos simulando un sonido simple, es decir, una nota musical sin armnicos.
Si nos distanciamos un poco de la pantalla para tener una visin de conjunto, podemos apreciar unas perturbaciones que se desplazan de izquierda a derecha. Estas
perturbaciones, que se corresponden con las alteraciones de la presin del aire, constituyen un movimiento ondulatorio, que es la manera en la que se propaga el sonido
desde la fuente sonora hasta nuestros odos.
En efecto, distinguimos varias reas donde los paneles de esferitas progresivamente se
amontonan, dando una sensacin de mayor densidad o, lo que viene a ser lo mismo,
de mayor presin. Estas reas de mayor densidad parecen surgir de la cara lateral
izquierda del cubo, viajar de izquierda a derecha y desaparecer por la cara lateral
derecha. Cada una de estas condensaciones que surge deja a su paso otra zona donde
los paneles de esferitas se van separando y en la que, por lo tanto, la densidad y la
presin del aire sern menores.
Podemos ver en el vdeo que estas condensaciones se renuevan una vez por segundo. En efecto, cada segundo parece surgir de la cara izquierda del cubo una nueva
condensacin, por lo que la frecuencia de las ondulaciones que apreciamos en este
vdeo es de 1 Hz. Teniendo en cuenta que en l se representa el movimiento vibratorio ralentizado 440 veces, la frecuencia real con la que se renuevan estas zonas de
presin en el aire ser de 440 veces por segundo, lo que coincide con la frecuencia
de la nota musical que est sonando, un la4 de 440 Hz.
Si midiramos con exactitud, mediante un editor de vdeo u otro programa similar, el

tiempo que tarda cada una de las condensaciones en recorrer el cubo, veramos que es
de 2,58 segundos. Como el lado del cubo representado mide 2 metros, en un segundo
cada condensacin recorrer 0,775 metros (2 2, 58 = 0, 775). Como la realidad es
440 veces ms rpida, la velocidad real en la que se propagara la perturbacin sera
de 341 m/s (0, 775440 = 341), lo cual es coherente con la velocidad de propagacin
del sonido en el aire.
1.2.2.
Movimiento individual de oscilacin
Sin embargo, si nos jamos en cada una de las esferitas nos daremos cuenta de que
no se van desplazando indenidamente hacia la derecha, sino que tienen nicamente
un movimiento oscilatorio horizontal en torno a su posicin de equilibrio: slo se
mueven realizando un sencillo vaivn de izquierda a derecha y de derecha a izquierda, en un rango muy reducido de desplazamiento respecto a su posicin central. Y
lo mismo ocurre con los paneles en los que se agrupan.
Adems, si observamos con un poco de detenimiento varias esferitas elegidas al azar
podremos comprobar que todas ellas realizan el mismo movimiento. Unas se mueven
antes y otras despus en funcin del panel en el que se encuentran, pero todas las
esferitas del cubo oscilan exactamente de la misma manera.
Dado que en nuestra simulacin hemos elegido un sonido simple, el movimiento de
cada esferita es un sencillo vaivn. Este sencillo vaivn repite el movimiento que ha
efectuado el cono del altavoz al emitir el sonido.
Para observar con detalle el movimiento de una esferita cualquiera he realizado un
vdeo en el que aparece la oscilacin de una esferita del cubo aislada, ralentizada ahora
880 veces, es decir, el doble que en el vdeo de la gura 1.1. Conforme va oscilando
se va dibujando la forma de su movimiento en el tiempo.
Tiempo
Desplazamiento
Figura 1.2: Vdeo con el movimiento de oscilacin de una esferita cualquiera del cubo de la gura
1, ralentizado 880 veces.
Vemos que la forma de la grca que dibuja el movimiento de oscilacin de cada

esferita en el tiempo es una sucesin de eses. En efecto, en el momento en el que
la esferita alcanza su mximo desplazamiento hacia la derecha se detiene instantneamente y cambia de sentido, empezando a moverse hacia la izquierda. Entonces
va aumentando progresivamente su velocidad hasta pasar por la posicin de equilibrio, a partir de la cual va frenndose gradualmente hasta alcanzar su desplazamiento
mximo hacia la izquierda. En ese momento de nuevo se detiene instantneamente
y cambia de sentido, movindose ahora hacia la derecha, recorriendo de la misma
manera el mismo camino, pero en sentido opuesto, hasta llegar otra vez a su desplazamiento mximo por el lado derecho, donde inicia una nueva oscilacin.
Observamos que la esferita tarda 2 segundos en realizar una oscilacin completa. Esta
duracin es el periodo de oscilacin de la esferita que vemos en la pantalla. Como el
vdeo est ralentizado 880 veces, el periodo real de la oscilacin de este sonido ser
de 2,3 milsimas de segundo (2 880 = 0, 0023).
Visto de otra manera, en un segundo la esferita de este vdeo realiza media oscilacin completa. Eso quiere decir que su frecuencia de oscilacin es de 0,5 Hz. Al
estar ralentizado 880 veces, la frecuencia real de la oscilacin es de 440 Hz, que es
7
la frecuencia de vibracin del la4 que est sonando. Comprobamos, as pues, que la
frecuencia de oscilacin de las esferitas es la misma que la frecuencia del movimiento
ondulatorio de propagacin, es decir, la frecuencia con la que se renuevan las condensaciones en un punto del espacio que hemos visto en el apartado anterior.
1.2.3.
De la oscilacin individual a la propagacin ondulatoria
Al or la palabra ondulacin nos viene enseguida a la mente la imagen de las olas del
mar o la de los crculos concntricos que surgen en un estanque de agua al arrojar
una piedra. Pero en nuestra simulacin no vemos nada que ondule, nada que tenga la
forma de una onda; a lo ms, intuimos un cierto carcter ondulatorio en la sucesin
de condensaciones y rarefacciones. Ello se debe a que las ondas mediante las que
se propaga el sonido son ondas de presin longitudinales, mientras que las ondas
del estanque o del mar son principalmente transversales.
Voy a explicar a continuacin cmo son las ondas longitudinales mediante las que se
propaga el sonido. Veremos cmo surgen las ondas sonoras a partir del movimiento
individual de oscilacin, que reproduce la oscilacin de la fuente sonora, y de la
elasticidad del medio, en este caso, el aire. Comprenderemos, as mismo, que como
consecuencia de la elasticidad del medio, la forma de la onda en el espacio es la
misma que la forma de la oscilacin de la fuente sonora en el tiempo.
En trminos de nuestra simulacin, vamos a estudiar cmo a partir del movimiento
oscilatorio de cada una de las esferitas se genera el movimiento ondulatorio mediante
el que se propaga la perturbacin.
Para ello he fabricado un vdeo con una la aislada del cubo de la gura 1.1, en el que
las esferitas aparecen oscilando, pero ahora con el movimiento ralentizado 880 veces.
La oscilacin de cada una de las esferitas se va dibujando en el tiempo con trazos de
ocho colores distintos. La lnea ondulada verde que aparece por encima y por debajo
de las esferitas indica la variacin de la presin del aire a lo largo del espacio.
Tiempo
Espacio
Figura 1.3: Vdeo con el movimiento oscilatorio de una la de esferitas.
Analicemos con un poco de detenimiento lo que vemos en este vdeo y lo que sucede
en la realidad que simula.
a) En las ondas longitudinales la direccin de propagacin es la misma que la de la oscilacin
Podemos apreciar con claridad que la oscilacin de cada una de las esferitas se realiza en la misma direccin que la propagacin de las perturbaciones, en este caso,
de izquierda a derecha. Por eso los desplazamientos individuales de las esferitas, al
oscilar en torno a su posicin de equilibrio, se camuan en el movimiento general
de propagacin, lo que explica que en el cubo del aire vibrando de la gura 1.1 no
se observe ninguna forma ondulada en el espacio.
En la realidad, los pequesimos desplazamientos del aire, representados por la oscilacin de las esferitas, oscilan en la misma direccin en la que se propaga el sonido
por el espacio, repitiendo el movimiento de la fuente sonora. Este tipo de ondas se
llaman longitudinales y mediante ellas se propaga el sonido.
b) Los desfases provocados por la elasticidad transforman los desplazamientos oscilatorios

del aire en oscilaciones de la presin
En el vdeo observamos que la elasticidad de los muellecillos causa retrasos en la

transmisin del movimiento oscilatorio de las esferitas. Vemos que la fuente del movimiento de cada esferita es la que est situada inmediatamente a su izquierda; ahora
bien, la elasticidad de la unin entre la esferita impulsora y la impulsada hace que los
constantes cambios de velocidad del movimiento oscilatorio de la esferita impulsora
se transmitan con retraso. Esto explica que los dibujos en forma de ese que cada esferita va trazando en el tiempo, an siendo iguales en la forma, estn desfasados, lo
que queda reejado por los distintos colores con los que estn pintados.
A su vez, el retraso en la transmisin del movimiento provoca que en unos momentos
las esferitas se vayan aproximando y en otros se vayan alejando, con las correspondientes compresiones y elongaciones de los muellecillos que las unen.
Tiempo
Tiempo
Para entender cmo surge la oscilacin de la presin a partir de los desfases derivados
de la elasticidad, presento un nuevo vdeo con un detalle ampliado del movimiento de
las dos primeras esferitas. En el rectngulo de la derecha se va trazando la separacin
entre ellas, o lo que es lo mismo, el grado de compresin o elongacin del muelle
que las une.
Desplazamiento
Distancia entre esferitas
Figura 1.4: Vdeo con la oscilacin de las dos primeras esferitas y la evolucin de sus distancias.
10
Podemos apreciar en este nuevo vdeo cmo la evolucin en el tiempo del grado de
compresin o elongacin del muelle reproduce, aunque desfasada, la forma y el ritmo
de la oscilacin de las esferitas individuales. En este caso, como estamos analizando
un sonido simple, ambas oscilaciones tienen la forma de una sucesin de eses, que
repiten la oscilacin de la fuente sonora.
En efecto, en la vibracin real la presin del aire en cualquier punto del espacio
oscila con la misma forma y ritmo que los pequesimos desplazamientos de aire
provocados por la oscilacin de la fuente sonora.
c) La onda que se desplaza por el espacio tiene la misma forma que la oscilacin en el tiempo
Como consecuencia de los desfases debidos a la elasticidad, se produce una cadena de condensaciones y rarefacciones del aire que se extiende por el espacio. Estas
variaciones de la presin del aire a lo largo del espacio constituyen la onda sonora.
Podemos hacernos una idea intuitiva de lo que es la onda sonora si nos jamos en
la lnea ondulada verde del vdeo de la gura 1.3. All podemos ver tambin que la
forma de esta onda que se desplaza imita los dibujos de colores que las oscilaciones
de cada una de las esferitas van trazando en el tiempo.
En efecto, los retrasos producidos por la elasticidad de los muelles son tambin la
causa de que el movimiento oscilatorio que realizan las esferitas en el tiempo se dibuje en el espacio. Si miramos con un poco ms de atencin ese vdeo, podremos
apreciar que, en un instante cualquiera, la secuencia a lo largo del espacio de aproximaciones y separaciones entre las esferitas reproduce la secuencia de aproximaciones
y separaciones de las dos primeras esferitas a lo largo del tiempo.
Como la fuente sonora est a la izquierda, lo que est ms a la derecha en el espacio es
lo que ha sucedido antes en el tiempo, pues es lo que ha tardado ms en llegar. Puesto
que la evolucin de las distancias entre las esferitas repite el movimiento de la fuente
sonora, conforme se encuentren ms a la derecha o sea, ms lejos de la fuente,
su estado se corresponder con un momento anterior. Por poner un ejemplo, la distancia entre las dos ltimas esferitas de la derecha en un instante determinado es la
misma que la que haba en un instante anterior entre la penltima y la antepenl11
tima, que, a su vez, es la misma que en otro instante anterior se produca entre la
antepenltima y la que le antecede, y as sucesivamente.
As pues, en un instante dado, las distancias entre las sucesivas esferitas a lo largo de
la la reejan la historia del movimiento de la fuente sonora.
Podemos observar tambin en este vdeo que la secuencia de separaciones entre las
esferitas se va desplazando por el espacio. Lo que se desplaza a lo largo del espacio no son las esferitas, que slo tienen un pequeo movimiento oscilatorio, sino el
patrn de proximidad y lejana entre ellas. Lo mismo sucede en la vibracin real,
donde lo que se desplaza no son las masas de aire, sino la onda de presin y con ella
la informacin que lleva implcita, que no es otra sino la informacin de la fuente
sonora.
d) En un sonido simple la onda de presin del aire tiene forma de ese y una longitud definida
Veamos ahora lo que es especco de un sonido simple y, en concreto, de la onda

que corresponde a la nota la4 de nuestro ejemplo.
En el vdeo de la gura 1.3 podemos ver que la acumulacin de los desfases provoca que todas las esferitas que estn separadas entre s por ocho muellecillos oscilen
siempre sincronizadamente.
En efecto, en los dibujos en forma de ese que trazan las esferitas al oscilar podemos
apreciar que los retrasos con los que todas ellas repiten el movimiento de la primera de
la izquierda se van incrementando linealmente, es decir, segn la misma cantidad.
La acumulacin de los sucesivos retrasos hace que en la novena esferita el desfase
respecto a la primera coincida exactamente con una oscilacin completa, de modo
que ambas oscilan de manera sincronizada. Los dibujos de las esferitas que oscilan
sincronizadamente estn pintados en el vdeo con el mismo color.
Como consecuencia de ello, las separaciones entre las esferitas forman un patrn en el
espacio que se repite cada ocho esferitas. En cualquier momento en el que paremos el
vdeo de la gura 1.3, si tomamos como primera la esferita que en ese momento est
entre los muelles ms comprimidos, siempre comprobaremos que la quinta esferita
12
estar entre los muelles ms distendidos y la novena, de nuevo, entre los muelles ms
comprimidos.
Al margen de las imprecisiones debidas al reducido nmero de esferitas, este patrn
de compresiones y elongaciones representa la onda de presin sonora en el espacio.
Podemos observar en ese vdeo que los valores mximos de presin, representados
por los picos de la grca verde, vienen a coincidir con los puntos del espacio en
los que los muellecillos estn ms comprimidos, mientras que los valores mnimos
coinciden con aquellos puntos en los que los muelles estn ms estirados.
Para apreciar mejor la forma de la onda en el espacio en este sonido simple, presento
una instantnea de la cara frontal del cubo de la gura 1.1, en la que he trazado la
grca de la presin del aire. He teido cada esferita siguiendo la misma serie de
colores del vdeo de la gura 1.3, lo que facilita el reconocimiento del patrn.
Figura 1.5: Cara frontal del cubo con la grca de la onda de presin en el espacio.
La longitud de onda es la distancia entre dos puntos equivalentes de la perturbacin

o, lo que en nuestra simulacin viene a ser lo mismo, entre dos esferitas del mismo
color. En este caso, dado que la distancia entre las esferitas en la posicin de equilibro
es de 9,69 cm, esta longitud es de 77,5 cm (9,69 x 8), lo que corresponde a la longitud
de onda esperada para la nota la4 a 440 Hz con una velocidad del sonido de 341
m/s.
13
Si ahora volvemos de nuevo al vdeo de la gura 1.3 y prestamos un poco de atencin,

podremos apreciar tambin que en el tiempo en el que cualquier esferita realiza una
oscilacin completa, es decir, en el tiempo del periodo de la oscilacin en este vdeo
2 segundos, el patrn que representa la onda de presin ha recorrido exactamente
la distancia que lo dene, en este caso el espacio abarcado entre los centros de nueve
esferitas.
De la misma manera, en la vibracin real de un sonido simple la longitud de la onda
coincide con la distancia que recorre la onda de presin durante el tiempo que
dura una oscilacin completa, es decir, el periodo de la oscilacin. En nuestro
ejemplo, como el periodo de la oscilacin real es, redondeando, de 2,3 milsimas de
segundos ((2 880) = 0, 002273) y la velocidad del sonido que hemos supuesto es
de 341 m/s, la longitud de onda ser de 77,5 cm ((2 880) 341 = 0, 775) , lo que
coincide con la medida que hemos obtenido a partir de esta gura 1.5.
1.3.
Simulacin de la vibracin del aire en un fragmento sonoro

complejo
El carcter sencillo y repetitivo de la vibracin en el caso de un sonido simple se

debe a que no posee armnicos y su amplitud y frecuencia permanecen constantes
a lo largo de toda su duracin. Pero la realidad sonora es mucho ms compleja: los
sonidos van cambiando con el tiempo; es frecuente que varias notas distintas estn
sonando a la vez; y puede que ni siquiera se trate de un fragmento musical, sino de
una conversacin o del ruido de trco, por ejemplo.
Para hacernos una idea de cmo vara la presin del aire en el caso de un sonido complejo he fabricado un vdeo que representa la vibracin ocasionada por un brevsimo
fragmento del inicio de la Quinta Sinfona de Beethoven. El sonido es meramente
ilustrativo, pues la vibracin que simula el vdeo correspondera solamente a 27 milsimas de segundo. He utilizado el mismo modelo del cubo de aire simulado por
esferitas unidas por muellecillos. La nica diferencia es que ahora, para que se pueda
apreciar con ms facilidad el movimiento individual de oscilacin, he destacado con
ms luz una esferita.
14
Figura 1.6: Vdeo que modeliza, ralentizada 440 veces, la vibracin del aire ocasionada por un
fragmento de 27 milsimas de segundo del inicio de la Quinta Sinfona de Beethoven.
Si nos jamos en el movimiento de oscilacin de la esferita ms iluminada, no encontramos nada parecido al sencillo vaivn del vdeo que simula un sonido simple.
En efecto, en el caso de un fragmento sonoro real, con toda su complejidad, los pequesimos desplazamientos de aire no consisten ya en una simple oscilacin de tipo
pendular que se repite una y otra vez, sino que se trata de una oscilacin bastante ms
compleja, que se va transformando con el transcurso del tiempo. Adems, y como
consecuencia de ello, tampoco la onda de presin en el espacio tendr una forma
ja, sino que ir cambiando constantemente. Por eso, conceptos como periodo y
frecuencia de la oscilacin o longitud de onda ya no sern tan evidentes.
Pero, lo esencial de todo movimiento ondulatorio se cumple tambin en el caso de
cualquier sonido complejo, sea o no musical.
Dado que en ambas simulaciones hemos supuesto las mismas condiciones para el aire,
podemos apreciar que en los dos casos el retraso ocasionado por la elasticidad de los
muellecillos es el mismo y, en consecuencia, la velocidad con la que se propagan las
perturbaciones es tambin igual.
Y lo que es ms importante, aunque el movimiento de oscilacin sea complejo, observamos que tambin ahora todas las esferitas del cubo repiten, cada una con su
retraso, el mismo movimiento, el movimiento que est inducido por la fuente. Esto
nos ilustra sobre lo que ocurre en la vibracin del aire. En el aire la oscilacin de la
presin en cualquier punto del espacio repite, con su correspondiente desfase
15
en funcin de la lejana, las variaciones de la presin originadas por la fuente

sonora al emitir cualquier sonido.
As mismo, vemos que tambin en el caso de un fragmento sonoro complejo, la
secuencia de distancias entre las esferitas reproduce la forma de la oscilacin de cada
una de ellas. En lo que concierne al aire, la onda de presin a lo largo del espacio
adquiere la misma forma que la oscilacin de la presin en un punto a lo largo del
tiempo.
1.4.
Conclusin
Mediante la simulacin por ordenador de la vibracin sonora en el aire, hemos experimentado qu signica que el sonido sea una vibracin mecnica que se propaga
por un medio elstico. Hemos visto que el movimiento oscilatorio de la fuente sonora, sea simple o complejo, se repite en cualquier punto del medio elstico por el
que se propaga, dando lugar a oscilaciones de la presin. As mismo, hemos comprendido cmo en la transmisin del movimiento oscilatorio se generan ondas de
presin que toman la misma forma que la oscilacin de la fuente. En consecuencia,
podemos concluir que la informacin sonora est contenida tanto en la oscilacin de
la presin en cualquier punto del espacio, como en las formas que va adquiriendo la
onda al propagarse.
16
Captulo 2
La seal de audio
2.1.
Representacin del sonido
Dada la rapidez y el reducido rango de las oscilaciones de la presin del aire que dan
lugar al sonido, nosotros no podemos observarlo directamente. Sin embargo, con
el avance de la tecnologa, se han desarrollado diversos sistemas capaces de registrar
el movimiento vibratorio que lo constituye, lo que ha permitido, por un lado, reproducirlo ms tarde a voluntad y, por otro, estudiarlo y hasta manipularlo. Todos
estos mtodos estn basados en conseguir que la forma de la vibracin sonora deje
un rastro, una huella, es decir, una seal.
En efecto, toda la informacin que lleva consigo el sonido est contenida dentro de
la forma de la vibracin. La seal de audio es el dibujo que esa vibracin traza
en el tiempo. En el caso del aire, la seal de audio viene dada por la forma de la
oscilacin de la presin en torno a su valor medio, en un punto determinado del
espacio. Bastar, as pues, con obtener el dibujo de esa oscilacin de la presin para
lograr una representacin del sonido. Cuando el contenido de la vibracin sonora es
una pieza o un fragmento de msica, a esa representacin del sonido se la denomina
seal musical.
Desde mediados del siglo XIX se desarrollaron varios ingenios para atrapar el sonido, es decir, para guardarlo y volver a reproducirlo posteriormente. Surgieron los
primeros fongrafos, que, como su nombre indica, pretendan escribir el sonido.
17
Aquellos fongrafos consistan en una membrana capaz de vibrar solidariamente con

el aire y que, a travs de una serie de palancas intermedias que ampliaban la vibracin, transmita su movimiento a un no estilete. El estilete iba dibujando la forma
de la oscilacin en una capa de cera o en un papel ahumado colocado sobre la supercie de un cilindro que rotaba. De esta manera, la huella de la vibracin quedaba
registrada.
Figura 2.1: Un fongrafo. Dibujo de la poca.
Con el desarrollo de la electricidad, las oscilaciones mecnicas de la membrana que

captaba el sonido pasaron a transformarse en oscilaciones de la tensin elctrica, las
cuales, a su vez, podan de nuevo ser transformadas en vibraciones mecnicas. Nacan el micrfono y el altavoz elctrico. La aparicin de las vlvulas electrnicas y,
luego, de los transistores permiti controlar la amplicacin y mejorar la delidad
del registro sonoro, as como difundir por radio la seal a lugares remotos. Posteriormente se desarroll el registro de la seal de audio en un soporte magntico, lo
que facilit la edicin del sonido.
Todas estas representaciones del sonido que imitan de manera ms o menos directa
el dibujo de la vibracin sonora se conocen con el nombre de seal analgica de
audio, con independencia de que el soporte utilizado sea cera, vinilo, cinta magntica
o cualquier otro.
Pero desde hace unas dcadas el avance de la tecnologa ha permitido dar un paso
ms y transformar la oscilacin de la presin del aire en una lista de nmeros. Para
ello es necesario tomar una cantidad muy elevada de mediciones por segundo de la
18
seal analgica. Mediante estas mediciones, que recogen con la precisin deseada el
movimiento vibratorio original, se digitaliza la seal sonora. Obtenemos as la lista
de nmeros que constituye la representacin digital de la vibracin y que recibe, por
ello, el nombre de seal digital de audio. Conforme mayor sea la cantidad de muestras obtenidas es decir, la frecuencia del muestreo, mejor ser la aproximacin al
movimiento vibratorio real que obtendremos.
La transformacin en nmeros de la vibracin sonora permite que el tratamiento del
sonido se pueda realizar simplemente mediante operaciones matemticas simples. Por
ejemplo, amplicar un sonido consiste en multiplicar cada una de sus muestras por
una cantidad constante; para mezclar dos grabaciones digitales slo hay que sumar
los valores correspondientes de cada una de sus muestras, etc. Adems, la seal digital
de audio, al tratarse solamente de una lista de nmeros, no se pierde ni se deteriora
por muchas veces que sea reproducida. Y a partir de esa lista de nmeros se pueden
generar con facilidad grcas e imgenes que facilitan la observacin y el estudio de
los sonidos.
2.2.
Un ejemplo de registro digital
Veamos mediante un ejemplo en qu consiste el registro de la seal de audio digital.

Un sistema muy sencillo y al alcance de cualquiera puede estar formado simplemente por un micrfono de condensador con salida digital y conectado a un ordenador.
La cpsula de un micrfono de condensador posee una membranita muy na que
vibra como consecuencia de las variaciones de la presin del aire que llegan hasta ella.
Esta membranita constituye una de las dos placas de las que consta un condensador
elctrico. Al desplazarse esta membranita, debido a la vibracin del aire, se acerca o
se aleja de la placa ja del condensador, lo que produce un cambio en la capacitancia
de ste, un cambio que es proporcional al desplazamiento de la membranita. De
esta manera las vibraciones mecnicas que dan lugar al sonido se transforman en
variaciones de la tensin elctrica.
Si a este mecanismo le unimos un sistema capaz de medir con rapidez esas variaciones
de la tensin elctrica, tendremos ya una herramienta que nos permitir transformar
19
en nmeros lo que sucede en la vibracin sonora. Se trata de un pequeo circuito

integrado llamado Conversor Analgico Digital (CAD o ADC, por sus siglas en
ingls). La cantidad de mediciones que se toman por segundo se llama frecuencia de
muestreo. Una frecuencia de muestreo estndar con la que se puede conseguir ya la
mxima delidad es 44.100 muestras por segundo.
Hay que tener en cuenta que las muestras no contienen los valores absolutos de las
variaciones de la presin del aire, sino valores que son relativos entre s, habitualmente
normalizados entre 1 y -1. El valor 0 corresponde a la presin ambiental del aire
en ausencia de sonido y los valores 1 y -1 a la presin sonora mxima y mnima
respectivamente que el sistema puede registrar.
Por su parte, el ordenador nos proporciona un lugar para almacenar las mediciones que vamos obteniendo y nos permite tambin generar, a partir de esta lista de
nmeros, todo tipo de grcas e imgenes.
Supongamos que queremos registrar y guardar en un archivo de ordenador los compases iniciales de la Quinta Sinfona de Beethoven interpretada por una orquesta cualquiera en un da cualquiera. Los nmeros obtenidos es decir, las medidas o muestras
que resulten de digitalizar la oscilacin de la presin del aire en torno a su valor medio en el lugar en el que hayamos colocado el micrfono constituirn la seal de
audio digital de esta interpretacin concreta. Y esta lista de nmeros ser el archivo
de sonido que guardaremos en el ordenador.
Para ilustrar cmo surge la seal de audio digital a partir de la vibracin sonora, he
fabricado un vdeo con imgenes obtenidas mediante Matlab. En el vdeo se simula,
a cmara lenta, el movimiento arriba y abajo de la membranita del micrfono, provocado por la variacin de la presin del aire en el punto donde se halla colocado,
cuando suena un pequesimo fragmento del inicio de la Quinta Sinfona de Beethoven. El resultado de ese movimiento se va dibujando en el panel de la izquierda,
dibujo que da lugar a la seal analgica de ese fragmento. En el panel de la derecha
va apareciendo el valor numrico de las muestras que se van obteniendo, es decir, lo
que constituye la seal digital.
El movimiento que apreciamos en el vdeo est ralentizado 1.000 veces. Aunque el
sonido es meramente ilustrativo, hay que tener en cuenta que el movimiento de la
membrana, el dibujo de la seal y el valor numrico de las muestras que aparecen en
20
el vdeo se corresponden a las 20 primeras milsimas de segundo de esa grabacin

concreta de la interpretacin de esta sinfona de Beethoven realizada por esa orquesta
en ese momento.
Figura 2.2: Vdeo que ilustra el proceso de digitalizacin sobre un fragmento de 20 ms de los
primeros compases de la Quinta Sinfona de Beethoven.
El espacio de color azul viene a representar el interior de la cpsula del micrfono,

mientras que la raya horizontal de color amarillo que se desplaza arriba y abajo es
la membranita del micrfono que se mueve dentro de la cpsula, aunque la medida
real del desplazamiento de la membranita por la cpsula del micrfono sera de unos
pocos micrmetros.
La seal analgica es la grca de color blanco que se dibuja desde la cpsula del
micrfono como consecuencia de la transformacin de la oscilacin de la presin del
aire en oscilacin de la tensin elctrica. Las pequeas cruces verdes que estn sobre
esta grca de la seal representan los puntos en los que se van tomando las muestras
para la digitalizacin. Estas muestras se toman a intervalos de tiempo iguales, lo que
se llama la frecuencia de muestreo, que en este caso ha sido de 25.000 muestras por
segundo.
Esas mediciones van apareciendo en el recuadro de la derecha. Si detenemos el vdeo
en un instante cualquiera, podemos comprobar que el ltimo nmero que aparece,
el situado en la parte superior de la lista, corresponde a la posicin de la membranita
en ese momento. La lista de todas estas muestras numricas es la seal digital de este
21
fragmento sonoro. Estos nmeros se pueden almacenar en un archivo de ordenador,

de modo que el sonido quede registrado.
Si continuramos digitalizando el sonido de la Sinfona completa a tiempo real y
guardramos la enorme lista de nmeros, sin alteracin alguna, obtendramos exactamente esa interpretacin concreta, tal como fue recogida por el micrfono. Y lo
ms interesante es que si conservramos esa lista de nmeros, no ya en un ordenador
o en un CD, sino, por poner un ejemplo disparatado, uno detrs de otro en un papel,
tendramos exactamente la grabacin original, sin que se perdiera nada de ella.
A partir de esta seal digital de audio que puede ser guardada en un archivo del ordenador es posible reproducir el sonido de esta interpretacin. El sistema de sonido
de cualquier ordenador posee un circuito integrado capaz de convertir los nmeros en variaciones de la tensin elctrica, un Conversor Digital Analgico (CDA, o
DAC, por sus siglas en ingls). De esa manera se puede recuperar la misma forma
original de la seal analgica. Idealmente, el altavoz al que tenemos conectado el
ordenador vibrar siguiendo la lista de nmeros de la seal de audio que tenemos
almacenada y provocar las mismas oscilaciones de la presin de aire que haban sido
registradas.
2.3.
El editor de sonido
Veamos ahora cmo podemos representar y observar con ayuda de un editor de sonido la seal digital de ese fragmento sonoro. Existen muchos editores de sonido,
algunos de ellos, como Audacity, de libre distribucin. Mediante cualquiera de ellos
podemos trazar, a partir de los nmeros que hemos guardado en el archivo del ordenador, la grca de la seal que hemos registrado.
Abrimos desde el editor de sonido el archivo con la seal de audio digital de ese
fragmento de msica. Elegimos una presentacin en la que podamos ver todo el
fragmento en una sola pantalla, para lo que, probablemente, necesitaremos hacer un
zoom negativo. Veremos y oiremos algo similar a lo siguiente:
22
Figura 2.3: Vdeo con la seal de audio de los compases iniciales de la Quinta Sinfona de Beethoven.
En el vdeo podemos observar la representacin de la seal de audio de un fragmento

de aproximadamente 21 segundos de duracin. El valor de la coordenada vertical
representa la variacin de la presin del aire en torno a su valor medio en el punto
en el que estuviera colocado el micrfono en el momento de la grabacin. Dado que
los valores de presin que muestran las grcas de las seales de audio no son valores
absolutos, sino relativos, no se indica ninguna unidad de presin.
Comprobamos a simple vista que esa mancha verde, la seal de audio, guarda cierta
relacin con lo que estamos oyendo. Por ejemplo, los niveles sonoros ms fuertes
coinciden con desplazamientos verticales ms amplios, y viceversa. Pero en realidad
lo nico que vemos son unas manchas ms o menos amplias con un perl bastante
simtrico y muy escarpado.
En efecto, con esta presentacin no apreciamos el detalle de la vibracin sonora, no
podemos ver cmo se ha movido la membrana del micrfono en cada instante, ni
por lo tanto, cmo ha variado la presin del aire que ha hecho que nuestro tmpano
vibrara. Esta grca consta aproximadamente de 1.000.000 de muestras, por lo que no
podemos ver los detalles. Ahora bien, basta hacer sucesivos zoom ahora positivos
en nuestro editor de sonido para acercarnos al interior de la seal. Obtendremos una
grca similar a la siguiente:
23
Figura 2.4: Fragmento de 50 ms de la seal de audio del inicio de la Quinta Sinfona de Beethoven.
En esta imagen s podemos observar con bastante detenimiento cmo ha sido la

vibracin sonora en un pequeo intervalo temporal. Debido a que la grca est
representando solamente 50 milsimas de segundo (en concreto, desde el segundo 2
hasta el segundo 2,05), ahora es posible apreciar con detalle la vibracin.
Vemos que esa grca va dibujando un movimiento de subidas y bajadas que oscilan
en torno a un valor central. Esta grca es el resultado de unir los valores de cada
una de las muestras digitales que han sido tomadas en el momento de la grabacin
y que han constituido la seal de audio. Por lo tanto, podemos decir que la grca
verde representa la oscilacin del valor de la presin del aire en el punto donde estaba
colocado el micrfono.
Si seguimos la forma de la grca verde en la pantalla utilizando un dedo o el ratn
del ordenador, nos estaremos haciendo una idea bastante intuitiva, como si fuera
a cmara lenta, de los pequesimos desplazamientos sucesivos que ha realizado la
membrana del micrfono que ha registrado el sonido. Mediante el editor de audio
podemos movernos por las barras de desplazamiento hacia la izquierda y la derecha y
recorrer toda la seal, de modo que podemos observar toda la vibracin sonora con
el detenimiento que queramos.
24
2.4.
El osciloscopio
Pero lo que realmente nos interesara para estudiar el movimiento vibratorio que es
el sonido sera ver con este mismo detalle el dibujo de la seal de audio mientras
omos lo que est representando. Con el editor de sonido podemos conseguir algo
aproximado si hacemos que la ventana en la que se representa la seal se vaya actualizando conforme la msica va sonando. Pero la forma idnea de representar en vivo
las vibraciones sonoras es mediante un osciloscopio.
Un osciloscopio es un instrumento de observacin y medicin que hace pasar a tiempo real la seal de audio por una ventana de observacin. En Teora de Seal se llama
ventana de observacin a la funcin matemtica que recorta un fragmento de la seal
de un determinado tamao.
Para simular un osciloscopio he realizado un vdeo en el que podemos ver y escuchar
sincronizadamente la oscilacin de los mismos compases iniciales de la Quinta Sinfona de Beethoven del vdeo anterior. He elegido una ventana de observacin de
50 milsimas de segundo porque ese tamao es lo sucientemente corto como para
que se pueda apreciar el detalle de la vibracin y lo sucientemente largo como para
permitirnos observar la forma de las oscilaciones.
Figura 2.5: Vdeo con la representacin en un osciloscopio simulado de los compases iniciales de la
Quinta Sinfona de Beethoven.
25
Podemos entender de manera intuitiva en qu consiste un osciloscopio si imaginamos que la seal de audio, la grca de la vibracin, va pasando por delante de nuestra
ventana de observacin a la vez que va sonando, entrando por la derecha y saliendo
por la izquierda. Algo as como si tuviramos la grca de la seal de todo el fragmento sonoro escondida a la derecha de la ventana del osciloscopio (una ventana en
la que caben 50 milsimas de segundo) y la hiciramos pasar de derecha a izquierda
por delante de nuestra ventana a la misma velocidad con la que est sonando.
El hecho de ver casi simultneamente un fragmento de 50 milsimas de segundo nos
permite estudiar una realidad como la vibracin sonora que cambia tan rpidamente
que de otro modo sera imposible observar. Mediante esta especie de osciloscopio
digital podremos apreciar la forma de la vibracin que est sonando y su evolucin
conforme el sonido va cambiando. Podemos parar el vdeo en cualquier momento y
analizar la forma de la vibracin en las 50 milsimas de segundo correspondientes al
momento en el que lo hemos detenido.
Mediante este vdeo-osciloscopio podemos apreciar que cuando suena una nota musical aislada las formas de la vibracin tienden a repetirse, lo que nos produce la impresin de que en ese momento el movimiento de la grca se hubiera detenido o
ralentizado. En realidad estamos viendo pasar la grca a la misma velocidad que
antes, pero, como las formas de la oscilacin se repiten muchas veces con escasas
variaciones, la sensacin ptica que obtenemos es ms esttica.
Esta repeticin, unida al ritmo en el que se actualizan los cuadros en el vdeo y a
la persistencia en nuestra retina de las imgenes, nos produce diferentes ilusiones
pticas: a veces parece que las formas de la oscilacin se dirigieran a la derecha, otras
a la izquierda, otras parecen casi detenerse y en otras ocasiones da la impresin de
que se superpusieran dos vibraciones distintas. Pero estas ilusiones pticas no nos
interesan ahora, pues nuestra atencin solamente debe estar dirigida a la forma de la
vibracin y a su evolucin.
2.5.
Conclusin
Al margen de las numerosas utilidades prcticas en los campos del registro, edicin
y difusin de las obras musicales o de los acontecimientos sonoros de todo tipo, la
26
representacin digital del sonido ofrece muchas posibilidades para el estudio acstico.
Puesto que la seal de audio digital es una representacin dedigna de la vibracin
sonora, a partir de ella podemos obtener con facilidad todo tipo de grcas e imgenes
que nos ayudarn a entender el sonido y la relacin entre los parmetros fsicos de
la vibracin y nuestra percepcin. As mismo, podremos utilizar tcnicas numricas
para extraer la informacin que contiene.
27
Captulo 3
Caractersticas de los sonidos musicales
3.1.
Introduccin
Imaginemos que hacemos escuchar a un grupo de personas de distintas edades, culturas y formacin musical varios fragmentos sonoros y les pedimos que nos digan
en cada caso cundo se trata de msica y cundo no. Con independencia de instrumentos, de anaciones y escalas o de su procedencia cultural, nadie dudar en decir
si lo que est escuchando es msica o no lo es.
En efecto, distinguimos con facilidad los sonidos propios de la msica del ruido que
produce un atasco de trco, o del murmullo de una fuente de agua, o de las palabras
de una conversacin, por poner unos ejemplos. Ciertamente, hay circunstancias en
las que esta distincin no resulta tan obvia, como, por ejemplo, cuando en una obra
musical contempornea se utilizan los ruidos procedentes de una fbrica. Pero, al
margen de casos similares, todos sabemos reconocer si lo que est sonando son o no
son sonidos musicales.
Ahora bien, en qu consisten estas diferencias que percibimos? Las seales de audio
que contienen informacin musical tienen alguna particularidad que las hace distintas de otros tipos de seales sonoras? Por qu el ruido se considera lo opuesto al
sonido musical? Este captulo va a tratar de responder a estas cuestiones, mostrando
las peculiaridades que poseen las vibraciones de los sonidos que consideramos musicales.
28
3.2.
Ruido y sonido musical
Habitualmente se contrapone el sonido musical al ruido. Si bien esta oposicin es

de gran utilidad para ayudarnos a entender qu es lo especco del sonido musical,
necesitamos precisar antes qu entendemos por sonido musical y en qu sentido
usamos la palabra ruido, pues este trmino tiene varias acepciones.
Cualquier sonido puede ser utilizado con un propsito musical, como, por ejemplo,
los sonidos de los instrumentos de percusin, los efectos sonoros que se generan en
la msica electrnica o los ruidos diversos que se pueden incluir dentro de una obra
de msica. Pero por sonido musical, en sentido estricto, vamos a entender aqu
solamente aquel sonido en el que podemos identificar una altura tonal, es decir,
aqul del que podemos decir que es un re o un la o cualquier otra nota.
Por otra parte, en el sentido cotidiano del trmino, ruido es cualquier sonido no
deseado. As, si el vecino de al lado est escuchando pera y a m no me apetece
nada or la pera que pone mi vecino, esa pera, paradjicamente, es ruido para m.
Este es el sentido en el que se utiliza la palabra ruido en acstica ambiental, donde el
objetivo es atenuar las molestias que el sonido indeseado puede ocasionar.
As mismo, desde el punto de vista de la Teora de la Informacin, ruido es cualquier
perturbacin en la transmisin del mensaje. Por poner un ejemplo similar al anterior,
si estoy hablando por el mvil en una cafetera en la que est sonando msica a un
volumen muy elevado, el sonido de la msica, aunque parezca tambin paradjico, es
un ruido que perturba mi comunicacin y que altera la transmisin de la informacin
al colarse en el canal por el que viaja la conversacin.
Aqu, sin embargo, vamos a usar el trmino ruido en un sentido distinto. Ruido va a
ser lo opuesto al sonido musical. As pues, ruido ser una masa de sonido indiferenciado de la que nunca podramos extraer notas musicales individuales. Del
ruido, cmo mucho, podremos decir que es grave o que es agudo o que predominan
en l los tonos medios, pero nunca podremos intuir, ni siquiera remotamente, una
nota musical.
Pero, son tan claras las cosas?, es tan ntida esta separacin?, qu es el habla, ruido
o sonido musical?, y el sonido de una campana? A continuacin intentar responder
a estas cuestiones, utilizando una serie de ejemplos que nos van a permitir comparar
29
por medio del osciloscopio las vibraciones de los sonidos especcamente musicales
con las de otros sonidos que no lo son.
3.3.
Ruido blanco y sonido simple
Antes de entrar en la observacin de seales reales, voy a presentar dos sonidos generados articialmente que denen los polos opuestos entre los que se mueven los
sonidos naturales: el ruido blanco y el sonido simple. En un extremo, el ruido blanco
llamado as por analoga con la luz blanca contiene todas las frecuencias del espectro con la misma intensidad. En el otro extremo, el sonido simple posee una sola
frecuencia que se mantiene estable durante toda su duracin y es el paradigma del
sonido musical.
Para comparar cmo es la forma de la vibracin en ambos casos, he construido un
vdeo en el que se observa en el osciloscopio un fragmento de ruido blanco seguido
de un sonido simple de 440 Hz.
Figura 3.1: Vdeo que simula un osciloscopio con un fragmento de ruido blanco y otro de un sonido
simple de 440 Hz.
Durante toda la primera parte del vdeo, cuando suena el ruido blanco, resulta imposible identicar alturas tonales, notas musicales. Aun es ms, ni siquiera podramos
30
responder a la pregunta de si este sonido es agudo o grave. En principio, el chisporroteo de la parte aguda es lo que resulta ms evidente, pero con un poco de esfuerzo
podemos distinguir tambin el ronroneo de los graves. Esta diferencia de apreciacin
se debe a que nuestro odo no responde a todas las frecuencias por igual, sino que
es ms sensible a la banda situada entre los 2.000 y los 5.000 Hz. Pero, al margen de
las irregularidades de nuestra sensibilidad auditiva, en el vdeo podemos apreciar que
este sonido contiene todas las frecuencias del espectro audible, de la misma manera
que la luz blanca contiene todos los colores visibles.
En la segunda parte del vdeo, sin embargo, la situacin es completamente distinta.
Todos omos una nota musical, en concreto, un la4 anado a 440 Hz, la nota que
habitualmente sirve de referencia para denir la anacin estndar.
Atendamos ahora a la seal de audio, al dibujo que traza la vibracin y que se observa
en el osciloscopio. Cuando suena el ruido blanco la grca va cambiando aleatoriamente a lo largo del tiempo y no hay manera de reconocer en ella ningn orden.
Si paramos el reproductor del vdeo en un cuadro cualquiera, veremos una imagen
similar a la siguiente:
Figura 3.2: Grca de la seal de audio de ruido blanco.
Vemos en esta grca que el movimiento de la vibracin no posee forma alguna, ni

siquiera se aprecia una tendencia. Por consiguiente, no hay nada que nos permita
predecir cmo va a continuar, es absolutamente indeterminado. Esto se debe a la
31
manera en la que ha sido generada esta seal: para calcular el valor de las muestras he
utilizado una secuencia de nmeros aleatorios, como si hubiera echado a suertes el
valor de cada muestra en una lotera en la que estuvieran todos los nmeros posibles,
sin que los valores que hubieran salido previamente inuyeran en las probabilidades
de los siguientes. As pues, la seal de audio del ruido blanco es completamente
aleatoria.
Por el contrario, en la segunda parte del vdeo, mientras suena el sonido simple,
la grca que dibuja la vibracin en la pantalla del osciloscopio tiene una forma
denida: una serie de eses iguales. Si paramos el reproductor del vdeo obtendremos
una imagen como sta:
Figura 3.3: Grca de la seal de audio de un sonido simple de 440 Hz.
Al ver la grca de esta nota simple podemos predecir con total seguridad cmo
va a continuar. Ello se debe a que los valores de las muestras de esta seal han sido
obtenidos mediante una funcin matemtica. Por ello decimos que la seal de audio
de un sonido simple es puramente determinista.
Y, lo que es ms importante, en esta grca distinguimos que la forma se repite en
intervalos de tiempo exactamente iguales, es decir, existe un periodo de repeticin.
Podemos apreciar que en las 50 milsimas de segundo de la grca se han sucedido 22
oscilaciones completas; en un segundo, por lo tanto, se habrn producido 440 oscilaciones. Vemos, as pues, que la frecuencia de este sonido, el nmero de oscilaciones
32
completas que se producen en un segundo, es de 440 hercios. Nos encontramos con

un concepto que es esencial al sonido musical: la periodicidad de la vibracin.
Esta periodicidad de la vibracin es la que posibilita que nuestro sistema auditivo
reconozca una altura tonal, es decir, una nota musical.
Mediante este vdeo hemos podido observar las dos referencias extremas de las seales sonoras: la seal puramente aleatoria, la indeterminacin absoluta, por un lado, y
la seal totalmente predecible, la determinista pura, por otro. O, visto de otra manera, la mxima complejidad, la reunin innita de todas las frecuencias audibles
posibles, frente a la mxima simplicidad, un sonido con una sola frecuencia siempre
estable.
Pero la realidad no es nunca ni totalmente impredecible ni completamente determinada. Solo en el caso de sonidos generados articialmente podremos obtener tanto
una mxima predictibilidad como una mxima impredecibilidad. Ambas seales, el
ruido blanco y el sonido simple, son dos formas paradigmticas de los constituyentes que estn presentes en la mayora de los sonidos reales, es decir, vienen a ser las
referencias ideales entre las que se mueven los sonidos naturales.
3.4.
Trfico con lluvia y notas de clarinete
Comparemos ahora dos situaciones acsticas naturales de ndole opuesta: por un lado,
el ambiente sonoro de una ciudad en un da de lluvia y con trco abundante y, por
otro, unas pocas notas de clarinete tomadas de los compases iniciales de la Rapsodia
para piano y clarinete de Claude Debussy.
33
Figura 3.4: Vdeo que simula un osciloscopio con ruido de trco en un da lluvioso, en la primera
parte, y cinco notas de clarinete de la Rapsodia para piano y clarinete de C. Debussy, en la segunda.
Durante la primera parte, el ambiente sonoro de fondo del trco con lluvia nos
recuerda el ruido blanco que hemos odo en el vdeo anterior. Sin embargo, nos
damos cuenta enseguida que ahora tienen ms presencia los componentes graves.
Podramos decir, siguiendo la analoga de los colores, que esta sonoridad tiende al
rojo, la parte inferior del espectro. Esto es debido a la aportacin que hace el trco
al sonido de la lluvia. Si detenemos el vdeo en los segundos iniciales observaremos
una imagen similar a la siguiente:
Figura 3.5: Grca de la seal de audio de ruido de trco con lluvia.
34
Vemos en esta seal que, igual que en el caso del ruido blanco, ni hay periodicidad
alguna ni resulta posible predecir con seguridad el valor de cualquier muestra a partir
de las que le preceden. Sin embargo, el grado de aleatoriedad es ahora menor, pues las
muestras anteriores s inuyen en las posibilidades de la que viene a continuacin. En
efecto, en la grca podemos apreciar, tomando como referencia una muestra cualquiera, que los valores ms prximos a las muestras inmediatamente anteriores son
ms frecuentes que los ms alejados. Esto explica que la grca, aun siendo una lnea
quebrada, mantenga una cierta continuidad. Cuando analicemos esta seal mediante
el anlisis espectral entenderemos mejor el signicado de todo esto.
Por otro lado, en medio de este ruido rojo de fondo, podemos distinguir varios acontecimientos sonoros. Omos el motor de un coche que acelera, con lo que su sonido
se va haciendo ms agudo y se incrementa su volumen. Omos tambin otros coches
ms lejanos. Y ya casi al nal de esta primera parte del vdeo escuchamos la bocina
de un coche. Si prestamos atencin, nos damos cuenta de que esta bocina est dando
una nota musical, en concreto, una nota que podramos situar entre un sol4 y un
lab4 . En el osciloscopio podemos ver que la seal, que hasta entonces era claramente
aleatoria, parece adquirir en ese momento cierta periodicidad.
En la segunda parte del vdeo, sin embargo, todos omos con claridad las cinco notas
del clarinete (la4 , si4 , solb4 , mib4 , re4 ). Puede que quien no tenga odo absoluto o sus
conocimientos de msica sean menores no sea capaz de darles nombre, es decir, no
pueda determinar si se trata de un la o de un si, pero todos sabemos que lo que suena
son notas musicales.
Podemos observar tambin que mientras est sonando cada una de las notas, la grca
que aparece en la pantalla del osciloscopio es bastante estable, pues la vibracin se
repite de manera parecida durante la duracin de la nota. Por eso, ahora tambin
podemos hablar de una forma de la vibracin, como ocurra en el caso del sonido
simple, si bien se trata de una forma ms compleja que una sencilla ese. Como se
explica en el captulo dedicado al sonido armnico, la forma de ese dibujo tiene que
ver con la cualidad del sonido, con el hecho de que sea ms suave o ms spero, por
poner un ejemplo.
Si paramos el reproductor del vdeo cuando suena la nota si4 , obtendremos una grca parecida a la siguiente:
35
Figura 3.6: Grca de la seal de audio de una nota de clarinete.
Puesto que hay una forma que se repite, podremos hablar aqu tambin de periodo
de la oscilacin y, a partir de ah, deducir su frecuencia. En efecto, en esta grca,
que representa 50 milsimas de segundo, podemos distinguir casi 25 oscilaciones,
pues la ltima no est del todo completa, por lo que deducimos que en un segundo
se habrn producido un poco menos de 500 oscilaciones. Esta frecuencia de 500
Hz es ligeramente superior al valor que esperaramos para la nota si4 en la anacin
estndar (493,9 Hz), pero se aproxima bastante a la frecuencia real de la nota que
estamos escuchando (497 Hz).
Y, puesto que existe una forma, es posible tambin predecir cmo va a continuar
la seal en las prximas milsimas de segundo, a no ser, claro est, que se produzca
algn cambio repentino, como, por ejemplo, que empiece a sonar otra nota.
As pues, hemos podido observar que durante la primera parte del vdeo, en el trco con lluvia, predomina la aleatoriedad, por lo que la seal de audio que vemos en
el osciloscopio tiene muchos rasgos en comn con la del ruido blanco que hemos
analizado en el apartado anterior. Durante la segunda parte del vdeo, sin embargo, cuando suenan las notas del clarinete, hemos comprobado que la seal tiende a
ser de tipo determinista y tambin hemos podido apreciar con claridad su periodicidad.
Mediante los ejemplos que hemos estudiado hasta ahora podemos obtener la idea
general de que el ruido se corresponde con el desorden, con la aleatoriedad, con
36
la imposibilidad de predecir lo que va a suceder a continuacin, mientras que

el sonido musical tiene que ver con el orden, la predictibilidad y, lo que es ms
importante, con la periodicidad.
3.5.
Campanadas y notas de piano
Ahora bien, son tan claras las cosas? Hay una lnea que delimita con nitidez las
vibraciones propias de los sonidos musicales? Podemos determinar con precisin
dnde empieza el sonido musical y dnde termina el ruido? E incluso ms, hay
siempre una separacin clara entre los sonidos peridicos y los que no lo son? La
respuesta es que no, que en medio hay un amplio territorio difuso. Ciertamente,
hay sonidos que no pueden ser considerados como ruidos, pero que tampoco son
propiamente peridicos; y hay sonidos que son claramente musicales, pero que estn
lejos de ser estrictamente peridicos.
A continuacin vamos a comparar dos sonidos que pertenecen a esta zona intermedia
que se encuentra lejos de los extremos opuestos de la pura aleatoriedad y la periodicidad estricta, es decir, lejos del ruido blanco y del sonido simple. Se trata del sonido
de una campana de iglesia y el de una nota de piano, en concreto un sol3 .
Figura 3.7: Vdeo que simula un osciloscopio con el sonido de una campana, en la primera parte, y
el de una nota de piano, en la segunda.
37
Podemos apreciar en el vdeo que existe un gran parecido en la forma en la que evoluciona la vibracin de los dos sonidos. Ciertamente, ambos son sonidos percutidos,
por lo que las vibraciones que observamos en el osciloscopio tienen bastantes semejanzas: el ataque es muy rpido y abrupto, ruidoso en ambos casos, y va seguido de
un decrecimiento inmediato que conduce a un nivel sonoro considerablemente ms
bajo; una vez alcanzado ese nivel, el sonido prolonga su duracin durante bastante
tiempo, decayendo lentamente.
Todo este proceso va acompaado de un cambio constante en la cualidad del sonido,
pues con el paso del tiempo se van extinguiendo progresivamente los componentes ms agudos. Por eso vemos en el osciloscopio que la forma de la vibracin se va
haciendo cada vez ms sencilla, hasta recordar al nal la grca de un sonido simple.
Pero, aunque el sonido de la campana y el del piano tienen todos estos rasgos en comn, ambos se diferencian en algo que es fundamental para discernir si son sonidos
musicales: la posibilidad de atribuirles una altura tonal. Cuando suenan las notas del
piano todos percibimos una altura tonal que permanece constante, aqu en concreto
un sol3 . Pero si tratamos de responder a la pregunta de qu nota est dando la campana, nos encontraremos que durante la mayor parte de su duracin no podemos
dar una respuesta, y slo al nal, en la parte que queda resonando, podemos apreciar
una altura tonal clara, un lab4 un poco bajo. Por ello, podemos armar que en el caso
del sonido de esta campana estamos al otro lado de la frontera que delimita el sonido
musical.
Esta diferencia que percibimos al or ambos sonidos responde a las diferencias que se
producen en la vibracin, como podemos observar en las dos seales de audio. En el
caso de la campana, a excepcin de la resonancia nal donde la forma de la vibracin
es similar a la de un sonido simple, no podemos reconocer en la grca ninguna
periodicidad, si bien comprobamos que est muy lejos de las grcas del ruido blanco
o del ruido de trco que hemos observado en los vdeos anteriores.
Para apreciar esto con claridad, veamos las grcas que se obtienen si paramos el
vdeo en un momento cualquiera en pleno sonido de la campana, primero, y del
piano, despus.
38
Figura 3.8: Grca de la seal de audio de un sonido de campana.
La grca de la campana no muestra ninguna periodicidad, lo que explica que no

podamos apreciar una nota determinada, pero lo cierto es que tampoco presenta una
gran complejidad. Su aspecto no es el de una seal aleatoria. Ms bien su forma nos
llevara a pensar que pudiera tratarse de varias notas musicales sencillas de frecuencias
diferentes que estuvieran sonando a la vez. De hecho, una persona entrenada o un
profesional de la anacin podra extraer algunos de los componentes frecuenciales
que constituyen este sonido.
Figura 3.9: Grca de la seal de audio de una nota de piano.
39
En la grca del piano la situacin es diferente. A pesar de que ni siquiera durante este
breve intervalo de 50 milsimas de segundo, la forma que dibuja la vibracin se repite
idnticamente igual, s es posible reconocer en ella una forma compleja que, aun con
variaciones, se renueva cada cierto intervalo exacto de tiempo. Por lo tanto, aunque
no podamos decir que esta seal sea estrictamente peridica, s podemos armar sin
ninguna duda que posee un periodo de oscilacin que se mantiene constante y que
posibilita el reconocimiento de una altura tonal. En efecto, en esta grca podemos
contar aproximadamente unas nueve oscilaciones y media, lo cual correspondera a
una frecuencia de 190 Hz, muy prxima a la frecuencia real del sol3 que est sonando,
196 Hz.
Movimiento vibratorio peridico, en un sentido estricto, signica que el movimiento
tiene que repetirse exactamente igual cada cierto intervalo de tiempo, su periodo.
Pero en el caso de una nota musical real, como sta que estamos observando, con
toda su complejidad, la periodicidad no es perfectamente estricta. Su oscilacin es
compleja, por lo que la forma que se repite no es exactamente igual, sino que va
evolucionando con el paso del tiempo, y eso es lo que le proporciona su riqueza
sonora. Y no slo su forma va cambiando, sino que tambin con el paso del tiempo
vara su amplitud.
No obstante, a pesar de todos estos cambios e inestabilidades, en ese intervalo de
tiempo de 50 milsimas de segundo que estamos observando, la forma de la vibracin
de esta nota de piano resulta lo sucientemente peridica como para poder percibir
una altura tonal. Este es el estado que predomina en los sonidos musicales reales, salvo
en los momentos en los que se producen cambios abruptos, como, por ejemplo, en
el inicio de una nueva nota.
As pues, la frontera que delimita el sonido musical reside en que su vibracin
sea lo suficientemente peridica como para poder percibir una altura tonal determinada.
3.6.
Habla y canto
Hemos visto hasta ahora que la periodicidad es esencial al sonido musical. Pero, podemos armar que todos los sonidos que muestran cierta periodicidad son musicales?
40
Qu sucede con los sonidos del habla? Vamos a comparar ahora en el osciloscopio
las vibraciones de los sonidos del habla con los del canto, a n de precisar con ms
nitidez qu es lo especco del sonido musical.
Para estudiar estas diferencias he fabricado un vdeo en el podremos observar con
detalle las particularidades que adquieren los sonidos del habla cuando reciben msica. En la primera parte se presenta la seal de audio de un breve fragmento hablado
de una locutora de radio y, en la segunda, la seal de un pequeo fragmento cantado, en concreto, el inicio del Lamento de Ariadna de Claudio Monteverdi. En ambos
casos se trata de sonidos propios del habla; la nica diferencia es que en el segundo
la prosodia natural del lenguaje hablado ha sido sustituida por la meloda del canto.
Mediante este vdeo podremos ver en qu se diferencia la vibracin de los sonidos en
los que podemos reconocer de qu vocal se trata (si es una a o es una e, por poner un
ejemplo) de otros sonidos en los que, adems de reconocer su fonema, percibimos
claramente una nota musical.
Figura 3.10: Vdeo que simula un osciloscopio con un fragmento de una locutora de radio, en la
primera parte, y el inicio del Lamento de Ariadna, en la segunda.
El texto de la locutora es:

Dice: Pero no se pueden aceptar normas ticas a la carta. La sociedad
necesita criterios reconocibles, saber que las varas de medir se aplican a
todos por igual.
41
La letra del Lamento de Ariadna es:

Lascite mi morire.
Y las notas musicales que van sobre cada slaba, respectivamente, son: la4 , sib4 , fa4 ,
fa4 , mi4 , mi4 ,mi4 .
En la primera parte, durante el enunciado de la locutora, podemos ver en el osciloscopio que la vibracin va alternando rpidamente entre unas formas breves, pero
peridicas, que recuerdan a las de los sonidos musicales, y otras, mucho ms breves
todava, de aspecto aleatorio, similares a las del ruido. Esta alternancia corresponde,
simplicando un poco, a la que se produce en el habla entre las vocales y las consonantes.
Por el contrario, en el fragmento del canto vemos constantemente formas peridicas claramente reconocibles. Podemos apreciar que cambian con el texto y con la
msica, incluso que durante la emisin de la misma vocal van modicando su forma
y su amplitud, pero se reconoce en ellas un patrn lo sucientemente estable como
para concluir que son sonidos musicales, incluso si simplemente los viramos en el
osciloscopio, sin or lo que suena.
Veamos la grca de un pequeo fragmento de la primera parte del vdeo en la que
podemos apreciar muy bien cmo se articula el lenguaje hablado, es decir, cmo los
sonidos consonnticos se unen con los voclicos para formar la cadena hablada. La
grca corresponde al momento en el que la locutora pronuncia la palabra ticas.
He elegido ahora una duracin ms extensa que la ventana de observacin que he
utilizado en los vdeos del osciloscopio, a n de presentar un panorama general de
la vibracin cuando se emite una palabra completa. La duracin de este fragmento
es de 400 milsimas de segundo, es decir, ocho veces mayor que el de la ventana
del vdeo, lo que explica que las formas de la vibracin se vean ahora mucho ms
apretadas.
42
Figura 3.11: Grca de la seal de audio correspondiente a la emisin de la palabra ticas.
La parte de la seal correspondiente a cada fonema est delimitada por unos corchetes. Aunque es imposible una separacin precisa, responde bastante elmente a
la realidad de lo que omos. Podemos apreciar que existe una diferencia muy clara
entre la forma de la vibracin de las consonantes y la de las vocales: las vocales son
claramente peridicas, mientras que las consonantes no son peridicas y tienden al
ruido. Observamos tambin que las consonantes oclusivas, la t y la k, son muy breves,
mientras que la s es bastante ms larga y relativamente parecida al ruido blanco.
Si midiramos mediante un editor de sonido el periodo de cada una de las vocales y,
a partir de ello, dedujramos su altura tonal, comprobaramos que la slaba acentuada
es casi un semitono ms aguda que la vocal siguiente i y cerca de semitono y medio
ms alta que la tercera vocal a, cuya slaba, sin embargo, es la que tiene ms intensidad
sonora y mayor duracin.
Comprobamos que en espaol el acento de la palabra no se produce ni por una mayor
intensidad sonora ni por un alargamiento de la duracin, sino por una elevacin de
la altura tonal, lo cual justica que se llame slaba tnica a la que va acentuada. As
pues, al margen de la entonacin general propia de la prosodia, la relacin de agudeza
y gravedad entre los sonidos de la cadena hablada explica nuestra distincin entre
slabas acentuadas y sin acentuar, como podemos apreciar si volvemos a escuchar
con detenimiento cmo suena la palabra ticas.
43
Pero lo que interesa ahora es responder a la pregunta siguiente: las vocales, cuyo
movimiento vibratorio es peridico, son propiamente sonidos musicales? Lo cierto
es que no omos una nota musical cuando suenan. La razn de que, en principio, en
la cadena hablada no identiquemos una nota musical cuando se emite una vocal, a
pesar de que se trata de un sonido peridico, reside en la brevedad de la parte peridica. En efecto, vemos que cada vocal apenas llega a completar unos pocos ciclos.
Esto, debido al constante entrecortarse en su articulacin con el sonido consonntico vecino, impide que reconozcamos esa periodicidad y que la apreciemos como un
sonido musical.
Para observar un detalle de la forma de la vibracin cuando se emite la slaba ti,
presento una grca que tiene la misma duracin que la ventana de observacin de
los vdeos y en la que he hecho zoom en la amplitud, que ha quedado delimitada
entre -0,4 y 0,4.
Figura 3.12: Grca de la seal de audio correspondiente a la emisin de la slaba ti.
Vemos que el periodo de la vocal i es un poco ms de 5 milsimas de segundo, lo

que corresponde a una frecuencia ligeramente inferior a 200 Hz, es decir, se trata
aproximadamente de un sol3 . Pero la duracin de este sonido es muy breve: solo
se observan entre cuatro y cinco ciclos completos, lo que explica que no oigamos
ninguna nota musical cuando suena esta slaba.
En el fragmento del canto, sin embargo, la situacin es totalmente distinta. En la
grca de abajo, correspondiente a la vocal a de la primera slaba, las, podemos ver
44
que la seal permanece claramente estable al menos durante todo el tiempo que dura
la observacin.
Figura 3.13: Grca de la seal de audio correspondiente a la vocal a cantada.
Vemos que durante las 50 milsimas de duracin la seal permanece estable, lo cual
es suciente para que se pueda percibir una altura tonal. Conforme evolucione el
sonido, incluso durante la propia emisin de la vocal a, se modicar la forma, la
amplitud e incluso el periodo, pero, al margen de estas modicaciones, el sonido
en el canto es lo sucientemente estable y duradero como para permitirnos apreciar
con claridad una altura tonal. Por poner un ejemplo, si emitimos al hablar la vocal a,
no pensaremos que estamos dando una nota musical; ahora bien, si prolongamos la
duracin de la vocal y nos esforzamos en mantener constante la misma altura tonal,
enseguida nos daremos cuenta de que estamos emitiendo una nota musical.
As pues, el requisito de sucientemente peridico, que hemos reconocido en el
apartado anterior como necesario para determinar que un sonido sea musical, exige
tambin una cierta duracin, es decir, necesitamos que la periodicidad se mantenga durante el suficiente tiempo como para que nuestro sistema perceptivo
sea capaz de apreciar una frecuencia, y con ella, una altura tonal.
45
3.7.
Conclusin
A lo largo de este captulo hemos podido apreciar las caractersticas que posee el
sonido musical. Ayudndonos de la seal de audio que queda representada en el osciloscopio, hemos comparado lo que omos cuando escuchamos un sonido musical,
con lo que omos cuando se trata de sonidos ruidosos y de otros de cualidad intermedia, de modo que hemos podido experimentar que un sonido es considerado por
nuestra percepcin auditiva como musical cuando su vibracin es lo sucientemente
peridica y duradera cmo para que podamos reconocer una altura tonal.
46
Captulo 4
El sonido simple
4.1.
Introduccin
El sonido simple, tambin llamado sonido puro, es el sonido al que da lugar la vibracin ms sencilla posible, aquella que se comporta siguiendo lo que en Fsica se
denomina Movimiento Armnico Simple (MAS). El calicativo armnico para describir este movimiento procede precisamente de su vinculacin con la msica.
Empecemos observando cmo es un sonido simple. En el captulo 1, El sonido como
vibracin, he utilizado un sonido simple para estudiar la vibracin del aire, precisamente porque su oscilacin es muy sencilla y repetitiva, un simple vaivn. Volvamos,
pues, al vdeo de la gura 1.1 de ese captulo donde se simula a cmara lenta el movimiento del aire cuando suena un sonido simple generado articialmente, la nota
musical la4 a 440 Hz, sin armnicos y de frecuencia y amplitud totalmente estables.
En el vdeo de la gura 1.2 de ese captulo tenemos el detalle del movimiento oscilatorio de una de las esferitas de la simulacin, donde se ve cmo la oscilacin dibuja
en el tiempo una serie de eses enlazadas.
Veamos ahora un vdeo donde podemos apreciar en tiempo real mediante el osciloscopio la forma de la vibracin cuando suena esa misma nota.
47
Figura 4.1: Vdeo con un sonido simple, la4 a 440 Hz, visto en un osciloscopio.
Podemos detener el reproductor en cualquier momento y observaremos con ms

claridad la forma de ese constantemente repetida de la oscilacin. Esta forma de ese,
como veremos enseguida, es el resultado de que la grca de la oscilacin de un
sonido simple es una funcin sinusoidal del tiempo.
A lo largo de este captulo estudiaremos en detalle en qu consiste el sonido simple y
comprenderemos por qu su vibracin es la ms sencilla de todas las posibles formas
de vibracin. Me parece que este estudio puede ser til para entender los fundamentos
acsticos de la teora musical, e incluso algunas consideraciones loscas que esta
teora ha generado a lo largo de la historia.
4.2.
El sonido simple como fundamento del sonido musical
El sonido simple es en s mismo un sonido musical; aun es ms, es la referencia ideal

de todo sonido musical. Y es tambin el constituyente elemental del que estn formados todos los sonidos musicales. Adems, la descomposicin en sonidos simples
est presente en la forma en la que nuestro sistema perceptivo procesa y entiende
todo sonido, sea o no musical. Este carcter de constituyente elemental que posee el
sonido simple reside, en ltima instancia, en la simplicidad esencial del movimiento
que lo produce.
48
Veamos a continuacin brevemente las implicaciones que se derivan de las propiedades del sonido simple.
a) El sonido simple es el paradigma del sonido musical
El sonido simple es peridico en el sentido ms estricto, es decir, su vibracin se

repite idnticamente igual cada cierto intervalo de tiempo durante toda su duracin.
Por ello su frecuencia y su amplitud permanecen constantes, con lo que su altura
tonal puede ser percibida con total nitidez.
Su estabilidad, unida a su simplicidad, hacen del sonido simple el lugar ms adecuado
para estudiar los parmetros fsicos del sonido musical, as como la relacin entre estos
parmetros fsicos y nuestra sensacin.
Idealmente un sonido simple no tendra comienzo ni nal, sino que estara sonando
eternamente, pues todo comienzo o nal supone una discontinuidad y produce un
ruido. Hablando con rigor, deberamos decir que lo que omos en el vdeo de la
gura 4.1 es un fragmento de un sonido simple eterno.
El sonido simple, estable y sin armnicos, es principalmente un sonido de laboratorio.
Entre los sonidos naturales, el que se aproxima mejor a un sonido simple es el que
produce un diapasn metlico de los que se utilizan para anar los instrumentos, pues
emite una nota sin armnicos y, una vez pasado el ataque inicial, mantiene durante
cierto tiempo una amplitud casi constante.
b) El sonido simple es el elemento constitutivo de todo sonido musical
El sonido musical puede ser considerado como una composicin de sonidos simples
cuyas frecuencias mantienen entre s unas determinadas relaciones de conmensurabilidad. En este sentido, al sonido musical se le llama tambin sonido armnico,
pues la palabra griega harmona designaba, en origen, la buena mezcla que resulta de
una proporcin adecuada.
En efecto, al margen de fenmenos transitorios y de la parte de ruido que cualquier
sonido natural lleva consigo, todo sonido musical est formado por un conjunto de
sonidos simples denominados parciales. Salvo excepciones, las frecuencias de estos
49
parciales son mltiplos de un sonido simple ms grave. Estos mltiplos siguen el

orden de los nmeros naturales y constituyen la serie armnica. Los sonidos simples
que forman parte de la serie armnica de un sonido se denominan componentes
armnicos.
La presencia o ausencia en un determinado sonido musical de unos u otros armnicos, as como el mayor o menor peso de cada uno de ellos, determinar en gran
medida la cualidad del sonido musical resultante. Por ejemplo, los sonidos con pocos
armnicos tienden a ser ms dulces, mientras que aquellos en los que predominan
los armnicos impares son ms speros.
c) Nuestra audicin extrae sonidos simples del complejo sonoro
Toda vibracin ya sea mecnica, como el sonido, o electromagntica, como la

luz puede ser descompuesta matemticamente en componentes simples, es decir,
en oscilaciones que realizan un simple vaivn, similar al que hemos visto en el vdeo de la gura 4.1. Esta descomposicin matemtica recibe el nombre de anlisis
frecuencial o anlisis armnico.
Salvando las distancias, nosotros percibimos el sonido de una manera similar. En
efecto, nuestro sistema auditivo extrae continuamente del complejo sonoro los componentes simples ms relevantes. A nuestro cerebro no llega la forma de la vibracin
tal cual, es decir, lo que llamamos la seal de audio, sino que la propia siologa de
nuestro odo detecta los componentes ms signicativos presentes en esa seal en
cada momento y transmite sus parmetros al cerebro, inicindose con este ltrado
el procesamiento de la informacin que contiene. Y este proceso se realiza as con
independencia de que se trate de msica o de cualquier otro tipo de sonido.
d) El sonido simple es la vibracin ms sencilla posible
El sonido simple o puro no slo es simple porque es el componente elemental de todo

sonido musical o incluso, en un sentido amplio, de todo sonido, sino que es simple,
principalmente, porque la vibracin que realiza es la ms sencilla posible.
50
Como veremos enseguida, el Movimiento Armnico Simple es la proyeccin unidimensional del Movimiento Circular Uniforme y comparte con l el atributo de
sencillez. Entiendo aqu por movimiento sencillo aqul que no cambia, o que cambia
lo menos posible y de la forma ms suave y continua posible. En este sentido, el sonido simple es la expresin sonora del movimiento ms elemental, sencillo y natural
que surge de las propias condiciones de simplicidad exigidas a la razn: el Movimiento Circular Uniforme. Por utilizar una metfora, el sonido simple es la forma
en la que suena lo que gira eternamente sobre s mismo.
Estas relaciones de anidad entre la vibracin del ms simple de los sonidos musicales
y el Movimiento Circular Uniforme iluminan en parte algunas de las armaciones
hechas por matemticos, fsicos y lsofos de todos los tiempos sobre la constitucin
armnica o musical del universo.
4.3.
El Movimiento Armnico Simple (MAS)
Puesto que el sonido simple es el resultado de un Movimiento Armnico Simple, es

conveniente conocer con un cierto detalle en qu consiste este movimiento. El Movimiento Armnico Simple es la forma ms sencilla de oscilacin, aquella que surge
de modo natural cuando la fuerza que tiende a recuperar la posicin de equilibrio es
proporcional al desplazamiento realizado.
4.3.1.
Un ejemplo de Movimiento Armnico Simple
Para ilustrar el Movimiento Armnico Simple he fabricado mediante Matlab una

animacin que simula matemticamente el movimiento que realiza una bola suspendida de un muelle, al ser liberada despus de haber sido desplazada de su posicin
de equilibrio.
51
Figura 4.2: Vdeo que representa en esquema un MAS, su relacin con el Movimiento Circular
Uniforme y su desarrollo sinusoidal en el tiempo.
En el vdeo hay tres paneles, cada uno con su correspondiente bola roja. Las tres
bolas se mueven al mismo tiempo. Si atendemos nicamente al movimiento vertical
de las bolas rojas, veremos que las tres bolas se encuentran en cada instante a la misma
altura. La lnea de puntos verde que las une resalta este hecho.
Analicemos con detalle lo que vemos en cada uno de estos tres paneles:
a) Panel central
En el panel del medio vemos una pequea bola roja que simula estar suspendida de
un muelle colgado del techo. Suponemos que antes de comenzar el vdeo hemos
desplazado la bola hacia abajo, desde la posicin de equilibrio, que en la grca se
corresponde con la altura 0, hasta la altura -1. El vdeo empieza justo en el momento
en el que hemos soltado la bola y ha comenzado a oscilar.
Para entender lo que sucede es necesario tener presente un principio de carcter universal que constituye el fundamento de la Fsica, la Segunda Ley de Newton, la cual
dice que cualquier cuerpo sobre el que no acta ninguna fuerza conserva indenidamente su velocidad. Por otra parte, es necesario suponer tambin que hemos elegido
52
un muelle adecuado al peso de la bola, de modo que su fuerza de restauracin sea

proporcional al desplazamiento de sta.
La accin combinada del peso de la bola y de la fuerza de restauracin del muelle
tender a colocar la bola en la posicin de equilibrio, la altura 0. No especico si la
altura se mide en metros, centmetros o cualquier otra unidad, pues es irrelevante
para el ejemplo. Cuando la bola est por debajo de la altura 0, la fuerza total ejercida
sobre ella estar dirigida hacia arriba, hacia la posicin de equilibrio, y ser mayor
conforme ms alejada se encuentra la bola de esa posicin de equilibrio. Por el contrario, si la bola est por encima de la altura 0, la fuerza total ejercida sobre ella estar
dirigida hacia abajo, y ser mayor tambin conforme ms alejada est de su posicin
de equilibrio.
No importa la forma en la que ambas fuerzas, el peso y el muelle, se reparten el trabajo. Hay momentos en los que las dos fuerzas colaboran y otros en los que se oponen.
Lo importante es que la fuerza total que acta sobre la bola siempre estar dirigida
hacia la posicin de equilibrio y que la magnitud de esta fuerza ser proporcional a
la distancia en la que se encuentre la bola respecto a esa posicin de equilibrio. Por
eso la magnitud de esta fuerza ser la misma en las posiciones simtricas.
Observamos que al soltar la bola en la altura -1, sta comienza a ascender impulsada por la fuerza de restauracin del muelle, que supera el peso de la bola. En el
vdeo podemos apreciar que este desplazamiento ascendente adquiere cada vez mayor velocidad. Ciertamente, la fuerza total ascendente que se ejerce sobre la bola es
progresivamente menor conforme se va acercando a la posicin de equilibrio. Pero, hasta que se llega a la posicin de equilibrio, sigue ejercindose una fuerza hacia
arriba, por lo que la velocidad ascendente tiene que seguir incrementndose. Por
eso, cuando la bola roja pasa por la posicin de equilibrio, la altura 0, podemos ver
en el vdeo que la velocidad es la mxima, pues todo el tiempo ha ido recibiendo
fuerza.
A partir de all las cosas se invierten, pues la combinacin del peso y de la fuerza
de restauracin del muelle apunta hacia la posicin de equilibro y se opone, por lo
tanto, a la velocidad ascendente que lleva la bola. As, la velocidad ascendente de la
bola va siendo frenada hasta llegar a la altura 1, la simtrica a la altura -1.
53
En ese punto justo la bola se detiene y su velocidad se hace 0. Pero esta pausa es
instantnea, pues la fuerza que la ha frenado sigue apuntando hacia abajo, por lo que
inmediatamente la bola comienza a descender. Y va ganando de nuevo velocidad,
ya que ahora, al apuntar la fuerza en la misma direccin que va la bola, no la frena,
sino que la acelera, hasta pasar de nuevo por la posicin de equilibrio, la altura 0, a
la misma velocidad mxima con la que haba pasado al subir.
Una vez superada la posicin de equilibrio, la bola comienza a ser frenada hasta llegar
a la altura -1, donde otra vez se detiene instantneamente. Y de nuevo comienza a
ascender. Y as sucesivamente.
Este movimiento continuara eternamente si no fuera por las fuerzas de friccin, entre otras la del aire, que progresivamente van atenuando la oscilacin de la bola.
b) Panel izquierdo
El panel izquierdo ilustra la conexin del Movimiento Armnico Simple con el Movimiento Circular Uniforme y muestra que el Movimiento Armnico Simple es la
proyeccin unidimensional del Movimiento Circular Uniforme. Este relacin
nos permite entender el concepto de fase instantnea de la oscilacin y nos muestra
que la altura que alcanza la bola en cada instante es el seno de esta fase.
En este panel de la izquierda vemos otra bola roja que va recorriendo una circunferencia. El radio de esta circunferencia es igual a la altura mxima que alcanza el
desplazamiento de la bola del panel central. Adems, ambas bolas, la que se desplaza
por la circunferencia y la del muelle, estn sincronizadas: la altura instantnea de la
bola que gira uniformemente alrededor de la circunferencia es la misma que la altura de la bola que oscila en el muelle. Dicho de otro modo, la altura de la bola es la
proyeccin en el eje vertical de la posicin de la bola en la circunferencia.
Pero, a diferencia de la bola que oscila en el muelle, la celeridad del movimiento de
la bola que se traslada por la circunferencia en el panel de la izquierda se mantiene
constante: en cada unidad de tiempo recorre un arco de circunferencia de la misma
longitud. Si lo expresamos en medidas angulares vemos que, en este ejemplo, recorre
90 en cada segundo, por lo que tarda 4 segundos en realizar una vuelta completa,
como podemos comprobar en el propio reloj del vdeo.
54
De esta manera, la posicin de la bola en la circunferencia nos permite expresar

utilizando medidas angulares el estado en el que en ese momento se encuentra la
oscilacin. Este estado, cuanticado as, recibe el nombre de fase instantnea de la
oscilacin.
En nuestro ejemplo el estado inicial de la oscilacin coincide con el momento en
el que la bola est desplazada a su posicin ms baja, y por eso decimos que la fase
en ese instante inicial es de 270. En el segundo 1 el estado de la bola alcanza en
su movimiento ascendente la posicin de equilibro y la fase instantnea es 0. En el
segundo 2 el estado de la bola ha alcanzado la altura mxima y su fase instantnea
es 90. En el segundo 3 la bola vuelve a la posicin de equilibrio, pero ahora en un
movimiento descendente, y la fase instantnea es 180.
Dicho de otro modo, la fase instantnea es el ngulo que expresa la posicin de la bola
sobre la circunferencia. Observamos tambin que la altura en la que se encuentra
la bola en cada instante es el seno de este ngulo, como podemos apreciar en la
siguiente gura:
Figura 4.3: Altura de la bola cuando la fase de la oscilacin es 60.
La gura muestra el momento en el que la fase de la oscilacin es 60. Puesto que el

radio es 1, la altura (h) es el seno de 60, que es igual a 0,866.
55
c) Panel derecho
El panel derecho sirve para ilustrar que el Movimiento Armnico Simple es una
funcin sinusoidal del tiempo.
La grca del panel de la derecha va describiendo las sucesivas alturas por las que pasa
la bola al oscilar a lo largo del tiempo. De hecho, si seguimos con el dedo esta grca, podemos vericar de manera intuitiva la descripcin del Movimiento Armnico
Simple que he presentado al comentar el desplazamiento de la bola en el panel central. En efecto, podemos apreciar, entre otras cosas, cmo el movimiento aumenta su
velocidad conforme se acerca a la posicin de equilibrio; cmo la disminuye cuando
se aleja de sta; cmo se detiene instantneamente y cambia de sentido al alcanzar
los desplazamientos mximos en los segundos 0, 2, 4, 6, 8, 10, 12.
Como hemos visto, la altura de la bola es la proyeccin en el eje vertical de su posicin
en la circunferencia. Esta proyeccin es el seno del ngulo que dene la posicin de
la bola en la circunferencia, la fase de la oscilacin. Dado que la celeridad de la bola al
recorrer la circunferencia es constante con independencia de que su movimiento
pueda ser ms o menos rpido, este movimiento giratorio depende linealmente
del tiempo, es decir, es la misma imagen del tiempo, como si fuera un reloj. Por
ello la descripcin de la evolucin temporal del Movimiento Armnico Simple que
realiza la bola en su ascender y descender es una funcin sinusoidal que depende del
tiempo.
4.3.2.
Parmetros del Movimiento Armnico Simple
Ahora, con ayuda del vdeo, voy a explicar brevemente los parmetros que intervienen en el Movimiento Armnico Simple: amplitud, fase inicial, periodo y frecuencia.
a) Amplitud
La amplitud es el valor absoluto del desplazamiento mximo que alcanza la

oscilacin desde la posicin de equilibrio. En el vdeo del ejemplo vemos que
56
este valor es 1, tanto cuando la bola del muelle va hacia arriba, como cuando va hacia
abajo.
b) Fase inicial
La fase inicial de la oscilacin es la fase instantnea en la que se encuentra la

oscilacin en el tiempo 0. En nuestro ejemplo la fase inicial es 270, pues sta es
la fase instantnea en la que se halla la bola en el momento en el que se inicia la
oscilacin, como podemos comprobar en el panel de la izquierda del vdeo.
c) Periodo y frecuencia
El periodo de la oscilacin es el tiempo que tarda un movimiento oscilatorio en

realizar una oscilacin completa. En nuestro vdeo podemos observar que la bola
tarda 4 segundos en completar una oscilacin. As pues, el periodo de esta oscilacin
es 4 segundos.
La frecuencia de la oscilacin es el nmero de oscilaciones completas que se
producen en un segundo. La unidad de frecuencia es el hercio. Un hercio equivale
a una oscilacin completa por segundo. En este ejemplo la frecuencia es 0,25 Hz. En
efecto, puesto que una oscilacin tarda 4 segundos en completarse, en un segundo
slo habr realizado la cuarta parte de la oscilacin.
Vemos que periodo y frecuencia son recprocos. Ambos nombran la misma realidad, pues decir cuntos segundos se tarda en completar un ciclo equivale a decir
cuntos ciclos se producen en un segundo.
Por otra parte, hay que tener en cuenta que el desplazamiento inicial no inuye en
la frecuencia de la oscilacin. Podramos haber alejado la bola al inicio a cualquier
distancia dentro de los mrgenes en los que el muelle trabaja bien y la frecuencia
de la oscilacin hubiera sido la misma. La frecuencia depende nicamente de dos
valores: en este caso, de la elasticidad del muelle y de la masa de la bola. Es decir, para
ese sistema concreto de bola y muelle la frecuencia ser siempre la misma. Es su frecuencia natural de oscilacin. Podemos decir que este conjunto de bola y muelle
57
o, generalizando, de masa y resorte tiene una frecuencia natural de oscilacin de

0,25 Hz.
4.4.
El Movimiento Armnico Simple en el sonido
El sonido simple es una vibracin mecnica que se comporta segn el modelo oscilatorio que acabamos de estudiar. En efecto, el sonido simple es un caso particular
del Movimiento Armnico Simple. Ahora bien, para ser percibida por nosotros
como sonido, la oscilacin debe ser lo sucientemente rpida, en concreto, debe realizar entre 20 y 20.000 oscilaciones completas por segundo, que es aproximadamente
el rango en el que se mueve nuestro sistema auditivo.
As pues, el movimiento oscilatorio que he descrito con detenimiento en el ejemplo
de la bola y el muelle nos puede servir para entender cmo es la vibracin de un
sonido simple. En lugar de la bola oscilante pensemos ahora en un pequeo volumen
de aire que se comprime y se expande de la manera ms sencilla posible, es decir, con
un Movimiento Armnico Simple.
Cuando se emite un sonido simple, los valores que va tomando la oscilacin de la
presin del aire en un punto del espacio a lo largo del tiempo describen una grca
sinusoidal similar a la del panel derecho que aparece en el vdeo de la gura 4.2. En
efecto, en el sonido simple la presin del aire oscila segn una funcin sinusoidal del tiempo.
Examinemos ahora los parmetros del Movimiento Armnico Simple en el caso concreto de la vibracin sonora.
4.4.1.
Parmetros del sonido simple
Veamos los parmetros del sonido simple en una grca que muestra las primeras 50
milsimas de segundo de la seal de audio correspondiente a la nota la4 que hemos
observado en el osciloscopio de la gura 4.1.
58
Figura 4.4: Grca de los 50 ms iniciales de un sonido simple, la4 a 440 Hz, con la amplitud y el
periodo.
Esta grca representa la variacin, respecto a su valor medio, de la presin del aire en
un punto del espacio a lo largo del tiempo o, lo que podemos considerar equivalente,
el desplazamiento de la membrana de un micrfono situado en ese punto del espacio
que hubiera recogido esa variacin de la presin del aire.
a) Amplitud
La amplitud es la variacin mxima que alcanza la presin del aire respecto

a su valor medio como consecuencia del movimiento vibratorio del sonido
en el punto del espacio elegido como referencia. Si pensamos que este punto es
el lugar en el que hemos colocado el micrfono, podemos interpretar la amplitud
como el desplazamiento mximo que alcanza la membranita del micrfono cuando
est recogiendo el sonido.
En la grca la amplitud est sealada en color rojo. El 0 representa el valor medio
de la presin del aire. Es costumbre utilizar el valor 1 y -1 para representar la variacin mxima de la presin del aire que el sistema de grabacin tendra capacidad de
registrar. En este ejemplo la amplitud tiene un valor de 0,2. Esto quiere decir que
el valor mximo de la oscilacin de la presin del aire debida a la vibracin de este
sonido es el 20 % del valor mximo que el sistema podra registrar.
59
La amplitud de un sonido depender del punto del espacio que tomemos como referencia, pues disminuir conforme mayor sea la distancia de la fuente sonora.
b) Fase inicial
La fase inicial es el estado en el que se encuentra la oscilacin de la presin

del aire en el tiempo 0 en el punto del espacio elegido como referencia. En la
grca vemos que en el tiempo 0 la oscilacin pasa por la posicin de equilibrio en
sentido ascendente, es decir, la fase inicial es 0.
La fase instantnea cambia tambin con la posicin espacial, pues en funcin de la
velocidad con la que se propaga la vibracin, el estado en el que se encuentra la
oscilacin en un mismo instante vara de un lugar a otro.
c) Periodo y frecuencia
El periodo es el tiempo que tarda la vibracin sonora en realizar una oscilacin

completa. Fijmonos, por ejemplo, en el primer pico de la oscilacin y sigamos
la evolucin de la seal, primero hacia abajo y luego hacia arriba, hasta completar
una vuelta entera y llegar al siguiente pico. ste es el periodo de la vibracin. Si
en lugar del primer pico, comenzamos en cualquier otro punto de la oscilacin y
realizamos el mismo proceso completando una vuelta entera, obtendremos el mismo
valor. En la grca he indicado el periodo mediante una lnea de color azul que une
alternativamente los picos y valles de la seal de audio.
La frecuencia es el nmero de oscilaciones completas que se producen en un
segundo. En el caso de nuestro ejemplo sabemos que la frecuencia de la nota es
440 Hz, por lo tanto, en nuestra grca, que tiene una duracin de 50 milsimas de
segundo, tendremos que encontrar 22 ciclos completos (440 0, 05 = 22), como as
sucede.
Como ya hemos dicho periodo y frecuencia son recprocos, por lo tanto el periodo de
esta vibracin, redondeando, ser 2,3 milsimas de segundo (1440 = 0, 0023).
60
La frecuencia de la vibracin, as como su recproco el periodo, es independiente

del lugar del espacio que tomemos como referencia. Esto hace de la frecuencia un
parmetro idneo para transmitir la informacin musical.
4.5.
Conclusin
El sonido simple es la forma sonora del Movimiento Armnico Simple, la oscilacin

ms sencilla y elemental, que resulta de la proyeccin unidimensional del Movimiento Circular Uniforme. El sonido simple no slo es en s mismo un sonido musical,
sino que es tambin el elemento constitutivo de todo sonido musical.
61
Captulo 5
Altura tonal, intervalos y volumen sonoro
5.1.
Introduccin
Al margen del carcter convencional y arbitrario de los diversos lenguajes musicales,

carcter que es inherente a cualquier creacin del espritu humano, todos los sistemas
musicales se construyen sobre unos condicionantes previos que se derivan tanto de la
naturaleza fsica del sonido en s mismo, como de la manera en la que nosotros percibimos los fenmenos sonoros. Por ello, para entender la Teora Musical es necesario
estudiar las relaciones que se producen entre los parmetros fsicos de la vibracin
sonora y las sensaciones auditivas que nosotros experimentamos.
Dado que el sonido simple es sencillo y estable, y adems puede ser considerado
como el paradigma de todo sonido musical, resulta muy adecuado para examinar
cmo afecta a nuestra sensacin la variacin de sus parmetros fsicos.
A lo largo de este captulo analizaremos la manera en la que percibimos la frecuencia
y la amplitud en el caso de un sonido simple. Veremos que la frecuencia determina
la altura tonal que apreciamos y, por lo tanto, la nota musical que reconocemos, y
que la amplitud guarda relacin con el volumen sonoro que percibimos.
Sin embargo, no nos vamos a ocupar de la fase inicial, pues, aunque es un parmetro
importante para la localizacin espacial de la fuente sonora y puede provocar diferentes efectos en la reunin simultnea de varios sonidos, no tiene un correlato directo
62
en nuestras sensaciones. En efecto, si escuchamos un sonido simple de frecuencia y

amplitud determinadas cuya fase inicial es de 0, y luego escuchamos otro sonido de
la misma amplitud y frecuencia, pero cuya fase inicial sea, pongamos por caso, 180,
no apreciaremos ninguna diferencia.
5.2.
Relacin entre estmulo y sensacin: la Ley de Weber-Fechner
Puesto que nuestra sensacin auditiva se comporta de manera similar al resto de nuestros sentidos, comenzaremos estudiando las relaciones matemticas que se establecen
entre los estmulos fsicos y nuestras sensaciones. Me reero al carcter logartmico
de nuestro sistema sensorial, tal como ha quedado denido mediante la llamada Ley
de Weber-Fechner.
En la segunda mitad del siglo XIX Gustav Fechner, basndose en los trabajos previos
de Ernst Weber, expres una ley que relacionaba los estmulos fsicos con las sensaciones que experimentamos al recibirlos. Al margen de matizaciones y excepciones,
la Ley de Weber-Fechner establece que el estmulo debe crecer en progresin geomtrica para que la intensidad de la sensacin crezca en progresin aritmtica. Esto
signica que la relacin entre la variacin de los parmetros fsicos que actan
de estmulo y la de nuestras sensaciones no es lineal, sino logartmica.
Veamos con un ejemplo qu signica que nuestra sensacin responda logartmicamente al incremento o disminucin de los estmulos. Imaginemos que recibimos
cuatro estmulos sucesivos, a los que llamamos a, b, c y d. El parmetro fsico asociado
al estmulo a tiene una intensidad de 100; el de b, de 200; el de c, de 400; y el de d,
de 800. Podemos comprobar que cada uno de ellos es el doble del anterior, es decir,
que crecen manteniendo una progresin geomtrica cuya razn es 2 y cuyo primer
trmino es 100:
100; 100 2 = 200; 100 2 2 = 400; 100 2 2 2 = 800; ...
Cuando pasamos del estmulo a al b, entre los cuales hay una distancia aritmtica
de 100, nuestra sensacin aprecia una diferencia. Tomemos para nuestro ejemplo
63
esa diferencia sensorial como unidad y consideremos a partir de ahora que nuestra
sensacin se ha incrementado en un grado al pasar del estmulo a al estmulo b.
Examinemos ahora lo que suceder al pasar del estmulo b al c. La diferencia aritmtica
entre los parmetros fsicos del estmulo b y del estmulo c es de 200 (400-200), es
decir, el doble de la diferencia aritmtica que hay entre los estmulos a y b. Si nuestra
sensacin respondiera de forma lineal al incremento del parmetro fsico, cuando
pasramos del estmulo b al c tendramos que percibir un incremento de dos grados.
Sin embargo, esto no sucede as, sino que experimentamos un incremento de un
grado, el mismo que hemos percibido al pasar del estmulo a al b. Y este mismo
incremento de un grado es tambin el que percibiremos cuando pasemos del estmulo
c al d, aunque la diferencia aritmtica entre sus parmetros sea de 400 (800-400).
La explicacin reside en que nuestra sensacin reconoce como incremento de
un grado el cociente entre las intensidades de los estmulos, no su diferencia
aritmtica. Por eso, aunque en nuestro ejemplo hayamos tomado como unidad sensitiva el paso del estmulo a al b, lo signicativo no ha sido la diferencia aritmtica
que hay entre ambos estmulos (es decir, 100), sino la razn b/a que se establece entre
ellos, que es la misma que c/b y que d/c. En este caso, se trata de la razn doble, la
representada por el nmero 2:
200
400
800
2
=
=
=
100
200
400
1
Esto quiere decir que cada vez que el parmetro fsico se multiplique por 2, nuestra
sensacin se incrementar un grado.
Imaginemos ahora que tenemos un nuevo estmulo al que llamaremos e, cuya intensidad es de 3200, y queremos saber cuntos grados sensoriales de incremento percibir nuestra sensacin al pasar del estmulo a a ese estmulo e.
La razn entre el estmulo e y el estmulo a es 3200/100, es decir, la representada por
el nmero 32. Puesto que en nuestro ejemplo hemos tomado como unidad de grado
sensorial la razn 2/1, representada por el nmero 2, la pregunta que nos tenemos que
hacer ahora es: cuntas veces tenemos que multiplicar el nmero 2 por s mismo para
obtener el nmero 32? O, dicho de otra manera, a qu exponente hay que elevar el
nmero 2 para obtener el nmero 32?
64
La respuesta es el logaritmo en base 2 del nmero 32, el cual es 5: 25 = 32. Esto signica que si la intensidad del parmetro fsico pasa de 100 a 3200, nosotros sentiremos
un incremento de 5 grados. As pues, el paso del estmulo a al estmulo e provocar una sensacin 5 veces ms intensa que la que hemos experimentado al pasar del
estmulo a al estmulo b.
Generalizando, para saber cuntos grados sensoriales experimentamos cuando
el estmulo cambia de intensidad, basta obtener el logaritmo del cociente entre
el estmulo final y el inicial, logaritmo que ha de tener como base la razn
numrica que hemos elegido como unidad sensorial.
En efecto, el logaritmo, como su nombre indica, es el nmero que mide la razn (la
palabra logaritmo procede del griego lgos, razn, y arithms, nmero) y, por ello, el
logaritmo realiza la conversin de los valores de los parmetros fsicos a las unidades
en las que se miden nuestras sensaciones. Por eso se dice que nuestra percepcin es
logartmica.
Con todas las matizaciones, excepciones y limitaciones que sera necesario hacer en
cada caso, la Ley de Weber-Fechner tiene especial inters para conocer cmo omos la
msica, pues, como veremos enseguida, nuestra audicin percibe las diferencias de
frecuencia y de amplitud de modo logartmico.
5.3.
Frecuencia y altura tonal: notas e intervalos
La altura tonal que percibimos al or un sonido peridico y con ella la nota musical
que reconocemos est determinada por el parmetro fsico de frecuencia (o por su
inversa, el periodo). Conforme mayor es la frecuencia de un sonido, ms aguda es la
altura tonal que apreciamos, y viceversa.
A continuacin vamos a analizar el modo en el que las notas y los intervalos musicales
estn vinculados con la frecuencia de los sonidos. Comenzaremos comprobando que,
dado el carcter logartmico de nuestro sistema perceptivo, los intervalos se denen
por las razones numricas que se establecen entre las frecuencias. Luego examinaremos las unidades musicales que habitualmente utilizamos para comparar intervalos
entre s: el intervalo de octava y sus divisiones. Y nalmente estudiaremos cmo se
65
establece mediante los intervalos una correspondencia directa entre las frecuencias
de los sonidos y las notas musicales.
5.3.1.
El intervalo musical como razn numrica
Aunque la altura tonal de una nota tiene un valor musical por s misma, lo cierto es
que los elementos que denen las escalas y los acordes musicales no son las alturas
absolutas de los sonidos, sino los intervalos que se producen entre ellas.
Igual que ocurre con la mayor parte de nuestro sistema sensitivo, en lo que concierne
a la percepcin del intervalo musical tambin est presente la Ley de Weber-Fechner:
la manera en la que percibimos las variaciones de la frecuencia no responde a una
escala lineal, sino a una escala logartmica. Esto explica que el intervalo musical no
sea la diferencia aritmtica entre sus frecuencias, sino su razn numrica, el cociente
que se establece entre ellas.
He fabricado un vdeo que nos va a permitir comprobar cmo percibimos las variaciones de la frecuencia y por qu las magnitudes de los intervalos musicales son
razones numricas. El vdeo est formado por una sucesin de sonidos simples agrupados de dos en dos para que se pueda distinguir con facilidad el intervalo que hay
entre ellos. Consta de dos partes separadas por una pausa larga. En la primera parte
se oyen en primer lugar dos sonidos seguidos, cuyas frecuencias son 220 Hz y 440
Hz, y tras una breve pausa, se oyen otros dos sonidos seguidos de 440 Hz y 660 Hz.
En la segunda parte del vdeo se oye primero otra vez la pareja de sonidos de 220 Hz
y 440 Hz, y luego otra nueva pareja que tiene como frecuencias 440 Hz y 880 Hz. A
medida que se van sucediendo los sonidos, se muestra en un recuadro la frecuencia
y la nota musical correspondiente.
66
Figura 5.1: Vdeo con una sucesin de sonidos simples agrupados por parejas que forman distintos
intervalos.
Podemos apreciar con claridad que percibimos mayor altura tonal en aquellos sonidos
que presentan las oscilaciones ms apretadas, es decir, los que tienen un periodo
menor y, por lo tanto, una mayor frecuencia. Pero, sobre todo, lo que nos interesa
experimentar mediante este vdeo es que el intervalo que percibimos entre dos notas
musicales no est denido por la diferencia aritmtica entre sus frecuencias, sino por
el cociente entre ellas.
En la primera parte del vdeo vemos que entre el primer sonido, el de 220 Hz, y
el segundo, el de 440 Hz, hay una diferencia aritmtica de 220 Hz. Apreciamos al
orlos un salto de altura tonal que es un intervalo de octava, en concreto, el que existe
entre el la3 y el la4 . Ahora bien, cuando escuchamos el salto entre los sonidos de la
segunda pareja entre el tercero, de 440 Hz, y el cuarto, de 660 Hz no percibimos
un intervalo de octava, a pesar de que su diferencia aritmtica es tambin de 220 Hz.
Nuestra sensacin nos dice que el salto ha sido bastante ms pequeo que el que se
produca entre el sonido de 220 Hz y el de 440 Hz. En efecto, ahora no reconocemos
el la5 , sino el mi5 , que est a una distancia intervlica de quinta respecto al la4 .
Sin embargo, al or los cuatro sonidos de la segunda parte del vdeo apreciamos la
misma diferencia intervlica entre la altura tonal de las dos parejas: entre el primer
sonido, cuya frecuencia es de 220 Hz, y el segundo, de 440 Hz, omos un intervalo
de octava, que es el mismo que omos entre el tercer sonido, de 440 Hz, y el cuarto,
de 880 Hz. Pero la diferencia aritmtica entre las frecuencias es distinta: mientras
67
que entre los dos primeros sonidos es de 220 Hz, entre los dos segundos es de 440
Hz.
Comprobamos que lo que ocurre es que la razn entre las frecuencias que denen los
dos intervalos de esta segunda parte del vdeo es la misma: el segundo sonido respecto al primero mantiene la misma razn numrica que el cuarto respecto al tercero,
exactamente la razn doble, 2/1, la cual es la propia del intervalo de octava:
880
2
440
=
=
220
440
1
Hemos podido experimentar que reconocemos el mismo intervalo, la misma distancia perceptiva, cuando entre los sonidos se mantiene la misma razn numrica. Esto
se debe a que lo que define el intervalo musical no es la diferencia aritmtica
entre sus frecuencias, sino la razn que hay entre ellas, su cociente.
En el vdeo, adems de los dos intervalos de octava, omos un intervalo de quinta, el
que hay entre la segunda pareja de sonidos, la4 (440 Hz) y mi5 (660 Hz). Si atendemos
a la relacin que se establece entre sus frecuencias vemos que estn en razn 3/2, que
es la razn que dene el intervalo de quinta natural:
3
660
=
440
2
As mismo, aunque no las oigamos seguidas, podemos ver que el intervalo que hay
entre la ltima nota de la primera parte, mi5 (660 Hz), y la ltima nota de la segunda
parte, la5 (880 Hz), es de una cuarta. Si nos jamos en sus frecuencias veremos que
mantienen la razn 4/3, que es la que dene el intervalo de cuarta natural:
880
4
=
660
3
Los intervalos que podemos considerar estructurales en nuestro sistema musical tienen una razn simple entre sus frecuencias: dos sonidos estn a un intervalo de octava
cuando sus frecuencias mantienen la razn doble, 2/1; estn a un intervalo de quinta
cuando mantienen la razn 3/2, la llamada razn sesquiltera; y estn a un intervalo
de cuarta cuando mantienen la razn 4/3, la llamada razn sesquitercia. Ahora bien,
68
en nuestra msica habitualmente no omos los intervalos naturales de cuarta y quinta,

sino los intervalos temperados, los cuales estn ligersimamente desviados.
Finalmente, del hecho de que el intervalo sea una razn numrica se deduce que el
intervalo que se obtiene de la composicin de otros intervalos es el resultado
de multiplicar sus respectivas razones. Por ejemplo, de la composicin del intervalo de quinta y el de cuarta surge el intervalo de octava, como podemos apreciar si
unimos el intervalo que hay entre las notas la4 y mi5 (3/2) con el que hay entre mi5 y
la5 (4/3):
2
3 4
=
2 3
1
De manera inversa, la diferencia entre dos intervalos es la divisin de sus razones.
As entre el intervalo de octava por ejemplo, el que hay entre la4 y la5 (2/1) y el
intervalo de quinta por ejemplo, entre la4 y mi5 (3/2) existe una diferencia intervlica de una cuarta (4/3) la que hay entre mi5 y la5 , lo cual se obtiene dividiendo
entre s ambas razones:
2 3
4
=
1 2
3
5.3.2.
Unidades intervlicas
Como acabamos de ver, los intervalos se denen mediante las razones entre sus frecuencias, pero, en tanto que el intervalo es un elemento de nuestra percepcin musical, necesitamos una unidad perceptiva que nos permita comparar unos intervalos
con otros. En la msica disponemos de una unidad natural. Esta unidad natural es el
intervalo de octava, la razn 2/1 entre las frecuencias de los sonidos.
Sonidos que distan un intervalo de octava poseen una especial anidad reconocida en
la prctica totalidad de los sistemas musicales de las diferentes culturas. Hay que tener
presente que cuando dos sonidos que forman una octava son emitidos simultneamente, el ms ligero alejamiento de la relacin doble es percibido inmediatamente
como desanacin. As pues, la octava es una unidad intervlica de carcter uni-
69
versal y en referencia a ella establecemos las restantes unidades que utilizamos

para medir los intervalos.
Veamos cmo podemos expresar cualquier intervalo en nmero de octavas. Imaginemos dos sonidos cuyas frecuencias sean a y b. El intervalo ser la razn b/a. Si
aplicamos lo que hemos estudiado con carcter general en el apartado sobre la Ley
de Weber-Fechner para medir las distancias perceptivas, concluiremos que el nmero de octavas que mide este intervalo ser el logaritmo en base 2 del nmero b/a
(recordemos que 2 es la razn de la octava). As pues, para expresar la medida de
un intervalo en octavas bastar tomar el logaritmo en base 2 del nmero que
define la razn entre las frecuencias de los sonidos que lo delimitan, sin que el
resultado tenga que ser necesariamente un nmero entero.
Por ejemplo, el intervalo que hay entre el ltimo sonido del vdeo, el la5 de 880 Hz,
y el primero, el la3 de 220 Hz, est denido por la razn 880/220, es decir, 4/1. Por lo
tanto, el nmero de octavas de este intervalo ser el logaritmo en base 2 del nmero
4, que es 2. Efectivamente, entre el la5 y el la3 hay dos octavas.
Pero en la mayor parte de las ocasiones la octava es un intervalo demasiado grande
para medir las diferencias entre las alturas tonales de los sonidos. Por eso se recurre
a divisiones de la octava. Una unidad intervlica habitual es el semitono temperado, que se define como la doceava parte de la octava. Por eso la razn que
representa el semitono temperado es el nmero que multiplicado 12 veces por s mis
mo da como resultado el nmero 2, la razn de la octava. Este nmero es 12 2, que
expresado con 15 decimales es: 1,059463094359295.
Cuando se trata de medir las sutilezas de la anacin el semitono sigue siendo una
unidad muy grande, por lo que es comn tambin utilizar como unidad intervlica la centsima parte del semitono temperado, la cual recibe el nombre de
cent. Como el cent es la 1/1200 parte de la octava, la razn que dene el intervalo de
cent es aquella que multiplicada por s misma 1200 veces da el nmero 2. Esta razn
es 1200 2, que con 15 decimales es: 1,000577789506555.
De las propiedades de los logaritmos se deduce que para expresar un intervalo cualquiera en semitonos o en cents basta con tomar el logaritmo en base 2 de la razn de
70
las frecuencias de sus notas y multiplicar el resultado respectivamente por 12 o por

1200.
A modo de ejemplo veamos cmo podemos expresar en semitonos temperados el
intervalo de quinta natural denido por la razn 3/2. Basta simplemente calcular
el logaritmo en base 2 del nmero 3/2 y multiplicarlo luego por 12. El resultado
redondeado a centsimas de semitono es 7,02.
log2
3
12 = 7, 02
2
Comprobamos que el intervalo de quinta natural, denido por la razn 3/2, es 2

centsimas de semitono es decir, 2 cents mayor que el de quinta temperada, que
por denicin consta de 7 semitonos temperados.
As mismo, si queremos expresar en semitonos el intervalo de cuarta natural, la razn
4/3, calcularemos el logaritmo en base 2 del nmero 4/3 y lo multiplicaremos por
12. El resultado ser 4,98 semitonos.
log2
4
12 = 4, 98
3
Este resultado nos indica que el intervalo de cuarta natural es 2 cents menor que el
de cuarta temperada, que por denicin consta de 5 semitonos.
Una vez realizadas estas comparaciones, nos daremos cuenta de que el sistema temperado se caracteriza porque acorta muy ligeramente las quintas y alarga las cuartas,
exactamente 2 cents en ambos casos.
5.3.3.
Las frecuencias de las notas musicales
Para determinar las frecuencias de las notas musicales de la escala, adems de conocer los intervalos que las separan, es necesario tambin elegir la frecuencia de una
nota que sirva de punto de partida para calcular todas las dems. La eleccin de la
frecuencia de esta nota determina la altura absoluta de toda la escala.
71
Aunque el intervalo es el elemento ms relevante para el lenguaje musical, lo cierto

es que la altura absoluta tambin tiene un importante valor en s misma. Es evidente
que el efecto musical que produce una meloda es muy distinto cuando se interpreta
en un registro grave que cuando se hace en un registro agudo. As mismo, tambin
resultan claras las diferencias entre una pieza interpretada, pongamos por caso, en la
tonalidad de do mayor o la misma pieza transportada a la tonalidad de mi mayor. Y
hay todava otras diferencias ms sutiles: por ejemplo, una pieza de Hndel ejecutada
en la anacin que se considera propia de su msica, con el la4 en torno a 422 Hz,
no suena igual que esa misma pieza interpretada en la anacin estndar actual, con
el la4 a 440 Hz.
Veamos cmo se determinan las frecuencias de las notas de nuestra escala temperada.
Supongamos que elegimos como nota de referencia el la4 a 440 Hz y queremos
hallar la frecuencia a la que debe estar anada la nota do6 . La cantidad de semitonos
temperados que separan ambas notas es 15 (12 semitonos de la octava la4 a la5 , ms
3 de la5 a do6 ). El nmero que dene el intervalo de 15 semitonos ser el resultado
de multiplicar 15 veces por s misma la razn del semitono, que como hemos visto
es 12 2:
12
215 = 2, 378414230005442
El nmero 2,378414230005442 es, as pues, la razn que dene el intervalo de 15

semitonos. Nos bastar ahora con multiplicar este nmero por la frecuencia de la
nota que hemos tomado como referencia inicial, en este caso 440 Hz, para obtener
la frecuencia de la nota do6 en la escala temperada estndar. Su valor ser 1046,5
Hz.
440
12
215 = 1046, 5
A continuacin presento una tabla con las frecuencias de las notas musicales en la
escala temperada estndar. Los nmeros de la la superior indican la octava a la que
corresponde cada nota. Aunque no hay unanimidad en la asignacin de los nmeros
de octava, he seguido el criterio que me parece ms acertado, el que hace corresponder el do central del piano con el inicio de la octava nmero 4.
72
Sobre fondo amarillo est destacada la frecuencia de la nota utilizada como referencia, el la4 . Las notas cuyo fondo est en color naranja coinciden con la extensin
completa de un piano moderno, que va del la0 al do8 . Las notas sobre fondo lila son
completamente excepcionales en la prctica musical: resulta muy difcil reconocer la
altura tonal de las ms agudas, mientras que las ms graves algunas de las cuales se
pueden encontrar en algn tubo de rgano casi no se perciben como sonido, sino
ms bien como un zumbido sordo.
do
16,4
32,7
65,4
130,8
261,6
523,3
1.046,5
2.093,0
4.186,0
do#
17,3
34,6
69,3
138,6
277,2
554,4
1.108,7
2.217,5
4.434,9
re
18,4
36,7
73,4
146,8
293,7
587,3
1.174,7
2.349,3
4.698,6
mib
19,4
38,9
77,8
155,6
311,1
622,3
1.244,5
2.489,0
4.978,0
mi
20,6
41,2
82,4
164,8
329,6
659,3
1.318,5
2.637,0
5.274,0
fa
21,8
43,7
87,3
174,6
349,2
698,5
1.396,9
2.793,8
5.587,7
fa#
23,1
46,2
92,5
185,0
370,0
740,0
1.480,0
2.960,0
5.919,9
sol
24,5
49,0
98,0
196,0
392,0
784,0
1.568,0
3.136,0
6.271,9
lab
26,0
51,9
103,8
207,7
415,3
830,6
1.661,2
3.322,4
6.644,9
la
27,5
55,0
110,0
220,0
440,0
880,0
1.760,0
3.520,0
7.040,0
sib
29,1
58,3
116,5
233,1
466,2
932,3
1.864,7
3.729,3
7.458,6
si
30,9
61,7
123,5
246,9
493,9
987,8
1.975,5
3.951,1
7.902,1
Tabla 5.1: Frecuencia de las notas musicales (Hz) en las diferentes octavas.
73
5.4.
Amplitud y volumen sonoro
El mayor o menor volumen sonoro, que es una sensacin subjetiva, est en relacin
directa con la intensidad de las ondas sonoras que llegan a nuestros odos. La intensidad es una magnitud fsica que mide la potencia sonora que transmite la onda por
unidad de supercie y se expresa en vatios por metro cuadrado (W/m2 ). Es decir, la
intensidad sonora es la cantidad de energa que, como consecuencia del movimiento
vibratorio que transmiten las ondas, uye en un instante dado a travs de un rea del
espacio, como puede ser el tmpano de nuestro odo.
Puesto que la intensidad de las ondas sonoras cuando se propagan por el aire es independiente de la frecuencia y, en el caso de un sonido simple, es directamente proporcional al cuadrado de la amplitud con la que la presin oscila, el volumen sonoro
que percibimos al escuchar un sonido simple viene determinado por el cuadrado de su amplitud.
Igual que ocurre con la altura tonal, tambin ahora est presente la Ley de WeberFechner, de modo que el cambio en el volumen sonoro que percibimos guarda una
relacin logartmica con la variacin de la intensidad o, lo que viene a ser lo mismo,
con la variacin del cuadrado de la amplitud, a la que la intensidad es directamente
proporcional. Por ello, lo que nuestro sistema perceptivo interpreta como un
grado en la variacin del volumen sonoro es el cociente entre las intensidades
de los sonidos, no su diferencia aritmtica.
5.4.1.
Unidades intervlicas de intensidad sonora: el belio y el decibelio
El rango de intensidades que podemos or es mucho ms amplio que el de frecuencias.

Mientras el sonido ms agudo que omos tiene una frecuencia de unas mil veces la
del sonido ms grave (recordemos que el rango frecuencial de nuestra audicin va
aproximadamente de 20 Hz a 20.000 Hz), el sonido ms fuerte que podemos escuchar
es por lo menos un billn de veces ms intenso que el ms dbil. En efecto, el rango
de intensidades de la audicin humana va desde un picovatio por metro cuadrado
(1 pW/m2 =0,000000000001 W/m2 ), donde se sita el umbral de audicin, hasta un
74
vatio por metro cuadrado (1 W/m2 ), donde la sensacin auditiva se transforma en

dolorosa.
Adems, para medir la percepcin de la intensidad sonora no existe una unidad objetiva que cumpla una funcin similar al intervalo de octava en el caso de la percepcin
de las alturas tonales en la msica. Pero, puesto que se ha comprobado de una manera
estadstica que un incremento en la intensidad del sonido de 10 veces es percibido
por nuestra sensacin auditiva como si se hubiera doblado el sonido, se ha establecido
como unidad convencional la razn 10:1.
Por eso, para poder comparar las diferentes intensidades de los sonidos de una manera acorde con la forma en la que percibimos el volumen sonoro se utiliza la relacin
10:1. Esta unidad recibe el nombre de bel o belio (B) en honor del cientco Alexander Graham Bell. El belio, que sirve tambin como unidad logartmica para otras
magnitudes relativas, es el logaritmo en base 10 de la razn entre las magnitudes que se quieren comparar. En lo que concierne al sonido, podramos decir que
el belio es una medida intervlica de las intensidades sonoras y cumple una funcin
similar a la que realiza la octava en la percepcin de la frecuencia.
Pero como en la mayor parte de las ocasiones el belio resulta en la prctica una unidad
demasiado grande, para medir la intensidad sonora habitualmente se utiliza el
decibelio (dB), que es la dcima parte del belio. As pues, para saber cuntos
decibelios de diferencia hay entre dos sonidos, se toma el logaritmo en base 10 de
la razn entre sus respectivas intensidades o de la razn entre los cuadrados de sus
amplitudes y se multiplica el resultado por 10.
Veamos con ayuda de un ejemplo cmo se puede expresar en decibelios la diferencia
de volumen sonoro entre dos sonidos cuyas amplitudes son una el doble de la otra.
Dado que la intensidad es directamente proporcional al cuadrado de la amplitud, las
( )2
diferencias entre sus intensidades estarn en razn cudruple: 21 = 41 . Calculamos

el logaritmo en base 10 de 4 y multiplicamos el resultado por 10. Redondeando,
obtenemos el nmero 6,02. As pues, el intervalo de intensidades, la diferencia de
volumen sonoro que percibimos entre dos sonidos cuya amplitud es una el doble
que la otra, es aproximadamente de 6 dB.
Podemos aprovechar las propiedades de los logaritmos para simplicar el clculo (el
logaritmo de un nmero elevado al cuadrado es igual al logaritmo de ese nmero
75
multiplicado por 2), por lo que es suciente multiplicar por 20 el logaritmo en base
10 de la razn 2/1 que hay entre las amplitudes:
10 log10
( )2
2
= 20 log10
( )
2
= 6, 02
1
Resumiendo, para expresar en decibelios las diferencias de volumen sonoro entre dos sonidos simples basta tomar el logaritmo en base 10 del cociente entre
sus amplitudes y multiplicarlo por 20.
5.4.2.
Correspondencia entre la amplitud normalizada y la intensidad en decibelios
Los editores de sonido ofrecen la posibilidad de acompaar las grcas que representan la evolucin temporal de la amplitud de la presin sonora cuyos valores estn
generalmente normalizados entre 1 y -1 con una escala logartmica en decibelios
que indica la intensidad a la que corresponden. Esto nos permite comparar entre s las
amplitudes de varios sonidos de una manera ms prxima a la sensacin de volumen
que percibimos.
Para obtener los valores de intensidad relativa en una escala expresada en decibelios,
se aplica la frmula anterior, es decir, se calcula el logaritmo en base 10 del valor de
cada amplitud y se multiplica por 20. As, el valor de amplitud 1 equivale a 0 dB de
intensidad (el logaritmo en base 10 de 1 es 0); el valor 0,5 de amplitud corresponde a
-6,02 dB de intensidad relativa; y as sucesivamente. Los valores negativos se deben
a que el logaritmo de los nmeros inferiores a la unidad es negativo, de modo que 0
dB se corresponde con la amplitud mxima.
A continuacin presento una tabla de correspondencias entre los valores de amplitud
normalizados y su intensidad expresada en decibelios. En la columna de la izquierda
se muestran una serie de valores de amplitud normalizada que cubren el rango que
un sistema de 16 bits es capaz de digitalizar. Los valores van decreciendo de modo
que cada uno de ellos es la mitad del anterior, hasta llegar al valor mnimo que es
posible representar con 16 bits. En la columna de la derecha se expresa en decibelios
los correspondientes valores de intensidad. Podemos observar que las intensidades
76
van decreciendo de manera lineal, disminuyendo 6,02 dB cada vez que la amplitud
se reduce a la mitad.
Amplitud
Intensidad
normalizada
normalizada (dB)
1,000000
0,00
0,500000
-6,02
0,250000
-12,04
0,125000
-18,06
0,062500
-24,08
0,031250
-30,10
0,015625
-36,12
0,007813
-42,14
0,003906
48,16
0,001953
-54,19
0,000977
-60,21
0,000488
-66,23
0,000244
-72,25
0,000122
-78,27
0,000061
-84,29
0,000031
-90,31
0,000015
-96,33
Tabla 5.2: Equivalencias entre amplitudes y decibelios de intensidad.
77
5.4.3.
Valores absolutos de intensidad sonora
Por razones prcticas, hay algunas ocasiones en las que es conveniente referirse a la
intensidad del sonido en trminos absolutos, como por ejemplo para determinar si
el nivel sonoro de un lugar est dentro de la normativa legal. En estos casos es til
establecer una escala logartmica de intensidades absolutas adecuada a la manera en
la que nosotros percibimos el volumen sonoro.
Dado que el belio o el decibelio son unidades que miden intervalos entre intensidades, para expresar con ellas valores absolutos es necesario tomar una intensidad de
referencia con la que comparar las que queremos medir. Como sonido de referencia
al que se asigna el valor 0 dB, se ha elegido lo que se considera el umbral mnimo de
la audicin humana: un sonido simple de 1 pW de intensidad, a una frecuencia de
1000 Hz.
Para hacernos una idea de las intensidades que corresponden al volumen que percibimos en distintos ambientes sonoros, pongo debajo una escala de intensidades
absolutas y su correspondiente valor en dB, acompaada de unos ejemplos orientativos. En la columna de la izquierda se muestra la intensidad en W/m2 y en la del
medio la intensidad en dB, a partir del valor de referencia inicial de 0 dB para 1
pW/m2 . El valor de cada intensidad es 10 veces mayor que el de la la anterior, por
lo que el incremento en dB es de 10. Como la intensidad depende de la proximidad
o lejana de la fuente sonora, se indica la distancia o el lugar en el que se debera
hacer la medicin. Hay que insistir en el carcter meramente orientativo de cada
ejemplo, dada la gran variedad de intensidades que pueden darse en cada situacin
sonora.
78
Intensidad
2
Intensidad
W(m )
(dB)
0,000000000001
0,000000000010
10
0,000000000100
20
0,000000001000
30
0,000000010000
40
0,000000100000
50
0,000001000000
60
0,000010000000
70
0,000100000000
80
0,001000000000
90
0,010000000000
100
0,100000000000
110
1,000000000000
120
Ejemplo sonoro orientativo

- Umbral de audicin para un sonido simple de 1000 Hz.
- Suave aleteo de una mariposa a 1 m.
- Zumbido de un mosquito a 1 m.
- Suave murmullo de hojas de rbol a 10 m.
- Respiracin tranquila de una persona a 1 m.
- Ordenador silencioso a 1 m.
- Murmullo de un arroyo en el campo a 1 m.
- Susurro a 2 m en una biblioteca silenciosa.
- Oleaje junto a la orilla de una playa tranquila.
- Piano vertical en un pasaje pianissimo (pp) a 3 m.
- Ruido de lluvia moderada en una calle sin trco.
- Piano vertical en un pasaje piano (p) a 3 m.
- Conversacin entre dos personas a volumen medio a 1 m.
- Piano vertical en un pasaje mezzoforte (mf ) a 3 m.
- Autobs urbano de gasleo a 10 m.
- Piano vertical en un pasaje forte (f ) a 3 m.
- Ruido de trco intenso a 10 m.
- Piano vertical en un pasaje fortissimo ( ) a 3 m.
- Moto de gran cilindrada a 10 m.
- Orquesta sinfnica a pleno volumen en sala de conciertos.
- Sirena de una ambulancia a 20 m.
- Tren suburbano llegando a la estacin en el andn.
- Avin de pasajeros despegando a 100 m.
- Msica a gran volumen en el interior de una discoteca.
- Martillo neumtico a 0,5 m.
- Umbral de molestias serias.
Tabla 5.3: Niveles de volumen sonoro de diferentes sonidos.
79
5.4.4.
La percepcin del volumen sonoro
He confeccionado un vdeo que nos va a permitir experimentar cmo percibimos

el mismo grado de disminucin del volumen sonoro cuando la amplitud se reduce,
manteniendo la misma razn. En l podemos or seis veces el sonido simple la3 a 220
Hz con una amplitud que es cada vez la mitad de la anterior. En la parte superior del
vdeo va apareciendo el valor de la amplitud normalizada de la nota que est sonando
y su correspondiente intensidad en decibelios. La primera nota tiene una amplitud de
0,5 y las siguientes notas reducen su amplitud sucesivamente a la mitad, coincidiendo
con los valores de la tabla.
Figura 5.2: Vdeo con la nota la3 a 220 Hz repetida con una amplitud que se reduce cada vez a la
mitad.
Para apreciar que los valores de amplitud e intensidad son relativos, nos basta con
subir o bajar el volumen del reproductor de sonido. Al hacer esto, aumenta o disminuye la presin sonora que el altavoz origina y, con ello, la intensidad que llega a
nuestros odos. Ahora bien, si escuchamos de nuevo todo el vdeo con el nuevo volumen, comprobaremos que percibimos el mismo grado de disminucin del volumen
sonoro al pasar de nota en nota. En efecto, el intervalo entre las intensidades sonoras,
lo que nosotros percibimos como un grado en el volumen sonoro, sigue siendo el
mismo: cada vez que la amplitud se reduce a la mitad nosotros percibimos el mismo
descenso de volumen sonoro, el que corresponde aproximadamente a 6 dB.
80
Hemos podido comprobar que nuestra percepcin del volumen sonoro guarda muchas similitudes con nuestra percepcin de la altura tonal. Sin embargo, hay varias
diferencias que conviene tener presente, debidas tanto a las peculiaridades fsicas del
sonido, como a las de nuestro sistema auditivo.
A diferencia de la frecuencia que, salvo situaciones excepcionales, se mantiene invariable en su transmisin a travs de las ondas, la amplitud y la intensidad disminuyen progresivamente conforme el sonido se aleja de la fuente: la amplitud
de forma lineal y la intensidad segn el cuadrado de la distancia. Adems, ambas magnitudes son muy sensibles a las mltiples incidencias que las ondas pueden
encontrase en su camino.
Por otra parte, nuestra sensacin no responde de igual manera a todos los sonidos de la misma intensidad, sino que el grado de volumen sonoro que percibimos depende en buena medida de la frecuencia. Para permitir comparar el
volumen sonoro en funcin de la frecuencia se ha establecido una unidad de referencia: el fon o fonio. Hay que tener en cuenta que el fonio no es una unidad fsica
objetiva, sino que se trata de una unidad establecida a partir de criterios psicoacsticos estadsticos. El nmero de fonios de un sonido simple es la sensacin de
volumen sonoro que experimenta un oyente medio cuando escucha un sonido
de 1000 Hz de ese nmero de decibelios de intensidad absoluta.
Por ello la escala de fonios coincide con el valor de intensidad sonora de un sonido a
1000 Hz. Por ejemplo, cuando hablamos de un sonido que provoca una sensacin de
volumen sonoro de 50 fonios, estamos rerindonos a un sonido simple de 1000 Hz
cuya intensidad sonora expresada en decibelios absolutos es de 50 dB. Si la frecuencia
del sonido fuera de 200 Hz, para provocar la misma sensacin de volumen sonoro
es decir, 50 fonios sera necesario que tuviera una intensidad de 60 dB, expresada
en unidades absolutas.
Podemos verlo en las grcas que habitualmente se establecen con los valores psicoacsticos de la percepcin del volumen sonoro en funcin de la frecuencia.
81
Figura 5.3: Grcas de la percepcin del volumen sonoro en las diferentes frecuencias.
La raya azul marca los 1000 Hz, la frecuencia de referencia donde el nmero de
fonios coincide con el valor de la intensidad sonora absoluta. Podemos observar que
en torno a los 4000 Hz es donde, con la misma intensidad sonora, la percepcin
del volumen es mayor, tal vez debido a la resonancia de nuestra canal auditivo. Por
otra parte, las zonas extremas, tanto graves como agudas, requieren una intensidad
mucho mayor para que el oyente experimente el mismo nmero de fonios, es decir,
la misma sensacin de volumen sonoro.
5.5.
Conclusin
A lo largo de este captulo hemos podido comprobar que nuestra percepcin musical
de los parmetros fsicos del sonido es logartmica. Percibimos razones intervlicas,
no diferencias aritmticas. Mientras la altura tonal es el correlato perceptivo de la
frecuencia, el volumen sonoro est en relacin directa con el cuadrado de la amplitud. En ambos casos, nuestra sensacin se incrementa de grado en grado cuando
se mantiene la misma razn en la variacin de los parmetros fsicos. El intervalo
meldico entre dos notas musicales queda determinado por la razn entre sus fre82
cuencias y puede ser expresado utilizando como unidad la octava la razn 2/1
o cualquiera de sus subdivisiones, como el semitono o el cent. As mismo, tambin
podemos denir el intervalo de volumen sonoro entre dos sonidos como la razn
entre el cuadrado de sus amplitudes y utilizar para medirlo el belio la razn 10/1
o el decibelio. El hecho de que, a diferencia de la amplitud, la frecuencia permanezca
invariable a lo largo de la transmisin ondulatoria ha posibilitado su codicacin en
las notas y escalas del lenguaje musical.
83
Captulo 6
Mezcla e interferencia de dos sonidos
simples
6.1.
Introduccin
Los sonidos que omos todos los das, sean o no musicales, no suelen ser sonidos
simples, sino el resultado de la superposicin de un conjunto de vibraciones que
coinciden en un momento dado. En el caso de la msica, que es lo que nos interesa
ahora, estas superposiciones se pueden producir en cualquier lugar: en el cuerpo
mismo de los instrumentos, en el espacio por el que se transmiten las ondas sonoras
o en el interior de nuestro odo.
Cuando se mezclan las vibraciones sonoras se producen diversos fenmenos acsticos, fenmenos que dan lugar a las diferentes cualidades sonoras que omos. Estas
mezclas, dependiendo de sus caractersticas, pueden ser combinaciones armnicas
que percibimos como notas musicales o pueden ser otro tipo de combinaciones en
las que apreciamos simplemente ruido. En efecto, los fenmenos acsticos derivados
de las distintas combinaciones de sonidos simples (es decir, de componentes sinusoidales) generan buena parte de la riqueza sonora de nuestro entorno. En lo que
concierne a la msica, los fenmenos que se crean al combinarse las vibraciones de
distintos sonidos o de distintos componentes de un mismo sonido constituyen buena
parte del fundamento acstico de nuestro sistema musical.
84
Como se estudia en el captulo siguiente, el sonido armnico o musical, hablando en

general, est formado por una serie de componentes simples cuyas vibraciones se superponen de una manera especial. Las caractersticas de las mezclas y combinaciones
de sonidos simples que dan lugar al sonido musical son la causa de su particular naturaleza sonora. Estas caractersticas explican, adems, los principios fsicos que rigen
las consonancias, los pilares del lenguaje musical.
En este sentido, este captulo prepara el estudio del sonido armnico, es decir, de la
estructura armnica creada por la combinacin de componentes simples que mantienen entre s unas determinadas relaciones. Puesto que los principios que rigen la
superposicin de dos componentes simples son los mismos que los que estn detrs de
la mezcla de cualquier nmero de componentes, conviene experimentar cmo son
los fenmenos que se crean cuando intereren entre s las vibraciones de dos sonidos
simples y analizar a qu se deben esos fenmenos. Despus ser sencillo entender
las especiales relaciones de conmensurabilidad que se establecen entre las frecuencias
de un nmero cualquiera de componentes simples cuando se superponen unos con
otros para formar un sonido armnico.
As pues, en este captulo vamos a comprobar que los fenmenos acsticos que se
crean en las diferentes tipos de mezclas de sonidos simples son el resultado bien de
la diferencia aritmtica entre las frecuencias de los sonidos que se superponen o bien
de la razn numrica que hay entre esas frecuencias, y que estos fenmenos estn
condicionados por la anchura de la banda crtica correspondiente a sus respectivas
frecuencias. Adems, vamos a atender a los fundamentos acsticos de las consonancias musicales, es decir, a los fenmenos que se producen cuando se mezclan dos
sonidos simples cuyas frecuencias mantienen unas especiales relaciones de conmensurabilidad.
Por otra parte, al estudiar todos estos fenmenos, vamos a entender el mecanismo
acstico que permite la anacin de los instrumentos musicales. Comprenderemos
cmo, a lo largo de la historia, de manera natural y sin recurrir a ninguna herramienta externa, ha sido posible anar con precisin los instrumentos y, a partir de
esas anaciones, han sido establecidas las diferentes escalas musicales. En efecto, podremos experimentar que las interferencias que se crean cuando se mezclan entre s
los sonidos permiten determinar de manera emprica las alturas tonales que dan lugar
a los intervalos y a las escalas, y que eso se hace con tanta exactitud que muy ligeras
85
variaciones son interpretadas por nuestra percepcin como extraas a esa escala o
desanadas.
Experimentaremos tambin los lmites de nuestra capacidad para discernir individualmente sonidos simultneos, comprobando que estos lmites dependen de la anchura de la banda crtica correspondiente a cada zona frecuencial.
Y, por ltimo, mediante la introduccin de una distorsin articial en la seal, comprobaremos los efectos que sta puede ocasionar en la mezcla de sonidos simples, al
dar lugar a la aparicin de componentes espurios. Esta es la razn de que, para poder apreciar correctamente las caractersticas sonoras que se muestran en los vdeos,
sea necesario que la distorsin del equipo de audio en el que los reproduzcamos sea
pequea, como he indicado en el Prlogo de este libro.
A mi juicio, el modo ms sencillo que tenemos hoy en da para estudiar los fenmenos acsticos y psicoacsticos que se crean al mezclarse los sonidos es observar como
se comportan dos sonidos fabricados por ordenador. El hecho de utilizar sonidos
articiales nos garantiza su estabilidad y permite que sus parmetros estn perfectamente controlados. Mediante vdeos que simulan un osciloscopio creados a partir de
Matlab, a lo largo de este captulo vamos a escuchar cmo suenan las diferentes mezclas de inters musical de dos sonidos simples y observar la forma de la vibracin de
la seal resultante, atendiendo tanto a los fenmenos acsticos en s mismos, como a
la manera en la que nosotros los percibimos.
6.2.
El Principio de Superposicin Lineal de Ondas
Antes de analizar cada uno de los casos de inters musical que se producen cuando
se mezclan dos sonidos simples, vamos a prestar atencin brevemente al principio
general que rige toda mezcla de sonidos. Puesto que el sonido es un movimiento
vibratorio que se transmite en forma de ondas, cuando se mezclan dos sonidos en
las situaciones habituales se cumple el Principio de Superposicin Lineal de Ondas.
El Principio de Superposicin Lineal de Ondas dice que cuando en un tiempo
dado coinciden en un punto dos o ms ondas la alteracin total que se produce
en ese punto es igual a la suma de las alteraciones que cada onda individual
86
habra producido. Es decir, cuando dos ondas intereren, el comportamiento individual de cada una de ellas no se ve afectado por el de la otra.
Si pensamos en trminos de seal de audio, podemos decir que la seal que resulta
de la reunin de dos seales independientes es una nueva seal cuyas muestras son
simplemente la suma de las muestras de cada una de ellas.
Hay que tener en cuenta que para que se cumpla el Principio de Superposicin Lineal
de Ondas es necesario que el medio por el que se transmite el sonido no altere la
forma de la vibracin, es decir, que no distorsione la seal de audio. Si esto no se
cumple (por ejemplo, si el equipo reproductor de sonido presenta una distorsin
signicativa) surgirn componentes extraos no presentes en la seal original. Un
ejemplo de los efectos de tales distorsiones son los llamados Tonos de Tartini, que no
son componentes reales que pertenezcan a la vibracin sonora en s misma, sino el
resultado de la pequesima distorsin que introduce nuestro propio odo.
A continuacin vamos a estudiar una serie de fenmenos fsicos, todos ellos de inters musical, que surgen al mezclarse dos sonidos simples. Todos estos fenmenos, as
como la forma en la que nosotros los percibimos, dependen de tres factores: la distancia aritmtica entre las frecuencias de los sonidos que se mezclan; la razn numrica
que se establece entre sus frecuencias; y la regin frecuencial a la que pertenecen.
Generalizados a la mezcla de cualquier nmero de componentes, estos fenmenos y
la forma en la que nosotros los percibimos constituyen el fundamento acstico sobre
el que se ha construido nuestro Sistema Musical.
6.3.
Mezcla de dos sonidos simples de la misma frecuencia:

Unsono
Empecemos analizando lo que ocurre cuando se superponen en el mismo espacio y

tiempo dos sonidos simples que tienen exactamente la misma frecuencia, es decir,
que forman un unsono.
He confeccionado un vdeo que nos va a permitir observar que el resultado de
la superposicin de dos sonidos simples de igual frecuencia es siempre otro
87
sonido simple de la misma frecuencia, cuya amplitud depende no solo de la de

cada sonido, sino tambin del desfase que hay entre ellos.
En el vdeo se emiten cinco veces dos sonidos simultneos que tienen la misma frecuencia, 220 Hz, un la3 en la anacin estndar. En cada emisin omos el sonido
resultante de la mezcla de ambos componentes.
Para reconocer con facilidad la forma de la seal de cada componente en el simulador
del osciloscopio, he generado los sonidos con una ligera diferencia entre sus amplitudes. Si fueran exactamente iguales, las grcas de ambas seales se superpondran y
no podramos distinguirlos, particularmente en el momento en el que estn en fase.
La amplitud de la seal azul es 0,20 y la de la seal magenta 0,22.
En cada repeticin los sonidos componentes se van desfasando entre s: la primera vez
que suenan tienen la misma fase inicial; luego la fase inicial del sonido representado
por la seal azul se adelanta un poco, de modo que los dos sonidos quedan desfasados
entre s 45; a continuacin la seal azul se adelanta todava ms, siendo el desfase
entre los componentes de 90; luego el desfase es de 135; y, nalmente, de 180, es
decir, ambos sonidos estn en oposicin de fase.
Figura 6.1: Vdeo con dos sonidos unsonos que van incrementando su desfase.
Podemos ver en el osciloscopio dos seales nas sinusoidales de amplitudes muy parecidas, una magenta y otra azul, que representan los sonidos simples componentes.
88
Vemos tambin una seal ms gruesa de color verde, que es la resultante de la mezcla
y que corresponde al sonido que estamos escuchando en el vdeo.
En cada una de las cinco repeticiones percibimos un solo sonido simple. Comprobamos, as pues, que la mezcla de dos sonidos simples de la misma frecuencia produce
un sonido simple que conserva el mismo periodo y, por lo tanto, la misma frecuencia
que los componentes, en este caso 220 Hz. En efecto, en el osciloscopio vemos que
la grca de la seal resultante, de color verde, es tambin una seal sinusoidal. Al
escuchar como suenan podemos apreciar que la mezcla ha sido tan perfecta que los
sonidos que la han compuesto han sido fundidos, de modo que omos un solo sonido
simple.
Veamos ahora en qu se diferencian las distintas repeticiones de esa nota. Enseguida
nos damos cuenta de que el volumen sonoro que percibimos es diferente en cada
caso. No voy a explicar ahora cmo se puede calcular la amplitud y la fase inicial
del sonido resultante de la mezcla, pues no es relevante para nuestro objetivo; nos
basta comprobar en el osciloscopio que la amplitud de la seal verde, la del sonido
que omos, disminuye conforme aumentan los desfases en las sucesivas emisiones.
Como casos especiales podemos observar que cuando los dos sonidos estn en fase
la primera emisin, desfase de 0, la amplitud del sonido resultante es la suma
de las amplitudes de cada uno de los componentes (0,20 + 0,22 = 0,42), mientras
que cuando ambas seales estn en oposicin de fase la ltima emisin, desfase
de 180, la amplitud de la seal resultante es la diferencia de las amplitudes de los
componentes (0,22 0,20 = 0,02).
Para ver en detalle lo que sucede, la gura de abajo presenta una instantnea de la
forma de la vibracin en cada una de las cinco emisiones, de modo que cada grca
corresponde a uno de los desfases que hemos visto en el vdeo.
89
Figura 6.2: Formas de la vibracin de dos sonidos simples unsonos con diferentes desfases.
Puesto que cada muestra de la seal resultante es, segn el Principio de Superposicin
Lineal, la suma de las correspondientes muestras de las seales componentes, vemos
que, conforme se van incrementando los desfases, la prdida de sincrona da lugar
a que la amplitud resultante vaya disminuyendo. En la grca de la quinta la, en
la que ambas seales estn en oposicin de fase, podemos apreciar que los valores
de todas las muestras son prcticamente opuestos, de modo que resulta fcil deducir
que si ambos componentes hubieran tenido la misma amplitud, el sonido resultante
hubiera tenido una amplitud de 0, es decir, hubiera desaparecido por completo.
As pues, en este vdeo hemos podido observar que el resultado de la mezcla de dos
sonidos simples de igual frecuencia siempre es otro sonido simple de la misma frecuencia y que el cambio en la fase inicial slo modica la amplitud del sonido simple
resultante y, por lo tanto, solo repercute en el volumen sonoro que apreciamos, sin
que afecte a la cualidad sonora que percibimos.
Los cambios en el volumen sonoro derivados de los desfases entre dos sonidos unsonos explican algunos problemas que pueden surgir al realizar una grabacin en un
estudio. En el caso de que la misma fuente sonora sea recogida por dos micrfonos,
pudiera suceder que algunos componentes llegaran a cada micrfono casi en oposi90
cin de fase, lo que podra dar lugar a que, al realizarse la mezcla, esos componentes
quedaran signicativamente atenuados. Si esto ocurre se puede percibir una especie
de agujero acstico en el sonido grabado. Para evitar este problema las mesas de mezclas suelen llevar un dispositivo que permite invertir la fase de cada seal de entrada.
En la audicin directa este problema queda minimizado por el hecho de que disponemos de dos odos y porque los sonidos habitualmente llegan hasta nosotros con
mltiples desfases, debido a que, por regla general, provienen de diversos lugares,
como consecuencia de las reexiones en las paredes, techos y suelos.
6.4.
Mezcla de dos sonidos simples de frecuencias muy prximas: Batidos de primer orden
Vamos a estudiar ahora lo que ocurre cuando se mezclan dos sonidos simples cuyas frecuencias estn separadas entre s por una pequea distancia, menos de 15 Hz
aproximadamente. El fenmeno acstico que se produce se denomina batidos de
primer orden y ha sido empleado desde tiempos muy antiguos para la anacin de
los instrumentos musicales y la determinacin de las escalas.
6.4.1.
Los batidos de primer orden
Para experimentar cmo son los batidos o pulsaciones, he fabricado un vdeo en el

que se oyen sucesivamente seis sonidos, cada uno de los cuales es el resultado de la
mezcla de dos componentes simples de frecuencias muy prximas. En cada nuevo
sonido las frecuencias de los dos componentes estn cada vez ms cercanas.
91
Figura 6.3: Vdeo con diferentes casos de batidos de primer orden.
En el osciloscopio se representan dos seales nas, que pertenecen a cada uno de

los dos componentes que se mezclan y una seal ms gruesa, que es la del sonido
resultante de la mezcla y que es el que omos. La seal de color magenta es la del
componente ms grave y la de color azul es la del componente ms agudo, mientras
que la de color verde pertenece al sonido resultante. Para poder distinguir bien cada
uno de los dos componentes y para que la profundidad del batido no sea excesiva, he
elegido amplitudes diferentes para cada componente: la amplitud del primero es 0,2
y la del segundo es 0,1.
En cada uno de los seis sonidos que escuchamos, la frecuencia del primer componente es de 220 Hz (un la3 en la anacin estndar) mientras que la del segundo va
cambiando, de modo que la diferencia entre los dos componentes es cada vez ms pequea, hasta llegar a coincidir en el ltimo sonido: en el primer sonido la frecuencia
del componente agudo es de 228 Hz, por lo que la diferencia respecto al componente
grave es de 8 Hz; en el segundo, el componente agudo tiene una frecuencia de 224
Hz, de modo que tiene una diferencia de 4 Hz respecto al grave; en el tercero, la
frecuencia del componente agudo es de 222 Hz, por lo que estn a 2 Hz de distancia
del grave; en el cuarto caso la frecuencia del agudo es de 221 Hz, estando slo a 1
Hz del primer componente; en el quinto sonido la frecuencia del agudo es de 220,5
Hz, por lo que solo estn separados 0,5 Hz; y, nalmente, en el ltimo caso, los dos
componentes tienen la frecuencia de 220 Hz,de modo que suenan al unsono.
92
A excepcin del ltimo sonido, en todos los casos omos una especie de sonido tremolado, es decir, unos batidos o pulsaciones que se repiten de manera peridica y
que coinciden con la oscilacin de la amplitud de la seal verde que vemos en el osciloscopio. Si prestamos atencin al vdeo comprobamos que el nmero de batidos
por segundo que omos (es decir, la frecuencia de los batidos) coincide con la diferencia que hay entre la frecuencia de los dos componentes que han intervenido en
la mezcla. En efecto, en el primer caso omos 8 batidos por segundo; en el segundo
4; en el tercero 2; en el cuarto 1; en el quinto 1 batido cada dos segundos (es decir,
0,5 cada segundo); y en el ltimo los batidos desaparecen y los dos componentes se
quedan fundidos plenamente en un solo sonido estable y continuo.
Ahora bien, si detenemos el vdeo en cualquier momento, con independencia de que
haya o no batidos, observaremos que en todos los casos la vibracin sigue teniendo
una forma sinusoidal. Esto explica que en todos esos sonidos, incluso cuando estn
formados por dos componentes de diferente frecuencia, omos un solo sonido simple,
con una altura tonal bien denida.
En resumen, cuando se producen los batidos de primer orden la amplitud del
sonido oscila peridicamente, pero su frecuencia permanece estable durante
toda su duracin.
Si tenemos un odo muy no podremos apreciar que la altura tonal desciende ligersimamente de un sonido a otro, conforme se van aproximando ms las frecuencias
de los dos sonidos componentes. La frecuencia del sonido resultante depende de
la frecuencia y la amplitud de los componentes que lo forman. Si la amplitud de
ambos componentes hubiera sido la misma, la frecuencia resultante de la mezcla hubiera sido la media aritmtica de las frecuencias de los dos componentes; pero como
en todos los casos de este vdeo el componente ms grave tiene mayor amplitud, la
frecuencia resultante se aproxima ms a la de este componente. Por ello la frecuencia
de los seis sonidos que omos desciende ligeramente de un caso a otro: desde 222 Hz
en el primero, hasta 220 Hz en el ltimo cuando desaparecen los batidos y ambos
componentes suenan al unsono.
93
6.4.2.
Causas de los batidos de primer orden
Para ver en detalle a qu se debe este fenmeno, vamos a centrar nuestra atencin en
las seales del primer caso del vdeo, cuando las frecuencias de los dos componentes
estn a una distancia de 8 Hz. Veamos una grca que corresponde a 2 dcimas de
segundo de este primer sonido, en concreto, las que estn entre los segundos 1 y 1,2.
En esta grca las seales estn ms comprimidas que en la ventana del osciloscopio,
donde se representan slo 50 milsimas de segundo, con lo que ahora podremos
apreciar la forma de los batidos.
Figura 6.4: Detalle de un batido de primer orden.
La grca representa algo ms de un batido y medio. En ella podemos ver que la

ligera diferencia entre las frecuencias de los dos componentes provoca unos desfases
que van cambiando durante toda la emisin del sonido. As, vemos que la seal azul
y la seal magenta (que, recordemos, corresponden respectivamente al componente
de 220 Hz y al de 228 Hz) pasan alternativamente por momentos en los que estn
en fase y por momentos en los que estn en oposicin de fase. En el primer caso la
seal resultante tiene la mxima amplitud y en el segundo, la mnima.
Por ejemplo, podemos observar que en torno a los segundos 1,07 y 1,20 las seales
magenta y azul coinciden en sus fases, con lo que en ese momento, al sumarse la
94
amplitud de ambos componentes, la seal verde adquiere su mxima amplitud (0,2

+ 0,1 = 0,3). Por el contrario, en torno a los segundos 1,00 y 1,13 ambas seales se
encuentran en oposicin de fase, por lo que en ese momento la amplitud resultante
es la diferencia entre la amplitud de ambos componentes, teniendo su valor ms bajo
(0,3 0,2 = 0,1). La profundidad del batido es la diferencia entre la amplitud mxima
y mnima de la seal resultante, por lo que en este caso es de 0,2 (como en el resto
de los sonidos del vdeo en los que hay batidos).
La variacin en los desfases entre los componentes es la causa de que la amplitud de la
seal resultante vaya modicndose a lo largo del tiempo, oscilando tambin de una
forma sinusoidal. Ese cambio peridico de la amplitud es lo que origina los batidos
que escuchamos. El ritmo de los batidos o pulsaciones es la diferencia aritmtica entre
las frecuencias de los componentes.
Para entenderlo mejor podemos imaginarnos la seal de cada componente simple
como si fuera el resultado de un movimiento circular uniforme, similar al del panel
de la izquierda del vdeo de la gura 4.2 del captulo 4. En un segundo el componente
de color magenta dar 220 vueltas, mientras que el componente de color azul dar
228 vueltas. Por lo tanto, como si se tratara de una carrera de coches, en un segundo el
componente magenta habr doblado 8 veces al componente azul. Y cada vez que
lo doble sus fases volvern a sincronizarse, de modo que en la vuelta de despus
de la sincronizacin, en la que ambos componentes irn casi a la vez, se producir
la mxima amplitud del sonido resultante; por el contrario, como consecuencia de
los desfases, cuando ambos componentes estn en oposicin, el sonido resultante
alcanzar su amplitud mnima.
En resumen, cuando se mezclan dos sonidos de frecuencias muy prximas, el
resultado es un solo sonido simple, cuya frecuencia se encuentra entre la de los
dos componentes y cuya amplitud oscila de forma sinusoidal tantas veces por
segundo como la diferencia que hay entre la frecuencia de los dos componentes, dando lugar a los batidos de primer orden.
Hay que tener en cuenta que para que se perciban los batidos la diferencia entre las
frecuencias de los componentes debe ser inferior a 15 Hz, aproximadamente, pues
nuestro sistema perceptivo no tiene capacidad para distinguir con nitidez cambios
ms rpidos en la variacin de los parmetros sonoros.
95
6.4.3.
Batidos y afinacin
Cualquier msico que tiene que anar su instrumento est habituado a poner el odo, es decir, a prestar atencin y escuchar las pequeas oscilaciones en el volumen
sonoro que se producen cuando las frecuencias de dos sonidos distintos que se emiten simultneamente estn muy prximas, pero no son idnticas. En efecto, como
el fenmeno de los batidos se produce de manera natural siempre que se mezclan
sonidos de frecuencias muy prximas, su observacin ha sido el mtodo habitualmente utilizado para anar los instrumentos musicales: si se conoce la frecuencia de
un sonido que se utiliza de referencia, este mtodo permite la determinacin precisa
de la frecuencia de otro.
El vdeo de la gura 6.3 nos sirve para entender cmo se utilizan los batidos para la
anacin. Por ejemplo, para anar la cuerda de una guitarra, tomando como referencia la nota ya anada de una cuerda inferior, empezaremos tensndola de manera
aproximada para acercarla al sonido de referencia y, una vez en ese rango, iremos
ajustando su tensin hasta que los batidos desaparezcan por completo. En el vdeo
vemos que, conforme las frecuencias de los componentes estn ms prximas, el
ritmo de los batidos va disminuyendo, hasta desaparecer cuando los sonidos estn
completamente anados.
Incluso cuando no se busca una coincidencia exacta, el nmero de batidos que se
produce cada cierto tiempo proporciona al msico una medida precisa de la diferencia entre las frecuencias de los dos sonidos. El nmero de batidos que se produce
por segundo (es decir, la frecuencia de los batidos) es un medio para determinar con
precisin el grado de desanacin.
Este procedimiento no slo es vlido para anar notas unsonas, sino tambin para
determinar la anacin de las principales consonancias musicales y, a partir de ah,
la escala entera. Aunque en este captulo estamos estudiando el modelo de dos sonidos simples cuyas frecuencias se superponen en un momento dado, tenemos que
tener presente que la mayora de los sonidos que emiten los instrumentos musicales no son simples, sino que estn formados por muchos componentes armnicos,
como se estudia en el captulo 7. Por ello, en la anacin natural la frecuencia de
algn importante componente armnico de una nota coincidir exactamente con la
frecuencia de otro armnico de la otra nota. En la anacin temperada, donde ya
96
no se produce esa coincidencia exacta, el nmero de batidos permite bajar con precisin las quintas, exactamente en la pequea cantidad requerida. ste es el mtodo
habitualmente utilizado por los anadores de pianos.
6.5.
Mezclas de dos sonidos simples en funcin de la distancia

entre sus frecuencias y de la anchura de su banda crtica
Debido a las caractersticas de nuestro sistema auditivo, cuando se mezclan dos sonidos simples de diferente frecuencia es necesario que entre ellos exista suciente
distancia frecuencial para que podamos percibirlos individualmente. Esta separacin
mnima, a la que llamamos anchura de la banda crtica, no es igual en todas las
regiones frecuenciales, pues la capacidad de resolucin de nuestra percepcin auditiva depende de la zona frecuencial en la que estn situados los sonidos que se
mezclan.
En efecto, segn la separacin entre las frecuencias de dos sonidos simples emitidos
simultneamente, se pueden producir cuatro situaciones diferentes:
a) Cuando la diferencia es menor de unos 15 Hz omos un solo sonido tremolado, los batidos de primer orden que acabamos de ver.
b) A partir de 15 Hz, aproximadamente, de distancia entre ellos, dejamos de
or un solo sonido tremolado y empezamos a escuchar una especie de zumbido
spero, sin que todava seamos capaces de distinguir dos alturas tonales diferenciadas.
c) Cuando la separacin est cerca de la anchura de la banda crtica correspondiente a la zona frecuencial en la que se hallan los dos componentes que se
mezclan, comenzamos a distinguir ya dos sonidos, pero la cualidad sonora de la
mezcla sigue siendo spera y rugosa.
d) Conforme aumenta la distancia entre las frecuencias de los dos componentes,
la cualidad sonora se va haciendo cada vez menos rugosa, hasta que, una vez
97
superada holgadamente la anchura de su banda crtica, llega un momento en el

que percibimos con nitidez los dos sonidos.
Para experimentar esto, he fabricado, a partir de fotogramas construidos mediante
Matlab, un vdeo con cuatro sonidos en los que se mezclan dos componentes simples
de la misma amplitud. Las frecuencias de los dos componentes se van distanciando
progresivamente: en todos los casos la frecuencia del componente grave es 220 Hz,
un la3 temperado; en el primer sonido, la frecuencia del componente agudo es 233,1
Hz, que corresponde al sib3 de la escala temperada habitual, de modo que la distancia
frecuencial respecto al componente grave es de 13,1 Hz; en el segundo sonido, la
frecuencia del componente agudo es 246,9 Hz, el si3 de la escala temperada, con lo
que la distancia respecto al grave es de 26,9 Hz; en el tercer sonido, la frecuencia del
componente agudo es 261,6 Hz, el do4 de la escala temperada, con lo que la distancia
respecto al grave es de 41,6 Hz; y en el cuarto sonido la frecuencia del componente
agudo es 311,1 Hz, el mib4 de la escala temperada, de modo que la diferencia con el
componente grave es de 91,1 Hz.
Figura 6.5: Vdeo que muestra la importancia de la banda crtica en la percepcin individual de dos
sonidos prximos.
En el primer sonido, donde los componentes estn separados 13,1 Hz, omos una
nota simple tremolada, con unos batidos muy rpidos y muy profundos, similares a
los que hemos odo en los primeros casos del vdeo de la gura 6.3. En efecto, como
la distancia frecuencial es menor de 15 Hz, estamos ante un caso de una mezcla en la
98
que se percibe un solo sonido, pero en la que se producen batidos de primer orden,
como hemos visto en el apartado anterior. Lo he incluido aqu para que podamos
comparar su sonido con el de los siguientes casos. La altura tonal que percibimos
corresponde a una nota situada entre el la3 y el sib3 , pues, al ser igual la amplitud de
ambos componentes, la frecuencia del sonido resultante es la media aritmtica entre
ellos, es decir, 226,6 Hz.
En el segundo sonido, cuando la distancia entre las frecuencias de los dos componentes es de 26,9 Hz, no omos ya ninguna nota musical, ni una sola nota tremolada,
ni tampoco las dos notas por separado, sino un sonido spero y rugoso, como un
zumbido. Ello se debe a que, cuando la diferencia aritmtica entre las frecuencias de
los dos componentes supera los 15 Hz aproximadamente, la frecuencia de los batidos es tan rpida que nuestro sistema auditivo es incapaz de seguirlos. Por eso ya no
podemos distinguir un solo sonido simple tremolado, sino que omos un sonido sucio y rugoso, un zumbido borroso en el que no omos en absoluto los componentes
individuales de la mezcla.
En el tercer sonido, en el que la distancia entre las frecuencias es de 41,6 Hz, podemos
apreciar ya las dos notas por separado, el la3 y el do4 , aunque la cualidad de la mezcla
que omos sea sucia y borrosa.
En el cuarto sonido, sin embargo, cuando la distancia entre las frecuencias es de 91,1
Hz, distinguimos con nitidez dos notas individuales, el la3 y el mib4 , y el carcter
rugoso de la mezcla anterior ha desaparecido, siendo sustituido por una sonoridad
mucho ms clara y eufnica.
Estos fenmenos son de orden psicoacstico, es decir, se deben a las peculiaridades
de nuestro sistema auditivo, en concreto, a la siologa de nuestro odo interno.
Como consecuencia de ello, para poder distinguir dos sonidos simples simultneos
es necesario que la separacin entre ellos supere una distancia mnima. La anchura
de la banda crtica vara en funcin de la zona frecuencial de los sonidos que
se superponen, incrementndose conforme los sonidos son ms agudos. En los
casos del vdeo la anchura de la banda crtica est en torno a los 40 Hz. Ello explica que
no hayamos sido capaces de distinguir en el vdeo los componentes simples cuando
la distancia entre sus frecuencias era inferior a esta cantidad y, sin embargo, en el
99
ltimo caso, cuando la separacin excede en mucho a la anchura de la banda crtica

de esta regin frecuencial los omos con claridad.
Es oportuno aclarar que, si en lugar de sonidos simples, se hubieran superpuesto
notas normales es decir, compuestas por varios armnicos, hubiramos podido
distinguirlas con facilidad, pues la distancia entre sus armnicos superiores hubiera
excedido la anchura de su banda crtica correspondiente.
6.6.
Mezcla de dos sonidos simples cuyas frecuencias estn en

relacin de conmensurabilidad prxima: Consonancias
Cuando las distancias entre las frecuencias de dos sonidos simples que se superponen
sobrepasan holgadamente la anchura de la banda crtica, de modo que ya no percibimos zumbidos o rugosidades, hay ocasiones en las que se produce una mezcla
tan bien amalgamada que los dos sonidos casi parecen fundirse en uno. Esta mezcla
recibe el nombre de consonancia.
Antes de continuar, conviene hacer una aclaracin. El concepto de consonancia que
vamos a estudiar en estos captulos no hace referencia al carcter ms o menos eufnico que resulta de la mezcla de los sonidos, sino al especial acoplamiento fsico
entre las vibraciones sonoras que se produce cuando sus frecuencias son cercanamente conmensurables. Por ejemplo, el acorde de sptima disminuida puede perfectamente ser considerado hoy en da eufnico, pero nunca ser una combinacin
consonante.
Si bien las consonancias entre los sonidos reales de la msica, cada uno de ellos formado habitualmente por muchos componentes armnicos, se estudiarn ms adelante
(en el captulo dedicado al modo en el que reconocemos el sonido musical), primero es conveniente entender en qu consiste la consonancia entre sonidos simples.
As pues, a continuacin vamos comprobar, mediante nuestra experiencia auditiva
directa, que cuando se superponen dos sonidos simples cuyas frecuencias mantienen entre s una relacin de conmensurabilidad prxima se produce una
consonancia.
100
6.6.1.
Conmensurabilidad prxima
Empecemos puntualizando qu es la conmensurabilidad prxima. Dos cantidades

son conmensurables cuando tienen una medida comn, es decir, cuando la relacin
entre ellas puede ser expresada mediante un nmero racional o, lo que es lo mismo,
mediante el cociente de dos nmeros enteros. Por ejemplo, 11/7 23/12.
Ahora bien, en fsica, astronoma, otras ciencias en general y en la msica en particular, hay circunstancias en las que es relevante que esa razn sea sencilla. Podemos
considerar que una razn es sencilla cuando, expresada como fraccin irreducible,
sus trminos estn comprendidos entre los primeros nmeros enteros positivos. Diremos en ese caso que su conmensurabilidad es prxima. As pues, dos nmeros
estn en razn de conmensurabilidad prxima cuando los trminos de la fraccin irreductible que los relaciona son alguno de los primeros nmeros enteros
positivos. Conforme menores sean los trminos de la fraccin irreducible, ms sencilla ser la razn y ms prxima la conmensurabilidad. En este sentido, 2/1 es una
razn ms sencilla que 3/2, y sta ms sencilla que 4/3.
En lo que concierne a la msica, esta sencillez tiene que ver con los lmites de nuestro
sistema auditivo. La proximidad de los trminos de la razn entre las frecuencias de
dos sonidos simples va a permitir que nuestro odo perciba su superposicin como
una buena mezcla y los reconozca como consonantes: cuando las dos frecuencias
que se superponen son cercanamente conmensurables, las vibraciones de los
sonidos coinciden de modo peridico cada pocos ciclos, lo que hace que el
patrn de repeticin de las coincidencias sea lo suficientemente sencillo como
para que nuestro sistema perceptivo sea capaz de seguirlo. De ese modo podemos
or la mezcla como un sonido perfectamente amalgamado.
Cuando las frecuencias de los dos sonidos componentes estn en una relacin doble,
2/1, sucede que mientras una vibracin completa un ciclo entero, la otra completa
exactamente dos; cuando estn en una relacin sesquiltera, 3/2, ocurre que mientras
una vibracin realiza dos ciclos, la otra hace exactamente tres. Por eso conforme ms
prxima es la conmensurabilidad, ms unitaria resulta la mezcla de las vibraciones de
los dos sonidos simples, hasta el punto de que en la octava, 2/1, la ms perfecta de las
consonancias, prcticamente omos un solo sonido.
101
As pues, la consonancia, ms que un hecho fsico externo, viene dada por la

capacidad de nuestro odo para reconocer un sonido unitario cuando se combinan dos vibraciones cuya periodicidad coincide cada pocos ciclos. Por eso,
conforme la conmensurabilidad se aleja, percibimos un sonido cada vez ms complejo: cada vez omos menos el resultado de la mezcla y los componentes individuales
van adquiriendo ms presencia.
La cuestin sera precisar hasta dnde podemos considerar que una razn expresa una
conmensurabilidad prxima. La teora musical creada por los antiguos, que realizaba
los clculos atendiendo a la longitud de la cuerda y no al valor de la frecuencia, consideraba que slo los intervalos formados por razones cuyos trminos estaban comprendidos entre los cuatro primeros nmeros enteros eran consonantes. De acuerdo
a este criterio, dentro del rango de la octava, seran consonantes las mezclas de sonidos que estn en razn doble (2/1), es decir, que estn a distancia intervlica de una
octava; en razn sesquiltera (3/2), los que estn a distancia de un intervalo de quinta;
o en razn sesquitercia (4/3), en un intervalo de cuarta. No en vano estos intervalos
son los que han estructurado las escalas musicales de Occidente.
Desde el punto de vista de nuestra percepcin musical, la relacin 5/4 podra incluirse
tambin entre las razones simples, pero lo cierto es que el intervalo de tercera mayor
(al que, en principio, correspondera en nuestras escalas) queda ya bastante alejado de
esta razn: el intervalo de 5/4 est 14 cents por debajo de la tercera mayor temperada
y 22 cents por debajo del dtono que surge en la anacin por quintas justas de
3/2.
6.6.2.
Consonancias entre sonidos simples
Una vez entendido qu es la conmensurabilidad prxima en acstica y por qu da

lugar a las mezclas consonantes, vamos ahora a experimentar cmo son las seales
de audio de las mezclas de dos sonidos simples cuyas frecuencias, expresadas como
fraccin irreducible, son uno de los cuatro primeros nmeros enteros positivos. Siguiendo el procedimiento habitual, he fabricado varios vdeos mediante los cuales
podremos comprobar que en esos casos nuestro odo reconoce con claridad la buena
mezcla, lo que llamamos la consonancia.
102
En el vdeo de la gura 6.6 podemos escuchar las consonancias que se pueden establecer entre los cuatro primeros nmeros enteros positivos: la consonancia de octava,
la de doble octava, la de octava y quinta, la de quinta y la de cuarta.
En todos los ejemplos del vdeo la frecuencia del componente grave es 220 Hz (la3 ).
En el primer caso la frecuencia del componente agudo es 440 Hz (la4 ), por lo que
ambos sonidos mantienen la razn 2/1, que es la que dene el intervalo de octava. En
el segundo, el componente agudo tiene una frecuencia de 660 Hz (mi5 natural), por
lo que los dos componentes estn entre s en razn 3/1, la que dene el intervalo de
octava y quinta natural. En el tercero, el sonido agudo es de 880 Hz (la5 ) y la razn
respecto al componente grave es 4/1, por lo que entre ambos forman un intervalo de
doble octava. En el cuarto, el componente agudo es de 330 Hz (mi4 natural) y forma
respecto al grave una razn de 3/2, que corresponde al intervalo de quinta natural.
En el quinto caso, la frecuencia del sonido agudo es 293,3 Hz (re4 natural) y su razn
respecto al grave es 4/3, con el que forman un intervalo de cuarta natural. Para que se
distingan mejor los dos componentes, la amplitud de cada uno de ellos es diferente:
la del componente grave es 0,2 y la del agudo 0,1.
Figura 6.6: Vdeo con las consonancias denidas por los cuatro primeros nmeros enteros.
Si ponemos un poco de atencin, en todos estos ejemplos, adems del sonido resultante de la mezcla, tambin podemos or cada uno de los dos componentes por
separado. Solamente en el primer caso, cuando las frecuencias estn en razn 2/1,
103
predomina la tendencia a percibir un solo sonido, en lugar de dos sonidos simultneos distintos que se mezclan bien. Pero incluso ah, si orientamos un poco nuestra
escucha para hacerla ms analtica, podemos apreciar las dos notas individuales.
Para entender por qu percibimos en todos los casos la superposicin de los dos
sonidos componentes como una mezcla consonante, vamos a jarnos en la forma de
la vibracin de cada uno de los ejemplos que vemos en el osciloscopio del vdeo. Para
poder comparar unas formas con otras, la gura 6.7 representa un fragmento de la
seal de audio de cada uno de los ejemplos del vdeo.
Figura 6.7: Formas de la vibracin de las consonancias entre los cuatro primeros nmeros enteros.
En los tres primeros casos podemos observar que cada vez que el componente grave,
el de color magenta (el sonido de 220 Hz, que es comn a todos ellos) realiza un ciclo
completo, el componente agudo, el de color azul, completa exactamente un nmero
entero de ciclos: dos ciclos en el caso de la octava (de ah la razn 2/1); tres en el caso
de la octava y quinta natural (de ah la razn 3/1); y cuatro en el caso de la doble
octava (de ah la razn 4/1). Ello hace que en todos estos casos el sonido resultante de
la mezcla tenga el mismo periodo que el del componente ms grave, como podemos
comprobar en las grcas.
104
En la cuarta grca, en el caso de la quinta natural, vemos que cada dos ciclos del
componente grave, el componente agudo completa exactamente tres (de ah la razn
3/2). Por ello, el periodo del sonido resultante es el doble que el del componente ms
grave o, lo que es lo mismo, el triple del periodo del componente ms agudo.
En la ltima grca, en el caso de la cuarta natural, observamos que cada tres ciclos
del componente grave, el componente agudo completa exactamente cuatro (de ah
la razn 4/3). De esta forma, el periodo del sonido resultante es el triple del periodo
del componente ms grave y el cudruple del ms agudo.
As pues, en este vdeo y en las grcas correspondientes, hemos podemos observar
que la conmensurabilidad es la causa de la aparicin de una periodicidad en la
mezcla resultante.
Podra parecer que esta periodicidad debera haber dado lugar a la percepcin de la
altura tonal correspondiente a la mezcla. Si esto hubiera sido as, en el cuarto caso,
por ejemplo, deberamos haber odo la nota la2 , que correspondera al periodo de la
mezcla resultante, en lugar de las notas individuales la3 y mi4 bien amalgamadas y
formando la consonancia de quinta. Sin embargo, esto no ocurre as, salvo que el
equipo de msica en el que estemos oyendo los ejemplos distorsione y provoque la
aparicin de componentes espurios, como veremos un poco ms adelante. La explicacin de ello reside en que nuestra percepcin es frecuencial, de modo que, como
estudiaremos en el captulo correspondiente, omos dos notas y no una sola nota ms
grave correspondiente a la seal resultante.
6.6.3.
De la consonancia a la disonancia
Pero, debido a los mrgenes de nuestra percepcin, las fronteras entre lo que nos
suena consonante y lo que nos parece disonante son algo difusas.
Para observar donde acaba la consonancia y donde empieza la disonancia, he fabricado un vdeo con varios casos en los que se mezclan dos sonidos simples cuya distancia
intervlica est en torno a la quinta: la quinta natural o quinta justa (la que propiamente est en razn 3/2), la quinta temperada, la quinta disminuida y una quinta
desanada. He elegido el mbito intervlico de la quinta por dos razones: primero
porque la quinta justa es la consonancia en la que se pueden distinguir con ms faci105
lidad los dos componentes; y, segundo, porque en nuestro sistema musical tambin
se encuentran la quinta temperada y la quinta disminuida, por lo que estamos familiarizados con ellas y podemos compararlas. He aadido la quinta desanada para
permitir apreciar la diferencia.
En todos los ejemplos la frecuencia de la nota grave es 220 Hz (la3 ). En el primer caso
la frecuencia de la nota aguda es 330 Hz (mi4 natural), por lo que estn exactamente
en razn 3/2 y forman el intervalo de quinta natural o justa. En el segundo caso
la frecuencia de la nota aguda es de 329,6 (mi4 temperado) por lo que forman un
intervalo de quinta temperada (700 cent) con la nota grave (la quinta temperada est
solamente 2 cent por debajo de la quinta justa). En el tercer caso la frecuencia de
la nota aguda es 325,8 Hz (mi4 desanado) y forman un intervalo de quinta que
est 20 cent por debajo del que formara con el mi4 temperado. Y en el cuarto caso
la frecuencia de la nota aguda es 311,1 Hz (mib4 ) y forma un intervalo de quinta
disminuida (600 cent) con la nota grave. Para permitir que se distingan la amplitud
del componente grave es 0,2 y la del agudo 0,1.
Figura 6.8: Vdeo que ilustra el paso de la consonancia a la disonancia.
En todos los casos omos los dos sonidos de forma independiente, pues la distancia
entre ellos excede con mucho la anchura de la banda crtica de esa zona frecuencial,
que est en torno a los 55 Hz, lo cual, como hemos visto en los apartados anteriores,
106
es una condicin necesaria para que podamos reconocer con claridad ambos sonidos.
Analicemos con un poco de detenimiento lo que ocurre en cada caso.
a) En el primer caso, cuando las frecuencias de los componentes estn exactamente en razn 3/2 y forman la consonancia de quinta natural, omos una
mezcla muy bien amalgamada y observamos en el osciloscopio que la forma
de la vibracin resultante permanece totalmente estable. En efecto, el mximo
comn divisor de las frecuencias de los dos componentes (220 y 330) es 110.
Esto quiere decir que la forma de la vibracin de la mezcla resultante se repite
110 veces por segundo y que, por lo tanto, su periodo es 1/110 s, o sea, redondeando, 9 milsimas de segundo. As pues, cada 9 ms aproximadamente ambos
componentes se sincronizan: el sonido grave completa 2 ciclos mientras que el
sonido agudo completa 3, como podemos comprobar en el osciloscopio si detenemos el vdeo. Este periodo de 9 ms est dentro del rango temporal en el que
nuestro sistema auditivo es capaz de detectar periodicidades en la forma de la vibracin. Por eso, aunque seguimos oyendo los dos componentes por separado,
percibimos que se combinan muy bien, por lo que obtenemos una clara sensacin de buena mezcla, una mezcla sin perturbaciones que no vara a lo largo del
tiempo.
b) En el segundo caso, en el que se mezclan dos sonidos que estn en intervalo de quinta temperada, la razn entre sus frecuencias, redondeadas a dcimas de hercio, es 3296/2200. Esta razn expresada como fraccin irreducible es
412/275, la cual no es para nada una razn sencilla, por lo que las frecuencias
de los componentes estn muy lejos de mantener una relacin de conmensurabilidad prxima. Sin embargo, la diferencia entre la frecuencia del componente
agudo (329,6 Hz) y la del componente agudo del caso de la consonancia de
quinta natural (330 Hz) es solamente de cuatro dcimas de hercio. En efecto,
bastara con subir 0,4 Hz la frecuencia de la nota aguda para obtener la razn
simple 3/2. Por ello tambin ahora omos un intervalo de quinta cuyas notas se
mezclan bien, lo que coincide con la cuasi-periodicidad que observamos en la
seal verde del vdeo. Ahora bien, la mezcla que omos ya no es totalmente estable como en el caso anterior, sino que, si prestamos atencin, podremos or que
va acompaada de una lenta y peridica evolucin de la cualidad sonora, lo cual
tambin se reeja en la cclica evolucin de la forma de la seal resultante que
107
observamos en el osciloscopio, una forma que parece estirarse y encogerse como

si se tratara de una goma elstica. En el siguiente apartado, en el que se estudian
los batidos de segundo orden, se explica a qu se debe este fenmeno.
c) En el tercer caso, en la superposicin de dos sonidos que forman un intervalo
de quinta desanada (20 cent menos que la quinta temperada), vemos que la razn entre sus frecuencias es 3258:2200, que expresada como fraccin irreducible
es 1629:1100, la cual est muy alejada de ser una razn simple y, por lo tanto,
de mantener una conmensurabilidad prxima. El sonido agudo, el de 325,8 Hz,
es 4,2 Hz ms grave que el sonido agudo de la mezcla consonante justa, que
tiene 330 Hz. Es decir, le faltan 4,2 Hz para mantener, respecto al sonido grave,
la razn simple ms cercana, en este caso la razn 3:2. Y esta diferencia es ya
signicativa. Por ello ahora percibimos que esta mezcla nos produce una sensacin de inestabilidad. El ritmo de las modicaciones de la cualidad sonora es ya
tan rpido que diculta la buena amalgama de los dos componentes y percibimos ahora claramente los batidos de segundo orden. Podemos apreciar tambin
esa inestabilidad en el osciloscopio del vdeo, donde la seal resultante modica
constantemente su forma.
d) En el cuarto caso, en el que se superponen dos sonidos que estn en un intervalo de quinta disminuida, omos una disonancia. Percibimos con claridad cada
uno de los sonidos componentes, pero ahora ya no tenemos la sensacin de que
se amalgamen el uno con el otro. As mismo vemos en el osciloscopio que la
forma de la vibracin cambia constantemente. Si atendemos a sus frecuencias
(220 Hz y 311,1 Hz), vemos que la razn entre ellas es 3111:2200, que es ya una
fraccin irreducible, por lo que su conmensurabilidad es muy alejada: el sonido grave tendra que completar 2200 ciclos y el agudo 3111 para que sus fases
volvieran a sincronizarse y se repitiera de nuevo la forma de la vibracin. El periodo de la seal resultante sera, por lo tanto, de 10 segundos, lo que, a efectos
de nuestra percepcin, es equivalente a decir que no hay ningn periodo. Con
la nalidad de expresar este intervalo como una razn ms simple, podramos
bajar la anacin del sonido agudo 1,1 Hz y atribuirle una frecuencia de 310
Hz. En ese caso la razn simple entre las frecuencias expresada como fraccin
irreducible sera 31:22, por lo que cada 22 ciclos del sonido grave, el sonido
agudo completara 31. Pero, incluso en este caso, la conmensurabilidad seguira
108
siendo muy alejada el periodo de la seal resultante sera ahora un segundo

por lo que percibiramos esa mezcla tambin como una disonancia.
En resumen, en el intervalo de quinta natural omos una mezcla perfecta y totalmente
estable; en el de quinta temperada el ritmo con el que se producen las alteraciones de
la cualidad sonora es tan lento que no apreciamos ninguna inestabilidad, por lo que la
sensacin de mezcla es casi perfecta, e incluso notamos que esa pequea inexactitud
dulcica y da calor al sonido resultante; en el intervalo de quinta desanada la mezcla
est perturbada por un cierta inestabilidad provocada por unas rpidas y peridicas
alteraciones de la cualidad sonora; y en el intervalo de quinta disminuida no tenemos
para nada la sensacin de que los componentes se hayan mezclado entre s.
Mediante este vdeo hemos podido experimentar que, si bien solo percibimos exactamente como una buena mezcla la superposicin de dos sonidos simples cuyas frecuencias estn en conmensurabilidad prxima, nuestra percepcin auditiva permite
ciertos mrgenes de tolerancia dentro de los cuales se encuentran los ajustes propios de las escalas temperadas. Hemos comprobado que, ms all de esos mrgenes,
cuando no se produce una razn matemtica simple entre las frecuencias de los componentes, los periodos de ambas vibraciones solo se sincronizan tras un periodo de
tiempo demasiado largo como para que nuestro odo sea capaz de reconocerlo, por
lo que no omos una buena mezcla, sino dos sonidos independientes que van cada
uno por su lado y su combinacin nos resulta disonante.
As pues, hemos podido experimentar que la consonancia entre sonidos simples
se debe al reconocimiento de una periodicidad en la vibracin resultante. Esta
periodicidad no da lugar a la desaparicin de los sonidos individuales en la mezcla
resultante, pues nuestra audicin es principalmente frecuencial, pero en el caso de
los sonidos simples es la nica razn que explica que percibamos la especial buena
mezcla a la que llamamos consonancia.
6.6.4.
Grados de consonancia segn la conmensurabilidad
Nuestra percepcin auditiva no es igual para todas las consonancias, sino que el grado
de perfeccin de la consonancia disminuye conforme la conmensurabilidad entre
109
las frecuencias de los dos sonidos simples que se mezclan se hace ms lejana. Para
experimentar este fenmeno he confeccionado un vdeo con cinco ejemplos en los
que se mezclan dos componentes simples, dentro del rango de una octava. En todos
los casos sus frecuencias estn en una razn simple prxima y, por lo tanto, forman
una consonancia, pero su conmensurabilidad se va alejando, desde el unsono (1/1)
hasta la consonancia de tercera mayor natural (5/4).
En todos los ejemplos la frecuencia del componente grave es 440 Hz, un la4 en la
anacin habitual. La frecuencia del componente agudo va cambiando: en el primer
caso es tambin 440 Hz, por lo que ambas notas forman un unsono (1/1); en el
segundo, es 880 Hz, un la5 , por lo que forman una octava (2/1); en el tercero es
660 Hz, un mi5 , formando un intervalo de quinta natural (3/2); en el cuarto caso,
redondeando a dcimas de hercio, es 586,7 Hz, un re5 , por lo que forman un intervalo
de cuarta natural (4:3); y en el quinto caso la frecuencia aguda es 550 Hz, un do#5 ,
formando una tercera mayor natural (5:4). En este vdeo he elegido como nota grave
la4 , una nota que est en una octava ms aguda que la de los vdeos anteriores, para
evitar que en la consonancia de tercera mayor las frecuencias de los dos sonidos se
aproximaran a la anchura de la banda crtica y se generara alguna rugosidad en la
mezcla resultante. Como referencia para nuestro odo, a n de facilitar la escucha
individualizada de los componentes del intervalo de octava, he incluido tambin el
unsono.
Figura 6.9: Vdeo con las consonancias de unsono, octava, quinta, cuarta y tercera mayor.
110
En el osciloscopio del vdeo podemos apreciar que la forma de la vibracin permanece totalmente estable en todos los casos y que en cada uno de ellos omos con claridad
una mezcla consonante. En efecto, al mantener las frecuencias de los dos sonidos una
relacin de conmensurabilidad prxima, el periodo de la seal resultante est dentro
de los mrgenes en los que nuestro sistema auditivo es capaz de detectar la sincronizacin de ambas vibraciones, de modo que percibimos una buena mezcla.
Pero si escuchamos con un poco de atencin nos damos cuenta de que no todas
las mezclas son igualmente armoniosas, sino que, a medida que avanza el vdeo y
la conmensurabilidad entre las frecuencias se va alejando, se produce una prdida
progresiva de la sensacin de buena mezcla. Conforme la conmensurabilidad
de las frecuencias es ms alejada, el periodo de su sincronizacin es mayor y
la forma de la vibracin resultante adquiere mayor complejidad, por lo que
cada vez se hace ms difcil percibir las coincidencias peridicas entre los dos
sonidos. Ello da lugar a la progresiva disminucin de la sensacin de buena mezcla:
desde la octava, en la que la amalgama de los dos componentes es tan fuerte que
se hace difcil su escucha individualizada, hasta la tercera mayor natural, donde la
sensacin de buena mezcla es ya bastante dbil.
6.6.5.
La fase inicial en la mezcla consonante
Veamos ahora cmo afecta la fase inicial a las consonancias. En el caso de la mezcla
unsona hemos visto que la diferencia de fase entre los componentes modica notablemente la amplitud del sonido resultante y, en consecuencia, el volumen sonoro
que percibimos. Pero, a diferencia del unsono, los desfases entre dos componentes
consonantes, si bien modifican la forma de la vibracin resultante, no alteran
el volumen sonoro que omos, ni ninguna otra cualidad sonora, al menos de
un modo claramente perceptible.
Para observar que la forma de la vibracin viene determinada por la fase inicial de
los sonidos componentes y experimentar que nuestro odo no aprecia diferencias
signicativas, he confeccionado un vdeo con seis ejemplos en los que se mezclan dos
sonidos simples, todos ellos en consonancia de octava, pero con diferentes desfases
entre sus componentes.
111
En todos los casos las frecuencias de los sonidos son las mismas: 220 Hz (la3 ) y 440 Hz
(la4 ). La fase inicial del componente grave es siempre 0, pero el sonido agudo se va
adelantando sucesivamente 60 respecto al caso anterior: en el primero es tambin de
0; en el segundo es 60; en el tercero, 120; en el cuarto, 180; en el quinto, 240; y
en el sexto, 300. La amplitud del componente agudo es 0,3 y la del grave 0,1.
Figura 6.10: Vdeo de dos sonidos en consonancia de octava con diferentes desfases.
Podemos ver en el osciloscopio que la forma de la vibracin es diferente en cada

caso. Pero, hasta qu punto las diferencias en la forma de la vibracin que aparecen
en el osciloscopio pueden ser percibidas por nuestro odo? Comprobamos que no es
sencillo reconocer diferencias. Si prestamos mucha atencin y omos repetidas veces los diferentes ejemplos, puede que apreciemos alguna sutil diferencia entre ellos,
pero se trata de algo que es prcticamente irrelevante. Como mucho, podemos reconocer un pequeo cambio de volumen o una ligersima modicacin en la cualidad
sonora.
Lo mismo hubiera sucedido si hubiramos elegido cualquier otra consonancia. La
conclusin, as pues, es que las diferencias de fase entre los sonidos componentes de
una mezcla consonante no son reconocidas por nuestra percepcin auditiva.
112
6.7.
Mezcla de dos sonidos simples cuyas frecuencias se alejan un poco de la conmensurabilidad prxima: Batidos de
segundo orden
Cuando las frecuencias de dos sonidos simples que se superponen se alejan ligeramente de las que deberan tener para estar en una razn de conmensurabilidad
prxima y ser, por lo tanto, consonantes se produce una modicacin peridica de
la forma de la vibracin resultante, la cual es percibida por nuestro odo como una
oscilacin regular de la cualidad sonora. Este fenmeno recibe el nombre de batidos de segundo orden. Estos fenmenos recuerdan mucho a las interferencias que
se producen entre sonidos muy prximos al unsono (es decir, los batidos de primer
orden), pero sus causas y sus efectos no son exactamente los mismos.
He fabricado un vdeo que nos va a permitir experimentar cmo se producen los batidos de segundo orden cuando se mezclan dos sonidos cuyas frecuencias estn muy
prximas a la consonancia de octava. En todos los casos la frecuencia del componente
ms grave es de 220 Hz (la3 ). En el primer caso la frecuencia del componente agudo
es de 446 Hz, con lo que la diferencia respecto a la frecuencia que debera tener para
estar en razn doble (440 Hz) es de 6 Hz; en el segundo caso la frecuencia del componente agudo es de 444 Hz, es decir, tiene una diferencia respecto a la consonancia
de octava de 4 Hz; en el tercer caso la frecuencia aguda es de 442 Hz con lo que
su diferencia es de 2 Hz; y en el cuarto caso la frecuencia del sonido agudo es de
440 Hz, con lo que la razn que mantiene con el sonido grave es exactamente la de
octava. Para que se distingan bien los dos componentes y para que se aprecie mejor
el fenmeno de los batidos de segundo orden, la amplitud de cada componente es
diferente: la del primero es 0,3 y la del segundo 0,1.
113
Figura 6.11: Vdeo con los batidos de segundo orden de dos sonidos cuyas frecuencias estn muy
prximas a la octava.
En los tres primeros sonidos podemos observar que la forma de la vibracin resultante
cambia peridicamente, como si se tratara de una goma elstica, mientras que su
amplitud, al margen de los cambios de posicin que acompaan la evolucin de
la forma, permanece prcticamente constante. En el ltimo caso, por el contrario,
cuando son perfectamente consonantes, la seal permanece totalmente estable. En
todos ellos, el ritmo con el que la forma de la vibracin evoluciona coincide con la
variacin peridica en la cualidad del sonido que omos. Estas variaciones peridicas
dan lugar a los batidos de segundo orden. Los batidos de segundo orden se repiten
tantas veces por segundo como la diferencia que hay entre la frecuencia que tiene
el sonido agudo y la que debera tener para mantener la razn exacta de octava (440
Hz): en el primer caso, 6 veces por segundo; en el segundo caso, 4 veces por segundo;
y en el tercero, 2 veces por segundo. En el ltimo caso, al mantener la frecuencia de
los dos sonidos la razn 2:1 exacta, desaparecen los batidos y los dos sonidos se funden
perfectamente.
Veamos la explicacin de este fenmeno. En el vdeo de la gura 6.10, donde los
dos sonidos mantienen exactamente la razn 2/1, hemos visto que los desfases entre
los sonidos dan lugar a diferentes formas en la vibracin resultante, pero, puesto que
esos desfases permanecen constantes durante la emisin de cada sonido, la forma de la
vibracin resultante se mantiene estable en todos los casos. Pero ahora las frecuencias
de los dos sonidos que se mezclan no estn exactamente en la razn 2/1, sino que el
114
sonido agudo diere en algunos hercios del que debera tener para que la mezcla
fuera exactamente una octava.
Esta ligera diferencia da lugar a que el desfase entre ambas seales vaya aumentando,
haciendo que la forma de la vibracin resultante no permanezca constante, sino que
vaya cambiando a lo largo del tiempo. Estas modicaciones en la forma de la vibracin se repiten cclicamente, pues el progresivo incremento de los desfases hace que
cada cierto periodo de tiempo ambos sonidos vuelvan a estar en fase y comience un
nuevo ciclo. Los batidos de segundo orden son los cambios cclicos en la forma
de la vibracin que nuestro odo percibe como una peridica oscilacin en la
cualidad sonora.
As pues, la razn por la que se producen tanto los batidos de primer orden como los
de segundo orden es la misma: la evolucin en el desfase entre los dos componentes
cuando se alejan ligeramente de los nmeros que denen las razones exactas del
unsono (1/1) o de las consonancias (2/1, 3/2, 4/3).
Sin embargo, la naturaleza de los batidos de primer orden (que se producen en lo
que podramos llamar cuasi-unsono) y los de segundo orden (que se dan en lo que
podramos llamar cuasi-consonancia) es distinta. Los primeros provocan una evolucin cclica de la amplitud y son percibidos por nuestro odo como un trmolo en
el sonido resultante, mientras que los batidos de segundo orden no afectan a la amplitud de la seal resultante, sino que producen una modicacin, tambin cclica,
de la forma de la vibracin y son percibidos por nuestro odo como una variacin
peridica de la cualidad sonora. En el captulo dedicado a la siologa de la audicin
estudiaremos la causa de que, siendo nuestra audicin frecuencial, percibamos estos
batidos de segundo orden.
En el caso de la cuasi-consonancia de octava, el nmero de batidos por segundo es
la diferencia entre la frecuencia que tiene el sonido ms agudo y la que debera tener
para mantener la relacin exacta 2/1, como hemos podido apreciar en el vdeo de la
gura 6.11.
En lo que respecta a la cuasi-consonancia de quinta, el nmero de batidos por segundo es el doble de la diferencia que hay entre la frecuencia del sonido agudo y la que
debera tener para mantener la razn exacta de 3/2. En efecto, si volvemos al vdeo
115
de la gura 6.8, podemos apreciar que la desanacin del intervalo de quinta provoca
batidos de segundo orden. Donde se perciben ms claramente es en el ejemplo en
el que la quinta est bajada 20 cent. All el componente agudo tiene una frecuencia
de 325,8 Hz, cuando debera tener 330 Hz para mantener la razn exacta de quinta,
3/2, con el componente grave de 220 Hz. La diferencia es de 4,2 Hz y el nmero de
batidos que percibimos por segundo es 8,4, el doble de esa diferencia. En el caso de
la quinta temperada la diferencia es de 0,4 Hz y el nmero de batidos por segundo
de 0,8.
En el caso de la cuasi-consonancia de cuarta el nmero de batidos por segundo que
percibimos es el triple de la diferencia entre la frecuencia que tiene el componente y
la que debera tener para mantener la razn exacta de la cuarta, 4/3.
6.8.
Distorsin y componentes espurios en la mezcla de dos sonidos simples
Por ltimo, para concluir este captulo quiero explicar, aunque sea brevemente, lo
que puede suceder en la mezcla de dos sonidos simples si el equipo de sonido que los
reproduce presenta una distorsin signicativa.
En un sentido amplio, distorsin es cualquier modicacin que sufre la seal de audio
al pasar por un sistema, como ocurre, por ejemplo, en un equipo de msica provisto de ecualizador, donde la intensidad de las diferentes bandas de frecuencia puede
ser amplicada a voluntad. De hecho, toda seal que pasa por un sistema que no
sea idealmente plano sufre algn tipo de distorsin, pues algunos componentes son
amplicados ms que otros. Por ejemplo, mediante un ecualizador, podemos reforzar la presencia de los graves o de los ms agudos, o bien de los medios, y todo ello
ocasionar modicaciones en la forma de la vibracin y en la cualidad del sonido
que omos. Sin embargo, en otras ocasiones la alteracin de la importancia de las
bandas de frecuencia puede ser un problema, como cuando la acstica de una sala
de conciertos refuerza en exceso unos determinados componentes en detrimento de
otros.
116
Pero ahora vamos a referirnos a la distorsin en un sentido ms limitado: aquellas deformaciones de la seal de audio que provocan la aparicin de nuevos componentes
frecuenciales que no estaban en la seal original. Esta distorsin es muy importante,
pues no se limita a teir o matizar los componentes de la seal original, sino que
introduce en ella componentes espurios.
Cuando la seal de audio consta de un solo componente sinusoidal esta distorsin
provoca que surjan en la seal nuevos componentes que son armnicos del componente original, por lo que recibe el nombre de distorsin armnica. Se llama armnica porque los componentes que se introducen son armnicos del sonido simple
original, es decir, sus frecuencias son mltiplos de ste. Como veremos en el captulo
dedicado al sonido armnico, esto quiere decir que si el sonido original es un sonido
simple de 220 Hz, por ejemplo, el sonido resultante ser un sonido que, adems de
este componente original, tendr otro u otros componentes cuyas frecuencias sean
mltiplos de la de ese componente original. Es decir, ser la suma del componente
original de 220 Hz, ms otro en 440 Hz, y tal vez otro en 660 Hz, y as sucesivamente
en funcin de la importancia de la distorsin.
En el caso de que la seal de audio est compuesta por dos o ms sonidos simples,
el resultado de la seal distorsionada estar formada no slo por los armnicos correspondientes a la distorsin de cada uno de los sonidos que intervienen en la mezcla, sino tambin por nuevos componentes que sern la suma y la diferencia de las
frecuencias de los componentes originales. Esta distorsin recibe el nombre de distorsin de intermodulacin y altera considerablemente la seal original, de tal modo
que, a partir de cierto nivel, diculta seriamente la audicin de la msica.
Si bien las razones de esta distorsin exceden nuestro objetivo, a continuacin voy
a mostrar un caso particular de distorsin de intermodulacin, la cual ha dado lugar
a que en ocasiones se haya interpretado mal el fenmeno de la mezcla de dos sonidos simples. Vamos a ver lo que puede suceder si el equipo reproductor presenta
cierta cantidad de distorsin cuando los dos componentes que se mezclan forman
un intervalo de quinta natural (3/2). En los vdeos de la gura 6.6 y de la gura 6.8
hemos podido apreciar que ambos se oyen como una consonancia de quinta. Sin
embargo ahora vamos a poder experimentar que si el equipo presenta una distorsin
relevante pueden ser odos como si se tratara de un solo sonido cuya frecuencia fuera
una octava ms grave que la del ms grave de los dos componentes. He elegido este
117
caso precisamente para mostrar hasta qu punto es fcil confundir el resultado de un

proceso producido por la distorsin con una propiedad derivada de la mezcla entre
sonidos.
En el vdeo que vamos a ver a continuacin se han mezclado dos componentes simples cuyas frecuencias son de 440 Hz (la4 ) y 660 Hz (mi5 natural), ambos de igual
amplitud.
Figura 6.12: Vdeo que ilustra el efecto de la distorsin en la mezcla de dos sonidos simples.
En el osciloscopio podemos ver en color verde, en torno al valor de 0,4 la seal resultante que omos y debajo, en color azul, centrada en el valor -0,4, la seal original
tomada como referencia para apreciar el efecto de la distorsin. Si nuestro reproductor de sonido no distorsiona (en caso contrario igual es buena idea probar con
unos auriculares), en el primer caso debemos or dos notas consonantes muy bien
mezcladas. Vemos en el osciloscopio que la seal verde, la que estamos oyendo, y la
seal azul, la original, son totalmente idnticas.
En el segundo caso, en el que articialmente he provocado una distorsin de intermodulacin, omos un solo sonido que est a una octava ms grave que el la4 ,
es decir, omos el la3 , pero con una cualidad sonora ms rica que la de un sonido
simple. Si nos jamos en la forma de la vibracin (podemos parar el reproductor de
vdeo) y comparamos la seal resultante, ahora distorsionada, con la referencia original de color azul podremos apreciar que la seal verde no es capaz de continuar
118
hacia abajo cuando desciende, reproduciendo el movimiento de la seal azul, sino

que da lugar a una clara deformacin respecto a la seal de referencia, la original.
Esta deformacin provoca que la seal verde no est ahora formada nicamente por
los dos componentes originales, sino que tenga nuevos componentes.
Los componentes ms destacados han sido los que resultan de la suma y de la diferencia de los componentes reales: un componente en 1100 Hz y otro en 220 Hz. Luego,
los que son el doble de los originales: uno de 880 Hz y el otro de 1320 Hz. Si los
reordenamos todos sucesivamente nos encontramos con que tenemos los siguientes
componentes: 220, 440, 660, 880, 1100, 1320. Como veremos en el captulo dedicado al sonido armnico, estos componentes forman una serie armnica, pues todos
ellos son los sucesivos mltiplos de 220 Hz. Y sta es la razn por la que ahora omos
el la3 (220 Hz) como la nota fundamental y no oigamos ya los dos componentes
aislados, las notas la4 y mi5 formando una consonancia.
En el tercer caso tenemos la misma situacin, pero ahora con una distorsin mucho
ms exagerada. Vemos que incluso los movimientos descendentes han sido transformados en gran medida en ascendentes. El resultado es similar al anterior, slo que
ahora todava apreciamos una cualidad sonora ms plena. Esto explica por qu, de
una manera aparentemente paradjica, la distorsin nos puede dar lugar a un resultado engaoso y nos puede hacer pensar que la mezcla de dos componentes simples en
relacin de quinta ocasiona un nuevo sonido una octava ms baja. Este error aparece
a veces incluso en algn libro de texto y por ello me ha parecido oportuno explicarlo
aqu.
Cuando lleguemos al captulo dedicado al anlisis espectral podremos entender mejor
las causas de que la distorsin pueda alterar las propiedades de la mezcla de los sonidos,
ya que podremos observar con ms detalle los componentes espurios que surgen
como consecuencia de esta distorsin de intermodulacin.
6.9.
Conclusin
En este captulo hemos podido experimentar que cuando dos sonidos simples suenan
simultneamente se producen diferentes fenmenos acsticos y psicoacsticos, los
cuales dependen de la diferencia aritmtica entre sus frecuencias, de la anchura de la
119
banda crtica de nuestro odo en esas frecuencias y de la razn numrica que hay entre
ellas. Estos fenmenos, que fundamentan una parte importante de nuestro lenguaje
musical, pueden ser resumidos de la siguiente manera:
- Si los dos sonidos simples tienen la misma frecuencia, el resultado es un solo sonido simple de esa frecuencia, cuya amplitud depende no slo de la amplitud de sus
componentes, sino tambin del desfase que hay entre ellos.
- Si la diferencia aritmtica entre la frecuencia de los dos sonidos simples es menor de
unos 15 Hz, percibimos un solo sonido simple, cuya amplitud oscila sinusoidalmente
dando lugar a un efecto de trmolo (batidos de primer orden) y cuya frecuencia se
sita entre la de los dos componentes, aproximndose ms a la del que tiene mayor
amplitud. La frecuencia con la que se repite la oscilacin de la amplitud (el nmero
de batidos por segundo) es la diferencia aritmtica entre las frecuencias de los dos
sonidos componentes. Estos batidos, al permitir determinar con precisin la diferencia entre la frecuencia de los dos componentes, posibilitan anar con facilidad los
instrumentos musicales y establecer con exactitud los intervalos que dan lugar a las
escalas.
- Cuando la diferencia aritmtica entre las frecuencias de los dos sonidos simples
supera aproximadamente los 15 Hz, nuestro sistema auditivo no puede seguir el ritmo de los batidos y dejamos de percibir un solo sonido simple tremolado. Si esta
diferencia est dentro de la anchura de la banda crtica correspondiente a esa zona
frecuencial, omos un sonido spero y rugoso, a modo de zumbido, en el que no
podemos distinguir individualmente los dos componentes. Cuando esta diferencia
se aproxima al lmite de la anchura de la banda crtica, aunque la cualidad del sonido siga siendo rugosa, progresivamente pasamos a reconocer los dos componentes
individuales. Y cuando la diferencia supera con cierta holgura esa anchura de la banda crtica desaparece la sensacin de rugosidad y percibimos ya ntidamente los dos
componentes por separado.
- Cuando las frecuencias de los dos sonidos simples mantienen una relacin de conmensurabilidad prxima (razones entre los primeros nmeros enteros positivos), la
mezcla sonora resultante es peridica y la forma de la vibracin es lo sucientemente
sencilla como para que nuestro sistema auditivo pueda reconocer las coincidencias
peridicas entre los dos componentes. A consecuencia de ello, si las frecuencias de
120
estos componentes superan la anchura de la banda crtica, percibimos una sensacin

de buena mezcla que explica la consonancia musical entre dos sonidos simples.
- Cuando las frecuencias de los dos sonidos simples se alejan ligeramente de una
razn de conmensurabilidad prxima, percibimos un cambio peridico en la cualidad
de la mezcla resultante (batidos de segundo orden). A diferencia de los batidos de
primer orden, los batidos de segundo orden no son el resultado de una oscilacin
de la amplitud, sino que se producen porque nuestro sistema auditivo es capaz de
reconocer cambios cclicos en la forma de la vibracin.
- La distorsin de intermodulacin puede dar lugar a una mala interpretacin de los
resultados de la mezcla de sonidos.
121
Captulo 7
El sonido armnico
7.1.
Introduccin
La palabra griega harmona originalmente designaba al conjunto que resulta del buen
ensamblaje de sus partes. Por ello, en la Antigedad las escalas musicales, estructuradas mediante consonancias, eran llamadas armonas y la msica era considerada el
paradigma de lo armnico. En tanto que el sonido musical es un conjunto formado
por partes perfectamente ensambladas, hasta el punto de que es percibido como un
solo sonido, tambin es llamado sonido armnico.
Hasta ahora hemos estudiado la vibracin de un sonido simple y los fenmenos acsticos que se producen al superponerse dos vibraciones simples, pero la mayor parte de
los sonidos que omos son bastante ms complejos, pues en realidad son el resultado
de la combinacin de muchos sonidos simples.
Los sonidos simples cuando forman parte de un sonido compuesto reciben el nombre de parciales. Ahora bien, cualquier combinacin de sonidos simples no genera
un sonido musical, es decir, el sonido resultante no siempre vibra de una manera lo
sucientemente peridica como para que nuestro sistema auditivo sea capaz de reconocer una altura tonal. Para que se produzca un sonido musical es necesario que
las relaciones entre las frecuencias de los componentes simples que intervienen en la
mezcla sean armnicas, es decir, que sus frecuencias sean mltiplos de una frecuencia fundamental. En ese caso se crea una estructura armnica y los sonidos simples
122
que la constituyen se llaman componentes armnicos, o simplemente armnicos. El

sonido simple puede ser considerado como un caso particular de sonido armnico,
aqul que consta de un solo componente sinusoidal.
El sonido musical o armnico puede ser definido como el sonido formado por
la superposicin simultnea de varios sonidos simples cuyas frecuencias son
mltiplos de una frecuencia fundamental, es decir, de una frecuencia que es el
mximo comn divisor de todas ellas. La frecuencia de ese sonido fundamental
determina la periodicidad del sonido resultante y, por lo tanto, la altura tonal que percibimos. Y ello es as incluso si esa frecuencia fundamental no est presente, siempre
que el nmero de componentes armnicos sea suciente como para que podamos
percibir la mezcla como un solo sonido. Por el contrario, cuando las frecuencias de
los componentes no son mltiplos de una frecuencia fundamental se generan sonidos
inarmnicos.
Los elementos mediante los que se producen los sonidos musicales en los instrumentos por ejemplo, las cuerdas o las columnas de aire de los tubos habitualmente
son capaces de vibrar de diferentes modos a la vez, cada uno de ellos con su propia
frecuencia de vibracin, generando diferentes sonidos simples. Esos instrumentos
emiten sonidos musicales porque, debido a su propia constitucin fsica, las frecuencias de todos esos modos de vibracin son conmensurables entre s, es decir, son
todas ellas mltiplos de una frecuencia base, llamada fundamental o primer armnico. El resultado es una vibracin armnica, a la que podemos asignar una altura tonal
denida, por lo que reconocemos una nota musical.
En este captulo vamos a limitarnos a estudiar el sonido armnico, dejando al margen
las mezclas inarmnicas de componentes parciales. Por razones didcticas vamos a
analizar el comportamiento de sonidos totalmente estables, es decir, de sonidos formados por componentes cuyos parmetros de frecuencia y amplitud permanecen
sin cambios durante toda su duracin. Esto nos va a facilitar la observacin aislada
de las diferencias en la cualidad sonora derivadas de la presencia o ausencia de unos
u otros componentes de la serie armnica, as como de su mayor o menor amplitud, dejando para ms adelante el estudio de los rasgos sonoros que dependen de la
evolucin temporal de los parmetros, es decir, de las envolventes de frecuencia y de
amplitud.
123
He confeccionado mediante Matlab varios vdeos que nos van a permitir observar con
detenimiento qu es el sonido armnico. En la parte superior de todos ellos podremos
examinar la forma de la vibracin, es decir, la seal de audio, como en el osciloscopio
virtual que hemos visto en los vdeos de los captulos anteriores, y en la parte inferior
podremos ver unas grcas que representan la frecuencia y la amplitud de cada uno
de los componentes que constituyen ese sonido. El color de cada componente en
esas grcas viene determinado por su amplitud, siguiendo una escala que va del
negro (el valor cero) al blanco (el valor mximo que podra representarse en el eje
de ordenadas), pasando por los distintos colores que adquiere el hierro al calentarse:
negro rojizo, rojo oscuro, rojo claro, naranja, amarillo y, nalmente, blanco, con
todos sus matices intermedios. Este mapa de color es el que se utilizar en las grcas
de los captulos siguientes cuando sea necesario representar mediante colores el valor
de la amplitud.
7.2.
Sonidos armnicos y sonidos inarmnicos
Empecemos diferenciando la forma de la vibracin de los sonidos armnicos de la de

los inarmnicos. En el vdeo de la gura 7.1 se presenta primero un sonido inarmnico y luego un sonido armnico. Ambos estn constituidos por cuatro componentes
sinusoidales estables, pertenecen a la misma banda frecuencial y tienen las mismas
relaciones de amplitud entre ellos. En el primer caso las frecuencias de los componentes son: 220 Hz, 311 Hz, 557 Hz y 929 Hz. Comprobamos que estas cantidades
no son conmensurables con ninguna otra que pudiera servir de fundamental (o, lo
que es lo mismo, su mximo comn denominador es la unidad). En el segundo caso,
sin embargo, todas las frecuencias son mltiples de la ms grave: 220 Hz, 440 Hz,
660 Hz y 880 Hz. Todas estas cantidades son mltiplos sucesivos de 220, que es su
mximo comn divisor: 220; 220 x 2 = 440; 220 x 3 = 660; 220 x 4 = 880.
124
Figura 7.1: Vdeo que muestra la diferencia entre los sonidos armnicos y los inarmnicos.
El color de cada componente en ambas grcas viene determinado por su amplitud,

segn la escala de color del hierro al calentarse, mientras que la seal resultante de
la mezcla est en color verde. Dada la proximidad de las amplitudes, los colores son
bastante similares, lo cual diculta su visualizacin, pero he optado por mantenerlos
as para que coincidan con los valores de la grca de abajo y tambin para que nos
vayamos familiarizando con el mapa de color que se usar en los captulos siguientes,
cuando se estudie el anlisis frecuencial.
En la grca de abajo aparecen la frecuencia y la amplitud de cada componente
que interviene en la mezcla, representadas respectivamente en el eje de las abscisas
y en el de las ordenadas. Adems, la leyenda indica la frecuencia de cada uno de los
componentes con el color correspondiente a su amplitud: 0,12; 0,10; 0,08; y 0,06.
Como vemos en el eje de las ordenadas, ahora el valor mximo de la amplitud (al que
le correspondera el color blanco) es 0,15. Puesto que los componentes no cambian
en amplitud, esta grca no se modica a lo largo de la duracin del sonido.
En el primer caso omos un sonido que no es un ruido, pero del que para nada podremos decir que se trate de una nota musical. Como mucho, algn experimentado
anador de instrumentos o alguien con un odo analtico particularmente bueno
podra detectar los componentes individuales, que aproximadamente son: la3 , mib4 ,
do#5 , sib5 . En efecto, estamos ante un sonido que podramos calicar como inarmnico: no es ruido, pero tampoco es una nota musical.
125
En el segundo caso, por el contrario, todos omos claramente una nota musical, en
concreto, el la3 a 220 Hz. Aunque un buen odo analtico muy entrenado podra
identicar aisladamente cada componente, lo cierto es que los percibimos como un
nico sonido musical, pues han amalgamado perfectamente bien. Se ha producido
la mezcla armnica.
Si nos jamos en las grcas de arriba, las del osciloscopio, comprobamos que hay una
evidente diferencia en la forma de la seal entre el primer sonido y el segundo. En el
caso del sonido inarmnico, vemos que la forma de la vibracin no es estable, sino
que va cambiando constantemente, de modo que es imposible reconocer ninguna
periodicidad en ella. En el caso del sonido armnico, por el contrario, la forma de
la vibracin permanece constante, con lo que podemos apreciar la estabilidad de su
dibujo, es decir, su periodicidad.
En la grca de abajo apreciamos la disposicin espacial de los componentes. Tambin ahora las diferencias son claras. Vemos que en el caso del sonido inarmnico los
componentes mantienen entre s distancias totalmente desiguales, sin que podamos
encontrar ningn patrn espacial, mientras que en el caso del sonido armnico todos los componentes estn igualmente espaciados. Conviene jarnos en que, en este
segundo caso, la distancia entre los componentes armnicos es la misma que la que
hay entre 0 y la frecuencia del primer componente, es decir, 220 Hz.
Para entender lo que sucede podemos jarnos en un pequeo fragmento de la seal
de la segunda parte del vdeo, cuando se produce la superposicin de cuatro componentes parciales armnicos:
126
Figura 7.2: Forma de la vibracin de un sonido armnico y sus componentes.
Vemos que, mientras el componente ms luminoso y de mayor amplitud, representado en amarillo claro (el de 220 Hz), realiza un ciclo completo, el componente
amarillo oscuro (el de 440 Hz) realiza exactamente dos ciclos, el naranja (el de 660
Hz), tres ciclos exactos, y el rojo (el de 880 Hz), cuatro ciclos. Todos los componentes se sincronizan con total precisin cada vez que el de 220 Hz empieza un nuevo
ciclo.
Esta sincronizacin hace que la seal verde, la resultante de la mezcla de los cuatro
componentes, se repita exactamente igual cada cierto tiempo. En efecto, esta seal
verde es peridica y su periodo, como podemos observar en la grca, es aproximadamente de 4,5 milsimas de segundo (1/220). Podemos apreciar que ese periodo es
la inversa de la frecuencia del componente ms grave, el fundamental. Y puesto que
los componentes han amalgamado bien formando un solo sonido, una mezcla armnica, podemos atribuirle una frecuencia. De ah que en la segunda parte del vdeo
oigamos una nota de 220 Hz, el la3 en nuestra anacin estndar.
Fijmonos ahora en la forma de la seal cuando se mezclan componentes sinusoidales
que no mantienen entre s una relacin armnica, como ocurre en la primera parte
del vdeo.
127
Figura 7.3: Forma de la vibracin de un sonido inarmnico y sus componentes.
En la gura 7.3 no apreciamos ninguna regularidad: al no haber ninguna sincronizacin entre los componentes individuales, sino que que cada uno lleva su propio
ritmo de repeticin, en la seal verde resultante no existe ninguna forma que se repita. Este sonido carece de periodicidad y, por lo tanto, no podemos asignarle una
frecuencia y no omos una altura tonal concreta.
7.3.
La serie armnica
En msica se denomina serie armnica a la sucesin de sonidos simples cuyas

frecuencias son mltiplos enteros y sucesivos de una frecuencia base, llamada
fundamental o primer armnico. Esta frecuencia fundamental es la que determina
la nota musical que percibimos.
Los componentes armnicos se designan por el ordinal que le corresponde en la serie
armnica: primer armnico o fundamental; segundo armnico, el que tiene una frecuencia que es doble de la fundamental; tercer armnico, el que tiene una frecuencia
que es triple de la fundamental, y as sucesivamente. Por ejemplo, si tomamos como
frecuencia base un sonido simple de 100 Hz, la frecuencia del primer armnico o
fundamental ser 100 x 1 = 100 Hz; la del segundo armnico ser 100 x 2 = 200 Hz;
la del tercero, 100 x 3 = 300 Hz; la del cuarto 100 x 4 = 400 Hz, etc.
128
A continuacin vamos a estudiar cmo inuye en la cualidad del sonido resultante el

nmero y el peso de los componentes que constituyen su estructura armnica. Los
ejemplos que vamos a observar en los vdeos nos servirn tambin para comprender
que cualquier forma de vibracin peridica, por compleja que sea, puede ser generada a partir de componentes armnicos. Para ello he fabricado dos vdeos a partir de
fotogramas creados mediante Matlab. En ambos vdeos podemos observar que conforme se aaden armnicos al sonido la forma de la vibracin se va haciendo cada vez
ms compleja, alejndose de la forma sinusoidal, y la cualidad sonora va adquiriendo
cada vez ms brillantez. El primer vdeo muestra cmo se va formando una seal en
dientes de sierra y el segundo una seal rectangular. Igual que en el vdeo anterior, en
la parte de arriba podemos ver la forma de la vibracin del sonido resultante, a modo
de osciloscopio, y en la de abajo la frecuencia y la amplitud de los componentes que
lo constituyen. A medida que van apareciendo, se muestra tambin el nmero de
armnico del que se trata y su frecuencia.
En ambos vdeos suena ocho veces la misma nota, un la3 a 220 Hz, lo que nos permite
apreciar cmo va cambiando la cualidad sonora conforme se van aadiendo nuevos
componentes armnicos. En los dos casos empieza sonando el componente fundamental aislado, un sonido simple de 220 Hz. En el primer vdeo se van incorporando
uno detrs de otro todos los componentes de la serie armnica, tanto pares como
impares, hasta llegar al octavo armnico. En el segundo vdeo slo se incorporan los
armnicos impares, de modo que, puesto que tambin se van aadiendo un total de
ocho componentes, llegan hasta el decimoquinto armnico. En los dos vdeos la amplitud de cada armnico se decrementa proporcionalmente al ordinal del armnico
correspondiente: la amplitud del armnico quinto, por ejemplo, es la quinta parte de
la amplitud del fundamental. En todos los casos los componentes simples tienen la
misma fase inicial.
7.3.1.
Sonido formado por componentes consecutivos de la serie armnica:

Seal en diente de sierra
Empecemos escuchando y observando la forma de la seal cuando al sonido simple

fundamental se aaden uno tras otro componentes cuyas frecuencias siguen la serie
armnica.
129
Figura 7.4: Vdeo que muestra la generacin de una seal en diente de sierra a partir de los componentes consecutivos de la serie armnica.
Podemos apreciar que el carcter puro, seco y ms bien mate del sonido simple aislado que omos al inicio, se va perdiendo con la adquisicin de nuevos componentes.
Observamos que progresivamente el sonido va adquiriendo ms cuerpo y nos va
transmitiendo una sensacin de mayor grosor y de mayor brillo. En efecto, la incorporacin del segundo armnico elimina ya la sequedad del sonido simple y le otorga
una cualidad dulce y redondeada. Con el tercer armnico se introduce una clara
sensacin de nasalidad. El cuarto armnico refuerza el carcter redondo y compacto,
atenuando un poco la nasalidad que haba introducido el tercer armnico. El quinto
aporta plenitud al sonido, producindonos la sensacin de una sonoridad compacta
y llena. El sexto aade de nuevo nasalidad. El sptimo introduce, por primera vez,
una sensacin de aspereza. Y el octavo refuerza la coherencia total del sonido, aumentando el brillo y la luminosidad del conjunto.
En lo que respecta a la forma de la seal que vemos en el osciloscopio, comprobamos que conforme se van aadiendo nuevos armnicos, va hacindose ms y ms
compleja, adquiriendo nuevas ondulaciones y alejndose de la forma sinusoidal que
tena al principio. El hecho de que todos componentes que introducimos estn en
fase y que la relacin entre sus amplitudes se decremente proporcionalmente al nmero del armnico, hace que esas ondulaciones tiendan a aproximarse a una forma
rectilnea, conforme aumenta el nmero de armnicos que se incorporan. Aunque
130
en este vdeo para construir el sonido compuesto slo he sumado ocho armnicos,
podemos darnos cuenta de que la incorporacin de un nmero mayor nos permitira
aproximarnos cada vez ms a una seal que tuviera la forma de dientes de sierra.
7.3.2.
Sonido formado por los componentes impares consecutivos de la serie

armnica: Seal rectangular
Veamos ahora cmo suena y cmo es la forma de la seal de un sonido armnico

formado slo por componentes impares.
Figura 7.5: Vdeo que muestra la generacin de una seal rectangular a partir de los componentes
impares de la serie armnica.
Podemos apreciar que la incorporacin del tercer armnico hace que el sonido tenga
un carcter nasal muy destacado. As mismo, la ausencia del segundo armnico nos
produce un efecto de hueco. El quinto armnico aporta tambin ahora una sensacin de acabado, pero dentro de una cualidad sonora dominada por la nasalidad. Los
restantes armnicos que se van incorporando (el sptimo, el noveno, el undcimo, el
decimotercero y el decimoquinto) proporcionan cada vez ms brillo al sonido, pero
el resultado es tambin progresivamente ms spero.
131
Respecto a la forma de la vibracin, observamos que va evolucionando con la incorporacin de nuevos armnicos, hasta adquirir un aspecto rectilneo, una seal
rectangular. Esta forma rectangular se debe a la concentracin de las ondulaciones
en los tramos superior e inferior de la seal, unas ondulaciones que van aumentando
en nmero y atenundose en amplitud con cada nueva incorporacin de armnicos.
Igual que en el caso de la seal en dientes de sierra, tambin ahora podemos imaginar que si se siguieran aadiendo componentes armnicos impares, manteniendo la
misma proporcin en el decremento de la amplitud, podramos aproximarnos cunto
quisiramos a una seal rectangular.
El predominio de los armnicos impares es un rasgo caracterstico del timbre de
algunos instrumentos como, por ejemplo, el clarinete.
7.3.3.
Cualidad sonora derivada de los componentes de la serie armnica
Como hemos podido experimentar en los dos vdeos anteriores, la presencia o ausencia de unos u otros componentes inuye decisivamente en la cualidad sonora de
la mezcla armnica. Pero hay que tener en cuenta que la coloracin que aade cada
componente a la mezcla armnica se ve matizada por otras circunstancias, en especial, la anchura de la banda crtica en la que est localizado o la existencia o no
de componentes vecinos dentro de su banda frecuencial con los que pueda interferir.
Dejando al margen esto, podemos generalizar lo que hemos observado en los vdeos
y deducir cmo afecta cada uno de los componentes de la serie armnica a la cualidad
sonora de la mezcla resultante:
a) En lneas generales, el incremento del nmero de armnicos aumenta la brillantez del sonido.
b) Los armnicos segundo, cuarto, octavo, decimosexto, etc. es decir, los que
mantienen una relacin de octava con el fundamental refuerzan la coherencia
tonal del sonido.
132
c) Los armnicos tercero, sexto, duodcimo, etc. es decir, los que estn en
relacin de octava con el tercer armnico aportan un carcter nasal (llamado
as por recordar al que se produce en el habla al emitir los sonidos nasales).
d) Los armnicos quinto y dcimo aaden una sensacin de plenitud.
e) El resto de los armnicos aaden cierto matiz de aspereza.
f) Un sonido con numerosas lagunas entre sus armnicos tiende a producir una
sonoridad hueca, mientras que un sonido ms completo produce una sonoridad
plena y maciza.
Hay que tener presente que si hubiramos alterado la fase inicial de los componentes armnicos, hubiramos cambiado la forma de la vibracin, pero la cualidad del
sonido resultante no hubiera sufrido ninguna modicacin relevante.
Por otra parte, mediante estos dos vdeos podemos comprender que cualquier forma
de vibracin peridica, por alejada que est de la sinusoidal, puede ser generada a
partir de componentes armnicos. Y, a la inversa, podemos deducir tambin que
cualquier forma de vibracin peridica puede ser descompuesta en sus componentes
armnicos, como los que aparecen en la ventana inferior de los dos vdeos.
7.4.
Componentes de la serie armnica y notas de la escala

temperada
Una vez que hemos visto que los sonidos musicales complejos se forman combinando
diversos componentes de la serie armnica, nos interesa conocer la correspondencia
entre esos componentes y las notas e intervalos de la escala musical temperada, la
habitual en nuestra msica.
Muchos tericos de la Armona han considerado que los acordes imitan en cierta
manera la estructura armnica de los sonidos musicales, por lo que es comn que los
tratados de Armona comiencen enumerando los componentes de la serie armnica
e indicando las notas de la escala a las que ms se aproximan. Aunque estas consideraciones hoy en da estn en desuso, lo cierto es que existe una gran anidad entre los
133
elementos de nuestro lenguaje musical y la organizacin intervlica de la serie armnica. Esta anidad se debe a que la estructura cognitiva que posibilita la percepcin
unitaria de un sonido armnico es la misma que la que est detrs de la construccin
de nuestro lenguaje musical.
Por otra parte, conocer la correspondencia entre los componentes de la serie armnica y las notas de la escala musical nos va a permitir entender por qu omos
consonancias o disonancias cuando se mezclan notas musicales. Puesto que habitualmente las notas de las voces y de los instrumentos musicales constan de mltiples
componentes armnicos, cuando se emiten simultneamente dos o ms notas se va a
producir la mezcla e interferencia entre sus respectivos componentes. La coincidencia o divergencia entre los armnicos de cada una de esas notas determinar el grado
de consonancia que se establezca entre ellas.
Para ver las correspondencias entre los componentes armnicos y las notas de
la escala temperada, primero debemos traducir a semitonos temperados los intervalos que forman cada uno de los componentes de la serie armnica con el
fundamental o primer armnico. Las razones que denen estos intervalos vienen
dadas por las que se establecen entre sus respectivos nmeros de armnico: el intervalo del segundo armnico con el fundamental tiene la razn 2/1 (o sea, 2); el del
tercero con el fundamental, la razn 3/1 (o sea, 3); el del cuarto, la razn 4/1 (o sea,
4); y as sucesivamente. Como hemos visto en el captulo 5, para expresar estas razones en semitonos temperados bastar tomar el logaritmo en base 2 de los sucesivos
enteros positivos que constituyen la serie armnica y multiplicar el resultado por 12.
Por ejemplo, para expresar en semitonos temperados el intervalo que forma el tercer
armnico con el fundamental, tomaremos el logaritmo en base 2 del nmero 3 y
multiplicaremos el resultado por 12, lo que nos dar, redondeado a centsimas de
semitono, 19,02 semitonos.
En la tabla de abajo presento el nmero de semitonos temperados, redondeados a
cents, que tiene el intervalo que forma cada uno de los componentes de la serie
armnica con el fundamental.
134
Armnico
Nombre del intervalo
Nmero de
Diferencia en
que forma el componente armnico
semitonos
cents entre el
con el fundamental
temperados
intervalo natural
y el temperado
Unsono
Octava
12
Octava ms quinta natural
19,02
+2
Doble octava
24
Doble octava ms tercera mayor natural
27,86
-14
Doble octava ms quinta natural
31,02
+2
Doble octava ms sptima menor natural
33,69
-31
Triple octava
36
Triple octava ms tono de 9/8
38,04
+4
10
Triple octava ms tercera mayor natural
39,86
-14
11
Triple octava ms cuarta aumentada natural
41,51
-49
12
Triple octava ms quinta natural
43,02
+2
13
Triple octava ms sexta menor natural
44,41
+41
14
Triple octava ms sptima menor natural
45,69
-31
15
Triple octava ms sptima mayor natural
46,88
-12
16
Cudruple octava
48
Tabla 7.1: Intervalos que se establecen entre los componentes de la serie armnica y el fundamental.
En la primera columna se indica el nmero del armnico; en la segunda, el nombre

del intervalo que forma ese armnico con el fundamental, habitualmente adjetivado
con el calicativo natural para diferenciarlo del temperado; en la tercera, el nmero
de semitonos temperados que tiene ese intervalo natural redondeado a cents; y en la
cuarta, la diferencia en cents entre el intervalo natural y el intervalo temperado ms
prximo.
135
As, por ejemplo, en la quinta la, el ordinal 5 indica que se trata del quinto componente armnico y que, por lo tanto, la razn con el fundamental es 5/1. En la segunda
columna gura el nombre habitual de ese intervalo, en este caso, doble octava ms
tercera mayor natural. En la tercera columna se presenta el nmero de semitonos
temperados de este intervalo, que es el resultado de tomar el logaritmo en base 2 de 5
y multiplicarlo por 12, lo que nos da un valor, redondeado a centsimas de semitono,
de 27,86 semitonos. Esta cantidad ser de utilidad para averiguar cul es la nota musical de nuestra escala temperada que ms se aproxima a ese componente en una serie
armnica concreta, es decir, una serie armnica con un componente fundamental
determinado (por ejemplo, la serie armnica que comienza en do2 que podemos ver
en la gura 7.6). En la cuarta columna se presenta la diferencia en cents entre el
intervalo que forma ese componente armnico con el fundamental y el intervalo
temperado ms prximo (recordemos que por denicin todo intervalo temperado
tiene un nmero entero de semitonos). Puesto que en este caso el valor en semitonos
que forma el quinto armnico con el fundamental es de 27,86, la diferencia con el
intervalo temperado ms prximo, el de 28 semitonos, ser de -14 cents, tal como
aparece en la cuarta columna. Dicho de otra manera el intervalo natural de 5/1 es
14 cents menor que el intervalo de 28 semitonos, el intervalo de doble octava ms
tercera mayor temperada.
Una vez que hemos expresado en semitonos temperados el valor intervlico de cada
armnico con el fundamental, es sencillo asignar el primer armnico a una nota
cualquiera y, a partir de ah, determinar la nota musical que ms se aproxima a cada
uno de los componentes armnicos.
La gura que presento a continuacin nos va a permitir observar que la frecuencia
de algunos componentes armnicos coincide exactamente con la frecuencia de una
nota de la escala temperada, que la de otros se aproxima mucho, pero que la frecuencia de otros se aleja signicativamente de la de cualquier nota de esa escala. Estas
coincidencias y divergencias entre las frecuencias de los componentes armnicos y
las de sus correspondientes notas de la escala temperada condicionan el grado de
consonancia que se establece entre las notas musicales, como se explica en el captulo
que trata de la consonancia entre sonidos compuestos.
Para minimizar el nmero de bemoles y sostenidos, suele ser habitual presentar las
notas de la serie armnica tomando como referencia la nota do. He elegido como
136
fundamental el do2 , para evitar sobrepasar en exceso los lmites del pentagrama. La
serie armnica que presento a continuacin se extiende hasta los primeros diecisis
componentes armnicos.
Figura 7.6: Serie armnica con fundamental en do2 y diferencias entre las notas naturales correspondientes a cada armnico y las temperadas.
Debajo del pentagrama vemos el nmero del armnico al que se asigna cada nota.
Los colores de las notas representan la cualidad sonora caracterstica que aporta cada
armnico a la mezcla: en negro estn los que proporcionan coherencia al sonido; en
magenta, los que aaden una sensacin de nasalidad; en azul, los que aportan una
impresin de plenitud; y en rojo, los que introducen cierto matiz de aspereza.
En la la que est situada inmediatamente encima del pentagrama se indica la frecuencia de cada nota en la escala temperada estndar (la4 = 440 Hz), redondeada
a dcimas de hercio. En la siguiente la, se muestra la frecuencia del componente
armnico al que podemos llamar la nota natural, la cual es el resultado de multiplicar la frecuencia de la nota do2 (130,8 Hz) por el nmero del armnico, redondeada
tambin a dcimas de hercio. En la tercera la se indica, cuando la hay, la diferencia
en hercios entre la frecuencia del componente armnico y la frecuencia de la nota
temperada, redondeada a dcimas de hercio. Y en la la superior, destacada en color
137
azul, se presenta, expresado en cents, el intervalo que hay entre la nota natural es
decir, el componente armnico y la nota temperada ms prxima. Puesto que este
intervalo es el mismo que la diferencia que hay entre el intervalo natural que forma el
componente armnico con el fundamental y el intervalo temperado ms prximo,
podemos ver que estos valores coinciden con los de la cuarta columna de la tabla
7.1.
Por ejemplo, vemos que el quinto componente armnico se corresponde, aproximadamente, con la nota mi4 temperada, cuya frecuencia es 659,3 Hz. Como la frecuencia del quinto armnico es 654,1 Hz, comprobamos que es 5,2 Hz menos que la de la
nota mi4 temperada. El intervalo que hay entre la nota natural, es decir, la correspondiente al componente armnico, y la nota temperada es de -14 cents (27,86 - 28 =
-14). Podemos vericarlo tambin calculando el intervalo que hay entre la frecuencia
de la nota natural y la frecuencia de la nota temperada, tomando el logaritmo en base
2 de la razn entre sus frecuencias (654,1/659,3) y multiplicando el resultado por 12,
con lo que obtendremos el mismo resultado de -14 cents. As pues, el nmero -14
que est sobre la nota mi4 indica que la nota correspondiente al quinto armnico de
la serie est 14 cents por debajo del mi4 de nuestra escala temperada.
7.5.
Intervalos entre los sucesivos componentes de la serie armnica
Dadas las anidades entre la constitucin de la serie armnica y la estructura intervlica que da lugar a las escalas y acordes de nuestro lenguaje musical, nos interesa
comparar las relaciones intervlicas que se establecen entre los sucesivos componentes armnicos con los intervalos de nuestra escala temperada. Para ello vamos a
utilizar la la superior de la gura 7.6, en color azul, donde se indica, redondeado a
cents, el intervalo de diferencia que hay entre la nota de la serie armnica y la nota
temperada correspondiente. As mismo, para diferenciar con claridad cundo estamos rerindonos a la nota de la serie armnica y cundo a la nota correspondiente
de nuestra escala temperada, utilizar el adjetivo natural para las notas de la serie
armnica y el adjetivo temperada para las de la escala temperada.
138
a) En los cuatro primeros armnicos estn contenidas las consonancias

que estructuran todo nuestro sistema musical: la octava (2/1), entre el segundo y el primer armnico; la quinta (3/2), entre el tercero y el segundo;
y la cuarta (4/3) entre el cuarto y el tercero. En la serie armnica de la gura
7.6, cuyo fundamental es do2 , estas consonancias corresponden a los intervalos
que se establecen entre do3 do2 , sol3 do3 y do4 sol3 , todas ellas notas naturales.
Hay que tener en cuenta que, si bien estos intervalos exactos han constituido el
fundamento sobre el que se ha desarrollado nuestro lenguaje musical, a partir
del desarrollo de la moderna tonalidad las quintas y las cuartas han sido ligeramente matizadas para establecer el sistema temperado: la quinta temperada
est aproximadamente 2 cents ms baja que el intervalo de quinta natural y la
cuarta temperada est unos 2 cents ms alta que la cuarta natural. Esto ltimo
lo podemos deducir fcilmente, pues si la quinta natural es 2 cents mayor que
la quinta temperada, la cuarta natural ha de ser necesariamente 2 cents menor
para que la octava tenga los cents justos que le corresponden (1200 cents por
denicin, 12 semitonos). Hay que tener presente que, al ser la octava el intervalo de referencia, carece de sentido la distincin entre octava natural y octava
temperada.
b) Entre el quinto y el cuarto armnico (5/4) hay una tercera mayor natural que es sensiblemente ms corta que la tercera temperada, en concreto,
14 cents menos. En la serie armnica que estamos utilizando como ejemplo
corresponde al intervalo que se establece entre mi4 do4 , ambos naturales.
c) Entre el sexto y el quinto armnico (6/5) hay una tercera menor natural que excede en 16 cents a la tercera menor temperada. En nuestra serie
armnica corresponde al intervalo que se establece entre sol4 mi4 , ambos naturales. En efecto, puesto que el quinto armnico (mi4 natural) es 14 cents ms
bajo que la nota temperada correspondiente (mi4 temperado) y el sexto armnico (sol4 natural), es 2 cents ms alto que el sol4 temperado, la diferencia entre
el intervalo que forman las notas naturales (la tercera menor natural) y la que
forman las correspondientes notas temperadas (la tercera menor temperada) es
de 16 cents.
d) Los intervalos entre los armnicos cuarto, quinto y sexto (5/4, 6/5) constituyen un acorde perfecto mayor. Si incluimos el sptimo armnico forman
139
un acorde de sptima de dominante, aunque su correspondiente sptima temperada est ya muy lejos de la sptima natural, en concreto la sptima natural
es 31 cents inferior a la sptima temperada. En la gura 7.6 corresponden a las
notas do4 , mi4 , sol4 , sib4 , todas ellas naturales.
e) Entre el noveno y el octavo armnico se establece el tono de 9/8, tambin llamado tono pitagrico, que resulta de la composicin de dos quintas
naturales a la que posteriormente se sustrae una octava. En nuestra serie armnica corresponde al intervalo que se establece entre re5 do5 , ambos naturales.
Podemos construir este tono de 9/8 si aadimos a la quinta natural que hay entre el cuarto y el sexto armnico (do4 sol4 naturales), la quinta natural que hay
entre el sexto armnico y el noveno armnico (sol4 re5 naturales), con lo que
obtenemos un intervalo de octava ms un tono diatnico. Luego, al ascender
una octava el sonido ms grave del intervalo as formado (el do4 pasa a ser do5 ),
dejamos solamente el tono diatnico. Como cada quinta natural excede en 2
cents a la quinta temperada, este tono pitagrico ser 4 cents mayor que el tono
temperado.
f) Entre el dcimo y el noveno armnico se forma un intervalo de tono de
10/9, el llamado tono menor. En nuestra serie armnica corresponde al intervalo que se establece entre mi5 re5 naturales. Este intervalo es 18 cents menor
que el tono temperado. En efecto, puesto que el noveno armnico (re5 natural)
es 4 cents ms alto que la correspondiente nota temperada (re5 temperado) y
el dcimo armnico (mi5 natural) es 14 cents ms bajo que su correspondiente
nota temperada (mi5 temperado), la diferencia respecto al tono temperado es de
18 cents.
g) Entre el decimosexto y el decimoquinto armnico se produce un intervalo de semitono de 16/15, el llamado semitono mayor que se usaba en
algunas escalas musicales antiguas. En nuestra serie armnica corresponde al
intervalo que se establece entre do6 si5 naturales. Este intervalo excede en 12
cents al semitono temperado, pues el si5 natural es 12 cents ms bajo que el si5
temperado.
h) El resto de los intervalos que se forman entre los sucesivos armnicos
quedan lejos de los intervalos usados en nuestras escalas musicales.
140
7.6.
Estructura armnica y reconocimiento de la altura tonal
La estructura armnica es el conjunto de componentes de la serie armnica

que estn presentes en un sonido concreto, cada uno de ellos con su propia
amplitud. Como hemos podido apreciar en los vdeos anteriores, cuando escuchamos un sonido formado por componentes armnicos, nuestro sistema perceptivo
reconoce la estructura armnica que forman esos componentes, lo que hace que, de
manera totalmente inconsciente, seamos capaces de reconocer una altura tonal y, por
lo tanto, una nota musical. En los vdeos de este captulo la estructura armnica del
sonido queda representada en las grcas de abajo, donde aparecen los componentes
frecuenciales, cada uno con su amplitud.
Como hemos visto en los apartados anteriores, los componentes de la serie armnica
estn separados unos de otros por la misma distancia frecuencial. Esta distancia es el
mximo comn divisor de las frecuencias de todos ellos y coincide con la frecuencia del primer componente de la serie. Cuando omos un sonido, nuestro sistema de
reconocimiento auditivo intenta organizar sus componentes, intenta buscar una distancia frecuencial que se repita, es decir, intenta reconocer una estructura armnica.
Si lo consigue, est ante un sonido armnico, de modo que puede asignarle la altura
tonal del componente fundamental de la serie armnica a la que pertenece, incluso
cuando ese componente fundamental no est presente en la estructura armnica de
ese sonido concreto. Ello es as porque, como veremos en el captulo 13, nuestro
cerebro unica los componentes frecuenciales para reconstruir la unidad del objeto
sonoro, con lo que puede identicar la nota musical correspondiente en la escala. En
denitiva, si somos capaces de or notas musicales es porque reconocemos el patrn
armnico de un sonido concreto, aunque para ello sea necesario rellenar los huecos
de los componentes frecuenciales que faltan en su estructura armnica, de modo que
sea posible reconstruir la serie armnica a la que pertenece.
A continuacin vamos a comprobar experimentalmente que la altura tonal de un
sonido musical viene determinada por la frecuencia del componente fundamental de su estructura armnica, con independencia de que ese componente
est o no presente en ese sonido concreto. Veremos tambin que el reconocimiento del patrn armnico se produce incluso cuando la estructura armnica presenta
un nmero importante de huecos, como hemos podido observar en el caso de la seal
141
rectangular formada nicamente por componentes impares que aparece en el vdeo

de la gura 7.5.
Para apreciar cmo se produce el reconocimiento de la estructura armnica he confeccionado un vdeo en el que se presentan tres notas musicales cuyas alturas tonales
distan entre s una octava. En lo tres casos la frecuencia del componente ms grave
presente en la seal es 220 Hz; sin embargo, en el primero omos un la3 a 220 Hz,
en el segundo un la2 a 110 Hz, y en el tercero un la1 a 55 Hz.
Figura 7.7: Vdeo que muestra que la percepcin de la altura tonal del sonido armnico no se ve
afectada por la ausencia del componente fundamental o incluso de los primeros componentes.
Como era de esperar, la primera nota que omos es un la3 , pues esa es la frecuencia
del componente fundamental, tal como aparece indicado en la leyenda. Si atendemos a la grca de abajo y nos jamos en su estructura armnica, vemos que todos
los componentes son mltiplos de 220 Hz y que estn presentes los ocho primeros
armnicos de su serie. En la ventana del osciloscopio podemos ver que la forma de
la vibracin es totalmente peridica. En efecto, si detenemos el vdeo en cualquier
momento, y hacemos un clculo aproximado, podremos ver que su periodo ocupa
un poco menos de la anchura de un rectngulo de la retcula, es decir, un poco menos de 5 milsimas de segundo, lo cual es coherente con el periodo correspondiente
a la frecuencia de 220 Hz, es decir, 4,5 milsimas de segundo (1/220 = 0,0045).
142
La segunda nota que omos es un la2 . La estructura armnica de esta nota est formada tambin por ocho componentes consecutivos, pero ahora el primer componente
de esa serie armnica est ausente. En efecto, vemos que las frecuencias de todos los
componentes son mltiplos de 110, y no de 220. O lo que es lo mismo, el mximo
comn divisor de las frecuencias de todos los componentes de esta estructura armnica es 110. As pues, deducimos que la frecuencia del componente fundamental de
la serie armnica a la que pertenece esta nota es 110 Hz y que en este caso est ausente. En efecto, los componentes presentes en esta estructura armnica comienzan
con el segundo armnico, el de 220 Hz, y consecutivamente llegan hasta el noveno,
el de 990 Hz. En el osciloscopio vemos que la seal es tambin claramente peridica,
pero que el periodo es el doble del periodo del caso anterior, aproximadamente, 9
milsimas de segundo, como corresponde a una frecuencia de 110 Hz (1/110 = 0,009,
redondeando a milsimas).
La tercera nota que omos es el la1 . En este caso el mximo comn divisor de todos los
componentes que forman la estructura armnica de ese sonido es 55, de modo que la
frecuencia del componente fundamental de la serie armnica a la que pertenece es 55
Hz. Pero este componente no est. Podemos tambin observar que el componente
ms grave que est presente en la estructura armnica de esta nota musical es el cuarto
armnico. A partir de l estn los sucesivos componentes hasta el undcimo, el de 605
Hz. As pues, en este caso, no slo falta el fundamental, sino que tambin faltan los tres
primeros componentes. Pero nosotros omos con total claridad una nota que es una
octava ms grave que la anterior, es decir, un la1 . Si nos jamos en la periodicidad,
vemos que tambin se corresponde con la frecuencia del fundamental ausente. En
el osciloscopio podemos observar que el periodo de esta seal es el doble del de la
anterior, aproximadamente 18 milsimas de segundo (1/55 = 0,018, redondeando a
milsimas).
Mediante este ejemplo hemos podido experimentar que la altura tonal que percibimos en un sonido armnico es independiente de la existencia o no del componente
fundamental o incluso de los componentes ms graves. Ello explica que seamos capaces de or notas graves con cualquier sistema de reproduccin de sonido, por muy
deciente que sea: aunque la calidad sonora saldr perjudicada, la percepcin de la
nota de la que se trata no se ve modicada. Por poner un ejemplo, la mayor parte de
los reproductores de sonido econmicos son incapaces de dar frecuencias inferiores
143
a 100 Hz; sin embargo, en esos reproductores nosotros no omos las notas graves
cambiadas de octava, sino que, incluso en el peor equipo de msica, reconocemos,
pongamos por caso, el la1 del piano, cuya frecuencia fundamental est en 55 Hz y
no lo confundimos con el la2 , cuya frecuencia es 110 Hz. Ahora bien, la cualidad, el
color del sonido, no ser el mismo si estn o no estn presentes los componentes ms
graves.
7.7.
Las fronteras de lo armnico. La inarmonicidad en el sonido

musical
A continuacin me propongo mostrar que la estructura armnica del sonido puede deformarse hasta cierto punto sin que desaparezca la percepcin de una
altura tonal definida. Observaremos, adems, que esa deformacin, debida al estiramiento progresivo de la distancia frecuencial entre los componentes, produce una
modicacin de la cualidad sonora.
Como acabamos de ver, la altura tonal de un sonido musical queda denida por la
distancia frecuencial entre los componentes que constituyen su estructura armnica,
al margen de los posibles huecos que pueda haber en ella. Ahora bien, en la realidad, los sonidos de algunos instrumentos deforman esa estructura, incrementando la
distancia entre sus componentes. Y, adems, lo hacen de una forma no lineal: conforme mayor es el ordinal del armnico, mayor es el intervalo musical en el que se
alejan.
Por poner un ejemplo, en el caso del piano la deformacin ocasionada por la rigidez
de sus cuerdas metlicas puede dar lugar en una nota grave a que la frecuencia del armnico decimoquinto, pongamos por caso, sea 16 veces la frecuencia del fundamental, es decir, la frecuencia que debera tener el armnico decimosexto. Ahora bien, la
deformacin de la estructura armnica, cuando se mantiene dentro de unos lmites,
no impide el reconocimiento de una nota musical, si bien es cierto que la altura tonal
que se percibe es ligeramente ms aguda que la correspondiente a la frecuencia del
componente fundamental. Adems esta inarmonicidad modica la cualidad sonora:
cuando es muy ligera aporta un cierto grosor y hace que el sonido sea ms clido;
144
cuando el estiramiento es ya ms pronunciado, el sonido adquiere un color metlico

y empieza a recordar al sonido de una campana.
He fabricado un vdeo que nos va a permitir experimentar lo que sucede cuando
la estructura armnica se deforma dentro de ciertos mrgenes. En los tres casos que
se presentan suena la nota la3 constituida por los ocho primeros armnicos. Pero
mientras que en el primer caso los componentes son equidistantes, lo que da lugar a
una estructura armnica perfecta, en los dos casos siguientes la estructura creada por
los ocho componentes se va deformando: en el segundo caso las distancias entre ellos
estn ligeramente estiradas, lo que provoca una pequea inarmonicidad, mientras
que en el tercero el estiramiento se acerca ya al lmite de lo que podemos considerar
una estructura armnica y, por lo tanto, tambin al lmite de nuestra capacidad para
percibir una altura tonal denida. La amplitud de cada uno de los componentes es la
misma en los tres casos.
Figura 7.8: Vdeo que muestra que la introduccin de una ligera inarmonicidad en un sonido armnico no impide la percepcin de una altura tonal.
La leyenda que aparece a la derecha de la ventana inferior del vdeo muestra la frecuencia de los componentes y su nmero de armnico, as como la desviacin en
hercios de cada uno de ellos respecto a la frecuencia que tendra el armnico sin
deformar y su correspondiente distancia intervlica expresada en cents.
145
En el primer caso omos un sonido estable y claro, una nota musical, en concreto,
un la3 a 220 Hz. En la ventana del osciloscopio podemos apreciar que la forma de
la vibracin permanece siempre idntica a s misma, totalmente estable. Si paramos
el vdeo en cualquier momento y atendemos a la leyenda, comprobaremos que los
componentes de este sonido son los ocho armnicos consecutivos exactos, mltiplos
sucesivos de la frecuencia fundamental. Por eso en todos ellos la desviacin es 0. En
resumen, la deformacin de la estructura armnica en este caso es nula.
Si comparamos el segundo caso con el anterior, notamos que son muy similares.
Aunque tenemos una cierta sensacin de que la altura se ha elevado muy ligeramente, seguimos oyendo sin ninguna duda una nota musical clara. Ahora bien, si
prestamos un poco ms de atencin, apreciamos que la cualidad sonora se ha modicado sensiblemente respecto al sonido anterior: se ha hecho ms clida y ha adquirido
una coloracin que nos recuerda algo al efecto producido por los batidos de segundo
orden cuando se mezclan dos sonidos consonantes que se apartan ligersimamente
de la conmensurabilidad exacta. En la ventana del osciloscopio apreciamos que ahora la forma de la vibracin cambia a cada momento, si bien el periodo se mantiene
constante.
Podemos parar el vdeo y ver en la leyenda que ahora ya hay una desviacin en la
frecuencia de los componentes, una desviacin que es muy pequea en los primeros
armnicos y que va creciendo, tanto en hercios como en cents, a medida que aumenta
su ordinal. Pero nos damos cuenta de que incluso en el ltimo componente, que es
donde se produce la desviacin mxima, el intervalo que se desva respecto al valor
que le correspondera al octavo armnico exacto es solo de 16 cents. Vemos, as pues,
que en este sonido la estructura armnica se ha deformado ligeramente. En efecto,
cuando he generado este sonido, he elegido a propsito los valores de deformacin
de cada componente para que simulara aproximadamente el estiramiento que se suele
producir en una cuerda media del piano. Para ello he usado una variante de la frmula
habitualmente utilizada para calcular la frecuencia de cada uno de los componentes
de una nota de piano a partir de un coeciente dado de inarmonicidad.
En el tercer caso, si atendemos a nuestra percepcin auditiva, comprobamos que
resulta todava posible asignar al sonido una altura tonal, aunque ya de una forma
ms confusa que en los dos casos anteriores. Observamos que esta altura tonal es
ms elevada. Al poner un poco ms de atencin apreciamos que la cualidad clida
146
del caso anterior ha pasado ahora a adquirir cierta aspereza y a transformarse en un

sonido metlico. En efecto, la cualidad sonora nos recuerda bastante al sonido de
una campana (aunque no est presente la atenuacin progresiva caracterstica de la
campana). Estamos en el lmite de la posibilidad de distinguir una altura tonal estable
y de reconocer que se trata de una nota musical.
Si prestamos atencin a la ventana del osciloscopio, vemos que la periodicidad resulta
ya difcil de reconocer, incluso cuando detenemos el vdeo. Podemos aventurar un
cierto valor temporal que parece marcar la evolucin de la vibracin y que, ms o
menos, coincidira con el periodo de los dos casos anteriores, pero de una manera
bastante imprecisa.
En la leyenda podemos comprobar ahora que las desviaciones de los armnicos son
ya bastante importantes, tanto en hercios como en cents. Tambin ahora la desviacin va creciendo conforme mayor es el ordinal, hasta el punto de que la frecuencia
del octavo componente est ya muy lejos de la que le correspondera al octavo armnico. En efecto, su desviacin en cents es de 152, es decir, un semitono y medio.
Podemos ver que la frecuencia de este octavo componente (1921,5 Hz) se aproxima
a la frecuencia que le correspondera al noveno armnico: teniendo en cuenta que
la frecuencia fundamental es 220 Hz, el noveno armnica tendra una frecuencia de
1980 Hz (220 x 9 = 1980). Ahora la estructura armnica ha sido deformada, estirndose los componentes hasta casi romper la estructura armnica. Un poco ms all
de estas fronteras dejaramos ya de percibir una altura tonal y el sonido dejara de
ser armnico. En efecto, para generar este tercer sonido he utilizado la misma frmula que en el caso anterior, pero con un coeciente de inarmonicidad diez veces
mayor.
Para entender a qu se debe el cambio de cualidad sonora provocada por una ligera
inarmonicidad vamos a jarnos en el segundo caso. Vemos en la ventana del osciloscopio que la forma de la vibracin cambia constantemente, mientras se mantiene
la periodicidad. Este fenmeno es una generalizacin a mltiples componentes de
lo que observamos en el caso de los batidos de segundo orden respecto a la mezcla
de dos componentes. La explicacin del fenmeno es, pues, similar. Las pequeas
diferencias de frecuencia provocan desfases, los cuales dan lugar a modicaciones
constantes de la forma de la vibracin, que son las que dotan al sonido de esa cualidad clida. La forma de la vibracin, no obstante, mantiene su periodicidad y eso
147
hace que tenga una frecuencia propia y, en consecuencia, que tenga sentido atribuirle una altura tonal. La diferencia respecto a los batidos de segundo orden reside en
que la complejidad de los desfases, debida al elevado nmero de componentes, evita
una rotacin repetida de la forma de la vibracin, por lo que no percibimos batidos,
sino solamente un sonido ms clido.
Conforme la inarmonicidad aumenta la periodicidad tiende a desaparecer y se complica la percepcin de una altura tonal, pues nuestro sistema auditivo tiene dicultades para organizar los componentes en un patrn armnico. En el ltimo ejemplo de
este vdeo, la deformacin de la estructura es tan importante que el patrn armnico
es percibido ya de una manera difusa, totalmente alejada de la percepcin ntida con
la que se percibe en el primer caso.
7.8.
Conclusin
A lo largo de este captulo hemos podido comprobar que la Armona est presente
incluso en la constitucin misma del sonido musical. Hemos visto que los sonidos
armnicos o musicales son el resultado de la buena mezcla, mientras que los inarmnicos son aquellos cuyos componentes no se mezclan bien, no amalgaman unos con
otros.
Hemos podido observar cmo al combinarse varias vibraciones que guardan entre s
determinadas razones y proporciones se produce una nueva entidad, una nota musical clara y diferenciada. Lo que hace musical a la vibracin que resulta de esta mezcla
es la estructura armnica que posee, una estructura que en s misma no es otra cosa
que unas determinadas relaciones de conmensurabilidad. Por eso los componentes
del sonido armnico no desaparecen, sino que pueden ser de nuevo descompuestos,
tal como hace nuestro sistema auditivo y como podemos realizar mediante las herramientas matemticas propias del anlisis frecuencial. Es por ello por lo que la rama
de las matemticas que se ocupa de la descomposicin de funciones en componentes
sinusoidales se denomina Anlisis Armnico.
Puesto que la estructura armnica, que es lo propio del sonido musical, se crea por
la conmensurabilidad de las frecuencias de todos los componentes respecto al fundamental, y puesto que esa conmensurabilidad permite que amalgamen bien unos
148
componentes con otros, podemos considerar que el sonido armnico viene a ser la
generalizacin a un nmero indeterminado de componentes de la buena mezcla
que se produce entre dos sonidos simples consonantes. En ambos casos la conmensurabilidad da lugar a la sincronizacin de las fases de los distintos componentes, y
esa sincronizacin posibilita su buena mezcla. En este captulo hemos visto que los
intervalos que hay entre los primeros componentes de una serie armnica son precisamente los principales intervalos consonantes (2/1, 3/1, 4/1, 3/2, 4/3), de modo que
la estructura sonora que se crea mediante la mezcla de cualquier nmero de componentes pertenecientes a la misma serie armnica da como resultado un sonido en el
que se ha producido la buena mezcla, un sonido musical.
Mediante los ejemplos que se presentan en los vdeos de este captulo hemos podido
experimentar que la vibracin del sonido armnico o musical mantiene siempre una
periodicidad y que, por lo tanto, posee una frecuencia concreta, con lo que se le puede
atribuir una altura tonal. Dado que nosotros no somos capaces de seguir al detalle el
desarrollo temporal del movimiento vibratorio para captar su periodicidad, sino que
nuestro sistema auditivo extrae su estructura frecuencial, podemos considerar que la
estructura armnica sirve de puente entre la naturaleza peridica del sonido y nuestra
percepcin de la altura tonal.
Nuestra especial facultad para reconstruir intuitivamente la serie armnica explica la
abundante presencia en las acciones de los hombres del sonido armnico: silbar, gritar, cantar, vocalizar, todas estas acciones producen una vibracin armnica a la que
dotamos de sentido y de signicacin. Esta facultad tambin pudiera tener que ver
con la invariabilidad de la frecuencia a lo largo de todo el recorrido de la vibracin
sonora, desde la emisin hasta su recepcin. El sonido puede perder amplitud con
la distancia, puede perder componentes frecuenciales por el camino, pero en condiciones normales nunca modica su periodo de vibracin, o sea, su frecuencia.
Las coincidencias que hemos podido observar entre los armnicos y las notas e intervalos de nuestro lenguaje musical contribuyen a explicar que el mismo sistema
cognitivo que posibilita la percepcin unitaria de un sonido compuesto por varios
componentes armnicos est presente en la constitucin de nuestro lenguaje musical, tanto en la determinacin de los elementos estructurales de las escalas, como en
la construccin de los acordes.
149
Captulo 8
Ondas estacionarias y resonancia:
Generacin del sonido armnico
8.1.
Introduccin
El material de la msica, el sonido armnico, es un fenmeno tan frecuente que forma

parte de nuestra experiencia cotidiana en el reconocimiento del entorno. En efecto,
el sonido armnico est por todas partes: si ponemos un poco de atencin, podemos
or notas musicales en medio del ruido del trco, en el silbido del aire cuando se
ltra por los tubos de una chimenea o por las grietas de las rocas, en el canto de los
pjaros o incluso en el aullido de algunas eras. Por otra parte, es sencillo generar
sonidos armnicos: basta soplar ligeramente en el cuello de una botella vaca, frotar
con suavidad el borde de una copa de cristal o pellizcar una cuerda lo sucientemente
tensa para que se produzcan sonidos musicales.
La pregunta es: por qu es tan habitual la existencia de vibraciones cuyos componentes tienen frecuencias que son mltiplos enteros de una frecuencia fundamental?
La respuesta nos lleva a la geometra: si el sonido armnico abunda tanto en la naturaleza y en los utensilios de todo tipo que hemos fabricado los humanos es porque es
muy comn la existencia de estructuras geomtricas adecuadas para la generacin de
ondas estacionarias armnicas y para su amplicacin mediante resonancias.
150
En cierto modo podemos decir que todo sonido armnico se produce mediante
un proceso de resonancia, un proceso por el cual la onda excitadora se acopla
con sus sucesivos reflejos, dando lugar a la aparicin de ondas estacionarias.
A lo largo de este captulo vamos a examinar por qu se produce el sonido armnico. Para ello estudiaremos el mecanismo fsico mediante el cual surgen las ondas
estacionarias y el fenmeno de la resonancia. Comprenderemos que determinadas
propiedades fsicas y geomtricas de los cuerpos que vibran posibilitan la aparicin
de ondas estacionarias con unos modos de resonancia que son armnicos entre s
y que cuando estos modos naturales de vibracin son excitados por algn agente
surgen sonidos armnicos.
Mediante vdeos ilustrativos que he elaborado con Matlab y que simulan el comportamiento de una cuerda tensada y ja en sus extremos, podremos experimentar
qu son las ondas estacionarias y en qu consiste el fenmeno de la resonancia. Los
vdeos nos van a permitir observar cmo las ondas estacionarias surgen de la interferencia reiterada de una onda sinusoidal con su reejo. Veremos tambin que la
cuerda tensada, como todo sistema vibratorio unidimensional, posee por naturaleza
unos modos de vibracin que son armnicos. Observaremos que la resonancia se
produce cuando un sistema vibratorio es excitado por cualquier perturbacin, por
pequea que sea, que coincida con una de sus frecuencias naturales de vibracin.
Y comprenderemos por qu, al ponerse a vibrar en las frecuencias de estos modos
naturales de vibracin, la cuerda produce un sonido peridico y musical.
Finalmente, antes de entrar en materia, me gustara sealar que el fenmeno de la
resonancia no slo es importante para la acstica musical, sino que atae a toda la
acstica e incluso a la fsica en su conjunto y, de una u otra manera, a la ciencia en
general. La nocin de resonancia ha salido del campo estrictamente acstico y ha
servido para explicar multitud de fenmenos en todas las reas de las ciencias, desde
fenmenos electromagnticos hasta los que conciernen a la fsica de partculas, a la
astronoma, e incluso a la biologa molecular. All donde est presente la vibracin o
la oscilacin est tambin presente el fenmeno de la resonancia.
151
8.2.
La cuerda como paradigma de un sistema vibratorio unidimensional
Para estudiar los fenmenos de las ondas estacionarias y de la resonancia vamos a analizar lo que ocurre en una simple cuerda tensada y ja en sus extremos. Este modelo
puede ser considerado como paradigma de un sistema vibratorio unidimensional.
Dado que los sonidos musicales suelen ser producidos por sistemas vibratorios unidimensionales, si analizamos el comportamiento de una cuerda cuando es inducida
a vibrar podremos comprender los mecanismos mediante los cuales se produce el
sonido armnico.
En todo movimiento ondulatorio hay que distinguir entre el movimiento de propagacin de la onda y el movimiento oscilatorio que realiza cada una de las partculas
que se ven afectadas por el paso de la onda. Cuando la direccin de ambos movimientos es la misma, decimos que las ondas son longitudinales, como vimos que ocurre
con las condensaciones y rarefacciones en el aire al transmitir un sonido. Cuando la
direccin del movimiento oscilatorio es perpendicular a la del movimiento propagatorio, decimos que las ondas son transversales.
Por otra parte, la propagacin de las ondas puede producirse en las tres dimensiones
del espacio, en dos dimensiones o solamente en una: las condensaciones y rarefacciones que se producen al propagarse un sonido por el aire en un espacio abierto
son de carcter tridimensional, pues se extienden de forma radial por todo el espacio circundante; la ondulacin que se propaga por las aguas de un estanque o por
la membrana de un tambor es bidimensional, pues viaja a lo largo y ancho de una
supercie; y las perturbaciones que se propagan a travs de una cuerda tensada o en
el aire contenido en el tubo de una auta son unidimensionales, pues viajan en una
sola direccin del espacio.
Al margen de que sean transversales o longitudinales, los sistemas vibratorios unidimensionales tienden a producir ondas estacionarias con modos normales de vibracin
armnicos. Por eso los sonidos musicales son generados por sistemas vibratorios unidimensionales, tales como los instrumentos de cuerda y los de viento. Habitualmente
las cuerdas de los instrumentos al excitarse dan lugar a ondas transversales: el macillo
en un piano golpea la cuerda y la desplaza transversalmente; lo mismo sucede al ser
152
frotada la cuerda de un violn con un arco o al ser pulsada la cuerda de una guitarra
con el dedo. En el caso de los instrumentos de viento, sin embargo, las ondas que se
producen son longitudinales, pues la oscilacin de las partculas de aire se produce
en la misma direccin en la que se propagan las variaciones de la presin, es decir, a
lo largo de la propia longitud de la masa de aire que est contenida en el tubo.
Para estudiar cmo se genera el sonido armnico me ha parecido oportuno tomar
como ejemplo un sistema constituido por una cuerda tensada que est ja en ambos
extremos, como puede ser la cuerda de un piano, de una guitarra o de cualquier otro
instrumento similar. Se trata de un sistema vibratorio unidimensional y transversal.
Dado que en las ondas transversales las partculas oscilan de forma perpendicular a la
direccin de propagacin, son ms fciles de observar que las ondas longitudinales,
donde la oscilacin de las partculas tiende a camuarse con el movimiento de la onda
que propaga la perturbacin. Aunque al estudiar el comportamiento de la cuerda
tensada nos centraremos en las ondas transversales, las ideas que vamos a examinar
pueden ser generalizadas al caso de las ondas longitudinales unidimensionales, como
las que se producen en el interior de los tubos de los instrumentos de viento.
As pues, con el propsito de permitir entender con facilidad cmo se producen las
ondas estacionarias y en qu consiste el fenmeno de la resonancia, he fabricado varios vdeos en los que se simula a cmara lenta el movimiento de una cuerda cuando
se provocan en ella diversas perturbaciones transversales. Supondremos que se trata
de una cuerda de piano sin encorchar de un metro de longitud como podra ser
cualquiera de las cuerdas que dan una nota en la octava que va de do3 a do4 y que
ha sido extrada del instrumento y sujetada por sus extremos a unos soportes que la
mantienen tensada. Supondremos tambin que estos soportes pueden ser desplazados
arriba y abajo mediante algn artilugio mecnico para inducir en la cuerda diversos
tipos de perturbaciones. La perturbacin se provocar mediante el desplazamiento
vertical del soporte izquierdo al que est unida la cuerda o, en alguna ocasin, de los
dos soportes. Una vez que la perturbacin haya sido introducida, los soportes volvern a quedar jos. A n de modelizar la inercia y la elasticidad, podemos considerar
que la cuerda est constituida por un conjunto de bolitas unidas por pequeas gomas
o muellecillos que se estiran y se encogen.
En el eje vertical de la grca que aparecen en los vdeos se representa el desplazamiento vertical de las partculas que suponemos forman la cuerda. Como nos interesa
153
observar el detalle de la perturbacin y de sus reejos e interferencias, las unidades del

eje vertical estn en milmetros. En el eje horizontal se representan las sucesivas posiciones de la cuerda a lo largo de su longitud. Las unidades en este caso, sin embargo,
estn en metros. Esta diferencia en las unidades hace que en los vdeos resulten muy
exageradas las deformaciones de la cuerda provocadas por su vibracin (tengamos
en cuenta que la cuerda real mide un metro y que la deformacin mxima que va a
sufrir es de dos milmetros), pero nos va a permitir ver con mucha ms facilidad los
fenmenos ondulatorios que se producen.
Por otra parte, como queremos observar con detenimiento el movimiento que se
genera en la cuerda, nos interesa que en nuestra simulacin la velocidad de propagacin de las perturbaciones sea sucientemente lenta. La velocidad con la que se
transmite cualquier perturbacin transversal en una cuerda real est determinada por
la tensin a la que est sometida y por la masa por unidad de longitud que posee. En
el caso de una cuerda de piano que emite una nota media (como puede ser el la3 ) la
velocidad de propagacin de una perturbacin transversal puede estar en torno a los
400 m/s. En nuestra simulacin, sin embargo, la velocidad con la que se propaga la
perturbacin a lo largo de la cuerda es de 1 metro por segundo, es decir, 400 veces
ms lenta que en la cuerda real. El movimiento vertical del soporte mediante el que
se generan las perturbaciones est ralentizado en esa misma proporcin.
Hay que tener en cuenta tambin que la cuerda de nuestro modelo se comporta de
forma ideal. En las simulaciones de los vdeos se ha prescindido del rozamiento con
el aire o con los soportes que la sujetan, por lo que no se produce ninguna amortiguacin en el movimiento de la cuerda. As mismo, supondremos que la cuerda
vibra siempre en el mismo plano en concreto, en el plano vertical arriba/abajo,
aunque las cuerdas de los instrumentos reales no se comportan siempre as (por ejemplo, en un piano de cola, como consecuencia de la accin del macillo que la golpea
desde abajo, la cuerda comienza a oscilar en la direccin arriba/abajo, pero durante
su vibracin tiende a rotar su plano de oscilacin y a oscilar tambin de izquierda a
derecha, en la direccin paralela al teclado).
Comenzaremos examinando cmo se propaga por la cuerda una perturbacin transversal y cmo esa perturbacin se reeja cuando llega a los extremos jos. Luego analizaremos lo que ocurre cuando intereren dos perturbaciones que viajan en sentidos
opuestos. Despus comprobaremos que las ondas estacionarias surgen de la interfe154
rencia de una onda sinusoidal con su reejo, cuando, en el tiempo que tarda una
oscilacin en completarse, la onda recorre exactamente una parte entera del camino
de ida y vuelta a lo largo de la cuerda. A continuacin veremos que la cuerda tensada,
en funcin de la velocidad de propagacin ondulatoria, posee unos modos normales
de vibracin propios, cuyas frecuencias siguen la serie armnica. Despus podremos
observar que, cuando una cuerda es excitada en cualquiera de esos modos de resonancia naturales, basta una mnima perturbacin para producir una gran ondulacin.
Y nalmente, podremos ver el movimiento de una cuerda cuando resuena simultneamente en varios de sus modos naturales de vibracin, como sucede habitualmente
en las cuerdas de los instrumentos musicales.
8.3.
Propagacin y reflexin de una perturbacin transversal sobre una cuerda
Para estudiar cmo se propaga una perturbacin transversal a lo largo de una cuerda
y cmo se reeja al llegar a un punto jo que le impide seguir en el mismo sentido, he
fabricado un vdeo en el que se simula el comportamiento de nuestra cuerda cuando
se introduce en ella una perturbacin de 1,5 milsimas de segundo de duracin.
Imaginemos que para iniciar la perturbacin hemos desplazado, con ayuda de un
artilugio mecnico, 1 mm hacia arriba el soporte al que est sujeta la cuerda por la
izquierda y luego lo hemos hecho descender hasta su posicin original. Dado que la
simulacin est ralentizada 400 veces, la duracin del impulso en el vdeo de nuestra
simulacin es de 0,6 segundos. Los 20 segundos que dura el vdeo corresponden a las
primeras 50 milsimas de segundo del movimiento de la supuesta cuerda real.
Para que se apreciara claramente en el vdeo que la perturbacin se invierte cuando se
reeja en los soportes jos de los extremos, interesaba que el impulso inicial fuera slo
hacia arriba, sin que al descender sobrepasara la posicin de equilibrio de la cuerda,
de manera que antes de reejarse por primera vez la perturbacin viajara slo por
la parte superior. Para ver cmo es el impulso que ha generado la perturbacin, es
decir, el movimiento vertical que ha realizado el soporte de la cuerda, presento una
grca que muestra el desplazamiento del soporte en funcin del tiempo.
155
Figura 8.1: Grca de la perturbacin introducida.
Podemos apreciar que el desplazamiento del soporte es simtrico y que tiene forma
de campana de Gauss. Las unidades del eje horizontal corresponden al tiempo de la
simulacin en el vdeo.
Veamos ahora el vdeo que simula el comportamiento de la cuerda.
Figura 8.2: Vdeo que simula la propagacin de una perturbacin en una cuerda tensada y su reejo
cuando alcanza un extremo jo.
156
Podemos observar en el vdeo que el movimiento vertical del soporte izquierdo provoca una perturbacin en la cuerda que se transmite a lo largo de ella por la parte
superior hasta alcanzar el soporte derecho. All la perturbacin, al no poder continuar, se reeja de modo invertido, regresando por la parte inferior hasta alcanzar el
soporte izquierdo, donde se vuelve a reejar para invertirse de nuevo y seguir por
la parte superior. Dado que no hemos contemplado ningn tipo de amortiguacin,
la propagacin de la perturbacin se repite constantemente, reejndose de modo
invertido cada vez que alcanza un extremo.
La propagacin de la perturbacin es consecuencia de la elasticidad de la cuerda. En nuestra simulacin podemos apreciar que la elasticidad introduce un retraso
en la comunicacin del movimiento de una bolita a la siguiente, de modo que las
bolitas van repitiendo sucesivamente, pero con su correspondiente demora, el desplazamiento vertical del impulso inicial, como podemos apreciar en el vdeo si atendemos al movimiento individual de cualquiera de ellas. De esta manera el movimiento
temporal que ha realizado el soporte, la campana de Gauss que hemos visto en la
gura 8.1, queda dibujado en el espacio. As mismo, la anchura de la perturbacin
que dibuja la cuerda depende tambin de los retrasos que introduce la elasticidad,
los cuales determinan la velocidad con la que se propaga cualquier perturbacin a
lo largo de esa cuerda. En la simulacin ralentizada de nuestro vdeo, dado que la
velocidad de transmisin es de 1 m/s y que el impulso dura 0,6 segundos, la anchura
de la deformacin provocada en la cuerda es de 0,6 metros.
La reexin se produce cuando la perturbacin que se transmite a lo largo de la
cuerda encuentra un obstculo que no puede mover. En nuestro caso, cuando la
perturbacin llega al extremo derecho de la cuerda no puede desplazar el soporte.
Puesto que, segn la Tercera Ley de Newton, la fuerza ejercida hacia arriba por la
cuerda sobre el soporte es la misma que la que el soporte ejerce hacia abajo sobre la
cuerda, el resultado es que el soporte, al no poder moverse, hace que la cuerda rebote
hacia abajo, con lo que la perturbacin se invierte y retorna por la parte inferior. La
misma situacin se repite cuando la cuerda llega de nuevo al soporte izquierdo, el
cual, una vez introducido el impulso inicial, ha quedado tambin jo. De nuevo la
perturbacin rebota y sigue su recorrido, ahora por la franja superior.
Podemos tambin interpretar el fenmeno de la reexin como el resultado de la
superposicin de dos perturbaciones simtricas que viajaran en sentido opuesto a lo
157
largo de dos cuerdas virtuales. Esta forma de entenderlo es ms intuitiva y nos sirve
para explicar los desplazamientos que sufre la cuerda en los momentos en los que se
solapa la perturbacin incidente y la reejada, lo cual nos va a facilitar el estudio de
las ondas estacionarias.
Estas dos cuerdas virtuales, que no estaran sujetas a ningn soporte, se prolongaran
por un espacio imaginario que existira ms all del obstculo jo en el que se reeja la
perturbacin real. La prolongacin sera igual a lo que mide la cuerda real, por lo que
las cuerdas imaginarias mediran el doble de sta. Por una de estas cuerdas imaginarias
viajara la perturbacin incidente, que se prolongara por el espacio imaginario sin
ser inuida por la existencia del obstculo; por la otra viajara en sentido opuesto
la perturbacin reejada, una perturbacin idntica a la real, pero invertida, que se
habra originado simultnea y simtricamente en esta segunda cuerda imaginaria. En
todo momento el desplazamiento de cada punto de la cuerda real sera el resultado
de la superposicin lineal de ambas cuerdas virtuales.
Entenderemos mejor esta idea si imaginamos que en el punto del espacio en el que se
halla el obstculo que la perturbacin no puede mover en nuestro caso, el soporte
derecho al que est jada la cuerda existiera una suerte de espejo que separara el
espacio real del espacio virtual. Veamos un vdeo de carcter didctico en el que se
ilustra lo que ocurre cuando la misma perturbacin del vdeo anterior se reeja en
el soporte derecho. Para poder apreciar los detalles, la velocidad del vdeo ha sido
ralentizada 5 veces respecto al anterior.
Figura 8.3: Vdeo que ilustra el reejo especular de una perturbacin que viaja por una cuerda
cuando alcanza un extremo jo.
158
En el vdeo podemos ver dos planos claramente diferenciados y separados por una
lnea blanca vertical que representa el espejo. A la izquierda aparece el plano de la
realidad, cuyo fondo est en color azul oscuro, el mismo color que el del resto de
los vdeos que simulan el comportamiento de la cuerda, y a la derecha est el plano
virtual, el del otro lado del espejo, en color gris.
La cuerda est representada en el mundo de la realidad por las mismas bolitas y gomillas que en el vdeo anterior. Las dimensiones coinciden: la longitud es de 1 metro y la
anchura de la perturbacin es de 0,6 metros. Junto a la cuerda, por encima y por debajo, vemos unas lneas de puntos que representan las cuerdas imaginarias por donde
viajan las perturbaciones virtuales. Ambas lneas deberan coincidir exactamente con
la cuerda, pero, para que resultara ms fcil distinguirlas, las he dibujado ligeramente
por encima y por debajo de la cuerda real. Por la lnea de arriba, en color amarillo,
va la perturbacin incidente, la que va de la realidad al espejo, la cual contina su camino cuando se encuentra con el soporte jo, como si no hubiera obstculo alguno.
Por la lnea de abajo, en color turquesa, viaja la perturbacin reejada, la originada
al otro lado del espejo y que se dirige al plano de la realidad.
Observamos que, a la vez que se introduce una perturbacin que afecta a la cuerda
real de nuestra simulacin y a la lnea de puntos amarilla, al otro lado del espejo se
inicia la misma perturbacin, pero invertida, una perturbacin que viaja por la lnea
de puntos de color turquesa con la misma velocidad que la perturbacin original.
Vemos que ambas perturbaciones siguen por su lnea de puntos como si no hubiera
ningn obstculo, atravesando en el mismo instante la separacin entre la realidad y
el mundo del espejo.
Vemos que la cuerda real, la que est formada por las bolitas, se comporta como si
fuera el resultado de sumar los desplazamientos de ambas perturbaciones virtuales, la
que va por la lnea de puntos amarilla y la que va por la lnea de puntos turquesa. Esto
es de especial inters para explicar lo que sucede en el tiempo en el que la perturbacin incidente y la reejada se solapan. Podemos apreciar que ambas perturbaciones,
la incidente y la reejada, alcanzan a la vez el soporte jo de la cuerda, es decir, la
frontera entre el mundo imaginario y el real, y a partir de ese momento empiezan
a solaparse hasta que cada una termina de pasar totalmente al otro lado. Esto ocurre porque ambas perturbaciones han sido producidas simultneamente a la misma
distancia del punto del reejo y viajan a la misma velocidad. As mismo, puesto que
159
una es la inversa de la otra, el valor de su superposicin en el punto en el que se

produce el reejo (es decir, el valor de la suma de sus desplazamientos individuales
en el extremos jo de la cuerda real) como era de esperar, es siempre cero.
8.4.
Superposicin de dos perturbaciones que viajan en sentido

opuesto sobre una cuerda
Examinaremos a continuacin el comportamiento de la cuerda cuando se cruzan

en ella dos perturbaciones que se desplazan en sentidos opuestos. He fabricado dos
vdeos en los que podemos ver que cuando las dos perturbaciones se solapan, sus
desplazamientos se suman, pero que, una vez han terminado de cruzarse, cada una
de ellas contina su camino sin sufrir ninguna modicacin, como si no hubiera
ocurrido nada.
En ambos vdeos las perturbaciones han sido ocasionadas por dos impulsos dados
simultneamente en los dos extremos de la cuerda mediante el desplazamiento vertical de los respectivos soportes. En el primer vdeo (el de la gura 8.4 y su repeticin
a cmara lenta en la gura 8.5) los dos impulsos desplazan la cuerda hacia arriba,
mientras que en el segundo vdeo (el de la gura 8.6) el impulso de la izquierda la
desplaza hacia arriba y el impulso de la derecha la desplaza hacia abajo. Por ello, en el
primer caso las dos perturbaciones intereren constructivamente, mientras que en el
segundo lo hacen destructivamente. Los impulsos son similares a los que hemos visto
en el vdeo anterior, es decir, tienen forma de campana de Gauss, y en la simulacin
ralentizada del vdeo tambin duran 0,6 segundos. La duracin de los dos vdeos es
de 20 segundos, y corresponden a las primeras 50 milsimas de segundo del movimiento de la cuerda real. Para facilitar la distincin de cada una de las perturbaciones,
ahora la amplitud de cada uno de los impulsos es diferente: el impulso izquierdo es
de 1 mm y la del derecho es de 0,7 mm.
Empezaremos observando cmo se producen las interferencias constructivas.
160
Figura 8.4: Vdeo que simula la interferencia constructiva de dos impulsos que viajan a lo largo de
una cuerda.
En este vdeo podemos ver que las perturbaciones provocadas en la cuerda por el
desplazamiento hacia arriba de ambos soportes viajan por la parte superior en sentidos
opuestos, se superponen cuando se cruzan, continan su camino sin alterarse y se
reejan al llegar a los extremos jos, viajando entonces ambas por la parte de abajo.
Para apreciar con detalle lo que sucede es necesario reconocer primero cada una de
las dos perturbaciones por separado. Puede servirnos de ayuda ralentizar la velocidad
del reproductor, tal como ocurre en el vdeo de la gura 8.5, que es una repeticin a
cmara lenta de los momentos iniciales del vdeo de la gura 8.4.
Figura 8.5: Momentos iniciales del vdeo de la gura 8.4 ralentizado cinco veces.
161
Este vdeo auxiliar est ralentizado cinco veces respecto al anterior, lo que signica
que la perturbacin que vemos viaja 2.000 veces ms despacio que la de la cuerda real.
Ahora podemos observar con ms facilidad que cada una de las dos perturbaciones,
cuando no se solapa con la otra, mantiene la amplitud con la que ha sido generada:
la que procede de la izquierda es siempre de 1 mm y la que procede de la derecha es
siempre de 0,7 mm. Vemos tambin que la perturbacin ms amplia, la que procede
de la izquierda, circula de izquierda a derecha cuando va por la franja superior y
de derecha a izquierda cuando va por la inferior, mientras que la perturbacin ms
pequea, la que procede de la derecha, circula de derecha a izquierda cuando viaja
por la franja inferior y de izquierda a derecha cuando lo hace por la franja superior.
Dicho de otra forma, la perturbacin mayor sigue siempre el sentido de las agujas
del reloj y la menor el sentido contrario al de las agujas del reloj.
Una vez que hemos identicado ambas perturbaciones, podemos observar que cuando se cruzan el desplazamiento que sufre cada punto de la cuerda es la suma de
los desplazamientos que hubiera provocado en ella cada una de las perturbaciones por separado, es decir, las dos perturbaciones se superponen linealmente.
Como ambas perturbaciones viajan siempre por la misma franja del espacio, las dos
por arriba o las dos por abajo, intereren entre s de manera constructiva. Y puesto
que las dos perturbaciones han comenzado a la vez y se propagan a la misma velocidad, necesariamente se cruzan en la mitad de su camino, en el punto que est a
0,5 m, y es en ese punto donde la perturbacin resultante alcanza su desplazamiento
mximo. Dado que la amplitud de la perturbacin iniciada en el soporte izquierdo
es de 1 mm y la provocada por el soporte derecho es de 0,7 mm, la amplitud mxima
de la perturbacin resultante es de 1,7 mm, que corresponde a un desplazamiento ascendente de la cuerda cuando las perturbaciones se encuentran en la franja superior
o a un desplazamiento descendente cuando se encuentran en la franja inferior. Una
vez superado su solapamiento cada una de las perturbaciones sigue su camino conservando su individualidad. Hemos podido observar que, como consecuencia de la
elasticidad, la perturbacin se sigue transmitiendo a travs de las fuerzas que ejercen
unas bolitas sobre las siguientes, por lo que, cuando cesa la coincidencia de ambas
perturbaciones, cada una sigue su camino.
Veamos ahora el vdeo en el que podemos observar cmo se producen las interferencias destructivas.
162
Figura 8.6: Vdeo que simula la interferencia destructiva de dos impulsos que viajan a lo largo de
una cuerda.
Este vdeo solo se diferencia del de la gura 8.4 en que ahora los dos impulsos se
dan en sentidos verticales opuestos: mientras que el impulso del soporte izquierdo
desplaza la cuerda hacia arriba de su posicin de equilibrio, el del soporte derecho
la desplaza hacia abajo. Esto hace que las perturbaciones no solo viajen en sentidos
opuestos a lo largo de la cuerda, sino que los desplazamientos verticales provocados
por las perturbaciones siempre sean opuestos. Podemos observar que ambas perturbaciones se desplazan ahora en el sentido de las agujas del reloj, pero que cuando
una se propaga por la franja superior, la otra lo hace por la inferior, y viceversa. Por
eso, cuando ambas se cruzan en el punto central de la cuerda, el desplazamiento que
sufre sta es la diferencia de las amplitudes de ambas perturbaciones. Podemos apreciar que cuando la superposicin de las dos perturbaciones coincide plenamente, el
desplazamiento del punto central de la cuerda es de 0,3 mm (1 0,7 = 0,3), hacia
arriba o hacia abajo en funcin de la franja por la que circulen las perturbaciones.
Tambin ahora vemos que, una vez que ha concluido el cruce, cada perturbacin
sigue su camino sin haber sufrido ninguna alteracin, hasta reejarse en el extremo
correspondiente.
163
8.5.
Formacin de ondas estacionarias sobre una cuerda
Una vez que hemos estudiado la propagacin, la reexin y la superposicin de las

perturbaciones que viajan sobre una cuerda ja, estamos en condiciones de comprender cmo y en qu circunstancias se crean las ondas estacionarias. Y puesto que
los sonidos musicales son el resultado de un conjunto armnico de ondas estacionarias, entender cmo se producen estas ondas nos permitir conocer verdaderamente
qu es el sonido musical.
Un movimiento ondulatorio transmite una perturbacin de un lugar a otro del espacio, es decir, por naturaleza es viajero. Ahora bien, cuando una onda sinusoidal
queda atrapada en algn cuerpo o en alguna regin del espacio como puede ser la
cuerda de una guitarra o la columna de aire de una auta, las sucesivas interferencias de la onda con su reejo pueden hacer que su carcter viajero quede disimulado
y parezca que la onda se hubiera detenido. En ese momento, el cuerpo o el volumen
de aire de la regin del espacio en el que la onda ha quedado encerrada comienza a
oscilar y la onda viajera se transforma en onda estacionaria.
A continuacin vamos examinar, mediante varios vdeos que he fabricado para ello,
cmo surgen las ondas estacionarias en la cuerda que nos est sirviendo de modelo.
Dado que las ondas estacionarias son el resultado de la superposicin de las sucesivas reexiones de una onda sinusoidal, vamos a introducir en la cuerda oscilaciones
sinusoidales, en lugar del impulso gaussiano que hemos utilizado en los vdeos anteriores. Para ello, supondremos que mediante un artilugio mecnico obligamos al
soporte que sujeta el extremo izquierdo de la cuerda a realizar un Movimiento Armnico Simple (MAS).
Nuestro objetivo va a ser comprobar que, cuando se introduce una oscilacin
sinusoidal en una cuerda concreta denida por su longitud y por la velocidad
con la que se propagan en ella las perturbaciones transversales, slo se producirn ondas estacionarias si la longitud de la onda creada coincide con el doble
de la longitud de la cuerda o si es una parte entera de esta medida. O dicho
de otra manera, se generarn ondas estacionarias cuando dentro de la longitud de
la cuerda quepan exactamente un nmero entero de semiondas sinusoidales. En los
vdeos de este apartado podremos observar que esto solamente sucede cuando en el
164
tiempo que tarda en completarse una oscilacin sinusoidal, la onda recorre exactamente el camino de ida y vuelta a lo largo de la cuerda o una parte entera de este
camino. Veremos, as mismo, que las frecuencias de las ondas estacionarias que se
pueden producir en una cuerda dada siguen la serie armnica, pues todas ellas
son mltiplos de la frecuencia fundamental, que es la frecuencia de la onda
estacionaria cuya longitud es el doble de la longitud de la cuerda.
Recordemos que la cuerda ideal sobre la que estamos haciendo la simulacin mide
un metro de longitud y que la velocidad con la que se propaga por ella cualquier
perturbacin transversal es de 400 m/s. Por ello, en los vdeos ralentizados 400 veces, la velocidad de la propagacin de la onda que observaremos ser de 1 m/s, y la
duracin de 20 segundos corresponder a las primeras 50 milsimas de segundo de
la vibracin real. En los vdeos ralentizados 2.000 veces, la velocidad de propagacin
ser de 0,2 m/s y la duracin de 30 segundos representar las primeras 15 milsimas de segundo del movimiento real de la cuerda. En todos ellos la amplitud de las
oscilaciones sinusoidales introducidas es de 1 mm.
8.5.1.
Reflexin de una onda sinusoidal cuya longitud no es una parte entera

del doble de la longitud de la cuerda
Pero antes de estudiar las ondas estacionarias vamos a examinar cmo se produce la
reexin de una onda sinusoidal en un extremo jo de la cuerda cuando la longitud
de la onda introducida no es una parte entera del doble de la longitud de la cuerda.
Como lo que nos interesa ahora es ver lo que sucede al solaparse la onda incidente
con la reejada, elegiremos una onda cuya longitud sea menor que la longitud de la
cuerda. De esta manera, podremos apreciar por separado los momentos en los que se
produce el solapamiento de las dos ondas (la incidente y la reejada) y los momentos
en los que solo est presente una de ellas. Por ello, he elegido una onda cuya longitud
es de 0,6 metros, la misma que la del impulso gaussiano de los apartados anteriores.
El periodo de la oscilacin introducida tendr que ser, por lo tanto, de 1,5 ms. En
efecto, dado que la velocidad de propagacin de las perturbaciones transversales en
nuestra cuerda es de 400 m/s, cuando la oscilacin del soporte termine, la onda habr
recorrido 0,6 m (0,0015 x 440 = 0,6). Aunque no sea relevante en este caso, este
165
periodo corresponde, redondeando a dcimas de hercio, a una frecuencia de 666,7

Hz.
As pues, he confeccionado un vdeo en el que se simula el comportamiento de nuestra cuerda ideal cuando introducimos en ella esta nica oscilacin sinusoidal de 1,5
ms de periodo. Puesto que este vdeo est ralentizado 400 veces, la duracin de la
oscilacin inicial que observaremos en l ser de 0,6 segundos.
Figura 8.7: Vdeo que simula ralentizada 400 veces la propagacin a lo largo de una cuerda de
una perturbacin sinusoidal cuya longitud de onda es inferior a la longitud de la cuerda y no es una
parte entera del doble de esta longitud.
En el vdeo vemos que una perturbacin en forma de onda sinusoidal que ha sido
generada por el desplazamiento vertical del soporte izquierdo recorre ininterrumpidamente la longitud de la cuerda, reejndose de forma invertida cada vez que
alcanza uno de los extremos jos. A diferencia de los vdeos anteriores, ahora nos
sorprende el carcter articial del movimiento que realiza la cuerda. Ello se debe a la
introduccin repentina de una nica oscilacin sinusoidal y a su cese instantneo, sin
transicin alguna, ni al comienzo ni al nal. Aunque he procurado dotar de la mayor
verosimilitud posible al movimiento de la cuerda, no podemos olvidar que estamos
ante una simulacin de carcter didctico, en la que es necesario aislar el fenmeno
que nos interesa estudiar, aun a consta de una apariencia articiosa.
166
Distinguimos en el vdeo dos situaciones claramente diferenciadas: los momentos en

los que la onda va y viene por el medio de la cuerda y los momentos en los que esa
onda se deforma, dando lugar a una fugaz semionda, cuando se reeja en los soportes
de los extremos. Respecto a los primeros, no hay nada que no hayamos visto antes.
Observamos cmo la oscilacin provocada por el movimiento armnico simple que
ha realizado el soporte, se dibuja en la cuerda en forma de onda sinusoidal. Si pensamos en los tiempos en los que suceden los acontecimientos en el vdeo, podemos
vericar tambin que la longitud de la onda introducida es de 0,6 metros. Puesto que
la velocidad con la que se propagan las perturbaciones en la cuerda del vdeo es de 1
m/s, en los 0,6 segundos que ha tardado la oscilacin en completarse, la onda introducida habr recorrido 0,6 m. En efecto, si detenemos el vdeo en cualquier instante
en el que la onda se encuentre en una posicin intermedia, podremos comprobar
que su longitud es de 0,6 metros.
Como lo que nos interesa ahora en particular es estudiar lo que sucede en los momentos en los que se produce la reexin de la onda en cada uno de los soportes
jos en los que termina la cuerda, he fabricado un vdeo auxiliar con el movimiento
de la cuerda ralentizado 5 veces ms que en el vdeo anterior. En l se representan
tambin las dos cuerdas imaginarias que hemos visto en el vdeo de la gura 8.3, pues
nos sirven para interpretar la reexin como la superposicin de dos ondas virtuales,
la incidente y la reejada, que viajaran por ellas.
Figura 8.8: Vdeo que simula ralentizada 2.000 veces la propagacin a lo largo de una cuerda de
una perturbacin sinusoidal cuya longitud de onda es inferior a la longitud de la cuerda y no es una
parte entera del doble de esta longitud, con el aadido de dos cuerdas virtuales que ilustran lo que
sucede en la reexin.
167
Igual que en el vdeo anterior, vemos que sobre la cuerda real representada por las
bolitas unidas por muellecillos se desplaza una onda sinusoidal que se reeja cada
vez que alcanza uno de los extremos jos. Vemos tambin dos cuerdas virtuales que
no estn sujetas a ningn soporte y que, como en el vdeo de la gura 8.3, debemos
imaginar prolongndose por ambos lados a travs de un espacio imaginario que no
est representado en este vdeo. Por la cuerda amarilla viaja, de izquierda a derecha,
la perturbacin original en los primeros segundos del vdeo, y luego los sucesivos
reejos que se producen en el soporte izquierdo (esto es, las ondas sinusoidales provenientes del otro lado del hipottico espejo situado a la izquierda de la cuerda). Por
la cuerda turquesa viajan, de derecha a izquierda, las ondulaciones reejadas en el
soporte derecho (es decir, las ondas que llegan desde el espacio imaginario de la derecha), las cuales son del mismo periodo, amplitud y longitud de onda que las de la
cuerda amarilla, pero invertidas. Ya he explicado, a propsito del vdeo de la gura
8.3, la razn por la que la suma de los desplazamientos de las cuerdas auxiliares en los
puntos extremos jos es siempre cero.
Ahora vamos a prestar atencin a lo que sucede cuando se produce la superposicin
entre la onda incidente y la reejada en los extremos jos de la cuerda. Si nos jamos en el soporte de la derecha, vemos que en el momento en el que la onda que
viaja por la cuerda amarilla comienza a atravesar el soporte, tambin lo hace la onda
turquesa que, invertida, proviene del otro lado del supuesto espejo. Como una onda
es la inversa de la otra y ambas viajan a la misma velocidad en sentidos opuestos,
en el momento en el que ambas estn a la mitad del cruce, las dos, que en ese momento tienen la forma de una semionda sinusoidal inferior, coinciden exactamente.
Lo mismo sucede en el soporte derecho, con la nica diferencia de que, en ese caso,
las semiondas que coinciden son las superiores. En ambos momentos, vemos que la
cuerda adquiere su desplazamiento mximo, hacia abajo o hacia arriba, respectivamente.
Veamos una instantnea de este ltimo vdeo que representa un momento inmediatamente anterior a producirse la coincidencia exacta de las dos ondas virtuales cuando
se cruzan en el soporte derecho (si fuera en el momento exacto no podramos distinguir las dos cuerdas virtuales, pues coincidiran exactamente).
168
Figura 8.9: Instantnea del vdeo de la gura 8.8 en el momento anterior a producirse la coincidencia
entre la semionda incidente y la reejada.
En la gura podemos observar que en el momento de la coincidencia, tanto la onda

incidente como la reejada tienen la forma de una semionda sinusoidal inferior. Teniendo en cuenta que la suma de dos ondas sinusoidales de la misma fase es tambin
una onda sinusoidal de la misma fase cuya amplitud es la suma de las amplitudes de las
dos ondas componentes, la cuerda real adquiere tambin la forma de una semionda
sinusoidal de la misma fase, cuya amplitud es el doble de la de las ondas virtuales. En
la grca vemos que la semionda formada en la cuerda real, la de las bolitas, tiene una
amplitud de 2 mm, el doble de la que tiene la onda cuando no est solapada.
Resumiendo, mediante los vdeos de las guras 8.7 y 8.8 hemos podido observar
que las semiondas creadas en la cuerda real en cada reflexin duran solamente
un instante, pues a continuacin esa semionda fugaz se diluye y se dibuja de
nuevo en la cuerda la forma de la onda completa. As pues, la onda sigue siendo
viajera, pues en esta cuerda la oscilacin introducida no ha generado una onda
estacionaria.
169
8.5.2.
Generacin de una onda estacionaria en el modo fundamental de vibracin
A continuacin examinaremos lo que sucede al introducir en la cuerda, mediante

el desplazamiento vertical del soporte izquierdo, una oscilacin de un periodo tal
que sea capaz de generar en ella una onda sinusoidal de longitud doble de lo que
mide la cuerda. Veremos que cuando la onda termine de realizar por primera
vez su recorrido de ida y vuelta a lo largo de la cuerda, su carcter viajero
quedar enmascarado y la cuerda entera comenzar a oscilar de forma unitaria,
realizando un movimiento armnico simple de la misma frecuencia que la de
la oscilacin inicial que la ha generado. Cuando esto ocurre decimos que se ha
producido una onda estacionaria en el modo fundamental de vibracin o primer
modo.
Para generar una onda estacionaria de estas caractersticas en la cuerda que nos sirve
de modelo (que, recordemos, mide 1 metro y tiene una velocidad de propagacin de
400 m/s), la longitud de la onda sinusoidal que viaje por ella deber tener 2 metros
y, por lo tanto, el periodo de la oscilacin inicial que deberemos introducir tendr
que ser de 5 milsimas de segundo. En efecto, en 5 ms la onda habr recorrido los 2
metros que mide el camino de ida y vuelta a lo largo de la cuerda (440 x 0,005 = 2).
La frecuencia de la oscilacin ser, pues, de 200 Hz (1/0,005 = 200).
Como en los casos anteriores, he fabricado un vdeo que reproduce, ralentizado 400
veces, el movimiento de la cuerda en estas condiciones. El periodo de la oscilacin
inicial que observaremos en el vdeo ser, por lo tanto, de 2 segundos y su frecuencia
de 0,5 Hz. La velocidad de propagacin que veremos ser de 1 m/s.
170
una perturbacin sinusoidal cuya longitud de onda es el doble de la longitud de la cuerda.
Al igual que en el vdeo de la gura 8.7, como consecuencia de la superposicin

de la onda con su reejo, se crea en la cuerda una semionda sinusoidal inferior. La
diferencia reside en que ahora la semionda abarca la cuerda entera y en que la cuerda
conserva la forma de semionda durante toda la duracin del vdeo, alternndose entre
semionda inferior y semionda superior. Aparentemente ya no se transmite ninguna
perturbacin por la cuerda; en su lugar, oscila la cuerda en su conjunto como un
todo, repitiendo toda ella el movimiento oscilatorio que ha sido introducido por el
soporte. La onda ha dejado de viajar a lo largo de la cuerda y se ha transformado en
una onda estacionaria. La frecuencia con la que oscila la cuerda es la misma que la
de la oscilacin que la ha generado, en nuestro vdeo, que est ralentizado 400 veces,
es 0,5 Hz. En efecto, podemos observar que cada 2 segundos la cuerda realiza una
oscilacin completa.
Vemos tambin que, una vez formada la onda estacionaria, cada punto de la cuerda
oscila de forma sinusoidal, en fase con todos los dems, con una amplitud que es
siempre la misma para cada punto y que depende nicamente de su posicin en
la cuerda. Observamos que los puntos extremos permanecen jos y que el punto
situado en la mitad de la cuerda es el que alcanza la mayor amplitud.
La pregunta que tenemos que responder ahora es: Por qu se ha producido esto?
Para entender con ms detalle lo que ocurre vamos a ver un vdeo que describe,
cinco veces ms despacio que el vdeo anterior, los momentos iniciales en los que se
171
crea la onda estacionaria. En l aparecen las cuerdas virtuales que hemos visto antes
y que nos van a ayudar a entender cmo las constantes interferencias entre las ondas
reejadas en ambos extremos jos dan lugar a la onda estacionaria.
Figura 8.11: Vdeo que simula ralentizada 2.000 veces la propagacin a lo largo de una cuerda
de una perturbacin sinusoidal cuya longitud de onda es el doble de la longitud de la cuerda, con el
aadido de dos cuerdas virtuales que ilustran lo que sucede en la reexin.
Con ayuda de las cuerdas virtuales auxiliares, en el vdeo podemos ver que lo que est
sucediendo por debajo de esa apariencia de estabilidad es que los sucesivos reejos
de la onda viajera estn interriendo entre s, dando lugar a la formacin de esa
onda que parece haberse detenido. En el vdeo vemos que, como consecuencia de los
sucesivos reejos, la onda sinusoidal amarilla viaja ininterrumpidamente de izquierda
a derecha, y la turquesa de derecha a izquierda.
En los momentos iniciales del vdeo, podemos apreciar que cuando la onda incidente,
la de color amarillo, alcanza el soporte derecho, comienza a surgir invertida la onda
reejada, la de color turquesa. Como he explicado a propsito del vdeo de la gura
8.8, cuando ambas ondas imaginarias completan la mitad de su recorrido, coinciden
plenamente y la cuerda real, la de las bolitas, adquiere la forma de una semionda
sinusoidal inferior. Dado que, en este caso, la longitud de la onda es de 2 metros, la
semionda abarca la longitud entera de la cuerda y, por lo tanto, se termina de formar
en el instante exacto en el que el soporte izquierdo ha completado su oscilacin. Esta
coincidencia que se produce como consecuencia de que el periodo de la oscilacin
172
introducida y la velocidad de propagacin de la cuerda dan lugar a una onda de

longitud doble que la de la cuerda es la causa de que la cuerda comience a oscilar
de forma unitaria y se cree una onda estacionaria en el primer modo de vibracin.
Veamos en la gura de abajo el momento inmediatamente anterior a la formacin
de esta semionda sinusoidal.
Figura 8.12: Instantnea del vdeo de la gura 8.11 en el momento anterior a producirse la coincidencia entre la semionda incidente y la reejada.
Vemos que la cuerda entera est a punto de adquirir la forma de una semionda sinusoidal y que, al coincidir las dos ondas virtuales, su amplitud alcanza el valor mximo,
2 mm.
Tenemos que entender ahora por qu esta forma que adquiere la cuerda no se diluye,
como en el caso del vdeo de la gura 8.8, sino que la ondulacin de la cuerda va
modicando su amplitud y alternando su forma entre una semionda inferior y una
semionda superior.
Para ello, tenemos que tener presente que la suma de dos ondas sinusoidales de la
misma longitud de onda es otra onda sinusoidal de esa misma longitud, cuya amplitud depende de la diferencia de fase entre las dos ondas componentes. Al viajar las
dos ondas en direccin opuesta, el desplazamiento hacia la derecha de la onda que va
173
por la cuerda amarilla es compensado por el desplazamiento hacia la izquierda de la

onda turquesa, por lo que la cuerda real, la de las bolitas, siempre conserva la misma
fase, manteniendo, por lo tanto, la forma de una semionda sinusoidal. Puesto que las
dos ondas auxiliares viajan a la misma velocidad en direcciones opuestas, siempre se
cruzan en el medio, pasando de coincidir plenamente, cuando ambas cuerdas virtuales forman una semionda inferior o superior, a oponerse por completo, dando lugar
a que la cuerda adquiera, en el instante en el que pasa por la posicin de equilibrio,
la forma rectilnea.
Dicho de otra manera, las cuerdas auxiliares pasan continuamente de estar en fase
a estar en oposicin de fase. Pero siempre los adelantos de una se compensan con
los retrasos de la otra, por lo que la resultante, la de la cuerda real, es siempre una
semionda inferior o una semionda superior, segn sea la zona en la que coincidan
las ondas virtuales. Los desfases entre las ondas virtuales se traducen en diferencias
de amplitud de la onda resultante: cuando ambas estn en fase es decir, cuando
coinciden la amplitud es mxima, como hemos visto en la gura 8.12; conforme
se desfasan, yendo una hacia la derecha y la otra hacia la izquierda, la amplitud de la
cuerda real disminuye; y cuando llegan a estar en oposicin de fase, la amplitud se
anula y en ese instante la cuerda recobra su forma rectilnea, como se puede ver en
la gura de abajo.
Figura 8.13: Instantnea del vdeo de la gura 8.11 en el momento anterior a producirse la oposicin
entre la semionda incidente y la reejada.
174
Por otra parte, dado que el desplazamiento de cualquier punto de la cuerda real es
la suma de los desplazamientos de los puntos correspondientes de la onda incidente
y la reejada, en toda onda estacionaria hay puntos cuyo desplazamiento es siempre
nulo y otros cuyo desplazamiento alcanza el valor mximo. Los puntos que son jos
se denominan nodos, y en este modo fundamental de vibracin son slo los puntos
extremos de la cuerda. Los puntos que oscilan con una amplitud mxima se denominan vientres o antinodos, y en este modo, slo lo es el punto medio, aqul en el que
siempre se cruzan las dos ondas virtuales. La amplitud con la que oscila este punto es
el doble de la amplitud de la oscilacin introducida, en este caso podemos ver que es
de 2 mm.
As pues, el modo primero de vibracin se caracteriza porque la cuerda entera
oscila de forma unitaria. En consecuencia, tiene un solo vientre en el punto
central de la cuerda y dos nodos que estn situados en los puntos extremos.
La frecuencia de este primer modo de vibracin es la que corresponde a una
longitud de onda doble de la longitud de la cuerda. En nuestra cuerda ideal, sobre la que estamos realizando la simulacin, la frecuencia de este primer modo de
vibracin es de 200 Hz.
8.5.3.
Generacin de ondas estacionarias en los modos de vibracin armnicos
Ahora vamos a comprobar que tambin se producen ondas estacionarias en nuestra cuerda cuando la oscilacin que introducimos al desplazar el soporte izquierdo
da lugar a una onda cuya longitud es una parte entera del doble de la longitud de
la cuerda. O, dicho de otra manera, cuando introducimos oscilaciones sinusoidales
cuyo periodo es tal que, al reejarse la perturbacin en los extremos jos de la cuerda, se crean un nmero entero de semiondas. Para que este requisito se cumpla, el
periodo de las oscilaciones iniciales tendr que ser la mitad, la tercera parte, la cuarta
parte o cualquier parte entera del periodo que ha producido la onda estacionaria en el
modo de vibracin fundamental. Por ello, la frecuencia de estas oscilaciones iniciales
que ser la misma con la que oscilar la cuerda cuando se formen en ella las ondas
estacionarias tendr que ser el doble, el triple, el cudruple o cualquier otro mlti-
175
plo entero de la frecuencia fundamental de vibracin. Ello explica que estos modos
naturales de vibracin se denominen armnicos.
Vamos a detenernos a continuacin en observar cmo se produce el segundo modo
de vibracin y luego generalizaremos los conceptos aprendidos al resto de los modos
armnicos.
Para lograr que nuestra cuerda ideal se ponga a vibrar en el segundo modo de vibracin, la longitud de la onda que deberemos generar tendr que ser de 1 metro.
Por ello, el periodo con el que deber oscilar el soporte izquierdo para introducir la
perturbacin tendr que ser de 2,5 ms. En efecto, dado que la velocidad de la cuerda
es de 400 m/s, en 2,5 ms la onda habr recorrido 1 metro (400 x 0,0025 = 1). La
frecuencia de la oscilacin inicial ser, por lo tanto, de 400 Hz. Tenemos que tener
en cuenta tambin que, para que se produzca el solapamiento de la onda incidente
con la reejada en el segundo modo de vibracin, deberemos introducir en la cuerda
dos oscilaciones completas.
He fabricado un vdeo que simula el comportamiento de nuestra cuerda ideal cuando
se introducen en ella dos oscilaciones sinusoidales de ese periodo de 2,5 ms. Tambin
ahora el movimiento de la cuerda est ralentizado 400 veces, con lo cual el periodo
de la oscilacin que observaremos ser de 1 segundo y su frecuencia, por lo tanto, de
1 Hz.
una perturbacin sinusoidal cuya longitud de onda es la misma que la longitud de la cuerda.
176
En el vdeo podemos observar que en el mismo instante en el que el soporte izquierdo ha terminado de realizar las dos oscilaciones y se ha quedado jo, en la cuerda se
han formado dos semiondas, una inferior y otra superior, es decir, se ha creado una
onda sinusoidal entera. De modo similar a lo que hemos visto en el caso de la onda
estacionaria en el modo fundamental de vibracin, a partir de ese momento desaparece el carcter viajero de la onda y la cuerda comienza a oscilar. La diferencia reside
en que ahora oscila como si estuviera dividida en dos partes. La forma que adquiere
la cuerda en su oscilacin es la de una onda completa.
Ahora hay un nuevo punto jo, un nodo, que est en el medio de la cuerda (con lo
que en total hay tres nodos), y dos puntos de desplazamiento mximo, dos antinodos
o vientres, que estn en la mitad de cada semionda, uno a 0,25 m y el otro a 0,75
m.
La frecuencia con la que vemos oscilar la cuerda en este vdeo es el doble de la que
tena en el anterior: ahora es de 1 Hz, que corresponde, en la cuerda de la realidad,
a 400 Hz. Esta frecuencia es la misma que la de las oscilaciones iniciales que han
generado la onda estacionaria.
Dado que en el modo segundo de vibracin la cuerda adquiere la forma de una
onda sinusoidal completa, podremos apreciar ms claramente cmo surge una onda
estacionaria. Para verlo con ms detalle he fabricado un vdeo con los momentos
iniciales del movimiento de la cuerda, ralentizados 5 veces respecto al vdeo anterior
o, lo que es lo mismo, 2.000 veces respecto al movimiento de la cuerda real. Este vdeo
corresponde a las primeras 15 milsimas de segundo del movimiento de la cuerda
real. Tambin ahora la cuerda real, representada por las bolitas, va acompaada de
las cuerdas virtuales auxiliares, la amarilla y la azul turquesa.
177
Figura 8.15: Vdeo que simula ralentizada 2.000 veces la propagacin a lo largo de una cuerda de
una perturbacin sinusoidal cuya longitud de onda es la misma que la longitud de la cuerda, con el
aadido de dos cuerdas virtuales que ilustran lo que sucede en la reexin.
Puesto que ahora la longitud de la onda es la misma que la de la cuerda, podemos

observar que justamente cuando la perturbacin inicial que viaja de izquierda a
derecha por la cuerda auxiliar amarilla alcanza el soporte derecho, se termina de
formar en la cuerda una onda sinusoidal completa. Luego, justo cuando empieza a
surgir en la cuerda la segunda ondulacin sinusoidal desde el soporte izquierdo, esa
primera perturbacin se reeja en el soporte derecho y regresa invertida, de derecha
a izquierda, por la cuerda virtual turquesa. Podemos ver despus que, en el instante
en el que la primera onda ha terminado de recorrer el camino de ida y vuelta a lo
largo de la cuerda y ha alcanzado de nuevo el soporte izquierdo, la segunda onda ha
llegado al soporte derecho. En ese mismo instante, la onda incidente y la reejada
coinciden plenamente y la cuerda real dibuja la forma entera de una onda o, lo que es
lo mismo, la de dos semiondas opuestas consecutivas. En la gura de abajo se muestra
el instante previo a esta coincidencia.
178
Figura 8.16: Instantnea del vdeo de la gura 8.15 en el momento anterior a producirse la coincidencia entre la onda incidente y la reejada.
En la gura podemos apreciar que en ese instante las cuerdas virtuales prcticamente
coinciden, con lo que, al sumarse los desplazamientos de ambas, el desplazamiento
vertical de cada uno de los puntos de la cuerda real alcanza su valor mximo, dando
como resultado una onda sinusoidal cuya amplitud es el doble de la amplitud de la
oscilacin introducida, es decir, 2 mm.
Si volvemos al vdeo de la gura 8.15, podemos jarnos en que, a partir del momento en el que la cuerda adquiere la forma de una onda completa, el desplazamiento
hacia la derecha de la onda virtual incidente la que viaja por la cuerda amarilla
es compensado por el desplazamiento hacia la izquierda de la onda virtual reejada
la que viaja por la cuerda turquesa, de modo que desde ese momento la cuerda,
que parece estar dividida en dos partes, oscila de forma estable, como si ya no se
propagara ninguna perturbacin por ella.
Atendamos ahora a lo que ocurre cuando la cuerda oscila. Nos damos cuenta de que
pasa por dos situaciones extremas. Una es el momento en el que las cuerdas auxiliares
coinciden completamente, con lo que la ondulacin de la cuerda real alcanza su
mxima amplitud, como hemos visto en la gura 8.16; otra es el momento en el
que las cuerdas virtuales estn en oposicin de fase, con lo que los desplazamientos
179
de todos los puntos de la cuerda se anulan y sta pasa por su posicin de equilibrio,
como podemos ver en la gura de abajo.
Figura 8.17: Instantnea del vdeo de la gura 8.15 en el momento anterior a producirse la oposicin
entre la onda incidente y la reejada.
En el vdeo de la gura 8.15 podemos apreciar que, como consecuencia tambin de

que ambas ondas virtuales se desplazan a la misma velocidad en sentidos opuestos,
se cruzan siempre en los mismos puntos y se oponen siempre en los mismos puntos.
Dado que el desplazamiento de cualquier punto de la cuerda real es la suma de los
desplazamientos de los puntos correspondientes de las cuerdas virtuales, los puntos en
los que stas se cruzan oscilan con la mxima amplitud y son los vientres o antinodos
de la onda estacionaria, mientras que los puntos en los que siempre se oponen permanecen jos y constituyen los nodos. En la gura 8.17 podemos ver que las ondas
virtuales se cruzan en 0,25 m y 0,75 m, que corresponden a los vientres de la onda
real que hemos visto en el vdeo, y se oponen en 0 m, 0,5 m y 1 m, que corresponden
a los nodos de la onda real.
Podemos generalizar las ideas que hemos visto respecto al primero y segundo modo
de vibracin a cualquier caso en el que la frecuencia de las oscilaciones iniciales sea
mltiplo de la frecuencia del modo fundamental. En cualquiera de esos modos de
180
resonancia armnicos, la longitud de la onda generada por la oscilacin inicial ser

necesariamente una parte entera del doble de la longitud de la cuerda (que, recordemos, coincide con la longitud de la onda en el modo de resonancia fundamental),
de forma que la cuerda entera oscilar dividida en tantas partes como semiondas se
puedan formar en ella.
En el vdeo de abajo se simula la generacin de una onda estacionaria en el tercer
modo de vibracin. El periodo de las oscilaciones introducidas tendr que ser, en este
caso, la tercera parte del periodo necesario para producir la onda estacionaria en el
modo fundamental, es decir, 5/3 ms. Por ello, la frecuencia correspondiente ser el
triple de la frecuencia fundamental, esto es, 600 Hz, si bien, al estar el vdeo ralentizado 400 veces, la frecuencia que observaremos en l ser de 1,5 Hz. La longitud
de la onda ser tambin la tercera parte del doble de la longitud de la cuerda, esto
es, 2/3 m, es decir, redondeando a milmetros, 0,667 m. Para que se solapen completamente la onda introducida con su reejo necesitaremos ahora tres oscilaciones
iniciales.
una perturbacin sinusoidal cuya longitud de onda es la tercera parte del doble de la longitud de la
cuerda.
Podemos observar que, al terminar de completarse las tres oscilaciones iniciales del
soporte, la cuerda comienza a vibrar sin que parezca que se propague ya ninguna
perturbacin por ella. En este caso la cuerda adquiere la forma de tres semiondas si181
nusoidales, consecutivas y opuestas, que oscilan al ritmo de la frecuencia introducida.

Vemos que en este modo estacionario de vibracin se forman 4 nodos en los puntos 0, 0,3333, 0,6666 y 1, que dividen la cuerda en tres partes, y tres vientres entre
los nodos. Puesto que la frecuencia que resulta es el triple de la del modo primero de
vibracin, cuando es excitado este modo, producir el tercer armnico.
Algo parecido podramos hacer para generar el cuarto modo de vibracin, con la
diferencia de que deberamos introducir cuatro oscilaciones. En ese caso el periodo
de la oscilacin introducida deber ser la cuarta parte del periodo fundamental y su
frecuencia, cudruple, es decir, deber tener un periodo de 1,25 ms y, por lo tanto,
una frecuencia de 800 Hz. Ello dar lugar a una longitud de onda de 0,5 m. Vemoslo
en un nuevo vdeo.
una perturbacin sinusoidal cuya longitud de onda es la mitad de la longitud de la cuerda.
La frecuencia representada en el vdeo es de 2 Hz, pues el movimiento de la cuerda

est ralentizado 400 veces respecto a la vibracin real que est simulando. Podemos
observar que en las ondas estacionarias que se forman en el cuarto modo de vibracin
hay 5 nodos en los puntos 0, 0,25, 0,5, 0,75 y 1, que dividen la cuerda en cuatro
semiondas, y cuatro vientres entre los nodos. As pues, la frecuencia de 800 Hz, que es
cuatro veces la del modo primero de vibracin de esta cuerda, corresponde al cuarto
armnico.
182
Y algo similar podramos observar en los restantes modos de vibracin. Su nmero,

en principio, sera innito. En la realidad, sin embargo, la prdida de elasticidad de la
cuerda para longitudes de onda pequeas hace que el nmero de modos armnicos
de vibracin sea limitado.
De los vdeos que hemos visto en este apartado dedicado a la formacin de ondas
estacionarias podemos sacar la conclusin de que la cuerda fija en sus extremos
tiene la propiedad de crear ondas estacionarias a frecuencias que son mltiplos
enteros de una frecuencia fundamental determinada, es decir, en modos de
vibracin armnicos. La frecuencia fundamental depende tanto de la velocidad de
propagacin de la perturbacin a lo largo de esa cuerda, como de la longitud de sta.
El periodo de la oscilacin que da lugar a la frecuencia fundamental coincide con
el tiempo que tarda la perturbacin en realizar el camino de ida y vuelta a lo largo
de la cuerda. Y tambin se crean ondas estacionarias cuando se introducen 2, 3, 4 o
cualquier nmero entero de oscilaciones en ese tiempo que tarda la perturbacin en
ir y volver. Eso quiere decir que la cuerda tiene unos modos naturales de vibracin,
los cuales son tambin llamados modos de resonancia. A continuacin veremos por
qu se llaman as y lo que sucede cuando son excitados.
8.6.
La resonancia
Cualquier msico ha sufrido alguna vez la desagradable experiencia de que algn

objeto de su entorno empezaba a emitir un sonido cuando daba una determinada
nota con su instrumento, sin que le resultara nada sencillo determinar su procedencia. Al cabo, se ha encontrado con un cenicero metlico, una lmpara de cristal o un
objeto cualquiera que estaba vibrando. Ocurra simplemente que el objeto en cuestin resonaba con la nota musical que estaba emitiendo el instrumento: la vibracin
producida por esa nota tena un componente frecuencial que coincida con alguna
de las frecuencias naturales de vibracin del objeto, de modo que ste se pona a
resonar.
La resonancia se produce porque un cuerpo que vibra excita a otro que es capaz
de vibrar. Un cuerpo entra en resonancia cuando alguna de las frecuencias del
sistema excitador coincide con alguna de las frecuencias naturales de vibra183
cin que ese cuerpo posee, de modo que la perturbacin no se limita a pasar a
travs de l, sino que se retroalimenta positivamente, dando lugar a una onda
estacionaria cuya amplitud se va incrementando con el paso del tiempo. La
resonancia despierta los modos de vibracin que por naturaleza posee cada objeto y
por eso a estos modos normales o naturales de vibracin se les llama tambin modos
de resonancia.
Un ejemplo tomado de la vida cotidiana que nos puede servir para comprender el
fenmeno de la resonancia es el de un columpio. Pensemos que tenemos a un nio
columpindose y queremos que cada vez gane ms altura y que el columpio se balancee ms y ms. El columpio, al igual que cualquier pndulo, tiene una frecuencia
natural de oscilacin, la cual depende de su longitud. Si empujamos el columpio de
forma peridica, haciendo que nuestros impulsos se produzcan siempre en el mismo estado de la oscilacin, el columpio ir ganando en altura; si, por el contrario,
impulsamos el columpio cuando se nos ocurra, con total independencia del estado
de oscilacin, no incrementaremos la amplitud de sus oscilaciones, sino que probablemente lo frenaremos. En denitiva, si impulsamos el columpio siempre con la
misma frecuencia y sta coincide con la frecuencia natural de oscilacin de ese columpio concreto (por ejemplo, si lo impulsamos siempre cuando pasa lo ms prximo
al suelo), el columpio ir acumulando esa energa y progresivamente la amplitud de
sus oscilaciones aumentar.
Examinemos ahora cmo se produce la resonancia en la cuerda que estamos utilizando para nuestras simulaciones. Recordemos que mide 1 m de longitud, que est
ja en sus extremos y que tiene, por razn de su masa y de la tensin a la que est
sometida, una velocidad de propagacin de las perturbaciones transversales de 400
m/s. Como consecuencia de ello, tal como hemos visto en el apartado anterior, en
nuestra cuerda se puedan crear ondas estacionarias en frecuencias que sean mltiplos
enteros de 200 Hz. Y esto quiere decir que cuando la cuerda entre en contacto con
una vibracin en alguna de estas frecuencias, se pondr en resonancia con ella y empezar a vibrar por simpata: con una frecuencia de 200 Hz dar el primer modo de
resonancia o fundamental; con una de 400 Hz, el segundo modo de resonancia; con
600 Hz, el tercero, y as sucesivamente. As pues, si en nuestra simulacin hacemos
que la frecuencia con la que oscila el soporte que introduce la perturbacin coincida
184
con una de esas frecuencias naturales de vibracin, la cuerda se pondr a vibrar en

resonancia.
A diferencia de los casos anteriores, ahora vamos a introducir en la cuerda oscilaciones
de modo continuo, unas oscilaciones de amplitud muy pequea, de 0,1 mm, pero
que se mantienen durante cierto periodo de tiempo, exactamente durante 50 ms. Lo
que nos interesa es comprobar cmo la amplitud de la oscilacin que se genera en la
cuerda va creciendo rpidamente a medida que pasa el tiempo.
Empezaremos viendo lo que ocurre cuando el soporte oscila durante 50 ms a una
frecuencia de 200 Hz, es decir, la frecuencia del modo fundamental o primero de
resonancia de nuestra cuerda. En el vdeo de abajo, que est ralentizado 400 veces,
la frecuencia ser de 0,5 Hz, con lo que podremos observar una oscilacin completa
cada 2 segundos.
Figura 8.20: Vdeo que simula la creacin por resonancia de una onda estacionaria en el primer
modo de vibracin.
Vemos que enseguida se crea una onda estacionaria en el primer modo de resonancia,
por lo que la cuerda entera oscila de manera unitaria. Pero vemos tambin, y esto
es lo ms importante, que la amplitud de la oscilacin crece de manera muy rpida,
de tal forma que cuando el soporte se detiene al concluir los primeros 50 ms de la
realidad (o los primeros 20 segundos del vdeo), la amplitud de la oscilacin de la
cuerda ha alcanzado ya 2 mm. Es decir, han bastado 50 ms de oscilacin del soporte
185
para multiplicar la amplitud de esa oscilacin inicial por 20 veces. Sucede que el
movimiento del soporte se acopla con las sucesivas reexiones de la cuerda, de tal
modo que la energa se acumula y eso hace crecer la oscilacin de la cuerda, de
modo semejante a lo que ocurre en el columpio.
Ahora examinaremos lo que sucede cuando el soporte oscila con otra de las frecuencias de resonancia naturales de nuestra cuerda, en este caso 400 Hz, que corresponde
al segundo modo de resonancia. En el vdeo, ralentizado 400 veces, la frecuencia ser
de 1 Hz.
Figura 8.21: Vdeo que simula la creacin por resonancia de una onda estacionaria en el segundo
modo de vibracin.
Vemos que en este caso se crea tambin una onda estacionaria, ahora en el modo
segundo. En efecto, la cuerda oscila dividida por la mitad en dos partes. Cuando el
soporte deja de moverse el punto medio permanece ya estable y se crea en l un nodo.
Tambin ahora podemos apreciar que la mnima amplitud con la que oscila el soporte
es capaz de provocar una gran respuesta en la oscilacin de la cuerda. Comprobamos,
pues, que la cuerda resuena tambin a la frecuencia de 400 Hz.
Para experimentar que la resonancia se produce solo cuando la oscilacin que introducimos tiene una frecuencia que coincide con alguno de los modos de resonancia
naturales de nuestra cuerda, vamos a ver lo que sucede cuando forzamos a la cuerda
a vibrar a una frecuencia alejada de cualquiera de esos modos. En concreto, vamos a
186
forzar a la cuerda mediante una oscilacin constante del soporte izquierdo a 285 Hz
de frecuencia. En el vdeo, al estar ralentizado 400 veces, la frecuencia del soporte
ser aproximadamente de 0,7 Hz.
Figura 8.22: Vdeo que muestra que no hay resonancia si la frecuencia de la oscilacin introducida
no coincide con ningn modo natural de vibracin de la cuerda.
La duracin del vdeo es de 33 segundos, que corresponden aproximadamente a 82

milsimas de segundo del movimiento real de la cuerda. A pesar de que durante todo
este tiempo el soporte izquierdo se mantiene oscilando, vemos que no es capaz de
generar en la cuerda una onda estacionaria. El soporte fuerza a vibrar a la cuerda a
la misma frecuencia con la que oscila, 285 Hz en la realidad y 0,7 Hz en el vdeo,
pero, como esta frecuencia no corresponde a ninguna de las frecuencias naturales
de resonancia de la cuerda, la oscilacin del soporte no se acopla con la onda que se
transmite a lo largo de la cuerda y no genera ninguna onda estacionaria. Adems, la
amplitud con la que oscila la cuerda forzada por el soporte es, por ello mismo, muy
pequea.
En resumen, cuando un cuerpo vibra siempre lo hace a la misma frecuencia que posee
aquello que lo fuerza a vibrar. La diferencia es que si esa frecuencia coincide con
alguna que posee el cuerpo receptor por su propia naturaleza, esa fuerza se transmite
muy ecazmente, acoplndose y amplicndose, mientras que si no se produce esa
coincidencia, la ecacia es mucho menor.
187
La resonancia se produce siempre en un contexto de oscilaciones forzadas. La resonancia implica dos partes. Por un lado, la parte activa: un cuerpo o sistema que
vibra y que con sus vibraciones excita o impulsa a otro. Por otro, la parte pasiva:
un cuerpo o sistema que, por su propia constitucin, posee una o varias frecuencias
naturales de vibracin. Al poner en relacin estas dos partes, siempre el resultado ser
que la frecuencia de la vibracin del cuerpo o sistema pasivo ser la misma que la del
sistema impulsor o activo, con independencia de cul fuera su frecuencia natural de
vibracin. Ahora bien, cuando la frecuencia del sistema impulsor se aproxima mucho a una de las frecuencias naturales del sistema pasivo, la facilidad con la que la
energa del sistema impulsor se transmite al sistema pasivo hace que la amplitud de
las vibraciones de este sistema pasivo crezca de forma extraordinaria.
Como conclusin podemos decir, que, en lneas generales, cuando coincide la frecuencia de la fuerza excitante y la frecuencia natural del sistema pasivo, se
produce un cambio cualitativo importante. La resonancia nos muestra como
una fuerza en s misma pequea puede crear un efecto grande. Este efecto ser
ms evidente conforme las fuerzas de friccin o cualquier otra que se oponga al movimiento sean menores. En el caso de nuestra cuerda ideal en la que hemos descartado
cualquier fuerza de amortiguacin este crecimiento es mximo.
8.7.
Generacin del sonido armnico
Una vez que hemos visto que la cuerda, por sus propias caractersticas fsicas, posee
unos modos naturales de vibracin que son armnicos y que estos modos resuenan
cuando coinciden con alguna o algunas de las frecuencias que estn presentes en la
perturbacin que la excita, estamos en condiciones de entender en qu consiste y
cmo se produce la vibracin armnica.
Habitualmente una cuerda, como cualquier otro cuerpo capaz de vibrar, vibra simultneamente en varios modos de resonancia. Esto da lugar a que el movimiento
de la cuerda evolucione de una forma aparentemente compleja.
Vamos a comenzar observando un caso sencillo: el movimiento a cmara lenta que
realiza la cuerda de nuestra simulacin cuando vibra simultneamente en los dos primeros modos de resonancia. Para ello, he fabricado un vdeo en el que el movimiento
188
del soporte que provoca la vibracin de la cuerda es una oscilacin armnica de la

misma frecuencia que la frecuencia natural de vibracin de la cuerda, y consta de los
dos primeros armnicos. La frecuencia del primer componente es 200 Hz y la del
segundo componente es 400 Hz. La amplitud de ambos componentes es la misma y
est ajustada para que la amplitud mxima de la onda cuando quede resonando sea
de 2 mm.
Figura 8.23: Vdeo que simula la vibracin de una cuerda en los dos primeros modos de resonancia.
En el vdeo, que est ralentizado 400 veces respecto al movimiento real de nuestra
cuerda, podemos observar cmo se superponen los dos primeros modos de vibracin.
Al entrar en resonancia por la accin del soporte, el movimiento de la cuerda va incrementando rpidamente su amplitud. Cuando el soporte se detiene, lo cual ocurre
en el segundo 20 del vdeo o en el 50 ms de la realidad, y dado que no hemos tenido en cuenta ninguna fuerza de amortiguacin, la amplitud de la onda permanece
estable durante el resto del vdeo.
Vemos que el conjunto de la cuerda oscila arriba y abajo una vez cada 2 segundos,
como corresponde a la frecuencia fundamental. Esto lo podemos ver mejor si nos
jamos en el punto central de la cuerda, el que est en 0,5 m: podemos apreciar en el
vdeo que este punto oscila arriba y abajo haciendo un Movimiento Armnico Simple (MAS) con la frecuencia del primer modo de resonancia de nuestra cuerda, que
189
coincide con la frecuencia fundamental de la oscilacin del soporte que est introduciendo la perturbacin, es decir, 0,5 Hz en el vdeo o 200 Hz en la realidad.
Pero, a la vez, observamos que la cuerda se divide por el medio en dos partes iguales
y que cada una de estas partes oscila, de forma complementaria una de la otra, a una
frecuencia doble de la que tiene el conjunto de la cuerda, es decir, a 400 Hz en la
realidad o a 1 Hz en el vdeo. Este movimiento es similar al que tendra la cuerda si solo se hubiera introducido en ella el segundo modo de resonancia y pivotara en torno
al punto central (como podemos ver en la gura 8.21). Pero este punto central en el
modo segundo sera un nodo y, por lo tanto, permanecera inmvil. La diferencia
reside en que ahora este punto central oscila tambin arriba y abajo, en cuanto que
es el punto de mxima amplitud, el vientre, del primer modo de resonancia.
En este caso sencillo en el que se combinan solamente los dos primeros modos de
resonancia, nos resulta fcil apreciar que el movimiento total de la cuerda es el resultado de la composicin de estos dos movimientos, pero a medida que el nmero de
los componentes que vibran aumenta, la vibracin de la cuerda se hace ms y ms
compleja, hasta un punto en el que ya no es posible discernirlos ni siquiera en un
vdeo ralentizado.
Por otra parte, hay que tener en cuenta que en nuestra simulacin solamente hemos
contemplado el caso de que la excitacin que genera la onda sobre la cuerda se realice
a travs de uno de los extremos jos de la cuerda. Pero la cuerda de un instrumento
musical real puede ser excitada de mltiples maneras, bien por un golpe tal como
el que realiza el macillo en el piano, bien al ser pulsada como en el caso de la
guitarra o del clavecn o bien al ser frotada como ocurre en el violn. El lugar
en el que se produce la excitacin de la cuerda tambin es relevante para la sonoridad
que se obtiene, pues, dependiendo de la posiciones en las que se produce el estmulo
y de las intensidades de ste, se potenciarn o se atenuarn unos u otros modos de
resonancia de la cuerda, con lo que se despertarn en mayor o menor medida unos
u otros armnicos.
Veamos ahora un vdeo que simula de una forma ms completa el movimiento de
una cuerda real cuando produce un sonido armnico. En l se observa la vibracin
de nuestra cuerda cuando es excitada por una perturbacin constituida por un conjunto numeroso de componentes, alguno de los cuales coinciden con sus modos de
190
resonancia, mientras que otros estn alejados. La cuerda amplica solamente aquellas
frecuencias que coinciden o estn muy prximas a sus modos de resonancia y deja
pasar sin amplicar aquellas otras que estn alejadas. De esta manera, como las frecuencias naturales de la cuerda son armnicas, la vibracin resultante ser tambin
armnica, dando lugar a una nota musical. La frecuencia de esta nota es de 200 Hz,
la frecuencia fundamental que por naturaleza tiene la cuerda de nuestra simulacin.
A n de facilitar la observacin en el vdeo, he diseado el movimiento del soporte para que la cuerda responda de forma signicativa a los ocho primeros modos
de resonancia y, adems, para que los componentes de ms frecuencia disminuyan
progresivamente su amplitud.
Figura 8.24: Vdeo que simula la vibracin de una cuerda en mltiples modos de resonancia.
Al principio del vdeo observamos una vibracin de poca amplitud y ms bien de

carcter aleatorio, pero rpidamente va adquiriendo periodicidad y ganando en amplitud. Sucede simplemente que aquellos componentes que estn presentes en la oscilacin del soporte, pero que no corresponden a ningn modo de vibracin natural
de nuestra cuerda, no son amplicados, permaneciendo siempre en su bajo nivel inicial, mientras que los componentes que corresponden a las frecuencias naturales de
la cuerda resuenan y son amplicados. El resultado es que la cuerda vibra de una
manera compleja, como consecuencia de la combinacin de sus modos naturales de
vibracin, pero de una forma peridica, con lo que produce una vibracin armnica.
191
En efecto, el movimiento que observamos en el vdeo se aproxima bastante al que

podra ser el movimiento de una cuerda real. Al ser el movimiento de la cuerda
el resultado de mltiples modos de vibracin, la apariencia que observamos es un
movimiento complejo en el que es casi imposible reconocer individualmente cada
uno de los modos de vibracin. Aun con todo, podemos apreciar que se trata de una
vibracin armnica, como podemos reconocer si nos jamos en la clara periodicidad
que se maniesta cuando el soporte queda ya inmvil. Podemos jarnos en que cada
dos segundos se repite el mismo movimiento, lo que supone una frecuencia de 0,5
Hz, que multiplicado por las 400 veces que est ralentizado el vdeo, nos da los 200
Hz de frecuencia que hemos atribuido a nuestra cuerda.
As pues, mediante este vdeo hemos podido hacernos una idea intuitiva de que una
cuerda tensada selecciona de modo natural aquellas perturbaciones que coinciden con sus modos naturales de vibracin, actuando como si se tratara de un
filtro, de modo que, ante una perturbacin compleja, reacciona positivamente y se acopla bien slo en aquellas frecuencias que coinciden con sus modos
naturales de vibracin.
8.8.
Conclusin
A lo largo de este captulo hemos estudiado que el sonido armnico o musical se

produce cuando un cuerpo cuyos modos naturales de vibracin son mltiplos enteros
de una frecuencia fundamental es excitado por una fuerza vibratoria que contiene
algunas de esas frecuencias o todas ellas, con las que entra en resonancia y se generan
ondas estacionarias.
192
Captulo 9
Envolventes de amplitud y de frecuencia
9.1.
Introduccin
En el captulo dedicado al sonido armnico hacamos abstraccin de los cambios a

lo largo del tiempo que se pueden producir en la amplitud y en la frecuencia de cada
uno de los componentes armnicos, estudiando el sonido musical como si se tratara
de un fenmeno totalmente estable. Pero la realidad es que los sonidos musicales no
suelen permanecer estables, sino que van evolucionando durante su duracin.
La evolucin de los parmetros de amplitud y de frecuencia de los componentes
simples que constituyen los sonidos musicales da lugar a ciertos rasgos acsticos que
caracterizan la sonoridad de las notas musicales que escuchamos. Esos rasgos nos proporcionan informacin sobre la fuente sonora es decir, sobre el instrumento del que
se trata y tambin sobre las acciones que realiza el intrprete con el instrumento.
Debido a esto ltimo, los rasgos tmbricos que se van creando por la modicacin
de la amplitud y de la frecuencia de la nota a lo largo de su duracin encierran una
parte muy importante de la fuerza emotiva que es capaz de transmitir el cantante o
el instrumentista con su interpretacin.
Las formas que adquieren la evolucin de la amplitud y de la frecuencia a lo
largo del tiempo de duracin de una nota reciben respectivamente el nombre
de envolvente de amplitud y envolvente de frecuencia. Junto a la cualidad sonora derivada del diferente peso de cada uno de los componentes que constituyen
193
el sonido armnico y tambin de las marcas acsticas que resultan de la transicin

entre una nota y la siguiente, las envolventes de frecuencia y de amplitud denen el
timbre de las notas musicales que escuchamos.
En el caso de la amplitud, no solo interviene la envolvente general es decir, la
forma que describe la evolucin temporal de la amplitud del sonido armnico en
su conjunto, sino tambin las envolventes de cada uno de sus componentes simples. Efectivamente, la evolucin de la amplitud de cada uno de los componentes
que constituyen un sonido armnico puede tener su ritmo propio, de modo que
unos pueden estar adelantados o retrasados respecto a otros, o incluso unos pueden
crecer mientras otros decrecen. Estas diferencias van a dar lugar a marcas tmbricas
distintas.
En el caso de la frecuencia, sin embargo, ms all de sutilezas que escapan al objetivo
de este curso, todos los componentes armnicos de una nota evolucionan de la misma
manera, con lo que la forma de la envolvente de frecuencia general coincide con la
de cada uno de ellos.
Aunque voy a dedicar un capitulo a estudiar el timbre de los sonidos producidos por
los instrumentos musicales y por la voz humana, es de inters experimentar primero,
mediante ejemplos sonoros de laboratorio, cmo son los rasgos acsticos elementales
derivados de la evolucin de la frecuencia y de la amplitud de los diferentes componentes armnicos, lo que nos va a permitir apreciar la importancia que tienen las
envolventes de amplitud y de frecuencia en la caracterizacin tmbrica de los sonidos
musicales.
Pare ello he confeccionado varios vdeos con sonidos de laboratorio creados con
Matlab especialmente diseados para experimentar cmo afecta a nuestra percepcin
sonora la envolvente de amplitud y la envolvente de frecuencia. En la parte superior
de cada uno de estos vdeos se representa, como un osciloscopio virtual, la forma de
la vibracin en tiempo real, mientras que en la parte inferior se muestra una grca
con la envolvente de amplitud o la envolvente de frecuencia. En la parte inferior,
la barra azul que se va deslizando seala el punto de la envolvente del sonido que
estamos oyendo en ese instante.
En los ejemplos de este captulo he pretendido dejar aislado el rasgo sonoro que
nos interesa experimentar en cada caso. Por eso en cada vdeo los sonidos han sido
194
generados a propsito para que slo se diferencien en el rasgo especco que debemos
observar.
9.2.
Envolvente de amplitud general
Empezaremos atendiendo a la evolucin de la amplitud del sonido armnico en su

conjunto, con independencia de los desfases y de los cambios de forma que se puedan producir en la evolucin de la amplitud de cada uno de sus componentes parciales.
La envolvente de amplitud general es la grfica que describe cmo la amplitud
total de un sonido cambia a lo largo del tiempo, desde el momento de su emisin hasta que desaparece completamente. Por eso, la envolvente de amplitud
global describe, entre otras cosas, si el ataque es rpido o lento, si el sonido se mantiene durante un tiempo o si comienza enseguida su extincin, y si esta extincin es
abrupta o el sonido se va amortiguando poco a poco.
Puesto que el caso ms sencillo de un sonido armnico es un sonido simple, donde
la envolvente de amplitud global necesariamente coincide con la del nico componente que lo constituye, en primer lugar vamos a observar cmo inuye en la
caracterizacin tmbrica de un sonido simple la forma que adquiere la evolucin de
su amplitud, es decir, su envolvente de amplitud general.
He fabricado un vdeo en el que suena dos veces la misma nota generada en el laboratorio, un la3 a 220 Hz constituido por un solo componente. La diferencia entre
ambos sonidos simples reside solamente en la forma en la que evoluciona la amplitud
a lo largo de su duracin: la envolvente del primer sonido es similar a la que posee
una nota musical real producida mediante una cuerda pulsada con la mano o con
una pa; la envolvente del segundo sonido, sin embargo, se asemeja a la de una nota de auta mantenida durante unos pocos segundos. He procurado que el pico de
amplitud sea el mismo en ambos casos para que la nica diferencia entre ellos resida
en la envolvente de amplitud.
En la parte superior del vdeo aparece la forma de la vibracin a medida que va
sonando. En la parte inferior se representa en color verde la seal de audio completa
195
de los dos sonidos y en color amarillo su envolvente de amplitud. La seal de audio

tiene el aspecto de una mancha continua debido a que el nmero de muestras que se
representan en este reducido espacio es superior a 300.000. La barra azul seala en
cada instante el punto de la envolvente que corresponde a la seal de audio que est
sonando y que se ve representada en la parte superior.
Figura 9.1: Vdeo que muestra las diferencias tmbricas a las que dan lugar dos envolventes de
amplitud distintas sobre el mismo sonido simple.
Podemos observar que la grca amarilla, la que representa la evolucin de la amplitud, parece perlar la mitad superior de la seal de audio, como si la envolviera.
En efecto, si bien la relacin de envoltura solo es rigurosamente cierta para la evolucin de la amplitud de sonidos simples, el nombre de envolvente ha pasado a
designar tambin la evolucin de la amplitud de cualquier tipo de sonido, e incluso
la evolucin de la frecuencia, donde en realidad no se produce ninguna relacin de
envoltura, como veremos enseguida.
En el primer ejemplo vemos que el ataque es muy rpido. En efecto, si detenemos
el vdeo en el momento preciso en el que se inicia el sonido, comprobamos que
tarda slo 5 milsimas de segundo en alcanzar su amplitud mxima, y que a partir
de ah comienza inmediatamente a decaer de forma exponencial, hasta extinguirse
lentamente. Como es propio de la amortiguacin exponencial, la tasa de cada en
196
cada instante es directamente proporcional al valor de la amplitud en ese momento:

cuando la amplitud es mayor, la tasa de cada es mayor; cuando la amplitud es menor,
la tasa de cada es menor. O dicho de otra manera, conforme ms amplitud tiene el
sonido, ms rpidamente decae y conforme la amplitud se hace menor, lo hace ms
lentamente. En realidad, esta amortiguacin exponencial es la forma natural en la
que se extingue toda perturbacin abandonada a sus propias fuerzas.
El sonido que escuchamos en este primer ejemplo nos recuerda al de una cuerda
pulsada: tenemos la sensacin de que se trata de un sonido producido por algo que
ha sido pulsado, o activado de una manera similar, y que la propia dinmica del
instrumento ha dejado que se extinga libremente. Esta sensacin se debe a que reconocemos que ha recibido al inicio una energa puntual por parte del ejecutante y
que la propia constitucin del instrumento la ha ido disipando hasta su extincin, sin
que haya habido ms contribuciones de energa por parte del instrumentista. En este
caso la informacin que ha aportado el intrprete se ha concentrado en el ataque,
mientras que el resto de la envolvente slo nos ilustra sobre las caractersticas propias
del instrumento.
En el segundo ejemplo podemos distinguir con claridad las cuatro etapas que convencionalmente se diferencian en la envolvente de amplitud: ataque, declive, mantenimiento y extincin (si bien esta clasicacin en etapas no deja de ser
una simplicacin de tipo prctico utilizada en los antiguos sintetizadores de sonido).
Podemos apreciar en este caso que el ataque es muy lento, pues dura medio segundo
(aproximadamente desde 3,6 s hasta 4,1 s) y que tiene la forma de una especie de ese
inclinada hacia la derecha. En efecto, el ataque comienza muy lentamente, luego
se apresura y nalmente se ralentiza de nuevo hasta alcanzar el punto de mxima
amplitud.
Una vez terminado el ataque, la amplitud comienza a decaer un poco hasta estabilizarse en torno al segundo 5. Esta etapa de declive recibe tambin el nombre de cada
o primera cada y es el resultado de que a veces tras el ataque de la nota se produce
una cierta relajacin que conduce a la etapa de mantenimiento.
La etapa de mantenimiento, que tambin se llama etapa de sostenimiento, comienza en el segundo 5. Ahora el sonido se mantiene en una amplitud aproximada de 0,2.
197
En este ejemplo el sonido mantiene la amplitud estable, pero tambin podra haberse producido un trmolo, es decir, una oscilacin de la amplitud en torno al valor
medio del mantenimiento.
Por ltimo, se inicia la etapa de extincin del sonido, que en este caso se prolonga
durante bastante tiempo, desde aproximadamente 6,6 s hasta 7,4 s. La duracin de esta
ltima etapa puede depender no slo del instrumento o de la voluntad del ejecutante
quien puede prolongar la duracin de la nota amortigundola poco a poco si el
instrumento lo permite, sino tambin del entorno sonoro en el que se emite la nota.
Por ejemplo, si la nota se emite en una sala cerrada grande, cuyas paredes reejan
una parte importante del sonido que reciben, se producir una reverberacin que
prolongar considerablemente esta etapa de extincin.
El sonido de este segundo ejemplo nos recuerda al de una nota de auta, una nota
que el intrprete ha atacado con delicadeza y que luego se ha esforzado en mantener
estable durante toda su duracin. La prolongacin de la etapa de extincin nos hace
imaginar una sala grande y vaca con mucha reverberacin.
Con estos dos ejemplos hemos podido ver que los rasgos acsticos derivados de la
evolucin de la amplitud global de un sonido armnico contribuyen a caracterizar
la cualidad sonora que escuchamos. Si reconocemos un determinado rasgo tmbrico y lo asociamos a un instrumento o a una accin del intrprete es porque nuestro
sistema auditivo est entrenado para detectar en los sonidos del entorno toda la informacin til que podamos extraer y que nos permita identicarlos. Por eso, cuando
la evolucin de la amplitud sigue la ley natural de extincin exponencial, como en
el primer sonido del vdeo, reconocemos, sin ser conscientes de ello, que la fuente
sonora no ha sido modicada durante su emisin, y esa informacin es percibida como una caracterstica diferencial de ese sonido. Cuando, por el contrario, el sonido
mantiene un cierto nivel de amplitud durante buena parte de su duracin, como es el
caso del segundo ejemplo, interpretamos que la fuente sonora est siendo alimentada
constantemente con energa. Y en funcin de las variaciones de la fase de mantenimiento nos hemos acostumbrado a distinguir si es el resultado de la intervencin
del ejecutante o si viene dado por la dinmica propia del instrumento. As mismo,
la forma de la extincin y su duracin nos aporta informacin sobre la accin del
intrprete y sobre el entorno espacial en el que ese sonido se encuentra.
198
Cualquier forma de la envolvente que no responda a la dinmica propia del comportamiento fsico esperable nos habla de una intervencin por parte del intrprete. Por
poner un ejemplo, nuestro sistema perceptivo distingue entre el sonido producido
por un rgano de iglesia y el producido por una auta, con independencia del color
es decir, del nmero y peso de los armnicos, simplemente por las variaciones
que, por mnimas que sean, acompaarn siempre al sonido de la auta. As, en el
segundo ejemplo, la suavidad del ataque con esa forma de ese y la ligera primera
cada son sucientes para atribuir a ese sonido una voluntad humana, y por eso lo
relacionamos con el sonido de una auta en la que el intrprete ha podido modicar
la evolucin de la amplitud. Aunque se trata de un sonido generado articialmente,
nunca lo confundiramos con otro que simulara el producido por el tubo de un rgano de iglesia. En realidad, si en lugar de haber sido la envolvente de amplitud tan
esquemtica, sus etapas de declive y de mantenimiento hubieran presentado algunas
inexiones, nos hubiera recordado ms al sonido producido por una auta real.
9.3.
Envolventes de amplitud parciales
Durante la emisin de un sonido musical no solamente puede cambiar la amplitud

global, como hemos visto en el apartado anterior, sino que tambin puede modicarse el peso relativo que cada componente aporta al conjunto, con la consecuente
alteracin de la cualidad sonora. A continuacin vamos a experimentar cmo afectan
al timbre los desfases en la envolvente de amplitud entre los distintos componentes.
Comprobaremos tambin que los cambios en la forma de las envolventes de amplitud
de los distintos componentes de un sonido musical pueden ser consecuencia tanto de
la propia constitucin acstica del instrumento, como de las acciones del intrprete
mediante las cuales consigue su especial expresividad.
La propia constitucin acstica de algunos instrumentos hace que los componentes
armnicos se amortigen de manera desfasada. En general, los armnicos superiores
tienden a extinguirse antes que los inferiores. En algunos instrumentos, sin embargo,
el desfase afecta al ataque, como es el caso de los instrumentos de metal, donde los
armnicos superiores tienden a retrasarse. Estos desfases constituyen una marca tm-
199
brica que caracteriza los sonidos y contribuye a la identicacin de la fuente sonora,

es decir, ayudan a reconocer el instrumento.
As mismo, en la voz y en otros instrumentos, el intrprete puede modicar durante
la emisin del sonido la importancia relativa de sus componentes armnicos y, con
ello, su cualidad sonora. Por ejemplo, en el caso del violn puede cambiar la posicin
del arco, su velocidad o la presin que ejerce sobre la cuerda, alterando la cualidad
sonora de la nota que est emitiendo. Por todo ello las envolventes de amplitud
de los componentes parciales no siguen necesariamente el mismo patrn, sino
que se puede dar la circunstancia de que el aumento de amplitud de un armnico superior pueda coincidir con el decremento de un armnico inferior, o
viceversa.
Para experimentar cmo afecta al timbre las relaciones entre las envolventes de amplitud de los diferentes componentes de un sonido musical, he fabricado tres vdeos
en los que se ejemplariza tres situaciones caractersticas. El ejemplo del primer vdeo muestra lo que ocurre cuando se desfasa la extincin de los componentes; el
del segundo, lo que sucede cuando hay un retraso progresivo en el ataque; y el tercero, cmo se modica la cualidad sonora a lo largo de la emisin de un sonido a
consecuencia del cambio en el peso relativo entre los componentes. La nota es en
todos los casos un la3 a 220 Hz, constituido por los cuatro primeros componentes
armnicos.
El primer vdeo presenta el caso en el que la extincin de los componentes no se
produce de manera homognea, sino que se apaga antes conforme ms agudo es el
componente.
200
Figura 9.2: Vdeo que muestra la inuencia en el timbre del desfase en la extincin de los componentes de un sonido.
En este vdeo observamos dos repeticiones de la nota la3 a 220 Hz, pero si prestamos
atencin advertimos que su sonoridad es claramente diferente. En ambos casos el nmero de armnicos y su amplitud mxima es la misma: el primer armnico, el de 220
Hz, tiene una amplitud mxima de 0,24; el segundo, el de 440 Hz, de 0,21; el tercero,
el de 660 Hz, de 0,18; y el cuarto, el de 880 Hz, de 0,15. La nica diferencia entre
ambos sonidos es que en el primero la velocidad con la que se amortiguan los cuatro
componentes es similar, mientras que en el segundo la extincin de cada armnico
sigue un ritmo diferente, de modo que los armnicos superiores se extinguen ms
rpidamente que los inferiores.
En la primera emisin de la nota apreciamos que durante toda su duracin la cualidad
del sonido es la misma. En la parte inferior podemos observar que el peso relativo
de los diferentes armnicos no vara sustancialmente. Podemos apreciar tambin en
el osciloscopio que la forma de la vibracin no cambia a lo largo de todo el sonido,
aunque su amplitud vaya disminuyendo progresivamente.
En la segunda emisin de la nota, por el contrario, si realizamos una escucha atenta
nos damos cuenta de que la cualidad sonora va cambiando a lo largo de la duracin.
Comienza con una sonoridad plena, resultado de que los cuatro componentes que
forman la nota tienen un peso similar, pero luego va perdiendo cuerpo hasta que la
nota se transforma en un sonido simple. Esta evolucin de la cualidad es percibida por
201
nuestro odo como un rasgo caracterstico del timbre de esa nota, algo que la hace
diferente de la anterior. En el osciloscopio se puede observar tambin que la forma de
la vibracin cambia a largo de su duracin. En efecto, al principio de la nota la forma
de la vibracin es compleja, pero luego, conforme la amplitud se va atenuando, su
forma se va simplicando progresivamente, hasta llegar a una sinusoide pura.
El segundo vdeo muestra un caso en el que se produce un retraso de los componentes
superiores en el momento del ataque:
Figura 9.3: Vdeo que muestra la inuencia en el timbre del desfase en el ataque de los componentes
de un sonido.
Ahora tambin se repite dos veces la misma nota, el la3 a 220 Hz constituido por
los cuatro primeros componentes. La amplitud mxima en ambos casos es la misma:
0,24 en el primer armnico, el de 220 Hz; 0,18 en el segundo, el de 440 Hz; 0,12 en
el tercero, el de 660 Hz; y 0,08 en el cuarto, el de 880 Hz.
Como podemos apreciar en las grcas de las envolventes que aparecen en la parte
inferior del vdeo, la nica diferencia ente los dos sonidos reside en que en la segunda
repeticin de la nota los armnicos se retrasan progresivamente en el momento del
ataque, de modo que los armnicos superiores alcanzan su mximo ms tarde que
los inferiores. Este retraso provoca un cambio en la cualidad del sonido debido al
202
diferente peso relativo que adquieren los componentes a lo largo del breve intervalo
de tiempo que dura el ataque.
Si nos jamos en el rea del osciloscopio, podremos observar que durante la emisin del primer sonido no cambia la forma de la vibracin, mientras que el ataque
del segundo se inicia con una vibracin puramente sinusoidal que rpidamente se
transforma en una forma ms compleja, similar a la del primer sonido.
Aunque reconocemos que se trata de la misma nota, si escuchamos con atencin percibiremos una diferencia apreciable en el timbre de ambos sonidos. Nuestro sistema
perceptivo ha reconocido en el segundo sonido un cambio rpido en la cualidad sonora que nos recuerda el efecto wah de una trompeta al destapar la sordina o el de
un pedal wah wah de guitarra elctrica. As pues, percibimos el retraso en el ataque
de los armnicos superiores como un rasgo tmbrico peculiar que diferencia ambos
sonidos, que son por lo dems idnticos.
El tercer vdeo muestra el caso de un sonido en el que la amplitud de los armnicos
superiores durante la etapa de mantenimiento sigue una evolucin opuesta a la del
fundamental. Aunque en los sonidos reales de los instrumentos y de las voces estos cambios acostumbran a ir unidos a modicaciones en la intensidad sonora, para
aislar el rasgo tmbrico que se deriva de la diferente evolucin de los componentes
parciales he procurado mantener constante la amplitud global durante la etapa de
mantenimiento.
Figura 9.4: Vdeo que muestra la inuencia en el timbre de las modicaciones en el peso de los
componentes de un sonido durante su etapa de mantenimiento.
203
En este vdeo escuchamos una sola nota, la misma que en los vdeos anteriores, un la3
a 220 Hz constituido por los cuatro primeros armnicos. En la parte inferior del vdeo
podemos observar que las envolventes de amplitud de los tres armnicos superiores
tienen una forma opuesta a la del componente fundamental. Vemos que durante la
etapa de mantenimiento el componente fundamental decae progresivamente desde
su valor mximo, alcanzado tras el ataque, hasta llegar a su valor mnimo, lo que
sucede en torno a la mitad de la duracin del sonido, para desde all volver a crecer
y alcanzar de nuevo su valor mximo antes de iniciar la extincin. Sin embargo,
las envolventes de amplitud de los restantes armnicos realizan el camino inverso:
crecen hasta llegar a un mximo hacia la mitad del sonido y a partir de all decrecen.
En este recorrido vemos que el segundo y el tercer armnico llegan a superar al
primero, e incluso que el tercer armnico supera al segundo.
Estos cambios hacen que el peso relativo de cada componente en el conjunto se modique a lo largo de la emisin de la nota, con la correspondiente modicacin en su
cualidad sonora. En efecto, percibimos que estos cambios durante la etapa de mantenimiento dan lugar a una modicacin gradual y constante de la cualidad sonora:
en la parte inicial y nal de esta etapa el peso del sonido recae mayoritariamente
en el componente fundamental, lo que proporciona al sonido una cualidad slida;
progresivamente los armnicos superiores van adquiriendo mayor importancia en
detrimento del fundamental, lo que proporciona al sonido una cualidad cada vez
ms hueca e incluso nasal, cuando predomina el tercer armnico, cosa que sucede
hacia la mitad de la duracin del sonido.
Los casos que hemos examinado en estos tres vdeos son solamente una muestra de
laboratorio de los rasgos acsticos que se derivan de las diferencias entre las envolventes de amplitud parciales. Estas diferencias provocan que la cualidad sonora de una
nota cambie a lo largo de su duracin y estos cambios son habitualmente percibidos
como un rasgo tmbrico.
9.4.
Envolvente de frecuencia
A continuacin vamos a experimentar cmo las modicaciones de la frecuencia de

una nota musical durante el tiempo que dura su emisin afectan al timbre.
204
Aunque, como hemos visto, lo que dene una nota musical es la permanencia de
una frecuencia estable durante un periodo de tiempo lo sucientemente grande como para que podamos reconocer una determinada altura tonal, lo cierto es que en la
voz y en algunos instrumentos musicales esa permanencia puede ir adornada con oscilaciones en torno a su valor medio o con inexiones expresivas que pueden incluso
recorrer momentneamente las frecuencias de otras notas vecinas.
El hecho de que sean posibles esas modicaciones frecuenciales durante la emisin de
una nota, constituye ya un rasgo sonoro caracterstico de un grupo de instrumentos,
los llamados instrumentos de anacin libre como es el violn, un rasgo que los
diferencia de aquellos otros cuya frecuencia se mantiene totalmente estable a lo largo
de toda la duracin de la nota, los instrumentos de anacin ja, como por ejemplo, el
piano. Incluso la mayor o menor libertad en la modicacin de la frecuencia tambin
constituye un rasgo tmbrico. As, por ejemplo, mientras el violn puede modicar
libremente la frecuencia de una nota sin interrumpir su emisin hasta el extremo de
que la transicin entre las notas puede realizarse de forma continua, sin necesidad de
una nueva emisin, la auta o el saxofn solamente pueden modicar ligeramente
la frecuencia durante la misma emisin de la nota. As pues, se puede decir que la
modificacin de la frecuencia en los instrumentos de afinacin libre constituye
un elemento expresivo de primer orden a disposicin del intrprete.
Para experimentar los rasgos acsticos que se derivan de los cambios en la frecuencia
de una nota a lo largo de su duracin he fabricado dos vdeos. De manera semejante
a los vdeos anteriores, en cada uno de ellos en la parte de arriba se presenta la forma
de la vibracin, a modo de osciloscopio, y en la parte inferior las correspondientes
envolventes de frecuencia. En ambos vdeos la nota que escuchamos sigue siendo un
la3 con una frecuencia de 220 Hz. En el primer vdeo se presenta el caso de un sonido
simple y en el segundo el de una nota formada por los tres primeros armnicos.
Con la nalidad de aislar los rasgos tmbricos especcos que se originan por la evolucin de la frecuencia, empezaremos examinando una nota musical constituida por
un solo componente. En el vdeo que presento a continuacin podemos escuchar
tres sonidos simples que dan la misma nota, donde la nica diferencia que hay entre
ellos reside en la envolvente de frecuencia.
205
Figura 9.5: Vdeo que muestra la inuencia en el timbre de la envolvente de frecuencia en el caso
de un sonido simple.
El primer sonido nos sirve de referencia para facilitar la comparacin. Durante su

emisin la frecuencia de la nota permanece totalmente estable y, en consecuencia, la
envolvente de frecuencia que se presenta en la parte de abajo es una lnea horizontal.
En el segundo sonido vemos que la frecuencia de la nota oscila en torno a su valor
medio, 220 Hz, dando lugar a un efecto sonoro denominado vibrato. Podemos apreciar que este vibrato tiene su propia frecuencia de oscilacin (no confundirla con la
frecuencia de la nota), que en este caso es de aproximadamente 4 oscilaciones por
segundo. Tambin podemos observar la profundidad del vibrato, es decir, lo que se
aleja en su oscilacin de la frecuencia media de la nota. En este caso, como es habitual
en la realidad, la profundidad del vibrato vara a lo largo de la duracin de la nota. La
profundidad mxima de este vibrato es aproximadamente de 8 Hz, lo cual, para una
frecuencia media de 220 Hz, corresponde a un intervalo de unos 60 cents.
En el tercer sonido escuchamos una inexin importante de la nota, similar a la que
podemos or en una guitarra elctrica cuando se sobretensa momentneamente una
cuerda, bien con el dedo o con ayuda de una palanca destinada a tal n, para lograr
mayor expresividad.
206
As pues, hemos podido apreciar mediante este vdeo que las variaciones en la frecuencia de una nota a lo largo de su emisin producen efectos acsticos que contribuyen a caracterizar el timbre de un instrumento y que proporcionan al sonido una
particular carga emotiva.
Para ver cmo se comporta la envolvente de frecuencia de cada uno de los componentes de un sonido armnico compuesto he confeccionado un vdeo que presenta
el vibrato de una nota formada por los tres primeros armnicos. El objetivo de este vdeo es mostrar que la evolucin de la frecuencia en los distintos componentes
presenta la misma forma, si bien sus valores estn escalados.
Figura 9.6: Vdeo que muestra la inuencia en el timbre de la envolvente de frecuencia en el caso
de un sonido compuesto.
Las dos repeticiones de la misma nota se diferencian slo por la envolvente de frecuencia. El primer sonido sirve tambin ahora de referencia para permitirnos la comparacin. Se trata de un sonido en el que no ha habido modicacin de la frecuencia
a lo largo de su emisin y por eso en la parte inferior, donde aparecen las envolventes
de frecuencia de los tres componentes, solamente se dibujan tres lneas horizontales
igualmente espaciadas.
El segundo sonido tiene un vibrato similar al del primer vdeo. Vemos que, como en
el anterior sonido, la frecuencia del segundo armnico es doble que la del primero
207
y la del tercero, triple. Dado que en las notas musicales los componentes, salvo ligeras matizaciones, son armnicos, sus envolventes de frecuencia mantienen la misma
forma y slo se diferencian en el escalado correspondiente a su nmero armnico.
As, en este caso, como la profundidad del vibrato del primer armnico es de 8 Hz,
la del segundo armnico es de 16 Hz y la del tercero de 24 Hz.
9.5.
Conclusin
A lo largo de este captulo hemos podido comprobar la inuencia de la envolvente de frecuencia y de la envolvente de amplitud, tanto la general como la de cada
componente, en la cualidad tmbrica de las notas musicales. Estas envolventes constituyen una parte importante de la caracterizacin de los instrumentos musicales y
sirven tambin como vehculo expresivo de las intenciones del intrprete.
208
Captulo 10
Anlisis espectral de los sonidos
musicales
10.1.
Introduccin
En los captulos anteriores hemos visto mediante el osciloscopio virtual distintos

ejemplos de seales de audio, es decir, de la forma que adquiere la vibracin sonora a
lo largo del tiempo. Estas seales nos han ayudado a distinguir los rasgos caractersticos de los sonidos musicales y la manera en la que nosotros los percibimos. Hemos
podido comprobar que, en lneas generales, nuestra sensacin auditiva no es capaz de
seguir el rpido movimiento de la vibracin sonora, sino que atiende principalmente
a los parmetros de frecuencia y amplitud de los componentes que forman el sonido
musical.
En efecto, como veremos ms adelante, nuestra percepcin descompone el movimiento vibratorio que llega a nuestro odo, de modo que obtiene la frecuencia y la
amplitud de sus componentes sinusoidales. Por eso, para estudiar la realidad musical de una forma completa necesitamos una herramienta de anlisis que nos permita
descomponer los sonidos en sus componentes sinusoidales y extraer sus parmetros
de frecuencia y amplitud (salvo circunstancias excepcionales, podemos ignorar la
fase inicial). Nos interesa pasar de una representacin de la vibracin en su desarrollo temporal a una representacin de la vibracin en funcin de la amplitud de
209
los componentes que la constituyen o, dicho en trminos ms tcnicos, pasar de la

representacin en el dominio del tiempo a la representacin en el dominio de la
frecuencia. Esta tarea se realiza mediante las tcnicas de anlisis espectral, llamado
tambin anlisis frecuencial. En este captulo me propongo explicar qu es el anlisis
espectral del sonido, en particular, en el caso del sonido musical.
Hoy en da disponemos de algoritmos numricos muy potentes que nos permiten
realizar el anlisis de los sonidos y extraer la frecuencia y la amplitud de cada componente simple, los cuales pueden ser realizados con facilidad en un ordenador. La
Fast Fourier Transform (FFT) es capaz de descomponer un fragmento de seal en sus
componentes sinusoidales con gran ecacia. Pero me ha parecido que explicar en
qu consiste la Transformada de Fourier se alejaba del propsito de este curso. En su
lugar, creo que es ms intuitivo, y no menos correcto, explicar el anlisis frecuencial
utilizando el fenmeno de la resonancia. De hecho, hasta el desarrollo de las tcnicas digitales los analizadores de espectro tradicionales consistan en una batera de
circuitos resonadores que medan la amplitud de cada componente presente en la
seal.
Por otra parte, explicar el procedimiento del anlisis frecuencial a partir del fenmeno de la resonancia tiene la ventaja, a mi juicio, de que es ms fcil de asimilar
para un lector sin conocimientos fsicos ni matemticos. Adems, puesto que nuestro
sistema auditivo procede de una manera similar, este punto de vista nos va a permitir
entender mejor la forma en la que percibimos las frecuencias de los componentes que
constituyen los sonidos, la cual se produce por la localizacin de sus resonancias en
los diferentes puntos de la membrana basilar situada en nuestro odo interno.
El anlisis espectral se utiliza habitualmente para sonidos o fragmentos musicales que
constan de mltiples componentes, por lo que es necesario conocer hasta qu punto va a ser capaz de distinguirlos y localizarlos con precisin en el caso de que esos
componentes tengan frecuencias prximas. Veremos a lo largo de este captulo que la
capacidad de resolucin del anlisis espectral est indisolublemente ligada a la duracin del fragmento analizado, de modo que si queremos un anlisis preciso y exacto
deberemos elegir una duracin larga. El problema surge porque, en general, a menos
que lo que se pretenda sea obtener una especie de valor promediado til en algunas
circunstancias, es necesario que los parmetros de los componentes permanezcan estables durante el tiempo en el que se efecta el anlisis. Pero en el caso de los sonidos
210
musicales reales, aunque son mucho ms estables que los del habla, generalmente la
estabilidad no se mantiene ms all de unos 50 milisegundos, por lo que, salvo circunstancias excepcionales, la longitud del fragmento no debe ser mucho mayor que
esa cantidad, de forma que podamos considerar, aunque slo sea de forma aproximada, que los parmetros han permanecido constantes durante el intervalo de tiempo
analizado.
En este captulo veremos, en primer lugar, en qu consiste el anlisis espectral y cmo se puede realizar mediante el fenmeno de la resonancia. Despus estudiaremos
la cuestin esencial de los lmites de su capacidad de resolucin. A continuacin veremos cmo mediante el espectrograma es posible obtener una representacin de la
evolucin de los distintos componentes simples a lo largo del tiempo. Por ltimo,
para ejemplarizar las ideas expuestas y para preparar la utilizacin de esta nueva herramienta en el estudio de los sonidos reales, presentar los espectrogramas de varios
sonidos caractersticos.
10.2.
Un modelo ideal de analizador espectral mediante resonancias
Imaginemos que disponemos de un piano ideal en el que las cuerdas vibran con toda facilidad, pues no hay apagadores. Adems, las cuerdas de este piano imaginario
slo tendran un modo de vibracin, el modo fundamental, es decir, slo resonaran
cuando la frecuencia que las excitara coincidiera con su frecuencia natural o estuviera
prxima a ella. Las cuerdas de este piano imaginario, en lugar de estar espaciadas siguiendo la escala cromtica, estaran separadas de hercio en hercio (aunque tambin
podran haber estado separadas de dcima de hercio en dcima de hercio o de cualquier otra forma). Evidentemente este piano imaginario poseera miles de cuerdas,
tantas como quisiramos. Lo que acabo de describir ser nuestro analizador espectral
ideal.
Delante de este piano haremos sonar, imaginariamente claro est, los sonidos que
vayamos a analizar y luego mediremos la amplitud con la que vibra cada una de las
211
cuerdas que se han quedado resonando, representando los resultados en una grca.
En las grcas de componentes frecuenciales que presentar a partir de ahora consideraremos que cada uno de los pequeos palitos que las constituyen corresponde
a una cuerda de nuestro piano imaginario. La altura que alcance cada uno de esos
palitos reejar la amplitud relativa con la que se ha quedado resonando la cuerda
correspondiente, en una escala que va del 0 al 1. He asociado, de manera similar a
las grcas del captulo 7, un color a cada amplitud, dentro de una escala que se corresponde con la de los colores por los que pasa el hierro al calentarse: el cero ser el
negro absoluto; los valores prximos a cero sern de un rojo muy oscuro; progresivamente, conforme los valores se incrementen, el rojo pasar a ser ms brillante;
luego el rojo se transformar en amarillo; y nalmente, a medida que los valores se
van aproximando al 1, el amarillo se ir aclarando hasta llegar al blanco absoluto, que
representar el valor mximo, el 1.
Supongamos que delante de nuestro imaginario piano hacemos sonar durante un
segundo de duracin un sonido simple de 220 Hz, un la3 formado por un nico
componente. La eleccin de un segundo no ha sido algo casual, pues, como veremos
en el apartado siguiente, la duracin del fragmento sonoro puede condicionar en
determinadas circunstancias la abilidad del anlisis. La duracin temporal que se
elige recibe habitualmente el nombre de ventana de observacin o ventana de
anlisis.
Ahora nos interesa comprobar cmo responde este analizador de espectro ideal al
sonido propuesto y averiguar si localiza bien la frecuencia. La grca de abajo representa las amplitudes de las cuerdas que quedarn resonando en el piano ideal. He
limitado la grca a la representacin de los primeros 1.000 Hz.
212
Figura 10.1: Grca del anlisis frecuencial de un sonido simple de 1 segundo.
Observamos en esta grca un pico muy destacado pintado de un color amarillo

muy luminoso, prximo al blanco, situado a la derecha de la cuadrcula que seala
los 200 Hz. Este pico correspondera a la cuerda del piano imaginario que se ha
quedado resonando con ms fuerza y, en principio, coincidira con el componente
sinusoidal que, como ya sabemos, constituye el sonido que estamos analizando. El
valor absoluto de su amplitud no nos interesa ahora, pues este parmetro slo es
pertinente cuando hay ms de un componente, pues permite comparar las diferentes
amplitudes.
Veamos un detalle de la zona que rodea a este componente, algo as como si hiciramos un zoom positivo sobre la grca.
213
Figura 10.2: Detalle de la grca del anlisis frecuencial de un sonido simple de 1 segundo.
Ahora distinguimos con claridad la representacin de cada una de las cuerdas del
piano que han quedado resonando. Apreciamos que la cuerda que resuena con ms
fuerza es la de 220 Hz. Pero, como podemos observar en la grca, al estar las cuerdas
de este piano separadas de hercio en hercio, en realidad solo podemos saber que la
frecuencia del componente del sonido analizado habr sido mayor que 219,5 Hz y
menor que 220,5. En efecto, el margen de precisin de nuestro piano analizador de
espectro es de un hercio, aunque nada nos habra impedido aadir en medio muchas
ms cuerdas a este piano imaginario y obtener la precisin que deseramos.
As pues, de este anlisis se desprende que el componente presente en el sonido que
estamos analizando se corresponde con el pico destacado en la grfica de las
amplitudes de las cuerdas resonantes. Pero eso no es todo. Tambin observamos
que, en menor medida, algunas de las cuerdas laterales han obtenido cierta amplitud.
Esto parece intuitivamente coherente, pues el efecto de la resonancia tambin hace
vibrar las cuerdas cuya frecuencia es muy prxima a la del componente del sonido
que estamos analizando.
Cada una de las cuerdas de este hipottico piano resonar cuando en el sonido que
queramos analizar est presente un componente sinusoidal muy prximo a su frecuencia natural de vibracin. En este caso la cuerda que resonar con ms fuerza ser
aquella que tenga una frecuencia natural lo ms cercana a 220 Hz; pero las cuerdas
prximas, como es fcil de intuir, tambin resonarn, aunque sea en menor medida.
214
Estas cuerdas vibrarn tambin a la frecuencia de ese componente, en este caso, a

220 Hz, con independencia de la frecuencia exacta a la que cada una de ellas est
anada. La amplitud con la que vibren las cuerdas ir incrementndose conforme su
frecuencia natural sea ms cercana a la del componente. Por eso en las grcas nos
encontramos con que no aparece slo un palito en la frecuencia de los 220 Hz, sino
que a ambos lados hay otras cuerdas/frecuencias que van decrementando su amplitud
a medida que su frecuencia natural de vibracin se aleja de la que est sonando. No
obstante, en principio, esto no parece alterar la abilidad del resultado.
10.3.
Relacin entre duracin temporal y resolucin frecuencial
Ahora bien, la pregunta es: Siempre esto es as? Todo resulta tan fcil? Disponemos, o mejor dicho, dispone la naturaleza de un medio tan sencillo para determinar
con precisin los componentes sinusoidales presentes en cualquier fragmento sonoro? La respuesta, desafortunadamente, es que no. Voy a realizar ahora el anlisis del
mismo sonido de un solo componente de 220 Hz, pero acortando la duracin del
fragmento a analizar: ahora har sonar delante de nuestro piano imaginario slo 50
milsimas de segundo (es decir, la ventana de anlisis ser de 0,05 s). Veamos lo que
ocurre en la grca de abajo.
Figura 10.3: Grca del anlisis frecuencial de un sonido simple de 50 milisegundos.
215
Ahora observaremos un detalle de la zona entre 160 Hz y 280 Hz.
Figura 10.4: Detalle de la grca del anlisis frecuencial de un sonido simple de 50 milisegundos.
Comprobamos ahora que, al reducir la cantidad de tiempo de la seal analizada, el

nmero y la importancia de las cuerdas laterales afectadas ha sido mucho mayor que
cuando analizbamos un segundo entero. Esto responde tambin a una cierta idea
intuitiva sobre la resonancia, pues todos hemos podido comprobar que el efecto de
la resonancia se aprecia ms fcilmente cuando la seal que excita dura ms tiempo.
Por lo tanto, vemos que la duracin de la vibracin analizada determina el nmero
de cuerdas prximas afectadas por la resonancia. Dicho de otra manera, el efecto
de la resonancia es ms picudo conforme la duracin del sonido que la provoca es
mayor.
Si se trata, como en este caso, de analizar un componente aislado no se plantea ningn problema. Pero, qu hubiera ocurrido si hubiramos querido analizar una seal
con dos componentes que estuvieran prximos? Vamos a comprobarlo en los dos
ejemplos siguientes.
En el primero voy a analizar una seal formada por dos componentes sinusoidales
de la misma amplitud. La frecuencia del primero, igual que antes, es de 220 Hz (la3 ),
y la del segundo, de 233 Hz (sib3 ). La ventana de anlisis (la duracin del fragmento
216
analizado) ser, como en el ejemplo anterior, de slo 50 ms. Realicemos el anlisis y

veamos los resultados.
Figura 10.5: Grca del anlisis frecuencial de dos sonidos simples muy prximos de 50 milisegundos.
Comprobamos que el anlisis efectuado con este tamao de ventana ha sido incapaz de distinguir los dos componentes, el de 220 Hz y el de 233 Hz, que sabemos
que existen en la seal a analizar, y que, en su lugar, ha salido un solo componente
cuya frecuencia es la media aritmtica de los otros dos, 226,5 Hz. Ciertamente, si
hubiramos podido analizar un segundo entero de duracin no habramos tenido
ningn problema para distinguir ntidamente los dos componentes. En la siguiente
grca podemos ver el resultado de realizar el mismo anlisis durante un segundo de
duracin.
217
Figura 10.6: Grca del anlisis frecuencial de dos sonidos simples muy prximos de 1 segundo.
En efecto, aqu los dos componentes han sido resueltos y adems con toda la precisin
que haba requerido al anlisis.
Veamos ahora otro ejemplo de dos componentes un poco ms separados. Vamos a
analizar una seal constituida por un componente de 220 Hz (la3 ) y otro de 262 (do4 ).
La duracin del anlisis va a ser tambin de 50 ms.
Figura 10.7: Grca del anlisis frecuencial de dos sonidos simples de 50 milisegundos.
218
En este caso el anlisis s que ha sido capaz de distinguir los dos componentes. Ahora
bien, si nos jamos en la localizacin de los picos mximos vemos que el componente
de 220 Hz ha sido desplazado a 232 Hz y el de 262 Hz a 250 Hz. Es decir, observamos
que la presencia de un componente prximo altera de manera notable la abilidad
del resultado obtenido.
Resumiendo, nos encontramos con que al reducir el tamao de la ventana de
anlisis disminuye su capacidad para discernir componentes distintos y la precisin con la que puede determinar su frecuencia. Este problema plantea una
cuestin esencial: si queremos obtener una buena resolucin en frecuencia necesitamos una duracin temporal larga. Pero la realidad es que el sonido musical va evolucionando con el tiempo y los parmetros de sus componentes solamente permanecen
relativamente estables durante un tiempo pequeo, unas cincuenta milsimas de segundo.
As pues, a la hora de efectuar un anlisis frecuencial de un fragmento musical siempre hemos de buscar una opcin de compromiso. Podremos utilizar una ventana de
mayor duracin, pero en ese caso tendremos que asumir que lo que obtendremos
en el anlisis ser una especie de promediado de la evolucin de los acontecimientos
sonoros que se hayan producido en ese tiempo. Podremos elegir una ventana de corta duracin para garantizar que el fragmento analizado sea sucientemente estable,
pero en ese caso deberemos asumir que si coinciden componentes prximos puede
que el anlisis no sea capaz de distinguirlos o al menos que pierda precisin en su
localizacin.
10.4.
El espectrograma
Como he dicho ya, los parmetros de los componentes sonoros en los sonidos reales
no suelen permanecer estables, sino que evolucionan a lo largo de su duracin. Por
ello, para analizar un fragmento sonoro nos interesar muchas veces obtener una representacin que muestre la evolucin de los valores de amplitud y de frecuencia de cada componente durante el tiempo que dura el sonido. Habitualmente
esta representacin recibe el nombre de espectrograma.
219
Un espectrograma no es otra cosa que una forma de representar grcamente los

sucesivos y solapados anlisis frecuenciales que se pueden hacer a lo largo de un sonido o de un fragmento de una interpretacin. Esta forma de representacin guarda
mayor anidad con la manera en la que nosotros omos que la representacin de la
seal de audio que hemos visto en el osciloscopio.
En los vdeos en los que se simulaba un osciloscopio y en las grcas en las que se
mostraba el desplazamiento de la vibracin en relacin al tiempo hemos tenido una
representacin puramente temporal del hecho fsico de la vibracin. Acabamos de
ver tambin en qu consiste una representacin puramente frecuencial, donde no
importa cundo se han producido los componentes sonoros, sino slo su frecuencia y su amplitud relativa. Ahora bien, ninguna de estas dos formas coincide con la
manera en la que omos. Omos frecuencias, pero omos frecuencias que cambian
en el tiempo, bien porque unas dejan de sonar y surgen otras, bien porque las que
estaban sonando evolucionan en amplitud, o bien porque desparecen y surgen otras
frecuencias. No obstante, en lo que concierne al sonido musical, hay cierto margen
de tiempo en el que las cosas, salvo momentos especiales de transicin, parecen cambiar poco, es decir, hay momentos en el que se puede considerar que la vibracin
es casi estable, pues los componentes y sus parmetros no han sufrido grandes cambios. Como he dicho al principio de este captulo, el tamao que se suele considerar
adecuado para este intervalo temporal viene a ser de unas 50 milsimas de segundo.
Si cada 50 ms se va haciendo un anlisis que va progresivamente desplazndose en
el tiempo y solapndose, la evolucin de los parmetros ser ms able y responder
ms a la realidad que si se hace un anlisis en intervalos ms grandes o ms pequeos.
Mediante el vdeo que pongo a continuacin voy a explicar ms detenidamente cmo podemos obtener un espectrograma. Voy a utilizar para este ejemplo los primeros
compases del adagio de la Sonata para violn solo de J. S. Bach (BWV 1001). Para facilitar la presentacin, he limitado la banda de los componentes a los primeros 2.000
Hz. Veamos primero el vdeo.
220
Figura 10.8: Vdeo que muestra la obtencin de un espectrograma.
Recomiendo ir parando el vdeo en el momento que se considere oportuno para entender mejor lo que sucede. Encontraremos una imagen similar a la siguiente.
Figura 10.9: Instantnea del vdeo de la gura 10.8.
221
En el panel de la izquierda tenemos la representacin temporal de la vibracin a modo de osciloscopio, es decir, la forma de la vibracin a lo largo del tiempo. Al estar en
la gura 10.9 la imagen detenida, he podido aadir la localizacin temporal precisa:
el fragmento de seal analizado en este cuadro del vdeo corresponde al intervalo
de tiempo transcurrido entre el segundo 10,360 y el 10,410. En total son las 50 milsimas de segundo que constituyen la duracin de los fragmentos que analizamos.
Podemos observar que en esta ocasin la forma de la vibracin ha permanecido casi
prcticamente estable durante ese intervalo de tiempo. Sin embargo, si hubiramos
detenido el vdeo en algn otro momento, especialmente en el ataque de alguna
nota, nos hubiramos encontrado con una situacin ms inestable.
En el panel de la derecha tenemos la representacin frecuencial, es decir, los componentes que constituyen la seal que estamos viendo en el panel de la izquierda. Esta
representacin sigue los mismos criterios que acabamos de ver en los apartados anteriores, es decir, muestra el anlisis frecuencial. He aumentado proporcionalmente
la amplitud para que en el espectrograma inferior resaltaran ms los componentes
pequeos. En esta ocasin vemos que aparecen destacados 6 picos que corresponden a los 6 primeros armnicos de la nota re4 , cuya frecuencias son, redondeando
en hercios: 294,7 Hz, 587,4 Hz, 881,1 Hz, 1174,8 Hz, 1.468,5 Hz, 1.762,2 Hz. Las
amplitudes estn tambin acompaadas de una escala de colores, como la que he descrito antes. El componente primero se ve claramente destacado y el pico presenta un
color amarillo luminoso que se aproxima ya al blanco. Los componentes segundo y
el tercero tienen tambin una amplitud considerable y su color es un rojo brillante, siendo ligeramente mayor el tercero que el segundo. Los componentes cuarto,
quinto y sexto van progresivamente perdiendo amplitud y sus colores van siendo
cada vez ms oscuros. A lo largo del vdeo podemos ver como esta grca va evolucionando siguiendo los cambios en el sonido. Dicho de otra manera, conforme el
sonido va pasando por el panel izquierdo, la representacin frecuencial de la derecha
se va actualizando.
En el panel de abajo vemos cmo se va construyendo el espectrograma del fragmento. Si nuestro reproductor de vdeo nos permite avanzar de cuadro en cuadro
veremos que en cada cuadro tenemos un desplazamiento de la seal hacia la izquierda
en la ventana temporal del panel de la izquierda, una actualizacin de su representacin frecuencial en el panel de la derecha y, por ltimo, una nueva columna de
222
pxeles en el panel inferior. Esa nueva columna de pxeles presenta los valores frecuenciales correspondientes al anlisis frecuencial del cuadro que estamos analizando,
utilizando simplemente los mismos colores que hemos obtenido en la representacin
frecuencial, de tal forma que aqu prescindimos de la longitud del componente y la
representamos nicamente por el color. As por ejemplo, si en el visor de imgenes
con el que estamos examinando esta grca hacemos un zoom considerable, hasta el
extremo de poder ver pxeles aislados, y nos jamos nicamente en la ltima columna de pxeles del espectrograma que estamos construyendo y que hemos detenido,
veremos que los picos que hemos visto en el panel de las frecuencias se corresponden,
con sus mismos colores, con los pxeles que vemos destacados en esta ltimo columna
de la imagen. Tal vez el componente ms agudo nos aparezca un poco desvado, pero aun con todo nos resultar fcil ver cmo esta columna de pxeles se corresponde
y representa la amplitud de cada componente frecuencial analizado en el panel de la
derecha.
Esta forma de representacin nos permite dejar un rastro de lo que hemos visto que
ha ido sucediendo a lo largo del tiempo en el panel de las frecuencias. De este modo
tenemos una representacin frecuencial actualizada con el paso del tiempo. Y esto es
ya similar a la manera en la que nosotros omos y a la que en la realidad se producen
la mayor parte de los acontecimientos sonoros. As pues, el espectrograma es la forma
de representacin ms idnea del sonido de un fragmento musical.
10.5.
Interpretacin de los espectrogramas
Voy a presentar a continuacin varios espectrogramas para mostrar cmo podemos

interpretar las imgenes que ofrecen. Utilizar los mismos ejemplos sonoros que hemos visto en anteriores captulos, lo cual nos permitir comparar la informacin que
nos proporciona el espectrograma con la que obtenamos en el osciloscopio. He confeccionado mediante Matlab varios vdeos para facilitar el seguimiento del sonido en
el espectrograma. La imagen del vdeo muestra el espectrograma del fragmento completo, mientras la lnea verde vertical se va desplazando marcando el instante que est
sonando. Todos los espectrogramas presentan slo los primeros 4.000 Hz.
223
10.5.1. Espectrograma de sonidos armnicos estables

Comenzar con el espectrograma que corresponde al vdeo de la gura 7.4 del captulo 7, donde se muestra cmo la incorporacin de los sucesivos componentes
armnicos aproxima la forma de la vibracin a la de un diente de sierra y cmo repercute esta incorporacin en la cualidad sonora. En este ejemplo suena ocho veces la
misma nota, un la3 a 220 Hz. Empieza sonando el componente fundamental aislado,
un sonido simple de 220 Hz, y luego se van incorporando sucesivamente todos los
componentes de la serie armnica, hasta llegar al octavo armnico.
Figura 10.10: Vdeo con el espectrograma de la generacin de una seal en diente de sierra a partir
de los componentes consecutivos de la serie armnica.
En este espectrograma podemos observar que cada componente aparece representado por una lnea horizontal, lo que indica que la frecuencia de todos ellos permanece
constante durante la emisin de cada nota. As mismo, por el color podemos apreciar que la amplitud de cada componente es la misma en todas las repeticiones de la
nota en las que est presente, y tambin que la amplitud de los componentes que van
apareciendo es progresivamente menor. As vemos que el primer armnico o fundamental presenta la mayor amplitud, pues su color es casi blanco, que el color con
el que est representado el segundo armnico es amarillo dorado y que los siguientes
son rojos cada vez ms oscuros.
224
Podemos ver tambin en el espectrograma con total claridad la estructura armnica

que forman el conjunto de los componentes de la nota, pues todos ellos estn separados entre s por la misma distancia, una distancia que coincide con la frecuencia
del primer componente.
10.5.2. Espectrograma de sonidos armnicos cuyos componentes cambian

de amplitud
Veamos ahora cmo queda reejado en un espectrograma la evolucin en amplitud
de los componentes armnicos de un sonido. He elegido tres sonidos cuya forma de
vibracin ya habamos examinado en el captulo 9, cuando estudibamos las envolventes de amplitud. En todos los ejemplos los sonidos estn formados por los cuatro
primeros armnicos y su frecuencia fundamental es 220 Hz, correspondiente a la
nota la3 . En el primer caso se produce un retraso en el momento del ataque de los
componentes superiores (gura 9.3 del captulo 9); en el segundo hay cambios en
las amplitudes respectivas de cada componente durante el mantenimiento del sonido
(gura 9.4 del captulo 9); y en el tercero ocurre que los componentes superiores se
extinguen mucho ms rpidamente que los inferiores (gura 9.2 del captulo 9).
Figura 10.11: Vdeo con el espectrograma de tres sonidos armnicos formados por componentes
cuya amplitud evoluciona de diferentes formas.
225
A diferencia de la representacin de la seal en el tiempo que veamos en el osciloscopio, donde no podamos distinguir los componentes individuales, este espectrograma
nos muestra de forma clara la evolucin de la amplitud de cada componente que forma el sonido. En primer lugar podemos observar que en todos los casos estamos ante
un sonido armnico, pues las distancias entre los componentes son iguales. Por otro
lado, los cambios en el color de cada componente a lo largo de su duracin nos indican que ha variado su amplitud. En el espectrograma se puede distinguir tambin
el carcter ms o menos abrupto del ataque y de la extincin de las notas.
Si pasamos a analizar caso por caso, nos encontramos con que en el primer sonido la
amplitud de los componentes superiores es progresivamente menor, pues vemos que
el componente primero es el que presenta mayor luminosidad, mientras que el ltimo
es el ms oscuro. Se aprecia tambin claramente en el momento del ataque un retraso
de los sucesivos componentes, siendo el fundamental el primero que entra. Por el
contrario, vemos que en la extincin del sonido todos los componentes se apagan
simultneamente (si bien los componentes de mayor amplitud parecen prolongarse
un poco ms, esto se debe solamente a que los colores ms oscuros se funden antes con
el negro). Vemos tambin que las lneas que representan los componentes cambian
de color durante la parte inicial del sonido, aproximadamente en la primera dcima
de segundo, desde un rojo muy oscuro que se funde casi con el negro del fondo,
hasta llegar al color que mantendrn durante la mayor parte de la emisin. Esto es
indicativo de que el ataque de la nota ha sido ms bien suave, tal como apreciamos
al orla. As mismo, en la etapa nal de la nota vemos que los componentes van
perdiendo luminosidad, lo que hace que parezca que se vayan adelgazando. Esto
corresponde a la extincin suave que omos.
En el segundo sonido los ataques de los componentes son simultneos y menos suaves que en el primero, como podemos observar en el hecho de que se alcanza ms
rpidamente el color que mantendr cada componente durante la emisin. As mismo, vemos que la forma en la que se extinguen es similar a la del sonido primero.
Los cambios de color que observamos durante su etapa intermedia nos indican que
la amplitud de los componentes superiores, en especial el segundo y el tercero, se va
haciendo progresivamente mayor, hasta superar, aproximadamente a la mitad de la
duracin del sonido, a la del fundamental; luego vemos que se invierte la tendencia
y se recupera la situacin inicial. Esto coincide con el cambio de cualidad sonora que
226
apreciamos: el sonido comienza con un carcter ms bien suave, va ganando cuerpo

y un poco de aspereza, y nalmente retorna a la suavidad.
En el tercer caso, como en el primero, la representacin de los componentes es progresivamente ms oscura, lo que nos indica que su amplitud es menor conforme
mayor es su frecuencia. Cada uno de los componentes tiene mayor intensidad lumnica al inicio de la emisin de la nota y luego se oscurece hasta casi desaparecer.
Podemos ver en el espectrograma que los cuatro componentes han surgido a la vez.
Por el contrario, la extincin se ha realizado de forma claramente desfasada, de tal
modo que al nal slo queda sonando el componente fundamental, como podemos
ver por la desaparicin de las lneas que representan cada componente en el espectrograma. Si nos jamos un poco ms, vemos que el ataque abrupto que omos se
traduce en una lnea vertical en el espectrograma, que se extiende por arriba y por
abajo de la posicin del respectivo componente y que luego, en forma de una especie
de embudo, va a desembocar en la lnea que le corresponde por su frecuencia. Esto
se debe a que el ataque abrupto es similar al ruido, es decir, contiene una banda muy
amplia de frecuencias. Podemos ver que la inestabilidad inicial es ruidosa y pasa cierto
tiempo hasta que el sonido alcanza la estabilidad. Cuando veamos sonidos reales, los
ataques abruptos vendrn caracterizados por esa forma de embudo que desemboca
en la zona ms luminosa del componente.
10.5.3. Espectrograma de sonidos cuyos componentes modifican su frecuencia

A continuacin vamos a ver un conjunto de casos en los que podremos apreciar
cmo se observa la evolucin de la frecuencia en un espectrograma. Los sonidos son
los mismos que los que utilic en el captulo 9 al explicar la envolvente de frecuencia.
Los tres primeros sonidos corresponden a la gura 9.5 y los otros dos a la gura
9.6.
227
Figura 10.12: Vdeo con el espectrograma de varios sonidos cuya frecuencia evoluciona de diferentes
formas.
Al igual que en los ejemplos anteriores y a diferencia de la representacin de la seal

en el tiempo, el espectrograma nos permite apreciar la evolucin de cada componente por separado.
En el primer caso observamos un componente aislado que mantiene constante su
frecuencia, como podemos ver por su horizontalidad. En el segundo, vemos unas
oscilaciones que reejan perfectamente el vibrato que omos. En l podemos apreciar
que la profundidad del vibrato aumenta y luego disminuye, pues las ondulaciones se
hacen ms pronunciadas y luego menos, aunque vemos tambin que el ritmo de las
oscilaciones es decir, la frecuencia del vibrato permanece constante. En el tercer
sonido apreciamos un incremento signicativo de la frecuencia tras el ataque, que
luego baja de nuevo hasta alcanzar el nivel correspondiente en el que ya se mantiene horizontal. En el cuarto caso tenemos un sonido formado por tres componentes
armnicos que mantienen su frecuencia constante, como podemos apreciar en su
horizontalidad. Y en el quinto, vemos los mismo tres componentes anteriores, pero
ahora con un vibrato similar al del segundo sonido. En l podemos apreciar que las
ondulaciones del segundo componente son el doble de profundas que las del primero
y que las del tercero son el triple que las del primero, como era lgico de esperar,
pues los sonidos siguen siendo armnicos durante el vibrato.
228
10.5.4. Espectrograma de ruido blanco y sonido simple

Una vez visto cmo se pueden observar en un espectrograma los componentes y la
respectiva evolucin de sus parmetros de frecuencia y amplitud, vamos a examinar
un elemento que tambin est presente de una u otra manera en los sonidos musicales:
el ruido. Para ver cmo aparece representado el ruido en un espectrograma y cmo
se distingue inmediatamente de un sonido musical voy a utilizar el ejemplo de la
gura 3.1 del captulo 3, donde veamos la representacin en el osciloscopio del ruido
blanco, aqul que contiene todas las frecuencias del espectro, y de su opuesto, un
sonido simple.
Figura 10.13: Vdeo con un espectrograma de ruido blanco y de un sonido simple.
La representacin espectral del ruido blanco es el granulado de la izquierda, mientras que la lnea blanca de la derecha corresponde al sonido simple. Si hubiramos
extendido la representacin del espectrograma ms all de los 4.000 Hz hubiramos
seguido observando ese mismo granulado en toda la franja audible. Idealmente un
ruido blanco contiene todas las frecuencias con la misma amplitud, por lo que deberamos haber visto, en lugar de este granulado, un rectngulo plano de un color
uniforme. Pero la aleatoriedad absoluta slo es posible en la idealidad. Para ello deberamos haber dispuesto de una duracin innita y haber tenido una garanta total
229
de que los nmeros que hemos obtenido para generar el ruido blanco fueran perfectamente aleatorios, no pseudo-aleatorios, como los que hemos utilizado. As mismo,
cuando observamos el componente aislado, un sonido simple, deberamos haber visto una lnea innitamente na, la correspondiente solamente a esa precisa frecuencia.
Sin embargo, en los espectrogramas siempre vemos para cada componente una lnea
con un cierto grosor. Estas son las aproximaciones con las que vamos a ver las seales
en los espectrogramas que realicemos habitualmente.
10.5.5. Espectrograma de ruido de trfico y de habla

Quiero ahora presentar un ejemplo en el que se toman dos situaciones de la vida
real en las que no hay sonido musical. Ambos ejemplos corresponden tambin al
captulo 3: el primero consiste en la primera parte de la gura 3.4, que contiene
ruido de trco en un da de lluvia, y el segundo en la primera parte de la gura 3.10
en el que una locutora de radio dice unas pocas palabras.
Figura 10.14: Vdeo con un espectrograma de ruido de trco y de una locutora de radio.
En la primera parte vemos con claridad el ruido blanco producido por la lluvia, que
cubre todo el espectro de frecuencias de una manera homognea. En la parte de abajo
del espectro vemos una forma granulada, correspondiente tambin a ruido, pero que
230
se sita en una zona de ms bajas frecuencias. Es el ruido propio del trco. Vemos
tambin como el motor de un coche, al acelerar, se reeja en la aparicin de unos
componentes que suben rpidamente su frecuencia. Y omos en medio de ese ruido
un sonido armnico, la bocina de un coche, como se puede apreciar con claridad
por la distribucin vertical de componentes igualmente espaciados que se observan
en torno al segundo nueve y con menos claridad un poco antes del segundo 4.
En la segunda parte del espectrograma, cuando omos hablar a la locutora, vemos una
alternancia entre breves fragmentos de sonidos armnicos y un granulado organizado en barras verticales. Es la alternancia entre ruido y sonido armnico caracterstica
del habla, simplicando un poco, la alternancia entre consonantes y vocales. Vemos
tambin que las vocales cambian de frecuencia siguiendo unos esquemas ascendentes y descendentes dentro de unos pequeos mrgenes. Estos esquemas son los que
constituyen la entonacin del habla.
10.6.
Conclusin
En este captulo hemos estudiado cmo se puede descomponer una vibracin cualquiera en la suma de los componentes sinusoidales que la constituyen, cada uno con
su propia frecuencia y amplitud. Al hacer esto hemos obtenido una representacin
frecuencial del sonido analizado. As mismo, dado que habitualmente los parmetros
de los componentes armnicos que constituyen el sonido musical cambian a lo largo
del tiempo, hemos visto que el espectrograma es una forma adecuada de representar
esta evolucin, pues muestra para cada instante la frecuencia y la amplitud de los
componentes que forman el sonido.
231
Captulo 11
El timbre
11.1. Introduccin
El sonido de los instrumentos musicales, entre los que hay que incluir el de la voz
humana en el canto, es una realidad acstica mucho ms compleja que el sonido generado articialmente que hemos utilizado en la mayor parte de los ejemplos de los
captulos anteriores. El sonido habitual que omos en las notas que forman una pieza
musical interpretada por instrumentos acsticos posee unas cualidades que le proporcionan, por as decir, un grosor y una textura que lo hacen rico y variado, tiene
algo que percibimos como vivo y de lo que suelen carecer los sonidos articiales.
Estas cualidades son las que dotan a cada sonido musical de una individualidad, una
individualidad que va a conservar incluso cuando se mezcle con otros sonidos, como
ocurre, por ejemplo, en los acordes dados en el mismo instrumento o cuando la misma nota es emitida simultneamente por dos instrumentos distintos. Este conjunto
de cualidades sonoras constituyen lo que llamamos el timbre del sonido.
La palabra timbre se suele usar en sentido estricto para designar los rasgos especcos que caracterizan los sonidos propios de uno u otro instrumento. As, se habla
del timbre del violn, del clarinete, del piano, etc. Sin embargo, el trmino timbre
tambin puede ser utilizado para nombrar el conjunto de marcas diferenciadoras que
individualizan el sonido de cada nota musical concreta, al margen de su altura tonal o
de su volumen sonoro. Estas marcas tmbricas no slo diferencian un sonido de otro
232
dentro del mismo instrumento, sino que hacen que una misma nota dada en el mismo instrumento posea una cualidad sonora particular dependiendo del toque del
intrprete, el cual puede hacer incluso que suene de diferente modo en los distintos
momentos de su interpretacin.
La palabra timbre signica precisamente esto: sello. Podemos considerar, as pues,
que el timbre es el sello propio que posee cada sonido, bien sea por su pertenencia a un tipo de instrumentos o a un instrumento concreto, o bien incluso
por la accin intencionada del instrumentista. En este ltimo sentido decimos
que el instrumentista timbra de una u otra manera cada uno de los sonidos que
ejecuta, dotndolos de unas marcas especcas que forman parte del sello de su interpretacin.
En lneas generales, podemos decir que los sonidos producidos por la prctica totalidad de los instrumentos musicales son el resultado de la interaccin de dos sistemas:
uno, la fuente de excitacin sonora, aquellos mecanismos mediante los cuales se provoca y se mantiene la vibracin, como son, por ejemplo, las cuerdas en el piano; otro,
las estructuras que actan de resonadores y que modican la composicin del sonido
emitido por la fuente, como es, por ejemplo, la caja de resonancia. Las posibilidades
de accin sobre cada uno de estos sistemas que ofrece cada instrumento al intrprete
completan su caracterizacin tmbrica, como ocurre, por ejemplo, con el vibrato en
los instrumentos de anacin libre. Estas posibilidades son los recursos expresivos
con los que cuenta el intrprete para transmitir su idea musical.
Pero no todos los instrumentos permiten al intrprete las mismas posibilidades. En
unos casos puede modicar los parmetros acsticos a lo largo de la emisin de un
sonido, como ocurre en la voz humana, el ms verstil de los instrumentos, donde el
cantante puede controlar la amplitud y la frecuencia de la fuente sonora (sus cuerdas
vocales), pero tambin, y especialmente, puede modicar la forma de los resonadores (su rgano bucal). Esto ltimo le permite incrementar o disminuir la amplitud
de unos u otros componentes frecuenciales, modicando a su voluntad y de forma
constante la cualidad tmbrica del sonido que est emitiendo. El caso opuesto es el
del clavecinista, por ejemplo, quien dispone casi exclusivamente de la posibilidad de
disparar el mecanismo de produccin del sonido mediante su accin sobre la tecla,
pero, a partir de ah, todo lo que sucede en el sonido viene ya determinado por la
233
propia constitucin del instrumento, careciendo el intrprete de cualquier medio de

modicacin.
Aunque el estudio del timbre no se presta con facilidad a un anlisis sistemtico, un
conocimiento de las causas que dan lugar a las diferentes marcas y matices tmbricos
que conforman el sonido de los instrumentos es esencial para entender verdaderamente en qu consiste el sonido musical, el material con el que se construye la msica. Por otra parte, analizar sonidos reales nos va a ayudar a entender cmo nuestro
sistema perceptivo es capaz de organizar el conjunto sonoro que llega a nuestros odos y extraer de l las diferentes voces. Y esto es algo que est detrs de todo nuestro
sistema musical.
Para realizar un anlisis sistemtico del timbre del sonido musical tendramos que estudiar su color, es decir, el nmero de armnicos y su jerarqua; las envolventes de
amplitud y de frecuencia de cada componente; los formantes, es decir, las resonancias
propias de cada instrumento; los transitorios, es decir, los breves milisegundos que
transcurren hasta que el sonido se estabiliza; la presencia de ruido y sus caractersticas; la posible existencia de algn componente no armnico; etc. Pero el estudio
sistemtico de todos estos factores excedera el propsito de este captulo, por lo que
me voy a limitar a ofrecer unos cuantos ejemplos ilustrativos que muestran cmo el
sonido conserva la marca del instrumento que lo ha producido y la gestualidad
sonora que ha realizado el intrprete. A travs de estos ejemplos observaremos tambin que nuestra percepcin es capaz de detectar esas marcas tmbricas y con ello de
seguir y reconocer, hasta cierto punto, la individualidad de cada sonido en medio de
otros.
As pues, en este captulo vamos a adentrarnos en el complejo mundo de la vida real
de los sonidos musicales. Comprobaremos que en la mayora de los sonidos musicales es habitual que cierto componente de ruido acompae a la parte armnica del
sonido. Veremos, por ejemplo, que cuando un instrumento emite una nota, lo ms
comn es que los parmetros de cada uno de los componentes simples que la constituyen evolucionen de diferente modo a lo largo del tiempo de su emisin y que eso
interviene en el timbre del sonido que escuchamos. Adems, podremos experimentar que los componentes sinusoidales de los sonidos de algunos instrumentos, como
es el caso del piano, no son estrictamente armnicos, es decir, las frecuencias de sus
componentes no son mltiplos exactos del fundamental.
234
En primer lugar me ocupar del conjunto de rasgos que pertenecen a lo que habitualmente se denomina el contenido espectral de un sonido y que determinan sus
cualidades sonoras, su color. Puesto que el espectrograma nos ofrece una imagen
bastante completa de la vida del sonido musical, utilizar varios vdeos con espectrogramas que nos permitirn observar los rasgos tmbricos que estn vinculados a la
estructura y a la evolucin individual de los componentes frecuenciales, as como la
posible presencia de ruidos caractersticos que acompaan a la emisin. En segundo
lugar mostrar la importancia que para la caracterizacin del timbre tiene la evolucin temporal de los parmetros del sonido en su conjunto, es decir, la envolvente
de amplitud y la envolvente de frecuencia.
11.2. Rasgos tmbricos derivados del contenido espectral

Empezaremos estudiando, a modo de ejemplo, los rasgos ms destacados que se pueden observar en el contenido espectral de unos cuantos sonidos instrumentales. Se
trata de sonidos de piano, de violn y de clarinete. He procurado elegir ejemplos en
los que sea fcilmente apreciable la relacin entre lo que vemos en el espectrograma
y lo que omos.
El primer ejemplo consiste en dos frases breves formadas por notas salteadas del registro medio-grave del piano. La segunda frase se repite al nal con un toque ms suave.
Las notas son: sib2 , mib3 , solb3 ,dob3 ; mib3 , lab3 , dob4 , re3 ; mib3 , lab3 , dob4 , re3 .
El segundo ejemplo pertenece al registro medio-agudo del piano y consiste en una
frase formada principalmente por notas consecutivas: la4 , si4 , do5 , re5 , mi5 , do5 , si4 ,
la4 , fa5 .
Esta frase se repite dos veces, la primera con un toque intermedio y la segunda con
un toque ms duro. Tanto en este ejemplo como en el anterior las notas de cada frase
estn ligadas y no he utilizado ningn pedal.
El tercer ejemplo consta de una frase de violn y otra de clarinete. La frase de violn
est formada por tres notas: la primera es sol3 , la nota ms grave del violn que se
obtiene con la cuarta cuerda al aire; la segunda y la tercera son fa#5 y sol5 , esta ltima ejecutada con vibrato. La frase de clarinete est formada por dos pares de notas
235
ligadas, de las cuales las segundas son el resultado de abrir el portavoz sin modicar
la posicin. La primera pareja la forman el re3 , la nota ms grave del clarinete en sib
con todos los oricios tapados, y el la4 , la misma posicin con el portavoz abierto.
La segunda pareja est compuesta por el mib3 y el sib4 .
Para cada uno de los tres ejemplos presentar dos vdeos con sus correspondientes
espectrogramas, a n de mostrar, mediante la modicacin de la escala de color, diferentes aspectos de su contenido espectral. En todos los espectrogramas la duracin
de la ventana de anlisis ha sido de 50 milsimas de segundo, lo que, como vimos,
da como resultado un compromiso aceptable entre la resolucin en tiempo y en frecuencia. De esta forma podremos distinguir con suciente claridad los componentes
que constituyen cada sonido y a la vez seguir su evolucin temporal.
En el primero de los dos espectrogramas de cada ejemplo la escala de colores reeja
linealmente las amplitudes de cada componente, desde el negro, que corresponde
al 0, hasta el blanco, que corresponde al 1, con todas las gradaciones intermedias,
como indiqu en el captulo dedicado al anlisis espectral. Dado que, en general, la
amplitud relativa de los componentes muy agudos es muy pequea, con esta escala
de colores no se observa prcticamente ningn componente ms all de los 5.000
Hz, por lo que he limitado el rango de estos espectrogramas a esta frecuencia.
El segundo espectrograma de cada ejemplo nos va a permitir observar con claridad
los componentes que estn en la banda alta de frecuencias. Aunque la amplitud de
estos componentes muy agudos es, en general, muy pequea, nuestro odo es muy
sensible a su presencia y, si bien su importancia para el reconocimiento de la altura
tonal es escasa, inuyen mucho en el color del sonido. Si los componentes que se
encuentran en esas zonas superiores del espectro no fueran importantes para nuestra
percepcin acstica, no tendra sentido que los reproductores de msica de calidad
se distinguieran, entre otras cosas, por su capacidad para reproducir con delidad
los componentes ms agudos. Para hacer visibles estos componentes muy agudos he
modicado la escala de colores, de tal forma que el color blanco representa ahora
cualquier amplitud superior a una centsima, dentro de la escala normalizada del 0
al 1. Al hacerlo as, surgen del fondo oscuro del espectrograma nuevos componentes
que antes estaban fundidos con el color negro. Ahora bien, desaparecen las diferencias entre las amplitudes que se pueden apreciar con la escala de color sin alterar de
los primeros espectrogramas, ya que cualquier valor superior a una centsima queda
236
representado ahora por el color blanco. Esto explica el engrosamiento que se observa
en los componentes ms graves. Esta escala de color nos permitir tambin apreciar
mejor la presencia de ruido y su inuencia en la caracterizacin de los sonidos musicales. No obstante, he limitado el rango de estos segundos espectrogramas a los
10.000 Hz, pues, aunque desde el punto de vista de la calidad de la reproduccin sonora son muy importantes los componentes que estn por encima de esta frecuencia,
para nuestro estudio sobre las marcas tmbricas este lmite es suciente.
Veamos, pues, uno detrs de otro los vdeos con los tres ejemplos sonoros y sus correspondientes espectrogramas. Recomiendo ver y escuchar con detenimiento cada
uno de los vdeos para adquirir familiaridad a la hora de relacionar lo que se ve con
lo que se oye.
237
Figura 11.1: Vdeo con el espectrograma de una meloda de piano en el registro medio-grave.
Figura 11.2: Vdeo con el espectrograma de banda alta de la meloda de piano de la gura 11.1.
238
Figura 11.3: Vdeo con el espectrograma de una meloda de piano en el registro medio-agudo.
Figura 11.4: Vdeo con el espectrograma de banda alta de la meloda de piano de la gura 11.3.
239
Figura 11.5: Vdeo con el espectrograma de unas notas de violn y clarinete.
Figura 11.6: Vdeo con el espectrograma de banda alta de las notas de violn y clarinete de la gura
11.5.
Lo primero que podemos observar es que todos estos espectrogramas son de sonidos
naturales, es decir, de sonidos producidos por instrumentos acsticos, pues podemos
apreciar imperfecciones, ruidos y variaciones que lo hacen rico y vivo. As, en el
espectrograma de banda alta del primer ejemplo, el de la gura 11.2, observamos que
240
aproximadamente en el segundo 12,5 aparece una pequea franja vertical. Si el volumen del altavoz de nuestro reproductor es lo sucientemente alto, reconoceremos
en ese momento el ruido que se ha producido al levantar la tecla que ha dado el re3 .
Un poco ms adelante (en la penltima nota, en torno al segundo 16,7, casi al nal de
la duracin del dob4 ) omos un pequeo ruido sordo que enmascara momentneamente el sonido de la nota y que se corresponde con una pequea franja vertical en el
espectrograma. Y al nalizar el pasaje, en la ltima nota (un poco antes del segundo
18) omos y vemos en el espectrograma un pequeo chasquido ambiental. Por otra
parte, el granulado que est por debajo de los componentes ms graves en todo el
espectrograma coincide con el ruido ambiente de la grabacin domstica.
Ciertamente, en medio del sonido emitido por los instrumentos musicales hay muchas formas de ruido, todas ellas caracterizadas por una acumulacin de componentes en una determinada zona del espectro. En el caso del piano, por ejemplo, como
veremos enseguida, determinados tipos de ruido forman parte de su propia caracterizacin tmbrica.
Con la ayuda de estos ejemplos vamos a examinar a continuacin los rasgos tmbricos
a mi juicio ms relevantes que se aprecian en el contenido espectral del sonido de
los instrumentos musicales. Estos rasgos son, en parte, resultado de la constitucin
de cada instrumento y, en parte, resultado de las acciones del intrprete.
En primer lugar nos ocuparemos de las peculiaridades espectrales que comparten los
sonidos del mismo instrumento, es decir, aquellas caractersticas que poseen los sonidos del piano por ser de piano, los del violn por ser de violn o los del clarinete por
ser de clarinete. Para no alargar en exceso este captulo, me centrar en las marcas
especcas del sonido del piano. En segundo lugar estudiaremos las diferencias en
contenido espectral que presentan cada sonido individual del mismo instrumento.
Veremos cmo la cualidad sonora de una nota del piano es diferente de la de otras
notas del mismo piano, igual que cada nota del violn es diferente de otras del mismo violn, y lo mismo en el caso del clarinete. Y en tercer lugar analizaremos las
diferencias en el contenido espectral que son resultado de las acciones intencionadas
que realiza el intrprete al emitir cada nota segn sus propsitos expresivos en cada
momento de la interpretacin.
241
11.2.1. Rasgos espectrales caractersticos del tipo de instrumento

Puesto que, como acabo de decir, un estudio detenido vlido para cualquier instrumento excedera el objetivo de este curso, me ha parecido oportuno elegir como
ejemplo el caso del piano para estudiar sus peculiaridades tmbricas. Empezaremos
analizando cmo quedan reejadas en los espectrogramas que acabamos de ver las
marcas tmbricas propias de este instrumento, es decir, los rasgos sonoros que nos
permiten reconocer que un determinado sonido ha sido emitido por un piano, y no
por un violn, por un clarinete o por cualquier otro instrumento.
Si comparamos los espectrogramas de los tres instrumentos podemos distinguir las
siguientes caractersticas propias de los sonidos del piano:
a) Todos los componentes del piano mantienen una total horizontalidad.
Ciertamente tambin son horizontales los componentes del sol3 del violn o incluso los del re3 y mib3 del clarinete, aunque, si nos jamos en el detalle, nos
damos cuenta de que estos ltimos son algo menos horizontales. Ahora bien, en
ninguna nota de piano podremos encontrar nunca una oscilacin de los componentes a lo largo de su duracin, como ocurre en el caso del sol5 del violn o,
aunque en un grado menor, en el la4 y el sib4 del clarinete. Los componentes del
piano ni siquiera presentan una ligera inexin, a diferencia de los del violn,
como podemos apreciar en el inicio del fa#5 de este instrumento. En efecto, la
estabilidad de la frecuencia es un rasgo distintivo de los componentes del
sonido de piano.
b) Los componentes de las notas del piano poseen en el espectrograma
cierto aspecto triangular: son ms gruesos en el comienzo, donde al poco
de empezar alcanzan su mxima luminosidad, y luego progresivamente
se adelgazan y oscurecen. El grosor con el que empieza cada componente se
debe al ruido inicial producido durante el ataque. El modelo de paso brusco de
ruido a frecuencia estable es comn a todas las notas del piano. Esto se aprecia
ms claramente en las notas agudas, donde la presencia del ruido es ms duradera
y destacable. Esto sucede porque cuando el martillo golpea la cuerda del piano
se produce un ruido inicial que va transformndose en vibracin peridica, es
decir, en un conjunto de componentes claramente denidos. Este momento
242
inicial, que se llama transitorio de ataque, es especialmente signicativo para

denir el timbre del piano, y es ah, en este momento, donde se concentra la
mayor parte de la informacin que el pianista puede proporcionar, pues a partir
de entonces es ya la propia constitucin del instrumento la que determina la
evolucin de los parmetros sonoros, sin que el intrprete pueda hacer nada
para modicarlos.
c) Salvo las excepciones que veremos en el apartado d, un rasgo caracterstico de las notas del piano es que sus componentes tienden a desvanecerse
y a perder paulatinamente su brillo. Los espectrogramas de las guras 11.1 y
11.3 traducen la atenuacin progresiva de la intensidad sonora que se produce tras el momento inicial del ataque de la nota de piano, momento en el que
se acumula toda la aportacin de energa que realiza el intrprete y que queda
reejado en ese punto inicial de fuerte luminosidad que poseen muchos componentes. A diferencia de los sonidos del piano, los componentes de las notas
del violn y del clarinete, como podemos observar en el espectrograma de la
gura 11.5, pueden disminuir, mantener o incrementar su brillo a lo largo de
su emisin, pues en estos instrumentos la energa sonora se modica a voluntad
del intrprete, quien ha de aportar energa constantemente para que el sonido
siga producindose.
d) En ocasiones los componentes del piano se desvanecen y vuelven a aparecer, como podemos apreciar en los armnicos segundo, tercero y cuarto de
la nota dob4 del espectrograma de la gura 11.1, en torno al segundo 9,5, o con
ms claridad en muchos componentes de las notas de las guras 11.2, 11.3 y
11.4. Nada parecido observamos en los espectrogramas del violn o del clarinete. Podemos comprobar que el espectrograma reeja lo que el odo percibe
como pequeas pulsaciones. Estas pulsaciones son el resultado de las interferencias que se producen por las pequesimas desigualdades de frecuencia que
habitualmente hay entre las dos o tres cuerdas unsonas que suenan al pulsar
cada tecla del piano.
e) Los componentes frecuenciales del sonido del piano no son estrictamente armnicos. Si bien un sonido musical se caracteriza por ser armnico,
ocurre que en la propia naturaleza de los sonidos de algunos instrumentos como el piano hay una pequea inarmonicidad, la cual le otorga precisamente una
243
cualidad sonora caracterstica. La inarmonicidad es una marca tmbrica del

sonido del piano. Aunque no es fcil apreciarla a simple vista en los espectrogramas, el odo s la reconoce enseguida. La inarmonicidad se produce porque
las frecuencias de los sucesivos componentes del piano se apartan cada vez ms
de la que les debera corresponder si siguieran estrictamente la serie armnica.
Los armnicos de una nota del piano no son exactamente mltiplos de la frecuencia fundamental, sino que progresivamente se van abriendo: la frecuencia
del segundo armnico, en lugar de ser el doble de la fundamental, puede ser, por
ejemplo, de 2,002 veces esa frecuencia; la del tercero, en lugar de ser exactamente tres veces la del fundamental, puede ser de 3,005 veces; y as sucesivamente,
de modo que la frecuencia del noveno armnico ya ser una 9,14 veces la del
fundamental, pues la apertura va aumentando conforme mayor es el nmero del
armnico.
Podemos observar la inarmonicidad del piano mediante un nuevo ejemplo. Ahora
se trata de la nota sol3 dada por un piano, seguida de esa misma nota emitida por un
violn con la cuerda al aire, de manera que no presenta ningn vibrato ni inestabilidad en su frecuencia. Para este espectrograma he utilizado una ventana de anlisis
muy larga, lo que nos va a permitir obtener una resolucin en frecuencia muy elevada, pues, lo que nos interesa ahora es atender a las frecuencias de los componentes,
aunque perdamos resolucin temporal. He modicado el mapa de color para poder
apreciar los componentes ms dbiles. Slo vamos a estudiar lo que ocurre en los
primeros nueve armnicos.
244
Figura 11.7: Vdeo con el espectrograma de ventana muy larga de la nota sol3 dada primero por
un piano y luego por un violn.
En el espectrograma he medido la frecuencia de cada uno de los componentes, tanto

los de la nota de piano como los de la nota de violn. A continuacin pongo una
tabla con los valores que he obtenido en ambos instrumentos y, para que sirva de
referencia, las frecuencias que les hubieran correspondido a los componentes si hubieran seguido estrictamente la serie armnica. Hay que tener en cuenta que, como
se trata de sonidos naturales, la anacin de la nota de piano y la de violn no coinciden exactamente, sino que hay una pequea diferencia de dcimas de hercio: el
componente fundamental del piano mide 195,5 Hz y el del violn 195,9 Hz.
245
Piano serie
Piano
Violn serie
Violn
armnica (Hz)
medido (Hz)
armnica (Hz)
medido (Hz)
195,5 x 1 = 195,5
195,5
195,9 x 1 = 195,9
195,9
195,5 x 2 = 391,0
391,3
195,9 x 2 = 391,8
391,8
195,5 x 3 = 586,5
587,5
195,9 x 3 = 587,7
587,7
195,5 x 4 = 782,0
784,4
195,9 x 4 = 783,6
783,6
195,5 x 5 = 977,5
982,1
195,9 x 5 = 979,5
979,5
195,5 x 6 = 1.173,0
1.180,9
195,9 x 6 = 1.175,4
1.175,4
195,5 x 7 = 1.368,5
1.381,4
195,9 x 7 = 1.371,3
1.371,3
195,5 x 8 = 1.564,0
1.583,5
195,9 x 8 = 1.567,2
1.567,2
195,5 x 9 = 1.759,5
1.786,8
195,9 x 9 = 1.763,1
1.763,1
Tabla 11.1: Frecuencias de los componentes de la nota de piano y de la nota de violn.
Si comparamos los valores de las columnas correspondientes a los instrumentos medidos con los respectivos valores de referencia segn la serie armnica, podemos
vericar que los componentes de la nota de violn son armnicos hasta la dcima de
hercio, mientras que los del piano se van apartando cada vez ms, de modo que la
diferencia es bastante signicativa en los componentes superiores, exactamente de
27,3 hercios en el noveno armnico.
Esta inarmonicidad, que es consecuencia de la rigidez de las cuerdas del piano, da al
instrumento un sonido ligeramente metlico muy caracterstico. La inarmonicidad
del piano provoca tambin problemas en la anacin y obliga al anador a estirar
artesanalmente las octavas.
246
11.2.2. Diferencias del contenido espectral entre las distintas notas del mismo instrumento
Las notas de un clarinete suenen todas a clarinete y las de un piano suenen todas a
piano, pero cada instrumento e incluso cada nota del mismo instrumento posee
un color propio, unos matices que le otorgan una sonoridad peculiar.
Como se explica en el captulo dedicado al sonido armnico, la mayor o menor importancia que posee cada componente dentro del conjunto es decir, su jerarqua
determina la cualidad sonora que percibimos, su color. En efecto, el contenido espectral de todas las notas del mismo instrumento no es idntico. De un instrumento a otro y de una nota a otra cambia la importancia relativa que cada
componente posee respecto al conjunto. Para observar que esto es as volveremos a los tres ejemplos sonoros que he presentado al principio y a sus respectivos
espectrogramas (guras 11.1 a 11.6). Comprobaremos que el hecho de que vare
el contenido espectral de una nota a otra dentro del mismo instrumento hace que
cambie su cualidad sonora.
Primero vamos a examinar las diferencias de sonoridad que se producen entre notas
cuya tesitura est alejada y luego las que existen entre notas muy cercanas. Por ltimo, comentar brevemente las causas de estas diferencias entre sonidos del mismo
instrumento.
a) Diferencias tmbricas entre notas pertenecientes a distintos registros del mismo instrumento
Para explicar la inuencia del registro tonal en la cualidad tmbrica de las notas emitidas por el mismo instrumento voy mostrar los que ocurre en el piano y en el violn
mediante los ejemplos sonoros de los vdeos que he presentado antes.
Empezaremos estudiando al caso del piano. En los vdeos con los dos ejemplos de
piano (los espectrogramas de las guras 11.1 a 11.4) podemos apreciar la diferencia
de sonoridad que hay entre las notas del registro medio-grave y las notas del registro
medio-agudo.
247
Atendamos a los espectrogramas de los dos ejemplos de piano en los que la escala
de color no est alterada (los de las guras 11.1 y 11.3). Podemos apreciar que la
mayor parte de las notas que pertenecen al registro medio-grave (las del primer caso)
presentan abundantes armnicos visibles, diez o incluso ms, mientras que en las
notas que pertenecen al registro medio-agudo (las del segundo caso) el nmero de
armnicos que se pueden distinguir con claridad est en torno a tres o cuatro.
Examinemos ahora los espectrogramas que nos permiten apreciar mejor la banda alta
del espectro de esos dos ejemplos de piano (el de las guras 11.2 y 11.4). Puesto que
la escala de color ahora representa como blanco todo valor de amplitud superior a
una centsima, vemos que aparecen los componentes de la banda alta, cuya amplitud
es generalmente muy reducida y que no se vean en los espectrogramas anteriores.
Podemos comprobar tambin ahora que el nmero de componentes visibles es notablemente mayor en las notas del registro medio-grave (las del espectrograma de la
gura 11.2) que en las del registro medio-agudo (las del espectrograma de la gura
11.4).
En estos dos ejemplos podemos observar que lo que vemos en los espectrogramas
coincide plenamente con lo que omos en los respectivos vdeos: mientras que las
notas del primer ejemplo suenan ms llenas, ms redondas, las del segundo tienen
una sonoridad ms clara, ms perlada. En resumen, podemos concluir que el color
de las notas del piano es muy diferente en el registro medio-grave y en el registro medio-agudo, a pesar de la proximidad que hay entre ambos registros. Las
diferencias hubieran sido mucho ms exageradas si hubiramos comparado notas del
piano de los registros extremos, el ms grave y el ms agudo, pero me ha parecido
oportuno situar los ejemplos dentro del rango habitual de la msica de piano.
Por otra parte, en estos ltimos espectrogramas podemos apreciar que el ruido, que
acompaa el ataque de la nota en todos los sonidos de piano y que es un elemento caracterstico del timbre de este instrumento, no tiene la misma importancia en las notas agudas que en las graves. Si nos jamos en el espectrograma
de la gura 11.4 (el del registro medio-agudo del piano) observamos que el inicio de
cada nota va acompaado de una serie de emborronamientos y sombreados de tendencia vertical que se diluyen al cabo de muy poco tiempo y que sealan la presencia
de ruido. Ahora bien, aunque este ruido de ataque se puede observar tambin en el
espectrograma de banda alta que corresponden al primer ejemplo del piano (el de la
248
gura 11.2), donde se dan notas del registro medio-grave, podemos comprobar que
su incidencia es claramente menor. Esa diferente presencia del ruido de ataque en
ambos registros es tambin una marca tmbrica que distingue nuestro odo.
Veamos ahora en el caso del violn cmo se aprecian las diferencias tmbricas entre
notas de distintos registros tonales, pero del mismo instrumento. Volvamos a las notas
que suenan en la primera parte del tercer ejemplo que he presentado antes (el que
corresponde a los espectrogramas de las guras 11.5 y 11.6). Hay una distancia de
casi dos octavas entre la primera y la segunda nota: primero suena la nota ms grave
de este instrumento, el sol3 , dado con la cuarta cuerda al aire, y luego el fa#5 seguido
del sol5 , dadas ambas con la primera cuerda presionada con los dedos para acortar su
longitud.
Si analizamos el contenido espectral de la nota sol3 del violn del espectrograma de
la gura 11.5, encontramos que el primer armnico es inapreciable y que el componente ms destacado es el segundo; el tercero, cuarto y quinto armnico tienen
una escasa presencia, mientras que el sexto aparece con claridad; el sptimo, octavo
y noveno armnico casi pasan desapercibidos, pero el dcimo y el undcimo se observan con bastante nitidez. Ahora bien, el contenido armnico de las notas agudas
del violn, el fa#5 y el sol5 , es totalmente distinto: en ambos casos los cuatro primeros
armnicos tienen una presencia destacada, mientras que el quinto y el sexto estn
ms atenuados.
Comprobamos que la sonoridad de los dos grupos de notas es tambin muy distinta:
el fa#5 y el sol5 tienen una cualidad sonora brillante, casi hiriente, mientras que el
sonido del sol3 es ms clido y envolvente. Entenderemos mejor la razn de la sonoridad agresiva de esas notas del registro agudo si nos jamos en el otro espectrograma
del mismo ejemplo (el de la gura 11.6). Vemos que en esas notas hay una presencia
destacada de armnicos en toda la banda superior, lo que explica esa sonoridad casi
hiriente.
As pues, hemos podido experimentar en el caso del piano y del violn que las diferencias en el contenido espectral de notas de diferentes registros dan lugar a
unas marcas tmbricas especficas.
249
b) Diferencias tmbricas entre notas prximas del mismo instrumento
Una vez que hemos examinado la diferente cualidad sonora de notas del mismo instrumento que pertenecen a regiones de la voz alejadas, vamos a ver que tambin
existen diferencias entre notas que son casi consecutivas. Estas diferencias son ms
difciles de apreciar por el odo y requieren una audicin ms atenta, capaz de hacer abstraccin de la diferente altura tonal para prestar atencin exclusivamente a la
cualidad sonora.
Comenzar con la frase de clarinete que aparece en la segunda parte del tercer ejemplo (guras 11.5 y 11.6). Las notas forman una doble pareja que distan entre s un
semitono. La primera pareja, el re3 y el la4 , han sido producidas con toda la longitud
del tubo, en el caso del re3 con todos los agujeros tapados y en el caso del la4 continuando con todos los oricios tapados excepto el portavoz (el oricio cuya apertura
provoca en el clarinete la emisin del tercer armnico, la nota que est a una distancia de octava y quinta). La otra pareja, el mib3 y el sib4 , ha sido producida de forma
similar, pero con el acortamiento del tubo sonoro.
Como ahora pretendo mostrar la diferente cualidad sonora entre notas que estn muy
prximas, no voy a analizar las diferencias de sonoridad que existen entre las notas
del registro grave del clarinete el llamado chalumeau y las del registro agudo,
el registro clarn que da nombre a este instrumento y que se producen al abrir el
portavoz. Atenderemos al diferente contenido espectral entre notas que pertenecen
al mismo registro, es decir, el re3 y mib3 , por un lado, y el la4 y sib4 , por otro.
Un rasgo caracterstico del sonido del clarinete es la prevalencia de los armnicos
impares. Fijmonos, en primer lugar, en el mib3 , la tercera de las notas emitidas por
el clarinete. En efecto, en el espectrograma se observan casi exclusivamente los armnicos impares: primero, tercero, quinto, etc, hasta el undcimo, y acaso parece
vislumbrarse un poco el duodcimo. En el caso del re3 , la primera nota, observamos,
as mismo, la prevalencia de los armnicos impares, pero comprobamos que tambin
hay una cierta presencia de los armnicos pares: el sexto, el octavo, el dcimo y el
duodcimo. Como hemos experimentado hasta ahora, estas diferencias en la importancia de los componentes armnicos deberan ser percibidas por nuestro odo como
diferencias en la cualidad sonora.
250
Para facilitar la apreciacin auditiva de estas diferencias, he realizado un nuevo vdeo

con los dos sonidos que quiero comparar, uno a continuacin del otro. Para que la
diferente altura tonal no distraiga nuestra atencin sobre la cualidad sonora de cada
nota, he bajado articialmente un semitono la segunda nota, el mib3 , de modo que ha
quedado convertido en un re3 , y as ambas notas tienen la misma altura tonal.
Figura 11.8: Vdeo con el espectrograma de dos notas de clarinete con diferente contenido espectral.
Ahora podemos distinguir bastante bien la diferente cualidad sonora de ambas notas.
En efecto, omos dos notas de igual altura tonal, pero con distintos matices de color:
mientras la primera tiene un sonido ms bien profundo y lleno, la segunda resulta
ms spera.
Si comparamos el contenido espectral de las otras dos notas del clarinete, las del registro agudo, vemos que en el la4 aparece el segundo armnico, un armnico par
que est ausente en el sib4 . Tambin observamos que el componente ms destacado
del la4 es el fundamental, mientras que en el sib4 es el tercer armnico el que tiene
ms relevancia. Estas diferencias en el contenido espectral explican las distintas
cualidades sonoras que omos en dos notas consecutivas.
Veamos por ltimo cmo dos notas prximas de piano tienen una cualidad sonora diferente. Volvamos al vdeo de la gura 11.3, donde se repite una pequea frase ligada
251
formada por notas predominantemente seguidas. Todas las notas de la primera frase
han sido dadas con el mismo toque, por lo que las diferencias de sonoridad que apreciemos se tienen que deber necesariamente a la propia constitucin del instrumento.
Prestemos atencin en el espectrograma, por ejemplo, a la jerarqua armnica de las
tres primeras notas: la4 , si4 y do5 . Observamos que en el la4 , aunque en el momento
del ataque el armnico primero es el que tiene una presencia mayor, el que termina
prevaleciendo es el segundo; en el si4 el armnico ms importante es el tercero; y en
el do5 el que posee mayor importancia es claramente el primer armnico. As pues,
la diferente jerarqua en el contenido espectral de estas tres notas es la razn de que
oigamos una cualidad sonora distinta en cada una de ellas.
Esta diferente cualidad sonora de cada una de las notas del mismo piano explica,
por ejemplo, que algunos pianistas que no poseen odo absoluto es decir, que no
son capaces de identicar una nota aislada de un instrumento cualquiera sin una
referencia previa puedan reconocer sin ninguna dicultad cualquiera de las notas
del instrumento en el que habitualmente interpretan.
c) Causas de las diferencias tmbricas entre notas del mismo instrumento
El estudio detenido de las causas fsicas que explican las diferencias de sonoridad entre
las notas de un instrumento excede el objetivo de este captulo. Pero si atendemos a
lo que sucede, por ejemplo, en el caso del violn, podemos hacernos una idea, aunque
sea vaga, de las razones de esa peculiaridad tmbrica. Por un lado, todo violinista sabe
que no suena lo mismo una nota tocada en una cuerda que esa misma nota tocada en
otra cuerda del mismo instrumento. Ocurre que cada cuerda del violn vibra de forma
distinta, debido a su grosor, a su constitucin material, por estar o no entorchada,
etc. Y esa diferente vibracin produce un contenido espectral distinto del de las otras
cuerdas del mismo instrumento y, por lo tanto, una sonoridad particular.
Por otro lado, hay que tener en cuenta que no omos directamente la vibracin de
la cuerda de un violn, la cual solo podra poner en movimiento una pequesima
cantidad de aire; lo que realmente omos son las vibraciones que la cuerda provoca
en la caja de resonancia del instrumento a travs del puente, vibraciones que ya son
capaces de mover una cantidad de aire suciente como para que llegue con claridad
a nuestro odo. Pero esa caja de resonancia tiene sus frecuencias propias de vibracin,
252
por lo que resonar ms o menos con los diferentes componentes de la cuerda que
vibra, amplicando unos y disminuyendo otros, de manera que transforma el contenido espectral original de la cuerda, alterando su jerarqua y dejando en el sonido
su propia huella. Las resonancias destacadas de la caja constituyen una caracterstica
fundamental de los instrumentos musicales y reciben el nombre de formantes. Igual
que en el caso del habla estos formantes son decisivos a la hora de distinguir las diferentes vocales, en el caso de los instrumentos inuyen de una manera muy marcada
en el color de las notas que emiten.
Un ejemplo interesante de la inuencia de estos formantes que denen las frecuencias
de resonancia de cada instrumento nos la ofrece el vibrato del violn sobre la nota sol5
en el vdeo de la gura 11.5, en torno al segundo 4. Si observamos el vibrato sobre
el sol5 vemos que, adems de la ondulacin caracterstica que muestra la variacin de
la frecuencia, en la parte ms baja del tercer armnico hay como unos puntos de luz
casi blanca. Estos puntos indican que en esos instantes se ha producido una amplitud
mxima en ese componente. Dicho de otra manera, el vibrato no slo ha ocasionado
una variacin de la frecuencia, sino que tambin ha oscilado el color del sonido, es
decir, la mayor o menor prevalencia de unos u otros componentes.
Esta oscilacin de la cualidad sonora que posee el vibrato del violn es un rasgo caracterstico de este instrumento. Si lo comparamos con el vibrato menos profundo
del clarinete que podemos observar tambin en el mismo espectrograma (o incluso
mejor en el de banda alta de la gura 11.6) sobre las notas la4 , en torno al segundo
8, y sib4 , en torno al segundo 13, vemos que en el clarinete no hay cambio de color, sino que la cualidad sonora se mantiene igual a lo largo de toda la emisin de
la nota y solo oscila la altura tonal. La explicacin fsica de este rasgo caracterstico
del violn reside en las propiedades de su caja de resonancia, que responde de diferente manera a componentes frecuenciales muy prximos. En este caso, el tercer
armnico resuena mucho ms cuando el vibrato est en la parte baja de su oscilacin, debido a que en ese instante su frecuencia coincidir con la frecuencia de una
de las mltiples resonancias naturales de la caja del violn. En consecuencia, el tercer
armnico adquiere en esos momentos una funcin predominante en la jerarqua de
los componentes.
253
11.2.3. Modificacin del contenido espectral por la accin del intrprete

Una vez entendido que cada instrumento, por sus propias caractersticas fsicas, imprime su personalidad en el contenido espectral de los sonidos que produce y, por
lo tanto, posee su propia cualidad tmbrica, vamos a atender ahora a las huellas que
las acciones del intrprete dejan en la jerarqua espectral de los componentes de cada
nota, las cuales se traducen en su particular cualidad sonora.
Una parte importante de la formacin de un instrumentista consiste en aprender
a fabricar el sonido. Esto es evidente en el caso de un intrprete de violn, pues
pueden pasar aos hasta que un violinista consiga obtener un sonido aceptable, pero
tambin es vlido en el caso del piano. A pesar de que el sonido del piano parezca
estar fabricado de antemano y de que aparentemente el pianista solo deba bajar la
tecla, basta escuchar unas pocas notas para distinguir si han sido ejecutadas por un
intrprete formado o por un estudiante que est empezando. En efecto, pequesimas
diferencias en la velocidad de bajada de la tecla es decir, en el toque se traducen
en claras diferencias en la sonoridad y en el color del sonido que se obtiene.
Comencemos observando la relacin entre el toque del instrumentista y la mayor o
menor presencia de armnicos superiores. Volvamos sobre las frases de piano de los
dos primeros ejemplos (guras 11.1 a 11.4). Fijmonos en primer lugar en el segundo
ejemplo, el de los vdeos de las guras 11.3 y 11.4. Apreciamos la diferente cualidad
sonora de las notas de la primera frase, que han sido dadas con un toque intermedio
y natural, y las de la segunda, donde la misma secuencia de notas se repite con un
toque ms duro y enrgico.
Esa diferencia en la cualidad sonora queda reejada en el contenido espectral que
vemos, sobre todo en la gura 11.4, donde la escala de color ha sido preparada para
observar la banda alta. El toque ms duro de la segunda repeticin se ha traducido en
una mayor presencia y relevancia de los armnicos superiores. En efecto, en el piano
un ataque ms duro produce una nota con mayor volumen sonoro, pero tambin
con un contenido ms rico en armnicos superiores. Estos armnicos superiores son
los que le proporcionan al sonido un color brillante e incisivo.
Escuchemos ahora el primer ejemplo, el de las guras 11.1 y 11.2. Como hemos visto
ya, est formado por tres breves frases, cada una de cuatro notas. La tercera frase es
254
una repeticin de la segunda, pero ejecutada con un toque ms delicado. Fijmonos

en la diferencia de contenido espectral entre ambas. Tanto en el vdeo de la escala de
color completa (gura 11.1), como el de la escala de color modicada para resaltar la
banda alta (gura 11.2), comprobamos que hay bastante diferencia en el nmero y
la importancia de los armnicos superiores: en la segunda repeticin, la que tiene el
toque ms delicado, el nmero de armnicos superiores visibles es menor que en la
primera y predominan muchos ms los armnicos inferiores. Esta hace que el sonido
de esta frase sea mucho ms dulce.
A diferencia del ejemplo de piano anterior, donde todas las notas de la misma frase
haban sido ejecutados con un toque homogneo, aqu cada nota ha tenido su propio toque. El intrprete ha pretendido dar a cada una de ellas un signicado propio,
una personalidad, como si cada una tuviera que decir algo distinto slo ya con su
sonido. Por no alargar en exceso el comentario, me voy a centrar en una nota que
adquiere especial singularidad, el dob4 , en la segunda ejecucin, pasado ligeramente
el segundo 16. La cualidad sonora de esta nota es distinta de todas las dems. Su sonido es destacadamente suave y conciso. Si observamos el espectrograma en las guras
11.1 y 11.2 vemos que el primer armnico presenta aqu una relevancia mucho ms
destacada que en el resto de las notas que la rodean. La interaccin entre el instrumento y el toque del pianista ha dejado su marca en esa importancia casi absoluta del
componente fundamental.
Mediante estos ejemplos hemos podido comprobar que el toque del pianista, es
decir, la mayor o menor velocidad con la que baja la tecla, repercute en el
contenido espectral y, por lo tanto, en el color del sonido que obtiene. Conforme ms duro es el ataque, mayor es el contenido de armnicos superiores
que despierta.
Esto que hemos visto en el caso del piano es comn a la mayor parte de los instrumentos, as como a la voz humana. Una persona gritando producir un mayor
volumen sonoro, pero todos podemos distinguir que una persona est gritando aunque el volumen que oigamos sea muy bajo. Ello se debe a que la cualidad del sonido,
el contenido armnico, es diferente: un incremento en el volumen va asociado a
un incremento en el nmero e importancia de los armnicos superiores.
255
En el ejemplo de violn de las guras 11.5 y 11.6 hemos visto que la diferente sonoridad que omos entre el sol3 , por un lado, y el fa#5 y sol5 , por otro, se debe a la
diferencia entre las cuerdas y al hecho de haber sido tocadas al aire o pulsadas con el
dedo. Pero otra parte importante de la cualidad sonora peculiar de cada una de estas
notas viene dada por la mayor presin o velocidad con la que el arco ha frotado la
cuerda en las notas superiores. Dicho de otra forma, el alto contenido armnico en
la zona superior del espectro es consecuencia de esa mayor energa del arco que ha
empleado el violinista.
Por otra parte, en algunos instrumentos el intrprete puede modicar el contenido
espectral durante la emisin del sonido. El violinista y el clarinetista, por ejemplo, tienen que aportar energa constantemente para mantener el sonido, por lo que pueden
cambiar el volumen sonoro a voluntad. As mismo, dentro de unos mrgenes limitados por la naturaleza del instrumento, pueden tambin alterar su contenido espectral
a lo largo del tiempo que dura la emisin de la nota. Por poner un ejemplo sencillo,
en la segunda parte de los vdeos y espectrogramas de las guras 11.5 y 11.6 podemos
apreciar que cuando el clarinetista apaga lentamente la segunda nota de cada pareja,
el la4 y el sib4 , se produce una desaparicin progresiva de los armnicos superiores.
El clarinete sigue, as pues, tambin la norma general de que el incremento en el
volumen va unido a un incremento en el nmero y prevalencia de los armnicos
superiores, y viceversa, como ocurre en este ejemplo.
Realmente cuando escuchamos un sonido nuestra imaginacin tiende a reconstruir
la accin que lo ha producido. sta es precisamente una de las formas en las que se
transmite la informacin emotiva del intrprete. Sin necesidad de verlo tocar, nosotros, al or su msica, imaginamos el gesto que est haciendo en el instrumento.
Por ejemplo, en el teclado de un piano omos-vemos al intrprete acariciando las
teclas en los pasajes delicados, golpeando sin piedad en los fortsimos-staccato, pasando
con ligereza en los pasajes pianos y ligados, etc. Esta gestualidad nos llega a travs
de las marcas de los sonidos. Entre esas marcas est habitualmente el hecho de que
el nmero de armnicos superiores crezca en funcin de la energa con la que se ha
atacado la tecla, ataque y energa que cambian constantemente a lo largo de una interpretacin. Hablando en general, el nmero y la importancia de los armnicos no
es una caracterstica ja propia del sonido de un instrumento, ni siquiera de la misma
256
nota del mismo instrumento, sino que en buena medida depende de la voluntad del
intrprete.
11.3. Rasgos tmbricos dependientes de la evolucin de los parmetros del sonido

A continuacin vamos a examinar los rasgos tmbricos derivados de la modicacin
de los parmetros de amplitud y frecuencia a lo largo del tiempo de emisin de la nota
o, dicho de otra manera, vamos a analizar cmo las envolventes, tanto de amplitud
como de frecuencia, afectan a la caracterizacin tmbrica de los sonidos musicales, en
particular los sonidos emitidos por instrumentos acsticos y por la voz humana.
11.3.1. Marcas tmbricas y envolvente de amplitud

La evolucin de la amplitud del sonido en su conjunto tiene especial inters para caracterizar el timbre de cada sonido. Para tener una aproximacin a la evolucin de la
amplitud he elegido un fragmento de la seal de audio de una determinada duracin
y he calculado el valor medio de su amplitud. La reiteracin de este procedimiento,
desplazando suavemente esta ventana de observacin a lo largo de la duracin de toda la nota, nos proporciona una aproximacin a la envolvente de amplitud. Como en
el caso del espectrograma, tambin ahora en funcin de la duracin de la ventana de
observacin elegida obtendremos resultados diferentes: si se elige una ventana muy
corta obtendremos una evolucin de la amplitud muy accidentada, llena de alteraciones, mientras que si se elige una ventana muy larga, la grca ser ms suave, pero
el seguimiento temporal de la evolucin de la amplitud ser menos preciso. En los
siguientes ejemplos he optado por hacer un seguimiento intermedio de la evolucin
temporal, por lo que he elegido para la ventana de observacin una duracin de 30
milsimas de segundo.
Debajo presento dos grcas en las que se muestra la envolvente de amplitud de las
notas sol3 dadas, respectivamente, por el piano y el violn, las mismas que he utilizado
257
en el vdeo de la gura 11.7. Junto a la envolvente se muestra tambin la forma de la

seal en el tiempo.
Figura 11.9: Envolvente de amplitud de una nota de piano.
Figura 11.10: Envolvente de amplitud de una nota de violn.
258
En ambas guras vemos que en un tono azul grisceo, que se funde casi con el azul del
fondo de la grca, se ha trazado la seal de audio, es decir, la forma de la vibracin de
ese sonido. En esta ocasin la representacin de la seal de audio no permite apreciar
los detalles de la vibracin, como suceda en las representaciones de los osciloscopios
simulados que hemos visto en los captulos anteriores, sino que es el resultado de
haber hecho un gran zoom negativo sobre ella, como si observramos la seal desde
muy lejos. Se ha perdido todo el detalle y solamente se aprecia el aspecto global de
la evolucin de la amplitud, que es precisamente lo que nos interesa ahora.
La lnea que se destaca en amarillo representa la envolvente de amplitud, la evolucin
de la amplitud a lo largo del tiempo. Podemos comprobar que, en lneas generales,
la grca de la envolvente sigue bastante de cerca la forma de la seal de audio comprimida, como si quisiera envolverla. Si escuchamos con atencin las notas del vdeo
de la gura 11.7 mientras vemos estas grcas de sus envolventes de amplitud, reconoceremos con facilidad que reejan lo que omos.
En las dos grcas observamos al principio y al nal unas pequesimas oscilaciones
de la lnea amarilla, que corresponden al ruido de ambiente presente en el lugar en el
que se han hecho las grabaciones (ambas han sido grabaciones domsticas realizadas
con un micrfono de nivel medio del tipo USB para ordenador).
Fijmonos primero en la grca de la envolvente del piano (gura 11.9). Podramos
distinguir tres partes en esta grca amarilla. La primera parte, que corresponde al
ataque inicial, tiene un carcter muy abrupto, pues crece bruscamente desde el inicio
de la nota hasta el pico mximo, que en esta grca se sita aproximadamente en el
segundo 1,3. Ahora bien, su crecimiento no es uniforme. Comienza con una lnea
casi vertical que se queda en torno a un valor de 0,18, sin llegar todava a su valor
mximo, una lnea que reeja un cambio casi instantneo y que se corresponde con
el ruido inicial que acompaa al ataque en la nota de piano, como hemos visto al
analizar el contenido espectral. Luego la grca sigue todava creciendo de forma
rpida, pero ya no tan abrupta, hasta alcanzar en el segundo 1,3 el pico mximo, es
decir, una amplitud de aproximadamente 0,34. La segunda parte de la grca comienza en este pico mximo, cuando se inicia un declive con bastante pendiente,
y dura aproximadamente hasta el segundo 2. Y en la tercera parte, que comienza
en este segundo 2, la grca contina descendiendo, pero ahora de una forma mucho ms lenta y mantenida, hasta que se produce el levantamiento de la tecla, lo que
259
ocurre poco antes del segundo 5. Esta evolucin de la envolvente de amplitud es caracterstica de las notas del piano. En esencia consiste en un ataque muy rpido y una
doble amortiguacin, la primera relativamente rpida y la segunda muy prolongada
y sostenida.
Si comparamos la grca de la envolvente de amplitud del piano con la de la envolvente de la nota de violn (gura 11.10) nos damos cuenta de que las diferencias
son muy grandes. El ataque es ahora suave y va creciendo poco a poco; las formas
generales son poco marcadas y ms bien redondeadas; la evolucin de la amplitud
general se aproxima aqu a una forma circular; y, lo que viene a ser el rasgo ms
caracterstico de la envolvente de amplitud del violn, la lnea general de la evolucin est constantemente llena de alteraciones, que se corresponden con apreciables
oscilaciones en el volumen sonoro de la nota, resultado de la variacin de la presin
del arco sobre la cuerda.
Pero creo que conviene insistir un poco ms en la importancia que tiene para nuestra percepcin de la cualidad tmbrica de un sonido su envolvente de amplitud. En
efecto, si modicamos articialmente la evolucin de la amplitud general de un sonido, el cambio en el timbre que percibiremos ser enorme. Voy a poner un ejemplo
muy sencillo que servir para comprobar la decisiva inuencia que posee la evolucin de la amplitud general en la determinacin del timbre. Este ejemplo, de paso,
nos ayudar tambin a entender cmo nuestra percepcin auditiva est congurada
para colaborar con el resto de los sistemas sensoriales en la tarea de captar la evolucin
de la realidad externa. He grabado una pequea frase de piano con ocho notas que
alternan los valores de blancas y negras formando un ritmo troqueo constante. Las
notas son las siguientes: re4 , do4 , mi4 , fa4 , sol4 , la4 , re4 , la3 . Con ayuda de un editor
de audio he copiado la seal y la he pegado a continuacin, pero ahora invirtiendo
el orden temporal, es decir, haciendo que la seal vaya de atrs a adelante, con lo
que el resultado que he obtenido ha sido una seal formada por dos partes iguales
simtricas.
260
Figura 11.11: Vdeo con el espectrograma de una meloda de piano y su retrogradacin.
Como se puede comprobar en el vdeo, las dos partes son totalmente idnticas, a
excepcin de que la segunda es una repeticin de la primera, pero en el orden inverso.
Esto resulta tambin claro si nos jamos en el orden y en el ritmo de las notas. El ritmo
en la segunda parte es una sucesin de yambos, es decir, de negras y blancas. Las notas
son las mismas que las de la primera parte, pero en orden inverso: la3 , re4 , la4 , sol4 , fa4 ,
mi4 , do4 , re4 . El nmero de componentes armnicos de cada nota y su importancia
relativa tiene que ser, por lo tanto, el mismo y, sin embargo, el sonido es totalmente
distinto. Cuando escuchamos la segunda parte del vdeo nunca pensaramos que est
sonando un piano. Tal vez, si acaso, una armnica o algn instrumento similar. Para
facilitar este efecto he elegido a propsito una frase musical que al ser oda en orden
inverso tenga un cierto aire de meloda de pelcula del oeste. Pongo a continuacin
la grca de las correspondientes envolventes de amplitud.
261
Figura 11.12: Envolvente de amplitud de las melodas, directa y retrgrada, del vdeo de la gura
11.11.
La grca de las envolventes explica lo que ha sucedido. Efectivamente, el piano

es un instrumento de percusin, por lo que el ataque es muy rpido y la amplitud
comienza a decrementarse casi inmediatamente despus del inicio. Nadie espera que
una nota de piano suba de volumen a lo largo de su emisin, sino que lo que se espera
es que se vaya poco a poco apagando. Por el contrario, en la segunda parte del vdeo,
al escuchar unas notas que van aumentando su intensidad, hemos imaginado que
han sido emitidas por un instrumento cuyos sonidos son capaces de recibir energa
despus del ataque y, por eso, de aumentar su amplitud con el paso del tiempo, como
ocurre, por ejemplo, con la armnica, en la que el instrumentista puede incrementar
la intensidad del soplo durante la emisin de las notas e interrumpirlo bruscamente
entre nota y nota. Por ello, al invertir el orden temporal de la seal se ha invertido la
evolucin de la amplitud y el sonido ha dejado de sonar como un piano, pues nunca
la amplitud del sonido de una nota del piano evolucionara as. Esa deduccin de
nuestro cerebro es lo que ha modicado tan rotundamente nuestra percepcin del
sonido.
262
11.3.2. Marcas tmbricas y envolvente de frecuencia

Como ya he comentado al estudiar los rasgos tmbricos que dependen del contenido
espectral, la evolucin de la frecuencia es una marca tmbrica muy signicativa. De
hecho, establece la diferencia entre instrumentos de anacin libre, cuya envolvente
de frecuencia sigue las intenciones del intrprete, e instrumentos de anacin ja,
cuya envolvente de frecuencia es, en general, una lnea horizontal. As mismo, el
rango de variacin de la envolvente de frecuencia en los instrumentos de anacin
libre es muy distinto. Por ejemplo, el violn permite con facilidad portamentos que
pueden unir notas muy alejadas, lo que puede dar lugar a envolventes de frecuencia
muy extendidas, mientras que las variaciones de frecuencia que permite una auta
durante un soplo mantenido son ms bien pequeas y, por lo tanto, su envolvente
de frecuencia es bastante reducida.
Por otra parte, los instrumentos de anacin libre permiten que el intrprete fabrique su propio vibrato, un recurso que constituye una parte muy importante en la
caracterizacin de su sonido. La diferente profundidad y ritmo del vibrato vienen
a ser como una especie de sello de marca del instrumentista, que dibuja su rma en
la envolvente de frecuencia.
A modo de ejemplo, voy a comentar cmo la ejecucin de una nota de violn dada
con vibrato queda reejada en su envolvente de frecuencia. Se trata de la nota sol5 del
vdeo de la gura 11.5. Es muy sencillo obtener una representacin de la envolvente
de frecuencia a partir del espectrograma. Puesto que en un sonido armnico la frecuencia de todos los componentes evoluciona en paralelo, basta con determinar en el
componente fundamental (o en cualquier otro que nos interese, pero dividiendo su
valor por el nmero de armnico del que se trate) la frecuencia que ha alcanzado la
mxima amplitud en cada momento (es decir, la frecuencia del pixel ms luminoso)
y representar este dato en una nueva grca.
263
Figura 11.13: Envolvente de frecuencia de una nota de violn con vibrato.
Al reducir la representacin de las frecuencias al estrecho margen de la zona en la

que se mueve la nota de violn sol5 (en este caso de 776 Hz a 796 Hz), se obtiene
mayor claridad. Para evitar que la observacin de esta grca nos cause una impresin
equivocada, debemos tener en cuenta que la variacin de la frecuencia a lo largo de
los 1,7 segundos aproximados que dura la nota no llega a los 20 Hz y que en su mayor
parte no sobrepasa los 14 Hz. En realidad este movimiento que constituye el vibrato
es muy sutil y se mueve en la esfera de la microtonalidad.
Observamos que el valor medio de la nota se mantiene en torno a 789 Hz. Sin embargo, la frecuencia esperada en funcin de la anacin de la nota anterior, que es
prcticamente la temperada, debera haber sido de 784 Hz. As pues, este aparente
valor medio de la nota en el que se realiza el vibrato est aproximadamente 11 centsimas de semitono por encima. El vibrato permite una mayor exibilidad en la anacin, pues sus oscilaciones camuan cualquier posible batido o interferencia y hace,
adems, que sea ms difcil percibir cualquier desanacin. Ello permite al intrprete
elegir una frecuencia ms alta con una nalidad expresiva sin ningn problema. La
profundidad del vibrato es variada. En esta grca el caso ms extremo corresponde
264
a la oscilacin que se produce entre el segundo 0,9 y el 1 y tiene una profundidad

que va desde 795 Hz a 782 Hz, o sea, unas 28 centsimas de semitono.
Esta grca nos muestra con precisin que el violinista toma la nota desde muy abajo,
en 777 Hz aproximadamente, luego sube hasta prcticamente rozar los 796 Hz y a
partir de ah comienza a realizar unas oscilaciones centradas aproximadamente en
torno a 789 Hz, hasta llegar al nal de la nota, cuando de nuevo desciende tambin
en frecuencia. Este tomar desde abajo, subir y mantenerse y volver de nuevo a caer
al nal es un patrn muy caracterstico para notas mantenidas con vibrato en violn.
Podemos ver tambin en la grca que la distancia temporal entre las oscilaciones es
aproximadamente de 2 dcimas de segundo, lo que se corresponde con 5 oscilaciones
por segundo, que es tambin un ritmo de oscilacin muy habitual en la realizacin
del vibrato de violn.
Para acabar, solo quiero apuntar que la evolucin de la frecuencia, al margen de dejar
una marca clara del tipo de instrumento del que se trata, es tambin un medio muy
ecaz para transmitir mediante el propio sonido la gestualidad del intrprete. Y en
gran medida es a travs de esa gestualidad como el intrprete comunica a quien le
escucha una parte importante de su emotividad.
11.4. Conclusin
El timbre del sonido es como su sello particular. En este captulo hemos podido
observar que el conjunto de marcas tmbricas dejan su huella principalmente en el
contenido espectral de cada sonido musical y en sus envolventes de frecuencia y amplitud. Estas marcas diferencian la sonoridad caracterstica de un tipo de instrumento
de la de otro, la de cada instrumento particular, la de las distintas notas que emite cada
instrumento, la propia de cada instrumentista e incluso la que posee la misma nota emitida en el mismo instrumento por el mismo instrumentista en los diferentes
momentos de su interpretacin.
265
Captulo 12
Fisiologa de la audicin
12.1.
Introduccin
El sonido no es solamente un acontecimiento fsico, una vibracin mecnica, sino

tambin un fenmeno psquico: la imagen que la vibracin acstica produce en nuestra mente. Esa imagen est condicionada por las caractersticas de nuestro receptor,
el odo. Por ello, para entender la manera en la que escuchamos el sonido musical
es necesario conocer cmo es y cmo funciona el odo humano, pues es en el odo
donde se transforma la vibracin mecnica que llega del exterior en un conjunto de
impulsos nerviosos que posteriormente sern enviados al cerebro, donde se elaborar
nuestra imagen acstica.
En este captulo vamos a estudiar la morfologa y la funcin de cada una de las partes
del odo: las zonas que recogen la vibracin sonora del exterior, las que adecan su
presin a los uidos del odo interno y las que realizan el anlisis frecuencial extrayendo los diferentes componentes de la vibracin y transformndolos en impulsos
elctricos que llegarn al cerebro mediante el nervio auditivo. Empezaremos con una
visin general de la anatoma del odo humano y luego nos detendremos en estudiar
cmo es y cmo se comporta la cclea.
266
12.2.
El odo humano
Nuestro odo est formado por tres partes anatmica y funcionalmente diferentes:
el odo externo, el odo medio y el odo interno. Veamos un dibujo esquemtico de
las partes del odo. Es una adaptacin de la Figura 1 del captulo 2 de Structure and
function del curso Hearing, en Open Learn (The Open University).
Figura 12.1: Seccin transversal del odo.
En la gura vemos las tres partes del odo:
a) El odo externo
En el odo externo el pabelln auditivo concentra, a modo de trompa, las ondas sonoras del exterior y las encauza a travs del canal auditivo externo hasta
el tmpano, la membrana que separa el odo externo del odo medio. El canal
auditivo externo mide aproximadamente 25 mm de longitud y 7 mm de dimetro.
267
La membrana timpnica tiene una forma ligeramente cnica y se mueve hacia dentro y hacia fuera siguiendo las variaciones de la presin del aire que constituyen la
vibracin sonora y que le llegan por el canal auditivo.
b) El odo medio
El odo medio es una cmara llena de aire en cuyo interior se halla una cadena de
huesecillos u osculos, llamados por su forma martillo, yunque y estribo, que sirven
para transmitir las vibraciones sonoras desde la membrana timpnica hasta el odo
interno. Para lograrlo, el mango del martillo est unido al tmpano, mientras que la
base del estribo est en contacto con la membrana de la ventana oval, a travs de
la cual penetran las vibraciones sonoras en la cclea, que es la parte del odo interno
dedicada a la audicin.
La principal funcin del odo medio es posibilitar el incremento de presin
necesario para que la energa de la vibracin sonora del aire exterior se transmita eficazmente a los fluidos acuosos que llenan el odo interno. En efecto,
puesto que el agua tiene mayor impedancia acstica que el aire (es decir, presenta
mucha ms resistencia a la transmisin de la vibracin), si no hubiera un mecanismo
que aumentara la presin de las vibraciones, una gran parte de la energa sonora sera
absorbida o reejada por los uidos acuosos de la cclea, tal como sucede si tratamos
de hablar a una persona que est sumergida en el agua.
Este incremento de la presin se logra principalmente porque la supercie del tmpano que vibra (la membrana que est en contacto con el aire exterior) es unas 17
veces mayor que la supercie de la membrana de la ventana oval (la que est en contacto con el lquido acuoso que hay en el interior de la cclea). De esta manera se
consigue un aumento de presin de unas 17 veces. Adems, la accin de palanca que
ejerce la cadena de huesecillos del odo medio tambin contribuye al incremento de
presin. En su posicin habitual, los osculos pueden aumentar 1,3 veces aproximadamente la presin que llega hasta la ventana oval. As pues, la accin combinada de
ambos mecanismos puede lograr un aumento de presin de unas 22 veces, con lo
que la membrana de la ventana oval va a ser ya capaz de transmitir de forma ecaz
la vibracin sonora a los lquidos que estn en el interior de la cclea.
268
Otra funcin muy importante del odo medio es la proteccin del delicado odo
interno frente a sobrepresiones que podran daarlo. Cuando la intensidad sonora
excede los niveles de tolerancia se activa un mecanismo reejo mediante el cual dos
pequeos msculos que actan sobre el martillo y sobre el estribo (no incluidos en
el dibujo) pueden bloquear la articulacin de los osculos, limitando en gran medida
la transmisin de las vibraciones.
El odo medio comunica con el exterior a travs de la trompa de Eustaquio, un conducto de unos 4 mm de longitud que termina en la regin nasofarngea. La trompa
de Eustaquio, que habitualmente est cerrada, se abre con la deglucin y con el bostezo. Tiene la nalidad de igualar la presin de aire del odo medio con la del exterior
y as permitir que el tmpano pueda vibrar libremente en su posicin idnea.
c) El odo interno
El odo interno, tambin llamado laberinto, est formado por una estructura sea
hueca situada en el hueso temporal y consta de diferentes partes delimitadas por conguraciones seas y membranosas. Su interior est lleno de dos lquidos acuosos: la
perilinfa en las zonas exteriores, que estn en contacto con el hueso; y la endolinfa en
las interiores, rodeadas por membranas. Mientras que la composicin de la perilinfa
es similar a la de otros uidos extracelulares del cuerpo humano, como el lquido cefalorraqudeo, la endolinfa es una sustancia especca del odo interno y se caracteriza
por contener una cantidad muy elevada de iones positivos de potasio (K+).
El odo interno cumple dos funciones. Por un lado, sirve para contribuir al mantenimiento del equilibrio corporal, lo cual se realiza mediante el sistema vestibular o
laberinto posterior, que est formado por el vestbulo y los tres canales semicirculares. Por otro lado, y en lo que a la actividad acstica se reere, el odo interno sirve
para transformar las vibraciones mecnicas que provienen del odo medio en
impulsos elctricos, lo que se produce en el laberinto anterior, llamado por su
forma cclea o caracol. Ambas tareas son llevadas a cabo por clulas sensoriales pilosas capaces de trasformar los movimientos mecnicos en variaciones de la tensin
elctrica, las cuales son codicadas y transmitidas al cerebro por los nervios vestibular
y coclear respectivamente. Estos dos nervios se juntan inmediatamente despus del
269
odo y forman el nervio vestibulococlear, tambin llamado VIII par craneal, el cual
conduce la informacin procedente del odo interno al cerebro.
Puesto que en este captulo nos estamos ocupando de la siologa de la audicin,
dejaremos de lado lo que concierne al sistema vestibular, el encargado del equilibrio,
para dedicarnos a la parte del odo interno en el que se producen los fenmenos
relacionados con la audicin, es decir, a la cclea.
Pero antes de examinar con ms detalle la estructura de la cclea, veamos un vdeo
didctico que nos explica muy bien el mecanismo mediante el cual las ondas sonoras
procedentes del exterior son transmitidas por las distintas partes del odo y transformadas en impulsos elctricos, fenmeno que se denomina transduccin auditiva.
El vdeo Auditory Transduction ha sido creado por Brandon Pletsch y los subttulos
en espaol se deben a Hermes Carreo y Oscar Guillermo.
Figura 12.2: Vdeo que muestra un panorama general de la audicin.
270
12.3.
La cclea
La cclea es la parte del odo interno donde se transforma la informacin auditiva que contiene la vibracin sonora en impulsos nerviosos. En primer lugar,
la cclea acta como un analizador mecnico de frecuencias, descomponiendo mediante resonancias la forma de la vibracin sonora en sus componentes sinusoidales;
en segundo lugar, transforma esa informacin frecuencial en seales elctricas; y,
nalmente, codica todo ese conjunto de datos en impulsos nerviosos que son transmitidos al cerebro.
Para estudiar cmo est constituida la cclea voy a ir presentando una serie de ilustraciones en las que podremos observarla desde diferentes perspectivas. En ellas iremos
avanzando desde una visin general a otra cada vez ms detallada. En todas las ilustraciones he utilizado los mismos colores para representar las distintas partes de la
cclea: en color beige estn las partes seas; en color rojizo, las membranosas; en
color amarillo, las nerviosas; en azul, las reas ocupadas por la perilinfa; y en verde,
las ocupadas por la endolinfa.
12.3.1. Descripcin general de la cclea

La cclea est formada por un armazn seo hermticamente cerrado, lleno
de fluidos acuosos, que contiene en su interior diversas membranas, clulas
sensoriales y fibras nerviosas. La cclea comunica con el odo medio a travs de
dos oricios cerrados por sendas membranas (gura 12.1): la ventana oval, mediante
la cual el estribo provoca las variaciones de presin en los uidos que llenan los canales
del interior de la cclea; y la ventana redonda, mediante la cual se compensan las
variaciones de presin que han sido introducidas por el estribo.
Veamos dos ilustraciones que presentan el aspecto general de la cclea. Estn basadas
en dibujos antiguos, aunque he coloreado cada zona siguiendo los criterios que acabo
de mencionar.
271
Figura 12.3: Ilustracin del aspecto general de la cclea.
La ilustracin de la izquierda representa la parte sea de la cclea. Consiste en una

especie de cilindro hueco de aproximadamente 2 mm de dimetro que se enrolla
sobre s mismo de manera helicoidal unas dos veces y media en torno a un eje seo
llamado modiolo. Su aspecto recuerda al de la concha de un pequeo caracol (la
palabra cclea procede del trmino griego kochlas, caracol). La cclea est incrustada
en el hueso temporal. Su anchura en la base es de algo menos de 1 cm y su altura, desde
la base hasta el pex, es de unos 5 mm. La longitud de la cclea humana desenrollada
es de aproximadamente 35 mm. Esta ilustracin incluye tambin la lmina espiral
que divide, sin llegar a cerrarlo, el interior de la cclea en dos conductos principales,
el superior y el inferior.
En la ilustracin de la derecha se representa lo que veramos si hubiramos retirado
la pared exterior de la cclea. Ahora podemos distinguir el modiolo, que forma la
pared interna de la cclea; la lmina espiral, que surge del modiolo; la membrana
basilar, que completa la divisin principal del interior de la cclea; y el borde del
ligamento espiral, en color naranja, mediante el cual la membrana basilar queda
sujeta a la pared exterior de la cclea.
La membrana basilar sigue todo el recorrido espiral de la cclea, pero no es igual a
lo largo de toda su longitud, sino que es ms estrecha en la parte basal donde mide
aproximadamente 0,1 mm de ancho y ms ancha en la parte apical donde mide
unos 0,5 mm. Conforme la membrana basilar gana en anchura, la lmina espiral va
272
hacindose ms estrecha. Adems, la membrana basilar es unas 100 veces ms rgida

en la parte basal que en la apical. El ligamento espiral que sujeta la membrana basilar
a la pared externa de la cclea contribuye a proporcionarle la tensin adecuada que
debe tener en cada punto de su longitud.
La divisin del interior de la cclea en dos canales principales, llenos de uidos acuosos y separados por una membrana elstica cuya rigidez vara a lo largo de su longitud, explica el comportamiento de la cclea como analizador mecnico de espectro.
Como veremos ms adelante, la diferente elasticidad de la membrana basilar en cada
punto de su longitud otorga a cada localizacin espacial una frecuencia natural de resonancia. De esta manera, la membrana basilar resuena en diferentes localizaciones en
funcin de los componentes sinusoidales que estn presentes en la vibracin sonora
que recibe: los componentes graves generan resonancias en la zona de la membrana
basilar situada en la parte apical de la cclea, mientras que los agudos resuenan en la
zona basal. Esta propiedad de la membrana basilar se denomina tonotopa (del griego
tnos, altura tonal, y tpos, lugar, espacio).
12.3.2. Estructura interna de la cclea

Pero para poder realizar las tareas de transduccin mecano-elctrica y de codicacin
neuronal la cclea necesita tener una estructura ms compleja. Veamos ahora un
esquema del odo en el que se representa un corte longitudinal de la cclea como si
estuviera desenrollada.
Figura 12.4: Ilustracin de un corte longitudinal de la cclea desenrollada.
273
La novedad ms destacada que observamos en este dibujo respecto a los anteriores

es que ahora en el interior de la cclea vemos tres canales bien diferenciados. En
realidad, el canal superior de la cclea est subdividido en dos canales independientes: el canal o rampa vestibular y el canal medio o canal coclear.Esta
divisin del canal superior en dos canales se realiza mediante una membrana muy
na, de unos 12 micrmetros de grosor, llamada membrana de Reissner. Vemos
tambin que la membrana basilar recorre casi toda la longitud de la cclea, hasta
llegar a la zona apical, donde existe una abertura, llamada helicotrema, que comunica el canal vestibular con el canal inferior. El canal inferior recibe tambin el
nombre de canal o rampa timpnica.
Como se puede ver en la ilustracin, los tres canales del interior de la cclea estn
llenos de dos tipos de uidos acuosos de diferentes caractersticas electroqumicas: la
perilinfa, sealada en color azul, y la endolinfa, en color verde. El canal vestibular
y el canal timpnico, contienen perilinfa, mientras que el canal medio tiene en
su interior endolinfa, el lquido especco del odo interno, caracterizado por ser
muy rico en iones positivos de potasio (K+).
El canal vestibular comienza en el vestbulo del odo interno, desde donde comunica
con el odo medio a travs de la membrana de la ventana oval. Puesto que la ventana oval est en contacto directo con la base del estribo del odo medio, cuando ste
hace oscilar la membrana de la ventana oval, las vibraciones mecnicas ocasionadas
por los cambios de presin del aire debidos al sonido son transmitidas inmediatamente a la perilinfa del canal vestibular. Y estas vibraciones son comunicadas, casi
instantneamente, al canal timpnico a travs de la membrana basilar.
El canal timpnico se comunica con el odo medio a travs de la ventana redonda,
un oricio en el hueso de la cclea cerrado por una membrana. A diferencia de la
ventana oval, esta membrana es pasiva y solamente sirve para compensar los aumentos y disminuciones de la presin que se producen en el interior de la cclea como
consecuencia de la oscilacin de la membrana de la ventana oval, variaciones que
llegan al canal timpnico mediante la deformacin de la membrana basilar. Cuando la membrana oval penetra en el interior del canal vestibular, la membrana de la
ventana redonda se abomba hacia afuera, es decir, hacia el espacio del odo medio;
por el contrario, cuando la membrana oval retrocede, la membrana de la ventana
redonda penetra en el canal timpnico de la cclea. Si no existiera esta ventana re274
donda, los uidos acuosos del interior de la cclea, al ser incompresibles, no podran
vibrar.
El canal medio o conducto coclear es un contenedor de endolinfa. A pesar de la nura
de la membrana de Reissner, su impermeabilidad impide a la endolinfa mezclarse con
la perilinfa del canal vestibular. Por su diferente constitucin electroqumica, entre
la endolinfa y la perilinfa existe una diferencia de potencial de unos 80 mV, y gracias
a esa diferencia de potencial la cclea puede realizar la transduccin de las seales
mecnicas en seales elctricas, como veremos ms adelante.
Hay que tener en cuenta, por otra parte que, debido a su nura, la membrana de
Reissner no supone obstculo alguno a la vibracin de los uidos. De esta forma, en
lo que concierne a la funcin de la cclea como analizador mecnico de espectro, el
canal vestibular y el canal medio se comportan como si se tratara de un solo canal, el
canal superior del dibujo de la izquierda de la gura 12.3.
En la gura 12.4 podemos ver tambin, ligeramente dibujadas, las bras nerviosas que
salen de la cclea y que forman el nervio coclear. Este nervio ser el encargado de
llevar al cerebro la informacin auditiva convertida ya en impulsos nerviosos.
Pero para apreciar mejor cmo se organizan estas estructuras nerviosas, es oportuno
observar el interior de la cclea desde otra perspectiva. Veamos una ilustracin que
representa las dos vueltas y medio de la cclea cortada transversalmente. En ella, para
mostrar las estructuras nerviosas, se ha prescindido de la pared sea interior y de la
lmina espiral. Los autores son Guy Rebillard y Rmy Pujol y la ilustracin procede
de Voyage au centre de laudition.
275
Figura 12.5: Ilustracin de un corte transversal de la cclea.
Podemos distinguir en cada vuelta de la cclea los tres canales que hay en su interior
el canal vestibular, el canal medio y el canal timpnico, cada uno de ellos pintado
en el color que representa el uido acuoso que contiene. Pero lo ms interesante de
esta ilustracin es que nos permite apreciar cmo es el ganglio espiral, el cual se
forma de la reunin de las bras nerviosas que se conectan al epitelio sensorial de la
membrana basilar, el llamado rgano de Corti. Vemos que el ganglio espiral recorre
prcticamente toda la longitud de la cclea y tambin que de l surge el haz nervioso
que forma el nervio coclear.
Y para concluir el estudio de la organizacin interna de la cclea, examinemos sus
partes con un poco ms de detalle. Veamos un dibujo esquemtico de las reas que se
podran distinguir en un corte transversal de una sola vuelta de la cclea. Est basada
en un dibujo muy difundido en internet. Lo he modicado para hacer coincidir los
colores con los del resto de las ilustraciones de la cclea y, sobre todo, para delimitar
276
con precisin las zonas ocupadas por la endolinfa de aquellas otras ocupadas por la
perilinfa, particularmente en la zona inferior del canal medio.
Figura 12.6: Ilustracin de un corte transversal de una vuelta de la cclea.
En la gura reconocemos las partes de la cclea que hemos visto en los dibujos anteriores, si bien ahora, al ser representadas desde otra perspectiva, podemos apreciarlas
mejor. As, reconocemos la cclea sea, con la pared exterior, el modiolo y la lmina
espiral que sale de l; la membrana basilar, de la cual ahora podemos ver con claridad
que completa la divisin del interior del cilindro coclear en los dos canales principales; los tres canales llenos de lquido del interior de la cclea, el canal vestibular,
el canal medio y el canal timpnico; el ligamento espiral, que sujeta la membrana
basilar a la pared exterior de la cclea; y el ganglio espiral, situado en el interior del
modiolo, que va a converger en el nervio coclear.
Pero adems, esta ilustracin nos muestra otras estructuras que hasta ahora o no haban sido representadas o no lo haban sido con suciente claridad. Vemos la estra
vascular, el epitelio que recubre el ligamento espiral y que cierra el recinto del canal
medio por la parte externa, encargndose de dotar de abundantes iones positivos de
potasio a la endolinfa de ese canal. Tambin podemos ver con claridad el epitelio
sensorial situado sobre la membrana basilar, el rgano de Corti, en el que pode277
mos identicar las clulas pilosas externas e internas, as como los espacios llenos de
perilinfa que hay entre ellas. As mismo, ahora est dibujada la membrana tectorial, una estructura gelatinosa contra la que chocan las vellosidades las clulas pilosas
del rgano de Corti. Y, nalmente, podemos apreciar las terminaciones nerviosas
que conectan las clulas sensoriales del rgano de Corti y que forman el ganglio
espiral.
Por otra parte, este dibujo es muy til para determinar con precisin qu zonas del
interior de la cclea estn ocupadas por perilinfa y cules otras estn ocupadas por la
endolinfa. En efecto, ahora podemos apreciar con ms exactitud los lmites del canal
medio, en el que est encerrado el uido endolinftico, lo cual es muy importante
para entender cmo se realiza la transduccin mecano-elctrica.
Podemos distinguir sin dicultad los lmites del canal medio por la zona superior
y por la exterior: por un lado, la membrana de Reissner separa por arriba el canal
medio del canal vestibular y, por el otro, la estra vascular delimita el canal medio
por la zona exterior de la cclea.
Y ahora podemos delimitar con ms claridad los bordes inferiores del canal medio, en
la zona donde est ubicada la membrana basilar y el rgano de Corti. En el dibujo este
lmite inferior aparece delineado en color rojo. En lneas generales, se puede decir
que ese lmite est formado por la parte superior del epitelio sensorial que recubre la
membrana basilar. Pero, si nos jamos un poco, podemos apreciar que no es todo el
epitelio sensorial, sino que las vellosidades de las clulas sensitivas del rgano de Corti
estn dentro del canal medio y, por lo tanto, estn baadas en endolinfa, mientras
que el cuerpo de esas clulas ya permanece fuera del canal medio, en contacto directo
o indirecto con la perilinfa que proviene del canal timpnico. Pero esto lo veremos
con ms detalle a continuacin, al estudiar el rgano de Corti.
12.3.3. El rgano de Corti

El rgano de Corti es un epitelio sensorial que est situado sobre la membrana basilar
a lo largo de todo su recorrido, por lo que vibra solidariamente con ella. El rgano
de Corti es el encargado de transformar los movimientos vibratorios resonantes de
la membrana basilar en variaciones de la tensin elctrica, las cuales posteriormente
278
sern codicadas por las neuronas del ganglio espiral y convertidas en impulsos nerviosos. Para entender cmo se produce la transduccin mecano-elctrica es conveniente estudiar antes, con un poco de detenimiento, cmo est organizado el rgano
de Corti.
Veamos una ilustracin de un pequeo segmento del rgano de Corti, creada por
Robert Jackler y Christine Gralapp, que se encuentra en la pgina Ear Anatomy,
Stanford School of Medicine. He cambiado algunos colores para adecuarlos a los ilustraciones anteriores.
Figura 12.7: Ilustracin de un segmento del rgano de Corti.
A la izquierda del dibujo tendramos el modiolo, como podemos deducir por la presencia del ganglio espiral, mientras que a la derecha se encontrara la pared exterior
de la cclea.
En el rgano de Corti hay dos tipos de clulas: las clulas sensitivas, llamadas por
su aspecto clulas pilosas, y otros tipos de clulas que les sirven de aislamiento, de
soporte y de relleno.
279
Las clulas pilosas son las clulas mediante las cuales propiamente se realiza la
transduccin mecano-elctrica. En todo el epitelio sensorial hay unas 15.000 o
16.000 clulas pilosas. La longitud media de estas clulas es de unos 50 micrmetros.
Su dimetro es inferior a los 10 micrmetros. De la membrana de la parte superior
de cada una de las clulas pilosas salen una especie de vellosidades rgidas, llamados
estereocilios. En cada clula pilosa hay aproximadamente un centenar de estereocilios, unidos entre s y agrupados en un ramillete. Los estereocilios de cada ramillete
tienen distinta longitud (los ms largos miden unos 6 micrmetros) y estn ordenados por su altura, de tal modo que el estereocilio ms largo est hacia el exterior de
la cclea y los ms cortos hacia el interior.
Por su forma y su funcin se distinguen dos tipos de clulas pilosas: las clulas pilosas
internas, ms prximas a la pared interna de la cclea, y las clulas pilosas externas,
ms prximas a la pared externa.
Las clulas pilosas internas son clulas exclusivamente sensoriales. Tienen una forma
bulbosa, similar a la de una pera, y se disponen en una sola hilera. En total hay unas
3.500 clulas pilosas internas dispuestas a lo largo de la membrana basilar. Su tamao
no presenta muchas variaciones. Estn rodeadas por otras clulas no sensoriales que
les sirven de soporte y de aislamiento. Hacia la parte exterior se encuentran las clulas
pilares que forman el tnel de Corti, un hueco que est lleno de perilinfa.
Por su parte, las clulas pilosas externas tienen un cuerpo cilndrico. Se agrupan en
las de tres o de cuatro clulas y tambin se disponen en hileras. Hay unas 12.000
clulas pilosas externas, distribuidas a lo largo de la membrana basilar. Las clulas
pilosas externas estn ancladas en otras clulas que las soportan. Entre ellas hay espacios llenos de perilinfa, los llamados espacios de Nuel. La altura de las clulas pilosas
externas vara de la zona basal a la apical de la cclea: en la zona basal miden unos 30
micrmetros, mientras que en la apical llegan a tener hasta los 70 micrmetros.
La caracterstica de las clulas pilosas externas es que son clulas contrctiles: no solamente captan mediante sus estereocilios el estmulo mecnico que reciben, sino que
tambin reaccionan, acortndose o alargndose, en respuesta al estmulo recibido,
de modo que retroalimentan el movimiento mecnico de la membrana basilar en
la localizacin exacta en la que se hallan. Con ello logran que la resonancia en ese
punto sea ms acentuada.
280
Tanto en las clulas pilosas externas como en las internas, los estereocilios estn separados del cuerpo de la clula a la que pertenecen por una especie de pletina. Esta
pletina est unida estrechamente a la supercie de las clulas que bordean cada clula
sensorial y que la aslan de sus vecinas. Mediante esa estrecha unin se crea una lmina
impermeabilizadora capaz de cerrar el canal medio por su parte inferior, impidiendo
a la endolinfa de ese conducto mezclarse con la perilinfa que llena las lagunas que
existen entre las clulas del rgano de Corti, es decir, el tnel de Corti y los espacios
de Nuel. De estas manera, mientras que los estereocilios de cada clula pilosa
estn dentro del canal medio y estn baados por el lquido endolinftico de
ste, el cuerpo de la clula est en contacto directo o indirecto con la perilinfa
que procede del canal timpnico.
Como veremos cuando estudiemos la transduccin mecano-elctrica, esta lmina
impermeable hace que los iones positivos de Potasio (k+) que abundan en la endolinfa solamente puedan pasar al otro lado a travs del cuerpo de las clulas pilosas.
La exin de los estereocilios al chocar contra la membrana tectorial, como consecuencia de la vibracin de la membrana basilar, abrir o cerrar los canales inicos,
permitiendo o impidiendo el establecimiento de una corriente elctrica entre la endolinfa y la perilinfa.
Para hacernos una idea de la disposicin de los estereocilios de las clulas pilosas
internas y externas, veamos una fotografa realizada con microscopio electrnico de
la parte superior del rgano de Corti, en la que se ha retirado la membrana tectorial.
Est obtenida de la galera de imgenes de Yale Medical Cell Biology.
281
Figura 12.8: Fotografa de las clulas pilosas del rgano de Corti vistas desde arriba.
Vemos la parte superior de las clulas pilosas y de las clulas de soporte, as como
la pelcula impermeabilizadora que forman. Observamos que los estereocilios de las
clulas sensoriales internas estn dispuestos casi en hilera. Y tambin que los estereocilios de las clulas externas tienen una forma casi de uve doble. Aunque ni en
esta fotografa ni en la ilustracin anterior estn representados, los estereocilios estn unidos entre s por unos enlaces exibles situados aproximadamente en el medio
de su longitud, mediante los cuales estn agrupados unos con otros formando un
ramillete.
Adems, los estereocilios poseen en su extremo superior unas pequeas aberturas
cuya puerta, por as decir, est unida mediante un microlamento protenico, el tip
link, al estereocilio contiguo ms alto. Estas aberturas son los canales inicos y se
abren o se cierran en funcin de la mayor o menor separacin de los estereocilios
segn el momento de la oscilacin, permitiendo o impidiendo el paso de los iones
positivos al interior del cuerpo celular.
282
Figura 12.9: Ilustracin de la apertura y cierre de los canales inicos de los estereocilios.
Se podra considerar que las clulas pilosas son los micrfonos de nuestro sistema auditivo. De algn modo, podramos decir que nuestro membrana basilar est equipada
con unos 15.000 micrfonos colocados sobre ella, capaces de recoger y transformar
en seales elctricas las vibraciones de cada una de las localizaciones de esta membrana. Las clulas pilosas internas estn dispuestas de tal modo que forman algo as
como una hilera de 3.500 micrfonos situados sobre la membrana basilar y son la
principal y ms directa fuente de informacin del movimiento de oscilacin de cada
zona de esta membrana. Teniendo en cuenta que la longitud media de la membrana basilar es de 35 mm, la separacin entre las clulas pilosas internas es de unas 10
micras, una separacin ligeramente superior al dimetro de cada clula. As pues, podramos decir que cada 10 micras una clula sensorial recoge, a modo de micrfono,
el movimiento resonante de esa zona de la membrana basilar.
283
12.3.4. El ganglio espiral

Para terminar la descripcin de la cclea, antes de pasar a analizar las funciones que
realiza, nos queda el estudio de su sistema nervioso. El ganglio espiral o coclear recorre el interior de la cclea por un oricio situado dentro del modiolo llamado el
canal de Rosenthal, a la altura de la divisin creada por la lmina espiral y la membrana basilar, como hemos podido ver en las guras 11.5, 11.6, y 11.7. El ganglio
espiral es el encargado de codicar las seales elctricas que provienen de las clulas
pilosas del rgano de Corti y de regular su actividad. Est formado por los cuerpos
de unas 50.000 neuronas.
Las dendritas de estas neuronas establecen sinapsis con las clulas pilosas, mientras
que sus axones constituyen el nervio auditivo o coclear. El conjunto de dendritas y
axones forman las bras nerviosas que comunican el rgano de Corti con los primeros ncleos del cerebro especializados en la audicin. Las bras nerviosas que salen
del ganglio espiral pueden ser imaginadas como lneas de comunicacin entre la cclea y la parte del cerebro dedicada a procesar la informacin auditiva. Veamos una
hermosa ilustracin, realizada por Andra Zariwny.
Figura 12.10: Ilustracin del ganglio espiral.
284
En esta ilustracin podemos apreciar el ganglio coclear, con las dendritas que salen
de l a lo largo de todo su recorrido espiral y los axones que, reunidos en forma de
haz, constituyen el nervio coclear.
Las neuronas aferentes del ganglio espiral codican las seales elctricas recibidas
de las clulas sensoriales del rgano de Corti y transmiten la informacin hacia los
ncleos auditivos del cerebro, en concreto, hacia el ncleo coclear. Por su parte,
las neuronas eferentes reciben informacin desde el complejo olivar superior y la
comunican a las clulas pilosas.
En el ganglio espiral existen dos tipos de neuronas que se diferencian por su morfologa y su constitucin: las llamadas neuronas cocleares de tipo I, bipolares, caracterizadas por tener una dendrita y un axn, ambos gruesos y mielinizados; y las
neuronas cocleares de tipo II, unipolares, con un axn delgado y sin mielina dividido en dos ramas, una de las cuales cumple la funcin de dendrita. Debido a ello,
mientras las neuronas de tipo I dan lugar a bras de conduccin rpida, las bras de
las neuronas de tipo II son ms lentas. El 90 % de las neuronas del ganglio espiral son
del tipo I. Las neuronas eferentes son todas del tipo II, pero las aferentes pueden ser
tanto del tipo I como del tipo II.
La inervacin de las clulas pilosas del rgano de Corti es diferente segn sean internas o externas.
Cada clula pilosa interna es inervada por entre 10 y 15 bras nerviosas aferentes
del tipo I. Adems, cada una de estas bras est conectada solamente con una clula
sensorial interna. De esa manera, para transmitir la informacin que ha generado,
cada clula sensorial interna dispone de entre 10 15 lneas de comunicacin independientes y rpidas. Esto explica el gran porcentaje de neuronas del tipo I que hay
en el ganglio espiral.
Por su parte, cada clula pilosa externa se conecta a unas 6 bras nerviosas aferentes.
Pero la clula tiene que compartir cada bra con unas 10 20 clulas pilosas externas
ms y, adems, las bras nerviosas aferentes son ahora neuronas del tipo II. Por ello la
informacin que transmiten las bras nerviosas que proceden de las clulas sensoriales
externas es mucho ms lenta y mucho menos especializada que la enviada por las
bras nerviosas que proceden de las clulas sensoriales internas.
285
Tanto las clulas pilosas externas como las internas tienen conexiones con neuronas
eferentes, todas ellas del tipo II. En las clulas pilosas internas la conexin no se establece directamente con la clula sensorial, sino con alguna bra nerviosa a la que
est unida. En ese caso la nalidad de estas bras eferentes parece ser el control de las
sinapsis aferentes. En las clulas pilosas externas, que son contrctiles, parece que la
funcin de las neuronas eferentes es el control de su motilidad.
Veamos un sencillo esquema de las conexiones de las clulas sensoriales del rgano
de Corti con las neuronas del ganglio espiral donde se procesa la informacin auditiva.
Figura 12.11: Esquema de las conexiones neuronales del rgano de Corti.
286
12.4.
La cclea como analizador mecnico de frecuencias
El anlisis espectral es la primera de las tres tareas que debe realizar la cclea
para transformar en impulsos nerviosos la informacin sonora contenida en
la vibracin mecnica. Para llevar a cabo este trabajo la cclea cuenta con la membrana basilar y con los uidos acuosos que llenan sus canales.
Este anlisis da lugar a que la informacin frecuencial que contiene la seal en el
tiempo se traduzca en informacin espacial, dando como resultado una organizacin
tonotpica de la membrana basilar. En cierto sentido, el comportamiento de la cclea
como analizador mecnico de frecuencias se asemeja al del piano imaginario de miles
de cuerdas utilizado para explicar la descomposicin espectral en el captulo Anlisis
espectral de los sonidos musicales.
En ambos casos, la deteccin de los componentes frecuenciales que constituyen la vibracin sonora se logra mediante un sistema mecnico de resonancias: en el caso del
piano ideal entran en resonancia las cuerdas que estn anadas a la frecuencia de los
componentes sinusoidales presentes en el sonido analizado; en el caso de la cclea
resuenan aquellas pequeas secciones de la membrana basilar cuyas frecuencias naturales de vibracin coinciden con las de los componentes de la onda
sonora que penetra en el canal vestibular por la ventana oval.
Ahora bien, a diferencia de las cuerdas del piano, la membrana basilar es un continuo.
Su frecuencia de resonancia en cada punto a lo largo de su longitud (la anacin de
ese punto, por decirlo as) depende tanto de la elasticidad de la membrana en esa
localizacin concreta, como de su distancia respecto a la ventana oval. As mismo,
las frecuencias de resonancia de la membrana basilar no se distribuyen linealmente
como en nuestro piano ideal, sino logartmicamente. De hecho, si tomamos como
inicio la zona apical de la membrana basilar, cada 3,5 mm aproximadamente se dobla
la frecuencia, es decir, se aumenta una octava.
12.4.1. Tonotopa de la membrana basilar

La cuestin que hay que explicar ahora es: Cmo es posible que un sistema formado por dos canales llenos de uido acuoso y separados por una membrana elstica de
287
rigidez variable pueda resonar en diferentes localizaciones en funcin de los componentes frecuenciales de la seal de entrada? Recordemos que, en lo que concierne a la
transmisin de la vibracin mecnica, el canal vestibular y el canal medio funcionan
como si se tratara de uno solo, ya que la membrana de Reissner, debido a su nura, no supone obstculo alguno a la transmisin de las vibraciones entre los uidos
acuosos.
Mi exposicin va a seguir el planteamiento propuesto por Jan Schnupp, Israel Nelken y Andrew King en su libro Auditory Neuroscience, Making Sense of Sound (The
MIT Press, 2011), segn el cual la vibracin sonora se propaga por el uido del canal superior y pasa al canal inferior a travs de la membrana basilar justamente en
aquellas localizaciones cuya frecuencia natural de vibracin coincide con la de los
componentes frecuenciales presentes en el sonido analizado.
Veamos, as pues, las razones por las que la membrana basilar resuena en distintas
localizaciones segn la frecuencia de la vibracin que recibe.
Como todo movimiento ondulatorio, la vibracin sonora tiende a buscar el camino
ms fcil, aqul que presenta un obstculo menor. En la cclea, la transmisin de la
onda desde el canal superior al inferior se ve afectada por dos fuerzas cuyos gradientes
van en sentido contrario. Por un lado, la rigidez de la membrana basilar disminuye
conforme se aleja de la ventana oval ofreciendo menos resistencia a la vibracin. Por
otro, la inercia de los lquidos que llenan los canales es mayor conforme la zona est
ms alejada de la ventana oval, pues la cantidad de lquido que la vibracin tendr
que mover ser mayor.
As mismo, el obstculo que supone la inercia depende de la frecuencia de la vibracin: cuanto mayor sea la frecuencia, ms difcil le resultar a la vibracin mover
los lquidos que llenan los canales de la cclea. Para entender esto ltimo nos basta
recurrir a una sencilla experiencia: si tratamos de desplazar en vaivn el lquido de
una botella a medio llenar comprobaremos que, conforme ms rpido lo queramos
hacer oscilar, ms nos costar.
Por todo ello, para una frecuencia determinada de la onda vibratoria, el punto en el que la inercia de los fluidos y la rigidez de la membrana basilar se
compensan ser el punto en el que sta se deformar ms, oscilando en re-
288
sonancia con esa frecuencia y transmitiendo la vibracin al lquido del canal

inferior.
El hecho de que cada componente frecuencial de la vibracin encuentre su propio
camino para transmitirse desde el conducto superior al conducto inferior hace que
las ondas sonoras se dispersen, producindose la descomposicin de la seal en sus
componentes sinusoidales. De este modo se realiza el anlisis espectral.
Este fenmeno es similar al que ocurre con un rayo de luz al que se le hace pasar a
travs de un prisma de cristal. En ese caso, cuando las ondas lumnicas se dispersan
buscando el camino ms ecaz para cada componente frecuencial es decir, para
cada color surge el arco iris. En el caso del sonido, la dispersin que se produce en
la cclea permite que se cree una especie de mapa de frecuencias en la membrana
basilar. Al transmitirse las vibraciones por diferentes zonas de la membrana segn su
frecuencia, los componentes sinusoidales que estn presentes en la seal sonora quedan registrados en diferentes localizaciones espaciales. Esta organizacin tonotpica
va a estar presente a lo largo de todo el camino que lleva la informacin sonora al
cerebro.
Para ayudar a entender todo esto de una manera intuitiva, he fabricado un vdeo
en el que se simula el comportamiento de un analizador mecnico de frecuencias
con una estructura parecida a la de la cclea. Se trata de un cilindro que contiene
en su interior dos canales llenos de lquido, separados por una membrana elstica de
rigidez variable. Ambos canales estn comunicados por una abertura que simula el
helicotrema. Los colores con los que est pintada la membrana siguen la escala del
arcoiris, de manera que los rojos representan las zonas que vibran en resonancia con
las frecuencias bajas y los azules las que vibran con las altas. Por la ventana superior,
que se comporta como la ventana oval, penetra la vibracin mecnica producida
por la onda sonora. La ventana inferior, que imita la ventana redonda, sirve para
compensar los aumentos y disminuciones de presin que se crean en el interior del
cilindro. El aumento y disminucin de la cantidad de partculas que otan en el
lquido simboliza el aumento y la disminucin de la presin de los uidos.
El vdeo simula cuatro situaciones vibratorias diferentes, cada una de ellas con un
solo componente sinusoidal: la primera es una vibracin cuya frecuencia pertenece
a la zona de los infrasonidos, en torno a los 16 Hz; la segunda tiene una frecuencia
289
de 220 Hz, un la3 en la anacin convencional; la frecuencia de la tercera es de 880

Hz, un la5 ; y la de la ltima, 3.520 Hz, un la7 . El vdeo est ralentizado 440 veces. El
sonido es solamente ilustrativo.
Figura 12.12: Vdeo con una simulacin de la resonancia en la cclea.
En el vdeo podemos observar que las vibraciones que penetran en el cilindro pasan
del canal superior al inferior por una u otra zona en funcin de su frecuencia, haciendo resonar la membrana en diferentes localizaciones, a excepcin del primer caso
donde la transmisin de la vibracin se realiza por la abertura del nal que simula el
helicotrema, de modo que la membrana no se ve afectada.
Al estar el vdeo muy ralentizado, podemos apreciar cmo la vibracin introducida
a travs de la ventana elstica superior se compensa mediante la ventana elstica inferior. Vemos que cada vez que, como consecuencia del movimiento vibratorio, la
ventana superior penetra en el cilindro, el aumento de la presin que se crea en su
interior hace que la ventana inferior se mueva hacia fuera; y, a la inversa, cada vez que
la ventana superior sale hacia fuera, la ventana inferior se mueve hacia dentro.
El inicio del vdeo muestra una situacin en la que la frecuencia de la vibracin real
estara por debajo del rango de los sonidos audibles, es decir, sera menor de 20 Hz.
290
Dado que se trata de una frecuencia muy baja, el obstculo que supone la inercia
del lquido es escaso, por lo que el camino elegido por la vibracin para pasar del
conducto superior al inferior es la abertura del nal. En esta situacin la membrana
no sufre ninguna deformacin y, por lo tanto, tampoco hay ninguna percepcin de
sonido.
El segundo caso ilustra lo que sucede con una frecuencia vibratoria de 220 Hz. Ahora la inercia del uido ya supone cierto obstculo, un obstculo lo sucientemente
importante como para que la vibracin preera vencer la rigidez de la membrana
elstica y pasar a travs de ella al canal inferior. Esa zona en la que vemos oscilar la
membrana es la que posee una frecuencia natural de resonancia de 220 Hz, resultado de la conjuncin de las dos fuerzas que crecen o decrecen en sentido opuesto: la
inercia de los uidos en esa zona para esa frecuencia y la rigidez de la membrana en
ese punto.
El tercer caso se corresponde con un sonido dos octavas ms agudo, de 880 Hz, por lo
que el movimiento oscilatorio que vemos en el vdeo es cuatro veces ms rpido que
en el caso anterior. Ahora la oscilacin es tan rpida que el obstculo que presenta la
inercia del lquido es mucho ms importante, por lo que a la onda vibratoria le resulta
ms ecaz pasar al canal inferior en una localizacin ms prxima a la entrada de la
vibracin, pues, a pesar de que en ese punto la membrana presenta ya una resistencia
bastante grande, la cantidad de lquido que debe mover es mucho menor.
El cuarto caso presenta la situacin correspondiente a un sonido de 3.520 Hz, es
decir, un sonido cuya frecuencia de vibracin es cuatro veces mayor que la del caso
anterior y diecisis veces mayor que el segundo caso del vdeo. Al ser la vibracin
muy rpida, el obstculo derivado de la inercia de los lquidos es muy grande, por
lo que la onda vibratoria elige un punto donde tiene que mover menos cantidad de
lquido, aunque ahora la resistencia de la membrana sea ya muy grande.
Este vdeo nos ayuda a entender por qu cada localizacin de la membrana basilar a
lo largo de su longitud posee una frecuencia natural de resonancia, lo cual explica la
capacidad de la cclea para transformar los componentes sinusoidales presentes en la
vibracin en localizaciones espaciales. A esto es a lo que llamamos la tonotopa de la
membrana basilar.
291
12.4.2. Comportamiento de la membrana basilar ante un sonido complejo

Una vez entendido el fenmeno de la resonancia en la membrana basilar, nos interesa examinar cmo vibra esa membrana ante un sonido complejo, es decir, ante un
sonido que consta de varios componentes sinusoidales (recordemos que todo sonido,
sea o no musical, puede ser descompuesto en componentes sinusoidales).
En primer lugar, hay que tener en cuenta que las zonas de la membrana basilar que
resuenen ante los distintos componentes frecuenciales vibrarn siempre al menos
de forma ideal con un movimiento armnico simple, oscilando de arriba a abajo
con una amplitud que, en principio, ser proporcional a la del componente que la ha
hecho resonar.
As mismo, como ocurre en el caso de las cuerdas del piano ideal del captulo Anlisis espectral de los sonidos musicales, no solamente resonar el lugar especco de
la membrana basilar cuya frecuencia natural coincida con la del componente presente en la vibracin de entrada, sino tambin las zonas prximas. Ahora bien, como
sucede en toda vibracin provocada, cada una de las localizaciones de la membrana
basilar que entre en resonancia oscilar siempre a la frecuencia del componente que
la hace resonar, con independencia de cul sea la frecuencia natural de resonancia de
esa localizacin concreta. Es decir, si en la onda vibratoria est presente, pongamos
por caso, un componente de 220 Hz, resonar la localizacin de la membrana cuya
frecuencia natural sea de 220 Hz, pero tambin se vern afectadas y resonarn, aunque en menor medida, las localizaciones vecinas, aquellas que posean una frecuencia
natural prxima, por ejemplo, las que estn entre 200 Hz y 240 Hz. Ahora bien, todas ellas oscilarn siempre a la frecuencia excitadora es decir, a 220 Hz y no a la
suya propia.
Y, nalmente, los oscilaciones sinusoidales de las distintas localizaciones de la membrana que entren en resonancia conservarn tambin las diferencias de fase relativas
que puedan existir entre los componentes sinusoidales de la onda vibratoria. As pues,
el anlisis espectral que realiza la membrana basilar no slo conserva la amplitud de
cada componente, sino tambin sus diferencias de fase. Esto explica que, en la medida
en la que esta informacin sea recogida y procesada por nuestro cerebro, podamos
ser sensibles a fenmenos tales como los batidos de segundo orden.
292
Para ilustrar la manera en la que vibra la membrana basilar ante un sonido formado
por varios componentes sinusoidales, he creado un vdeo en el que se simula su movimiento oscilatorio ante una onda vibratoria que se va haciendo progresivamente ms
compleja. Se trata de la nota la3 , de 220 Hz, en la que se van introduciendo nuevos
componentes armnicos, con amplitudes y fases diferentes. El vdeo est ralentizado
y el sonido es solamente ilustrativo.
Figura 12.13: Vdeo que simula la tonotopa de la membrana basilar.
Debemos tener presente que en la realidad los desplazamientos oscilatorios de cada

zona de la membrana basilar son muy pequeos (en un sonido de intensidad media
del orden de nanmetros, es decir, de millonsimas de milmetro). Por ello, en este
vdeo la longitud de la membrana se corresponde con los 35 milmetros que viene
a medir la membrana basilar, mientras que el desplazamiento vertical de cada zona
que resuena representa solamente unos pocos nanmetros.
Podemos ver que cada localizacin de la membrana oscila de forma sinusoidal. Y
tambin que lo hace solamente a la frecuencia de los componentes presentes en la
seal de entrada. Apreciamos tambin que en cada zona de resonancia no oscila solamente un nico punto de la membrana el que tiene la misma frecuencia natural
293
de resonancia que el componente de entrada, sino que tambin oscilan, a la misma

frecuencia, los puntos vecinos, crendose pequeos montculos y hondonadas.
Como el vdeo est tambin ralentizado 440 veces, podemos apreciar que cuando el
componente de 220 Hz, el ms grave, hace una oscilacin completa han transcurrido
dos segundos, y cuando el siguiente componente, el de 440 Hz, realiza una oscilacin
completa ha transcurrido uno, y as sucesivamente.
El principio del vdeo ilustra la vibracin de la membrana basilar cuando el sonido
est formado por un solo componente, el de 220 Hz. Luego, al entrar el segundo
componente, el de 440 Hz, la membrana basilar resuena adems en una nueva localizacin, ms prxima a la zona basal, donde oscila con el doble de frecuencia que
en la primera. Y cuando entra el tercer componente se crea una nueva zona de resonancia, an ms prxima a la zona basal, y su frecuencia de oscilacin es el triple
de la primera. Lo mismo sucede cuando entran el cuarto y el quinto componente,
cuyas frecuencias de oscilacin son cuatro y cinco veces la de la primera.
Por otra parte, en el vdeo podemos observar que las oscilaciones de las diferentes zonas de la membrana basilar conservan la informacin de la fase relativa que tenan los
componentes que constituyen la onda vibratoria. Si paramos el vdeo en el momento
en el que el componente ms grave alcanza su desplazamiento mximo, podremos
apreciar los desfases con los dems componentes. Estos desfases estaban presentes en
la seal de entrada que he fabricado.
12.4.3. Retroalimentacin de las clulas pilosas externas sobre la membrana

basilar
Como se estudia en el captulo dedicado al anlisis espectral, para que un analizador
de frecuencias sea capaz de discriminar componentes prximos presentes en la seal
de entrada, es necesario que la respuesta sea lo sucientemente picuda, es decir, que la
anchura de la banda de frecuencias afectada por el derrame espectral sea pequea. Sin
embargo, el anlisis mecnico que resulta del movimiento resonante de la membrana
basilar est lejos de lograr esa buena respuesta.
294
Pero la cclea dispone de un sistema de retroalimentacin que le permite reducir el

derrame espectral y mejorar signicativamente la respuesta puramente mecnica que
le proporciona la simple resonancia de la membrana basilar: el movimiento de las clulas pilosas externas del rgano de Corti. Como hemos visto, estas clulas sensoriales
no se limitan a enviar a las terminaciones nerviosas con las que estn conectadas informacin sobre la zona de la membrana basilar afectada por la resonancia, sino que,
al ser contrctiles, pueden alargarse y encogerse cuando son excitadas por el movimiento de la membrana basilar o de la membrana tectorial, con las que estn en
contacto directo.
En efecto, cuando un ramillete de clulas pilosas externas son afectadas por
la vibracin del punto de la membrana basilar sobre el que se sitan, chocan
contra la membrana tectorial, de modo que el cuerpo de estas clulas se contrae
y se dilata, y lo hace siguiendo el ritmo de la oscilacin en ese punto. As, estas
clulas actan como pequeos motores que refuerzan el movimiento de la membrana
basilar en un punto, incrementando notablemente la amplitud de la resonancia en
la localizacin exacta sobre la que se hallan y logrando, por lo tanto, una respuesta
ms picuda. Esta funcin de retroalimentacin es particularmente importante en las
seales dbiles, donde pueden llegar a multiplicar por 100 veces la amplitud de la
oscilacin de un punto de la membrana basilar.
Este mecanismo de retroalimentacin explica, por una parte, el importante margen
perceptivo de la intensidad sonora que poseemos (aproximadamente de 120 dB) y,
por otra, que la anchura de la banda de frecuencias en la que dos componentes no
intereren entre s sea los sucientemente amplia como para que seamos capaces de
distinguir individualmente seis o siete armnicos de un sonido compuesto (recordemos que los armnicos superiores, aunque no sean individualizables por nuestra
percepcin, contribuyen tambin a la cualidad del sonido).
12.5.
Transduccin mecano-elctrica en la cclea
A continuacin vamos a estudiar cmo los movimientos oscilatorios de cada una de

las posiciones de la membrana basilar se transforman en variaciones de la tensin
elctrica, las cuales reproducen analgicamente esas oscilaciones.
295
Esta transformacin se realiza gracias a dos tareas complementarias que llevan a cabo
las clulas sensoriales del rgano de Corti: en primer lugar, se produce una transformacin exclusivamente mecnica, mediante la cual los movimientos ascendentes y
descendentes de una localizacin concreta de la membrana basilar se convierten en
movimientos transversales de los estereocilios de las clulas pilosas que estn sobre
ella; en segundo lugar, se origina la transformacin elctrica propiamente dicha, mediante la cual los movimientos de izquierda y derecha de los estereocilios sirven para
modular la corriente que circula a travs del cuerpo de las clulas sensoriales.
La primera parte, la conversin de los desplazamientos verticales de la membrana basilar en movimientos transversales de los estereocilios, se produce como consecuencia de la fuerza ejercida sobre ellos por la membrana tectorial.
Esta membrana pivota ligeramente arriba y abajo, pero su pivote es independiente
de la membrana basilar, de modo que cuando sta asciende, la membrana tectorial
crea una fuerza de cizalladura sobre los estereocilios que los obliga a inclinarse hacia
el lado externo de la cclea es decir, hacia el estereocilio ms alto, mientras que
cuando la membrana basilar desciende, los hace inclinarse hacia el lado interno. Veamos un diagrama esquemtico de este movimiento en una imagen obtenida del curso
Hearing en OpenLearn Works, de la que solamente he traducido los nombres.
Figura 12.14: Esquema del movimiento de cizalladura de los estereocilios.
296
El dibujo presenta las tres situaciones caractersticas del movimiento derivado de las
fuerzas de cizalladura en una sola clula pilosa.
En la posicin de equilibrio (b), vemos que la zona de la membrana basilar donde
se encuentra la clula sensorial mantiene su horizontalidad y que los estereocilios de
esa clula estn en vertical.
Cuando esa zona de la membrana basilar asciende (a), desplazndose hacia el canal
vestibular, los estereocilios empujan hacia arriba la membrana tectorial, que, al pivotar ligeramente en el sentido contrario al de las agujas del reloj, se desplaza un poco
tambin hacia arriba, con lo que provoca una fuerza de cizalladura sobre los estereocilios que los hace inclinarse en el sentido del estereocilio ms alto, es decir, hacia
el exterior de la cclea (en el dibujo hacia la derecha). Aunque en el esquema no se
puede apreciar, hay que pensar que, al inclinarse en este sentido los estereocilios, se
separan ligeramente unos de otros, de modo que los lamentos que unen la puerta
del canal inico de cada uno de ellos con su correspondiente estereocilio adyacente
se abre ms.
Cuando esa zona de la membrana basilar desciende (c), la membrana tectorial pivota ligeramente en el sentido de las agujas del reloj, desplazndose hacia abajo, de
modo que ahora la fuerza de cizalladura sobre los estereocilios se produce en sentido
inverso, es decir, hacia el interior de la cclea (en el dibujo hacia la izquierda). Entonces los estereocilios se juntan unos con otros, cerrndose las puertas de los canales
inicos.
As pues, estas deecciones de los estereocilios siguen el ritmo y la amplitud de los
movimientos oscilatorios de la membrana basilar donde se asientan. Hay que tener
en cuenta que, conforme mayor sea la amplitud del movimiento de ascenso o descenso de una determinada localizacin de la membrana basilar, mayor ser tambin
la amplitud del movimiento transversal de los estereocilios. Por otra parte, aunque
este desplazamiento de los estereocilios es muy pequeo (en un sonido muy intenso
el desplazamiento mximo en la parte superior del estereocilio ms alto es del orden 100 nm), basta que se desplacen menos de un nanmetro para que percibamos
sonido.
La segunda parte, la transformacin elctrica a partir del movimiento transversal de los estereocilios, es posible gracias a la diferencia de potencial (de
297
unos 80 mV) que existe entre el lquido endolinftico del canal medio, muy
rico en iones positivos de potasio (K+), y el lquido perilinftico del canal timpnico, cuyo contenido en iones positivos de potasio es muy escaso. Debido a
que los estereocilios de las clulas pilosas estn dentro de la endolinfa, mientras que
el cuerpo de estas clulas est en contacto directo o indirecto con la perilinfa y, al
ser totalmente impermeable la lmina que separa ambos lquidos, la nica forma en
la que se puede establecer una corriente elctrica entre estos uidos es a travs del
interior de las clulas sensoriales, cuyos canales inicos abiertos en sus estereocilios
permiten que penetre un mayor o menor nmero de iones positivos.
En efecto, los iones positivos de la endolinfa son atrados por la mayor negatividad
del cuerpo de las clulas pilosas. Cuando el cuerpo celular recibe estos iones se positiviza y, en consecuencia, los iones positivos son atrados por las cargas negativas del
lquido semejante a la perilinfa que llena las lagunas del rgano de Corti. Finalmente, los iones positivos son asimilados por la perilinfa del canal timpnico, debido a la
permeabilidad de la membrana basilar al paso de los iones. Y mientras tanto, la estra
vascular se encarga de suministrar constantemente nuevos iones positivos de potasio
a la endolinfa, reponiendo los que va perdiendo.
Pero esa corriente elctrica no es constante, sino que vara segn el movimiento de los
estereocilios de las clulas sensoriales. El movimiento de vaivn de los estereocilios,
producido como consecuencia de la oscilacin de la localizacin de la membrana
basilar donde se encuentra la clula sensorial, abre ms o menos los canales inicos,
como acabamos de ver, modulando de ese modo el paso de la corriente desde la
endolinfa a la perilinfa.
Cuando esa localizacin de la membrana basilar est en una posicin de equilibrio
y los estereocilios estn en vertical, el ujo de iones de potasio que penetra a travs
de sus canales inicos es reducido, con lo que la corriente elctrica que atraviese el
cuerpo de la clula ser moderada. Cuando esa zona asciende hacia el canal vestibular, abrindose ms los canales inicos en los estereocilios, penetran por ellos muchos
ms iones de potasio positivos, aumentando la corriente elctrica. Y, por el contrario, cuando esa zona de la membrana basilar se desplaza hacia abajo y se tienden a
cerrar los canales inicos, penetran por ellos una cantidad ms reducida de iones positivos, quedando entonces el ujo de la corriente muy atenuado. De este modo, el
298
movimiento transversal de carcter mecnico de los estereocilios se transforma en

variaciones de la corriente elctrica.
As pues, el resultado de la transduccin mecano-elctrica es que las variaciones
de la corriente elctrica que atraviesa el cuerpo de cada clula sensorial son
capaces de reproducir de manera analgica los movimientos oscilatorios de la
membrana basilar en la posicin en la que se encuentra la clula. La vibracin
de ese punto es transformada en una seal elctrica analgica, de manera similar
a lo que hace un micrfono respecto a las variaciones de la presin del aire en el
lugar en el que est situado. Finalmente, conviene insistir en que el movimiento de
la oscilacin de los estereocilios que va a dar lugar a las oscilaciones de la tensin
elctrica ya no reproduce la forma de la onda vibratoria que ha llegado a la cclea a
travs del estribo, la cual es una seal en el tiempo, sino la forma de la oscilacin que
resuena en cada localizacin de la membrana basilar. Idealmente esta forma es una
seal sinusoidal, con sus propios parmetros de frecuencia, amplitud y fase, resultado
de la descomposicin de la seal en el tiempo que ha realizado la membrana basilar
para ese componente concreto.
12.6.
Codificacin de la informacin sonora en impulsos elctricos
A continuacin vamos a estudiar cmo el conjunto de seales analgicas que nos

proporcionan las clulas sensoriales son codicadas por las neuronas y transformadas en impulsos nerviosos. Gracias a esta codicacin nuestro cerebro extraer e interpretar la informacin pertinente a nuestra audicin, es decir, los componentes
frecuenciales que estn presentes en la vibracin de entrada y su correspondiente
amplitud, e incluso la fase relativa entre ellos.
Podramos pensar que, de algn modo, la codicacin que realizan las neuronas en
el ganglio espiral supone la transformacin de una informacin analgica en una
informacin de tipo digital. Mientras las variaciones de la corriente elctrica que pasa
a travs de las clulas sensoriales del rgano de Corti reproducen analgicamente las
oscilaciones de la zona de la membrana basilar correspondiente, las neuronas del
299
sistema auditivo se comportan, como todas las dems neuronas, de una manera que
podramos calicar de discontinua o digital. En efecto, las neuronas siempre siguen
la ley de todo o nada, es decir, disparan un impulso o no lo disparan.
Los medios de los que dispone cada una de las neuronas del sistema auditivo para codicar la informacin que proporcionan las clulas sensoriales y transmitirla a otras
neuronas ubicadas en sus respectivos centros de proceso son bsicamente dos: el nmero de veces que cada neurona se excita por segundo, es decir, su tasa de disparos;
y el momento preciso en el que lo hace, es decir, la circunstancia concreta en la que
dispara el impulso, como por ejemplo, cuando la oscilacin de la corriente elctrica
en la clula sensorial con la que est conectada alcanza un mximo.
Junto a estos medios individuales, hay otro muy importante en el que estn implicadas todo el conjunto de neuronas que se comunican con las clulas sensoriales del
rgano de Corti: la disposicin tonotpica de las neuronas del sistema auditivo. En
efecto, estas neuronas mantienen a lo largo de su recorrido, hasta llegar a la capa
exterior del cortex auditivo, la organizacin tonotpica que posee la membrana basilar. Dicho de otra manera, cada neurona va asociada a una determinada frecuencia
de resonancia de la membrana basilar y esta asociacin se mantiene de neurona en
neurona, dando lugar a una especie de mapa de frecuencias en la zona del cerebro
especializada en la audicin.
Puesto que cada clula pilosa interna transmite su informacin a unas 10 o 12 bras
nerviosas aferentes que son exclusivas para esa clula concreta, la tonotopa por s
sola podra explicar nuestra capacidad para apreciar los componentes frecuenciales.
Teniendo en cuenta que el rango de frecuencias que distinguimos los humanos va
desde 20 Hz a 20.000 Hz (es decir, prcticamente 10 octavas 120 semitonos) y puesto que contamos con una hilera de aproximadamente 3.500 clulas pilosas internas,
podemos deducir que la separacin intervlica entre las clulas sensoriales internas
se corresponde aproximadamente a unas tres centsimas de semitono (120/3500 =
0,0343). Este margen viene a coincidir con las mediciones psicoacsticas sobre nuestra capacidad para apreciar las diferencias mnimas entre intervalos sucesivos.
Adems, la informacin sobre la frecuencia tambin lleva consigo la informacin
sobre la amplitud. Una parte importante de esas 10 12 neuronas que hacen sinapsis
con cada clula pilosa interna transmiten la informacin de la amplitud mediante
300
su tasa de disparos. Cuando la amplitud de la oscilacin elctrica en el cuerpo de la

clula sensorial es grande, el nmero de disparos por segundo de cada neurona es
elevado, mientras que si la amplitud es pequea hay un reducido nmero de disparos
por segundo (el nmero mximo de disparos que es capaz de efectuar una neurona
est en torno a los 500 disparos por segundo). As mismo, el nmero de neuronas
pertenecientes a cada clula sensorial que resultan activadas es mayor cuanto mayor
sea la amplitud de la oscilacin elctrica.
La combinacin de estos dos medios, tonotopa y tasa de disparos de las neuronas, pueden constituir los mecanismos bsicos por los que se codifica la frecuencia y la amplitud. Sin embargo, no son sucientes para explicar fenmenos
psicoacsticos, tales como la deteccin de la fase relativa entre los componentes, como ocurre, por ejemplo, cuando omos los batidos de segundo orden.
El elevado nmero de conexiones neuronales por cada clula sensorial interna invita
a pensar que pudieran existir otros mecanismos complementarios que refuercen y
precisen esa codicacin. Por un lado, parece ser que alguna de las neuronas a las
que estn conectadas las clulas pilosas estn especializadas en dispararse cuando la
oscilacin elctrica de la clula pasa por un mximo. Y esto, en principio, ocurre de
forma peridica, pues cada clula que transmite la resonancia de la membrana basilar
debe oscilar con un movimiento armnico simple. Esto implica que si la frecuencia
de oscilacin elctrica es baja, la neurona tendr tiempo para rearmarse y disparar
un impulso por cada mximo, pero si la frecuencia de la oscilacin es alta, no podr
rearmarse y disparar cada dos, cada tres o cada ms mximos. El resultado ser un
tren de impulsos que, aunque tenga lagunas, ser predominantemente peridico.
Estas lagunas podrn ser completadas por otras neuronas de esa clula especializadas
en este mecanismo, actuando en su conjunto como si estuvieran jugando un partido
de voleibol.
As pues, el disparo de estas neuronas no tendra que ver con la amplitud, sino con
la fase de la oscilacin, es decir, con un estado de la oscilacin, el punto en el que
se alcanza el mximo. Este mecanismo, que se denomina bloqueo de fase, servira para reforzar la codificacin de la frecuencia y tambin para trasmitir la
informacin de fase relativa entre los componentes de una seal.
301
Hay que tener en cuenta que, aunque como consecuencia del derrame espectral las
clulas pilosas internas vecinas tambin oscilarn, lo harn no a su frecuencia natural
de resonancia, sino a la del componente frecuencial presente en la seal de entrada.
Por ello, el tren de impulsos enviado por las neuronas vecinas especializadas en este
mecanismo de bloqueo de fase tendr siempre la misma frecuencia, lo que explicara,
entre otras cosas, la percepcin de los batidos de segundo orden.
Por otra parte, en lo que concierne a la codicacin de la amplitud, contamos con
dos medios complementarios. El primero es la mayor o menor extensin de la
zona afectada por el derrame espectral, es decir, el nmero de clulas vecinas
estimuladas por la presencia de un determinado componente frecuencial presente en la seal de entrada. Conforme mayor sea la amplitud del componente,
mayor nmero de clulas vecinas se vern afectadas. El segundo es que la informacin que transmite la neurona aferente conectada a un pequeo grupo de
clulas pilosas externas contribuye a codificar la mayor o menor amplitud de la
pequea zona en la que estn ubicadas. Dado que estas clulas pilosas externas son
las encargadas de retroalimentar los movimientos resonantes de la membrana basilar,
la mayor o menor tasa de disparos de la neurona a la que estn conectadas contribuir
a informar sobre la mayor o menor amplitud de la oscilacin en esa zona.
As pues, la forma en la que se realiza la codicacin de la informacin auditiva explica que, a pesar de que nuestra audicin es esencialmente frecuencial (es decir, procede
del anlisis espectral realizado mecnicamente por la membrana basilar), haya tanta
coincidencia, como hemos podido comprobar en otros captulos, entre lo que vemos
en la forma temporal de la vibracin sonora y el sonido que percibimos.
Todo este conjunto de mecanismos neuronales que sirven para codicar las seales
analgicas provenientes de las clulas pilosas del rgano de Corti suministran la base
sobre la cual se realizan complejos algoritmos de procesamiento de la informacin
auditiva, a lo largo de los diversos centros cerebrales por los que atraviesa. Pero el
funcionamiento preciso de todo ello no es todava sucientemente conocido y se
escapa del objetivo de este captulo.
302
12.7.
Conclusin
Podemos concluir que nuestra percepcin del sonido se fundamenta en el anlisis

frecuencial que se realiza en la membrana basilar en el interior de la cclea. La evidente anidad entre la forma de la vibracin y nuestra percepcin auditiva se debe a
que el analizador mecnico de la cclea conserva una gran parte de la informacin
que se encuentra en la seal en el tiempo, pues no slo recoge y transmite la amplitud de cada componente presente en la seal, sino que tambin atiende en cierta
medida a la fase. La gran densidad de informacin frecuencial que llega a nuestro cerebro le permite recuperar una parte importante del contenido temporal de la seal
sonora.
303
Captulo 13
Psicoacstica musical
13.1.
Introduccin
A pesar de que la informacin musical llega hasta nuestros odos totalmente mezclada
en la vibracin mecnica sobre la que viaja, nuestro sistema auditivo es capaz de
determinar los sonidos musicales que contiene. De la misma manera que en la visin
tenemos la capacidad de distinguir la gura del fondo e individualizar los mltiples
objetos que ocupan la escena visual, en la percepcin auditiva podemos aislar cada
una de las entidades sonoras del entorno acstico en el que estn inmersas, as como
recuperar la unidad de los sonidos musicales dados por la voz o los instrumentos, los
cuales, debido a la propia siologa de nuestro odo, han sido previamente divididos
en sus componentes frecuenciales.
Este captulo estudia la capacidad de nuestra percepcin para reconocer objetos musicales en un contexto sonoro y para reconstruir su unidad. Si bien en cierta medida
esta capacidad est condicionada por las caractersticas siolgicas de nuestra audicin, el proceso mediante el cual percibimos el sonido musical es de orden superior.
En efecto, nuestra percepcin musical es el resultado de la manera en la que nuestro cerebro procesa los impulsos nerviosos producidos por la cclea al codicar la
vibracin sonora. A da de hoy slo tenemos ideas de carcter muy general sobre
el proceso que realizan los diferentes ncleos cerebrales relacionados con la audicin. Pero, aunque conociramos con detenimiento los mecanismos neurolgicos
304
mediante los cuales se procesa la informacin acstica en el cerebro, lo que nos interesara siempre conocer es la imagen psicoacstica que construimos a partir de esa
informacin.
Examinaremos, en primer lugar, las limitaciones para la percepcin del objeto sonoro que vienen dadas por la siologa de nuestro odo, tales como las que afectan a la
identicacin de un sonido simple en un ambiente ruidoso o, dicho de otra manera, el enmascaramiento al que da lugar la coexistencia de diversos componentes en
zonas prximas del espectro. En segundo lugar, veremos que nuestra capacidad para
recuperar la unidad del objeto sonoro musical viene dada por nuestra predisposicin
natural para el reconocimiento del patrn armnico. Y en tercer lugar estudiaremos
cmo el reconocimiento de un patrn armnico, o de una estructura que lo recuerde, explica la percepcin de la consonancia entre sonidos armnicos compuestos y
cmo tambin en las consonancias musicales podemos seguir percibiendo la individualidad de cada uno de los sonidos que forman parte de la mezcla gracias a nuestra
capacidad para detectar las marcas tmbricas que los individualizan.
Vamos a dejar al margen las cuestiones relacionadas con la percepcin de la espacialidad y con todo lo que se deriva del hecho de que tengamos dos odos. La capacidad
de nuestro sistema auditivo para localizar la procedencia de la fuente sonora es un
tema de inters para la tecnologa musical, en especial para lograr una reproduccin
sonora que nos devuelva el sonido de la forma ms natural posible. Pero, dado que
esta cuestin no es determinante para comprender los fundamentos psicoacsticos
del lenguaje musical, vamos a prescindir en este captulo de ella.
Finalmente, hay que tener en cuenta que la capacidad de reconocimiento del sonido
musical depende, en buena medida, del entrenamiento del oyente, es decir, de su
mayor o menor dedicacin a la msica.
13.2.
Limitaciones en la percepcin del objeto sonoro debidas

a la fisiologa del odo
Debido a la constitucin de nuestro sistema auditivo, la presencia de otros componentes frecuenciales en zonas del espectro prximas al sonido que tratamos de perci305
bir nos diculta o incluso nos impide su reconocimiento. Como ya pudimos ver en
el captulo dedicado a la interferencia entre sonidos simples, nuestro odo requiere
que exista cierta separacin entre los componentes frecuenciales para poder
distinguir ntidamente los sonidos. La anchura de la banda crtica es la distancia mnima que sirve de lmite para que dos componentes sinusoidales puedan
ser distinguidos con claridad. Esta distancia mnima est en relacin directa con
el hecho de que la resonancia de la membrana basilar en un punto afecta tambin
a los puntos que estn prximos, tal como hemos visto en el captulo dedicado a la
siologa de la audicin.
Para permitir experimentar este fenmeno voy a presentar, a modo de ejemplo, un
vdeo con el caso ms sencillo de distincin de fondo y gura en el paisaje sonoro: la
percepcin de un sonido simple en un entorno ruidoso. Ahora nos interesa solamente
comprobar que la percepcin de un sonido simple con una determinada intensidad
mantenida se facilita de forma signicativa cuando se encuentra en una zona libre de
otros componentes. Este caso, realizado con sonidos de laboratorio, nos servir para
entender la manera en la que nuestra percepcin est condicionada por la siologa
de nuestro odo. Para evitar que los otros componentes puedan provocar efectos
de batidos e interferencias que obstaculizaran nuestra percepcin del fenmeno, he
elegido como elemento perturbador una banda de ruido. En este ejemplo el fondo
consiste precisamente en esta banda de ruido, mientras que la gura est formada por
dos sonidos simples que a lo largo de todo el vdeo mantienen la misma amplitud y,
por lo tanto, la misma intensidad. Se trata de un la4 (440 Hz) cuya amplitud es de
0,005 (en unidades arbitrarias normalizadas como siempre entre 0 y 1) y de un la6
(1.760 Hz) cuya amplitud es de 0,3. La diferencia entre la intensidad de ambas seales
es de 36 dB. La banda de ruido se extiende durante los seis primeros segundos unos
1.000 Hz arriba y abajo del componente agudo. A partir del segundo 6 se abre un
hueco en esta banda de ruido que va progresivamente separndose del componente
agudo.
Al disminuir la anchura de banda del ruido, disminuye tambin su intensidad. Si el
objetivo de este vdeo fuera ser utilizado como un test para ver en qu condiciones es
posible identicar un componente es decir, medir la anchura de la banda crtica,
la intensidad del ruido debera haberse mantenido constante, aunque disminuyera la
anchura de su banda. Pero nuestro objetivo ahora es simplemente ilustrar la diferencia
306
entre la percepcin que se produce en una banda ocupada y en otra sin ocupar. Que
la intensidad del ruido no se adapte a la disminucin de su anchura de banda nos
facilita esta tarea.
Figura 13.1: Vdeo que permite experimentar la percepcin de sonidos simples en presencia de ruido.
Durante los primeros 6 segundos del vdeo podemos comprobar que el componente
de 440 Hz (la nota la4 que en el espectrograma corresponde a la lnea horizontal inferior que casi no se ve) se oye con toda claridad, acompaada de un ruido de carcter
ms agudo; sin embargo, no somos capaces de or el componente de 1.760 Hz, a
pesar de que en el espectrograma lo podemos ver sin dicultad en medio de la banda
ruidosa. A partir del segundo 6 el carcter del ruido va cambiando: en el espectrograma vemos que en medio del ruido va abrindose un hueco que se va ensanchando
progresivamente para dejar libre las bandas prximas al componente de 1.760 Hz.
Por ello el componente de 440 Hz siguen oyndose con el mismo volumen sonoro
que antes, pero hasta pasado el segundo 10 no empezamos a percibir ligeramente
el componente agudo de 1.760 Hz, el corrrespondiente a la nota la6 (dependiendo
del volumen de nuestro reproductor y de la atencin que prestemos a su aparicin
podemos orlo un poco antes o un poco despus). Nuestra percepcin del componente agudo llega a ser cada vez ms clara, hasta que, en un momento determinado,
307
ya no cambia y al nal percibimos con claridad los dos componentes individuales,

manteniendo cada uno de ellos su propio volumen sonoro. Este efecto se aprecia
ms claramente conforme va disminuyendo la intensidad del ruido y reducindose
la anchura de su banda.
Este fenmeno psicoacstico del enmascaramiento es utilizado por los compresores
de sonido para disminuir la codicacin necesaria en funcin de nuestras capacidades
para distinguir los componentes prximos.
13.3.
El reconocimiento del patrn armnico
En la naturaleza hay muchos sonidos que surgen en condiciones estacionarias, por

ejemplo, las cuerdas que vibran, las columnas de aire que resuenan en cavidades, los
ruidos emitidos por muchos animales, el viento que silba en las grutas, etc. Por ello
el sonido armnico es tan abundante en la naturaleza. Entre los humanos, el sonido
armnico no slo constituye el material con el que se construye la msica, sino que
tambin sirve de soporte para la articulacin del lenguaje hablado, como es el caso
de las vocales. Esta familiaridad con un entorno sonoro armnico explica de algn
modo nuestra predisposicin natural para reconocerlo.
A nuestro cerebro llega, a travs del nervio auditivo, la descomposicin espectral de
la vibracin mecnica que ha realizado el odo interno y es nuestro cerebro el que
lleva a cabo la tarea de reunir todos esos componentes dispersos para recuperar la
unidad del objeto sonoro armnico. En nuestra mente se realizan una serie de procesos psicoacsticos encaminados al reconocimiento del patrn armnico de cada
objeto musical mediante el cual agrupamos los componentes e identicamos las notas. Hay que tener en cuenta que identicar una nota musical, o el intervalo que
forma con otra, no signica darle un nombre concreto; es un proceso inconsciente
para la mayor parte de las personas, pero que nos permite entender y recordar una
meloda. Por ejemplo, si se cambia una nota por otra en una cancin conocida casi
todos los oyentes se darn cuenta; y eso ocurrir con independencia de que sepan o
no msica, ni de que sean capaces o no de nombrar la nota o las notas que esperaban
escuchar.
308
La identificacin de un sonido armnico no se debe a que percibamos su periodicidad en la forma de la vibracin resultante, sino a que la estructura de sus
componentes frecuenciales se corresponde con una estructura armnica. As
pues, el reconocimiento del patrn armnico se produce por los intentos de nuestro
sistema perceptivo por organizar en estructuras armnicas todo el material sonoro
que recibe.
En lneas generales, el reconocimiento del patrn armnico obedece a las leyes de la
Gestalt en su aplicacin al material sonoro. Vamos a ver a continuacin que La ley
de la completitud de la gura explica cmo reconstruimos un patrn armnico en un
sonido en el que hay muchos huecos dentro de la serie armnica. Voy a presentar
dos vdeos que nos van a permitir observar la manera en la que nuestra percepcin
auditiva organiza el material sonoro segn la serie armnica, completando los huecos
que el sonido musical pudiera tener. En el primero mostrar cmo reconocemos
una nota musical en un sonido en el que faltan un buen nmero de los primeros
componentes. En el segundo veremos que seguimos identicando la misma nota
incluso cuando se le quitan sus primeros armnicos.
En el primer vdeo tenemos el espectrograma de la nota ms grave de un sonido
de piano, el la0 , cuya frecuencia es de 27,5 Hz. El sonido procede de una grabacin domstica realizada con un piano vertical, donde el nmero e importancia de
los componentes graves es considerablemente menor que en un piano de gran cola.
El espectrograma ha sido realizado con una ventana de larga duracin (0,2 segundos), pues aqu nos interesa observar la frecuencia de los componentes, ms que su
evolucin temporal.
309
Figura 13.2: Vdeo con el espectrograma de la nota la0 de un piano.
Todos reconoceramos aqu un la0 , la nota ms grave del piano, con lo que, en principio, deberamos ver en el espectrograma su primer armnico, es decir, el componente
de 27,5 Hz. Sin embargo, el armnico ms grave que aparece en el espectrograma
es el cuarto, con una frecuencia de 110 Hz; luego el quinto, el sexto y el sptimo,
separados aproximadamente por una distancia de 27,5 Hz. El octavo armnico no
est, pero desde el noveno hasta el decimosexto vemos que son todos consecutivos.
Si seguimos hacia la parte alta del espectro observamos una considerable cantidad de
componentes armnicos, todos ellos separados entre s, salvo en los casos en los que
hay huecos, por una distancia de 27,5 Hz o un poco ms (hay que tener en cuenta
que la ligera inarmonicidad del piano hace que se vayan separando progresivamente).
En cuanto a la energa que aporta cada armnico al sonido y que afecta a su timbre,
podemos apreciar que el duodcimo es el que tiene mayor amplitud y, por lo tanto,
mayor intensidad.
Ahora bien, a pesar de las importantes lagunas en la estructura armnica de esta nota
la0 e incluso de la ausencia de los primeros armnicos, nuestro sistema perceptivo ha
apreciado varios rasgos que le han ayudado en la tarea de su reconstruccin y en la
recuperacin de la unidad de esa nota la0 . Ha reconocido que la distancia que ms
abunda entre los diferentes componentes es de unos 27,5 Hz. Tambin ha apreciado
los rasgos comunes que hay entre los componentes de la nota la0 : coincidencia en el
310
tiempo del ataque, forma similar en el ataque, horizontalidad, atenuacin exponencial, etc. Y a partir de todo ello ha reconocido que todos esos componentes forman
parte de la nota de piano la0 , con independencia de que sepamos nombrarla o no.
Gracias a esta capacidad de nuestra percepcin auditiva podemos or las notas graves
de cualquier obra musical en un reproductor de msica de no muy buena calidad, a
pesar de que, en lneas generales, stos no acostumbran a reproducir frecuencias ms
bajas de 50 Hz.
En el segundo vdeo he elegido un ejemplo diferente. Empezamos oyendo la nota
la2 del piano (110 Hz), pero en los sucesivos ataques le he ido quitando de forma articial diferentes componentes de la estructura armnica. La duracin de la ventana
de anlisis ha sido en esta ocasin 0,08 segundos, pues he pensado que, al estar los
componentes ms separados, esta duracin era ya suciente para apreciar con claridad la estructura armnica (insisto en que ahora nos interesa ver los componentes
frecuenciales de la estructura, no su evolucin temporal).
Figura 13.3: Vdeo con el espectrograma de la nota la2 de un piano a la que se le quitan progresivamente sucesivos armnicos.
Podemos comprobar que, aunque vayan cambiando las cualidades sonoras de la nota,
en las tres ocasiones escuchamos un la2 . En el primer caso, tenemos la nota emiti311
da por el piano sin modicacin alguna. La estructura armnica est completa: se

aprecian claramente los primeros doce armnicos, se insinan el decimotercero y el
decimocuarto, y el decimoquinto aparece con claridad, aunque de forma intermitente. En el segundo caso he eliminado el primero y el segundo armnico, pero los
cambios producidos en el sonido han sido escasos: una cierta prdida de graves en
la cualidad sonora que solamente ser apreciada en un reproductor con suciente
calidad. En el tercer caso he eliminado los cinco primeros armnicos. Apreciamos
ahora que el cambio en la cualidad sonora ha sido muy importante, casi no parece
una nota de piano, pero la identicacin de la altura tonal de la nota como un la2 no
ha sufrido en absoluto.
As pues, con estos dos ejemplos hemos podido experimentar cmo acta nuestra
percepcin auditiva para reconocer la estructura del objeto, incluso cuando la serie
armnica presenta numerosas lagunas, e identicar de esta manera las notas musicales.
13.4.
Percepcin de la consonancia entre sonidos musicales
El concepto de consonancia del que voy a ocuparme a continuacin no tiene nada que ver con la consonancia entendida como eufona, es decir, con el hecho de
que dos o ms sonidos emitidos simultneamente nos suenen mejor o peor. Hay
disonancias claramente eufnicas. Por poner un ejemplo, en mi opinin, el acorde
de sptima disminuida suena deliciosamente bien y es un autntico paradigma de
la disonancia. Por otra parte, no voy a tratar aqu de las convenciones que en cada momento histrico del desarrollo de nuestro lenguaje musical han considerado
consonantes o disonantes determinados intervalos musicales, o unas u otras agrupaciones de sonidos. Por ejemplo, en unos contextos armnicos el intervalo de cuarta
es tratado como disonante y exige resolucin, mientras que en otros es considerado
como consonante.
Aqu vamos a atender a los fundamentos acsticos y psicoacsticos de la consonancia entre sonidos musicales, es decir, tanto lo que concierne a su propia constitucin
fsica como a las caractersticas de nuestra percepcin musical que permiten que reconozcamos la consonancia, con total independencia de los criterios estticos de cada
312
poca o de las apreciaciones subjetivas de un nmero mayor o menor de oyentes.

Nos interesa ahora atender a los sonidos reales, es decir, a sonidos individualizados
complejos y distintos, tal como surgen de la voz y de los instrumentos, cada uno con
su propia marca tmbrica.
Cuando dos notas suenan a la vez puede ocurrir, o bien que permanezcan independientes una de la otra, o bien que se acoplen y produzcan una mezcla consonante.
En el captulo 6 vimos que la consonancia entre sonidos simples se debe a que la
mezcla resultante tiene una periodicidad que nuestro sistema auditivo es capaz de
reconocer y que esa periodicidad viene dada por la conmensurabilidad prxima entre sus frecuencias. Pero en la mayor parte de las ocasiones los sonidos musicales son
compuestos, es decir, estn formados por un buen nmero de componentes cuyas
frecuencias forman entre s una estructura armnica. En estos casos, la percepcin
de la consonancia est en relacin directa con la posibilidad de organizar los componentes de la mezcla resultante en una nueva estructura armnica ms o menos
completa. Dicho de otra manera, la combinacin de los componentes de los sonidos
musicales que intervienen en la mezcla ha de formar una estructura lo sucientemente armnica como para que nuestra mente sea capaz de reconocerla, completando los elementos que faltan si es necesario. Cuando eso sucede nosotros percibimos
la mezcla resultante como una entidad musical a la que llamamos consonancia. En
este sentido podemos decir que la consonancia se produce cuando al mezclarse dos o ms sonidos musicales se crea una nueva estructura armnica o casi
armnica.
Pero la mezcla consonante no es una combinacin de componentes simples en la
que cada uno de ellos se disuelve y desaparece, como hemos visto que ocurre cuando
se combinan componentes sinusoidales para formar el sonido armnico compuesto.
Las marcas tmbricas que caracterizan a cada sonido impiden que la mezcla se comporte como una mera suma de componentes sinusoidales que dara lugar a un nuevo
y nico sonido. Por el contrario, cuando se unen sonidos consonantes, cada uno de
ellos sigue estando presente en el sonido resultante, de modo que, si prestamos atencin, podemos seguir distinguiendo cada uno de los sonidos que se mezclan. Salvo
cuando los intrpretes pretenden anular las individualidades y fundirlas en una masa
coral, como ocurre con las diferentes secciones de cuerda de una orquesta, el timbre
313
de cada sonido de algn modo permanece y deja su huella en la textura de la mezcla

consonante.
En realidad, ste es el sentido preciso del concepto de armona, concepto que se
fundamenta en la consonancia natural y que tanto ha inuido en el pensamiento de
Occidente. La armona es la buena mezcla, la mezcla hecha de tal modo que resulta
una nueva entidad ms rica y compleja, un conjunto bien trabado, pero un conjunto
en el que las partes no se disuelven, sino que siguen manteniendo su individualidad.
Para comprender en qu consiste la consonancia entendida como mezcla, as como
para observar los diversos tipos de consonancias naturales, voy a presentar varios vdeos en los que los sonidos van acompaados de su correspondiente espectrograma.
En los ejemplos suena primero cada una de las dos notas por separado y luego el sonido resultante de su emisin simultnea. Esta emisn simultnea ha sido simulada
mezclando las dos notas con ayuda de un editor de sonido, con la nalidad de que
las notas presentes en la combinacin sean exactamente las mismas que las que han
sido emitidas por separado.
13.4.1. Consonancia y disonancia

En primer lugar voy explicar la diferencia entre consonancia y disonancia, para lo
que voy a poner un ejemplo de cada una de ellas. Como consonancia he elegido
el unsono, la ms perfecta de las consonancias, y como disonancia, una sptima
menor. En ambos casos he combinado la misma nota de piano, el sol3 , con otra nota
de violn; en el ejemplo de la consonancia, con otro sol3 , y en el de la disonancia,
con un fa4 .
Comencemos con el ejemplo de la consonancia.
314
Figura 13.4: Vdeo con el espectrograma de una nota de piano y otra de violn al unsono.
Oigamos cmo suenan y paremos luego el vdeo en cualquier momento para ver
el espectrograma. La columna izquierda del espectrograma corresponde al sol3 del
piano, la columna del medio al sol3 del violn y la de la derecha a la emisin simultnea de ambas notas. En el espectrograma observamos que el nmero y la estructura
de los componentes frecuenciales de las dos notas simultneas (los armnicos de la
columna de la derecha) vienen a ser el resultado de la combinacin de los componentes de las dos notas emitidas por separado (los de las columnas de la izquierda y
del medio). Enseguida entendemos por qu las dos notas se han mezclado tan bien.
En efecto, comprobamos que ambas notas comparten un buen nmero de sus componentes frecuenciales, lo que era de esperar al tratarse de un unsono. Observamos,
adems, que la combinacin resultante tambin posee un patrn armnico. En una
primera ojeada, y especialmente si atendemos solo a los siete primeros componentes,
podramos pensar que estamos ante un nico sonido individual, pues en la estructura
frecuencial no encontramos nada de particular diferente de la que posee un nico sonido armnico compuesto. La capacidad de nuestra percepcin musical para
reconocer el patrn armnico ha funcionado tambin aqu: ha reunicado los componentes frecuenciales y ha reconstruido una nueva unidad.
Ahora bien, la cosa no es tan sencilla. Con esto queda explicada solamente la parte
unitaria de la mezcla consonante, el hecho de que estos sonidos se mezclen bien y
315
den como resultado una nueva unidad; pero nos falta entender por qu en la mezcla
se sigue reconociendo el sonido de las dos notas, la de piano y la de violn, es decir,
por qu, a pesar de esa buena mezcla, se conservan los elementos individuales. En
efecto, si volvemos a escuchar el ejemplo, nos damos cuenta de que en la emisin
simultnea tambin podemos seguir oyendo con claridad cada una de las dos notas:
en funcin de sus propias dinmicas hay momentos en los que el piano se destaca ms
(como por ejemplo, en el ataque) y hay otros en los que es el violn el que domina
(como sucede cuando el volumen de la nota de violn se mantiene elevado mientras
la nota de piano se encuentra ya muy amortiguada).
Tendremos que jarnos con ms detenimiento en el espectrograma para entender
por qu se siguen oyendo las dos notas individuales. En muchos componentes de
la columna de la derecha (la de las dos notas simultneas) reconocemos las mismas
marcas tmbricas especcas del piano o del violn que estn en los respectivos componentes de las notas dadas por separado (las columnas izquierda y central). Por ejemplo, vemos que ese punto luminoso que destaca en el primer componente de la nota
de piano sola o esa lnea vertical que seala el ruido inicial del ataque aparecen de
nuevo en los componentes del sonido mezclado; y tambin que ese dibujo de la nota
de violn solo, que indica que se est manteniendo la amplitud sin amortiguacin, se
repite en los componentes de las dos notas mezcladas, igual que se repite el elevado
nmero de componentes armnicos superiores y su permanencia en el tiempo. Podemos concluir, as pues, que en la mezcla consonante se conservan buena parte de
los rasgos tmbricos de cada uno de los sonidos individuales que la componen, lo que
explica que percibamos una nota de piano y otra de violn dadas simultneamente y
no un nico sonido con otro timbre diferente.
Pero hay tambin otros elementos que se pueden observar en la mezcla y que no
estn en los sonidos individuales. Podramos decir que son algo as como los efectos
colaterales de la mezcla. En el armnico sexto y en otros superiores podemos observar
unas discontinuidades que en el odo se traducen en la percepcin de pequeos
batidos, las cuales son el resultado de la inarmonicidad de los componentes del
piano interactuando con la armonicidad casi total de los componentes de violn. En
efecto, la progresiva desanacin de los componentes superiores del piano choca
con la anacin casi perfecta del violn y provoca esas interferencias. Este abrirse de
los componentes frecuenciales de las notas del piano, que contribuye a mantener la
316
individualidad de cada una de las notas emitidas, llega a plasmarse en los armnicos
superiores en las dos lneas distintas y prximas que se aprecian en la columna derecha
del espectrograma.
As pues, hasta aqu hemos podido comprobar que la consonancia consiste en la combinacin de dos condiciones aparentemente opuestas. Por un lado, la posibilidad de
que dos sonidos distintos emitidos simultneamente sean reconocidos como uno solo: al compartir un buen nmero de componentes frecuenciales y al poseer un patrn
armnico, el resultado de la combinacin de dos sonidos consonantes es una nueva
entidad sonora unitaria. Y, por otro, la pervivencia en la mezcla, en esa nueva entidad sonora que ha surgido, de ciertos rasgos propios de cada uno de los sonidos
individuales, lo que impiden la disolucin total de las partes. Todo esto explica que
haya instrumentos que se amalgamen ms o menos, que empasten entre s mejor o
peor. Y tambin que la combinacin de piano y violn, en la que se mantiene muy
bien la individualidad de los sonidos, haya obtenido un amplio reconocimiento en
la literatura musical clsica.
Veamos el caso opuesto, aqul en el que las notas no se mezclan y se produce la
disonancia. Utilizo la misma combinacin de piano y violn.
Figura 13.5: Vdeo con el espectrograma de una nota de piano y otra de violn formando un intervalo
de sptima menor.
317
Comprobamos en el espectrograma que ambos sonidos no comparten apenas material sonoro. Adems, ahora no se puede distinguir en el sonido compuesto un nico
patrn armnico. Por el contrario, en este sencillo caso es perfectamente posible reconocer los dos patrones armnicos de cada nota por separado. Los dos sonidos se
producen simultneamente, pero sus componentes no se mezclan prcticamente nada. Si comparamos las columas de la izquierda (la nota del piano) y del medio (la nota
de violn) con la columna de la derecha del espectrograma (las dos notas simultneas)
podemos apreciar con claridad a qu instrumento pertenece cada componente de esta ltima columna. Tenemos en este caso dos notas que suenan perfectamente bien
al ser emitidas simultneamente, pero que no son para nada consonantes, pues no se
han mezclado en absoluto.
En resumen, la consonancia supone la mezcla de dos o ms sonidos, mientras que en
la disonancia existe solamente una reunin simultnea, pues los sonidos permanecen
sin mezclarse. Para que exista consonancia se han de producir dos condiciones: 1) que
los dos sonidos compartan buena parte de su material sonoro, es decir, que tengan
en comn la mayor parte de sus componentes; 2) que la mezcla resultante guarde un
patrn armnico.
Pero la consonancia es una categora relativa: unas mezclas son ms consonantes
que otras. Existe, por decirlo de algn modo, una cierta degradacin en los niveles
de consonancia, una creciente imperfeccin de la mezcla, desde el unsono hasta la
disonancia. Conforme las dos notas compartan mayor nmero de componentes y
conforme el patrn armnico del sonido resultante sea ms completo, sin huecos en
su estructura, mayor ser el grado de su consonancia. Lo que hace que dos notas sean
ms o menos consonantes es el grado de conmensurabilidad entre sus frecuencias:
cuanto ms prxima, ms consonante es la mezcla. La progresin es la siguiente:
unsono 1:1 (igual); octava 2:1 (doble); octava y quinta 3:1 (triple); doble octava 4:1
(cudruple); quinta 3:2 (sesquiltera); y cuarta 4:3 (sesquitercia). Ms all de estas razones la consonacia desaparece. Los nombres de los intervalos consonantes proceden
de su orden en la escala de referencia que fue ya formulada por los tericos musicales
griegos.
318
13.4.2. Consonancia de octava, de quinta y de cuarta

Veamos ahora algunas situaciones en las que las mezclas de dos sonidos, aun siendo
consonantes, no son tan perfectas como el unsono. Me voy a limitar a analizar los
intervalos consonantes que no superan el marco de la octava. Estos son, en orden
de mayor a menor grado de integracin de sus sonidos, los siguientes: la octava, la
quinta y la cuarta. La frecuencia de una nota que est a una octava superior es el
doble de la frecuencia de la nota inferior; la de una quinta es 3:2 veces la de la nota
inferior, y la de la cuarta es de 4:3.
Comienzo con el intervalo de octava. Veamos, as pues, un ejemplo en el que he
juntado la nota sol3 del violn anterior y la nota sol4 dada ahora por un clarinete en
sib. Las notas no estn perfectamente anadas. La frecuencia de la nota de violn es de
195,9 Hz y la de la nota de clarinete es de 394,5 Hz. Por eso el primer armnico de la
nota de clarinete (394,5 Hz) est ligeramente ms alto que el segundo armnico de
la nota de violn (195,9 x 2 = 391,8 Hz). Pero estas diferencias no son signicativas y
lo que nos interesa es experimentar lo que ocurre cuando se mezclan sonidos reales,
como sucede de ordinario en la msica, no situaciones tericas de laboratorio.
Figura 13.6: Vdeo con el espectrograma de una nota de violn y otra de clarinete formando un
intervalo de octava.
319
Los componentes de una nota que est a un intervalo de octava superior tienen todos la frecuencia doble del componente equivalente de la nota que est una octava
baja. Lo podemos vericar fcilmente al observar la estructura de los componentes correspondiente a la nota de clarinete emitida sola. Recordemos tambin que el
sonido del clarinete se caracteriza, en general, por el predominio de los armnicos
impares, como tambin podemos observar en este espectrograma. No obstante, en la
estructura de los componentes correspondiente a las dos notas emitidas simultneamente tambin vemos con claridad la presencia de un patrn armnico. En principio
podramos decir que se trata de un solo sonido armnico. El primer armnico pasa
casi totalmente desapercibido, pues tambin pasa desapercibido en la nota aislada de
violn y el clarinete no puede aadir nada, ya que su espectro no forma parte de la
composicin de esa nota que est a octava superior. Pero el resto de los componentes
s estn presentes, con mayor o menor importancia. Esa estructura armnica hace
que nuestra percepcin reconozca all una unidad sonora, un sonido armnico. El
grado de integracin de los componentes es tambin muy elevado, casi equiparable
al del unsono. Y tambin observamos ahora la permanencia de las marcas tmbricas individuales de cada uno de los sonidos. As, por ejemplo, podemos jarnos en
el predominio de los componentes impares, propio de la sonoridad del clarinete, o
en la riqueza de los armnicos superiores caracterstica de la nota de violn. Por otra
parte, surgen tambin una serie de fenmenos nuevos resultantes de la mezcla, como
la aparicin de esas intermitencias en numerosos componentes que son el resultado
de las ligeras diferencias en anacin entre los dos instrumentos, como hemos visto
al estudiar los batidos. Resumiendo, podemos decir aqu algo muy similar a lo que
dijimos acerca del unsono: se reconoce claramente un patrn armnico que explica
la fusin y se mantienen a la vez ciertas peculiaridades tmbricas que justican la permanencia de la individualidad de cada uno de los sonidos constitutivos de la mezcla.
La relacin de octava es decir, la relacin 2 a 1, que es una conmensurabilidad muy
cercana da lugar a un intervalo claramente consonante.
Veamos ahora lo que sucede en el caso de intervalos cuya conmensurabilidad no es
ya tan inmediata. Los ejemplos que voy a presentar a continuacin tienen como caracterstica comn que los sonidos que constituyen el intervalo consonante proceden
del mismo instrumento, un piano. En el primer ejemplo examinaremos lo que sucede
en un intervalo de quinta, donde la relacin entre sus frecuencias es de 3:2 (relacin
320
sesquiltera); y en el segundo ejemplo analizaremos cmo se comporta un intervalo

de cuarta, cuyas frecuencias estn en la relacin 4:3 (sesquitercia). Para facilitar la
observacin he elegido unas notas del registro medio-agudo, donde el nmero de
componentes por nota es ya relativamente bajo.
Figura 13.7: Vdeo con el espectrograma de dos notas de piano formando un intervalo de quinta.
En el espectrograma podemos comprobar que tres componentes de la nota la4 , en la

columna de la izquierda, se corresponden con dos componentes de la nota mi5 , en
la columna del medio. En efecto, la frecuencia del componente fundamental de la
nota mi5 (659,3 Hz) est casi en una relacin de 3 a 2 respecto a a la frecuencia fundamental de la nota la4 (440 Hz). En el sonido resultante de la mezcla, en la columna
de la derecha, es posible percibir una cierta aproximacin a un patrn armnico, si
bien imperfecto. Este patrn armnico tendra como fundamental un supuesto primer armnico, cuya frecuencia sera la mitad de la del primer armnico de la nota
la4 y la tercera parte de la de la nota mi5 , pues el componente fundamental del sonido mezclado habr de ser el mximo comn divisor de los fundamentales de las
dos notas que han intervenido en la mezcla (es decir, con independencia del margen debido al temperamento, 220 Hz). En la descomposicin espectral del sonido
mezclado el de columna derecha no aparece como es lgico ese supuesto primer
321
armnico, pero podemos deducirlo de la estructura armnica, en la cual podemos

observar que los componentes se corresponden con los de las notas sin mezclar: el
segundo armnico coincide con el primer armnico de la nota aislada la4 ; el tercer
armnico es el mismo que el primer armnico de la nota mi5 ; el cuarto armnico es el
segundo armnico de la nota la4 ; el quinto armnico est ausente, ya que no podra
corresponder a ningn componente armnico de ninguno de los dos sonidos aislados; el sexto armnico es el resultado de la aportacin de ambos sonidos originales (el
tercer armnico de la4 y el segundo de mi5 ); y as sucesivamente. Es decir, es posible
detectar un cierto patrn armnico, pero lleno de huecos. Si a esta deciencia en la
estructura armnica del sonido mezclado unimos la fuerte pervivencia de las marcas
individuales de cada uno de los sonidos emitidos (entre otras, el ataque individual,
claramente destacado, de cada uno de las notas aisladas que queda reejado en las
correspondientes marcas luminosas iniciales), el resultado es la prevalencia de la percepcin individualizada de los sonidos. En efecto, en el vdeo podemos apreciar que
las notas se mezclan, pero su integracin sonora es mucho menor que la de la consonancia de octava. Ello se debe, sobre todo, a que la estructura armnica est llena
de huecos. Las marcas tmbricas individuales, al pertenecer al mismo instrumento e
incluso al mismo registro y estar dadas con el mismo tipo de ataque, son menores,
pero son lo sucientemente signicativas como para mantener la individualidad de
los sonidos. Hay que aadir tambin una circunstancia que pertenece a nuestro sistema cognitivo: sabemos cmo suena una nota aislada de piano, por lo que ese doble
ataque que omos en el sonido mezclado no nos confunde, sino que percibimos dos
sonidos emitidos simultneamente y no uno solo.
Algo similar, pero con un menor grado de integracin todava, ocurre en el caso de
la consonancia de cuarta, aquella que se establece entre dos sonidos cuyas frecuencias
estn en una relacin 4:3.
322
Figura 13.8: Vdeo con el espectrograma de dos notas de piano formando un intervalo de cuarta.
Ahora podemos apreciar en el espectrograma que por cada cuatro componentes de

la nota la4 hay tres de la nota re5 . En el sonido resultante de la emisin simultnea
de las dos notas es ms difcil distinguir un nico patrn armnico. Tendramos que
suponer la existencia de un componente fundamental que fuera la tercera parte del
componente primero de la nota la4 y la cuarta parte del componente primero de
la nota re5 . Esa supuesta estructura armnica del sonido mezclado tendra el primer
y segundo armnico ausentes; el tercero y el cuarto corresponderan al primero y
segundo de los respectivos sonidos aislados; necesariamente el quinto, sptimo, undcimo y duodcimo componentes estaran ausentes. Podemos darnos cuenta de que
si bien aun es posible distinguir un cierto patrn integrador, su debilidad es maniesta, dado el nmero y relevancia de sus lagunas. As mismo, las marcas individuales
de cada sonido perviven claramente. El resultado es que nosotros omos un sonido
compuesto, que en cierto modo parece mezclarse algo, pero en el que predomina por
completo la individualidad de los componentes. Pienso que, en lo que concierne a la
reunin de solamente dos sonidos simultneos, el lmite perceptivo de la mezcla est
en la relacin de conmensurabilidad 4:3, la del intervalo de cuarta, pues incluso aqu
es dudosa la plena integracin de dos sonidos en uno solo. Esta carcter ambiguo de
la cuarta explica que haya sido considerada como consonancia o como disonancia en
funcin de otras categoras propias de cada idioma musical.
323
Como conclusin podramos decir que para que se produzca la consonancia es necesario el reconocimiento de un patrn armnico en el sonido resultante de la mezcla,
el mismo que constituye necesariamente todo sonido musical, todo sonido que tiene
una frecuencia determinada y que es percibido por nuestro sistema cognitivo como
una nota. De ese modo percibiremos la mezcla como una unidad. Nuestro cerebro ha
aprendido a reconocer el patrn de la serie armnica (de uno u otro modo, ya sea
porque la serie armnica est presente en todos los mbitos de la naturaleza, ya porque culturalmente estamos desde nada ms nacer inmersos en la msica que ha sido
compuesta mediante la serie armnica). Por lo tanto, hay una tendencia a entender
como unicador todo aquello que tenga que ver con ese patrn de la serie armnica.
La percepcin de una mezcla de sonidos consonantes se asemeja hasta cierto punto
a la percepcin unitaria de un solo sonido armnico compuesto de componenetes
frecuenciales, pues, en tanto que se mezclan bien, percibimos como unidades aquellos sonidos cuyas frecuencias son mltiples o conmensurables prximas. Pero, a la
vez, en la percepcin de la consonancia hay un reconocimiento de la individualidad
de cada sonido, de cada voz, que la diferencia de la percepcin de un sonido compuesto, donde no se aprecia ninguna parte constituyente. Si ese reconocimiento de
la individualidad no se produce estaremos ms prximos a hablar de un sonido coral,
es decir, de un conjunto de sonidos individuales fundidos en una sola voz, la voz del
coro.
13.5.
Conclusin
En este captulo hemos estudiado cmo percibimos el sonido musical en un entorno acstico, identicndolo por sus marcas tmbricas y reconstruyendo su patrn
armnico, con los lmites que nuestro sistema auditivo tiene para distinguir componentes prximos. As mismo hemos podido experimentar que reconocemos dos
sonidos musicales como consonantes cuando su estructura armnica posee sucientes elementos en comn como para que nuestra percepcin auditiva sea capaz de
percibir una nueva estructura lo sucientemente armnica, a la vez que seguimos
reconociendo su individualidad gracias a sus marcas tmbricas.
324
Captulo 14
La voz musical
14.1.
Introduccin
La tarea de la percepcin musical no acaba con la identicacin de los sonidos, sino

que exige tambin la asignacin de cada uno de ellos a un sujeto, a una voz. En efecto, la msica requiere la organizacin en voces de todo el material sonoro. Para ello
se sirve tanto de las marcas tmbricas que cada sonido posee, como de las leyes sintcticas del lenguaje musical, que son las que establecen los criterios de continuidad.
Esta es la razn por la que para los antiguos tericos musicales la voz era la primera
categora musical, de tal modo que los sonidos eran denidos a continuacin como
las partes ms pequeas de la voz musical. En ese mismo sentido, este captulo pretende servir de puente entre la acstica y la teora musical, cerrando, por un lado, el
conjunto de nociones acerca del sonido que, a mi juicio, debera conocer un msico,
e iniciando, por otro, el primer tema propiamente musical, la naturaleza especca
de la voz musical y su origen en la prosodia del habla.
La voz musical se diferencia de la del habla en que mantiene las alturas tonales durante
el tiempo suciente como para que seamos capaces de percibir las notas y, en lugar
de discurrir de forma continua, va a saltos a travs de intervalos. A lo largo de este
captulo voy a mostrar que nuestro lenguaje musical es el resultado de la aplicacin
de nmeros al movimiento continuo de la voz del habla, o dicho de otra manera, que
la voz musical se origina a partir de la discretizacin de la prosodia del habla.
325
Para ilustrar el concepto de voz musical y para poder entender con claridad en qu
sentido la msica surge al establecer nmeros sobre el movimiento de la voz, he elegido cuatro ejemplos que, debido a las caractersticas del instrumento y de la interpretacin, muestran una progresin clara desde el movimiento totalmente continuo
de la voz en el habla (ejemplo 1) hasta la estabilidad de las alturas tonales en el piano
(ejemplo 4).
Por otra parte, para permitir apreciar cmo es la voz en cada caso he realizado mediante Matlab un tipo de representacin grca que dibuja el movimiento de la voz,
a la que podramos llamar melograma (del griego mlos, meloda, y grmma, dibujo), y que atiende especialmente a nuestra cognicin musical. Si el espectrograma se
asemeja a la manera en la que nuestro sistema auditivo descompone el sonido, como hemos visto en el captulo dedicado a la siologa de la audicin, esta forma de
representacin va a integrar de nuevo el objeto musical armnico y va a mostrar la
evolucin de sus parmetros a lo largo del tiempo.
Como en el espectrograma, tambin en el melograma la coordenada horizontal representar el tiempo, la vertical la frecuencia (traducida ahora a altura tonal y por
ello expresada en cents) y la escala de color la mayor o menor intensidad, ahora vista
como volumen sonoro. La transformacin en altura tonal y en volumen sonoro de
la frecuencia y la intensidad utilizar la escala logartmica que vimos en el captulo
5. Tomar como punto de partida la nota la0 a la que asignar 0 cents y desde all el
nmero de cents ir incrementndose. As, por ejemplo, 1.200 cents corresponder
a la1 , 2.400 a la2 , y as sucesivamente. Para mayor claridad, a la izquierda del nmero
de cents gurar el nombre de la nota correspondiente en nuestra escala temperada.
Respecto al volumen sonoro ser el resultado de la traduccin de la intensidad sonora a decibelios, expresados utilizando la misma escala de color, habitual ya en los
espectrogramas.
Tenemos tambin que tener presente que el melograma slo representa aquellos momentos en los que la voz est constituida por sonidos armnicos, es decir, en los
que es posible denir una frecuencia y en consecuencia percibimos una altura tonal,
mientras que aquellas partes en las que domina el ruido no estn representadas, como es el caso de la mayora de las consonantes o el del ataque inicial de las notas de
piano.
326
14.2.
El concepto de voz musical
Dos son las razones que justican que el concepto de voz sea el fundamento de
nuestra teora musical. La primera y ms importante es que el discurrir de la voz, y
no los sonidos aislados, es la realidad ms inmediata con la que nos encontramos en la
msica. La segunda es que el modelo sobre el que se ha construido nuestro lenguaje
musical es la voz humana en el habla. En nuestra msica hablamos de voz o voces
para referirnos a las diferentes estructuras meldicas que conviven en el desarrollo de
una pieza musical, pero que mantienen su identidad y su sentido. Y se llaman voz o
voces precisamente porque su referencia es la voz humana en el habla, con toda su
expresividad, emotividad y matices retricos.
En efecto, la asignacin de voces es la forma inicial en la que organizamos el
material sonoro con la finalidad de hacerlo inteligible. Por naturaleza nuestra
percepcin busca siempre distinguir voces en medio del fondo sonoro, de la misma
manera que busca guras en las imgenes visuales. Es la manera de poner orden en el
complejo sonoro que llega a nuestros odos, de darle forma y dotarlo de signicacin.
Si prestamos atencin al ruido de trco de una carretera, por ejemplo, lo primero
que nos surgen son voces en medio del ruido: la voz de la motocicleta, la voz
del camin, etc. Organizamos cualquier material sonoro diverso en voces, es decir,
en protagonistas, en personajes.
Encontramos, as pues, que la voz lleva asociada la idea de identidad, la de individualidad. La voz posee una marca, un distintivo, lo que hoy llamamos, precisamente
por eso, un timbre, algo que le da una personalidad propia capaz de ser distinguida
en medio de otras voces o de un ruido confuso. La palabra voz nos trae a la mente
que hay un sujeto que est detrs, que hay un alguien que dice algo o, en msica,
que canta algo. Entre todas las informaciones que transmite la voz, hay una de especial relevancia: es su propio auto-identicador. La voz est diciendo constantemente
quin es, y esto lo hace de mltiples maneras, de las cuales el timbre es quizs la ms
evidente. Por ejemplo, la voz del contralto puede ascender por encima de la del tiple
y la del tiple, obviamente, descender por debajo de la del contralto, pero la voz del
contralto seguir siendo la del contralto y la del tiple la del tiple y el oyente no tiene
ningn problema, incluso aunque se mezclen unas con otras, en reconocer cada una
de esas voces.
327
En medio de una partitura, con sonidos simultneos que suben y bajan y se entrelazan en todas las direcciones, podemos distinguir el desarrollo de cada una de las
voces. No en vano cantar las voces es uno de los objetivos ms importantes de todo instrumentista, muchas veces lo que diferencia al buen intrprete del mediocre.
Por ejemplo, cualquiera que est aprendiendo a tocar el piano lo primero con lo que
se encuentra es con la dicultad de dar las notas. Solo ms tarde esas notas pasan a
formar parte de ideas musicales, y todava mucho ms tarde, y despus de mucho
esfuerzo, surge en l la capacidad de entender y de contar la multiplicidad de ideas
que laten en medio de la maraa de una partitura compleja y que se ponen de maniesto en el juego de las diferentes voces. En efecto, estas ideas habitan la partitura
de mil formas: unas veces en las voces intermedias, donde pasan casi desapercibidas; otras, perladas por notas que a veces estn distanciadas entre s por compases
enteros; otras entre los extremos de los arpegios que acompaan muchas veces a las
melodas; etc. Entonces es cuando la partitura comienza a tomar vida y deja de ser
una amalgama de sonidos incomprensibles y mecnicamente ejecutados, para pasar
a ser un conjunto de voces trabadas en el que cada una cumple su funcin y dice sus
ideas. Esto, que puede parecer propio solo de los instrumentos capaces de dar notas
simultneas como el piano, se da tambin en instrumentos tan aparentemente poco
dotados para la polifona como el violn. Cuntas veces hemos odo alabar la interpretacin de un violinista diciendo que pareca un dueto! Cmo podemos or en
un simple violn una fuga a tres voces? La msica es cosa de voces y la tarea del instrumentista es decir las voces y expresar mediante ellas emociones y sentimientos.
Algo parecido podramos haber dicho del que aprende a escuchar msica, porque
aprender a escuchar msica no es otra cosa que aprender a or voces y a distinguir las
ideas musicales que ellas van diciendo. As es como cobra su pleno sentido la emocin
de la msica.
Dejando ya los aspectos cognitivos que justican el carcter primigenio del concepto
de voz en msica, pasar ahora a explicar en qu sentido digo que la voz humana ha
sido el modelo sobre el que se ha construido nuestro sistema musical. La voz ha sido
nuestra principal herramienta de comunicacin con el mundo, en un proceso evolutivo que probablemente ha ido desde los primeros gruidos, gritos y dems ruidos
inarticulados, hasta las construcciones ms elaboradas del habla y de la msica.
328
En el habla la voz ha codicado principalmente tipos de ruidos distintos (las diferentes consonantes) y posiciones distintas de resonancias del rgano vocal (las diferentes
vocales). Mediante combinaciones de ambos elementos hemos ido adquiriendo la
capacidad de nombrar las cosas y de contar nuestras experiencias. Por ejemplo, si
decimos la frase quiero esto, estamos utilizando el ruido k para empezar, luego el
ruido r, despus la especie de silbido s, y por ltimo el ruido t. Para ayudarnos
a articular estos ruidos, especialmente aquellos de muy corta duracin, nos servimos
de unos sonidos voclicos, los cuales, a diferencia de los ruidos de las consonantes, s
poseen una altura tonal y tienen una duracin suciente. No obstante, no diferenciamos estos sonidos voclicos por su altura tonal, sino por la manera en la que los
hacemos resonar variando la posicin de nuestro aparato fonador. En este ejemplo
hemos utilizado tres conjuntos de resonancias voclicas distintas: las propias de la
i, las de la e y las de la o. No es posible explicar aqu qu son las resonancias
especcas de cada vocal, ni cmo son ni en qu consisten las articulaciones de los
sonidos que constituyen la cadena hablada; ahora nos interesa atender slo a aquellos
aspectos del habla que van a tener mayor repercusin en la msica, en concreto, la
altura tonal de los sonidos voclicos.
As pues, la voz hablada no consta slo de ruidos, sino tambin de sonidos voclicos
que, aunque se distinguen por la forma de su resonancia (los denominados formantes
propios de cada vocal) poseen una altura tonal. Pero en el habla la altura tonal en la
mayora de las lenguas no est prcticamente codicada y no lleva, por lo tanto, una
parte importante de signicacin lxica. Aunque s posee otra funcin muy importante: la altura tonal es la que organiza las palabras y las frases y, sobre todo, permite
unir a la expresin de los conceptos los matices emotivos del hablante. La altura tonal,
junto con la intensidad sonora y la duracin temporal de las slabas, constituyen los
aspectos ms importantes de lo que en general se denomina prosodia del habla.
En el caso de la msica occidental el modelo sobre el que se ha construido el lenguaje
musical ha sido la voz humana en el habla. Con esto no quiero decir que todo lenguaje musical tenga que surgir necesariamente ligado al habla, sino slo que nuestro
sistema musical lo ha hecho as: ha nacido en ntima relacin con los aspectos prosdicos del griego antiguo, tanto en lo que concierne a las alturas tonales como a las
duraciones. Los elementos de nuestro lenguaje musical (sonidos, intervalos, escalas,
tiempos, compases) son el resultado de una abstraccin de los aspectos prosdicos de
329
la voz hablada, es decir, de aquellos aspectos que, como su nombre indica, son anes
al canto (prosodia viene de d, canto), los cuales son precisamente los que llevan
en mayor medida la signicacin emotiva. Esta abstraccin ha consistido en jar numricamente las alturas tonales y las duraciones, y en establecer entre ellas un sistema
de proporciones. Con independencia de su evolucin histrica, esta abstraccin es
un proceso lgico que ha dado lugar a un sistema de codicaciones capaz de expresar
y transmitir una signicacin emotiva. As pues, la voz musical, a diferencia de
la voz del habla, es el resultado de la codificacin de las alturas tonales de los
sonidos y de sus duraciones.
14.3.
El movimiento de la voz en el recitado de la primera estrofa

de la Oda a la flor de Gnido de Garcilaso de la Vega
Comencemos examinando cmo es el movimiento de la voz en el habla. Vemoslo

en la declamacin de la primera estrofa del poema de Garcilaso de la Vega, Oda a la
or de Gnido. He elegido este poema como homenaje al instrumento sobre el que se
bas la construccin de nuestro sistema musical, la lira. Garcilaso, adems, es de los
primeros poetas castellanos que vuelven su mirada al mundo antiguo, como queda
reejado claramente en el poema, y es el inventor de esta estrofa, la lira, en la que
se combinan los versos endecaslabos, muy ligados al habla natural, con los de siete
slabas. Los versos son:
Si de mi baja lira
tanto pudiese el son que en un momento
aplacase la ira
del animoso viento
y la furia del mar y el movimiento,
Veamos en primer lugar un vdeo con el espectrograma del recitado de la estrofa

entera.
330
Figura 14.1: Vdeo con el espectrograma de la primera estrofa de la Oda a la or de Gnido de

Garcilaso de la Vega.
La declamacin es ms lenta que lo habitual en un poema y las pausas entre versos son
tambin muy exageradas, pues he pretendido principalmente mostrar con claridad
cmo discurre el movimiento de la voz hablada. Pero hemos de tener en cuenta que
la prosodia de la voz recitada ya tiene algo de musical: las palabras del poema han
sido elegidas por el poeta teniendo en cuenta su sonoridad, su entonacin y el ritmo
que se deriva de la ordenacin de los acentos (por eso se valora la musicalidad de
una poesa). As mismo, en un poema la rima establece la periodicidad del verso, sin
necesidad de interrumpir de una manera tan grande como se ha hecho aqu la cadena
hablada. Nada de esto se produce en el habla ordinaria, por lo que si hubiera elegido
un fragmento del habla comn, este tipo de formas que aqu apreciamos con claridad
quedaran algo desdibujadas.
En el espectrograma vemos claramente separados los cinco versos de la estrofa y
podemos distinguir tambin las diferentes slabas, tal como han sido pronunciadas.
Si nos jamos, por ejemplo, en el primer armnico, en el componente ms grave,
podemos tambin hacernos una idea aproximada del movimiento de la voz.
Pero un espectrograma no es la forma de representacin idnea para el movimiento de la voz, pues contiene mucha informacin que nos complica su observacin.
Ciertamente podemos apreciar que hay una relacin clara entre lo que vemos y lo
331
que omos, pero a la hora de recuperar el mensaje sonoro nuestro cerebro da un paso ms que no est recogido en el espectrograma. Como hemos visto en el mdulo
acerca de la percepcin del sonido musical, nuestra mente integra el conjunto de
armnicos para recuperar la unidad del sonido y seguir la evolucin en el tiempo
de los parmetros de ese sonido. Por eso nos viene muy bien utilizar el melograma,
una forma de representacin grca ms apropiada para el movimiento de la voz,
que reproduzca, aunque sea de manera aproximada, la evolucin de los parmetros
sonoros que realiza el intrprete y su recuperacin por parte de nuestro cerebro. En
el vdeo que presento a continuacin se muestra el melograma del primer verso de
este recitado. Al tratarse de un fragmento de escasa duracin podemos apreciar con
claridad los detalles del movimiento de la voz. Recordemos que los huecos de la grca se corresponden con los sonidos consonnticos que carecen de una altura tonal
denida.
Figura 14.2: Vdeo con el melograma de la recitacin del primer verso de la Oda a la or de Gnido
de Garcilaso de la Vega.
Pasemos ahora a analizar las caractersticas del movimiento de la voz en el habla que
se pueden observar en el espectrograma y en el melograma del recitado de estos
versos de Garcilaso, atendiendo especialmente a aquellas que poseen cierta validez
general.
332
La primera y ms destacada es la continuidad del movimiento de la voz en el

habla. Si nos pidieran que a partir de estas grcas precisramos las notas que se han
dado y cundo, veramos que esto es algo realmente imposible, pues la voz sube y
baja continuamente sin detenerse nunca en ninguna altura determinada. Y eso que
estamos ante un recitado, que si fuera en el habla cotidiana esta continuidad sera
todava ms exagerada.
Por otra parte, el rango tonal del movimiento de la voz en el habla es reducido.
En los vdeos vemos que incluso tratndose de un poema recitado, el rango total de
la voz en el habla no excede de una octava. La altura tonal ms aguda corresponde
a la slaba fu de furia, que vendra a ser un re3 , y la ms grave a la slaba ra
de lira, que en su punto ms grave sera un re2 . Desde la perspectiva musical nos
interesa este dato porque es otro elemento a tener en cuenta a la hora de justicar
la importancia del intervalo de octava y, especialmente, la importancia de las formas
escalares de octava. Sin embargo, si atendemos solamente a cada sintagma, que en
este caso coincide con cada verso (a excepcin del segundo verso donde hay dos
sintagmas), vemos que el rango es ms reducido, situndose en torno a una cuarta o
una quinta aproximadamente.
As mismo, observamos que cada sintagma se encuentra definido prosdicamente por una frmula cadencial descendente, es decir, la voz puede iniciarse en el
punto ms grave o en el medio, sube o baja, pero siempre termina en el punto ms
grave, habiendo abarcado un intervalo aproximado de cuarta o quinta. El modelo
de cadencia descendente en torno a un intervalo de cuarta o quinta es de especial
importancia, como se puede ver en el estudio de la teora musical, para entender la
construccin de nuestro sistema musical. El ltimo verso, sin embargo, parece ser una
excepcin a este modelo. Encontramos que all no se produce esta frmula cadencial, sino que, por el contrario, la prosodia termina arriba. Esta ausencia de frmula
cadencial nos informa de que el sentido de la frase queda abierto, que la prosodia exige una continuacin. En efecto, la estrofa entera constituye el antecedente de una
oracin condicional que va a reposar dos estrofas ms all.
Observamos tambin que, en general, el acento supone una elevacin de la altura
tonal respecto a la slaba siguiente, junto a un incremento de la intensidad y una
mayor duracin de la slaba. En castellano el acento es signicativo a la hora de
distinguir entre palabras distintas (por ejemplo, pblico, publico y public).
333
Pero este acento se encuentra siempre supeditado e integrado dentro de la frmula

cadencial que organiza los sintagmas.
14.4.
El movimiento de la voz en los compases iniciales del Lamento de Ariadna de Monteverdi
El siguiente ejemplo lo constituyen los seis primeros compases del Lamento de Ariadna de Claudio Monteverdi, compositor representativo de la nueva corriente musical
que en la frontera de los siglos XVI y XVII intenta recuperar la msica griega antigua y, en especial, el teatro musical griego. Podemos observar los rasgos de este
intento en el carcter homfono de esta nueva forma de hacer msica, caracterizada
por una voz sola acompaada de un bajo continuo que lleva el soporte armnico y
por el cromatismo intenso que intenta imitar los gneros cromtico y enarmnico
que se atribuan a la tragedia griega. La razn principal por la que he elegido este
fragmento es por su proximidad a la prosodia del habla. En efecto, se trata de voz
cantada, pero, al ser un lamento, es casi un recitativo: el tempo es lento, y el ritmo y
la modulacin de la voz son muy exibles. Veamos primero la partitura y luego un
espectrograma del fragmento entero y un melograma en el que podremos apreciar
el detalle del movimiento de la voz de la segunda frase.
Figura 14.3: Partitura de los compases iniciales del Lamento de Ariadna de Monteverdi.
334
Figura 14.4: Vdeo con el espectrograma de los compases iniciales del Lamento de Ariadna de
Monteverdi.
Figura 14.5: Vdeo con el movimiento de la voz de la segunda frase del Lamento de Ariadna de
Monteverdi.
Comenzar por lo ms evidente que podemos ver en ambas representaciones. El registro en el que se sita es mucho ms alto que el recitado del poema de Garcilaso.
Evidentemente la diferencia de altura tonal entre una voz de hombre y una de mujer es grande, aproximadamente una octava, pero la altura en la que se mueve este
335
lamento es ya muy elevada para una voz hablada. Simplemente, si oyramos hablar
a alguien con una entonacin en este registro nos resultara como mnimo sorprendente.
As mismo, el mbito de esta idea musical es tambin superior al de la prosodia: a
pesar de su austeridad, aqu recorre la octava entera con agilidad. Por otra parte, los
saltos de altura tonal entre slabas o palabras son impensables en la prosodia del habla
(entre sib4 y fa4 , entre mi4 y si4 , y entre re5 y fa4 ). Solamente estos rasgos estableceran
ya una diferencia clara entre este pasaje y el de la voz hablada.
Pero vamos ahora ya a lo que ms nos interesa, el tipo de movimiento de la voz.
Si nos jamos en el melograma de la gura 14.5 vemos que la voz sigue teniendo
un cierto carcter continuo, y de hecho no permanece ja prcticamente nunca.
No obstante, hay una considerable diferencia con el movimiento de la voz en la
declamacin del poema anterior: en general, la voz tiende a mantener ahora unas
lneas ms o menos horizontales. El lenguaje musical ha construido estas lneas
y ha denido las alturas tonales precisas sobre las que la voz se ha de mantener, o ha
de girar en torno, durante un espacio de tiempo lo sucientemente prolongado para
ser reconocidas como notas.
En este ejemplo, esta tendencia a la horizontalidad parece clara, hasta el extremo
de que podramos aventurar en el melograma las notas que constituyen la meloda.
Ahora bien, su altura tonal se modica a lo largo de la emisin, bien ascendiendo o
descendiendo ligeramente, bien oscilando en torno a un valor medio. En la interpretacin de estas notas vemos que, por un lado, la cantante ha tendido a imitar la
continuidad de la prosodia hablada, deslizando la voz, pero, por otro, ha utilizado un
recurso especcamente musical, un vibrato muy rpido y muy amplio.
Resumiendo, en la comparacin de este fragmento cantado con la declamacin anterior, vemos que hay acontecimientos denidos y, en general, separados, que nos
permiten identicar como notas musicales cada una de los dibujos del melograma.
Podemos tambin establecer un cierto valor medio en la altura tonal de las notas,
pero las libertades expresivas de la interpretacin hacen que la determinacin precisa
de la altura tonal no sea posible en todos los casos.
336
14.5.
El movimiento de la voz en el inicio del Adagio de la Sonata I para violn solo (BWV 1001) de J. S. Bach
El ejemplo siguiente corresponde al inicio del Adagio de la Sonata I para violn solo de
J. S. Bach, BWV 1001. El violn y lo mismo podramos decir de los dems miembros de su familia es el instrumento que ms se asemeja en posibilidades expresivas
a la voz humana. No en vano su desarrollo est muy ligado al estilo homofnico que
triunfa a partir de 1600 (la seconda prattica que he mencionado a propsito del fragmento de Monteverdi). En efecto, al carecer de trastes, el violn puede dar cualquier
altura tonal intermedia dentro de su tesitura (la primera dicultad a la que se enfrenta
el violinista es la de anar bien) y el intrprete puede modicarla con toda libertad
a lo largo de su emisin, deslizando la voz de nota en nota o hacindola oscilar a
voluntad. Tambin, al igual que en el canto, puede modicar libremente a lo largo
de la emisin la intensidad del sonido e incluso la cualidad sonora, aumentando o
disminuyendo el nmero de sus armnicos.
Veamos, igual que en el ejemplo anterior, la partitura, un vdeo con el espectrograma
del fragmento entero y otro con el melograma en el que vemos el movimiento de
la voz principal de la primera parte de la frase inicial. Como ahora el espectrograma es un poco ms complicado, me ha parecido oportuno etiquetar las notas de la
meloda.
Figura 14.6: Partitura de la primera frase del Adagio de la Sonata I para violn solo (BWV 1001)
de J. S. Bach.
337
Figura 14.7: Vdeo con el espectrograma de la primera frase del Adagio de la Sonata I para violn
solo (BWV 1001) de J. S. Bach.
Figura 14.8: Vdeo con el melograma que representa el movimiento de la voz del inicio de la
primera frase del Adagio de la Sonata I para violn solo (BWV 1001) de J. S. Bach.
Una comparacin supercial de este ejemplo con el anterior nos muestra ahora una
definicin ms clara de las alturas tonales y de las duraciones. As mismo, salvo
alguna pequea excepcin en notas muy rpidas y seguidas, el movimiento de la
voz es intervlico, es decir, la voz va a saltos. La voz se establece con claridad en una
338
altura tonal determinada y procede a intervalos, de modo que resulta imperceptible

la transicin de una altura a otra, a excepcin de la bordadura sib4 -la4 -sib4 donde la
ejecucin es ligada. En este ejemplo estaramos ya mucho ms cerca de poder denir
unas alturas tonales relativamente estables. Esto no se puede atribuir a un rasgo especco del instrumento, sino que ha sido la partitura elegida la que ha condicionado
una interpretacin ms denida en las altura tonales. En lo que concierne a la duracin de las notas, vemos tambin que mantienen un claro patrn de espaciamiento,
es decir, una cierta regularidad rtmica. El hecho de que en el espectrograma algunas
notas a veces parezcan superponerse a las siguientes es debido a la resonancia de la
sala o, en su caso, a la posible reverberacin aadida en la grabacin.
No obstante, un examen ms minucioso del espectrograma y del melograma nos
permite observar varias caractersticas que contravienen esa aparente regularidad y
que recuerdan al ejemplo anterior. En primer lugar, la altura de las notas que llevan el mismo nombre no siempre es exactamente la misma. En ocasiones el
instrumentista tiende a aproximarse ms a la nota inferior o a la superior, alejndose
de la anacin temperada, para destacar ms la atraccin de las notas prximas. A
modo de ejemplo, el segundo de los dos fa#4 es casi un cuarto de tono ms alto que
el primero, lo que podramos haber apreciado con ms claridad que en el espectrograma si hubiera extendido un poco ms la duracin del movimiento de la voz en el
melograma. As mismo, en las notas cuya duracin es ms larga se aprecia con
claridad una oscilacin rpida de su altura tonal, que es el resultado del vibrato
producido por el violinista, si bien este vibrato es mucho menos amplio que el que
vimos en algunas notas del Lamento de Ariadna. El vibrato tiene principalmente dos
nalidades: por un lado, dulcica la aspereza de la cualidad sonora y, por otro, facilita
la anacin, al posibilitar una cierta indeterminacin de la altura tonal.
14.6.
El movimiento de la voz en el inicio del Nocturno op.9, n

1 de Fr. Chopin
Como ltimo ejemplo he elegido un pasaje muy cantabile, el inicio del Nocturno op.
9 n 1 de Fr. Chopin. Presento en primer lugar la partitura y luego el espectrograma
y la representacin del movimiento meldico en el melograma.
339
Figura 14.9: Partitura del inicio del Nocturno op. 9 n 1 de Fr. Chopin.
Figura 14.10: Vdeo con el espectrograma del inicio del Nocturno op. 9 n 1 de Fr. Chopin.
340
Figura 14.11: Vdeo con el melograma del inicio del Nocturno op. 9 n 1 de Fr. Chopin.
Las imgenes de ambos vdeos presentan unas caractersticas muy distintas de todo
lo que hemos visto hasta ahora. En el espectrograma vemos que predomina la lneas
horizontales, y en el melograma vemos con total claridad un conjunto de lneas horizontales que precisamente se superponen a la retcula que dene las alturas tonales
de nuestras notas del sistema temperado en el diapasn estndar.
Esta horizontalidad en este caso vienen determinada por la naturaleza del instrumento. El piano es un instrumento de anacin ja, en el que el principal parmetro sobre
el que puede actuar el pianista es la velocidad de ataque, es decir, la rapidez con la
que baja la tecla. Una vez que el macillo queda libre de la tecla mediante el mecanismo de escape ya no hay posibilidad alguna de modicar el sonido (salvo apagarlo
antes o despus al soltar la tecla y liberar el apagador). Por ello, la mayor parte de la
informacin que el intrprete aporta queda condensada en las milsimas iniciales de
su ataque.
Si en este ejemplo se nos pidiera de nuevo precisar las alturas tonales del movimiento
de la voz utilizando solamente el espectrograma, la respuesta no planteara ninguna
dicultad. En el caso del espectrograma nos bastara con trazar lneas horizontales
que pasaran por el medio de cada gura o mancha de luz. En el melograma la respuesta sera todava ms evidente. Observamos, adems, que, como es lgico, todas
las notas con el mismo nombre estn ahora a la misma altura tonal. Efectivamente, las
alturas tonales estn ahora totalmente denidas. As pues, en este ejemplo podramos
341
asignar un nmero preciso a cada nota, su altura tonal expresada en cents. De hecho, realmente es al revs: es esta posibilidad de tener alturas tonales jas, expresables
numricamente, la que nos permite dar nombre a las notas.
Podramos observar tambin algunas pequeas diferencias respecto al modelo ideal
de lneas horizontales. Por ejemplo, las lneas correspondientes a las notas ms agudas
parecen estar ligeramente por encima de la retcula que marca la anacin temperada
estndar (con el la4 a 440 Hz). Esto se debe a la inarmonicidad del piano que hace
que la anacin de las notas superiores se vaya estirando un poco. Podramos tambin
apreciar algunas ligeras indecisiones en la anacin de algunas notas que parecen incluso oscilar ligeramente. Ello es debido al problema del derrame espectral que unido
al ruido que acompaa el ataque de cada nota provoca una cierta indeterminacin en
la precisin del reconocimiento de la frecuencia. Y todava ms, dejando al margen
estas cuestiones, incluso las notas de un piano, en una escala minscula cierto es, presentan tambin una cierta evolucin en la frecuencia. Pero no es momento de tratar
estas cuestiones ahora. Lo que nos interesa es que aqu si que vemos ya los elementos del lenguaje musical: las alturas tonales denidas con claridad que determinan las
notas y que constituyen la referencia que se crea en nuestra mente musical y que nos
permite entender y dar sentido incluso a los movimientos de la voz musicales que se
alejan de este modelo y se acercan ms al del habla.
Por otra parte, resulta tambin claro que aqu nos sera muy fcil especicar con toda
seguridad la duracin de cada nota (teniendo en cuenta, claro est, que lo que debemos medir es la distancia entre sucesivos ataques). Ya he explicado en el ejemplo del
violn a qu se debe la superposicin de algunas notas en el espectrograma. Aqu, en
este ejemplo, la utilizacin del pedal hace que las notas tiendan a superponerse ms
que en el caso del violn. Pero tambin podra haber sucedido lo contrario, y la ejecucin de las notas haber sido ms picada. Ahora bien, desde el punto de vista mtrico
ambas situaciones son irrelevantes: afectan slo al carcter de las notas, a la expresin,
pero no al ritmo, es decir, no alteran la codicacin mtrica. As mismo, resulta aqu
tambin ms clara todava la existencia de una repeticin de determinadas duraciones. Dar un paso ms y ver que esas duraciones guardan entre s las proporciones
sencillas de doble, triple, etc., requerira simplemente el uso de la regla.
Es importante destacar que en este ejemplo, en el que las altura tonales son claramente
estables y denidas numricamente, debemos seguir hablando de movimiento de la
342
voz. Aunque sea a saltos, aunque ya estemos muy lejos de los rasgos de la prosodia,
aunque no tengamos la versatilidad de la voz cantada, ni su imitacin como hace la
voz en el violn, tambin aqu hay un movimiento de la voz. El intrprete de piano
tiene que hacer todo lo posible para que el instrumento cante. Sin el movimiento
de la voz no existira msica en su sentido pleno, sino solamente una sucesin de
sonidos carentes de signicacin. El piano es, de algn modo, el instrumento de
referencia de nuestro sistema musical y en ese sentido tiene un papel equivalente al
que tena la lira en la Antigedad.
As pues, si volvemos al ejemplo del recitado del poema, donde la voz discurre sin
solucin de continuidad y la comparamos con el movimiento puramente intervlico
de la voz en un instrumento de anacin ja como es el piano, podemos ver cmo
nuestro lenguaje musical es el resultado de la cuanticacin de la altura tonal y, a
partir de ella, de la duracin.
14.7.
El espacio de la significacin musical
Para concluir este captulo, y con ello este curso, voy hacer ahora una breve reexin sobre lo que hemos observado en todas estas grcas de los distintos tipos de
movimiento de la voz.
Los melogramas nos han permitido intuir una nocin muy prxima a la realidad
sonora: el espacio musical, es decir, el lugar en el que se produce la signicacin
de la msica. El movimiento de la voz o de las voces discurre a lo largo del tiempo
en un espacio sonoro que va del grave al agudo. Nuestro sistema notacional, nuestra
partitura, representa de algn modo esta nocin de espacio musical: el tiempo con la
dimensin horizontal y la altura tonal con la dimensin vertical. Pero lo que tenemos
en una partitura es la obra musical, la idea musical, una elaboracin mental, no es
su realizacin fsica, sonora, no es su interpretacin. En el melograma, sin embargo,
vemos el espacio de la msica sonando, interpretada, hecha sonido.
Adems, ese espacio musical, tal como queda representado en el melograma, es el espacio de nuestra sensacin auditiva, no el del hecho fsico, no es la vibracin sonora.
La msica debe muchas de sus propiedades a la fsica del sonido, pero su verdadero punto de partida es nuestra sensacin, la manera en la que nosotros percibimos
343
los acontecimientos sonoros. El movimiento de la voz que hemos visto en todos los
melogramas es movimiento respecto a nuestra percepcin, es decir, es la variacin
dentro de una escala temporal adecuada a nuestra percepcin de uno de los parmetros caractersticos del sonido: la frecuencia instantnea. Al margen de que desde el
punto de vista fsico el sonido sea movimiento ms exactamente movimiento vibratorio, el movimiento que interesa a la msica es el movimiento de la
voz que percibimos, es decir, la variacin en el tiempo de su altura tonal.
El melograma nos ha permitido tambin ilustrar con imgenes el proceso de abstraccin que conduce desde la prosodia de la voz hablada hasta la constitucin del sistema
musical. La permanencia de la voz en alturas tonales determinadas permite establecer medidas y proporciones entre ellas. Estos nmeros son los que codican
las alturas tonales y determinan un conjunto de intervalos a los que el sistema musical dar signicacin, organizando las escalas. El lenguaje musical se crea a partir
del espritu de la voz humana en el habla, pero adquiere su ordenacin precisa es
decir, se codica, se hace propiamente sistema (escala) mediante un instrumento
de anacin ja que permite precisar las alturas tonales. En el caso de su creacin
histrica, este instrumento fue la lira; hoy es el piano del que podemos considerar,
en este sentido, que la lira fue un antecedente.
Por otra parte, hemos visto en el ejemplo del poema recitado dos caractersticas de
la voz hablada que van a tener muchas consecuencias en la creacin de nuestro sistema musical: una es el reducido mbito tonal en el que se mueve la
entonacin de cada unidad sintagmtica en el habla, un mbito de aproximadamente una cuarta o una quinta; otra, la frmula cadencial descendente con
la que se delimitan estas unidades. Por las noticias que nos han llegado de los tericos musicales y de los gramticos antiguos, estas caractersticas se daban tambin
en el griego antiguo, lengua que sirvi de fundamento a la construccin de nuestro
sistema musical. La primera explicar en parte la importancia del tetracordio y de la
consonancia de cuarta en las primeras formas escalares antiguas. La segunda se reejar en el carcter descendente de todas las resoluciones: las cadencias descendentes
van a dominar por completo el lenguaje musical de Occidente hasta la aparicin de
los primeros atisbos de la sensible ascendente en la msica de los trovadores. Pero las
consecuencias de esta cuestin pertenecen ya al estudio de la teora musical.
344
As mismo, estos ejemplos nos han permitido acercarnos mejor a un asunto que tiene
que ver con la interpretacin. Consideramos que una cualidad del intrprete es hacer hablar al instrumento. Mediante los melogramas hemos podido comprobar hasta
qu punto esto es literal: hacer hablar al instrumento es acercarse a la prosodia
del habla, es decir, alterar las alturas tonales o las duraciones de las notas que corresponderan al patrn escalar o rtmico, bien a travs de inexiones o desviaciones
de la voz, bien a travs de modicaciones de los tiempos (rubato, ritandando, etc.),
para aproximarnos a la naturalidad del movimiento de la voz en el habla, adquiriendo mediante este pequeo alejamiento del cdigo musical una alta signicacin
emotiva.
14.8.
Conclusin
Este captulo ha tratado de mostrar que la msica es esencialmente una cuestin de

voz o de voces entendiendo la palabra voz en su sentido ms amplio y que lo
especco de nuestro lenguaje musical consiste en establecer nmeros y medidas
sobre ese movimiento de la voz. Al hacerlo as, al detenerse la voz durante algn
tiempo en algn lugar del espacio sonoro, en alguna altura tonal concreta, surge el
sonido musical, denido por los antiguos precisamente como la parte ms pequea
de la voz meldica. El estudio de las relaciones entre esos sonidos tanto las leyes
que rigen su sucesin en cada una de las voces, como las de su reunin simultnea
en los acordes compete ya al estudio propio de la Teora Musical.
Como dije al empezar, la nalidad de este curso ha sido proporcionar los fundamentos acsticos y psicoacsticos sobre los que se ha creado nuestro lenguaje musical.
Por ello hemos ido examinando todos los aspectos que conciernen al sonido musical,
desde su constitucin fsica como un movimiento mecnico que se transmite por
un medio elstico cuyos parmetros frecuenciales cumplen unas caractersticas que
las hacen adecuados para ser percibidos por el odo humano, hasta su cualidad de
ser el primer elemento de la meloda, el que se pone de maniesto cuando el movimiento de la voz musical se detiene en un determinado punto del espacio sonoro.
Tambin hemos conocido, aunque haya sido someramente, cmo es y cmo acta
nuestro sistema auditivo a la hora de reconocer el sonido musical o armnico. Y de
345
paso hemos aprendido a observar unas representaciones grcas del sonido, el espectrograma y el melograma, que pueden ser de gran utilidad al msico y al musiclogo
para realizar el anlisis sonoro de una interpretacin musical.
Aqu nos quedamos, pues, a las puertas del estudio de la Teora Musical, que debe dar
cuenta del lenguaje que permite dotar de sentido a los sonidos de la msica.
346
Bibliografa
[1] HRNN, WII M., Principles of Musical Acoustics, Springer, 2013.
[2] JHNSN, I., Measured Tones: The Interplay of Physics and Music, 3rd Edition,
CRC Press, 2009.
[3] RRR, JN G., The Physics and Psychophysics of Music. An Introduction, 4th
Edition, Springer, 2008.
[4] RSSING, THS D., MR, F. RIHR y WHR, P A., The Science of
Sound, 3rd Edition, Pearson, 2013.
[5] SHN, JN, NN, ISR y KING, ANR, Auditory Neuroscience: Making
Sense of Sound, The MIT Press, 2011.
347

Acustica Musical

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Acustica Musical

Enviado por

Direitos autorais:

Formatos disponíveis

Acstica Musical

Luis Colomer Blasco

Este documento esta realizado bajo licencia Creative

Sobre los materiales multimedia

1. El sonido como vibracin

3. Caractersticas de los sonidos musicales

5. Altura tonal, intervalos y volumen sonoro

6.4.2. Causas de los batidos de primer orden . . . . . . . . . . . . . 94

8. Ondas estacionarias y resonancia: Generacin del sonido armnico 150

8.2. La cuerda como paradigma de un sistema vibratorio unidimensional

10. Anlisis espectral de los sonidos musicales

10.5.4. Espectrograma de ruido blanco y sonido simple . . . . . . . . 229

12. Fisiologa de la audicin

12.7. Conclusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303

los batidos, la consonancia, las envolventes de amplitud y de frecuencia, etc. A la vez,

entre el hecho fsico de la vibracin y nuestra forma de percibir los acontecimientos

cer componente ms grave, debemos atribuirlo a la distorsin de intermodulacin

Empecemos conociendo qu es el sonido, cualquier sonido, sea o no musical. La

Simulacin de la vibracin del aire en un sonido simple

sus inmediaciones, con lo que su densidad disminuye y su presin desciende. Esta

Propagacin de la perturbacin a travs del aire

Si midiramos con exactitud, mediante un editor de vdeo u otro programa similar, el

Movimiento individual de oscilacin

Vemos que la forma de la grca que dibuja el movimiento de oscilacin de cada

De la oscilacin individual a la propagacin ondulatoria

Figura 1.3: Vdeo con el movimiento oscilatorio de una la de esferitas.

a) En las ondas longitudinales la direccin de propagacin es la misma que la de la oscilacin

b) Los desfases provocados por la elasticidad transforman los desplazamientos oscilatorios

En el vdeo observamos que la elasticidad de los muellecillos causa retrasos en la

Distancia entre esferitas

Veamos ahora lo que es especco de un sonido simple y, en concreto, de la onda

La longitud de onda es la distancia entre dos puntos equivalentes de la perturbacin

Si ahora volvemos de nuevo al vdeo de la gura 1.3 y prestamos un poco de atencin,

Simulacin de la vibracin del aire en un fragmento sonoro

El carcter sencillo y repetitivo de la vibracin en el caso de un sonido simple se

en funcin de la lejana, las variaciones de la presin originadas por la fuente

Representacin del sonido

Aquellos fongrafos consistan en una membrana capaz de vibrar solidariamente con

Figura 2.1: Un fongrafo. Dibujo de la poca.

Con el desarrollo de la electricidad, las oscilaciones mecnicas de la membrana que

Un ejemplo de registro digital

Veamos mediante un ejemplo en qu consiste el registro de la seal de audio digital.

en nmeros lo que sucede en la vibracin sonora. Se trata de un pequeo circuito

el vdeo se corresponden a las 20 primeras milsimas de segundo de esa grabacin

El espacio de color azul viene a representar el interior de la cpsula del micrfono,

fragmento sonoro. Estos nmeros se pueden almacenar en un archivo de ordenador,

En el vdeo podemos observar la representacin de la seal de audio de un fragmento

En esta imagen s podemos observar con bastante detenimiento cmo ha sido la

Ruido y sonido musical

Habitualmente se contrapone el sonido musical al ruido. Si bien esta oposicin es

Ruido blanco y sonido simple

Figura 3.2: Grca de la seal de audio de ruido blanco.

Vemos en esta grca que el movimiento de la vibracin no posee forma alguna, ni

Figura 3.3: Grca de la seal de audio de un sonido simple de 440 Hz.

completas que se producen en un segundo, es de 440 hercios. Nos encontramos con

Trfico con lluvia y notas de clarinete

Figura 3.5: Grca de la seal de audio de ruido de trco con lluvia.

Figura 3.6: Grca de la seal de audio de una nota de clarinete.

la imposibilidad de predecir lo que va a suceder a continuacin, mientras que

Campanadas y notas de piano

Figura 3.8: Grca de la seal de audio de un sonido de campana.

La grca de la campana no muestra ninguna periodicidad, lo que explica que no

Figura 3.9: Grca de la seal de audio de una nota de piano.

El texto de la locutora es: