Você está na página 1de 203

REGIS ROSSI ALVES FARIA

APLICAO DE WAVELETS NA ANLISE DE GESTOS MUSICAIS EM TIMBRES DE INSTRUMENTOS ACSTICOS TRADICIONAIS

Dissertao apresentada Escola Politcnica da Universidade de So Paulo para obteno do ttulo de Mestre em Engenharia rea de Concentrao: Engenharia de Sistemas Eletrnicos Orientador: Prof. Dr. Joo Antnio Zuffo

So Paulo 1997

queles que tm a conscincia da evoluo.

AGRADECIMENTOS

Ao Prof. Dr. Joo Antnio Zuffo, pelo interesse e apoio esta linha de pesquisa. violinista Soraya Mancini Landim, pela interpretao artstica das partes de violino. A meu pai, pela influncia cientfica. A minha me, pela influncia artstica. A ambos, pela presena constante e inesgotvel estmulo, e a minha famlia, pela "cobrana" frequente. Luciana Albieri, pela inenarrvel companhia, e apoio na reviso bibliogrfica. A Gustavo Adolfo M. Alvarez, pela sua inestimvel amizade e presena constante. A Adrian Boller, pela produtiva convivncia e amizade. Ao engenheiro Rubem Dutra R. Fagundes, pela amizade e pelas valiosas revises. Ao compositor e colega Ruggero Ruschioni, pelos livros e informaes transmitidas. Ao msico e violinista Murilo Muniz, pela avaliao sonora das anlises musicais. Mylene Melly, pela reviso de texto. Aos amigos e funcionrios do LSI - Laboratrio de Sistemas Integrveis da Escola Politcnica da USP, pelo suporte e valorizao a este trabalho. CAPES e ao LSI, pelo suporte financeiro. A todos aqueles que contriburam para a finalizao deste trabalho.

SUMRIO

LISTA DE SMBOLOS LISTA DE FIGURAS RESUMO ABSTRACT 1 INTRODUO ................................................................................................................. 1 1.1 Motivao................................................................................................................ 5 1.2 Objetivos ................................................................................................................. 7 1.3 Organizao da dissertao ................................................................................... 12 2 TEORIA WAVELET E ANLISE EM MULTIRESOLUO ................................................. 14 2.1 Histrico da teoria wavelet.................................................................................... 14 2.2 Wavelets e a Transformada Wavelet...................................................................... 18 Requisitos bsicos............................................................................................. 19 Wavelets contnuas ........................................................................................... 20 Transformada Wavelet Contnua (TWC) .......................................................... 21 Transformada Enjanelada de Fourier X Transformada Wavelet..................... 21 Anlise com largura de banda relativa constante ............................................ 23 Implementao da transformada wavelet......................................................... 27 Wavelets discretas............................................................................................. 27 Transformada Wavelet Discreta (TWD)........................................................... 29 Tipos de wavelets .............................................................................................. 29 2.3 Wavelets em processamento de sinais ................................................................... 34 Wavelets na Anlise e Sntese de sons e timbres musicais ............................... 36 2.4 Anlise em multiresoluo .................................................................................... 38 Teoria da multiresoluo.................................................................................. 39 O espao de detalhes ou espao wavelet: Wj ................................................... 40 2.5 Anlise em multiresoluo com wavelets ............................................................. 42 O algoritmo de decomposio e reconstruo wavelet .................................... 42 2.5.1 Implementao via banco de filtros................................................................ 44 2.5.2 Abordagem matricial ...................................................................................... 47 3 TIMBRES DE INSTRUMENTOS ACSTICOS E A MSICA INSTRUMENTAL ..................... 49 3.1 Instrumentos acsticos tradicionais....................................................................... 52 Seleo dos timbres instrumentais.................................................................... 52 3.1.1 A flauta ........................................................................................................... 52 3.1.2 O violino ......................................................................................................... 55 3.2 Dos timbres msica instrumental ....................................................................... 59

3.2.1 Composio de timbres: modelos elementares............................................... 59 3.2.2 A tcnica de interpretao como fontes de expressividade ............................ 62 3.3 A anlise e sntese de timbres musicais ................................................................ 64 4 ANLISE EM MULTIRESOLUO DE GESTOS MUSICAIS COM WAVELETS.................... 69 4.1 Gestos musicais, padres snicos e nveis wavelets ............................................. 69 A percepo de objetos snicos ........................................................................ 70 A influncia da interpretao sobre os gestos musicais................................... 72 4.2 Anlise de gestos musicais em partes de flauta e violino ..................................... 73 4.2.1 Seleo do material sonoro para anlise......................................................... 73 Seleo dos eventos musicais ........................................................................... 73 Ataques (notas individuais)............................................................................... 74 Fraseados.......................................................................................................... 76 Sustentao ....................................................................................................... 80 4.2.2 Metodologia e implementao da anlise das amostras ................................. 81 4.2.2.1 Descrio do sistema de anlise wavelet ................................................. 85 Implementao algortmica .............................................................................. 87 WaveLab ........................................................................................................... 87 Descrio da interface grfica, funes e cdigos desenvolvidos ................... 88 Seleo das bases wavelets............................................................................... 90 4.2.2.2 Interpretao grfica e snica das anlises .............................................. 94 Interpretao grfica ....................................................................................... 94 Interpretao snica ........................................................................................ 95 5 RESULTADOS, DISCUSSES E CONCLUSES ................................................................ 98 5.1 Resultados das anlises ......................................................................................... 98 Anlises selecionadas: Flauta: Fraseado, No ligado, Trmulo dedilhado .............................. 104 Flauta: Sustentao com Frulato.......................................................... 111 Violino: Ataque Expressivo com Acento (Sforzato) com D16............... 117 Violino: Ataque Expressivo com Acento (Sforzato) com D4................. 122 5.2 Apreciao e discusso dos resultados................................................................ 125 A projeo dos eventos musicais nos nveis wavelets..................................... 125 Os rudos ........................................................................................................ 138 O imageamento ou gerao de bandas espelhadas........................................ 144 O efeito harmonizador .................................................................................... 147 Anlise tempo-escala ...................................................................................... 150 Reconstrues seletivas e compresso de dados ............................................ 151 Diferenas relevantes entre a anlise com D4 versus D16 ............................ 154 Consideraes sobre a qualidade e a inteno das gravaes ...................... 155 Enumerao alternativa para os nveis .......................................................... 157 Consideraes sobre o WaveLab.................................................................... 158 5.3 Concluses........................................................................................................... 159 Tabela de distribuio de gestos/eventos musicais por nveis wavelets......... 164

5.4 Trabalhos futuros................................................................................................. 167 5.5 Eplogo ................................................................................................................ 171 REFERNCIAS BIBLIOGRFICAS ................................................................................... 174 GLOSSRIO APNDICES I DIFERENAS ENTRE TOM, PITCH E NOTA MUSICAL II CENTROS DE PESQUISA EM COMPUTAO MUSICAL III LINGUAGENS COMPUTACIONAIS PARA MSICA IV MTODOS PARA ANLISE, SNTESE E TRANSFORMAO MUSICAL V WAVESYNT - PACOTE PARA ANLISE WAVELET EM MULTIRESOLUO DE SINAIS
MUSICAIS

LISTA DE SMBOLOS
norma de uma funo funo escaladora discreta wavelet me, descrita no domnio do tempo funo escaladora (ou wavelet pai), descrita no domnio do tempo transformada de Fourier da wavelet me frequncia angular de amostragem normalizada. a=2 famlia de wavelets contnuas projeo de f(t) no subespao Wj (detalhe) famlia de wavelets discretas parmetro escala (para wavelets contnuas) parmetro deslocamento (para wavelets contnuas) coeficientes de escalamento coeficientes wavelet - coeficientes da transformada wavelet varivel frequncia (Hertz) transformada wavelet contnua (TWC), onde b o deslocamento da wavelet no tempo ou espao (posio). F o sinal transformado. sinal descrito no domnio do tempo transformada enjanelada (TEF) de f(t), onde b o deslocamento da janela. F o sinal transformado. frequncia de amostragem (Hertz). Nas anlises adotou-se fa=44100 Hz. projeo de f(t) no subespao Vj filtro passa-alta associado wavelet filtro passa-baixa associado funo escaladora ndice de escala ou nvel (para wavelets discretas) ndice de deslocamento (para wavelets discretas) varivel tempo discreta varivel tempo contnua perodo de amostragem (segundos). Ta=1/fa varivel frequncia angular normalizada (radianos). =2f.Ta matriz transposta
[52]

j,k(t) (t) (t)


(w) a

a,b(t)
fj (t)

j,k(t)
a b cj,k dj,k f F(a,b) f(t) F(w,b) fa fj(t) G, g(k) H, h(k) j k n, k t, t Ta w, WT

LISTA DE FIGURAS
Figura 1 - Exemplo de uma wavelet (no normalizada)............................................................................. 19 Figura 2 - Suporte de um tomo de tempo-frequncia no plano tempo x frequncia ................................ 22 Figura 3 - Janelas de anlise no plano tempo-frequncia para a TEF e para as wavelets .......................... 24 Figura 4 - Cobertura do espectro de frequncias pela TEF (acima) e pela TW (abaixo)........................... 24 Figura 5 - Fisiologia do aparelho auditivo humano ................................................................................... 26 Figura 6 - Discretizao do plano tempo-escala (b versus a em escala logartmica) ................................ 28 Figura 7 - Wavelet de Haar ........................................................................................................................ 30 Figura 8 - Wavelet de Daubechies (D4) ..................................................................................................... 30 Figura 9 - Wavelets de Daubechies D4 e D16, e respectivas transformadas de Fourier (FFT's) ............... 32 Figura 10 - Associao dos espaos Vj e Wj numa anlise em multiresoluo.......................................... 40 Figura 11 - rvore de conexo entre os espaos Vj e Wj ........................................................................... 41 Figura 12 - Esquema de decomposio e reconstruo wavelet ................................................................ 43 Figura 13 - Anlise em multiresoluo com banco de filtros..................................................................... 44 Figura 14 - Flauta bsica: dedilhado e respectivos tons produzidos .......................................................... 53 Figura 15 - Flauta transversal metlica, afinada em d, de 3 partes montveis e chaves vazadas ............. 54 Figura 16 - Anatomia de um violino: partes constituintes principais......................................................... 56 Figura 17 - Corte seccional do violino sob o cavalete. .............................................................................. 57 Figura 18 - Esquema de um sintetizador analgico modular bsico .......................................................... 60 Figura 19 - Envelope de amplitude x tempo, ou ADSR............................................................................. 61 Figura 20 - Fluxograma de um simples algoritmo descritor de instrumento em sntese digital................. 62 Figura 21 - Exemplos de Fraseados Ligados Normais............................................................................... 77 Figura 22 - Exemplo de notao em partitura de um portamento e/ou glissando ...................................... 77 Figura 23 - Ilustrao das notaes usuais para o trmulo......................................................................... 78 Figura 24 - Ilustrao de uma melodia contendo frases no ligadas com staccatos e acentos................... 79 Figura 25 - Gravao e preparao das amostras contendo os eventos musicais para anlise................... 84 Figura 26 - Diagrama de blocos geral do sistema para anlise de eventos musicais ................................. 85 Figura 27 - Decomposio do sinal musical f(n) em coeficientes wavelet dj,k na rvore de filtros............ 86 Figura 28 - Gerao do sinal no nvel wavelet p : a projeo de f(n) no nvel wavelet Wp ........................ 87 Figura 29 - Interface grfica desenvolvida sobre MATLAB: janela de comandos.................................... 89 Figura 30 - Cobertura em frequncia das wavelets D16: 11,0 a 16,0 (em escala logartmica) .............. 93 Figura 31 - Diagrama de blocos do sistema para ressntese seletiva de nveis especficos........................ 97 Figura 32 - Eventos musicais amostrados e analisados para o violino....................................................... 98 Figura 33 - Eventos musicais amostrados e analisados para a flauta ......................................................... 99 Figura 34 - Exemplo de pgina inicial da anlise AWMR de um evento musical com extenso 217 ...... 101 Figura 35 - Parte do sinal original (topo) e do sinal ao nvel 16 (abaixo)................................................ 106 Figura 36 - Parte do sinal ao nvel 15: intervalo entre 0,94 s e 1,63 s (da 6a 9a notas) ......................... 107 Figura 37 - Parte do sinal ao nvel 13: da 6a 9a notas (si-sol-si-sol)...................................................... 108 Figura 38 - FFT do nvel 7 para a anlise de fraseado no ligado, trmulo dedilhado ............................ 110 Figura 39 - FFT do nvel 15 (sustentao com frulato)............................................................................ 113 Figura 40 - Primeira banda relevante da FFT do sinal original (esquerda) e do nvel 11 (direita) .......... 115 Figura 41 - Transio da 5a para a 6a notas nos 6o ( esquerda) e 2o nveis mais finos ( direita) ........... 133 Figura 42 - FFT do sinal original (em verde) e do 8o nvel mais fino (em vermelho) entre 0 e 300 Hz .. 143 Figura 43 - Decomposio seguida de reconstruo (canal passa-alta do algoritmo wavelet)................. 146 Figura 44 - Harmnicos da srie de f2 (F2) como notas/tons na escala musical.................................... 147 Figura 45 - Melodia tocada - Anlise de fraseado ligado normal (flauta)................................................ 148 Figura 46 - Melodia percebida no 5o nvel mais fino (anlise de fraseado ligado normal, flauta)........... 148 Figura 47 - Melodia percebida no 6o nvel mais fino (anlise de fraseado ligado normal, flauta)........... 148 Figura 48 - Melodia percebida no 7o nvel mais fino (anlise de fraseado ligado normal, flauta)........... 148 Figura 49 - Intervalo das terceira e quarta oitavas da escala temperada (registro em clave de sol)......... 159

RESUMO

A expressividade um elemento chave para o transporte de emoes em msica, e seu modelamento, vital para a concepo de sistemas de sntese mais realistas. Gestos musicais executados durante a interpretao usualmente portam a informao responsvel pela expressividade percebida, e podem ser rastreados por meio de padres snicos a eles associados em diversas escalas de resoluo. Um conjunto relevante de gestos musicais expressivos foi estudado atravs de uma anlise em multiresoluo utilizando-se a transformada wavelet. A escolha deve-se principalmente capacidade natural desta ferramenta em realizar anlises de tempoescala/frequncia, e suas semelhanas com o processamento dos estgios primrios do sistema auditivo. Vinte e sete eventos musicais foram capturados em interpretaes de violino e flauta, e analisados com o objetivo de avaliar a aplicabilidade desta ferramenta na identificao e segregao de padres snicos associados a gestos musicais expressivos. Os algoritmos wavelet foram implementados na plataforma MATLAB utilizando-se bancos de filtros organizados em esquema piramidal. Rotinas para anlises grfica e snica e uma interface ao usurio foram tambm implementadas. Verificou-se que as wavelets permitem a identificao de padres snicos associados a gestos expressivos exibindo diferentes propriedades em nveis diferentes da anlise. A tcnica mostrou-se til para isolar rudos oriundos de fontes diversas, extrair transientes associados a gestos sbitos e/ou intensos, e para segregar a estrutura harmnica de tons musicais, entre outras potencialidades no menos importantes. Particularidades da tcnica e efeitos secundrios observados so discutidos, e os padres snicos observados nos nveis wavelets so correlacionados com os gestos musicais que lhes deram origem. So propostos trabalhos futuros objetivando a investigao de certos eventos musicais e fenmenos verificados, bem como o estudo de implementaes alternativas.

ABSTRACT

Expressiveness is a key element for emotion transportation in music, and its modeling necessary to conceive more realistic synthesis systems. Musical gestures executed during a performance carry the information answering for expressiveness, and may be tracked by means of sonic patterns associated to them within several resolution scales. A relevant set of musical gestures was studied through a multiresolution analysis using the wavelet transform. The choice for this tool is mainly due to its natural ability to perform time-scale/frequency analysis, and for its similarities with early auditory processing stages. Twenty seven musical events were captured from violin and flute performances, and analyzed in order to evaluate the applicability of this tool for identification and segregation of sonic patterns associated with expressive musical gestures. The wavelet algorithms were implemented on the MATLAB platform, employing filter banks organized in a pyramidal scheme. Graphical and sonic analysis routines and a user interface were carried out over the same platform. It was verified that wavelets enable the identification of sonic patterns associated to musical gestures revealing different properties on different levels of the analysis. The technique showed up useful to isolate noise from different sources, extract transients associated to sudden and/or intense gestures, and segregate the tonal harmonic structure, among other important features. Particularities of the technique and secondary effects observed are discussed, and sonic patterns on wavelet levels are correlated with the musical gestures which produced them. Future works are proposed addressing further investigation of certain musical events and phenomena observed, as well as the study of alternative implementations.

1 INTRODUO

A questo central para os compositores no se o comportamento humano pode ser duplicado, mas qual novo efeito musical pode ser alcanado com a interao computacional que no podia ser alcanado pelos meios existentes anteriores.
David A. Jaffe

No trecho citado acima, Jaffe retoma uma questo polmica sobre o papel dos instrumentos artificiais eletrnicos, dotados de um certo nvel de inteligncia, e que fazem frente atividade ou funo dos msicos humanos. Durante uma certa fase, desde a introduo comercial de instrumentos musicais eletrnicos, questionou-se muito sobre a ameaa que o msico artificial representava aos instrumentistas humanos de carne e ossos, tomando-lhes o espao e mesmo o emprego, e competindo com vantagens em patamares onde certas qualidades humanas so limitadas. Hoje, no entanto, a viso acerca desta ameaa parece estar ultrapassada quando a sociedade passa, numa velocidade vertiginosa, a absorver os preceitos tecnolgicos e a enxergar seus frutos como ferramentas capazes de estimularem a criatividade e o desenvolvimento do ser humano em frentes antes inimaginadas, porque at ento tnhamos de ocupar nossas mentes e corpos em funes de mais baixo nvel. Os instrumentos e sistemas musicais computadorizados de hoje se tornam ferramentas de sonoplastas, compositores, artistas e instrumentistas que no mais se sentem ameaados pelo poder sinttico e pela preciso e incansabilidade dos "eletrnicos". A produo musical no sculo XX foi e tem sido profundamente marcada e influenciada pelo uso dos meios eletrnicos, inicialmente analgicos e, posteriormente, digitais. A mdia eletrnica abriu perspectivas inditas no campo da criao e produo sonora, e introduziu novos conceitos de gravao, armazenamento e reproduo de som. Compositores, instrumentistas e artistas multimdia aproximam-se do novo meio interessados em explorar seu potencial e sua diversidade, em empreg-lo na criao de ambientaes sonoras inditas, na sntese de novos estilos, na incorporao de linguagens e representaes musicais inovadoras, na aplicao de timbres e efeitos musicais exticos, artificialmente moldados.

A tecnologia eletrnica motivou o desenvolvimento da engenharia de udio e possibilitou o soerguimento de uma indstria voltada para a concepo e o desenvolvimento de hardware e software para produo musical, dando origem a sofisticados equipamentos para gravao, sntese, processamento, edio, masterizao, armazenamento e reproduo de udio. Estes equipamentos eletrnicos hoje dividem espao nos grandes estdios e nos espetculos com compositores, msicos, engenheiros de udio, tcnicos e sonoplastas, bem como com instrumentos musicais (muitos dos quais essencialmente eletrnicos). A eletrnica ganhou espao decisivo nas diversas fases da produo musical - da composio reproduo do udio - participando intensamente em todas, conquistando definitivamente a aceitao da comunidade musical e sendo naturalmente absorvida no cotidiano. A eletrnica pode estar presente no processo de composio musical, atravs do emprego de tcnicas de composio algortmica, ou como auxiliar no processo de escrita e depurao da partitura. Pode tambm estar presente na sntese e no processamento de sons naturais, na simulao de instrumentos acsticos tradicionais, ou no projeto de instrumentos virtuais, cujo paradigma de sntese no acstico, mas matemtico. Pode estar presente na interface, no instrumento ou controlador que o msico utiliza para gerar sua msica. Est presente na aquisio de vozes e de sons acsticos naturais. Est presente na criao de ambientes reverberantes, nos simuladores de posicionamento (3D-udio), na aplicao de efeitos especiais, na replicao de vozes, na transposio de escalas, na perverso de ritmos, nas harmonias exticas e nas iluses snicas (segundo Risset, p.148 [44], e p.67 [64]). A eletrnica est maciamente presente nos ambientes de estdio: mesas de gravao, mixadores, amplificadores, monitores, equalizadores, processadores de efeitos, compressores, sequenciadores, gravadores digitais e diversas outros equipamentos digitais e analgicos destinados ao polimento e acabamento das produes musicais, at que cheguem aos ouvintes, seja por meio de audies ao vivo (quase sempre acompanhadas por instrumentos eletrnicos ou instrumentistas virtuais criados por computador), seja por meio de um veculo armazenador adequado, como os antigos e analgicos discos de vinil (LPs - Long Play), os atuais CDs digitais (Compact Disc), os DCCs (Digital Compact Cassete), DATs (Digital Audio Tape), os mais recentes

DVDs (Digital Video Disc), ou qualquer outro meio passvel de introduo comercial futura (como, por exemplo, os silicon music chips, dispositivos armazenadores baseados em estado slido, cujo acesso dispensa movimentao mecnica de peas)1. Diversos algoritmos para processamento e manipulao de sinais discretos surgiram em decorrncia da pesquisa estimulada pelo advento da computao digital neste sculo. A clssica transformada de Fourier, conhecida desde a primeira metade do sculo XIX, tornou-se um instrumento popular e indispensvel em anlise espectral em decorrncia do invento do algoritmo da transformada rpida de Fourier, a FFT (Fast Fourier Transform), publicado primeiro por Cooley e Tukey em 1965, hoje contando com inmeras variaes, adies e verses melhoradas acessveis na literatura especfica. A evoluo tecnolgica acompanhada por uma crescente demanda por sistemas computacionais sofisticados e algoritmos rpidos e eficientes para se processar vastos volumes de dados, que afloram em todos os ramos da atividade humana. O processamento de sinal tornou-se uma parte essencial na atividade tecnolgica e cientfica contempornea.[47] Sob a gide da tecnologia eletrnica o mundo musical nunca mais foi o mesmo, e um fluxo interminvel de contribuies tericas e prticas passou a estimular o desenvolvimento de modelos mais sofisticados para representar os fenmenos acsticos musicais, construindo uma estrutura de referncia em constante evoluo, sobre a qual novos sistemas computacionais, hardware e software, foram e so criados para atender a necessidades gerais e especficas no mbito da anlise, criao e interpretao musical, assistindo o compositor e o msico em tarefas como a simulao de ambientes musicais complexos e a obteno de texturas tmbricas no naturais, exticas e densas; a manipulao de sons naturais, a criao de estilos musicais no convencionais, ritmos e harmonias especiais; a criao de arranjos e a composio de obras inditas, permitindo
O DCC consiste num meio de gravao digital que utiliza fitas cassete (K7) padro, mas que no se popularizou no mercado de udio devido a diversos fatores. O DAT se tornou o meio de gravao digital mais utilizado em estdios profissionais, devido versatilidade intrnseca s fitas magnticas, portabilidade do sistema e qualidade do udio. O DVD um padro recente que utiliza como meio armazenador discos de leitura ptica (CD's) com maior densidade de trilhas, duas faces e duas camadas de leitura. Prottipos atuais exibem capacidade de armazenamento de 4,7 a 17 GB de dados, sons e imagens. O estabelecimento e especificao do padro DVD comercial ainda est sob desenvolvimento por um consrcio de empresas, embora alguns equipamentos comerciais j estejam sendo comercializados. Os silicon music ou silicon audio chips so uma tecnologia ainda por emergir que se utilizaro das novas tecnologias de memria de estado slido (ROM) de alta capacidade. O estgio atual de intensa pesquisa e desenvolvimento. A NEC introduziu um primeiro prottipo no incio da dcada, mas prev a introduo comercial do padro para o final deste milnio.
1

verificar imediatamente a relevncia e adequao, bem como avaliar o impacto, do material sonoro recm editado. As contribuies no se limitam ao desenvolvimento de sintetizadores e softwares para sntese e composio. Vo muito mais alm, com o desenvolvimento de: instrumentos musicais eletrnicos, como o pioneiro (analgico) Thrmin inventado pelo russo Leon Thrmin
[27]

, o Sequential Drum e o violino eletrnico de Max

Mathews [64], os teclados de Robert Moog [16], etc. instrumentos e interfaces baseados em MIDI: teclados polifnicos, drum machines, instrumentos de sopro, guitarras, placas de som para computadores, etc. sistemas interativos e instrumentos virtuais baseados no mapeamento de movimentos em msica: as interfaces gestuais - luvas sensoriais, sensores gestuais pticos, ultrasnicos, de presso e deformao - e tambm na transduo de sinais biolgicos (Biomuse, 1990, BodySynth, etc.) [48] dispositivos para regncia [48], sistemas para anlise, transcrio e notao musical
[64]

, programas para gravao de interpretao (em instrumentos MIDI), edio e


[71]

reproduo musicais (Cakewalk, Cubase, etc.), para reconhecimento automtico de partituras (como o MIDISCAN) (SCORE, Finale, Encore, etc.)
[64]

, e para edio e impresso de partituras

processadores digitais de efeitos [22; 23], harmonizadores vocais [22], as estaes de trabalho para udio digital (Digital Audio Workstations) - pacotes integrados (software e hardware) para produo de udio digital, como o Music Kit do CCRMA ([89]; e p.63 [70]), o Pro-Tools da DigiDesign (http://www.digidesign.com), e os mais recentes Sound Forge (da Sonic Foundry), Samplitude-Pro (da Samplitude), o Mediasound (da Timeline), o Musicator Audio, a Audio Prisma Workstation (da Spectral, Inc., http://www.spectralinc.com), o Sonic Solutions (da Sonic Solutions, http://www.sonic.com), o Alchemy
[23]

, e

muitos outros editores digitais de udio, alm de uma infinidade de novos dispositivos baseados em MIDI, como o MIDIVox (conversor voz-MIDI), processadores de efeitos MIDI, etc. O nmero de equipamentos e arquiteturas proprietrias disponveis comercialmente enorme, e no objetivo compreender uma abordagem aprofundada neste tpico. O leitor interessado poder buscar informaes atualizadas em revistas e peridicos

especializados em udio e tecnologia musical (Computer Music Journal; Future Music; Keyboard; udio, Msica e Tecnologia, etc.) e em inmeros sites na Internet.

1.1 Motivao
Um desafio que merece intensa investigao est em modelar-se corretamente o transporte de emoes por meio da msica, compreender como sentimentos e padres associados ao comportamento humano so transmitidos dos msicos aos ouvintes, induzindo uma espcie de "ressonncia" nestes ltimos. At ento os sistemas de sntese baseados em computador tm oferecido poucos graus de liberdade ao msico instrumentista, refletindo na produo de uma msica de qualidade mecnica, marcada por uma monotonicidade, um objetivismo e uma perfeio artificial, frequentemente pobre em expressividade, e desprovida do realismo humano to presente nas audies acsticas. A possibilidade de se conduzir a sntese de timbres no naturais impregnando-os com padres de execuo semelhantes aos que ocorrem naturalmente na execuo ao vivo de instrumentos acsticos alargaria substancialmente os recursos snicos, oferecendo a possibilidade de se imprimir uma dinmica especfica, intensificar a percepo de realismo, simulando uma presena viva no material sonoro, e conseguir efeitos de notvel expressividade, como, por exemplo, numa execuo de um concerto para timbres complexos, construdos pela associao de canto vocal e metais, mas executando fraseados numa interpretao marcada com a qualidade de cordas tocadas com arco, como nos violinos. Esta seria uma tarefa somente alcanvel com o emprego da computao musical. H uma corrida estabelecida busca de metodologias eficazes, velozes,

conceitualmente modernas, culturalmente contemporneas. Busca-se a reduo do tempo empregado em todas as fases: no processo de composio, na escolha do ritmo e harmonizao; na definio do corpo orquestral, nos gestos expressivos, empregando timbres e arranjos complexos e interessantes; na equalizao, mixagem e na produo de efeitos sonoros especiais; no processamento sobre vozes humanas e timbres instrumentais, a fim de realar propriedades estticas, eliminar rudos e componentes

indesejveis, ou criar uma atmosfera psicolgica especfica, focalizando um ou mais temas desejados. A pesquisa no campo da computao musical busca satisfazer esta corrida tecnolgica, abrindo novas fronteiras de aplicaes que preencham as demandas atuais e mostrem novos rumos de desenvolvimento. nesse contexto que se inserem as teorias e ferramentais matemticos como as transformadas de Fourier, Wavelet e outras que encontram vasto campo de aplicaes no modelamento e representao de msica. Uma caracterstica intrnseca msica seu carter multidimensional, composta de mltiplos objetos e estruturas sonoras de diferentes duraes, intensidades e composies espectrais. Como num mapa geogrfico, onde as cidades maiores so facilmente identificveis numa escala maior, que revela o traado do todo, e os menores acidentes geogrficos e vilarejos s so visveis numa escala menor, onde os detalhes esto presentes. Assim tambm se estrutura a msica. [20] A anlise em multiresoluo com wavelets uma tcnica que permite visualizar o sinal musical em nveis de resoluo (escala) e contedo espectral diferentes. Uma implementao adequada pode mostrar-se til para isolar vozes, timbres e estruturas relevantes na percepo de gestos expressivos, acentos, ataques, modulaes e outros eventos discernveis projetados em nveis wavelets distintos, levando-se concepo de um modelo para mapeamento de eventos snicos passveis de representao em linguagens de alto nvel (como na notao musical tradicional) em objetos rastreveis a nvel de sinal acstico, isolados em nveis de resolues distintas. Tal sistema consistiria numa ferramenta de anlise musical poderosa, e permitiria uma compreenso mais profunda dos fenmenos associados interpretao sinfnica, alm de abrir caminhos para novas e sofisticadas tcnicas de sntese digital, capazes de modelar a execuo humana com mais preciso, realismo, e em tempo real - objetivo perseguido por inmeros pesquisadores em msica computacional e desenvolvedores de sintetizadores. O emprego de wavelets em msica computacional tambm oferece vantagens bvias em comparao s outras tcnicas, dado a baixa complexidade algortmica da transformada discreta, implicando numa alta velocidade de processamento, facilidade de implementao digital, e por ser uma ferramenta matemtica (uma transformada) capaz

de localizar caractersticas e propriedades musicais no domnio do tempo (das duraes), e no domnio frequencial (da colorao espectral). Some-se a isso o fascnio pela explorao bsica num campo de aplicaes novas: as regras pelas quais o sistema auditivo humano percebe eventos acsticos e realiza o reconhecimento de padres seletivamente dentro de um conjunto de eventos simultneos ainda no esto claramente definidas, e portanto merecem uma pesquisa mais aprofundada a fim de se revelar os segredos da cognio auditiva humana. A psicoacstica o campo que se ocupa de investigaes sistemticas em torno destes tpicos, havendo hoje uma atividade febril na realizao de diversos experimentos.2

1.2 Objetivos
Este trabalho pretende estudar e avaliar as potencialidades das wavelets em tarefas de anlise musical, verificar sua eficcia como ferramenta para modelar aspectos expressivos e dinmicos na msica instrumental, rastrear gestos musicais, e avaliar seu potencial como tcnica para processamento e sntese de msica. Visando a este propsito, organizou-se uma metodologia que enderea satisfazer os seguintes objetivos especficos: Realizar a anlise em multiresoluo de trechos musicais executados por instrumentos acsticos tradicionais utilizando-se a transformada wavelet como tcnica de decomposio do sinal snico (anlise) em "multinveis wavelets" (nveis de resoluo e escalas distintas). Identificar eventos musicais, padres snicos e constituintes elementares

caractersticos do timbre do instrumento tocado segundo tcnicas de interpretao especficas, e verificar a concentrao, o isolamento e a distribuio destes objetos snicos pelos multinveis wavelets gerados na anlise. Estudar e introduzir a transformada wavelet na anlise de sinais musicais, avaliar sua aplicabilidade no reconhecimento e isolamento de padres snicos oriundos de gestos
2

Parte da euforia atual se deve admisso de que h mecanismos sensoriais capazes de perceber frequncias alm do clssico limite superior da audio de 20 KHz, fato que est atraindo a indstria do udio digital no sentido de se empregar uma taxa de amostragem de 96 KHz com resoluo de 24 bits por amostra, figuras bem superiores ao padro do atual Compact Disc (CD) de 44,1 KHz de frequncia de amostragem e largura de palavra digital de 16 bits.

musicais presentes em ataques, fraseados, efeitos e modulaes em timbres instrumentais, e estabelecer as bases para a concepo de um futuro sistema de sntese sonora baseada em wavelets. JUSTIFICATIVAS A msica um elemento vital no processo de compreenso do mundo que nos cerca. Constitui-se num veculo essencial de aquisio e troca de informaes complexas entre o indivduo e o meio fsico em que atua, e frequentemente influi na direo evolutiva de uma sociedade. A anlise e sntese de msica sempre estiveram associadas vanguarda tecnolgica, utilizando-se das ferramentas e tcnicas mais sofisticadas disponveis em cada poca. A representao da msica, e seus intrnsecos componentes psicolgicos e perceptuais associados, atravs de sinais mensurveis e processveis eletronicamente (analgica ou digitalmente) abriu perspectivas novas e inditas na forma de se reorganizar a informao musical, e no processo de criao e composio. Sinais musicais podem conter uma infinidade de informaes complexas que podem ser visualizadas e interpretadas sob diferenciados ngulos, e representveis distintamente em diferentes linguagens. Por exemplo, durante a execuo de um movimento sinfnico ficam registradas uma variedade de impresses psicolgicas: sentimentos de tenso, momentos de expectativa, euforia e triunfo, relaxamento e tranquilidade. Imagens e situaes so sugeridas a todo momento, objetos que pertencem ao universo perceptual do ouvinte, um universo lingstico conceitual, crtico, de representao sutil e subjetiva, encarnado por uma simbologia emocional, e portanto dependente da cultura musical do ouvinte. Sob um outro ponto de vista registram-se contornos meldicos, temas, frmulas rtmicas, modulaes, fraseados expressivos, progresses, padres de harmonia e orquestrao que evoluem no tempo: objetos interpretveis luz da musicologia e da notao musical tradicional. Ainda, sob outra perspectiva, registra-se uma complexidade espectral variante no tempo e a ocorrncia mista de padres harmnicos e peridicos, em diversas escalas, associados a padres arrtmicos, transientes e no peridicos, objetos visveis luz da anlise fsica dos sinais acsticos, expressveis numa linguagem intrinsecamente mais

tcnica e matemtica. Mesmo uma simples melodia, solada por um nico instrumento, consiste num sinal complexo, cuja evoluo espectral no tempo mistura elementos peridicos e no peridicos. Vemos, portanto, que a anlise musical est associada especificao de um nvel conceitual ou contexto que se deseja abordar. Uma ferramenta que auxiliasse a mapear elementos identificveis num contexto lingstico (ou perceptual) em elementos representveis em outro contexto (ou nvel), estabelecendo uma ponte entre estas linguagens, seria de extrema valia para o aperfeioamento dos sistemas de anlise e sntese de msica baseados em computador, contribuindo para encurtar a distncia entre uma definio abstrata ou subjetiva e a gerao de um som acstico real que se aproxime daquela definio. Transformadas, como a Wavelet, que permitem um desmembramento do sinal acstico em sinais descritos em diferentes nveis de resoluo (escalas) com contedo espectral distintos, segregando assim diferentes padres e objetos snicos em diferentes nveis, parecem adequadas para este desafio. Em especial, as wavelets atraem as atenes pela sua flexibilidade na escolha das bases, possibilitando a obteno de bases adaptadas e otimizadas para tratarem famlias especficas de sinais. Entre as principais justificativas para se aplicar tcnicas de anlise wavelet em sinais musicais esto: Suporte local da transformada matemtica wavelet, desejvel para a caracterizao e anlise de transientes, rajadas (bursts) e outras descontinuidades em sinais no peridicos. As tcnicas de Fourier revelam-se adequadas para se analisar sinais peridicos e estacionrios. Singularidades e transies abruptas se revelam espalhadas por todo o espectro de frequncia. Este suporte global a principal desvantagem da transformada de Fourier para representar uma funo f(t) localizada no tempo: so necessrios muitos coeficientes de Fourier para representar o sinal, o que implica num alto custo computacional para se obter uma preciso razovel. Implementao natural de uma anlise em multiresoluo do sinal (tempo-escala) atravs do algoritmo de decomposio da transformada wavelet. Numa anlise multiresoluo com wavelets possvel visualizar o sinal em diversos nveis wavelets, isto , em diversas escalas, o que permite uma analogia com mapas

10

geogrficos3. Cada nvel est associado a uma banda de frequncias distinta, e a resoluo temporal e frequencial num escalograma wavelet4 varivel ao longo dos eixos temporal e frequencial (ao contrrio dos espectrogramas baseados em Fourier, que exibem resolues temporal e frequencial constantes ao longo do tempo e da frequncia). Baixa complexidade algortmica e, consequentemente, baixo custo computacional, fatores preponderantes em diversas aplicaes de processamento de sinais discretos, especialmente para implementaes em tempo real, que requerem algoritmos velozes. A propriedade de se isolar padres distintos contidos no sinal em nveis (da anlise multiresoluo) tambm distintos. As caractersticas e especificaes das bandas de frequncia, como largura de banda, forma, sintonia, taxa de subida e decaimento, suavidade, regularidade e outros parmetros matemticos esto diretamente relacionadas com as propriedades da wavelet ora empregada. Em decorrncia disto, cada nvel est associado a uma banda de frequncias distintas, e exibe padres ondulatrios associados quela banda, uma caracterstica bastante atraente e desejvel para a caracterizao de sinais musicais e extrao de seus componentes elementares formadores, assim como de rudos, transientes e outros processos oscilatrios presentes no sinal. A possibilidade de implementao atravs de bancos de filtros digitais ortogonais e/ou biortogonais, com propriedades de reconstruo perfeita. A propriedade de anlise em frequncia com largura de banda relativa (f/f) constante, similar ao processo de "leitura" do estmulo acstico realizado pela membrana basilar da cclea, rgo auditivo localizado no ouvido interno, o que determina um grau de similaridade com o processo de reconhecimento e de percepo sonora realizado pelo sistema auditivo humano.

Em mapas geogrficos o conceito de escala natural. Para se ter uma viso panormica num mapa usualmente adota-se um fator de escala maior. Se no entanto desejado visualizar detalhes de uma regio especfica, uma escala menor prefervel. O conceito se aplica anlise em multiresoluo com wavelets, onde cada nvel corresponde a uma escala. Escalogramas wavelet usualmente mapeiam escala X tempo, com a intensidade (amplitude) usualmente codificada em gradaes de cinza (gray scale) ou em cores. A escala proporcional ao inverso da frequncia, ou seja, para se observar frequncias altas requer-se uma escala menor, mais fina, enquanto flutuaes de baixa frequncia so facilmente vistas numa escala maior; o eixo vertical portanto pode mapear escala ou frequncia (inverso do parmetro escala).
4

11

H ainda um aspecto comercial a considerar que justifique a pesquisa de aplicaes de wavelets em sistemas eletrnicos musicais, no sentido de desenvolver e disponibilizar esta tecnologia para a comunidade musical. Neste final de sculo verifica-se uma exploso na oferta de sistemas eletrnicos integrados digitais de alta fidelidade para produo sonora, frutos da absoro de sofisticadas tecnologias disponibilizadas pela pesquisa e desenvolvimento em laboratrios, universidades e corporaes privadas. O mercado musical, tanto do ponto de vista dos compositores e grupos musicais, quanto dos produtores, engenheiros de som e consumidores finais, facilmente adapta-se aos nveis de qualidade e sofisticao providos por uma alta tecnologia eletrnica, e passa, incessante e naturalmente, a exigir mais qualidade, recursos e nveis de sofisticao cada vez maiores. Este comportamento, mesmo no sendo exclusividade do mundo da msica, torna-se potencializado neste domnio: a sofisticao e a busca da perfeio um exemplo recorrente na histria da msica. Tal oferta, acompanhando as tendncias do mercado de computadores e perifricos, tm disponibilizado, a um custo cada vez menor, uma gama imensa de equipamentos de alta qualidade, preciso e poder de processamento, abrindo chances para novos produtores, msicos e profissionais do mundo da msica menos afortunados, que no contam com o alto poder aquisitivo das grandes gravadoras e produtoras musicais.

12

1.3 Organizao da dissertao


No captulo 1 apresentou-se uma breve introduo ao universo da msica sob a intensa influncia da tecnologia eletrnica neste sculo, de forma a situar melhor o leitor no contexto desta rea de pesquisa e para clarear a importncia e o alcance do trabalho. A motivao em se trabalhar no campo da anlise e sntese de msica, os objetivos gerais e especficos da pesquisa, e as justificativas em se empregar aqui as tcnicas de wavelets so apresentados neste captulo. No captulo 2 apresenta-se a ferramenta de engenharia deste trabalho: as wavelets, sua transformada e a anlise em multiresoluo. Um traado histrico das wavelets at os dias de hoje compilado. Na sequncia apresenta-se as wavelets, a transformada matemtica wavelet, suas especificidades e aplicaes em vrias reas de processamento de sinais. A teoria da anlise em multiresoluo abordada a seguir, confluindo com a utilizao de wavelets para implement-la. O captulo 3 trata do alvo bsico deste trabalho: os timbres de instrumentos acsticos reais e a msica instrumental que deles emana. A flauta e o violino foram os instrumentos escolhidos como exemplos para este estudo. Neste captulo apresentam-se alguns modelos frequentemente usados para gerar timbres nos sintetizadores eletrnicos, discute-se a influncia da tcnica interpretativa sobre a impresso de expressividade e apresenta-se o clssico mtodo de anlise e sntese de timbres musicais. No captulo 4 os gestos musicais so ento introduzidos como alvos especficos para anlise neste trabalho. So apresentados os eventos musicais representativos de um conjunto relevante de gestos musicais expressivos, que sero analisados atravs de uma decomposio em multiresoluo com wavelets. Objetiva-se com isso a identificao dos padres snicos presentes nos trechos musicais analisados que estejam correlacionados a tais eventos. O material sonoro que foi amostrado a partir de interpretaes de flauta e violino e o sistema de anlise wavelet so apresentados, juntamente com a metodologia adotada para realizar as anlises e interpret-las. A descrio dos eventos musicais feita sob o ponto de vista musical, associando a tcnica interpretativa aos gestos musicais.

13

No captulo 5 passa-se apresentao, apreciao e discusso dos resultados, e s concluses finais. Procede-se discusso de alguns temas adequados avaliao da anlise wavelet em multiresoluo aplicada a sinais musicais, endereando a sua capacidade em identificar e isolar estruturas snicas em nveis diferentes da anlise, a fenomenologia associada ao processo da anlise, propriedades e particularidades. Finalmente, tendo como pano de fundo o futuro, discute-se alguns projetos de pesquisa aplicveis, abordagens alternativas e perspectivas. A bibliografia consultada apresentada na sesso seguinte. Os apndices vm em seguida, acrescentando informaes relacionadas rea de computao musical e abordando temas paralelos essa rea de pesquisa. O pacote de anlise wavelet em multiresoluo (AWMR) para sinais musicais desenvolvido para este trabalho - o Wavesynt - tambm introduzido nos apndices. Anexo a este texto tambm se encontra um CD-ROM (PC-compatvel) e disquete (1,44MB, PC-compatvel) onde se encontra a ntegra das anlises realizadas de flauta e violino (texto e figuras), gravadas em formato Microsoft Word-compatvel e comprimidas em formato ZIP. Ainda, no CD-ROM, incluiu-se cpias dos pacotes de anlise WaveLab e Wavesynt para MATLAB, uma cpia da dissertao, cpias dos arquivos sonoros originais de flauta e violino (trechos musicais analisados, em formato AIFF), bem como arquivos sonoros (em formato MATLAB) e figuras das anlises (em formato GIF), de forma a possibilitar ao leitor/usurio a verificao e reproduo das anlises e resultados obtidos.

14

2 TEORIA WAVELET E ANLISE EM MULTIRESOLUO

A transformada wavelet uma ferramenta que fatia dados ou funes ou operadores em componentes frequenciais diferentes, e ento estuda cada componente com uma resoluo casada com sua escala
I. Daubechies
[13]

A teoria wavelet se baseia em representar funes genricas em termos de blocos construtivos bsicos, ou tomos, fixos em diferentes escalas e posies. O tipo de sinal sob ateno determinar as ferramentas coadjuvantes necessrias para uma melhor identificao, reconhecimento e tratamento de suas caractersticas. Em imagens, por exemplo, as bordas, contornos, texturas, cores e padres geomtricos so elementos teis no mapeamento e na classificao de funes visuais. Para sons, a composio harmnica, padres de dinmica, envelopes, gestos, progresses, texturas e outros objetos percebidos pela audio so elementos importantes para se compreender e classificar sinais musicais. Esta abordagem til em diversas reas diferentes, por exemplo em tcnicas de filtragem QMF (Quadrature Mirror Filtering), nos esquemas piramidais e de codificao sub-banda, na teoria dos estados coerentes, entre outros mesma estrutura de referncia.
[35]

. A teoria

Wavelet representa hoje um corpo sinttico destas teorias, unificando-as sob uma

2.1 Histrico da teoria Wavelet


A aplicao de wavelets em processamento de sinais relativamente nova, datando da dcada de 1980. Entretanto, uma investigao retroativa na histria da matemtica ir revelar pelo menos sete origens diferentes para a anlise wavelet
[47]

. A idia de se

focalizar um sinal sob vrias escalas diferentes e analis-lo com vrias resolues surgiu independentemente em vrias reas de matemtica, fsica e engenharia. Em 1910, enquanto trabalhava na construo de bases para representar funes integrveis quadraticamente, Haar construiu a primeira famlia wavelet ortonormal de suporte compacto de que se tem notcia, e que leva o seu nome.

15

Caldern (1960) abordou em seus trabalhos a decomposio atmica, introduzindo a identidade de Caldern, uma decomposio de um operador de identidade seguir. No incio dos anos 80, Strmberg (1982) construiu as primeiras wavelets ortogonais, trabalhando num contexto para melhor compreender os espaos de Hardy Infelizmente sua construo foi pouco notada naquele momento [13]. Sob esta perspectiva histrica, foi possvel relacionar entre si as vrias teorias - da decomposio de Littlewood-Paley (1930) identidade de Caldern (1960) - e uma primeira abordagem unificadora surge com os trabalhos de Grossman e Morlet (1984), levando primeira sntese que encampava o termo wavelet.6 Em 1982, o geofsico francs Jean Morlet empregou wavelets em seus trabalhos em geoexplorao. Em seguida, Alex Grossman, Morlet e Yves Meyer estudaram a transformada Wavelet e perceberam que as tcnicas da teoria de Caldern-Zygmund, em particular as representaes de Littlewood-Paley, poderiam levar a uma concepo unificada de muitos resultados da anlise harmnica, e mais: que poderiam substituir as sries de Fourier em aplicaes numricas [35]. Da construram as bases matemticas da teoria Wavelet, com nfase nas representaes de sinais por blocos construtivos, a que Grossman e Morlet chamaram de wavelets. Em 1987, Tchamitchian construiu o primeiro exemplo do que se pode chamar de bases wavelets biortogonais. A ateno da comunidade de Processamento de Sinais foi atrada para o novo filo quando, no outono de 1986, S. Mallat e Y. Meyer desenvolveram a teoria da anlise em multiresoluo, que proporcionou uma explanao satisfatria para todas essas construes, e disponibilizou uma ferramenta para a construo de outras bases [13]. Seu trabalho pode ser visto como uma segunda sntese, mais completa, englobando as tcnicas numricas de processamento de sinais e imagens [47].
[35] [47]

. Seu

trabalho foi redescoberto 20 anos mais tarde por Grossman e Morlet, como veremos a

. Suas

wavelets exibem decaimento exponencial e esto em Ck (k arbitrrio mas finito)5.

5 6

Funes em Ck ou de classe k so funes contnuas com k derivadas contnuas. O termo original provm do Francs "ondelette", portado para o ingls como "wavelet".

16

Nos ltimos 15 anos, vrias bases wavelets ortonormais para L2(R) 7 foram construdas, as quais verificam as melhores propriedades das bases de Haar e de Littlewood-Paley: estas novas bases possuem excelente localizao tanto no tempo quanto na frequncia. A descoberta de bases ortonormais da forma 2j/2(2j t-k), j,k Z, (t) de classe C1, e de suporte compacto (no nulas em um intervalo finito), devida a Ingrid Daubechies. Daubechies (1987), inspirada nos trabalhos de Mallat, estendeu o trabalho de Haar, sintetizando esta famlia de wavelets ortonormais, possibilitando uma anlise e sntese mais eficiente do que a obtida com outros sistemas (como o de Haar). Desde ento o nmero de contribuies tericas e prticas no campo das wavelets cresceu exponencialmente ano aps ano, assim como a difuso de seu uso em inmeras reas. A partir de 1994 verifica-se uma tendncia de vrios segmentos da comunidade cientfica em explorar o potencial das wavelets principalmente em aplicaes de codificao, representao e compresso de sinais. Observa-se a partir de ento um interesse em torno de aplicaes grficas, especialmente compresso de imagens e processamento grfico em multiresoluo [68; 69]. Paralelamente aos trabalhos em aplicaes especficas, diversas contribuies endereando novos algoritmos e estratgias de implementao alternativas foram introduzidas para a transformada wavelet contnua e discreta. Implementaes computacionais propuseram verses para a transformada rpida discreta (utilizando-se bancos de filtros), algoritmos melhorados para resolver efeitos esprios de bordas8 e esquemas para obter maior particionamento do espectro, de forma a aumentar a resoluo nas faixas de frequncias mais altas, utilizando-se tcnicas como os "pacotes de wavelets" (wavelet-packets), e multiwavelets. A pesquisa por novas bases wavelets e a formalizao de tcnicas para construo de bases adquirem tambm importncia na medida em que vrias aplicaes apresentam melhores desempenhos. Bases wavelets so desenvolvidas tais que satisfaam diversos
7

L2(R) o espao de todas as funes quadraticamente integrveis em R (nmeros reais), como na equao (3) adiante. Nesta classe de funes encontram-se a maior parte dos sinais reais (de energia finita) de importncia em aplicaes de processamento de sinais.

Vrias tcnicas existem para estender sinais finitos de forma a prepar-los para o processamento e atenuar os indesejados efeitos de bordas, as mais empregadas sendo a extenso por acolchoamento com zeros (zero padding), por extenses peridicas (replicao peridica, wraparound ou convoluo circular), por extenses simtricas (mirror-image replication) e extrapolao linear [45; 80; 78, p.263]. Neste trabalho o algoritmo de decomposio utiliza convoluo circular, e adicionalmente algumas amostras foram estendidas por zero-padding para atingir o comprimento adequado exigido pelo algoritmo.

17

critrios desejveis, como rapidez de processamento, boa localizao espacial/temporal, regularidade e suavidade, boa localizao em frequncia, independncia, e melhor descrio de classes especficas de sinais. Entre 1989 e 1994 o mtodo da melhor base introduzido e vrios algoritmos baseados nele so desenvolvidos. Wickerhauser (1994) aborda o algoritmo da melhor base (best basis algorithm) em livro de sua autoria Vaidyanathan, Beylkin, entre outras. Surgem por volta de 1995 novas tcnicas de implementao e sntese de wavelets que no recorrem aos mtodos de Fourier para sua construo, introduzindo novos paradigmas de implementao e gerao de bases wavelets, que alguns autores consideram uma segunda onda das wavelets: as wavelets de segunda gerao. Sweldens (1995) introduz assim o esquema ou algoritmo de lifting, uma nova filosofia para construo de wavelets biortogonais independente da transformada de Fourier, at ento importante instrumental na construo de wavelets. [79] Implementaes em hardware comeam a aparecer no mercado pela metade da dcada de 1990. A Analog Devices lana o dispositivo ADV601, um chip para aplicaes em compresso com wavelets. A empresa norte-americana Aware patenteia algoritmos de melhor base wavelet, desenvolve sistemas de transmisso para telecomunicaes baseado numa tecnologia proprietria denominada Discrete Wavelet Multitone Technology (DWMT), e tambm lana chips para processamento wavelet no mercado. Diversas propostas de implementao de wavelets em dispositivos ASIC/VLSI aparecem na literatura. A atividade em torno das wavelets febril. Numerosos congressos, seminrios, workshops, publicaes especiais e conferncias internacionais endereando aspectos tericos e aplicativos das wavelets so realizados e propostos em vrios pases. Diversos sites na Internet so dedicados teoria wavelet, disseminao de informao, artigos, trabalhos cientficos, pesquisas em aplicaes especficas, divulgao de eventos, grupos de pesquisa, e suporte a usurios das wavelets. O site www.wavelet.org o Wavelet Digest - um dos pioneiros, contando 9418 assinantes (em 16 de maio de 1997), na sua maioria pesquisadores e usurios de wavelets.
[88]

. Vrias bases wavelets so concebidas e

publicadas na literatura - bases biortogonais, bases adaptativas, as bases de Malvar,

18

O leitor interessado numa viso histrica mais completa at 1993 encontrar no livro de Meyer (1993) [47] uma excelente retrospectiva histrico-matemtica sobre o assunto. A Internet, por sua vez, constitui hoje o melhor e mais rpido veculo para se obter informaes sobre quaisquer reas de desenvolvimento endereando as wavelets e suas aplicaes. No item 2.2, que se segue, procede-se a uma introduo teoria wavelet, ao conceito de wavelet, s wavelets contnuas e discretas e s transformadas contnua e discreta. No item 2.3 descreve-se brevemente a aplicao de wavelets em processamento de sinais, ilustrando com referncias a outros trabalhos que serviram de inspirao ao presente.

2.2 Wavelets e a Transformada Wavelet


Wavelets so "ondas pequenas", funes obtidas a partir de uma funo prottipo - a wavelet me - (t) L2(R), por meio de dilataes (contraes ou escalamento) e translaes (deslocamentos). O objetivo primordial em se realizar estas operaes o de se obter uma famlia de funes base para descrever outras funes L2 (R). O termo "wavelet" emergiu da literatura francesa na rea de geofsica
[78]

, mais

especificamente em trabalhos de geoexplorao desenvolvidos por Grossman e Morlet, que primeiro cunharam a palavra ondelette referindo-se s ondas pequenas ou blocos construtivos bsicos que estavam utilizando [35]. O terminologia inglesa wavelet deriva portanto do vocbulo francs9. Na Figura 1 (veja abaixo) mostra-se um exemplo de uma wavelet-me (a), uma verso escalada (b) e uma verso escalada e deslocada (c). A wavelet da Figura 1 uma wavelet de Morlet, cuja primitiva a funo (t) = e t . e jwt . Introduzindo dilataes por meio de um fator de escalamento a, e translaes por meio de uma varivel b deduzse a forma geral de uma famlia de wavelets
2

a ,b ( t ) = 1 ( t b )
a a

-(1)

Alguns pases de lngua espanhola traduzem o termo como ondaletas.

19

onde (t) a wavelet primitiva ou me.


Figura 1 - Exemplo de uma wavelet (no normalizada)

a) wavelet me
( t) = e t
2

. e jwt

b) wavelet escalada (t/a), a = 2.0.

c) wavelet escalada e deslocada


( t b ) , a=2, b=0.5 a

A utilidade das wavelets est na sua possibilidade de atuarem como funes base na decomposio de outras funes L2(R). As bases wavelets podem ser redundantes ou ortonormais, cobrindo e descrevendo completamente o espao L2(R), de uma forma mais sofisticada que as bases senoidais dos mtodos de Fourier. Na sua forma contnua, como veremos a seguir, as wavelets so basicamente redundantes. Em forma discreta podem dar origem s chamadas molduras (frames: bases discretas redundantes), a bases ortonormais, biortogonais, e outras bases wavelets. [13] REQUISITOS BSICOS Alm desses aspectos, outras propriedades so desejadas e exigidas das famlias wavelets para que sejam teis em aplicaes prticas em processamento de sinais e na anlise de espaos funcionais. Neste contexto, wavelets devem satisfazer requisitos como [47] : possurem energia finita, de forma que a anlise preserve a energia, e que a sntese leve a uma reconstruo perfeita possurem certo grau de regularidade (suavidade) serem nulas no infinito possurem um certo nmero de momentos nulos10 que sejam funes de classe Ck (0<k<) que tenham suporte compacto, no tempo e na frequncia

20

Existem inmeras possibilidades de escolha de wavelets para anlise, entretanto a escolha no arbitrria, e obedece a critrios matemticos bem definidos, como os supracitados. Analisa-se a seguir o caso contnuo, que leva transformada wavelet contnua ou integral. WAVELETS CONTNUAS Seja (t) L2(R) uma wavelet me. Para que possa dar origem a uma famlia de wavelets exige-se que [38]: a wavelet seja absolutamente integrvel
+

( t ) dt <

-(2)

que possua energia finita


+

( t ) 2 dt <

-(3)

e que satisfaa a uma condio de admissibilidade C = 2


+

( w ) 2 dw < w

-(4)

Esta ltima condio implica na prtica que a wavelet oscila, integra-se a zero e no possui componente contnuo (DC = 0), ou (w = 0) = 0, logo
+

( t ) dt

=0

[13]

Uma famlia de wavelets duplamente indexadas surge atravs do escalamento e translaes da wavelet me:

a ,b ( t ) = a

1 / 2

( t b ) a

a, b R, a0

-(5)

A normalizao escolhida de forma que a , b = , para todo a,b R, a0, e para fins prticos fazemos = 1.
[13]

10

f(t) tem m momentos nulos quando

f ( t ). t k dt = 0 para k=0,1,...,m

21

Para a anlise de voz e sons musicais muitas vezes conveniente extrair informaes sobre a distribuio de energia e comportamento de fase, o que pode ser feito utilizando-se uma wavelet complexa, tal que (t) possua somente componentes de frequncia positiva, (w = 0) = 0, de forma que a parte imaginria seja a transformada de Hilbert da parte real. [38] No escopo do presente trabalho, entretanto, explorado o uso de bases wavelets reais, ortonormais, em implementao discreta utilizando-se bancos de filtros.
TRANSFORMADA WAVELET CONTNUA (TWC)

A transformada wavelet contnua (ou integral) com respeito famlia de wavelets da equao 5 acima F( a , b ) = a
1/ 2 +

f ( t ). ( t b ) dt = f ( t ), a , b ( t ) a

- ( 6 ) TWC

onde o complexo conjugado de . A funo f(t) pode ser recuperada de F(a,b) atravs da resoluo de identidade de Caldern
(contnua) inversa (TWCI), como abaixo:
f (t ) = 1 C
++ [13]

- uma transformada wavelet

F ( a , b ). a , b ( t )

da . db a2

- ( 7 ) TWCI

A recuperao de f(t) de F(a,b) s possvel se a constante C acima representada (constante na identidade de Caldern) for finita, donde deriva a condio de
admissibilidade expressa na equao (4) acima
[78]

. Na transformada enjanelada de

Fourier (TEF)11, C obtido a partir da norma da funo janela g, isto , C = g 2 . Para

wavelets, C definido como na equao (4).


TRANSFORMADA ENJANELADA DE FOURIER (TEF) X TRANSFORMADA WAVELET

Comparando-se a transformada wavelet (TW) com a transformada enjanelada de Fourier (TEF), podemos verificar semelhanas e diferenas importantes que clareiam certos aspectos vantajosos no uso das wavelets. Uma comparao direta de suas frmulas

11

Tambm encontrada sob o nome de Short Time Fourier Transform (STFT), a transformada de Fourier em intervalos curtos.

22

mostra uma correspondncia e semelhana entre as janelas moduladas da TEF e as

wavelets da TW:
Transformada Enjanelada de Fourier F( w , b ) = 1 2
+

Transformada Wavelet Contnua


F( a , b ) = a
1/ 2 +

f ( t ). g ( t b ). e

jwt

dt

f ( t ). (

t b ) dt = f ( t ), a ,b ( t ) a

Ambas as transformaes levam a implementaes de anlise em tempo-frequncia, ou, simplesmente, anlise tempo-frequncia. Numa anlise tempo-frequncia o sinal analisado pode ser expresso por meio de uma combinao linear de tomos de tempofrequncia, caracterizados por uma durao finita no tempo (t) e uma durao finita na frequncia (w). Janelas moduladas, como

g(t-b).e

jwt

, e wavelets a,b (t) so tomos de tempo-

frequncia. O exemplo mais conhecido talvez seja a "wavelet de Gabor":


t 2 2

Gw0 , t 0 ( t ) = e jw0t g h ( t t 0 ) ,

onde

gh (t ) =

1/ 4

e 2h

Um tomo de tempo-frequncia ocupa uma regio finita no plano tempo-frequncia que possui suporte no intervalo [t0-t/2 , t0+t/2] e [w0-w/2 , w0+w/2], como abaixo:
Figura 2 - Suporte de um tomo de tempo-frequncia no plano tempo x frequncia w
t
w = w a

t
t 0 = at + b

Funes no podem ao mesmo tempo serem limitadas no tempo e na frequncia, bem como serem simultaneamente determinadas com preciso no tempo e na frequncia [13;
47]

, mas certas situaes prticas equivalem a esse suporte compacto no tempo-

frequncia, e podem ser expressas por condies menos severas como:


+

( t t0 )2 . ( t )

2 dt = c1 t 2 A 2 T 2

( w w0 ) 2 . ( w )

2 dt = c 2 w 2 2 . A 2 T 2

onde A, C1, C2 e T so constantes finitas.

23

Isso quer dizer que os tomos extraem informaes sobre o sinal analisado que estejam contidas nos intervalos de tempo e frequncia delimitados acima, localizando desta forma pores especficas do sinal no espao tempo-frequncia. A principal diferena entre os tomos da TEF e as wavelets que nestas, ao invs de uma varivel frequncia (w), temos uma varivel escala (a). As wavelets ao invs de moduladas so escaladas, e na verdade os tomos so de tempo-escala. A wavelet de Gabor (na prtica uma janela modulada em w para h=1) analisa sinais na regio de alta frequncia com uma janela contendo um nmero de ciclos muito maior do que contm a janela para anlise em baixa frequncia, o que leva instabilidade numrica na representao de transientes de alta frequncia
[38]

. Alm disso, as

wavelets de Gabor no so bem separadas umas das outras, falhando em serem ortogonais entre si, logo no levando construo de uma base ortonormal para L2(R)
[47]

, aspectos que limitam seu uso em anlise de sinais em tempo-frequncia, em

especial quando o algoritmo discreto e deseja-se um significativo poder de descorrelacionar ou reduzir a entropia na representao wavelet e habilitar a reconstruo perfeita. Estas desvantagens no ocorrem com as wavelets, que reescalam sua base analisadora para cada (banda de) frequncia, sem alterar o nmero de ciclos da onda. Na prtica, essa diferena implica num desempenho superior da anlise tempo-frequencial com

wavelets.
ANLISE COM LARGURA DE BANDA RELATIVA CONSTANTE

Outra diferena chave est na resoluo da cobertura do plano tempo-frequncia. A TEF divide o plano tempo-frequncia em pores de dimenses regulares e constantes, analisando em frequncias altas com as mesmas resolues que analisa frequncias baixas. A transformada wavelet, por outro lado, permite uma cobertura do plano tempofrequncia com resoluo temporal (e frequencial) nas faixas de baixas frequncias diferente da resoluo em altas frequncias. Alguns autores consideram esta a principal diferena entre a TEF e a transformada wavelet.[74] A Figura 3 abaixo ilustra as janelas de anlise no plano tempo-frequncia comparativamente para a TEF e para as wavelets. A resoluo no plano tempo-frequncia para as wavelets mais fina no tempo para altas frequncias, e mais sintonizada ou seletiva em frequncia para baixas frequncias. [84]

24

Figura 3 - Janelas de anlise no plano tempo-frequncia para a TEF e para as wavelets

TEF

Wavelets

tempo

tempo

Quando se analisa frequncias mais altas a resoluo temporal mais fina do que quando se analisa em frequncias baixas. J a resoluo em frequncia fica melhor nas frequncias mais baixas, onde a segmentao do espectro mais fina e resolvida do que em altas frequncias. A Figura 4, logo abaixo, auxiliar na compreenso desta segmentao do espectro.
Figura 4 - Cobertura do espectro de frequncias pela TEF (acima) e pela TW (abaixo)

largura de banda constante por todo o espectro (para todas as bandas)

largura de banda menor maior sintonia, maior resoluo em frequncia

largura de banda maior menor sintonia, menor resoluo em frequncia

frequncia

Esse efeito pode ser explicado de outra maneira: na anlise em frequncias mais altas a transformada emprega wavelets mais finas, comprimidas e de curta durao, portanto permitindo a visualizao do sinal analisado numa escala mais detalhada, localizada, com melhor resoluo temporal. Em frequncias mais baixas, wavelets mais largas e dilatadas enquadram o sinal numa escala maior, menos detalhada, permitindo visualizar caractersticas globais.[60] Nesta faixa, a anlise apresenta uma resoluo de frequncia

25

mais fina do que a temporal, tornando mais fcil a localizao em frequncia. Esse aspecto funcional das wavelets justifica o ttulo de microscpio matemtico que muitos pesquisadores lhe conferem. O mesmo processo de segmentao do espectro, com resolues temporal e frequencial variveis ao longo do plano tempo-frequncia, realizado pela membrana basilar da cclea - rgo perceptivo auditivo humano - perfazendo uma anlise espectral dos sinais acsticos com fator de qualidade Q-constante [60], isto , com uma relao f/f constante ao longo do eixo da frequncia, como ilustra a Figura 4, acima. Graas a esse esquema de processamento e anlise do estmulo acstico (semelhante a uma anlise wavelet) pelo ouvido que podemos discernir melhor 2 pitchs (ou frequncias individuais) muito prximos entre si nas faixas de baixa frequncia, do que

pitchs separados pelo mesmo intervalo nas faixas de alta frequncia. Tambm por isso
mais fcil interpretar e acompanhar transies e eventos muito rpidos em pitchs agudos (alta frequncia) do que entre pitchs graves (baixa frequncia) onde a resoluo em frequncia pior. O espectro fica segmentado numa escala logartmica, onde a resoluo e seletividade de cada banda mais fina (sintonizada) na direo das baixas frequncias. Para timbres muito agudos possumos melhor sensibilidade temporal e menor frequencial. mais fcil distinguir eventos curtos e seqenciais e mais difcil detectar desafinaes ou deslocamentos de frequncias. Nos timbres graves mais fcil distinguir microtons e avaliar intervalos de frequncia que separam pitchs (ou frequncias individuais), isto , a seletividade em frequncia melhor nas faixas mais graves, como sugerem as bandas de passagem dos filtros da TW na Figura 4 acima. A Figura 5 mostra um esquema do sistema auditivo humano mostrando suas divises anatmicas e funcionais. A modalidade de audio por conduo area a mais importante. Por esta via, o estmulo acstico (ondas sonoras areas) adentra pelo conduto auditivo no ouvido externo, amplificado (em cerca de 22 vezes
[28]

) pelo

sistema ossicular do ouvido mdio e transmitido, como estmulo mecnico (ondas sonoras lquidas), ao lquido perilinftico no interior do labirinto coclear, localizado no ouvido interno. [29]

26

Figura 5 - Fisiologia do aparelho auditivo humano som nervo auditivo


sistema ossicular (martelo, bigorna e estribo)

cclea

som

O sistema auditivo consta basicamente de 3 etapas de processamento por onde o estmulo acstico captado, amplificado, transmitido, analisado e interpretado. A cclea, dentro do ouvido interno, aloja a membrana basilar e o rgo de Corti, tecidos importantes no processo de transduo da energia acstica em energia eletroqumica. nesta etapa que ocorre a anlise e filtragem do sinal acstico (mecnico) similar anlise wavelet12. Uma vez transduzida em impulsos nervosos13, a informao acstica segue seu trajeto primeiro pela via auditiva perifrica, onde centros nervosos perifricos atuam no pr-processamento, em algumas funes interpretativas e na codificao de impulsos mais complexos para o sistema auditivo central, localizado no crtex. Esta similaridade entre a anlise da membrana basilar da cclea e a anlise wavelet um fator que reala a importncia do emprego de wavelets no estudo de processos acsticos e no modelamento e compreenso do sistema auditivo humano. [47]

12

A cclea pode ser vista do ponto de vista funcional como um banco paralelo de filtros passabanda, cujas funes de transferncia so determinadas em funo do padro de deslocamento verificado ao longo da membrana basilar (ressonncia vibratria) para cada faixa de frequncia. Acima de 800 Hz para humanos as respostas ao impulso destes filtros esto relacionadas entre si por uma dilatao, como na anlise wavelet [91]. Abaixo de 500 Hz o escalamento de frequncia torna-se progressivamente mais linear [91] , e o mecanismo de interpretao do estmulo acstico mais complexo [28].
13

processo realizado pelas clulas ciliadas do rgo de Corti: as clulas nobres do ouvido interno [29], altamente especializadas na transduo do som em impulsos eletroqumicos.

27

IMPLEMENTAO DA TRANSFORMADA WAVELET

A transformada wavelet integral (contnua), em se tratando de aplicaes com sinais pticos (analgicos), pode ser implementada atravs de filtros pticos, velocidade da luz, com todas as vantagens (e desvantagens) inerentes a esse tipo de processamento analgico. A implementao da transformada contnua em sistemas eletrnicos ficar entretanto sujeita aos fatores inerentes ao processamento eltrico, como limitaes na resoluo e preciso, margem de rudo estocstico, efeitos no lineares, etc. Em princpio, a implementao da transformada wavelet contnua em sistemas digitais implica num processamento no qual as funes envolvidas, respectivos clculos e transformaes so realizados de forma a simular discretamente o processamento analgico. Simulaes digitais de sistemas contnuos normalmente so acompanhadas de uma alta carga computacional a fim de se reproduzir o efeito analgico to prximo quanto possvel, e no se esquivam das limitaes impostas pelo interfaceamento anlogo-digital quanto resoluo da amostragem, erros de quantizao, preciso da converso, etc. A alternativa natural procurar abordar a transformada wavelet em sua forma matemtica discreta, cuja implementao computacional direta, dispensando os estgios sensveis a erros e de difcil implementao em tempo real. A transformada wavelet pode ser tratada sob a forma discreta sem prejuzo de suas qualidades e propriedades, e de maneira numericamente estvel.
WAVELETS DISCRETAS

Tradicionalmente discretizam-se os parmetros a (escala) e b (deslocamento), variveis do sinal transformado F(a,b), os coeficientes wavelet. Para a toma-se valores inteiros (positivos e negativos), potncias de um parmetro fixo a0

a= a0 -j ,

a0 > 1 e jZ

A discretizao de b deve depender de j tal que wavelets estreitas (de alta frequncia) seja deslocadas por passos pequenos, e wavelets largas (de baixa frequncia) sejam deslocadas por passos maiores. Assim, uma escolha natural

b= k b0 a0 -j

b0 > 0, fixo,

j,k Z

28

A wavelet discreta fica ento

j , k ( t ) = a 0j / 2 ( a 0j t kb0 )

- ( 8) wavelet discreta

No caso discreto, a resoluo de identidade - na equao (7) - no mais existe, e surge a questo bsica sobre a possibilidade de se representar f(t) em termos de F(a,b), e de se recuper-la de tais coeficientes. A resposta sim, desde que satisfeitas algumas condies sobre o suporte e a regularidade da wavelet, e atendidos alguns requisitos matemticos. Essencialmente a condio de admissibilidade permanece vlida14. Existem formas diferentes de se trabalhar com wavelets discretas, e de se implementar a transformada discreta. Uma delas atravs da utilizao de bancos de filtros organizados num esquema piramidal, que levar tambm a uma representao em multiresoluo do sinal. importante ressaltar que neste caso tais requisitos matemticos (acima mencionados) so traduzidos em restries impostas sobre os coeficientes dos filtros utilizados na decomposio e reconstruo wavelet. O fator a0 no pode ser arbitrrio. Diferentes valores de a0 levam a wavelets diferentes, e bases ortonormais de wavelets s so conhecidas para valores racionais de a0
[13]

.A

escolha mais natural a0=2. O fato das escalas musicais tradicionais se basearem em potncias de 2 (oitavas) e a base numrica digital ser 2 mais que uma coincidncia em relao a esta escolha. Fazendo-se b0=1, a wavelet da equao (8) fica:

j, k (t ) = 2

j/2

( 2 t k )

- ( 9 ) wavelet didica

A wavelet da equao acima, escala em oitavas, conhecida por wavelet didica. O plano tempo-escala (frequncia) neste caso fica amostrado por uma grade didica, como abaixo:
Figura 6 - Discretizao do plano tempo-escala (b versus a em escala logartmica)

log a

14

Estas questes especficas extrapolam o escopo deste texto, e o leitor poder encontrar explanaes completas sobre elas em [13].

29

Wavelets didicas constituem bases ortonormais, e permitem a caracterizao de um sinal f(t) sem redundncia [13]. A prova deste fato pode ser desenvolvida utilizando-se a anlise em multiresoluo como ferramenta, mostrando que qualquer funo f(t) pode ser aproximada numa preciso arbitrria por combinaes lineares de wavelets ortonormais.[13]
TRANSFORMADA WAVELET DISCRETA (TWD)

A transformada wavelet discreta (TWD) e sua inversa (TWDI) podem ser expressas da seguinte forma: d j , k = j , k ( t ), f ( t ) =
f (t ) =

f ( t ) j , k ( t ) dt

- ( 10 ) (TWD)

j = k =

j , k ( t ). d j , k

- ( 11 ) (TWDI)

onde dj,k so os coeficientes wavelets, correspondentes a F(a,b) da transformada integral.


TIPOS DE WAVELETS

Existem vrios tipos de wavelets citados na literatura. O uso de uma ou outra est associado aplicao. Regras de construo de wavelets esto sendo propostas por vrios pesquisadores, segundo as restries e necessidades que cada aplicao especfica impe. Isto nos leva a concluir que podemos gerar uma infinidade de wavelets diferentes, e particularmente construir um conjunto de wavelets adequado ao processamento de um tipo de sinal ou aplicao especfica, levando obteno de resultados melhores. Na Figura 7 mostra-se a wavelet de Haar, a mais simples das wavelets, introduzida por Haar por volta de 1910. Mostra-se graficamente as operaes essenciais de contrao (dilatao) e deslocamento, gerando W(2t) e W(2t-1).

30

Figura 7 - Wavelet de Haar

1 1 -1

2 1/2 -2

2 1/2

-2

W(t)

W(2t)

W(2t - 1)

O prximo nvel (no mostrado) contm W(4t), W(4t-1), W(4t-2) e W(4t-3), de onde exprimimos uma forma geral para esta famlia de wavelets Wj,k (t) = 2 j / 2W(2 j t k )
j,k Z - ( 12 )

Estas wavelets so contnuas por partes e constituem uma base para L2(R). Isto significa que as translaes e deslocamentos de W so mutuamente ortogonais para todos os j e k
+

W(t ).W(2t k )dt = 0

- ( 13 )

Na figura 8 mostra-se uma wavelet ortonormal de suporte compacto de Daubechies (uma D4).
Figura 8 - Wavelet de Daubechies (D4)

As wavelets de Daubechies apresentam uma capacidade de anlise e sntese muito mais efetiva do que as de Haar por possurem maior regularidade (suavidade) e aproximarem melhor funes (suaves) em L2(R)
[47; 58]

. No caso de Haar, funes regulares15 so

aproximadas por uma funo com severas descontinuidades, o que introduz efeitos e artefatos indesejados na representao do sinal [47].

15

Sinais musicais, como tons estveis (estacionrios) de instrumentos de cordas e sopro, podem ser vistos como funes com certo nvel de suavidade.

31

Como veremos adiante, a transformada wavelet pode ser produzida por um esquema de filtragem utilizando-se bancos de filtros. As origens das wavelets de Daubechies esto ligadas a famlias de filtros com propriedades especiais outro associado s funes escaladoras
16 [78]

. Dois canais de filtros

existem nas implementaes por banco de filtros, um estando associado s wavelets e . Os filtros de Daubechies so ortogonais, e
[78]

exibem mxima planura (maximum flatness) em =0 e = suas transformadas de Fourier. [88]

, isto , maximizam a

suavidade nas funes escaladoras associadas maximizando a taxa de decaimento de

Se desejarmos que as wavelets sejam teis para anlise de sinais regulares e suaves, necessrio impor condies sobre os filtros associados a elas alm das exigncias da capacidade de reconstruo perfeita e da preservao de energia. Condies impostas sobre o grau de regularidade da wavelet, sua taxa de decaimento no infinito e seu nmero de momentos nulos iro habilit-las a melhor aproximarem e analisarem um maior nmero de classes de sinais e funes, bem como produzirem melhores resultados e desempenho. [47] O grau de regularidade da wavelet e a sua taxa de decaimento governada pelo nmero de momentos nulos que apresenta. Esta propriedade importante para deduzir as propriedades de aproximao exibidas pela wavelet nos espaos de multiresoluo. Momentos nulos tambm impem uma condio necessria para que as wavelets sejam N vezes diferenciveis, isto , de classe CN. [58] As wavelets de Daubechies so numeradas em funo do nmero de momentos nulos que possuem. O ndice em si corresponde ao nmero de coeficientes que os filtros associados possuem, que tambm o nmero de derivadas nulas do filtro associado funo escaladora em = (o filtro tem um zero em = de ordem N-1). Assim, a wavelet D4 possui 2 momentos nulos, e os filtros associados possuem 4 zeros em =, e 4 taps (4 coeficientes). [58; 78] As wavelets D16 possuem 8 momentos nulos, e seus filtros associados tm 16 coeficientes. A taxa de decaimento e grau de suavidade para esta wavelet so maiores do que para a D4, e elas se mostram mais eficientes para representar sinais musicais que
16

Estas sero introduzidas adiante na sesso dedicada anlise em multiresoluo. Por ora, o objetivo clarear a origem das wavelets de Daubechies para que se possa melhor descrev-las em funo de suas propriedades.

32

wavelets de menor regularidade. A Figura 9 abaixo mostra wavelets D4 e D16, juntamente com suas transformadas de Fourier17. A wavelet D16 exibe visivelmente uma forma de onda mais suave e uma melhor sintonia no espectro coberto que a D4.
Figura 9 - Wavelets de Daubechies D4 e D16, e respectivas transformadas de Fourier (FFT's)

D4

D16

FFT de D4

FFT de D16

As wavelets de Daubechies no possuem formas analticas fechadas que as descrevam. Isso ocorre com muitas wavelets prticas inventadas e frequentemente encontradas na literatura. Entre as wavelets mais celebradas e algumas referncias bibliogrficas que remetam a elas (sem a menor presuno de compilar uma lista completa) podemos citar: Haar, que pode ser considerada como sendo uma D2 (Daubechies 2): a primeira wavelet, com um nico momento nulo; [6; 9; 12; 13; 14; 35; 42; 47; 60; 68; 69; 78; 88]
Transformadas rpidas de Fourier (FFT), calculadas com frequncia de amostragem (fa) em 44100 Hz, ou frequncia de Nyquist em 22050 Hz, figuras utilizadas no padro do Compact Disc (CD).
17

33

Daubechies, de suporte compacto e suavidade "regulvel"; [6; 9; 12; 13; 14; 35; 42; 47; 60; 68;
69; 78]

Coiflets, projetada para satisfazer certo nmero de momentos nulos; [6] Coifman, cujos "filtros foram projetados tais que tanto a wavelet quanto a funo escaladora tenham momentos nulos"; [13; 47; 88] Beylkin, cujos filtros apresentam razes na proximidade da frequncia de Nyquist; [6;
88]

Vaidyanathan, cujo filtro exibe reconstruo exata apesar de no satisfazer nenhuma condio de momentos; o filtro foi otimizado para aplicaes de voz; [6; 88] Meyer, que derivam das chamadas wavelets de Shannon, ou Sinc wavelets, que so suavemente enjaneladas na frequncia tal que o decaimento no tempo (t) possa ser mais rpido que qualquer potncia de t; [47; 78] Malvar, wavelets ortonormais cuja descoberta se insere na estrutura geral de referncia da anlise enjanelada de Fourier, vindo a constituir um algoritmo de anlise em tempo-frequncia, em oposio anlise tempo-escala. Henrique Malvar (1987), brasileiro, professor na Universidade de Braslia, atualmente vice presidente de uma empresa norte-americana, desenvolveu as wavelets que levam seu nome em trabalho de doutorado no MIT. A semelhana entre a sua construo e a estrutura dos gros sonoros ou tomos, possuindo um ataque, um perodo estacionrio e um decaimento, estabelecem conexes com a teoria da "decomposio atmica", onde os tomos so de tempo-frequncia. Os algoritmos para implementao de wavelets a partir de esquemas de filtragem todavia so mais simples, e trabalham com planos de tempo-escala. O modus operandi de uma anlise com wavelets de Malvar extrapolam os objetivos deste trabalho, que tambm so os de utilizar a abordagem das wavelets via bancos de filtros. Meyer, entretanto, chama a ateno para o fato de que as wavelets de Malvar poderiam ser teis para aplicaes de voz e som, mas introduz uma abordagem s wavelets de Malvar em favor mais da sntese e transmisso e menos da anlise; [47] wavelets biortogonais, para as quais a restrio da ortogonalidade relaxada; [47; 78] wavelets simtricas ou Simlets (symmlets), ou wavelets "menos assimtricas", de suporte compacto e nmero de momentos nulos variando de 4 a 10; [6; 88]

34

bases wavelets timas, que fornecem a decomposio mais compacta (comprimida) de um sinal, [47; 88] e mais uma diversidade de variantes, que usualmente recebem os nomes de seus desenvolvedores ou das tcnicas que lhes do origem, como o caso com as novas "wavelets de segunda gerao" (usando a terminologia de Sweldens (1995) ), obtidas pelo esquema de lifting, o qual no leva necessariamente a wavelets que sejam dilataes e translaes de uma matriz. [79] As wavelets D16 apresentaram os melhores resultados nas anlises de eventos musicais realizadas neste trabalho, superiores aos alcanados utilizando-se D4 ou wavelets de baixa regularidade, e semelhantes aos resultados obtidos com outras wavelets com idntico nmero de momentos nulos (regularidade). Isso se deve a sua melhor sintonia (suporte compacto na frequncia), suavidade e desempenho computacional. Por essas razes foram utilizadas maciamente neste trabalho. O fato de ser talvez a wavelet mais celebrada e freqente na literatura, cujas propriedades so conhecidas e bem documentadas, tambm contribuiu para sua escolha como principal wavelet de anlise neste trabalho. Em momento oportuno a questo da escolha da wavelet ser melhor abordado adiante.

2.3 Wavelets em processamento de sinais


Wavelets tem sido amplamente exploradas em um grande nmero de aplicaes em processamento de sinais. Vrias delas j foram, e sero ainda comentadas neste texto. A seguir, um esboo das principais aplicaes de wavelets em processamento de sinais. Devido a multiplicidade de referncias a uma mesma aplicao comum, optou-se por citar somente as referncias mais importantes disponveis e/ou que abordem o tema com mais cuidado. Talvez as wavelets mais populares tm sido as de Daubechies, pela sua ortogonalidade e suporte compacto. As wavelets de Gabor tambm se mostram populares em aplicaes em segmentao de imagens18. As ferramentas de implementao variam de aplicao
Veja o servidor Internet do grupo de viso computacional (Computer Vision Group, Computer Science III) da Universidade de Bonn, na Alemanha: http://www-dbv.informatik.unibonn.de/image/overview.html para detalhes sobre a utilizao destas wavelets em aplicaes de segmentao de imagens.
18

35

para aplicao, entretanto nota-se uma grande utilizao de bancos de filtros e de algoritmos piramidais de filtragem para implementao da transformada wavelet. H aplicaes que requerem muitas vezes a transformada contnua (cf. [87] ). Em processamento de imagens h verses naturalmente extrapoladas para 2 dimenses dos algoritmos wavelets, empregando, em especial, os esquemas piramidais baseados em implementaes em multiresoluo. Em computao grfica wavelets tm sido usadas para edio de curvas, manipulao de superfcies compresso de imagens
20 [13; 26; 35; 77; 78] [88] [75; 76]

, anlise de textura19,

, segmentao, segmentao de imagens

texturizadas , quantizao multiresoluo


[55]

, enfoque, magnificao, interpolao, pintura em


[69]

, representao de curvas, anlise de superfcies, representao de , viso

fluxo de luz, radiosidade, modelamento geomtrico, modelos fractais computacional [31; 42] e ptica difrativa, entre outras.

Mallat (1989) descreveu o uso de wavelets em discriminao de textura e anlise fractal em imagens
[42]

. Stollnitz e outros (1995) tambm mostraram as capacidades seletivas

das wavelets na edio de curvas em imagens, alterando aspectos globais de contorno sem afetar detalhes na imagem [75; 76]. Wavelets tm sido aplicadas para remoo de rudos, reconhecimento e extrao de padres, e realce de caractersticas em sinais
[26; 31; 78; 85; 88]

. Graps (1995) e Vidakovic

(1991) abordaram o uso de wavelets em aplicaes de extrao de rudos de sinais de ressonncia magntica nuclear [26] e de sinais ssmicos [85]. Tm sido empregadas em interpretao de imagens e sinais biomdicos, deteco de sinais [31]; em interpretaes ssmicas e em geofsica [31; 85]; em anlise de voz, acstica, anlise e sntese, msica, representaes auditivas, identificao de pitch, psicoacstica e identificao de padres snicos mais detalhadamente a seguir.
[18; 19; 26; 31; 33; 36; 37; 38; 50; 72; 78; 91; 92]

, como abordado

19 20

Veja o servidor Internet em http://www.ruca.ua.ac.be/~VisionLab/WTA.html.

Com aplicaes em robtica, viso guiada automtica, inspeo de qualidade de produtos, diagnsticos mdicos, anlise de imagens remotas, anlise de movimento, viso estereoscpica, reconhecimento de objetos e interpretao de cena -scene interpretation. Todas reas que dependem de uma segmentao de imagens de alta qualidade.

36

WAVELETS NA ANLISE E SNTESE DE SONS E TIMBRES MUSICAIS

J.-C. Risset (1989) destaca o potencial de aplicaes desta ferramenta no campo da computao musical
[61]

. Kronland-Martinet (1987/88) iniciou a demarcao de um


[38]

territrio para aplicaes musicais de wavelets

. Scott Levine (1994) reconhece na

transformada wavelet uma ferramenta adequada para analisar sinais de udio pela sua similaridade e adequao aos modelos atuais do ouvido humano [89]. Mas o interesse por wavelets na rea de udio resulta da verificao de seu extraordinrio desempenho em aplicaes para reconhecimento de voz, identificao de padres, e anlise de sinais acsticos. [78] Em 1985, S. Mallat (1985) estabeleceu uma conexo da teoria wavelet com outras teorias amplamente empregadas na rea de processamento de sinais, abrindo o caminho para Ingrid Daubechies (1988) e suas celebradas wavelets de suporte compacto
[12]

Desde ento o nmero de contribuies tericas e prticas cresceu substancialmente, existindo um grande nmero de trabalhos documentados abordando a aplicao de wavelets em processamento de udio e msica. A seguir, uma compilao de contribuies por rea de aplicao:
Acstica e msica

Newland (1994) prope as wavelets musicais superior das wavelets harmnicas


[51]

[50]

, com discriminao de frequncia

(tambm de sua autoria), cujos intervalos de

frequncia (destas ltimas) so oitavas. Kronland-Martinet (1988) aborda a transformada wavelet para anlise, sntese e processamento de voz e sons musicais [38]. Karlsen (1995) examina a aplicao de wavelets na identificao de veculos terrestres pela anlise dos sinais acsticos emitidos (no que se refere como identificao de assinaturas acsticas).[37]
Deteco de pitch

Yip (1995) prope um algoritmo para deteco de pitch em sinais de voz em ambientes ruidosos utilizando o espectro de fase da anlise tempo-frequncia com wavelets, verificando um desempenho notvel, superior a outros mtodos
[92]

. Shelby (1995)

tambm explora o uso de wavelets na deteco de pitch de voz, obtendo resultados comparveis a outras tcnicas, e avaliando o impacto da escolha da base wavelet no desempenho final do sistema [67]. Kadambe (1992) descreve um detetor de pitch de voz

37

baseado na transformada wavelet, constatando um desempenho superior em comparao a outros mtodos clssicos, e com vantagens de maior imunidade a rudos e baixa complexidade computacional. [36]
Representaes auditivas

Drake (1993) considera o uso de uma representao wavelet de voz em um algoritmo para compensar uma deficincia auditiva que altera a faixa dinmica percebida, e menciona vantagens da abordagem com wavelets neste tipo de aplicao
[18]

. Yang e

outros (1992) apresenta uma estrutura de referncia geral, analiticamente tratvel, para descrever as transformaes que os sinais acsticos sofrem nos primeiros estgios do sistema auditivo, e desenvolveu modelos algortmicos para representar os sinais em cada estgio do processamento, utilizando processamento multiescalar, o mtodo de projees convexas, e representaes wavelet para interpretar etapas do processamento coclear. [91] Irino e Kawahara (1993) tambm utilizam a transformada wavelet para simular o sistema auditivo perifrico humano (modelando a resposta em frequncia da cclea) para experimentos psicofsicos. Eles propem um mtodo para modificar sinais acsticos manipulando sua representao auditiva, e, partindo do pressuposto de que "a transformada wavelet simula as caractersticas da periferia21 do sistema auditivo quando uma wavelet de anlise apropriadamente selecionada a partir da resposta impulsiva de um modelo auditivo", definem uma "transformada wavelet auditiva" (AWT - auditory wavelet transform) introduzindo as caractersticas do modelo coclear na transformada wavelet [33]. Uma das vantagens do uso da transformada wavelet em representaes do sistema auditivo est exatamente na semelhana existente entre a sua resposta em frequncia e a da cclea, ambas perfazendo uma anlise espectral com fator de qualidade Q constante ao longo da frequncia. [33, 60, 91]
Compresso de udio

Sinha (1993) descreve o uso de procedimento para compresso de udio baseado na seleo adaptativa da base wavelet em conjunto com um abordagem de dicionrio dinmico, obtendo para udio em qualidade de CD (amostrado a 44,1KHz e resoluo de 16 bits) taxas de transmisso de 48-66 Kbits/s
[72]

. Scholl (1994) empregou um

algoritmo variante da transformada wavelet para compresso de sinais de udio (que

38

denomina circular wavelet-packets) reportando a eliminao de grande parte dos efeitos (indesejveis) de reconstruo de bordas. [66]
Extrao de caractersticas (feature extraction)

Evangelista (1993) introduz uma nova representao wavelet baseada numa representao vetorial pitch-sncrona, permitindo-se identificar e separar os segmentos pseudo-peridicos e aperidicos do sinal de voz ou msica, e servindo extrao de padres, separao de consonantes vocais e compresso de dados [19]. Seu trabalho neste campo serviu de estmulo consecuo da presente pesquisa, e comentado em maiores detalhes no captulo 4 (Anlise em multiresoluo de gestos musicais com wavelets) mais adiante. Alm destas reas, wavelets tm encontrado aplicaes no menos importantes em ptica no linear, anlise de sries temporais, estatstica e mecnica estatstica (sistemas dinmicos Hamiltonianos, sistemas Hamiltonianos no lineares22), matemtica aplicada e computacional23, fsica matemtica, anlise de espao de estados, anlise de processos estacionrios, soluo de equaes diferenciais e integrais, anlise matricial combinatria e aplicaes em cincias biolgicas, operadores, teoria dos estados coerentes, teoria dos grafos, teoria de grupos, teoria de jogos, lgebra booleana, qumica, biologia, ecologia, oceanografia, aerodinmica, meteorologia, engenharia petrolfera, de guas profundas e contaminao, eletromagnetismo, ondas aquticas, e soluo de problemas com valores de contorno Internet espalhados pelo globo.
[8; 25; 31]

. A alternativa mais veloz

atualmente para buscas de novidades nestes campos est nos milhares de servidores

2.4 Anlise em Multiresoluo


At aqui mostraram-se representaes de uma funo contnua f(t) decomposta sobre uma base de wavelets contnuas j,k(t), e expressa ento por coeficientes discretos dj,k. O interesse, no entanto, obter um algoritmo que nos permita representar sinais discretos f(n) em termos de uma combinao linear de wavelets discretas j,k(n).
21 22

primeiros estgios. Meiss, J.D., professor de matemtica aplicada, pesquisas da Universidade da Califrnia, Berkeley.

39

A anlise em multiresoluo leva naturalmente a um esquema rpido e hierrquico para a computao dos coeficientes wavelets, como veremos a seguir. A estrutura de implementao identificada com os algoritmos de codificao sub-banda, utilizados em compresso de voz
[60]

, e com os algoritmos piramidais, empregados em

processamento de imagens [47] e viso computacional. Numa anlise em multiresoluo um sinal f(t), tR, decomposto em aproximaes sucessivas de resoluo cada vez menor, numa sequncia de estgios de processamento consecutivos. Nos itens que se seguem apresenta-se a teoria da multiresoluo para sinais contnuos, igualmente vlida para o caso discreto. Com a utilizao de bancos de filtros pode-se implementar uma anlise em multiresoluo com wavelets na forma discreta.
TEORIA DA MULTIRESOLUO

Uma anlise em multiresoluo consiste numa sequncia de espaos (fechados) de aproximaes sucessivas Vj . Cada subespao Vj est contido no prximo subespao Vj+1. Uma funo em um subespao est em todos os subespaos mais finos: ... V-1 V0 V1 ... Vj Vj+1 ... Uma funo f(t) decomposta nestes espaos tem um pedao em cada subespao. Este pedao - a projeo de f(t) em Vj - fj(t). A unio de todos os subespaos L2(R), e as intersees entre eles o espao vazio ( I V j = {0} ).
j

H ainda requisitos adicionais para haver multiresoluo [9; 13; 35; 78] : Completeza: fj(t) f(t) para j , e nulidade: || fj(t) || 0 para j - Vj+1 compe-se de todas as funes reescaladas em Vj: f(t) Vj f(2t) Vj+1 Invarincia ao deslocamento: f(t) Vj f(t - 2-j.k) Vj H uma base ortonormal { j,k , j,kZ} para cada subespao Vj , isto , as funes fj(t) - projees de f(t) no nvel j - podem ser descritas como combinaes lineares de j,k .

23

Veja o servidor Internet http://amath.colorado.edu/appm/department/ fac_summ.html para informaes suplementares nestes campos e outros.

40

Chamamos a funo escaladora da anlise em multiresoluo, que d origem famlia ortogonal j,k

j,k (t) = 2j/2 (2j t - k)

- ( 14 )

que cobre todo nvel j e consiste numa verso escalada e deslocada da funo escaladora

(t), tambm referenciada como a wavelet pai, em contrapartida terminologia adotada


para (t), a wavelet me.
O ESPAO DOS DETALHES OU ESPAO WAVELET: WJ

A funo fj+1(t) Vj+1 possui uma resoluo melhor que fj (t) Vj. A parte que falta para aproximar fj+1(t) de fj (t) o detalhe fj (t) que se encontra num novo espao complementar a Vj: o espao Wj. Portanto, fj (t) = fj+1(t) - fj (t), Do ponto de vista dos subespaos, Vj Wj = Vj+1. O subespao Wj consiste no complemento ortogonal de Vj+1 em Vj . A Figura 10 abaixo ilustra esta hierarquia de relaes entre os espaos Vj e Wj . Os espaos mais finos (no alto) se decompem em uma verso menos resolvida - um "molde estrutural" - e num conjunto de detalhes. O molde estrutural ainda pode ser novamente decomposto em duas novas verses - um novo molde e um novo conjunto de detalhes. O processo, como sugerido, iterado sucessivamente, culminando com a completa decomposio do espao mais fino. Na direo oposta, isto na sntese, o molde enriquecido de detalhes, ampliando assim sua resoluo e formando os nveis imediatamente mais finos.
Figura 10 - Associao dos espaos Vj e Wj numa anlise em multiresoluo f3(t) V3 f2(t) f1(t) f0(t) V0 V1 W0 V2 W1 W2

onde fj (t)Wj.

Segue que

41

Vj+1 = Wj Wj-1 Wj-2 ... fj+1(t) = fj + fj-1 + ... + f1 + f0 + f-1 + ... =

,o que implica em

(t )

- ( 15 )

ou seja, a verso fj+1(t) pode ser descrita em termos da somatria das contribuies de todos os detalhes nos nveis inferiores. Naturalmente sucede que a unio de todos os Wj tambm produz o espao L2(R), e os requisitos acima impostos Vj tambm se aplicaro famlia de subespaos (fechados) Wj. A famlia de funes {j,k(t) , kZ} constitui uma base ortonormal para o subespao Wj. Uma extenso deste fato nos permite afirmar que a coleo inteira {j,k(t) , j,kZ} constitui uma base ortonormal para L2(R), que chamada de base wavelet de L2(R), com

j,k (t) = 2j/2 (2j t - k)


mantendo a coerncia com j,k(t).

- ( 16 )

A estrutura que conecta os subespaos Vj e Wj pode ser ilustrada tambm num formato de rvore, como abaixo:
Figura 11 - rvore de conexo entre os espaos Vj e Wj

Vj

Vj-1 Wj-1

Vj-2 Wj-2

Vj-3 Wj-3

... ...

As wavelets so uma base para o espao L2(R) inteiro, mas a funo escaladora em j = 0 e as wavelets com j 0 so uma base mais prtica. Tomando o nvel V0 como o nvel de menor resoluo da anlise, eliminamos os clculos para piramidal pra no nvel mais baixo V0 . Assim, Vj+1 = Wj Wj-1 Wj-2 ... V0 e podemos recuperar f(t), decomposta num conjunto de subespaos Vj e Wj, atravs de um nmero (infinito) de operaes: j < 0, e a estrutura

f (t ) = f j (t ) = d j, k j, k (t ) = f0 (t) + f j (t ) = f0 (t ) + d j, k j, k (t)
j =0 j = 0

+ +

+ +

- ( 17 )

42

para j 0, onde dj,k so os coeficientes wavelet de f(t). De f0(t) (nvel V0) e todos os fj ( j > 0) extraem-se as outras fj (t) via operaes matemticas atravs da pirmide (ou rvore, como na Figura 11 acima). Podemos parar em alguma escala 2-J (nvel J, onde est fJ(t) ) com suficientes componentes de alta frequncia (resoluo fina) para reproduzir o sinal to exatamente quanto possvel, isto , na prtica podemos tomar f(t) = fJ(t) no nvel mais fino (J), e operarmos diretamente sobre f(t). Na direo oposta (descendo a pirmide), decompem-se fJ em sucessivas aproximaes mais grosseiras e obtm-se descries menos finas de f(t) (numa escala maior, exatamente como em mapas geofsicos), at o limite de pior resoluo em f0 .[78]

2.5 Anlise em multiresoluo com wavelets

O ALGORITMO DE DECOMPOSIO E RECONSTRUO WAVELET

Precisamos obter uma descrio de f(t) em diferentes escalas. desejada a habilidade de se trafegar de uma aproximao de baixa resoluo de f(t) em direo s mais finas, onde mais detalhes estejam disponveis (melhor resoluo) e vice-versa, bem como ter acesso aos sinais em qualquer escala. A estrutura de referncia da multiresoluo, agora confinada entre o nvel de mais alta resoluo j=J e o de mais baixa j=0, oferece o meio necessrio para se implementar esse processamento. Neste esquema, as projees de f(t) nos subespaos Vj e Wj para j [J,0] (intervalo finito) so relacionadas por: fJ = fJ-1 + fJ-1 , o que por iterao fornece fJ = fJ-1 + fJ-2 + ... + f0 + f0 .

H uma relao ntima entre (t)V0 e (2t-k)V1 conhecida por relao entre duas escalas, a qual decorre diretamente do fato de VoV1. Esta relao expressa por meio da equao de dilatao, tambm chamada de equao de refinamento, porque mostra (t) num espao mais fino V1
=

h
n

n 1, n

2
n

h ( n ) ( 2 t n )

- ( 18 ) eq. de dilatao

Uma relao entre duas escalas semelhante tambm ocorre entre (t)Wo e (2t-k)V1, a qual d origem equao wavelet, decorrente de WoV1

43

g
n

n 1, n

2
n

g ( n ) ( 2 t n )

- ( 19 ) eq. wavelet

Destas relaes, derivam duas novas sequncias: h(n) e g(n), que vm a ser os coeficientes dos filtros associados respectivamente funo escaladora (t) e wavelet

(t).24
Imediatamente, segue-se que uma funo f1 (t)V1, pode ser descrita como combinao de duas verses um nvel de resoluo abaixo, porque V1=V0 W0. Isto, juntamente com as relaes de duas escalas acima, leva s frmulas de decomposio [13; 78] :

c j 1,k =< f , j 1,k >= hn 2 k c j ,n


n

- ( 20 )

d j 1,k =< f , j 1,k >= g n2 k c j ,n


n

- ( 21 )

onde dj,k so os coeficientes wavelet de f(t). Definimos agora fj (t) e fj (t) como
f j (t ) =

c
k

j, k

j , k ( t ) e f j ( t ) =

d
k

j, k

j, k (t )

onde cj,kVj e dj,kWj. Sendo fj = fj-1 + fj-1, o algoritmo de reconstruo fica [13; 78] : c j +1,n = [hn2 k c j ,k + g n2 k d j ,k ]
k

- ( 22 )

Estas expresses so o cerne da decomposio (transformada direta) e reconstruo (transformada inversa) wavelet, e podem ser esquematizadas de forma anloga aos algoritmos piramidais e de codificao sub-banda, como na figura abaixo:
Figura 12 - Esquema de decomposio e reconstruo wavelet

dJ-1 cJ cJ-1

dJ-2 cJ-2

... ...

dJ-N cJ-N

dJ-N cJ-N

dJ-N+1 cJ-

... ...
reconstruo

dJ-1 cJ-1 cJ

decomposio
24

Como veremos adiante, estas sequncias sero a chave para uma implementao prtica de uma anlise em multiresoluo com bancos de filtros.

44

A figura sugere um esquema hierrquico para se obter todos os coeficientes wavelet de um sinal eliminando a necessidade de se calcular o produto interno < f,j,k (t) > para cada dj,k. a natureza recursiva deste algoritmo wavelet que o torna computacionalmente veloz e eficiente, atraindo a ateno da comunidade de processamento de sinais. A introduo da teoria da multiresoluo abriu o caminho para descobrir-se as conexes entre os algoritmos piramidais, as estruturas de codificao sub-banda, os filtros de espelhamento de quadratura (QMF) e a teoria wavelet. [42; 47] Strang (1993) analisa em
[77]

as implementaes matriciais da transformada wavelet,

mostrando que a matriz de transformao pode ser fatorada em matrizes esparsas, num processo que equivalente ao algoritmo piramidal acima, dando origem transformada wavelet rpida, que permite uma reduo na complexidade algortmica de O(n.logn) para O(n), onde n a extenso do sinal (discreto). O algoritmo acima pode ser implementado utilizando-se bancos de filtros num arranjo piramidal, como veremos a seguir.

2.5.1 Implementao via banco de filtros


Uma anlise em multiresoluo pode ser vista como um sistema de filtros, esquematizados num arranjo piramidal (em formato de rvore) como abaixo [78] :
Figura 13 - Anlise em multiresoluo com banco de filtros

Aproximao de f(n) no nvel j Coeficientes de escalamento de f(n) no nvel j

fj

cj,k

H (2) G (2)

cj-1,k
fj-1 dj-1,k

fj-1

H (2) G (2)

cj-2,k

H (2) G (2)

cj-3,k ...
dj-3,k ...

dj-2,k
direo do processamento

Coeficientes wavelet de f(n) no nvel j-1

Um banco de filtros um conjunto de filtros conectados por operadores amostradores ou decimadores (2) e, em alguns casos, por mdulos de atraso [78]. Os filtros H e G neste arranjo formam um banco de filtros, e podem ser escolhidos tal que realizem os algoritmos de decomposio das equaes 20 e 21 acima. O banco opera sobre um sinal de entrada fj filtrando-o por dois canais distintos, geralmente um passa-alta (G) e outro passa-baixa (H), e iterando-se o processo no canal

45

passa-baixa, como mostra a figura acima. Em cada etapa geram-se 2 aproximaes de fj de menor resoluo: fj-1 Vj-1 e fj-1 Wj-1. Em implementaes prticas, trabalhamos diretamente com os coeficientes cj,k e dj,k representativos do sinal original- na rvore de filtros. Comeamos com um nvel j=J suficientemente fino25 ( fj = fJ , descrito na escala 2-J, ao nvel J) e descemos a rvore at o nvel j=0. Se o vetor de entrada cJ,k tem extenso N=2J, atingimos o nvel j=1 com 2 elementos, quase no nvel de resoluo mais baixa da rvore. [78] H o canal passa-baixa, que computa suavizaes (mdias), gera os subespaos Vj, e reduz a resoluo da sequncia de entrada pela metade em cada etapa da decomposio. G o canal passa-alta, que extrai os detalhes (diferenas) em cada etapa e gera os subespaos Wj, os subespaos wavelet. Os passos de subamostragem ou decimao (2) selecionam os componentes pares da sequncia de entrada, e dobram a escala em cada etapa: (2) x(k) = x(2k) O processo de decimao, ao contrrio da filtragem que linear e invariante no tempo, variante no tempo e no invertvel. Seu uso em banco de filtros, entretanto, no prejudica as propriedades desse arranjo especial, entre as quais a sua invertibilidade ou capacidade de reconstruo perfeita. O banco de filtros implementa uma anlise wavelet em multiresoluo quando os coeficientes dos filtros H e G correspondem queles dos filtros associados s sequncias h(k) e g(k) previamente apresentadas: os coeficientes dos filtros associados funo escaladora e wavelet. Anlise em multiresoluo porque o repetido reescalamento em cada etapa produz detalhes em todas as escalas/resolues. Anlise wavelet porque no limite do processo de filtragem do banco, a iterao do canal passa-baixo produzir a funo escaladora e a wavelet. Em outras palavras, a conexo entre o banco de filtros discretos e as wavelets contnuas est no limite da rvore de filtragem. A vantagem em se utilizar bancos de filtros para realizar uma anlise wavelet em multiresoluo est na facilidade da sua implementao na forma discreta, empregandose filtros digitais. Com a escolha apropriada dos filtros, o processo de filtragem passa a realizar na verdade uma transformao wavelet, decompondo o sinal de entrada em

46

coeficientes dj,k, indexados pelos parmetros escala ( j ) e deslocamento (k). Os requisitos impostos s wavelets no item 2.2 para que haja a transformada e a inversa ficam traduzidos no contexto dos bancos de filtros em restries sobre os coeficientes dos filtros a serem satisfeitas. O primeiro passo aproximar a funo f(t) por uma funo f(n), discreta, com resoluo arbitrariamente fina, suportada numa extenso finita [0, N-1] e constante por partes em intervalos [l/N, (l+1)/N]. Esse procedimento consiste numa amostragem do sinal original f(t) gerando uma aproximao discreta f(n), que pode ser to fina (ou resolvida) quanto se desejar. Em certas aplicaes podemos tomar os valores de f(n) diretamente como vetor de entrada, i., fazendo os coeficientes cJ,k = f(n). Isto corresponde a aproximar f(n) por seus coeficientes cj,k num nvel J arbitrariamente fino. A anlise prover no prximo nvel uma verso menos resolvida de f(n) numa escala duas vezes maior - cJ-1,k - e tambm os detalhes para que esta verso menos fina possa reconstruir o sinal original, no nvel superior mais fino - dJ-1,k (os coeficientes wavelet). O processo iterado no canal passa-baixa levar gerao de todos os coeficientes wavelet dj,k de f(n), que contm por toda a rvore os detalhes de f(n) separados em bandas de frequncias. Na sntese inverte-se a direo do processo, exatamente como na sntese em multiresoluo contnua. Substitui-se a subamostragem (2) por uma superamostragem (2)26 e os filtros de anlise H e G pelos de sntese H e G .

H e G podem satisfazer diversos critrios de formao e relaes com o banco de


anlise H e G. A operao de sntese inversa de anlise. O banco de sntese dever ser portanto o inverso do banco de anlise se a reconstruo perfeita desejada. Parte do projeto dos filtros consiste em garantir que (2)Hf(n) = u(k) e (2)Gf(n) = v(k) iro

produzir toda a informao necessria para recuperar f(n) no processo inverso, com H (2)u(k) e G (2)v(k). No caso de transformaes ortogonais os bancos de filtros tambm sero ortogonais, e a relao de invertibilidade entre sntese e anlise ganha

to fino quanto possvel para consistir numa excelente aproximao (fj) para o sinal original sob anlise ( f(n) ou f(t) )
26

25

Superamostragem [78]: y = (2) x(k) =

y( 2 k ) = x ( k ) y( 2k + 1) = 0

47

uma expresso matemtica direta e simples, melhor visualizada sob uma abordagem matricial dos bancos.

2.5.2 Abordagem matricial


As operaes num banco de filtros como acima podem ser representadas matricialmente, atravs de multiplicao de matrizes. Para se transformar uma sequncia de extenso N nos seus N coeficientes (gerados pela decomposio) necessrio uma matriz NxN. A transformada inversa envolve o uso da matriz inversa: Sntese: x = W.b Anlise: b = W-1.x

onde b o vetor transformado (com N coeficientes wavelet), W a matriz de transformao wavelet montada com os coeficientes dos filtros do banco (h(n) e g(n)) e
x o vetor de entrada (de extenso N).

A escolha do filtro passa-alta e passa-baixa (equivalente escolha da base wavelet) exercer uma forte influncia nas propriedades verificadas pelas matrizes. Por exemplo, se H e G so ortogonais, o banco de filtros ortogonal e a matriz correspondente ser tambm ortogonal. Por meio de uma normalizao a ortogonalidade passa a ortonormalidade, e temos que
WT.W = I

W-1 = WT

- ( 23 )

isto , o banco de sntese o transposto (conjugado) do banco de anlise. Isto permite que as matrizes possam ser fatoradas em matrizes menores e mais esparsas, gerando uma transformada rpida, e diminuindo o nmero de operaes necessrias para a transformao wavelet
[77]

. Pode ser demonstrado que o nmero de multiplicaes na

transformada rpida fica limitado a no mximo 2.T.N, onde T o nmero de coeficientes dos filtros [78]. Strang (1996) realiza uma conexo cuidadosa e aprofundada entre a teoria dos bancos de filtros e a teoria wavelet em [78]. Tambm examina com detalhes a questo da reconstruo e os mtodos de gerao dos filtros H, G, H e G , tais que constituam bancos (inversos) satisfazendo esta propriedade. Um caminho possvel de projeto resulta na gerao de bancos de filtros

48

QMF - ou filtros de espelhamento de quadratura. Outro caminho, utilizando filtros inversos alternados (alternating flip) conduz a bancos de filtros ortogonais. [78] Os filtros de Daubechies, por exemplo, seguem este padro, que leva G a ser definido a partir de H como abaixo:
h(k) e g(k) = (-1)kh(N-1-k)

Nas anlises experimentais de gestos musicais contidos em interpretaes de flauta e violino - mais adiante neste trabalho- os filtros de Daubechies foram maciamente empregados. O esquema de anlise empregado pelo pacote computacional adotado baseia-se na implementao de uma anlise wavelet em multiresoluo via banco de filtros, como exposto acima. Os filtros de Daubechies D16, que conduzem a uma anlise wavelet com a famlia Daubechies 16, foram os mais empregados nesta fase, exibindo os melhores resultados dentre as famlias avaliadas. No captulo seguinte aborda-se os timbres instrumentais: o conceito de timbre, os instrumentos selecionados para as anlises deste trabalho, o paradigma de representao de timbres instrumentais em sistemas eletrnicos de sntese, e a importncia da interpretao sobre a qualidade e naturalidade dos sons instrumentais.

49

3 TIMBRES DE INSTRUMENTOS ACSTICOS E MSICA INSTRUMENTAL

Dissertar sobre timbres musicais implica na premissa de prover antes uma definio para o termo timbre. Esta tem sido uma tarefa difcil j h um bom tempo. A American Standards Association27 em 1960 definiu timbre como aquele atributo da sensao auditiva em termos do qual um ouvinte pode julgar que dois sons similarmente apresentados e tendo a mesma intensidade e pitch so dissimilares. Esta definio entretanto deixa muito h desejar. Bregman (1990), comentando sobre a definio do termo, classifica a definio acima de incua, e mesmo sugere uma nova verso para ela: Ns no sabemos definir timbre, mas ele no intensidade e no pitch. [5]
Pitch e intensidade so parmetros acsticos importantes em msica, mas no

transportam toda a informao necessria para permitir a classificao de timbres, ou servir de guia na tarefa de reconhec-los. Numerosos fatores informam sobre a percepo do timbre: a amplitude do envelope do som, a forma e contedo do ataque, as ondulaes peridicas devido a um vibrato ou um trmulo, a estrutura dos formantes, a amplitude percebida, durao, e o espectro variante no tempo. [63] Durao e amplitude exercem uma importante influncia sobre o timbre percebido de um instrumento. Por exemplo, diferenas na intensidade podem transformar um tom de flauta, que a 60 dB equivalia a uma nota, num barulho intenso quando em 120 dB. Um tom que dure 30 ms pode possuir a mesma forma de onda peridica de um tom que dure 30 segundos, mas para um ouvinte pode ser muito difcil determinar se tais tons provm da mesma fonte sonora. [63] Timbre portanto uma entidade de complicada definio. Certamente ele depende at certo ponto do espectro do som, mas vai alm disso. Por exemplo, possvel reconhecer diferentes instrumentos tocados atravs de um radinho de pilha monoaural barato e de baixa fidelidade, o qual distorce seriamente e corta o espectro original dos sons. Tambm o fato de aumentarmos o volume do som neste radinho no alterar nossa percepo da dinmica do som original (se um pianssimo ou um fortssimo) constitui outra confirmao sobre a complexidade da percepo do timbre. [56]

27

Atualmente ANSI - American National Standards Institute.

50

A classificao de timbres historicamente mais antiga que a tentativa de se atribuir uma definio clara para o termo (na esperana de que isso sistematizaria a categorizao dos sons musicais). Os chineses h sculos faziam classificaes dos timbres baseado numa taxonomia de suas fontes sonoras. Desenvolveram sofisticadas descries dos timbres e levaram em conta a influncia dos diferentes tipos de toques (formas de ataques, puxadas e vibratos) na conformao do timbre. [63] O espectro e o timbre so conceitos relacionados, mas no equivalentes [63]. O espectro refere-se s propriedades fsicas (a distribuio da energia em funo da frequncia) dos sons musicais. As ferramentas computacionais de anlise baseadas no espectro tradicional encontram limites em tarefas de alto nvel em musicologia, como anlise de estilos, percepo e identificao de caractersticas em interpretaes musicais. A anlise destes elementos, transportados nos timbres instrumentais, encontra alicerce em grande parte nos paradigmas da psicoacstica. Psiclogos usam o termo timbre para se referir s qualidades percebidas e aos mecanismos perceptuais que permitem classificar os sons em famlias. A psicoacstica d mais nfase descrio dos timbres em termos de suas qualidades perceptuais, e nos remete a considerar fenmenos como a
integrao seqencial, fuso e mascaramento. Neste contexto, Roads (1996) considera

certamente mais fcil discutir-se timbre dentro do domnio dos tons instrumentais tradicionais, onde quase toda a pesquisa passada estava focada instrumento que os produzem, perfeitamente satisfatria famlias. [56; 63] Na msica ocidental tradicional o paradigma de classificao baseado em famlias instrumentais amplamente empregado. Os instrumentos acsticos tradicionais so classificados como pertencentes a quatro famlias bsicas, tomando-se os materiais de construo dos instrumentos como parmetro categorizador: os metais (trompetes, tubas, trombones, trompas, etc. ), as madeiras (flautas, obos, fagotes, clarinetas, saxofones, etc.), as cordas (violinos, violas, violoncelos, violes, guitarras, baixos, etc.), e as percusses (tmpanos, tambores, taris, tablas, pratos, tamborins, tants, gameles, etc.).
[5] [63]

. Bregman (1990)

tambm sugere que a classificao de timbres, referenciando-os pelo rtulo do . Existem vrias tcnicas criadas no intuito de se permitir classificar o universo de timbres por categorias ou

51

Esta classificao, no entanto, no reflete muitos dos avanos tecnolgicos em msica neste sculo, bem como no atendem a todos os timbres existentes (ou sintetizveis eletronicamente) permanecendo hoje vlida como herana da tradio musical de sculos passados. Instrumentos como a harpa, o acordeo ou o complexo piano, por exemplo, no encontram lugar nesta classificao, bem como as modernas flautas transversais, na sua maioria feitas de ligas metlicas, no se enquadram bem sob o termo madeiras.28 No domnio da msica eletrnica, entretanto, os timbres precisam de um sistema de descrio mais exato, com parmetros definidos de tal forma que possam servir para controlar um aparato sintetizador e dirigir a sntese de um sinal acstico. Esta necessidade impulsionou, no decorrer da segunda metade deste sculo, o desenvolvimento de um nmero de modelos representativos para timbres musicais enquadrados numa estrutura de referncia matemtica e de engenharia, isto , modelos expressos em linguagens matemticas e de engenharia, e que pudessem ser implementados atravs de algoritmos ou fluxogramas de controle. Os primeiros sintetizadores analgicos, e as primeiras verses digitais que lhes sucederam, baseavam-se em modelos descritivos de timbres simples e determinsticos. A inexistncia de dispositivos de alto poder computacional no incio, somado imaturidade dos sistemas e teorias explanativas sobre os fenmenos musicais, limitaram bastante os primeiros passos em direo sntese eletrnica de msica: os resultados snicos eram pobres e inexpressivos, reflexos claros do emprego de modelos reducionrios e super simplificados para representar complexos fenmenos acsticos. No fosse a sintomtica vontade humana da persistncia no teramos chegado aos atuais sistemas musicais computadorizados de hoje. Neste captulo apresentam-se os instrumentos acsticos cujos timbres foram escolhidos como alvo de anlise: a flauta e o violino. Faz-se ento uma breve introduo aos modelos elementares de timbres instrumentais nos sistemas de sntese eletrnicos. Em seguida adiciona-se uma discusso sobre a influncia da interpretao na msica instrumental: o papel preponderante dos gestos musicais realizados pelo intrprete, que constituem o diferencial no alcanado pelos sintetizadores eletrnicos no sentido de se
28

O mesmo ocorre com o saxofone, instrumento inventado por volta de 1840, tambm classificado em Orquestrao na famlia das madeiras, apesar de ser feito inteiramente de metal (com exceo do bucal onde fica a palheta).

52

produzir uma msica rica em detalhes, natural na evoluo e expressiva no contexto psicolgico. Para completar o captulo, introduz-se a tcnica da Anlise e Sntese, ferramenta j tradicional em computao musical, com a qual procura-se compreender melhor a estrutura de formao dos sons musicais.

3.1 Instrumentos acsticos tradicionais

SELEO DOS TIMBRES INSTRUMENTAIS

Pretende-se abordar neste trabalho os timbres de dois instrumentos acsticos sinfnicos para gerar as amostras para anlise: um de sopro, a flauta transversa, e um de cordas, o violino. As formas de excitao, de controle da vibrao e emisso sonora so distintas em cada instrumento, embora haja uma semelhana nos princpio fsicos de gerao sonora, fundamentados pelas teorias da fsica clssica de ondas e propagao de ondas mecnicas em meios deformveis ou elsticos. Por pertencerem a famlias de instrumentos diferentes, seus timbres so notadamente diferentes, possuindo registros e coloraes tonais distintos.

3.1.1 A flauta
A flauta em verdade pertence famlia dos instrumentos de sopros. Vrios autores, seguindo a nomenclatura tradicional, se referem flauta como pertencente famlia das madeiras, numa aluso ao material de que eram construdas no passado, mantendo-se a nomenclatura mesmo nos dias atuais quando h flautas feitas de diversos materiais, as mais nobres construdas de metais, o que lhes proporciona um registro snico mais amplo e um timbre mais ntido e brilhante29. A flauta caracteriza-se por ser um instrumento de timbre essencialmente harmnico, de qualidade clara, capaz de uma
29

Existem flautas construdas da mais variada gama de materiais, incluindo prata, ouro, platina, madeiras, e at vidros e materiais cermicos. A extenso da influncia do material sobre a qualidade do timbre um campo ainda inconclusivo, embora na prtica, por exemplo, hajam suficientes indicativos de que bucais de prata ou platina produzem tons mais claros e lmpidos. Por outro lado, o artfice, o projeto, a percia na manufatura e o acabamento, estes indubitavelmente so preponderantes sobre a qualidade final do timbre do instrumento.

53

extrema flexibilidade de variaes tonais e velocidade nas articulaes. O mecanismo fsico de gerao da escala (tonal) baseia-se na variao do comprimento da coluna de ar vibrante em intervalos discretos, dando origem a uma sequncia de modos de vibrao: os tons e semitons, que exibem uma srie harmnica e um pitch. Em sntese, a flauta (transversa) comporta-se como um tubo vibrante, de uma extremidade fechada e a outra aberta, onde o comprimento vibrante varivel pelo arranjo do dedilhado. Atravs do sopro induz-se vibraes simpticas por ressonncia sintonizada na frequncia (pitch) da coluna de ar. A altura da frequncia (e o pitch) funo do comprimento da coluna de ar vibrante. Furos devidamente dispostos no tubo da flauta em intervalos regulares servem para provocar o efeito da variao do comprimento da coluna de ar em intervalos tambm regulares. A produo da escala obtida pelo posicionamento dos dedos sobre os furos, fechando-os ou abrindo-os em arranjos determinados (posies ou dedilhados). A Figura 14 mostra uma flauta (transversal) bsica (didtica) e alguns dos tons produzidos para algumas posies de dedilhado. O dedo indicador o nmero 1 para ambas as mos, o dedo mdio, o 2, e assim por diante
[57]

. A indicao das notas

correspondentes aos dedilhados feita nas partituras direita, em clave de sol (registro tpico para flautas). Os segmentos pontilhados logo abaixo de cada um dos 7 arranjos mostrados mostram o comprimento (efetivo) da coluna de ar vibrante para cada nota/dedilhado.
Figura 14 - Flauta bsica: dedilhado e respectivos tons produzidos

54

Nas flautas modernas foram adicionadas chaves especiais para facilitarem o acesso a disposies de dedilhados mais difceis, o que contribuiu muito para melhorar a interface do instrumento para o manuseio do instrumentista, consequentemente oferecendo-lhes mais liberdade e velocidade na interpretao
[57]

. A Figura 15, abaixo,

mostra uma flauta transversal moderna, um modelo com as chaves vazadas e com a nota mais baixa acessvel em si bemol (Bb2 na afinao oficial de referncia). O instrumento cobre quatro oitavas, e existem posies de dedilhados alternativas que produzem a mesma nota30 (dedilhados isotonais) como recurso para incrementar a agilidade nos fraseados que normalmente exigiriam mudanas rpidas de posies envolvendo muitos dedos.
Figura 15 - Flauta transversal metlica, afinada em d, de 3 partes montveis e chaves vazadas

bucal

corpo

cabea

A excitao na flauta transversal feita atravs do sopro transversal ao bucal do instrumento. O controle da entonao na flauta manejado na embocadura pelos lbios e pela regularidade do fluxo de sopro. Existem amplas possibilidades de se impor efeitos especiais e modulaes simplesmente alterando-se a presso do sopro, a disposio dos lbios sobre o bucal, o formato da abertura labial e o ngulo do sopro em direo fenda do bucal. A embocadura refere-se formao dos lbios e msculos vizinhos, de forma a produzir um tom em instrumentos de sopro. A disposio dos lbios, maxilar, queixo e garganta extremamente importante na formao de uma embocadura correta para guiar o sopro para a flauta transversal. A lngua responsvel pela textura e articulao do ataque. Existem vrios ataques possveis para uma nota, dependendo da forma como o instrumentista inicia o fluxo de

30

As diferenas em pitch estando numa escala microtonal, perfeitamente ajustvel pelo intrprete modulando-se a embocadura e a presso de sopro. Vale lembrar que a entonao tambm um processo pessoal de afinao, que admite variaes e estilos diferentes entre instrumentistas diferentes.

55

ar projetado no bucal. Os mais comuns so obtidos liberando-se o fluxo de ar como se pronunciando a slaba tu, ou ku. A continuidade ou ritmo do fluxo de ar depende do controle sobre a respirao, em grande parte manejada pelo diafragma, um msculo vigoroso da regio abdominal. A intensidade (dinmica) funo do volume de ar soprado, e sua regularidade, especialmente em notas longas, tambm vai depender do controle que o instrumentista tem sobre sua respirao. As posies na escala tonal so determinadas pelo dedilhado e pela embocadura, que tambm influencia na determinao da altura da nota (pitch). Por exemplo, possvel tocar-se um l4 (A4) ou um mi5 (E5) com a mesma posio do dedilhado, simplesmente alterando-se a embocadura e o fluxo de ar no bucal. A flauta transversal utilizada para amostrar os eventos musicais abordados neste trabalho foi uma Armstrong modelo 104, de fabricao americana, de chaves fechadas e afinada em d.

3.1.2 O violino
O violino pertence famlia das cordas, e caracteriza-se por ser um instrumento de timbre denso, de grande alcance dinmico, e imensa capacidade de expressividade e possibilidade de variao contnua na tonalidade. No muito claro quem inventou o violino. Pode ter sido Andrea Amati, que fundou uma importante escola de luthiers de violinos, em Cremona, Itlia. Amati morreu em 1580, e cerca de 150 anos depois seus pupilos desenvolveram a arte da fabricao de violinos a um extraordinrio alto nvel, particularmente Antonio Stradivari e Giuseppe Guarneri. Naquela poca, o pouco conhecimento da fsica do som no influenciou sobremaneira o desenvolvimento do instrumento. Hoje, entretanto, a desenvolvida cincia da acstica aplicada abertamente para compreender o violino e seu processo de fabricao, bem como contribuir para o seu aperfeioamento. Em essncia, o violino um conjunto de quatro cordas montadas sobre uma caixa de madeira compreendendo um espao de ar quase fechado. Alguma energia das vibraes induzidas nas cordas transmitida caixa e ao espao de ar incluso no qual so estabelecidos vibraes correspondentes.

56

A Figura 16 abaixo mostra a anatomia de um violino, indicando suas partes componentes.


Figura 16 - Anatomia de um violino: partes constituintes principais

voluta cravelhas brao espelho ou ponto faixa lateral (costilhos) tampo fundo

abertura em f cavalete estandarte

A 1a corda (primeira direita na figura acima) a corda afinada em mi: a mais aguda. A 2a a corda em l, a 3a, em r, e a 4a (ltima esquerda, tambm chamada bordo), em sol, a mais grave
[73]

. As cordas tradicionalmente so feitas de uma alma (que pode ser

de tripa de porco ou perlon) envolvida por finos fios tranados de prata ou alumnio. Cordas vibrantes tm sido estudadas desde a poca de Pitgoras. No sculo XIX, O fsico alemo Hermann von Helmholtz muito contribuiu ao tema elucidando os tipos de vibraes que distinguem a corda puxada (pizicato) da tocada pelo arco. Seu trabalho foi mais tarde complementado e enriquecido por muitos outros pesquisadores. A corda vibrante por si s no possui rea de superfcie suficiente para imprimir uma presso sonora aprecivel, e sozinha, sem amplificao, soaria desprezivelmente. Cerca de 10% da energia suprida pelo violinista comunicada aos corpos ressonantes de madeira por meio de um mecanismo de movimentao do cavalete. Excitada pelo arco, as vibraes na corda encampam dezenas de harmnicos energticos, e embora seu movimento possa parecer simples31 nenhuma soluo geral foi firmada para ele, por
31

muitas vezes considerado simplesmente um deslocamento em forma de onda triangular ou dente de serra.

57

causa da extrema no linearidade existente na frico, e pelo complexo relacionamento desta com a velocidade de arraste do arco. A caixa sonora vibrante formada por um tampo - construdo de abeto laminado no
sentido do comprimento da tora, arqueado para fora e vazado por 2 furos em forma de f - por um fundo - tambm arqueado para fora, normalmente esculpido de um bloco de cer curado por vrios anos, cuja espessura varia de 6 mm no centro a 2 mm nas bordas - e por finas faixas laterais de suporte, de espessura prxima de 1mm,

construdas de cer crespo, envergadas e coladas a blocos de abetos ou madeira de salgueiros. O brao, de cer crespo, a base para o espelho, este normalmente de bano, onde o violinista dedilha. O cavalete, de cer macio, um elemento fundamental para a formao do som no violino. Na parte interior da caixa existem ainda dois elementos de importantes funes acsticas, exercendo relevante influncia sobre a qualidade do tom: a alma (sound post na lngua inglesa; me, em francs), um cilindro de madeira encaixado (aproximadamente) sob um dos ps do cavalete, e sem o qual o violino passa a soar mais parecido a um violo, e a cadeira [73] ou barra harmnica (bass bar), uma faixa de madeira sob o outro p do cavalete que se estende sob boa parte do comprimento do tampo. "Ambas as estruturas, alm de darem mais solidez ao tampo, melhoram o som: a barra harmnica, o das notas graves; a alma, o das agudas". [73] A Figura 17, abaixo, ilustra um corte seccional do violino mostrando a localizao destes componentes internos caixa.
Figura 17 - Corte seccional do violino sob o cavalete.

58

O arco, ferramenta (imprescindvel) parte, possui o lenho de madeira e o "cabelo" tradicionalmente formado de crina de cavalo. Outros ingredientes, como colas, vernizes e enchimentos, tambm exercem sua parcela contribuinte sobre a qualidade do timbre. Itokawa e Kumagai (1952) lembram que uma fonte sonora usualmente possui trs elementos necessrios: um sistema vibratrio, uma parte comunicativa (ou transmissiva) que geralmente inclui sistemas filtrantes e ressonantes, e uma terceira parte: o radiador. No caso do violino as cordas fazem o papel da primeira parte, o cavalete age transmitindo e filtrando as vibraes, e a terceira parte cabe caixa, ao tampo, fundo e o volume de ar contido no corpo do violino, que consiste num ressonador de Helmholtz juntamente com as aberturas em f. [30, p.55] As aberturas em f, de cada lado do instrumento, exercem duas funes acsticas fundamentais: (1) reduzir a rigidez da base do tampo, onde o cavalete se ergue, e (2) formar uma ressonador de Helmholtz [30]. Elas no consistem simplesmente em sadas para o som irradiar-se, mas juntamente com o as paredes do corpo do violino formam um vibrador harmnico ou cavidade ressonante, que ressona em faixas graves de frequncia. A extensa faixa de frequncias comunicada pelas cordas caixa foram-na a vibrar em sintonia. A estrutura do corpo entretanto possui seu prprio conjunto de frequncias ressonantes, e transferncia expressiva de energia ocorre na coincidncia dos harmnicos ressonantes. O luthier de violinos est principalmente interessado na principal frequncia de ressonncia do volume de ar (PFA-Principal Frequncia do Ar), que a frequncia do ressonador de Helmholtz. Quanto maior o volume de ar fechado, menor ser a frequncia de ressonncia, e quanto maior for a rea das aberturas em f, maior ser esta frequncia. A excitao do instrumento normalmente ocorre pelo arraste de um arco sobre as cordas presas no corpo do instrumento. A afinao das tonalidades fundamentais das cordas determinada pela tenso a que esto submetidas, embora a tonalidade possa ser continuamente variada pelo instrumentista alterando o comprimento vibrante das cordas com os dedos. Existe uma supremacia dos instrumentos de cordas sobre os outros em orquestras sinfnicas, assim como uma "discreta preferncia" pelos compositores (eruditos) por eles. A colorao tonal do grupo das cordas equitativamente homognea de cima a

59

baixo, enquanto os instrumentos de sopro apresentam caractersticas sonoras individuais muito mais pronunciadas. [57] As possibilidades de expresso dinmica destes instrumentos, bem como os detalhes sobre suas respectivas tcnicas de interpretao so assuntos cuja abordagem extrapola o objetivo deste texto. O leitor interessado pode encontrar maiores detalhes em
[57]

Tambm dvidas mais acirradas e um interesse maior pela fsica do instrumento podem ser satisfeitas, ainda que inicialmente, pela compilao dos mais relevantes trabalhos abordando a acstica do violino, a acstica da corda arqueada, os materiais de fabricao e propriedades, e o papel de importantes elementos do instrumento (como o cavalete e a alma) em [30]. O instrumento utilizado para capturar os eventos musicais abordados neste trabalho foi um violino Hopf, de 1730, com a corda sol revestida de prata, o interior de perlon, as demais cordas revestidas de alumnio.

3.2 Dos timbres msica instrumental


O som de uma sinfonia para orquestra composto pela somatria dos tons individuais de cada instrumento, que so emitidos segundo uma sequncia temporal organizada, obedecendo a um padro rtmico, harmnico e meldico. O tom musical de um instrumento formado por padres oscilatrios peridicos e aperidicos atuando em diferentes faixas de frequncia e intervalos de tempo durante o perodo de sua durao. Timbres de instrumentos acsticos variam na qualidade percebida do incio ao fim do tom, isto , o timbre evolui no curso de sua durao. Tons assim produzidos so ditos possuir espectro variante no tempo. [54, p.292]

3.2.1 Composio de timbres: modelos elementares


A compreenso dos elementos constituintes do tom essencial para construir um modelo realista de um instrumento musical e seu timbre para objetivo de sntese. Em particular, ser necessrio aqui introduzir e definir as regies comumente presentes em tons musicais que sero objetos de anlise e discusso nos captulos seguintes.

60

Os antigos sintetizadores analgicos baseavam-se num conceito simples de gerao sonora, procurando imitar o modo natural de evoluo das frequncias parciais componentes do tom. Neles, geradores de frequncias (VCOs) geravam a fundamental e parciais do tom. A sada de cada um era ento modulada em amplitude (atravs de VCAs) de forma que cada frequncia tivesse um envelope nico, e finalmente misturadas para compor o tom final, consistindo-se portanto numa forma de sntese aditiva. A Figura 18 abaixo mostra o esquema de roteamento dos sinais entre estes mdulos, ilustrando um sintetizador analgico elementar, realizando uma sntese aditiva de um tom com 6 frequncias parciais (f1 a f6 na sada dos VCO's) devidamente "envelopadas" por VCA's
[54, p.241]

. Evidentemente, com VCO's produzindo formas de onda mais

complexas as possibilidades de sntese se alargam.


Figura 18 - Esquema de um sintetizador analgico modular bsico

f1

VCO

VCA

f2

VCO

VCA

f3

VCO

VCA

MIX
Amplificador de Saida f4
VCO VCA

f5

VCO

VCA

f6

VCO

VCA

61

O mdulo do gerador de envelope tipicamente esculpia um contorno de 4 estgios para o sinal: uma etapa de ataque (attack), um queda inicial (decay), um perodo de sustentao (sustain) e a queda final (release), e frequentemente conhecido pela sigla (inglesa) ADSR
[54]

. Este modelo descritivo de tons naturais, que busca imitar o

envelope de tons naturais, sofreu variaes no decorrer das geraes de sintetizadores, e foi naturalmente portado para os sistemas digitais. Os envelopes temporais so ainda largamente utilizados nos sintetizadores digitais comerciais atuais, diferenas e sofisticaes na arquitetura de implementao variando de fabricante para fabricante. A Figura 19 abaixo ilustra o envelope temporal e seus estgios ou regies bsicas descritas sob um ponto de vista fsico.
Figura 19 - Envelope de amplitude x tempo, ou ADSR

sobrelevao 2

3 4 tempo

ataque (1) - a primeira regio de subida do tom at um pico determinado

(sobrelevao); refere-se ao perodo transitrio de excitao quando vibraes em vrias faixas de frequncia so estabelecidas e um determinado padro harmnico, solicitado.
decaimento (2) - o perodo que segue do pico do ataque (sobrelevao) etapa de

regime permanente em que as vibraes convergem para modos estacionrios.


sustentao (3) - o perodo referente ao estado de regime permanente, onde as

vibraes so sustentadas pela durao (e sob efeito das modulaes) que se desejar impor ao tom/timbre.
liberao (release) (4) - o perodo de colapso, que se inicia ao fim da excitao e

corresponde ao desvanecimento do tom, associado ao desmonte dos padres vibratrios, at o seu completo trmino. A Figura 20 mostra um fluxograma de um algoritmo simples descritivo de um instrumento gerado em sistema digital
[54]

. Uma associao modular semelhante do

diagrama do sintetizador analgico da Figura 18 igualmente aplicvel neste caso.

62

Figura 20 - Fluxograma de um simples algoritmo descritor de instrumento em sntese digital

p1 p2 p3 p4 Parmetros de Controle: p1 - Tempo de ataque p2 - Tempo de decaimento p3 - Durao da nota p4 - Amplitude p5 - Frequncia para o oscilador f1 - Envelope para o oscilador f2 - Nota/tom final

f1 P5 OSCIL f2

Em verdade, nas interpretaes acsticas reais, o nmero de etapas com identidades prprias e diferenciadas pode ser bem maior. A despeito da abordagem generalista e simplificadora deste modelo, verifica-se que a qualidade do som gerado sob este paradigma depende diretamente do esquema de implementao dos estgios do envelope, motivo pelo qual encontra-se no mercado sintetizadores com qualidades drasticamente distintas, numa classificao que vai do decepcionante e montono ao satisfatrio e estimulante. Isto porque cada fabricante implementa uma arquitetura diferente no arranjo de unidades geradoras, filtros digitais e/ou analgicos, bancos de formas de onda (amostras de timbres naturais em memria), interfaces e fluxo de controle e dados, otimizando alguns aspectos. Nos sintetizadores com mais recursos as etapas do envelope podem ser configuradas individualmente (editadas), criando texturas e promovendo efeitos sutis ou drsticos sobre o som produzido. O custo um fator influente na complexidade final do sistema, e costuma crescer em proporcionalidade direta com a qualidade sonora do sintetizador.

3.2.2 A tcnica de interpretao como fonte de expressividade


Existem vrias tcnicas de sntese empregadas para gerar tons to prximos quanto possvel de tons instrumentais naturais, conforme j abordado neste texto. Nos modelos de sntese mais simplistas, mesmo reducionrios, verifica-se a gerao de tons e timbres claramente artificiais, que no raro excluem informaes necessrias para que sejam reconhecidos, associados ou referenciados a um(s) instrumento(s) em particular, devido a inexpressividade incomparvel aos tons naturais extraveis de um instrumento real.

63

Nos mtodos mais sofisticados, como nos de modelamento fsico e espectral, adotam-se algoritmos de sntese mais elaborados, que levam em conta mais parmetros de controle associados interpretao do instrumento e tambm os fenmenos fsicos acsticos ocorridos no instrumento durante a emisso dos tons. Consequentemente, consegue-se um melhor mapeamento entre a reproduo sinttica e os processos associados interpretao. Todavia, mesmo os mtodos de sntese mais complexos, disponveis em alguns sintetizadores comerciais, no oferecem graus de liberdade e flexibilidade suficientes para o compositor ou msico utilizar todo o seu potencial criativo ou tcnica interpretativa. O registro disso est no baixo grau de realismo e inovao, e na pouca expressividade e variabilidade dinmica que conseguem impor aos tons que produzem. Tais qualidades podem ser encontradas nas interpretaes musicais ao vivo, e esto ocultas codificadas em escalas diferentes no material sonoro. As inmeras possibilidades de controle do instrumento numa execuo real, a infinidade de parmetros fsicos envolvidos na excitao e vibrao dos instrumentos acsticos, e mais a impresso de elementos psicolgicos e de expressividade do(s) intrprete(s) transformam a experincia musical num fenmeno complexo cujo modelamento passa pelo mapeamento dos eventos musicais associados dinmica, expressividade, realismo e tcnica de interpretao em eventos de baixo nvel, registrados como padres snicos em escalas diferentes. [20] evidente que o exame ou interpretao de fatores subjetivos como expressividade e realismo so feitos luz da descrio e da representao que a musicologia e a orquestrao em msica fazem destes elementos. Mesmo sendo de interpretao flexvel, de uma correspondncia no bijetora num sentido estritamente matemtico, estes elementos se manifestam atravs de eventos musicais modelveis e rastreveis com o uso de ferramentas de anlise adequadas para representar processos estacionrios e transitrios, localizados no tempo e na frequncia, como so as wavelets.

64

3.3 A anlise e sntese de timbres musicais


Em 1946/47, o fsico Dennis Gabor, trabalhando numa teoria da audio, sugeriu que os sons so formados por partculas elementares, os quanta acsticos, numa forma de representao quntica do som. Em 1971, Iannis Xenakis, em seu livro Formalized Music, introduziu uma teoria de composio a partir de gros de sons, aproximando-se do modelo de Gabor, e sugerindo o uso de computadores para gerar estes gros
[90]

. Estava nascida a sntese granular,

uma tcnica de sntese aditiva de sons complexos a partir de gros elementares (formas de ondas simples), que foi pesquisada e empregada por Roads (1978; 1985), Jones & Park (1988) e Truax (1988), entre outros [62]. Uma desvantagem reconhecida est no seu difcil controle, dado a imensa quantidade de dados requerida para efetivar a sntese (Truax, 1988). As tcnicas de anlise e sntese esto entre as mais festejadas e antigas tcnicas de sntese empregadas em computao musical. Em 1969 Risset e Mathews realizaram estudos para desvendar aspectos intrigantes dos timbres de trompetes e violinos que os tornavam inimitveis (Risset e Mathews, 1969). Estudaram a sua estrutura espectral, determinando sua composio frequencial e sua evoluo no tempo. O que mais os intrigava era a relutncia que esses timbres em particular tinham em serem imitados por processos de sntese artificial. Segundo Risset, os sons instrumentais foram
analisados, e a relevncia destas anlises foi checada pela sntese: se elas retm os parmetros 'auditivamente' significativos, elas devem permitir uma imitao razoavelmente boa do som analisado.[61] Desta forma podiam verificar a relevncia

dos dados da anlise bem como validar o modelo de sntese empregado. Em 1982 Risset e Wessel foram mais a fundo, explorando timbres pela anlise e sntese (Risset e Wessel, 1978). A anlise e sntese, em poucas palavras, consiste num mtodo para se extrair informaes parametrizveis do sinal musical existentes no domnio do tempo (anlise), e utiliz-las como parmetros controladores em um processo inverso (sntese), atravs do qual se reproduz o sinal original. Quando se usa as tcnicas de Fourier na anlise, os parmetros extrados revelam o contedo espectral do sinal, e portanto esto descritos no domnio da frequncia.

65

Risset foi um dos pioneiros na utilizao de mtodos de anlise pela sntese em computao musical. Sua tese em Fsica abordou a anlise do timbre do trompete pela tcnica da anlise e sntese, que Mathews considera a tcnica mais poderosa para analisar sons musicais naturais. [64, p.8] As tcnicas de anlise e sntese frequentemente levam a representaes reveladoras sobre a estrutura dos sons. Utilizando-a no estudo do trompete, Risset pde verificar, por exemplo, que o aumento na intensidade (loudness) do som implicava num alargamento do espectro do timbre
[61]

, enriquecendo-o. Tambm verificou que os

parciais harmnicos mais altos apareciam mais tarde no ataque, depois dos parciais baixos, e tambm terminavam antes que estes. Embora variaes randmicas da amplitude dos parciais provassem de nenhuma importncia para o ouvido, variaes randmicas das frequncias destes parciais foram importantes na sntese de sons realistas de trompete. Risset tambm demonstrou que variaes muito curtas nas amplitudes de vrios parciais, bem como as rajadas curtas de rudos (freqentes no incio dos ataques de trompetes) no representavam muito para o ouvido em termos de reconhecimento do timbre. [56] A anlise normalmente vale-se de um algoritmo matemtico que permita mapear os aspectos estruturais do som no domnio do tempo em componentes descritas no domnio da frequncia. Em linguagem matemtica: obter uma representao espectral de uma funo descrita no domnio do tempo. A Transformada Enjanelada de Fourier (TEF) e a FFT so tcnicas comumente empregadas em anlises de sries e funes temporais, atravs da expanso da funo em termos de blocos construtores bsicos (funes base), no caso senides. Rioul e Vetterli (1991) revem a transformada enjanelada de Fourier - que chamam de "transformada de Fourier de tempo curto" (STFT - Short Time Fourier Transform) - e suas propriedades de anlise sob resoluo fixa
[60]

. A funo original, num processo

inverso anlise, pode ser aproximada por uma soma de contribuies de funes bases. Nisto consiste a sntese, conduzida pelos dados extrados na anlise (os coeficientes da transformada direta). O principal problema nesta abordagem que a anlise pode gerar uma quantidade enorme de dados, uma exploso de informao, tornando a sntese praticamente impossvel em tempo real sem o emprego de arquiteturas computacionais de alto

66

desempenho. Evidentemente que existem formas de se agrupar alguns componentes, eliminar componentes no significativos perceptualmente (baseado em paradigmas da psicoacstica) e correlacionar vrios componentes em modelos simplificadores, reduzindo assim a quantidade de informao necessria para uma sntese satisfatria, mas no h para isso uma receita padronizada de uso geral, aplicvel em todos os casos. Evangelista (1993), por exemplo, utiliza um esquema para identificar e agrupar padres peridicos em sinais acsticos de forma a reduzir a quantidade de informao necessria para represent-los [19]. Uma soluo adequada, parte de suposies sobre o modelo estrutural do sinal, est no emprego de tcnicas de compresso de dados, ou na escolha de algoritmos naturalmente redutores da quantidade de informao, como a codificao sub-banda, os algoritmos piramidais, e os algoritmos wavelets. A anlise wavelet pode gerar um grande nmeros de coeficientes nulos ou aproximadamente nulos, implicando numa reduo considervel no nmeros de dados gerados
[77]

. No caso de sinais discretos, a anlise wavelet pode ser implementada

atravs de esquemas de codificao sub-banda, com bancos de filtros, expandindo-se o sinal original num nmero de coeficientes igual ou menor ao nmero de amostras do sinal original. Muitos deles podem ser nulos, ou aproximadamente nulos, e por meio de tcnicas de limiarizao (thresholding) podem ser desconsiderados sem que isso represente perda de informao essencial. Essa caracterstica do processamento com wavelets atraiu o interesse de especialistas interessados em desenvolver tcnicas para altas taxas de compresso de dados, admitindo-se uma pequena perda na informao (compresso com perdas)
[26; 77; 88]

Entretanto, nas aplicaes de caracterizao e anlise estrutural dos sinais a maior preocupao no com a reduo no contedo de informao, mas, ao contrrio, com a garantia em se preservar qualquer informao que contribua para uma descrio mais precisa da estrutura interna do sinal, e que possa levar a uma melhor compreenso e ao modelamento dos fenmenos associados com a gerao do sinal. Numa anlise wavelet os parmetros extrados tambm revelam o contedo espectral do sinal, porm sob uma roupagem mais elaborada, no podendo os coeficientes wavelets serem interpretados direta e simplesmente como parmetros de frequncia. Dado o trnsito da teoria wavelet por vrias reas da matemtica, fsica e engenharia, natural que possamos abord-la sobre diferentes linguagens ou interpretaes, escolhendo a

67

mais conveniente para enfatizar uma propriedade especfica, ou explicar seu modo operante. Sob um ponto de vista matemtico, a transformada wavelet realiza um produto interno com o sinal, projetando sobre bases wavelets o sinal analisado. O produto interno dessa forma pode ser visto como uma medida de similaridade entre o sinal e as wavelets, expressa pelos coeficientes wavelets gerados. [60] Sob a perspectiva da codificao sub-banda, a transformada wavelet consiste num banco de filtros passabanda aplicados ao sinal, e cada canal d origem a uma verso filtrada do sinal original, numa escala e nvel de resoluo especficos, representada pelos coeficientes wavelets. Ambas as interpretaes so corretas, e clareiam aspectos diferentes da mesma tcnica. O processo de anlise e sntese prov um insight na compreenso das identidades sonoras e frequentemente leva a representaes reveladoras. Alm disso, pode levar reduo da quantidade de informao (compresso de dados) e a um aspecto mais interessante: a capacidade de se expandir o vocabulrio snico, alterando aspectos do som enquanto preservando sua riqueza e densidade - como na tcnica de sntese
cruzada (Grey e Moorer, 1977) e na produo de iluses e paradoxos snicos (Risset

1978, 1985) -, bem como a capacidade de se produzir variantes e transformaes ntimas no som original. (como por exemplo preservar o timbre e alterar o pitch, a durao e a articulao
[61]

, ou alterar a durao preservando-se o pitch32). Vrios

processos de anlise e sntese, baseados em tcnicas de Fourier, foram desenvolvidos com estes propsitos, como o Phase-Vocoder (Portnoff, 1976; Moorer, 1978), abordado em [17], e o processo de predio linear (Moorer, 1977; Lansky, 1981), mais conhecido pela sigla LPC (Linear Predition Coding).33 Os mtodos de Fourier tornaram possvel analisar digitalmente uma variedade de timbres de instrumentos musicais tradicionais, levando a uma melhor compreenso da natureza fsica e perceptual dos sons musicais, assim como melhoria nas tcnicas de
32

O termo "pitch" encerra uma conotao em msica mais intrincada do que simplesmente a frequncia de um tom. Uma definio mais adequada para este termo abordada nos apndices.

O Phase-Vocoder perfaz uma anlise espectral do sinal snico, gerando funes de amplitude e frequncia para cada harmnico do tom analisado. Em aplicaes de voz e canto, permite a extrao das frequncias formantes [64, p.460]. A anlise com LPC permite extrair o pitch (que modela a excitao), e os coeficientes de um filtro recursivo (que modela as cavidades nasais e a garganta), gerando um modelo

33

68

sntese de som digital. Entretanto, como notado por Gabor em 1946, paradoxal analisar-se um som limitado no tempo por meio de sons (as senides) que duram eternamente, como ocorre na anlise espectral aplicada msica: um nmero infinito de senides infinitas (definidas de - a +) so necessrias para cancelarem-se mutuamente nas regies onde o sinal zero. Mtodos que incorporem um senso de localizao, tanto no domnio do tempo quanto no da frequncia, com funes analisadoras compactamente representveis num plano tempo-frequncia, seriam mais adequados para estas tarefas. As wavelets vm preencher, com vantagens, esta vaga, candidatando-se como funes bases de suporte compacto, no tempo e na frequncia. A transformada wavelet, como ser verificado neste trabalho, oferece meios eficazes para caracterizar o contedo espectral de sinais musicais, levando a representaes compactas e reveladoras do sinal, e permitindo o acesso a nveis de detalhes e resolues diferentes dentro do sinal, como uma sonda seletiva.

O prximo captulo trata da anlise em multiresoluo de gestos musicais. Inicialmente compila-se um pequeno histrico de aplicaes de wavelets em sinais acsticos para situar o leitor em relao a prvios trabalhos envolvendo wavelets e aplicaes em udio; em seguida introduz-se propriamente os gestos musicais - eventos musicais com
teor expressivo, alvos de anlise do presente trabalho. Aborda-se ento os objetos

snicos a eles associados, a sua associao com nveis wavelets especficos (onde sua visualizao torna-se mais evidente) e questes relevantes sobre a percepo de eventos musicais pelo sistema auditivo humano. A percepo auditiva torna-se significante neste contexto, uma vez que a anlise wavelet similar anlise realizada pela membrana basilar da cclea dos estmulos acsticos. As wavelets so ento referendadas como ferramenta apropriada para anlise de eventos musicais expressivos. Na sequncia, introduz-se os eventos musicais expressivos que foram amostrados de interpretaes de flauta e violino e que constituem o material bsico de anlise. A metodologia e forma de implementao das anlises ento detalhadamente apresentada, finalizando o captulo.
satisfatrio do trato vocal, til tambm principalmente em aplicaes para voz entretanto, sofrem do mal da gerao explosiva de dados na anlise.
[61; 64, p.16 e 436]

. Ambos,

69

4 ANLISE EM MULTIRESOLUO DE GESTOS MUSICAIS COM WAVELETS

A idia de se separar sinais, eventos snicos de identidade prpria, reconhecer e isolar componentes elementares formadores e outras classes de eventos constituintes de um material sonoro utilizando-se wavelets no nova. Evangelista (1993) introduziu uma nova representao wavelet baseada numa representao vetorial pitch-sncrona, permitindo identificar e separar os segmentos pseudo-peridicos e aperidicos do sinal de voz ou msica, e servindo extrao de padres, separao da voz do rudo em consonantes vocais, e compresso de dados. Ele ilustra esta caracterstica do processamento com wavelets decompondo a palavra Susan em nveis de resolues diferentes, e mostra como possvel separar o rudo fricativo dos componentes vocais associados a consonante voclica /z/. No mesmo exemplo, observa a concentrao de informao a nvel silbico num nvel especfico, e a concentrao de componentes fricativos nas escalas menores. Num outro exemplo ele separa o rudo do arco das vibraes harmnicas do som de um violino, e relata outras experincias separando parciais representativas do ataque de um instrumento, e componentes inarmnicos. [19] A anlise wavelet em multiresoluo (AWMR) apresenta-se como uma ferramenta adequada para se analisar trechos musicais e isolar componentes constituintes peridicos e aperidicos, como vozes, ataques instrumentais, efeitos expressivos, eventos dinmicos, fraseados e modulaes, separando-os pelos nveis da anlise em multiresoluo. Padres ondulatrios distintos - em cada nvel da anlise - podem estar associados a eventos musicais especficos e que dispem de notao em partitura, o que permite uma parametrizao (ou mapeamento) dos objetos musicais notados em pauta em objetos ondulatrios ou padres snicos presentes nos nveis da anlise.

4.1 Gestos Musicais, padres snicos e nveis wavelets


Pretende-se caracterizar neste trabalho padres snicos associados a gestos musicais expressivos executados em instrumentos acsticos tradicionais. Um bom msico ao executar uma pea musical faz uso de tcnicas de interpretao que o permitem dominar o instrumento e produzir, a partir de atos gestuais executados no instrumento, gestos

70

musicais correspondentes, compreendendo todas as variaes, efeitos e modulaes exigidos para uma correta interpretao da sequncia de notas da pea e necessrios para que se possa transmitir os efeitos dramticos e psicolgicos associados, bem como estabelecer um senso de progresso, sentido de direo ou finalidade. Quando os eventos musicais produzidos possuem uma qualidade expressiva relevante em msica, os gestos musicais correspondentes so ditos expressivos. Na interpretao de um violino a manipulao das cordas pelos dedos e o arraste do arco sobre as cordas - ato controlado pelo punho e brao do violinista - contribuem com os principais gestos fsicos que levaro produo dos mais diversos gestos musicais possveis para este instrumento. Na flauta, o sopro e o dedilhado do instrumentista so os gestos fsicos ativos que vo dirigir a produo dos gestos musicais. O teor de expressividade do gesto musical um componente de difcil julgamento, mas est sem dvida alguma diretamente correlacionado tcnica com que o instrumentista "manipula" o instrumento e explora sua capacidade em produzir eventos musicais. Eventos musicais so construdos de estruturas sonoras menores, objetos snicos ou sons individuais, partes constituintes que se agrupam numa unidade sonora clara e definida. Os objetos snicos elementares podem estar descritos ou contriburem em faixas de frequncia restritas e limitadas, e portanto sero melhor visualizados e identificados em certos nveis wavelets que cubram estas bandas de frequncia. Os eventos musicais que se formam a partir deles, portanto, se distribuem ou concentramse em certos nveis wavelets de uma anlise em multiresoluo, e estaro melhor caracterizados nestas escalas de resoluo.
A PERCEPO DE OBJETOS SNICOS

A identificao de uma identidade sonora nova, com propriedades claras e definidas, faz parte do trabalho de construir uma representao auditiva de um evento acstico ou objeto musical real. A construo de uma representao mental sobre eventos acsticos do mundo exterior implica na identificao e segregao dos estmulos acsticos que compartilham propriedades ou qualidades semelhantes, e que nos dizem sobre um mesmo evento musical. [5]

71

A forma como tais estmulos so agrupados pelo sistema nervoso guiar a elaborao de um novo padro percebido. Surgem em decorrncia deste agrupamento propriedades
emergentes antes no atribudas a nenhum dos estmulos ou objetos snicos

individualmente, e que agora passam a caracterizar o novo padro que surge. Normalmente, em percepo, propriedades emergentes constituem-se em descries precisas das propriedades dos objetos (acsticos) em nosso ambiente
[5]

. A correta

associao, fuso ou agrupamento de tais objetos pelo sistema auditivo levar correta representao (ou no) do evento ou objeto acstico real em curso no ambiente externo. O sistema auditivo, assim como o visual, possui um mecanismo sofisticado para elaborar sobre as relaes entre objetos sonoros e a percepo de grupos, progresses, cursos ou sucesses de objetos sonoros (streams) com propriedades caractersticas. A medida deste agrupamento, do grau de relacionamento entre objetos sonoros e da percepo de grupos ou sucesses (streams) objeto de estudo das linhas de pesquisa de Anlise de Cena Auditiva. Bregman (1990) introduz e elabora sistematicamente sobre esta linha de pesquisa em [5].34 A percepo portanto de uma unidade sonora clara e definida depende de como propriedades ou qualidades semelhantes dos sons ou objetos acsticos individuais vo se fundir ou agrupar numa nica representao perceptual, num padro percebido. Em msica, percebemos uma evoluo de padres associados em diferentes escalas, construindo uma representao mais complexa, rica em contedo expressivo e dotada de um senso de direo, um objetivo. Contornos meldicos, frmulas rtmicas, sequncias de timbres, combinaes harmnicas, efeitos, e uma infinidade de gestos musicais nascidos pelas tcnicas de interpretao do(s) msico(s) so exemplos de elementos da Orquestrao em Msica analisveis sob a ptica de padres percebidos. Belkin (1988), tendo visualizado esta correlao, sugere, pois, a construo de uma teoria mista de orquestrao com percepo[3]. Um grande nmero de padres orquestrais organizados segundo uma sequncia temporal sugerem a percepo de progresses e evolues, ou proporcionam uma sensao de destaque, um contraste ou continuidade, e tecem assim uma trama expressiva, envolvente, criando uma
34

Seu livro um verdadeiro tratado sobre o tema, empregando argumentaes de base da psicologia Gestalt e da psicoacstica, e indo mais alm elaborando sobre questes como a integrao sequencial de sons, integrao simultnea de sons, integrao baseada em esquema aprendido (scheme-based

72

representao (mental) emotiva. Por exemplo, sons curtos e percussivos podem ser usados para atrair a ateno ou refresc-la aps um movimento muito longo. Sons que evoluem, como se perfazendo uma contnua avaliao e trazendo um afluxo de informao, podem dar origem a um padro de evoluo. Sons que crescem ou diminuem em intensidade sugerem uma movimentao numa dada direo, uma progresso dinmica. [3]
A INFLUNCIA DA INTERPRETAO SOBRE OS GESTOS MUSICAIS

O sucesso de uma pea musical depender completamente da habilidade do msico em usar plenamente suas tcnicas de interpretao na execuo de fraseados, efeitos, modulaes e outros eventos musicais. Atravs delas, o msico pode fazer uso de ataques repentinos e intensos (staccatos, acentos), pode alterar a intensidade e entonao do som que produz (crescendo, diminuindo, efeitos de entonao e dinmica), pode tocar sequncias de tons continuamente (legatos, portamento,
glissando), em pulsos ou saltos (pizicato, acentos, staccatos), modulados em frequncia

(vibratos) ou alternar tons distintos rapidamente (trinados, trmulos). Esta uma amostra das imensas possibilidades que o intrprete tem sobre a variabilidade na produo de tons e variaes timbrsticas. A maior parte destas possibilidades sonoras acima podem ser representados em notao musical convencional, e constituem para efeitos prticos objetos ou eventos musicais, tratveis luz da musicologia e linguagens musicais associadas, bem como da "linguagem tradicional" em engenharia para representao de sinais (no determinsticos). Dada a intrnseca composio hierrquica destes eventos musicais, construdos de objetos snicos menores com propriedades frequenciais e delimitados em intervalos temporais finitos, a anlise wavelet em multiresoluo prov o arcabouo ideal para segreg-los e investigar as regras que regem sua construo. Faria (1996) aborda a anlise de eventos musicais associados a tcnicas de interpretao de instrumentos acsticos reais, e a emergncia da qualidade de expressividade e realismo em padres snicos visveis em diferentes nveis de resoluo numa anlise wavelet. [21]

integration: a influncia da cultura e do conhecimento adquirido sobre a percepo auditiva), a organizao auditiva na msica e na percepo de voz.

73

4.2 Anlise de gestos musicais em partes de flauta e violino


Inspirado pelos trabalhos em acstica j citados anteriormente, realizou-se no presente a implementao de uma anlise wavelet em multiresoluo (AWMR) para investigar a capacidade de segregao e a distribuio de eventos musicais - em particular, gestos
musicais expressivos associados a tcnicas de interpretao tradicionais para flauta e violino - em nveis/escalas de resoluo diferentes gerados por este tipo de anlise. A

anlise proposta para este trabalho no pretendeu o levantamento e a caracterizao formal completa de um mapeamento deste tipo, objetivo este que solicita uma investigao mais complexa e abrangente, e possivelmente o emprego de tcnicas complementares, como os pacotes de wavelets (wavelet-packets) e teorias de percepo cognitiva, sendo portanto alvo cabvel de um trabalho futuro mais extenso.

4.2.1 Seleo do material sonoro para anlise

SELEO DE EVENTOS MUSICAIS

Dadas as peculiaridades de cada instrumento, alguns eventos musicais se aplicam a um e no a outro, em funo das tcnicas de interpretao completamente diferentes que empregam. Todavia, uma grande classe de eventos discernveis e executveis em um podem ser executadas no outro, de forma diferente mas produzindo um efeito musical semelhante. Existem praticamente uma infinidade de eventos, fraseados, modulaes e efeitos produzveis por estes instrumentos, entre os quais foram selecionados um grupo de grande importncia expressiva e intenso emprego, tanto na msica sinfnica quanto nos estilos contemporneos e populares. Abordou-se os seguintes eventos musicais, discriminados na classificao abaixo:

74

Tabela 1 - Eventos musicais abordados

Eventos Musicais
Ataques (notas individuais) Normais Expressivos

Classificao
com acentos com staccatos com spiccatos normais com acentos com trmulos normais com acentos com staccatos com trmulos

Fraseados

Ligados (legato)

No ligados (non legato)

Sustentao

com dinmica com vibrato com frulato com trinado

Previamente s anlises destes eventos, necessrio introduzi-los de forma a familiarizar o leitor com a terminologia, com sua notao convencional em msica e, principalmente, com a descrio dos gestos musicais, sua fisiologia de produo pelo intrprete e o sentido musical que transmitem. o que se faz a seguir.

Ataques (notas individuais)

Anlise dos ataques de notas individuais emitidas fora de um contexto meldico, geralmente no associadas a uma sequncia ou agrupamento de notas/tons definidos como ocorreria em uma progresso ou num tema musical. Duas classes de ataques foram abordadas: os normais e os expressivos.
Normais

Ataques normais so tocados em condies normais de interpretao, sem emprego de dinmicas especiais, efeitos ou modulaes.
Expressivos Acentos

So ataques realizados com gestos intensos. Leva-se em considerao a dinmica da nota (intensidade). Acentos fazem mais sentido num

75

aspecto musical, dentro de uma hierarquia de valores (dinmica) do que no aspecto tcnico (da tcnica de interpretao) por si s. O fato de os ataques acentuados serem obtidos por meio de gestos usualmente sbitos e energticos influenciam na conformao de outros aspectos e propriedades dos tons produzidos, como na forma da onda, na taxa de subida (taxa de variao de intensidade no tempo), na "colorao tonal" (expressa pela riqueza e variabilidade do espectro na regio do ataque) e na qualidade do timbre por toda a durao da nota, uma vez que um padro acentuado exercer influncia no s sobre o incio da nota, mas tambm nos segmentos seguintes do envelope, como a regio de sustentao e colapso. Para o violino foram analisados acentos do tipo sforzato, uma tcnica para execuo de acentos em violino. Piston (1955) aborda com mais detalhes esta tcnica em
[57]

. Para a flauta, usualmente o acento implica num ataque sbito,

energtico e constante, marcado por um adicional na presso do sopro e por uma focalizao de embocadura que permita que modos de vibrao mais intensos sejam excitados no tubo vibrante.
Staccatos So ataques destacados e pontuais. Fazem sentido como elemento de

articulao no contexto da tcnica de interpretao, influenciando no destaque e na pronncia das notas. Existem dois tipos de staccatos para o violino: o tocado com o arco na corda (aproximado ou apoiado) ou com o arco saltante (tambm conhecido pela palavra italiana spiccato). Existe muito desacordo quanto exata aplicao destes termos, mas felizmente para o compositor ou orquestrador basta a indicao de pontos sobre as notas para referenciar o staccato [57], incluindo sinais de dinmica e outros caso deseje especificar melhor a qualidade da msica a ser interpretada. No tipo saltante (spiccato), em velocidade moderada e nvel de dinmica do piano ao mezzo forte, baixa-se o arco sobre a corda com um movimento semicircular pela metade do arco. O arco ento repica na corda embora seja tambm parcialmente levantando pelo pulso. Em tempo acelerado no ocorre o levantamento do arco, mas sim rpidos movimentos para baixo e para cima dirigidos pelo pulso.

76

Nos staccatos apoiados no se permite que o arco abandone a corda, e o ataque muito veloz, com incio e fim abruptos. O som destes poderia ser imaginado na forma de um bloco, com extremidades quadradas[57]. Alguns autores, como Piston
[57]

, consideram a tcnica de martel (martellato) como sendo um staccato

apoiado. Alguns instrumentistas consideram ainda o martel um tipo de acento,

dado o destaque e a dinmica envolvidos35. H ainda outros tipos de staccatos, como o staccato ligado que deve ser realizado com o arco saltante, com paradas bem pronunciadas e abruptas pelo pulso, e uma infinidade de combinaes possveis. Para a flauta, os staccatos so realizados por movimentos rpidos de retrao e avano da lngua sobre a parte posterior dos incisivos superiores, o que produz chaveamentos rpidos, sbitos e destacados no fluxo de sopro. Quanto melhor a tcnica de articulao do intrprete, tanto melhor a qualidade do staccato.

Fraseados

Fraseados so eventos musicais combinados (em sequncia ou simultneos) que produzem algum efeito psicolgico, perceptual ou atingem um objetivo musical em conjunto, e no separadamente. Os eventos musicais so ditos formarem uma frase, um arranjo que alcana - assim como na formao de frases e sentenas a partir de vocbulos individuais - um nvel de "complexidade informacional" mais alto, transmitindo uma identidade informativa nova, com propriedades emergentes associadas. Existem frases ligadas (legato, em italiano) e no ligadas (non legato). Nos fraseados ligados o movimento do arco contnuo e encampa todas as notas ligadas. Nos no ligados geralmente h uma mudana no sentido do arco para cada nota do fraseado. O que se deseja estudar nas anlises de fraseados como se d a conexo entre os vocbulos simples, isto , como so as transies entre as notas individuais que formam a frase. Estas ligaes sero diferentes nos fraseados ligados e no ligados.

35

Comunicaes pessoais ouvidas de alguns violinistas.

77

Ligado (legato) normal

passagens onde as notas numa composio meldica so interpretadas sem empregar acentos, modulaes ou efeitos especiais. Para o violino existem dois tipos especiais de fraseados ligados: o portamento e o glissando. A fronteira entre ambos estreita e suscetvel de ambiguidade em alguns casos.

A Figura 21 abaixo ilustra frases ligadas normais. A primeira ( esquerda) consiste num trecho de 4 notas (de mesma durao) tocadas em sequncia. A segunda ( direita) mostra um trecho com duas mnimas ligadas - um l3 (A3) seguido por um d4 (C4) - havendo indicaes de uma variao de dinmica (a segunda nota sob interpretao fortssimo) e para que a frase seja sempre ligada.36
Figura 21 - Exemplos de Fraseados Ligados Normais

O glissando consiste numa mudana contnua no tom (pitch) de uma nota a outra, deslizando-se o dedo pela corda da altura de uma nota altura da outra sob arco contnuo, e com isso soando todos os pitchs intermedirios entre elas.37 O pitch varia aproximadamente linearmente no tempo, a curva exata de variao estando fortemente correlacionada curva de velocidade do deslize do dedo sobre a corda.
Figura 22 - Exemplo de notao em partitura de um portamento e/ou glissando

36

Nesta seo algumas partituras sero introduzidas para ilustrar a notao em Msica para os eventos sob descrio. As partituras mais simples na msica ocidental consistem de uma pauta com 5 linhas onde so escritas as notas musicais. A clave, smbolo no incio da pauta, indica o registro (altura em frequncia) para o qual est se escrevendo. Para flauta e violinos o registro tpico o da clave de sol ( ). Adicionalmente notaes perifricas pauta exprimem aspectos dinmicos, suprem informaes quanto a gestos especficos, articulaes e outros atos para guiar a interpretao. O glissando uma tcnica mais natural nos instrumentos de corda, embora na 1a metade do sculo XIX fosse popular na Inglaterra e Alemanha para a flauta. Na Inglaterra Vitoriana havia tambm uma tcnica de glissando para flauta, conhecida como "rush": uma combinao de pitch bending com o vagaroso alar dos dedos, em desuso atualmente. (informaes do FAQ -Frequently Asked Questions- da FLUTE list, do servidor de listas listserv.syr.edu).

37

78

O portamento tambm consiste numa transio contnua entre duas notas, mas com a inteno de prover uma maneira elaborada de conectar os tons meldicos ligados, sem no entanto considerar a cobertura de todo o intervalo. Assim, o portamento pode associar um glissando veloz e mais objetivo no incio - sem a inteno de conferir expressividade durante a transio, mas simplesmente levando o dedo de uma posio a outra sem interromper o som ligado- e um pequeno salto j prximo da segunda nota. executado principalmente quando o fraseado exige uma mudana de posio (empunhadura e dedilhado) ou quando a composio assim o determina especificamente para fins expressivos. O glissando, pelo maior impacto expressivo que imprime, foi escolhido para efeito de anlise neste trabalho (veja partitura ilustrativa acima, Figura 22).
acentuado passagens onde as notas so interpretadas empregando-se algum tipo

de acentuao, como nos acentos j abordados em Ataques (notas individuais) anteriormente, mas atentando-se ao fato de que agora eles so executados num contexto meldico, sobre uma frase. Oportunamente ser discutido a diferena entre notas soltas ou individuais daquelas imersas num contexto fraseado.
trmulo dedilhado (flauta) O trmulo consiste na repetio rpida de uma nota

dentro do seu tempo, ou a alternncia entre 2 notas (de intervalo harmnico normalmente maior que um tom, ou uma segunda maior) dentro do tempo de uma delas, numa velocidade estipulada ou no (tremulando). [57]
Figura 23 - Ilustrao das notaes usuais para o trmulo alternncia entre duas notas

repetio da mesma nota

O trmulo dedilhado em flautas consiste na execuo de duas notas no tempo de uma, e pode ser ligado, quando executado num sopro contnuo dando origem a um fraseado do tipo ligado, ou no ligado, quando h interrupo no sopro entre cada nota. O trmulo ligado, aqui abordado, possui uma qualidade diferente daquele interpretado sem ligaduras, e por envolver a excitao de dois tons diferentes

79

distantes de um tom ou mais de forma contnua implica numa interpretao mais difcil.
No Ligado (non legato) normal

passagens onde as notas numa composio meldica so interpretadas sem empregar acentos, modulaes ou efeitos especiais, em condies normais de interpretao. Para a flauta a transio no ligada baseia-se na interrupo do fluxo de sopro a cada nota. Para o violino um alternncia no sentido do arco esperada a cada nota.

acentuados

frases (no ligadas) com acentos.

staccatos staccato normal para flauta e spiccatos para o violino


Figura 24 - Ilustrao de uma melodia contendo frases no ligadas com staccatos e acentos

trmulo dedilhado (flauta) alternncia rpida entre duas notas excedendo

intervalo maior que um tom, sem ligaduras (sopro contnuo)


trmulo de arco (violino)

quando o trmulo entre duas notas que esto alm

do alcance do dedo, faz-se necessrio o uso de 2 cordas para executlo, e o arco deve portanto atuar sobre as duas cordas alternadamente. Muito utilizado tambm quando o propsito do trmulo a repetio
iterada da mesma nota dentro do tempo de uma, novamente o arco

sendo crucial em realizar os ataques velozes de cada iterao, alternando o sentido em cada movimento de descida agora sobre uma mesma corda. O exemplo abordado para anlise consta da repetio iterada da mesma nota.

80

Sustentao Com dinmica

com crescendo (cresc.) e/ou diminuindo (decresc.), isto , com

uma variao na intensidade (magnitude ou amplitude) da(s) nota(s) tocada(s) durante a execuo38. A figura abaixo ilustra a notao usual.

Com vibratos

O vibrato no violino o resultado de uma combinao de

impulsos dos msculos da mo, pulso e brao, e seu efeito o de uma oscilao no pitch da nota quase imperceptvel. aplicado em todas as notas, exceto as de curta durao, e no necessita indicao para seu uso. Entretanto, quando deseja-se suprimir o vibrato indica-se com o termo italiano senza vibrato [57]. Fisicamente, o vibrato pode ser definido como uma baixa modulao de frequncia por volta de 6 Hz em uma extenso inferior a 1%. [61] Para a flauta o vibrato consiste mais numa modulao de amplitude aplicada por uma variao na presso de sopro e/ou na embocadura, esta ltima podendo provocar tambm alguma flutuao de frequncia.39
Com trinados

Alternncia

rpida

entre

notas

adjacentes,

obtida

pelo

chaveamento veloz no dedilhado.40


Com frulatos (flauta)

Considerado um trmulo especial em instrumentos de

sopro, consiste numa repetio muito rpida da(s) nota(s) tocada(s) obtida modulando-se o fluxo de ar pela vibrao da lngua, como na
38

Existe uma gradao ou escala de intensidade cujos nveis so representados por combinaes das letras p (piano ou fraco) e f (forte). Uma gradao usual, do menos intenso ao mais intenso, : ppp, pp, p, mp, mf, f, ff, fff. O smbolo ">" indica uma queda gradal na dinmica, e "<", um aumento gradual.

39

O vibrato na flauta uma tcnica que se popularizou no sculo XX. O sculo XIX no faz muitas menes ao vibrato, exceto pelo vibrato de dedilhado. (informaes do FAQ -Frequently Asked Questions- da FLUTE list, do servidor de listas listserv.syr.edu).dois Comear o trinado pela nota auxiliar mais alta (em pitch) era mais comum do que come-lo pela nota principal, pelo menos at aproximadamente 1830. O trinado uma tcnica que pode ter seu estilo varivel segundo a poca. No sistema de trinados para flauta do Sculo XIX, alguns trinados eram estreitos e entediantes, em contraste com os trinados vivos e largos nas flautas barrocas. (informaes do FAQ -Frequently Asked Questions- da FLUTE list, do servidor de listas listserv.syr.edu)

40

81

pronncia de um r. Uma sequncia de ataques reincidentes ento impressa s notas sobre frulato. Efeito mais destacado na flauta entre os instrumentos de sopro. [57]

4.2.2 Metodologia e implementao da anlise das amostras


Este trabalho fundamenta-se em dois mdulos bsicos, um terico - cuja contribuio est na abordagem teoria wavelet e tcnica de anlise e sntese em computao musical - e um experimental, que consiste na anlise em multiresoluo de gestos musicais em timbres instrumentais empregando a transformada wavelet. O tema central a transformada wavelet como ferramenta de anlise de sinais musicais, e a aplicao proposta a anlise de timbres instrumentais objetivando a caracterizao de gestos musicais e padres snicos associados s tcnicas de interpretao instrumental. O procedimento no mdulo terico incluiu:
uma introduo rea de computao musical, aos timbres musicais de dois

instrumentos acsticos tradicionais (flauta e violino), e tcnica de anlise e sntese;


uma abordagem introdutria teoria wavelet, suas aplicaes em processamento

de sinais e outras reas;


uma abordagem anlise em multiresoluo com wavelets e sua implementao

discreta atravs de bancos de filtros;


uma abordagem conceitual aos gestos musicais, fraseados e modulaes

associadas a tcnicas de interpretao instrumental;


uma introduo aos algoritmos para decomposio e reconstruo wavelets, e

anlise de timbres em multiresoluo com wavelets. O procedimento utilizado no mdulo experimental consistiu de:
seleo dos instrumentos (timbres), seleo do material sonoro a ser amostrado e

analisado - trechos musicais contendo ataques, fraseados e efeitos de sustentao, e uma breve descrio destes eventos e gestos musicais;
gravao e preparao das amostras (trechos musicais);

82

descrio da plataforma computacional, apresentao dos algoritmos de

decomposio (pacote de software) e das bases wavelets empregadas;


implementao da anlise das amostras (trechos musicais); anlise e discusso dos resultados.

A flauta foi escolhida por ser um instrumento extremamente difundido e polivalente, empregado em inmeros estilos e modalidades musicais, nas orquestras sinfnicas, nas danas e cortejos, no rock, na new age, na msica erudita contempornea, na msica popular dos pases europeus, no norte da frica, sul da sia, pelos povos indgenas das Amricas, e tambm aclamado na msica orquestral brasileira - presente no trabalho de expoentes como Carlos Gomes e Villa Lobos entre outros- assim como -no poderia deixar de ser- na msica popular brasileira, onde ecoa sonora na voz de inmeros maxixes, choros, sambas, na bossa nova, e no rock brasileiro. um instrumento de origem muito antiga, presente em vrias sociedades desde a pr-histria, de timbre essencialmente harmnico, meldico e alvissareiro. A condio de ser eu prprio um instrumentista, buscando caracterizar nuanas das tcnicas de interpretao em flauta, vem se somar a estes motivos no peso da escolha. O violino, instrumento de origem na Europa do sculo XVII, considerado o mais importante dos instrumentos de cordas. Tradicionalmente empregado em orquestras sinfnicas e de cmaras, restrito a crculos nobres, foi progressivamente incorporado a outros estilos neste sculo, e com o advento dos captadores eltricos a tecnologia musical ganhou terreno em novos estilos musicais, incluindo a o rock e a msica eletroacstica. O apogeu do artfice do instrumento, entretanto, foi atingido nos sculos XVII e XVIII, nas mos de importantes luthiers, e desta poca datam os melhores instrumentos fabricados, at hoje no ultrapassados. A escolha por ele recai naturalmente no interesse em verificar a influncia dos gestos musicais e tcnicas de arco sobre a qualidade do som emitido. A metodologia adotada para a gravao e preparao das amostras de trechos musicais contendo os eventos/gestos a estudar descrita a seguir: Foram escolhidos trechos musicais que contivessem os eventos e gestos musicais objetos de anlise (sumariados na tabela de eventos musicais, no item 4.2.1, e ilustrados no item 5.1, Figura 32 e Figura 33). A gravao foi realizada no estdio do

83

Departamento de Cinema, Rdio e Televiso, da Escola de Comunicao e Artes da USP. Apesar de seu condicionamento acstico orientado para as atividades sonoras deste departamento, e no propriamente para fins musicais, o estdio forneceu o isolamento acstico mnimo necessrio para uma boa gravao. O equipamento de gravao empregado foi um DAT (Digital Audio Tape recorder) marca TEAC, modelo DA-P20. O microfone utilizado foi um Neuman, modelo MKH 416 P 48 U, com resposta de frequncia de 40 a 20000 Hz, caracterstica direcional supercardiide. A gravao foi realizada com 48 KHz de taxa de amostragem (fa), palavra digital com resoluo de 16 bits por amostra. A preparao das amostras para anlise em computador a partir da gravao em DAT envolveu as seguintes etapas:
Transporte da gravao de udio digital serial em fita magntica para meio de

armazenamento em disco rgido, realizada numa estao Indy, da Silicon


Graphics;

converso do udio em DAT estreo 48 KHz para arquivos em formato AIF

mono 44,1 KHz de taxa de amostragem, realizada numa estao Indy, da


Silicon Graphics e tambm num PC Pentium 100 MHz;

segmentao e edio dos arquivos, para isolar os eventos musicais em arquivos

AIF individuais menores, realizada numa Indy e em PC;


normalizao de amplitude, realizada em parte numa estao Indy, rodando o

aplicativo SoundEditor ou MediaConvert, e em parte num PC rodando o aplicativo CoolEdit;41


converso dos arquivos do formato AIF para formato MATLAB, utilizando-se o

aplicativo Goldwave, em PC Pentium 100 MHz;


normalizao da extenso dos arquivos para valores em potncia de 2. Duas

tcnicas foram utilizadas com esse objetivo:


a prvia produo e edio do arquivo AIF (ou MAT) para uma extenso

(nmero de amostras digitais ou pontos) exatamente em potncia de dois, empregada principalmente quando o arquivo original excedia levemente em
SoundEditor um aplicativo (software) para edio e processamento bsico de udio digital da Silicon Graphics. CoolEdit (http://www.syntrillium.com) e GoldWave (http://web.cs.mun.ca/~chris3/goldwave/) so aplicativos shareware (disponveis na Internet) para edio e processamento simples de udio digital em PC's.
41

84

extenso uma potncia de dois prxima, ou quando o evento musical em questo podia ser isolado dentro de uma exata extenso em potncia de dois, com as bordas do sinal (incio e fim) nulas ou prximas de zero;
a tcnica de acolchoamento por zeros (zero padding) at atingir-se a

extenso da potncia de dois superior mais prxima, adicionando pontos nulos (zeros) ao incio e ao fim da amostra (trecho musical editado). A Figura 25 abaixo ilustra estas etapas de gravao e preparo das amostras musicais para anlise:
Figura 25 - Gravao e preparao das amostras contendo os eventos musicais para anlise

Trechos/partes musicais com eventos/gestos

Interpretao Instrumental (flauta e violino)

Gravao digital (amostragem) em DAT

Transporte para disco rgido (em computador)

Normalizao de amplitude

Segmentao, edio e isolamento dos eventos

Converso de taxa de amostragem e nmero de canais

44 KHz/mono

48 KHz/estreo

Converso para formato MATLAB aif mat

Normalizao de extenso

Amostras finais prontas p/ anlise

O procedimento para as anlises das amostras (arquivos com eventos musicais) incluiu:
decomposio wavelet de cada amostra em multinveis, utilizando as rotinas

ortogonais do pacote WaveLab para MATLAB, desenvolvido na Universidade de Stanford;


a anlise grfica e sonora dos sinais em cada nvel da decomposio em

multiresoluo, observando o padro de presena e a concentrao do evento musical em cada nvel analisado;
identificao grfica e sonora de padres (objetos) correspondentes aos eventos

musicais analisados nos nveis;

85

verificao do isolamento e da distribuio dos eventos por nveis wavelets,

avaliando a energia de cada nvel, os padres de distribuio grficos e o contedo sonoro dos nveis;
eventuais anlises espectrais complementares como ferramenta auxiliar; discusso dos resultados e fenmenos observados.

4.2.2.1 Descrio do Sistema de Anlise Wavelet


O diagrama geral do sistema de anlise implementado est esquematizado na Figura 26 abaixo. Os eventos musicais de interesse, j editados, normalizados e armazenados em sinais digitais segundo o procedimento ilustrado na Figura 25, so os sinais de entrada. O algoritmo computacional de decomposio wavelet utiliza um banco de filtros e operadores de decimao arranjados sucessivamente num esquema piramidal (rvore de filtros), como introduzido no item 2.5.1. Os sinais de sada so os sinais em cada nvel
wavelet, isto , as projees do sinal original em cada nvel da anlise em

multiresoluo.
Figura 26 - Diagrama de blocos geral do sistema para anlise de eventos musicais

nvel WJ-1 - Nvel wavelet mais fino nvel WJ-2 - Segundo nvel mais fino

sinal musical (amostras preparadas)

Anlise Wavelet em Multiresoluo

nvel WJ-3 - Terceiro nvel mais fino

nvel W1 - Segundo nvel mais grosso nvel W0 - Nvel wavelet mais grosso nvel V0

projees do sinal musical por nveis wavelet

No topo da rvore de decomposio, o algoritmo toma os sinais de entrada como


coeficientes de escalamento cJ,k na escala mais fina possvel: a original, ao nvel J. O

86

processamento comea a partir da, gerando todos os coeficientes cj,k at o nvel mais baixo de resoluo: o nvel mais grosso (ou menos fino), em j=0. Se, por exemplo, o vetor de entrada tem extenso N=23, isto c3,k possui oito elementos no nvel mais fino J=3; o prximo nvel (j=2, o nvel wavelet mais fino) ter 4 coeficientes (d2,k), o nvel seguinte j=1 ter 2 elementos (d1,k), e o nvel mais baixo de resoluo - j=0 - ter 1 coeficiente wavelet (d0,0 do nvel wavelet menos fino) e 1 coeficiente de escalamento c0,0, resduo final do iterado processo de suavizao, na verdade uma figura representativa da mdia de todos os coeficientes originais. Na decomposio so gerados coeficientes wavelets para os nveis wavelets (Wj) em escalas sucessivas, numa razo de escalamento 2, isto , em oitavas. Cada nvel de coeficientes possui a metade do nmero de amostras do nvel anterior resultado do processo iterado de decimao. O nmero de coeficientes gerados ao final da transformao igual ao nmero de amostras (elementos) do vetor de entrada.
Figura 27 - Decomposio do sinal musical f(n) em coeficientes wavelet dj,k na rvore de filtros H (2)

cJ,k = f(n) , no

nvel J

cJ,k

H (2)

cJ-1,k

H (2)

cJ-2,k

cJ-3,k ...

G (2) G (2)

dJ-3,k ...

G (2)
Coeficientes wavelet de f(n) no nvel J-1 (o nvel wavelet mais fino)

dJ-2,k

dJ-1,k

(o segundo nvel wavelet mais fino)

direo do processamento

Os coeficientes wavelet gerados nesta decomposio no correspondem propriamente s projees do sinal original em cada nvel de resoluo. Estas so geradas realizando-se uma sntese, o processamento inverso, considerando um nvel de coeficientes por vez, zerando-se todos os outros. Assim, para gerar a projeo do sinal no nvel j, considerase os coeficientes wavelet calculados no nvel j (dj,k) e perfaz-se uma sntese trafegando a rvore em sentido inverso, at obter-se um sinal no nvel original J. Este novo sinal, gerado somente a partir das informaes do nvel j, a projeo do sinal original naquele nvel de resoluo (veja Figura 28 abaixo). Este procedimento utilizado para gerar todos os nveis da anlise em multiresoluo, os sinais de sada da Figura 26.

87

Figura 28 - Gerao do sinal no nvel wavelet p : a projeo de f(n) no nvel wavelet Wp

Coeficientes wavelet de f(n) no nvel p

0 dJ-1,k

dp,k
(2)G (2)H

(2)G (2)H

(2)G (2)H

... dj,k ... cj,k

cp+1,k ...

cJ,k = fp (n)

cj+1,k .......

cp,k

direo do processamento

O sistema de anlise wavelet em multiresoluo (AWMR) acima foi totalmente implementado em plataforma computacional MATLAB. Os sinais de entrada foram convertidos em vetores no formato MAT. Os sinais de sada, tambm vetores em formato MAT, foram analisados grfica e sonicamente utilizando-se o prprio ambiente MATLAB, algumas rotinas desenvolvidas para avaliar o contedo energtico e espectral de cada nvel, e programas editores, processadores e reprodutores de udio digital em plataforma PC, como o CoolEdit e GoldWave, este ltimo capaz de ler arquivos sonoros em formato MAT.
IMPLEMENTAO ALGORTMICA

Os algoritmos de decomposio, de gerao das aproximaes do sinal em cada nvel Wj, e de reconstruo wavelet que foram empregados tm origem nas rotinas do pacote computacional WaveLab, desenvolvidos para a plataforma computacional para processamento de sinais MATLAB, e de domnio pblico, acessveis na Internet.
WAVELAB

WaveLab uma biblioteca de rotinas MATLAB para anlise wavelet, para anlise com pacotes de wavelets (wavelet-packet analysis), para anlise com pacotes de cossenos e busca de casamento (matching pursuit)
[6]

. Sua biblioteca rene ao todo mais de 800

arquivos de extenso .m (em linguagem MATLAB), documentados e interreferenciados de vrias formas. Vrias pesquisadores contriburam e contribuem no desenvolvimento deste software, entre eles Jonathan Buckheit, Shaobing Chen e David Donoho, da Universidade de Stanford. O software est disponvel atravs de FTP para Stanford no endereo fpt://playfair.stanford.edu/pub/wavelab. sua equipe de desenvolvimento.
[6]

Uma cpia da verso 0.701 est inclusa no CD-ROM anexo, gentilmente cedida pela

88

As rotinas esto codificadas em linguagem MATLAB, o que possibilita o trabalho de leitura e compreenso da implementao algortmica, e sua modificao para fins especficos, adaptando-as s necessidades do trabalho em questo. Desta forma desenvolveu-se um conjunto de rotinas alternativas, melhor adaptadas s tarefas de anlise dos sinais musicais, assim como uma interface de comandos grfica sobre o MATLAB, que incorporasse as funes do WaveLab juntamente com uma srie de outros comandos orientados a tarefas especficas de configurao de parmetros, entrada e sada de dados. Rotinas originais do WaveLab foram reescritas e suas funes modularizadas visando a focalizar o servio reduzindo o nmero de operaes a um ncleo mnimo. O impacto mais importante foi na reduo do custo computacional do processamento na decomposio, na gerao de figuras e nas tarefas de ressntese seletiva42. Rotinas de visualizao grfica foram incrementadas tal que possibilitassem a plotagem de cada nvel sob anlise numa escala conveniente e numa janela (na tela do computador) especfica. Outras, para reproduo e gravao de udio, foram criadas atendendo s demandas da anlise snica. As operaes de decomposio e reconstruo wavelet baseiam-se nas rotinas ortogonais do WaveLab, localizadas nos seus diretrios \ortho e \ortho.1, especialmente as rotinas fwt_po.m (forward wavelet transform, periodized,
orthogonal) e iwt_po.m (inverse wavelet transform, periodized, orthogonal), que

implementam a transformada direta e inversa, respectivamente.


DESCRIO DA INTERFACE GRFICA, FUNES E CDIGOS DESENVOLVIDOS

Uma interface grfica para MATLAB foi desenvolvida para se sistematizar e agilizar o trabalho de anlise, provendo um painel de comandos orientado s funes (tarefas) de configurao de parmetros para a anlise constantemente empregadas. A rotina que gera a interface grfica e as janelas diferenciadas para plotagem grfica dos nveis, coeficientes, reconstrues seletivas e mixagens intrface.m, e seu cdigo fonte est disponvel no CD-ROM e no disquete anexos, juntamente com todas as outras rotinas desenvolvidas e/ou incrementadas.

42

A reconstruo ou ressntese seletiva ser abordada no item anlise snica, logo adiante.

89

O conjunto de todas elas forma um pacote novo, que se nomeou Wavesynt - uma
contribuio em software deste trabalho, para a anlise wavelet em multiresoluo de sinais musicais - e que roda sobre o MATLAB utilizando-se do WaveLab previamente

instalado. A Figura 29 abaixo mostra a janela de comandos principal (ou interface mestre) do
Wavesynt na sua atual verso, indicando os botes, campos numricos disponveis e

respectivas funes:
Figura 29 - Interface grfica desenvolvida sobre MATLAB: janela de comandos

1 2 3 4 5 6 7 8 9 10 11 16

21

18

19 20

17 15

12

13

14 2 Seleo de nvel mais grosso 4 Grfico de todos os nveis da anlise wavelet em multiresoluo (AWMR) 6 Sonorizao do nvel selecionado 8 Seleo e plotagem dos coeficientes de nvel especfico 10 Sonorizao do sinal original 12 Gerador de figura com todos os grficos de todos os nveis da AWMR 14 Carregar arquivo selecionado 16 Sonorizao da reconstruo 18 Editor de pesos para reconstruo e mixagem 20 Seleo via boto deslizante para o peso do nvel

1 Seleo da wavelet 3 Decomposio wavelet (gerao de coeficientes wavelet para todos os nveis da anlise) 5 Seleo e plotagem de nvel especfico da AWMR 7 Grfico dos coeficientes por nvel 9 Sonorizao dos coeficientes do nvel selecionado 11 Seleo de nome de arquivo para entrada e sada (arquivos com extenso .MAT) 13 Normalizao em extenso do vetor de entrada (sinal original) 15 Sonorizao da mixagem 17 Mixador de nveis 19 Seleo numrica para o peso do nvel 21 Reconstrutor de nveis

90

Os objetivos imediatos da interface foram otimizar:


a entrada de dados (os arquivos sonoros contendo as amostras musicais); a escolha da wavelet de anlise; a escolha do nvel mais grosso para a anlise (usualmente o nvel 0); a sada de dados; a audio dos sinais;

bem como facilitar a programao de parmetros extras, como as escalas para plotagem. Foram implementadas:
funes para decomposio e plotagem de todos os nveis da anlise funes para gerao de cada nvel e clculo de sua energia funo de reconstruo seletiva (ressntese), com paleta para edio dos pesos de

cada nvel
funo misturadora, para mixar diretamente os sons dos nveis funes para impresso dos nveis da anlise em arquivo, em formato grfico.

Tanto o WaveLab quanto o Wavesynt so facilmente instalveis em qualquer plataforma onde rode o MATLAB. O Wavesynt abordado nos apndices, e informaes tcnicas mais detalhadas sobre ele e sobre o WaveLab esto disponveis no CD-ROM em anexo.
SELEO DAS BASES WAVELETS

Wavelets

diferentes

levam

representaes

diferentes

do

sinal

analisado.

Consequentemente, a separao de padres snicos (confinamento dos eventos musicais em nveis de resolues diferentes) pode ser melhor verificada e destacada para algumas bases especficas. Selecionou-se um grupo amostral de famlias wavelets para avaliar qual dentre elas exibia melhor desempenho na tarefa de segregao de componentes e estudar a textura e caractersticas dos nveis wavelets produzidos por elas, com a finalidade de se selecionar a(s) base(s) a ser adotada para a consecuo das anlises propostas. A seleo das wavelets traz tambm um impacto sobre a eficincia e a estabilidade computacional dos algoritmos de decomposio e reconstruo; sobre a obteno de representaes no redundantes e vrias taxas de compresso; sobre a suavidade e continuidade das representaes transformadas (as aproximaes do sinal original em

91

cada escala), e sobre a resoluo da localizao temporal e frequencial [55]. Wavelets so frequentemente classificadas em famlias pelo nmero de momentos nulos que possuem
[26]

. A regularidade e suavidade das wavelets esto associadas com este parmetro, que

tambm influencia na localizao em frequncia e na convergncia das aproximaes.


[55]

As seguintes famlias de bases foram avaliadas [6; 13; 69; 84; 88]:
Daubechies (D4, D8, D12, D16) Coiflets (C2, C4) Beylkin Simlets

Verificaram-se diferenas significativas entre wavelets de uma mesma famlia com nmero de momentos diferentes. As wavelets mais regulares propiciaram uma melhor sintonia da janela de anlise, isolando melhor faixas de frequncias por nveis. Isto se deve pelas caractersticas dos filtros associados (do banco de filtros) que possuem um decaimento mais pronunciado nas zonas de corte, levando a uma melhor localizao em frequncia das wavelets correspondentes. Isto pode ser verificado pela inspeo dos espectros cobertos por exemplo pelas
wavelets D4 e D16, como mostrados na Figura 9 (item 2.2, pgina 32). A cobertura da

D16 mais localizada ou sintonizada, exibindo uma banda (passante) principal mais intensa, as bandas secundrias bem mais atenuadas que as da D4. Isto conduz a uma menor supercobertura, ou redundncia na representao frequencial. O resultado prtico desse atributo est na simplificao do contedo espectral dos nveis wavelets gerados na anlise, que cobrem faixas mais localizadas de frequncias, acabam por isolar melhor alguns componentes em nveis diferentes, e propiciam uma textura sonora mais aveludada, um som menos spero. Foi realizado um experimento comparativo de desempenho para qualificar atributos diferentes gerados na anlise de um evento musical de sustentao com variaes de dinmica em violino com as wavelets ortogonais D4, Simlet4, Coiflet2, Beylkin e Vaidyanathan43. A textura sonora revelou-se levemente diferente entre elas, com exceo de D4, que reproduziu sons mais speros nos nveis mais finos. Os envelopes e
43

Note que D4 possui somente 2 momentos nulos, ao passo que Coiflet2 e Simlet4 possuem 4 momentos nulos.

92

formas de onda produzidos pela Simlet4 mostraram-se mais regulares e menos ruidosos que com D4. Coiflet2 produziu nveis com formas de onda semelhantes a Simlet4. Beylkin realou alguns picos em algumas formas de onda mais que Simlet4. D4 revelou formas de onda mais ruidosas, menos identificadas com as formas de onda original (para o nvel 10 da anlise). As rpidas concluses que extraem-se deste e outros experimentos facilmente implementveis com a interface grfica so que:
entre as wavelets ortogonais comparadas de mesmo nmero de momentos nulos, isto

, mesmo grau de regularidade e suavidade, as formas de onda dos nveis so semelhantes;


pequenas variaes de cobertura em frequncia levam a um realce de alguns objetos

em alguns nveis (com componentes espectrais sob as bandas passantes);


a cobertura espetral das wavelets ortogonais comparadas de mesmo nmero de

momentos nulos bastante similar, levando a representaes aproximadamente idnticas;


o parmetro de maior impacto sobre a qualidade snica dos nveis (para as wavelets

ortogonais comparadas) o nmero de momentos nulos satisfeitos pela wavelet. Estudos mais amplos, que englobassem uma anlise comparativa para um grupo maior de eventos musicais diferentes, provavelmente apontariam concluso de que a escolha da famlia wavelet deveria ser feita em funo do tipo de evento musical que se deseja caracterizar, e que o grau de regularidade seria um parmetro importante na obteno de melhor separao de objetos, suavidade das formas de onda e textura snica. Isto se deve tambm ao fato de que wavelets com formas de onda assemelhadas s formas de onda dos eventos analisados conduzem a representaes mais compactas, com representaes mais precisas deste eventos com menor nmero de coeficientes. [79] No estudo proposto a variabilidade do espao amostral extenso: os eventos musicais que dispusemos a caracterizar exibem variaes e conformaes diferentes tanto no tempo quanto na frequncia. A escolha de muitas variantes de wavelets para casar melhor cada classe de eventos tornaria o estudo muito amplo, alargando substancialmente o espao de variveis a analisar e os resultados. Alm disso no existem trabalhos na literatura que apontem quais wavelets atualmente existentes

93

produzem melhor desempenho analisando classes especficas de eventos. O tema indito. A sada natural recai portanto na escolha de uma famlia nica wavelet a ser empregada em todas as anlises. Os benefcios so bvios: (1) o estabelecimento de uma referncia que possibilite uma avaliao geral da aplicabilidade e do desempenho da wavelet para diversos tipos de eventos, e (2) a simplificao direta na complexidade deste trabalho. A regularidade parmetro decisivo na escolha da wavelet. Ortogonalidade um atributo indispensvel para implementar os algoritmos de gerao dos nveis da anlise em multiresoluo e as ressnteses seletivas (a serem ainda abordadas). A facilidade de implementao e a disseminao na literatura da base wavelet escolhida so outros fatores desejveis. A escolha, baseado nestes aspectos, recai sobre o emprego das
wavelets de Daubechies, em especial a D16 que possui 8 momentos nulos, um grau de

regularidade nem muito baixo e nem extremamente alto, tal que se possa avaliar o desempenho de anlises sob graus de regularidade mdios. Alm disso, com 16 coeficientes no filtro wavelet correspondente, estabelece-se um compromisso entre custo computacional e suavidade na representao. A Figura 30 abaixo mostra a cobertura em frequncia de 6 wavelets D16: 11,0 a 16,0 . Foram plotadas as FFT's de wavelets D16 com extenso de 131072 pontos amostrais de extenso (217), adequadas para anlise de sinais discretos de mesma extenso. Note a semelhana de suas formas de onda quando plotadas em escala logartmica.
Figura 30 - Cobertura em frequncia das wavelets D16:

11,0 a 16,0 (em escala logartmica) 16,0

11,0

94

Vrios textos abordam questes sobre ortogonalidade, biortogonalidade, simetria, suporte compacto, suavidade, regularidade e extenso dos filtros wavelets, analisando vantagens e desvantagens de cada famlia de wavelets em aplicaes especficas. O leitor interessado achar abordagens apropriadas sobre estas questes principalmente em
[13; 35; 47; 55; 78; 84; 88]

, embora quase todos os textos sobre wavelets discutam estes

aspectos.

4.2.2.2 Interpretao Grfica e Snica da Anlise

INTERPRETAO GRFICA

A anlise grfica consiste na interpretao e estudo dos nveis wavelets das anlises: as
representaes grficas bidimensionais de intensidade versus pontos amostrais

(tempo) das projees do sinal original f(n) em cada nvel da anlise em multiresoluo, isto , os sinais fj (n), tambm referenciados simplesmente como os
nveis da anlise. A partir destes grficos proceder-se- interpretao dos sinais em

cada nvel da anlise, avaliando a distribuio e o grau de isolamento dos eventos pelos nveis, gerando-se resultados e concluses. A anlise espectral dos nveis wavelets tambm outra ferramenta suplementar que foi adotada na anlise de alguns dos eventos, para permitir identificar padres harmnicos existentes nos sinais, avaliar as bandas e/ou frequncias mais intensas. A modalidade mais comum adotada foi a anlise esttica via o clculo da FFT do sinal, a qual no fornece informaes sobre a evoluo das frequncias no tempo, mas sim de um panorama geral da composio espectral no trecho analisado. Espectrogramas, que permitem o mapeamento dinmico das frequncias, foram empregados somente na anlise de glissandos, em violino. Os nveis wavelets, em tese, contm informaes confinadas a uma banda limitada do espectro, logo de se esperar que eventos estritamente produzidos por vibraes ou processos ondulatrios regidos por um conjunto finito e limitado de frequncias devam se confinar em alguns nveis, isto , manifestar-se com realce em alguns nveis. Como a partio do espectro no caso da anlise wavelet simples se d em oitavas, havendo uma melhor partio do espectro nas baixas frequncias do que nas altas, os nveis mais

95

finos (bandas largas nas altas frequncias) tm maior probabilidade de confinar padres associados a um maior nmero de eventos e processos vibratrios que participem da mesma (larga) banda de frequncias, e se misturam numa nica forma de onda. A separao dos eventos ento menos trivial. Para os nveis mais baixos entretanto, cobrindo bandas mais estreitas, a confirmao do confinamento de um evento menos difcil. A primeira vista pode parecer ento que uma partio do espectro em oitavas, como feita pela anlise wavelet simples, no seja til na extrao de caractersticas e isolamento de padres, mas exatamente essa segmentao no linear do espectro que prov o diferencial da anlise wavelet sobre as tcnicas de Fourier convencionais, e que serve investigao de inmeras classes de sinais na natureza em dezenas de aplicaes, conforme abordado em itens anteriores. Vale tambm ressaltar que nossos ouvidos, atravs de um sofisticado sistema aperfeioado pela natureza por milhares de anos, perfazem uma anlise dos estmulos acsticos atravs de uma segmentao do espectro semelhante a uma segmentao de uma anlise wavelet, e dela conseguem extrair toda a informao que necessitam para compreender o complexo mundo sonoro ao nosso redor. Esse, entre outros, consiste na principal motivao para se adotar tambm a anlise snica, suplementando a anlise grfica.
INTERPRETAO SNICA

Risset, em seus trabalhos de anlise de timbres, utilizou uma metodologia para investigar a composio harmnica dos timbres, que foi a anlise da evoluo (no tempo) das frequncias harmnicas, e uma metodologia de validao da sua anlise pela sntese de conjuntos de coeficientes, extraindo suas concluses sobre a relevncia da ressntese pela percepo do som ressintetizado, conforme sugere seu artigo [61]. fato estabelecido entre os profissionais do ramo musical, tanto a nvel tcnico quanto musicolgico, que o instrumento de anlise mais apurado e definitivo em quaisquer avaliaes de materiais sonoros o ouvido humano. A existncia de uma base tecnolgica oferecendo uma variedade de ferramentas matemticas e de engenharia exatas e confiveis para atestar a qualidade, pureza e outros aspectos acsticos da msica no pressupe a dispensa da avaliao auditiva. Pelo contrrio, o ouvido frequentemente quem d a ltima palavra, e o que se tem presenciado desde a

96

introduo dos primeiros equipamentos eletrnicos sonoros so acaloradas discusses sobre as diferenas percebidas na qualidade dos sons sintetizados, gravados e processados de forma digital dos sons processados em sistemas analgicos, como tambm dos sons naturais nas audies acsticas em espaos reais. Atualmente, com a recente tendncia em se estender os padres adotados para frequncia de amostragem em udio de 44.1 KHz (ou 48 KHz em alguns equipamentos profissionais) para 96 KHz, objetivando uma representao mais completa, novamente o ouvido tem-se revelado o instrumento de referncia para nortear as aferies e definir o espectro daquilo que perceptualmente rico e expressivo. Essas razes levam ao estabelecimento de uma metodologia de aferio baseada no julgamento das estruturas ressintetizadas atravs da sua audio e comparao com os sons originais, utilizando o ouvido para mensurar o grau de presena ou isolamento de gestos musicais expressivos em determinados nveis da anlise em multiresoluo, em outras palavras, um benchmark para a classificao validada pela audio. Para efeito de prova ou validao do grau de confinamento de certo padro snico ou evento musical num determinado nvel j (ou conjunto de nveis: j, i, ...) empregamos o sistema de edio dos coeficientes wavelet embutido na interface grfica desenvolvida, no qual zera-se ou determina-se um limiar prximo de zero para todos os coeficientes nos nveis diferentes daquele(s) que se deseja pesquisar, e ento procede-se reconstruo (transformada inversa) gerando um sinal na extenso do sinal original que revele as contribuies daquele(s) nvel(eis) pesquisados. A confirmao do confinamento se d via audio da ressntese dos nveis pesquisados. Um procedimento comparativo proposto para este objetivo descrito abaixo: - amostra-se o mesmo trecho musical tocado (1) com expressividade ou realce no evento musical que se deseja caracterizar, e (2) sem expressividade no evento musical em questo (execuo normal, sem efeito ou modulao) - analisa-se os trechos com o mesmo procedimento e bases wavelets, gerando uma decomposio wavelet. - edita-se os coeficientes dos nveis desejados em ambos os trechos, mantendo a contribuio do(s) nvel(is) sob pesquisa e reduzindo os coeficientes dos outros nveis a zero ou a um limiar prximo de zero

97

- resintetiza-se as amostras a partir dos coeficientes editados ou limiarizados - compara-se os trechos ressintetizados (1) e (2) de forma a validar a relevncia da contribuio do(s) nvel(eis) pesquisado(s) na representao do evento estudado. O diagrama de blocos deste esquema para edio e ressntese de trechos musicais est mostrado na Figura 31 abaixo.
Figura 31 - Diagrama de blocos do sistema para ressntese seletiva de nveis especficos

nvel WJ-1 nvel WJ-2

Editor de Coeficientes Limiarizao (thresholding)


nvel W0 nvel V0 dj,k

Reconstrutor wavelet

(transformada inversa que leva ressntese seletiva)

sinal de ressntese (reconstruo)

projees do sinal musical por nveis wavelets

coeficientes editados (por nveis)

O editor de coeficientes foi convenientemente implementado na interface grfica (veja Figura 29) para servir aos propsitos acima. Pode-se editar os coeficientes de cada nvel, atribuindo valores de atenuao (pesos) numa faixa contnua de 0 (0%) a 1 (100%), ou mesmo amplificando-os alm de 100% de suas intensidades originais. A entrada do valor de atenuao (peso) pode ser feita diretamente pela escrita do numeral no campo numrico, ou deslocando-se o boto deslizante ao lado (na interface grfica), o qual age como um potencimetro imediatamente atualizando o valor no campo numrico (entre 0 e 1). No captulo seguinte apresenta-se propriamente as anlises dos eventos musicais propostos para a flauta e para o violino, seguidas dos resultados, discusses e concluses finais.

98

5 RESULTADOS, DISCUSSES E CONCLUSES

Na sesso de resultados apresenta-se os resultados das anlises dos eventos musicais abordados. Na sesso de discusso faz-se uma apreciao dos resultados das anlises, fenmenos associados, e compila-se um cruzamento de informaes advindas da interpretao das mesmas. Na sesso de concluses, tece-se opinies, comentrios finais e perspectivas futuras.

5.1 Resultados das anlises


A Figura 32 abaixo resume todos os tipos de eventos musicais amostrados e analisados para o violino. So ao todo 13 eventos analisados:
Figura 32 - Eventos musicais amostrados e analisados para o violino

Normais Ataques Expressivos c/ Acentos (sforzatos) c/ Staccatos (martel) c/ Spiccatos Normais (glissando) Ligados Acentuados Fraseados Normais Acentuados No ligados Spiccatos Trmulo de arco c/ Dinmica Sustentao c/ Vibratos c/ Trinados

99

Os ataques abordam a anlise dos perodos de ataques de notas individuais. Os fraseados estudam as transies entre notas embutidas num contexto meldico. As sustentaes analisam um conjunto de efeitos sobre notas sustentadas. As partituras ao lado de cada evento meramente ilustram a simbologia adotada em msica para represent-los, isto , a notao escrita para guiar a interpretao, no consistindo propriamente dos trechos musicais tocados. Mantendo a mesma metodologia, a Figura 33 abaixo sumaria todos os tipos de eventos musicais amostrados e analisados para a flauta, ao todo 14 eventos:
Figura 33 - Eventos musicais amostrados e analisados para a flauta

Normais Ataques c/ Acentos Expressivos c/ Staccatos Normais Ligados Acentuados Trmulo dedilhado Fraseados Normais Acentuados No ligados Staccatos Trmulo dedilhado

c/ Dinmica Sustentao c/ Vibratos c/ Frulato c/ Trinados

A anlise Wavelet em multiresoluo (AWMR) de cada evento musical compreende:


os grficos dos nveis Wavelet da anlise,

100

uma descrio do evento (uma descrio da interpretao e/ou sobre o trecho

tocado),
uma ilustrao da partitura representativa do trecho tocado (quando aplicvel), a representao grfica do som original, a extenso da amostra (sinal musical), a Wavelet de anlise, os resultados individuais por nveis (pontos mais relevantes e revelaes em

cada nvel Wavelet),


grficos mostrando a distribuio de energia pelos nveis, e eventuais espectrogramas realizados.

A pgina inicial de cada anlise consta de um ttulo, que especifica o instrumento e o


evento musical abordado, e dos grficos dos nveis Wavelets da anlise do evento, isto

, a projeo do sinal em cada um dos subespaos da AWMR, do segundo nvel


Wavelet mais grosso (nvel 1) ao mais fino (nvel N-1, onde N o log 2 da extenso do

sinal musical). Por exemplo, para sinais de extenso 217 pontos amostrais, o nvel 16 ser o mais fino (W16) e o nvel 1 (W1), o segundo mais grosso (ou menos fino). O nvel 0 no mostrado, e corresponde informao encerrada nos subespaos W0 e V0 da AWMR. O sinal nestes nveis so desprezveis em termos de energia, e consistem basicamente na forma de onda da Wavelet de anlise, em nada contribuindo descrio ou formao do sinal. A Figura 34 que segue ilustra uma pgina inicial de uma anlise de evento musical, indicando a disposio e ordenao em que os nveis wavelets so plotados. O primeiro nvel acima esquerda o nvel wavelet 1. O ltimo nvel (abaixo direita) o nvel mais fino (que pode ser o 17, 16 ou 15 para sinais de extenso 218, 217 ou 216, respectivamente.

101

Figura 34 - Exemplo de pgina inicial da anlise AWMR de um evento musical com extenso 217
Instrumento: Evento musical Nvel 1

Nvel 9

Nvel 2

Nvel 10

Nvel 8

Nvel 16

O eixo horizontal de cada grfico mostra a extenso do sinal (nmero de pontos amostrais ou amostras discretas), e corresponde diretamente dimenso temporal (44100 pontos = 1 segundo). O eixo vertical mostra a intensidade (amplitude ou magnitude) em unidades (adimensionais) em escala linear. Da segunda pgina em diante apresentam-se os outros itens da anlise (textos, partituras e grficos). Usualmente o item mais longo aquele que discorre sobre os resultados e revelaes individuais de cada nvel: a anlise dos nveis. O texto detalhado, abordando tanto aspectos genricos - muitas vezes comuns a outras anlises, como
descries do envelope, de padres peridicos e estruturas produzidas por gestos de interpretao, avaliaes sobre a suavidade e regularidade da forma de onda, da textura, taxa de variao de subida ou descida, qualidade percebida do timbre, pitchs percebidos via audio, textura sonora, quantidade e caractersticas de rudo presente

- quanto aspectos exclusivos - como anlises espectrais suplementares, caracterizao


de srie harmnica associada, anlise da evoluo da forma de onda acompanhando

102

sua regularidade e/ou variabilidade grfica e snica, correlaes com gestos de interpretao, relao de transientes e objetos snicos relevantes e comparaes com outros nveis.

Ao final de cada anlise, dois grficos mostram a distribuio de energia do sinal pelos nveis wavelets; o primeiro, traado em escala linear, evidencia os nveis mais energticos do sinal musical; no segundo, o eixo vertical (normalizado) mostra o logaritmo da energia de cada nvel sobre o logaritmo da energia total, desta forma comprimindo grandes variaes de intensidade no topo do grfico, permitindo que os nveis menos energticos apaream e possa-se inferir sobre a distribuio relativa e a contribuio dos nveis que no aparecem sob o escalamento linear. O escalamento neste ltimo portanto logartmico. A quantidade de informao gerada relativamente extensa. Sua incluso na ntegra dentro do corpo do texto quebraria a sequncia e ritmo da narrativa, e produziria um efeito indesejado de torn-lo excessivamente extenso e prolixo. Assim, por motivos de clareza, espao e conciso, optou-se por reproduzir nesta sesso apenas uma seleo de quatro anlises significativas, duas de flauta e duas de violino, as quais apresentam alguns resultados genricos relevantes, comuns a outras anlises, bem como revelaes especficas importantes. Estas anlises ainda oferecem subsdios para os temas que so abordados nas discusses da sesso seguinte. Ao mesmo tempo, ilustram o formato e o nvel de detalhamento adotado na maioria das anlises. So as seguintes as anlises apresentadas a seguir:
Flauta: Fraseado, No ligado, Trmulo dedilhado - notas sol4 (G4) e si4 (B4) Flauta: Sustentao com Frulato - nota f4 (F4) Violino: Ataque Expressivo com Acento (Sforzato) - nota mi4 (E4), corda l (D16) Violino: Ataque Expressivo com Acento (Sforzato) - nota mi4 (E4), corda l (D4)

O material integral -as anlises de todos os eventos abordados nesta pesquisa- est disponibilizado para consulta, armazenado em meio digital anexo (CD-ROM e
disquete, em formato Microsoft Word for Windows 95 - verso 7.0). As anlises de flauta esto no arquivo "an_flauta.doc", e as de violino no arquivo

103

"an_violin.doc". Verses em formato texto (ASC-II), sem grficos ou figuras, esto nos arquivos "an_flauta.txt" e "an_violin.txt". 44 Estes arquivos consistem num amplo material de referncia para musiclogos, engenheiros de som/udio, projetistas e desenvolvedores de tecnologia musical interessados em conhecer os detalhes da anlise wavelet de sinais musicais, avaliar sua aplicabilidade em projetos comerciais e/ou cientficos especficos, e elaborar um roteiro de especificaes iniciais para nortear exploraes mais profundas, focalizadas, e orientadas concepo de produtos que utilizem a tecnologia. Adicionalmente, inclui-se uma cpia do pacote WaveLab (verso 7.01 para MATLAB, gentilmente cedida pela sua equipe de desenvolvimento), do mdulo Wavesynt, desenvolvido para anlise AWMR para sinais musicais (1D), e das amostras musicais preparadas (contendo os eventos/gestos musicais de flauta e violino analisados) em formato de som AIF e em formato MAT (MATLAB, j preparadas para anlise pelo
Wavesynt). O leitor/usurio do MATLAB que ento desejar reproduzir as anlises

realizadas, avaliar seus resultados, realizar reconstrues seletivas, sonorizar os nveis


wavelets e utilizar as capabilidades e funes do WaveLab e Wavesynt sobre seus

prprios arquivos sonoros ter ento totalmente sua disposio o ferramental e material sonoro bsico necessrios.

44

Sendo arquivos extensos, estaro comprimidos no formato .zip, do utilitrio para DOS pkzip/pkunzip (compactador/descompressor), ou da sua verso para Windows, o Winzip.

104

Flauta: Fraseado, No ligado, Trmulo dedilhado - notas sol4 (G4) e si4 (B4)

10

11

12

13

14

15

16

105

Evento: Fraseado no ligado: trmulo dedilhado. Exemplo consiste na execuo de um trmulo com as notas sol (G4) e si (B4) da segunda oitava da flauta, executados em tempo rpido para se caracterizar a natureza das transies e da emisso desses tons num fraseado tremulado. O trmulo do tipo "trmulo de dedilhado" consistindo na interpretao de duas notas com intervalo maior que 1 tom. A ltima nota do exemplo possui uma identidade diferenciada, com uma leve modulao aplicada alongando-a, e produzindo um final dinamicamente mais relevante. Grfico do sinal original:

Extenso da amostra: 217 pontos (131072). Wavelet de anlise: D16 Anlise dos nveis: Nvel 16: Percebe-se bastante modulao de sopro, isto , o sopro fundamental na formao do envelope do trmulo no ligado. O ciclo do sopro envolve o ataque e o colapso forado sucessivos. O nvel mais fino portanto importante para se caracterizar trmulos no ligados, onde observamos a presena do ciclo completo do sopro, do ataque ao colapso forado, em tempo rpido. Uma inspeo visual mais prxima (magnificao) de algumas notas mostrar o envelope caracterstico do ataque em fraseados no ligados, com uma rampa de subida ngreme, uma sobrelevao seguida de um decaimento. Logo em seguida vem a regio de sustentao com altas intensidades, superiores s da sobrelevao, e, em seguida, pela diminuio da presso de sopro devido ao avano da lngua sobre o cu da boca reduzindo o sopro, uma queda progressiva nas amplitudes, entrando na regio de colapso. A interrupo completa do sopro, que cclica no trmulo no ligado, provoca o decaimento sbito ao final da regio de colapso, conforme podemos observar na Figura 35, mostrando, para um mesmo intervalo de tempo (4 notas), o sinal original (sinal de cima) e o sinal no nvel 16 (sinal de baixo).

106

Figura 35 - Parte do sinal original (topo) e do sinal ao nvel 16 (abaixo)

Os "ndulos inter-notas", isto , as pequenas elevaes situadas entre as notas, correspondem aos gestos bucais que ocorrem quando temos um movimento de lngua rpido avanando e retraindo em relao ao cu da boca, no sentido de se modular a passagem de ar e assim o fluxo de sopro. A presso de sopro mxima no centro das notas, onde a intensidade mais alta. Nvel 15: Verificamos que os envelopes das notas sol4 (G4) possui uma depresso de amplitudes ao centro da regio de sustentao. Previamente ao colapso, as amplitudes crescem novamente e ento caem subitamente em virtude do colapso forado. Estruturas intermedirias, isto , pequenos ndulos ou elevaes ainda so vistas entre as notas, embora bem mais sutilmente do que no nvel anterior. Para as notas si, observamos o ataque caracterstico, com sobrelevao e decaimento, e em seguida um progressivo aumento de amplitudes em direo ao colapso, quando ento caem abruptamente. Os contornos da forma de onda, como no nvel anterior, no so suaves: so irregulares e com vrios picos locais (de mxima amplitude). A Figura 36 mostra uma parte magnificada do nvel 15, entre as 6a e 9a notas inclusive, uma sequncia de si-sol-si-sol (entre 0.944 e 1.630 segundos).

107

Figura 36 - Parte do sinal ao nvel 15: intervalo entre 0,94 s e 1,63 s (da 6a 9a notas)

Textura snica ruidosa, como o nvel anterior, mas apresentando j alguma contribuio das sries harmnicas das notas do trmulo. Nvel 14: Primeiro nvel que permite uma melhor percepo das tonalidades. Os envelopes das notas si4 (B4) diferem em forma dos envelopes das notas sol4 (G4), estes sendo ligeiramente mais suaves, com menos irregularidades e transientes, possuindo ataques discretos, e uma flutuao ou modulao de baixa frequncia sobre as amplitudes na regio de sustentao, com uma progressiva elevao que culmina nas maiores elevaes para cada nota (sol4) do centro em diante, na direo do colapso. J as notas si4 apresentam ataques mais discretos, embora bem caracterizados, no apresentam flutuaes de baixa frequncia na amplitude aps o decaimento, e sim as amplitudes crescem rapidamente e mantm uma mdia intensa por toda a sustentao, decaindo aps no colapso. O colapso para ambas as notas consiste numa queda de elevaes menos abrupta do que nos nveis anteriores, e so estendidos por uma pequena reverberao ou eco, como num pulso aps o corte da excitao. Ouvidas a 11025 Hz as duas notas apresentam diferenas nas regies transitrias, do ataque, previamente regio estacionria. As notas sol4 apresentam um transitrio mais complexo at estabelecerem o tom correto e so-lo com regularidade. Esta complexidade no ataque implica num maior tempo necessrio para atingir a zona de sustentao, e explica-se em parte pela dificuldade inercial de se excitar uma nota mais baixa (maior coluna de ar) no tubo vibrante. O fato de termos um ciclo de interrupo do sopro a todo momento, as vibraes que se processam no tubo esto sofrendo transitrios constantes, e as zonas de vibrao estacionrias so mais curtas, especialmente se o tempo da interpretao for rpido. Nvel 13: As notas si apresentam uma modulao em frequncia facilmente constatada por inspeo visual do grfico, fruto do processamento da anlise Wavelet em multiresoluo. Tambm seus envelopes so mais irregulares, com ataques discretos, zonas de sustentao com envelopes quase quadrados, com subidas e descidas ngremes, e uma regio de colapso mais longa, que decai gradualmente. Neste nvel o colapso se mistura regio de sustentao, seu

108

incio podendo ser considerado uma segunda parte daquela regio onde as amplitudes so menores. A Figura 37 ilustra o intervalo cobrindo da sexta nona notas (si-sol-si-sol) mostrando os contornos e aspectos da forma dos envelopes. Os envelopes das notas sol apresentam ataques mais discretos, com pequenas elevaes, e uma regio de sustentao mais intensa, com as amplitudes gradualmente reduzindo-se em seguida, misturando-se zona de colapso.
Figura 37 - Parte do sinal ao nvel 13: da 6a 9a notas (si-sol-si-sol)

Nvel 12: Nvel mais energtico. Boa sonoridade, nvel concentra energia dos parciais harmnicos. As sobrelevaes nos ataques das notas si4 apresentam amplitudes destacadas no exemplo, contrastando com o envelope das notas sol4 (aproximadamente com um formato de gaussiana), com elevao e queda variando mais suavemente, de forma gradual. Nvel 11: As notas si4 apresentam intensidades bem menores que as notas sol4, em mdia 6 vezes menos intensas, assim como ocorreu no exemplo com fraseado ligado com trmulo dedilhado. Observando o grfico do nvel da sexta oitava notas, percebe-se que as regies centrais das notas sol4 (mais baixas em frequncia) so as mais destacadas neste nvel, e que as notas si4 apresentam formas de onda de envelopes amorfos, contornos no suaves. Outro fato a ser observado, inclusive em nveis anteriores, a no observncia de silncios completos entre as notas, em todos os nveis at o presente. Se o trmulo fosse mais lento poderamos visualizar momentos de pausa, uma vez que o tubo ressonante teria tempo o suficiente para colapsar todas as vibraes que nele trafegam. Nvel 10: Alguns dos picos de mximos no nvel situam-se sobre as zonas centrais de ambas as notas do trmulo. No entanto, existem tambm transientes associados s zonas de transio entre notas e ausncia de mximos de amplitude pontiagudos sobre algumas notas. Essa irregularidade sugere que os picos esto rastreando eventos musicais e/ou gestos transitrios que no esto aparentes ou facilmente identificveis no sinal original. Os eventos ou gestos em questo seriam ento aperidicos, isto , produzidos de forma aleatria, sua existncia estando condicionada natural manipulao do instrumento, a eventos

109

de respirao e movimentos bucais aperidicos, e no aos processos vibratrios correlacionados aos modos ressonantes do tubo vibrante. Dado textura j ruidosa e grave do som do nvel (que cobre faixas de frequncia mais baixas), de se esperar que tais gestos impliquem em contribuies relevantes de frequncias mais baixas. Estudos mais especficos sero necessrios para investigar a natureza dos picos de mximo associando-os a gestos especficos na interpretao do instrumento. Nvel 9: Sinal no suave e de contornos irregulares, mas apresentando certa periodicidade na ocorrncia de transientes ou pulsos que se distribuem regularmente por todo o exemplo, com capacidade de localizao (isto , no extrapolam os limites do sinal original real invadindo a regio de zero padding). Os pulsos localizam as zonas centrais das transies entre notas e das regies de sustentao, onde encontram-se pontos crticos associados intermitncia do sopro, quais seja os de mxima intensidade e presso (quando a lngua permite a passagem do maior fluxo de ar) e os de intensidade mnima ou nula, onde a lngua interrompe por curtssimo perodo de tempo o fluxo de ar. Os estalidos e outros rudos bucais associados aos gestos bucais da interpretao so os eventos mais provveis de estarem visveis neste nvel, uma vez que so peridicos mas exibem frequncia de periodicidade inconstante exatamente por serem processos sincronizados pelos ritmos naturais dos movimentos do intrprete. Este nvel portanto revela-se mais til que o anterior para rastrear tais gestos. Cabe notar entretanto que em audies acsticas reais, onde vrios instrumentos so tocados num ambiente adequado, tais gestos no produzem rudos perceptveis porque seriam fortemente atenuados pela impedncia acstica do ambiente real, e tambm mascarados pela contribuio mais energtica das vibraes harmnicas dos instrumentos. S microfones com capacidade de captao direcional, como o que foi utilizado, podem revelar tais rudos caractersticos da manipulao do instrumento ou rudos de origem bucal. Nvel 8: O contorno do envelope do nvel consiste numa aproximao ao envelope original: depresses ou estrangulamentos no sinal original que ocorrem nas zonas entre notas, e elevaes correspondentes s zonas centrais das notas tambm ocorrem no sinal deste nvel. Como o nvel baixo, j representa de certa forma uma mdia do sinal original projetada num nvel de resoluo especfico onde as flutuaes de larga escala do sinal original so mais visveis. Em outras palavras, as frequncias cobertas por este nvel integram o sinal original e contribuem no delineamento ou conformao do envelope de larga escala do sinal original (mesmo tratando-se de nvel pouco energtico). As notas entretanto neste nvel no soam mais diferentes e seus envelopes so preenchidos por um contedo de frequncias comum a todas as notas, isto , um mesmo tom modulado em amplitude pelo envelope do sinal original. Dois pitchs ou bandas de frequncias preponderantes so encontradas no espectro do nvel: 46 Hz e 40 Hz, a diferena entre estas raias de aproximadamente 6 Hz corresponde a grosso modo periodicidade das notas, que ocorrem numa frequncia de aproximadamente 6 por segundo. Portanto, quando temos uma interpretao bem peridica, com preciso no respeito grade de tempos e de durao das notas - especialmente se a partitura consiste em sequncias de notas de mesma durao - a frequncia de produo de notas aparecer como simples diferena entre os raias do espectro deste nvel. Se a frequncia for inconstante, ento a sua extrao por

110

intermdio deste simples clculo (o do batimento entre os pitchs preponderantes do nvel) no ser eficaz, e tcnicas mais sofisticadas sero necessrias. Somente com esta sequncia de 15 notas que primeiro pudemos descobrir a sensibilidade deste nvel a periodicidades na interpretao de notas, agindo a grosso modo como um contador de notas. Nvel 7: Tambm revela periodicidade, contando notas, com picos do espectro em 40 Hz (mais intenso) e 46 Hz, exatamente as mesmas frequncias do nvel anterior. O espectro do nvel est na Figura 38 abaixo.
Figura 38 - FFT do nvel 7 para a anlise de fraseado no ligado, trmulo dedilhado

Nvel 6: Inaudvel (exceto pelos clicks), se espalha pela zona de acolchoamento, no permite localizar com preciso eventos em relao ao sinal original Distribuio de energia:

Mais de 99% de toda a energia do exemplo se concentra nos nveis de 11 a 14, sendo o nvel 12 o mais energtico.

111

Flauta: Sustentao com Frulato - nota f4 (F4)

2 10

3 11

12

13 6

14 7

15

112

Evento: Sustentao com frulato. Exemplo de um nota executada com efeito de frulato, desde o ataque at o final da nota. Ataque em frulato do tipo "tu" nota f4 (F4) e sustentao do efeito. Ouvido a 11025 notvel o efeito: inicialmente ouve-se o sopro e logo em seguida, quando quebra-se a inrcia da coluna de ar, estabelecem-se os padres estacionrios, que so periodicamente modulados por um jato intermitente de sopro. O efeito de intermitncia produzido pela vibrao da lngua contra o cu da boca, interrompendo o fluxo de ar periodicamente. A cada ciclo as vibraes estacionrias tendem a colapsar, e o retorno do fluxo de ar ocorre antes que morram completamente. No entanto, a cada retorno do fluxo de ar o rudo de sopro novamente introduzido, e temos um realce das componentes do sopro a cada ciclo. Uma anlise FFT da nota mostra a presena de uma srie harmnica predominante, e obscurece o fato de que h um frulato executado na nota. Trs raias se destacam: o segundo harmnico do f3 (F3) que na verdade a fundamental desta nota F4 (em 691 Hz, amplitude 5456 unidades), o quarto harmnico (em 1387,5 Hz, amplitude 1616 unidades) e o sexto harmnico (em 2100,8 Hz, amplitude 472 unidades). H portanto uma predominncia dos parciais pares, no entanto as raias so relativamente mais largas comparadas s notas interpretadas sem o frulato, com picos locais distribudos ao redor das frequncias centrais discriminadoras da raia, acusando a presena de bandas laterais de uma modulao de anel, resultado dos desvios em frequncia provocados pelo frulato. A frequncia com que o frulato executado no entretanto de fcil verificao no espectro da nota - por exemplo, pelo menos duas frequncias moduladoras diferentes podem ser verificadas na FFT entre 650 e 750 Hz. Grfico do sinal original:

Extenso da amostra: 216 pontos (65536). Wavelet de anlise: D16 Anlise dos nveis: Nvel 15: O ataque consiste numa regio de subida gradual at um ponto mximo do envelope. Na ponta inicial a presena do sopro predominante. No decorrer da nota, no perodo de sustentao, observa-se uma textura pouco suave no envelope, com muitos picos localizados de amplitude e uma sequncia de pulsos periodicamente distribudos pela nota at a regio do colapso, quando cessa a modulao do frulato e d-se incio ao colapso propriamente. O colapso revela-se neste nvel como um "apndice" com amplitudes baixas, consistindo num rudo de fundo na sua maior parte. O espectro do nvel revela uma densa populao de frequncias acima de 5000 Hz at 22050 Hz, com picos duplos resultado de uma modulao de anel (modulao de amplitude sem portadora) gerada pelo efeito de frulato. O pico mais amplo est em 11535 Hz e sua banda lateral espelhada se encontra 42 Hz abaixo, em 11493 Hz, evidenciando uma modulao de amplitude de 21 Hz, a frequncia estimada para o movimento lingual que oriunda o frulato. A mesma frequncia extravel da segunda raia mais ampla, com pico principal em 11046 Hz, e sua banda lateral inferior espelhada, tambm a 42 Hz abaixo, em 11004 Hz, novamente

113

mostrando a frequncia do ciclo intermitente de sopro do frulato. A FFT do nvel est ilustrada na Figura 39, mostrando o espectro entre 10000 e 15000 Hz, onde se encontram as raias principais do som neste nvel, e pode-se visualizar a modulao de anel implcita citada acima, com picos gmeos separados de 42 Hz.
Figura 39 - FFT do nvel 15 (sustentao com frulato)

A anlise do espectro do som original no torna evidente a presena da frequncia do frulato, e o sinal no nvel 15, tipicamente um nvel que reala as componentes do sopro, capaz de clarear os aspectos cclicos envolvidos no sopro intermitente do frulato. O som do nvel revela a periodicidade do sopro do frulato, tornando-se sua principal caracterstica. Nota-se que a periodicidade estabelecida desde o incio da nota, caracterizando o ataque de frulato a partir do onset da nota. Somente na regio do colapso o frulato interrompido. O som lembra um chocalho de cascavel quando reproduzido em 11025 Hz. Um nvel mais elevado de energia para este nvel mais fino revela que grande parte da energia do frulato fica esboado no sopro. Nvel 14: O envelope do nvel se assemelha ao do nvel anterior, mostrando entretanto um nvel de rudo de fundo menor (visvel pelo apndice do colapso). O som do nvel semelhante ao de um chocalho de cascavel. A anlise espectral esttica do nvel mostra que ele ainda representa uma significativa concentrao de componentes do sopro, dada a ampla distribuio de frequncias por uma faixa larga do espectro acima de 3000 Hz. Nvel 13: A presena do rudo de sopro ainda forte como pode-se verificar pela FFT (espectro esttico) do nvel, e a periodicidade do ciclo intermitente do frulato a mesma calculada nos nveis anteriores. O espectro (no mostrado) revela uma densa populao de frequncias entre 2000 e 8000 Hz principalmente, mas raias "mais comportadas" j aparecem claramente exibindo um padro de srie harmnica. O pico mximo do espectro se d em 3411,7 Hz, e entre 3300e 3600 Hz aparecem vrias raias onde a decifrao visual da frequncia do frulato associada se torna mais complexa.

114

Ao redor de 1/16 da frequncia de amostragem (2756,25 Hz) encontramos bandas laterais espelhadas, com ligeiras diferenas em amplitudes, um efeito de duplicao de bandas causado pelo algoritmo de anlise Wavelet em multiresoluo45. A audio do nvel sugere que h um pitch predominante e a frequncia do frulato aproximadamente a mesma dos nveis anteriores. Clculos da distncia entre picos, numa tentativa de estimar a frequncia modulante associada ao frulato, revelam valores entre 18 e 27 Hz de frequncia para o frulato. A estimativa da frequncia de frulato pela simples anlise visual dos picos e raias do espectro do nvel , entretanto, praticamente invivel, requerendo para tal o uso de tcnicas mais complexas, como por exemplo o emprego de anlise pitchsncrona (pitch synchronous) sobre o sinal do nvel, como Evangelista (1993) realizou em seus experimentos (veja citao de seu trabalho nas referncias bibliogrficas da dissertao). A audio do nvel a 11025 Hz revela que os componentes harmnicos do tom (vibraes estacionrias) surgem aps 3 ou 4 ciclos do frulato, e que permanecem presentes at o fim da nota, flutuando sob a modulao do frulato, conforme j dito anteriormente. Nvel 12: O envelope deste nvel revela duas caractersticas novas: 1. O ataque se processa numa ascenso gradual de amplitude 2. Existem duas regies de mximos e uma de mnimo (amplitudes relativas) na fase de sustentao. O efeito entretanto sobre a amplitude percebida do som desprezvel, e at observa-se que a regio de menores intensidades na sustentao portadora de um som mais puro e regular. A visualizao da forma de onda revela que a frequncia modulante do frulato no nvel pode ser na verdade uma combinao de frequncias modulantes, uma vez que pulsos perfeitamente distanciados no so verificados, e sim verifica-se a existncia de uma modulao mais complexa. A audio do nvel a 11025 Hz revela um incio soprado seguido, aps alguns ciclos, pela ascenso dos parciais harmnicos. Na regio do colapso tambm verifica-se uma ressonncia aps o fim da excitao (sopro) produzindo uma espcie de eco ou reproduo menos intensa do ltimo ciclo do som. Nvel 11: A inspeo grfica da onda deste nvel revela pelo menos duas regies com diferentes modulaes de amplitude, separadas aproximadamente ao meio da nota. De fato, o que se verifica que a frequncia modulante simples do frulato, calculada anteriormente em aproximadamente 21 Hz, no se aplica a todos os nveis, o que sugere a ocorrncia de diferentes modulaes de amplitude com diferentes frequncias modulantes aplicadas a cada faixa do espectro audvel. No nvel 11 por exemplo nenhuma frequncia modulante aparece com destaque, como 21 Hz o fez no nvel 15. O espectro do nvel basicamente revela as mesmas bandas existentes no espectro do sinal original, a nica diferena est no aparecimento das raias espelhadas em torno de frequncias que so razo de nmeros inteiros da frequncia de amostragem (fa=44100 Hz): 1/64.fa (~689 Hz) e 1/32.fa (~1378 Hz). Essa modulao, que tem origem no algoritmo usado para a anlise wavelet, a causa da modulao em amplitude, tanto visualizada no grfico da onda quanto percebida via audio. A Figura 40 mostra a primeira banda espectral relevante do sinal original e do sinal ao nvel 11, respectivamente (espectros normalizados). Note que o pico em 691 Hz (fundamental da nota)

45

Leia discusso sobre este efeito no captulo 5, item 5.2 da dissertao.

115

aparece em ambas as figuras, mas ao nvel 11 ela aparece espelhada em torno de 1/64.fa (689,0625 Hz).
Figura 40 - Primeira banda relevante da FFT do sinal original (esquerda) e do nvel 11 (direita)

A anlise auditiva do sinal no nvel 11 mostra um sinal mais puro e desprovido de rudos, com uma s voz percebida, e uma modulao em amplitude percebida como um batimento com frequncia em torno de 9 Hz para uma primeira regio (aproximadamente de 0 a 680ms) e 4,5 Hz para uma segunda regio (de 680ms ao final). Nvel 10: O nvel apresenta caractersticas gerais semelhantes ao nvel 11, como a fcil audio e visualizao de diferentes frequncias modulantes em forma de batimento; entretanto apresenta melhor suavidade, "pureza" de tom e o envelope possui contornos mais "contnuos". O batimento verificado no nvel anterior fica muito mais explcito neste nvel, onde as cristas e vales da onda ficam melhor caracterizados. Uma anlise mais cuidadosa da forma de onda apresentada no nvel (e da modulao em amplitude em forma de batimento que molda seu envelope) mostra que existe uma variao contnua da frequncia percebida de batimento. No incio da nota esta frequncia mxima, e decresce a medida que a nota progride e o efeito do frulato se estabiliza. Isto sugere (1) que o regime permanente de um tom emitido sob frulato requer algum tempo para se estabilizar, ou (2) que o gesto musical de frulato evolua, alterando seu padro modular no tempo. O batimento mais rpido ao incio mostra que os modos harmnicos (representados neste nvel) oscilam em amplitude respondendo ao ciclo de excitao e corte (sopro e ausncia de sopro) do frulato. Esta frequncia de oscilao tende a diminuir a medida que os modos vo ganhando energia em cada ciclo, e podem portanto manter suas oscilaes por mais tempo. Esse comportamento pode ser vital para se produzir um frulato sintetizado com qualidade bem prxima ao natural. Nvel 9: Cerca de 600 vezes menos energtico que o nvel anterior, o nvel 9 apresenta um envelope tambm diferenciado daqueles dos nveis anteriores, e seu som no guarda semelhana com os sons de nveis anteriores. O som do nvel no revela a preponderncia dos modos harmnicos do tom, como nos nveis mais energticos. O envelope no suave, apresenta vrias "descontinuidades", revela ataques e colapsos semelhantes aos dos nveis anteriores, com incio e final graduais. A presena de uma modulao de amplitude em forma de batimento entretanto uma caracterstica impressa devida ao frulato, e inexiste de forma to regular em notas interpretadas com outras tcnicas.

116

Nvel 8: A presena da frequncia caracterstica do frulato se faz novamente relevante agora no nvel 8, muito menos energtico que os anteriores. O envelope do nvel revela inmeras "descontinuidades", e o colapso, onde o frulato cessado, no apresenta os picos localizados que se distribuem por toda a nota onde o frulato existe - inclusive no incio, uma vez que a nota foi atacada sob frulato. O som caracterstico dos nveis baixos menos energticos, e reala os componentes ruidosos de baixa frequncia que existem no som original, sejam eles oriundos de rudos ambientes, das fases de gravao, converso e preparo das amostras, seja oriundo de vibraes graves excitadas nos instrumentos durante a emisso dos tons, ou de gestos musicais devido a manipulao de arcos, sopros, respirao e dedilhados. O espectro do nvel revela uma densa populao de frequncias entre 50 e 250 Hz, com picos em 109,0 e 134,6 Hz. Nvel 7: No revela aspectos importantes do sinal musical, e guarda semelhana com os sinais de outras notas sem frulato. Nvel 6: Espectro revela pico de frequncia em 27,59 Hz, seguido por outro em 40,37 Hz, frequncias muito baixas. No h contaminao de 60 Hz. Nvel 5: Inaudvel (exceto pelo click do incio e fim). Mostra um onda contnua, com frequncia (pitch) central em 15,47 Hz, e um segundo pico local em torno de 20 Hz, um valor muito prximo frequncia de frulato estimada no nvel 15. No pode-se todavia afirmar que a frequncia modulante do frulato fica evidente neste nvel. Do nvel 4 para baixo as formas de onda no exibem as flutuaes peridicas observadas nos nveis superiores, e no mostraram-se importantes para a verificao do frulato. Distribuio de energia:

Quase toda a totalidade da energia do exemplo se concentra nos nveis de 10 a 12, sendo o nvel 11 o mais energtico (com aproximadamente 50% de toda a energia). Os nveis mais baixos -em especial de 6 a 9- revelam-se mais energticos neste exemplo de frulato do que em outros eventos abordados neste trabalho, sugerindo que a modulao provocada por este adorno musical se imprime por um nmero maior de nveis wavelets.

117

Violino: Ataque Expressivo com Acento (Sforzato) - nota mi4 (E4), corda l

2 10

3 11

12 5

13 6

14 7

15

118

Evento: ataque acentuado (sforzato), nota nica, ao primeiro mi (E4) na corda l. Grfico do sinal original:

Extenso da amostra: 216 pontos (65536). Wavelet de anlise: D16 Anlise dos nveis: No ataque do nvel mais fino (15) maior a participao de parciais mais altos, efeito que se dilui da regio de sustentao em diante. A maior sobrelevao neste nvel ocorre entre 100 e 120 ms, e no no incio, logo aps a subida inicial. A textura snica denota a presena do rudo do arco e a composio harmnica do tom, principalmente na regio inicial onde soam mais intensamente os parciais mais altos. O formato do ataque, sobrelevao e decaimento no incio no esto bem caracterizados, havendo em verdade uma sequncia destes padres na fase inicial da nota. Essa complexidade da forma de onda inicial reflete a complexidade das vibraes iniciais que podem ser estabelecidas pelo engate e arraste do arco na corda do violino. Os nveis de 13 a 10 so os mais importantes para a formao desta nota acentuada. Pela audio (principalmente a 11025 Hz) e observao grfica destes nveis, verifica-se que h um perodo inicial de engate, onde o arco ataca a corda e no so perceptveis pitchs estveis (padres vibratrios com altura definida) mas sim padres irregulares e ruidosos, e um perodo consecutivo onde pitchs definidos so estabelecidos, havendo a percepo de tonalidades. No nvel 13, ouvido a 11025 Hz, percebe-se a grosso modo 3 fases compondo a regio inicial do tom: uma primeira, que cobre o momento do engate, uma segunda poro onde parciais mais altos so emitidos juntamente com 2 pitchs centrais, e uma terceira poro, onde parte do brilho snico anterior se reduz e melhora-se a percepo de 2 pitchs centrais. Destes dois pitchs, o mais baixo fica levemente mascarado durante a segunda fase pelas frequncias mais altas. O nvel 12 exibe um formato de envelope onde pode-se facilmente observar uma regio de ataque, uma sobrelevao, um leve decaimento e as regies de sustentao e colapso. Contudo, estas regies, normalmente associadas aos processos transitrios que se desenvolvem antes do perodo de sustentao, ocorrem na verdade antes desta maior sobrelevao visvel. Isto porque o nvel 12 um dos mais energticos, exibindo a evoluo dos padres harmnicos e preterindo os componentes transitrios. Sendo natural que o surgimento e evoluo dos padres harmnicos se d realmente aps os transitrios iniciais da nota, a forma de onda observada ao nvel 12 no d informaes sobre a "turbulenta" fase inicial, e no exibe os padres caractersticos da regio de ataque para o sforzato. Uma viso mais detalhada dos primeiros 250ms da nota ao nvel 12 revela uma fase inicial, com forma de onda aproximadamente irregular, no exibindo padres de ataque, sobrelevaes ou decaimentos, mas sim exibindo um sutil padro peridico que cresce de amplitude em cada perodo, e ganha relevncia e regularidade a partir de 188 ms do incio. O envelope visto no nvel 12 portanto uma verso escalada do envelope ideal. Esta interpretao em particular do sforzato contribuiu muito para moldar a forma de onda

119

observada: a intrprete caracterizou a qualidade de acento com um incremento na presso e/ou velocidade do arraste de arco aps o engate inicial do arco corda, produzindo assim a sobrelevao mxima tambm aps a regio inicial, onde j soam modos estveis, e que ocorre no momento em que a energia do arco encontra menos resistncia sua transferncia caixa ressonante. A influncia do intrprete sobre a caracterizao dos acentos portanto inegvel, e as regies de mxima intensidade de sforzatos podem ocorrer bem aps a regio de ataque, no incio da nota. Isto mostra que a sntese de notas acentuadas nos violinos deve abordar uma fase de engate do arco e independentemente uma fase de incremento no arraste para caracterizar o sforzato, esta podendo ocorre dissociadamente do ataque inicial. O engate do arco corda bem perceptvel pela audio do nvel 10, onde dois pitchs centrais so perceptveis. Tambm nos nveis 11 e 12 so ouvidos dois pitchs soando. Os nveis 9 e 8 (respectivamente o 7o e o 8o nveis mais finos) localizam e caracterizam bem o ataque acentuado sforzato, especialmente o engate inicial do arco, apesar de serem muito menos energticos. Parte da qualidade sonora do sforzato est portanto centrada em nveis pouco energticos. O 7o nvel mais fino nas anlises de violino (9 nesta anlise) usualmente revela os processos acsticos que ocorrem no corpo de madeira do instrumento. Violinistas so capazes de segregar as diversas sonoridades que emergem de pontos diferentes do instrumento, e identificar a parte do violino que est gerando aquele som, seja ele transiente ou estacionrio. Os sons associados caixa ressonante do violino, seu tampo e fundo, especialmente os transientes e pulsos, so enfatizados neste stimo nvel mais fino da anlise Wavelet, podendo-se informalmente referenci-lo pelo "nvel da madeira", pela sua textura snica, como se deixando passar somente a contribuio da caixa de madeira. Isto est de acordo com a percepo deste nvel escutado por um violinista. O nvel 8 exibe basicamente uma textura snica de rudo de fundo. O nvel 7 da anlise revela um rudo de fundo disperso por todo o exemplo, descorrelacionado com o envelope da nota tocada. O nvel 4 exibe suas maiores amplitudes no incio, exatamente sobre a regio de sobrelevao do sforzato, e inaudvel. Distribuio de energia:

O primeiro grfico apresenta no eixo vertical a intensidade em escala linear. Mais de 99% de toda a energia da amostra analisada se concentra nos nveis de 10 a 13, sendo o nvel 11 o mais energtico. No segundo grfico o eixo vertical contm o logaritmo da energia de cada nvel sobre o logaritmo da energia total. Reconstrues do sinal original desprezando-se os coeficientes dos

120

nveis 9 e inferiores (de 8 a 0) no implicam em perda de qualidade significativa no som final ressintetizado (em comparao ao original). Outras reconstrues relevantes foram realizadas para esse evento, inclusive algumas tomandose alguns nveis (na verdade os coeficientes) da anlise da mesma nota sob ataque normal, de forma a avaliar a importncia snica de alguns nveis para caracterizar o sforzato. Uma delas foi feita zerando-se os nveis de 0 a 8 e tambm o nvel mais fino (15); O sinal reconstrudo foi praticamente idntico nota original, com diferena abaixo do limiar de percepo. Outra reconstruo zerando-se os nveis de 0 a 9 (inclusive) e tambm o nvel mais fino (15) mostra que o nvel 9 no to importante para a efetivao da percepo do sforzato. O experimento mais significativo para se avaliar a concentrao da qualidade do sforzato em alguns nveis utilizou a rotina cruzar.m para realizar reconstrues com nveis tomados de arquivos sonoros diferentes, implementando uma forma de sntese cruzada com Wavelets. Dois arquivos sonoros, exemplificando eventos diferentes, foram empregados: (A) a nota mi na corda l da presente anlise, e (B) a nota mi tambm tocada na corda l, sob interpretao normal46. Os arquivos sonoros foram editados e devidamente acolchoados com zeros ao incio e fim dos vetores, tais que o incio de ambas as notas coincidissem no tempo, seus ataques comeassem simultaneamente, e a durao dos vetores fosse igual em ambos. Em seguida, ambos os sinais foram decompostos com o sistema de AWMR, e a rotina cruzar.m foi empregada para se construir sinais mistos, contendo contribuies de ambos os eventos (ataque sforzato, A, e ataque normal, B). Analisando-se comparativamente os nveis de A e B, nota-se que no nvel 11 ambos apresentam mesmo pitch, mas exibem diferenas na regio de ataque de A e na elevao ao final de B. O nvel 10 difere bastante nos dois eventos: no ataque normal ele apresenta um envelope mais largo tambm no final, e varia de intensidade por toda a durao; no ataque com sforzato h um pico bem destacado no incio. O nvel 12 em ambos apresenta envelopes regulares e apresenta um pitch semelhante; o sinal com sforzato apresenta, contudo, um segundo pitch em destaque, associado "mordida" do arco corda. Os sinais construdos em sntese cruzada foram em seguida ouvidos, interpretados e comparados com ambas as amostras originais de ataque normal e ataque acentuado com sforzato. A tabela abaixo mostra as mais importantes snteses cruzadas realizadas e os arquivos onde se encontram armazenados seus sinais de udio (disponveis no CD-ROM em anexo):

Amostra no selecionada para anlise neste trabalho. No entanto, aqui utilizada por haver sido tocada tambm na corda l, como a amostra de ataque com sforzato em anlise o foi. A e B esto disponveis no CD-ROM em formato AIFF (som) e MAT (MATLAB).

46

121

Arquivo norm-sf1 norm-sf2 norm-sf3 norm-sf4 norm-sf5 norm-sf6 norm-sf7

Nveis tomados de A (sforzato) 10, com peso amplificado em 10 vezes (peso 10) 10, 11 e 12, com peso 1 11, 12, 13, com peso 1 11, 12, com peso 1 10, com peso 3 11, 12, com peso 1 8 e 9, com peso 3; 10, com peso 2,5

Nveis tomados de B (normal) todos, exceto o 10 todos, exceto 10, 11, 12 todos, exceto 11, 12, 13 todos, exceto 11 e 12 todos, exceto o 10 13, com peso 0,225; 14 com peso 0,543; 15 com peso 0,552; os outros com peso 1 todos, exceto 8, 9 e 10

Somente com os nveis 11 e 12 da amostra A j possvel notar que uma qualidade de sforzato adicionada nota, mas existe uma degradao no som, evidenciada pela percepo de alguns pitchs (tons ou vozes adicionais) que no se integram (fundem num timbre ou stream nico). A causa principal disso est no balano deficiente dos pesos na reconstruo, o que usualmente um motivo para se "dividir" uma nota em uma espcie de acorde onde outras vozes soam simultaneamente. O sforzato ainda perceptvel se somente o nvel 10 da amostra A for substitudo com um peso 3 (3 vezes maior), como no arquivo norm-sf5 acima na tabela. O timbre geral ainda degrada-se um pouco, distorcendo levemente a percepo de um violino, mas a qualidade do sforzato, em especial a regio do ataque, adicionada, mostrando a importncia deste nvel na formao da percepo do acento sforzato.

122

Violino: Ataque Expressivo com Acento (Sforzato) - nota mi4 (E4), corda l (D4)

2 10

3 11

12

13 6

14 7

15

123

Evento: Ataque sforzato, nota nica, ao primeiro mi (E4) na corda l. Mesmo amostra sonora da anlise anterior, desta vez analisada com a Wavelet D4. Grfico do sinal original: (veja anlise anterior) Extenso da amostra: 216 pontos (65536). Wavelet de anlise: D4 Anlise dos nveis: Os gestos observados e caractersticas gerais verificadas em cada nvel so semelhantes s da anlise anterior, da mesma nota acentuada com D16, especialmente para os nveis mais energticos. O nvel mais fino encampa frequncias mais baixas no cobertas pelo nvel 15 da anlise com D16, o que perceptvel pela audio comparativa dos mesmos. Seu som apresenta uma textura menos aguda que o som do mesmo nvel para D16. No nvel 11 fica mais destacado o ataque de sforzato, sua audio apresentando a percepo de um tom ao incio e estabilizando em outro: o ataque no sinal ao nvel 11 apresenta 2 pores, cada qual com um pitch central dominante (mais pronunciado). O segundo tom permanece constante durante o exemplo, s reduzindo em intensidade no final. O nvel 10 caracteriza mais ainda o ataque sforzato. Comparando este nvel com o nvel correspondente da amostra da nota mi tocada na corda mi solta (da primeira anlise de ataque normal, atrs) nota-se claramente a diferena provocada pela presena do sforzato neste nvel. A intensidade no ataque acentuado (o presente) mais forte, e alm disso para aquela amostra foi utilizada a Wavelet D16. O nvel 7 com D4 permite uma localizao do acento sforzato, guardando semelhana como nvel imediatamente mais fino (8). O nvel 5 e inferiores tambm exibem formas de onda que j se assemelham Wavelet D4, menos regular. Distribuio de energia:

Mais de 99% de toda a energia do exemplo concentra-se nos nveis de 10 a 14, sendo o 11o o mais energtico. Comparativamente anlise com D16, a energia se distribui mais uniformemente pelos nveis, numa gradao mais suave entre a energia de um nvel e do nvel adjacente (degrau menos alto), como pode-se verificar comparando a distribuio (em escala logartmica) do segundo grfico acima com seu correspondente na anlise anterior (mesmo sinal analisado com D16). Como na anlise anterior, algumas reconstrues seletivas tambm foram realizadas com os coeficientes obtidos com D4, as quais relata-se abaixo:

124

1. reconstruo com nveis 9 e 10 com peso 0,5 e os nveis 11, 12, 13 e 14 com peso 0,586: no elimina a qualidade percebida do acento sforzato. 2. com nveis 10 a 15 intactos, o restante zerado: leva a uma reconstruo praticamente idntica original, diferenas abaixo do limiar perceptivo. 3. nveis 10 a 14 intactos, o restante em zero: leva a uma reconstruo quase idntica, havendo certa granulosidade na textura do som. 4. nveis 12, 13 e 14 intactos, o restante em zero. 5. nveis 13 e 14 intactos, o restante em zero: o tom fica muito degradado, falta muito do espectro harmnico, e o sforzato fica bastante atenuado, ainda que no eliminado. Vrias reconstrues seletivas foram feitas eliminando-se os nveis 9 e 10 e deixando-se diferentes pesos para os nveis de 11 a 15, mas nenhuma delas eliminou o sforzato. Ele aparece em todos estes nveis, com caractersticas e composio diferentes.

No item "Apreciao dos resultados e discusses" a frente feito uma avaliao geral da anlise wavelet em multiresoluo aplicada a sinais musicais. So abordados aspectos importantes sobre a fenomenologia associada ao processo da anlise e particularidades sobre as estruturas e objetos musicais identificados em cada nvel, procurando sempre identificar a relao de causa e efeito verificada entre os gestos executados na interpretao instrumental e os objetos snicos identificados nos nveis. Nas concluses finais elabora-se uma tabela de distribuio de gestos/eventos musicais
por nveis wavelets que relaciona os objetos snicos, estruturas, eventos e gestos

musicais identificados aos nveis onde mais se concentram e so visveis e/ou audveis. Apresentam-se as estruturas snicas que aparecem destacadas em cada nvel, a percepo grfica e snica do nvel, e uma lista de sensibilidade de cada nvel, sumariando os resultados mais relevantes deste trabalho.

125

5.2 Apreciao e discusso dos resultados


As anlises geraram um aprecivel montante de dados sobre as propriedades dos nveis
wavelets e sobre as caractersticas dos gestos e eventos musicais analisados, e

naturalmente trouxeram tona alguns aspectos importantes sobre o comportamento da anlise wavelet em multiresoluo aplicada a sinais musicais, sobre os tipos de objetos snicos e estruturas musicais que ela permite identificar e isolar, sobre a influncia da tcnica de interpretao na conformao das estruturas musicais, e finalmente sobre o algoritmo e pacote computacional utilizado. Estes aspectos merecem pois uma apreciao e discusso a fim de que se compreenda a fenomenologia associada ao processo da anlise wavelet e as particularidades associadas s anlises realizadas. Alguns temas so assim adequados para uma reflexo e discusso dos resultados das anlises, os quais tratam sobre:
A projeo dos eventos musicais nos nveis wavelets Os rudos O imageamento ou gerao de bandas espelhadas O efeito harmonizador Anlise tempo-escala Reconstrues seletivas e compresso de dados Diferenas relevantes entre a anlise com D4 versus D16 Consideraes sobre a qualidade e a inteno das gravaes Enumerao alternativa para os nveis Consideraes sobre o WaveLab
A projeo dos eventos musicais nos nveis wavelets

Para avaliar a capacidade e eficincia da AWMR em identificar e segregar padres musicais em nveis wavelets distintos requer que o leitor esteja a par dos diversos objetos, estruturas e/ou padres mais relevantes que foram recursivamente verificados, observados e/ou percebidos (grfica e/ou sonicamente) nos diversos nveis das anlises

126

realizadas. A leitura das ntegras das anlises de flauta e violino portanto necessria para se inteirar dos resultados detalhados de todas as anlises. Pode-se realizar avaliaes dos resultados das anlises a partir de dois pontos de vistas diferentes: o dos eventos musicais e o dos nveis wavelets. No primeiro, aborda-se o "comportamento" dos nveis wavelets em funo do evento analisado. Procura-se identificar os objetos e estruturas snicas mais relevantes associados ao evento musical analisado e sua distribuio pelos nveis wavelets. A presena de determinado objeto em determinado nvel e sua relao com o gesto musical que lhe deu origem so consideradas. Desta forma estaremos projetando os diversos gestos musicais e suas caractersticas nos nveis da anlise que os destacam, e por conseguinte identificando os nveis onde determinados gestos se concentram. O segundo ponto de vista - o dos nveis wavelets - endereado no item conclusivo seguinte. Nele os gestos e eventos musicais identificados em todas as anlises so apresentados por nveis onde se destacam numa tabela, indicando as classes de objetos e estruturas snicas que cada nvel permite identificar e/ou concentra. A seguir, a apresentao dos objetos e estruturas snicas mais relevantes identificados por eventos analisados para a flauta, para o violino, ou para ambos. Discusses sobre aspectos snicos percebidos, comparaes entre resultados produzidos por wavelets diferentes, e resultados de reconstrues seletivas so tambm considerados.
ATAQUES NORMAIS

No nvel mais fino das anlises para flauta verifica-se um intervalo de tempo perceptvel onde o instrumento est respondendo excitao do sopro, estabelecendo vibraes transientes a caminho do estabelecimento de ondas estacionrias. A qualidade do som ruidosa, retendo a maior parte do rudo caracterstico do sopro, em especial nos ataques. No nvel mais energtico, a pureza do som, os envelopes regulares (suaves), e a ausncia de texturas ruidosas mostram serem os nveis mais energticos (que concentram mais de 99% de toda a energia) aqueles que possuem a melhor textura sonora percebida. Tambm nestes nveis verifica-se uma maior insensibilidade a rudos e transientes.

127

Os nveis abaixo do 9o nvel mais fino (incluso) no contribuem significativamente para a formao do som original. Reconstrues realizadas desprezando-os ou mesmo intensificando seus coeficientes mostra somente que eles contribuem para um rudo de fundo grave (especialmente os 8o e 9o nveis mais finos), no sendo importante para os eventos musicais do exemplo. A medida que o nvel mais energtico ele tambm concentra mais da qualidade vibratria do timbre, isto , da energia dos modos harmnicos vibrantes. Os nveis mais baixos so capazes de revelar transientes oriundos de gestos labiais e da respirao associados interpretao em flauta. De uma forma geral esta constatao se aplica aos outros eventos analisados.
ATAQUES EXPRESSIVOS COM ACENTOS

O nvel mais fino normalmente concentra grande parte do rudo da excitao (arraste de arco para o violino, e sopro, para flauta) e permite monitorar a presena ou no desta, assim como variaes na sua intensidade. No caso de acentos, a localizao dos momentos de ataque ntida, com uma sbita elevao na amplitude, que evolui no curso da regio de sustentao. Nas anlises de flauta, os transientes associados ao colapso se destacaram mais neste nvel, enquanto para o violino, no exibiram tanto destaque, nem no ataque nem no colapso. As maiores amplitudes associadas ao acento, nos dois instrumentos, esto na regio de sustentao das notas. Isto mostra que os intrpretes procuram sempre por imprimir a intensa dinmica associada ao acento no na regio do ataque, mas logo aps quando o tom j se estabelece. De fato, para a flauta por exemplo, um intenso sopro inicial pode excitar tons indesejados, a turbulncia pode provocar a excitao de modos harmnicos que no os desejados, e portanto natural que o acento progrida do ataque sustentao. Nos prximos dois nveis mais finos a regio de ataque fica melhor destacada, com subidas ngremes e sobrelevaes mais intensas. Os ataques acentuados, para ambos os instrumentos, exibiram taxas de crescimento no ataque maiores do que com ataques normais. Os acentos exercem forte influncia nos 7o, 8o, e 9o nveis mais finos, onde ficam bem evidentes e apresentam transientes amplos localizando o ataque inicial, e tambm outras

128

variaes sbitas dos gestos de sopro (como nos colapsos). A altura da nota em questo determinar qual nvel concentrar mais da qualidade sbita e intensa do acento, e dos outros gestos transientes de sopro. Vrias reconstrues seletivas sobre a amostra de acentos sforzatos (para violino) foram realizadas no intuito de se verificar a concentrao deste gesto sobre alguns nveis. Tentativas de se eliminar a qualidade deste acento pela direta eliminao de diversos conjuntos de nveis mostraram que o sforzato aparece com caractersticas e padres diferentes em cada nvel, e no pode ser eliminado completamente da nota simplesmente editando-se os pesos dos nveis.
ATAQUES EXPRESSIVOS COM STACCATOS

O rudo de fundo verificado nos nveis mais finos desta anlise para a flauta indesejado, e de certa forma impossibilitou a observao dos componentes de rudo oriundos do sopro, uma vez que eles se fundem. Wavelet-packets podem ser teis para separar estes componentes, haja visto que uma inspeo visual mais acurada das regies de pausa (entre notas) e do incio das notas mostra evidncias de que as formas de onda apresentam espectros diferentes nestas regies. Os gestos bucais que caracterizam o pulso de sopro inicial dos staccatos so facilmente identificveis nos dois primeiros nveis mais finos. A presena de "rudos bucais" em fraseados velozes frequente, e o 2o nvel mais fino particularmente sensvel a tais gestos. Na execuo de staccatos em violinos, o padro de alternncia de sentido de arco pode estar evidente nos 8o, 9o e 10o nveis mais finos da anlise wavelet. Destes, o 10o nvel mostrou-se mais sensvel identificao destes gestos musicais. Neste tipo de ataque o intrprete usualmente muda o sentido arco para cada nota atacada. O arco para baixo normalmente consiste num movimento mais enrgico, e conduz a um gesto musical acentuado; o ponto e o ngulo de contato arco-corda, diferente em cada sentido, tambm influem sobre a qualidade e textura do timbre produzido, e consequentemente na sua composio espectral. Todavia, os tons das notas produzidas por sentidos opostos de arco sero to diferentes quanto o intrprete o desejar, refletindo-se proporcionalmente na capacidade de identificao destes gestos pelos nveis acima.

129

Para staccatos spiccatos, a tcnica interpretativa ensina que, para cada nota, o arco deve atacar sbito e sair da corda, deixando-a vibrar. Este gesto musical conduz a um
colapso natural da nota aps o arco abandonar a corda, produzindo "regies

reverberantes" caractersticas que podem ser verificadas grfica e auditivamente principalmente nos 5o e 6o nveis mais finos da anlise (para notas inscritas na 4a oitava).
FRASEADOS LIGADOS NORMAIS -

GLISSANDO (VIOLINO)

Nas anlises de glissando o que chama a ateno um efeito sonoro onde as linhas espectrais mais pronunciadas se deslocam em frequncia, algumas para cima, outras para baixo, produzindo padres sonoros transitrios interessantes. Nos tons mais altos em frequncia, o nmero de linhas espectrais mais pronunciadas menor, e a separao entre elas maior, em oposio ao que se verifica nos tons mais baixos, com mais raias espectrais intensas presentes e uma menor separao (intervalo de frequncia) entre elas. Em alguns nveis - em particular no 7o nvel mais fino ou 5o mais energtico - o efeito do glissando equivalente imposio de um envelope de amplitude sobre o sinal.
FRASEADOS LIGADOS NORMAIS (FLAUTA)

A segmentao de notas inexistente no nvel mais fino, uma vez que no fraseado ligado o rudo de sopro existe por todo o fraseado. A segmentao, entretanto vai melhorando nos nveis menos finos subsequentes da anlise, at atingir sua melhor forma nos nveis mais energticos, onde a regularidade da forma de onda e suavidade do envelope so mais destacados. Somente a primeira nota de um fraseado ligado apresentar o formato caracterstico da regio de ataque, com uma rampa de subida ngreme, uma regio de sobrelevao de amplitude e decaimento. Tal padro observado em vrios nveis do 2o ao 7o mais fino. Nos 9o e 10o nveis mais finos o momento do ataque da primeira nota localizado por um transiente intenso. Em vrios temas musicais, quando se deseja impression-los com expressividade, faz-se uso de recursos dinmicos alterando a intensidade de algumas notas chaves e imprimindo um vibrato associado, como ocorre na ltima nota do fraseado ligado

130

normal analisado para a flauta. Os nveis onde as notas com dinmicas mais fortes contribuiro mais em energia so aqueles que cobrem as oitavas onde localizam-se os modos harmnicos do tom (e nos nveis adjacentes), bem como, naturalmente, naqueles mais energticos.
FRASEADOS LIGADOS ACENTUADOS

Nos fraseados onde h uma transio ligada de uma nota normal para uma expressiva acentuada verifica-se a AWMR fornece meios para localizar o instante de onset (ataque) da nota acentuada, as regies intensas que ocorrem nos nveis mais energticos aps o decaimento, bem como caracteriz-los nos diversos nveis da anlise, expresso em termos de variao de intensidade do sinal. Acentos em flauta esto mais associados com a formalizao do transitrio inicial do ataque do que nos violinos, que alm disso exibem amplitudes elevadas nos nveis mais energticos, aps a regio de decaimento da nota.
FRASEADOS LIGADOS - TRMULO DEDILHADO (FLAUTA)

No nvel mais fino os transientes com alta declividade, e que so peridicos no trmulo, localizam os instantes em que h novo ataque na alternncia das notas envolvidas no trmulo. Os picos de mximo (e de mnimo) ao 7o stimo nvel mais fino (nvel 10 para este exemplo) se situam sobre as regies centrais das notas, e no sobre o ataque. Isso mostra que o nvel sensvel aos componentes harmnicos que s so realados ou alcanam mxima excitao nas regies de sustentao de cada nota, quando o padro harmnico estacionrio j se estabeleceu. Tanto que, nas regies de transio observamos um estrangulamento substancial nas amplitudes, marcando os pontos onde as vibraes estacionrias so dbeis porque o padro vibratrio est variando.
FRASEADOS NO LIGADOS NORMAIS

O nvel mais fino mostra uma segmentao razovel das notas e torna possvel localizar com preciso os momentos do ataque, colapso e pausas. As rampas de subida so ngremes, isto , as taxas de crescimento no ataque so elevadas. A textura snica ruidosa, e pela audio no se diferencia os tons das notas: o som um rudo de alta

131

frequncia. O envelope das notas varia em amplitude na medida em que a presso de sopro maior, demonstrando uma extrema sensibilidade presena do rudo de sopro. O nvel tambm permite avaliar o comportamento e evoluo do sopro na execuo das notas identificando modulaes na sua intensidade realizadas pelo flautista. Modulaes de amplitude semelhante a vibratos (de amplitude, para a flauta) so observados em alguns nveis. Na anlise do 3o nvel mais fino observou-se que a frequncia modulante do vibrato varia dentro de uma nica nota. A frequncia de batimento inicial pode ser inicialmente mais lenta, e acelerar em direo ao final. Isto sugere a existncia de uma correlao
com o aumento de intensidade no decorrer da nota (crescendo) percebido nos nveis

mais finos, em especial no 2o nvel mais fino. Nas regies onde o sopro menos intenso o "vibrato" mais lento, e cresce em velocidade (frequncia de batimento) nas regies onde h maior energia de sopro aplicada.
FRASEADO NO LIGADO ACENTUADO

O envelope tpico de uma nota acentuada em fraseado no ligado essencialmente semelhante ao ataque de notas individuais acentuadas. Na anlise de fraseado no ligado acentuado para flauta, o acento marcado por um pulso, objeto sonoro com uma elevada taxa de variao de amplitude no ataque, e tambm por uma sobrelevao (pico de mxima intensidade) logo aps. Os ataques de todas as notas ficam melhor caracterizados no 2o nvel mais fino, com uma intensa e repentina elevao nas amplitudes do sinal no incio do ataque, atingindo uma sobrelevao inicial (que caracteriza o acento) seguida por um decaimento, que finaliza a regio do ataque. Uma anlise com wavelet-packets do sinal neste nvel, fragmentando melhor o segundo nvel mais fino, poderia revelar melhor a composio frequencial em bandas de frequncia. No entanto, no nosso objetivo no instante avaliar aspectos quantitativos das modulaes existentes utilizando esta tcnica. Na reproduo do nvel a 44100 Hz fica mais difcil de se perceber a modulao em amplitude via audio. As descries dos envelopes de ataques referenciando formas de onda com intensas variaes de amplitude em curtos intervalos de tempo, seguidas de sobrelevaes e decaimentos, se aplicam a todos os tipos de ataques no ligados.

132

Ao 4o nvel mais fino (da mesma anlise para flauta) observa-se uma tendncia das regies de sustentao de todas as notas exibirem amplitudes semelhantes. Ataques acentuados ficam melhor caracterizados nos 3 primeiros nveis mais finos, onde as rampas de subida, sobrelevao e regio de decaimento e transientes de gestos de sopro associados tornam-se mais visveis e as formas (estruturas), mais pronunciadas. Tambm a informao auditiva evidencia a qualidade de ataque acentuado, especialmente no 3o nvel mais fino, onde maior a regularidade da forma de onda e menor a quantidade de rudo. Estruturas caracterizando gestos bucais existentes entre as notas no contribuem relevantemente no 4o nvel mais fino desta anlise para flauta. Observou-se que as vibraes do tom entre um gesto bucal (modulando o sopro) e o final do decaimento do ataque da 6a nota para esta anlise no correspondem aos parciais harmnicos da 6a nota, que s se estabelecem na regio de sustentao desta nota. Em fraseados no ligados na flauta, usualmente h um gesto bucal ou de sopro articulando as notas, de forma a separ-las, forando o colapso da anterior e produzindo um ataque para a nota seguinte. Observou-se nos primeiros nveis mais energticos (em especial no 6o nvel mais fino) que certas vibraes (vrios semitons abaixo do tom exibido durante a sustentao) aparecem to logo a nota entre em colapso, isto , to logo o sopro seja cortado, e soam como um ciclo de eco ou reverberao. Estas vibraes experimentam um desvanecimento natural, e que pode perdurar o suficiente para invadir a regio de ataque da nota seguinte, enquanto as tonalidades estacionrias desta no se firmam. A Figura 41 abaixo mostra um exemplo disto, ilustrando a regio de transio entre a 5a e a 6a notas do tema da anlise de fraseado no ligado acentuado (flauta), respectivamente no 6o e no 2o nvel mais fino desta anlise, e cobrindo o mesmo intervalo de tempo em ambos os nveis:

133

Figura 41 - Transio da 5a para a 6a notas nos 6o ( esquerda) e 2o nveis mais finos ( direita)

5a nota (F4)

gesto bucal

"ciclo de reverberao" (vibraes 7 semitons abaixo)

6a nota (Eb4)

5a nota (F4)

6a nota (Eb4)

Verificou-se que as vibraes 7 semitons abaixo de F4 soam to logo a excitao das vibraes de F4 terminam, o que coincide com a localizao do gesto bucal existente entre as 5a e 6a notas no 2o nvel mais fino, e vo terminar aps iniciado o ataque da 6a nota (Eb4), mais especificamente aps a regio de decaimento desta nota. O 6o nvel mais fino (nvel 12 da anlise em questo) focaliza melhor as componentes harmnicas do som, localizando melhor as regies onde estas so mais energticas. O 2o nvel mais fino (nvel 16 desta anlise) permite localizar os gestos bucais e os momentos onde h transies e chaveamentos no sopro. Note que as vibraes harmnicas da 6a nota (Eb4) no 6o nvel mais fino ganham energia a partir do final do decaimento observado no 2o nvel mais fino, aps o ataque inicial. Esta uma informao que pode ser bastante til para orientar a sntese natural de fraseados no ligados com acentos em sistemas computacionais. Este comportamento, entretanto, no se repetiu nas transies de todas as notas daquele exemplo, o que sugere que o fenmeno seja visvel ou no num certo nvel em funo dos intervalos tonais entre as notas. Algumas transies assim seriam melhor visualizadas em nveis especficos, que dem cobertura s faixas de frequncias relevantes na transio. Uma anlise com wavelet-packets, que permite uma melhor segmentao do espectro poderia permitir uma melhor visualizao deste fenmeno para um nmero maior de transies tonais, e verificar a ocorrncia do mesmo fenmeno, tal que a hiptese possa ser estendida a uma classe maior de transies no ligadas, ou mesmo generalizada. Um mapeamento completo deste comportamento extrapola os limites deste trabalho, ficando como sugesto para futuras pesquisas.

134

Ao 8o nvel mais fino as notas mais baixas (da 1a a 5a) apresentam seus instantes de ataque bem marcados por pulsos transientes. A localizao de transientes associados a gestos bucais de ataques tambm verificada ao 11o nvel mais fino (7o nvel mais grosso desta anlise). Nos nveis mais grossos, em especial no 6o nvel mais grosso, a segmentao de notas verificada simplesmente no corresponde segmentao do sinal original, exatamente por extrapolar os limites originais dos eventos musicais do sinal original. Isso entretanto no impede que o nvel no localize ou aponte regies de eventos importantes. De uma maneira geral, pode-se estender essa concluso para todos as frases ligadas analisadas, que no exibam a capacidade de localizar eventos ou notas. No violino, na anlise de fraseado no ligado acentuado, o 4o nvel mais fino da anlise sugere a existncia de uma compartimentao de cada nota em regies com padres vibratrios e amplitudes relativas diferentes. Nesta anlise feita uma descrio detalhada dos gestos musicais associados execuo de fraseados no ligados acentuados, interpretando seus efeitos sobre a modelagem de cada regio das notas. Acentos (sforzatos) so melhor caracterizados j na regio de sustentao das notas, e no propriamente na subida ou sobrelevao do ataque. Quando o ataque corda acentuado, sua durao bem curta (assim como a durao da sobrelevao e decaimento iniciais) e a fase de sustentao estimulada mais cedo. A qualidade acentuada vai se manifestar pouco depois do ataque, contando com as mais altas amplitudes (em especial nos nveis mais energticos). O transiente do contato inicial corda melhor visualizado nos primeiros nveis mais finos e no 8o nvel mais fino.
FRASEADOS NO LIGADOS COM STACCATOS

H uma sutil diferena entre os ataques staccatos e acentuados no nvel mais fino: os acentuados apresentam uma subida com declividade mais acentuada, de contorno bem aproximado por um envelope quadriltero, e projetam uma sobrelevao mais intensa seguida de um decaimento; os staccatos, apesar de exibirem aproximadamente a mesma descrio, apresentam declividades de subida menos acentuada e sobrelevaes mais discretas. Alguns deles neste exemplo neste nvel apresentam rampas ngremes de subida, outros, especialmente os associados s notas intermedirias de menor

135

intensidade (veja figura do som original), apresentam subidas mais discretas, com intensidades em elevao gradual. Uma caracterstica marcante do nvel mais fino est na sua sensibilidade a objetos correlacionados aos gestos de sopro, os quais so bem localizados. Particularmente dois tipos de gestos bucais e de sopro so rastreados neste nvel: o movimento da lngua, gerando um estalido na interrupo do jato de ar, marcando o final do colapso das notas, e os estalidos que ocorrem nas transies, previamente liberao de novo jato de sopro. Tambm no nvel mais fino de anlises de staccatos spiccatos de violino observa-se que ataques pontuais e energticos corda geralmente intensificam a energia dos parciais harmnicos mais altos, aumentando a resposta nas altas frequncias. Ao segundo nvel mais fino observa-se claramente estalidos nas transies das notas, os quais so objetos acsticos transientes provocados pela movimentao da lngua nos instantes de chaveamento do sopro, em regies fora das notas. A regio de colapso para a maioria das notas exibe uma queda gradual, sem decrscimos sbitos e acentuados. Isso se deve fisiologia do movimento lingual que modula o fluxo de ar para o staccato: a lngua, ao mover-se em direo parte posterior dos incisivos superiores para interromper o jato de ar, promove uma reduo gradual no fluxo/presso do sopro no instrumento, que culmina com o fechamento total do sopro, marcado por um estalido rastrevel como um transiente logo aps a regio do colapso. O incio do colapso portanto no fica marcado por transientes ou pulsos provocados pela lngua ou lbios, e ele se torna portanto uma extenso da regio de sustentao onde as intensidades esto decrescendo. Desta forma, para notas emitidas sob staccatos no se observa marcadores (transientes) de inicio de colapso, mas sim marcadores de fim. Estalidos semelhantes podem ocorrer tambm no momento de retrao da lngua previamente liberao de novo jato de sopro (portanto previamente ao ataque da prxima nota). Os nveis mais energticos exibem contornos mais suaves, logo envelopes mais suaves. Exibem tambm uma maior sensibilidade em destacar os processos snicos que ocorrem na regio central das notas: a regio de sustentao, onde as vibraes harmnicas apresentam maior contribuio. Adicionalmente possuem um som mais puro, sem a textura granulosa e spera caractersticas dos primeiros nveis mais finos.

136

Para staccatos spiccatos em violinos, as observaes anteriores feitas para ataques expressivos com staccatos spiccatos valem igualmente no contexto de fraseado. A alternncia de sentido de arco e o abandono do arco corda para cada nota faz at mais sentido quando inserida no contexto de um fraseado no ligado do que propriamente para notas individuais.
FRASEADO NO LIGADO - TRMULO DEDILHADO (FLAUTA)

Os dois primeiros nveis mais finos so importantes para se caracterizar o ciclo completo de sopro (do ataque ao colapso) para trmulos no ligados, evidenciando o envelope caracterstico do ataque em fraseados no ligados, com um transiente inicial (uma rampa de subida ngreme) e uma sobrelevao seguida de um decaimento. A regio de sustentao usualmente apresenta altas intensidades, superiores s da sobrelevao do ataque, e, em seguida, pela diminuio da presso de sopro devido ao avano da lngua contra os incisivos superiores reduzindo o sopro, apresenta uma queda progressiva nas amplitudes, entrando na regio de colapso. A interrupo completa do sopro, que cclica no trmulo no ligado, provoca o decaimento sbito ao final do colapso. Ao terceiro nvel mais fino o colapso para ambas as notas do trmulo consiste numa queda de elevaes menos abrupta -mas ainda acentuada- do que nos nveis anteriores mais finos, e so estendidos por uma pequena reverberao ou eco, como um pulso aps o corte da excitao. A queda acentuada da regio de sustentao para a regio de colapso se deve ao desvanecimento das vibraes harmnicas das notas. No 8o oitavo nvel mais fino, usualmente aquele que concentra um rudo grave de fundo, verificou-se a sensibilidade a gestos bucais da interpretao, marcados por transientes. Estes so os eventos musicais mais provveis de estarem visveis neste nvel, por serem peridicos mas apresentando frequncia de periodicidade inconstante, exatamente por serem processos sincronizados pelos ritmos naturais dos movimentos do intrprete. Observa-se tambm que quando um nmero maior de notas est presente o 9o nvel mais fino da anlise mostra-se sensvel a periodicidades na interpretao de vrias notas, agindo a grosso modo como um contador de notas. Os nveis mais grossos alm deste podem ser teis na extrao de informaes musicolgicas em trechos mais longos, uma

137

vez que so verses do sinal analisado vistas sob escalas maiores, e assim podem localizar movimentos e estruturas mais longas (distribudas no tempo).
SUSTENTAO COM DINMICA

Uma avaliao do 9o nvel mais fino da anlise de sustentao com dinmica para a flauta mostra que ele mais energtico que o nvel anterior mais fino, no sensvel variao dinmica, e que rudos e vibraes de baixa frequncia sem correlao alguma com o material musical sob anlise se encontram presentes no som original, e neste nvel concentram sua maior contribuio. Pode-se elimin-los do som desprezando-se os coeficientes deste nvel, uma vez que a sua ausncia no prejudica a composio harmnica do som musical. Uma reconstruo assim foi realizada, e, no sistema de udio utilizado, no foi perceptvel qualquer diferena com o sinal original. Diferenas, porm, podem ficar evidentes se um sistema mais sofisticado de udio digital, em estdio apropriado, for utilizado. Cabe a um trabalho futuro dar cabo a este experimento. Para o violino, verificou-se que as variaes dinmicas na regio de sustentao esto presentes nos 7 primeiros nveis mais finos da anlise, mostrando que uma larga faixa de frequncias sensvel a alteraes da dinmica e aos gestos musicais que as produzem, principalmente as variaes na velocidade e presso de arraste do arco, alm do ponto de contato do arco na corda. O 8o nvel mais fino mostrou-se sensvel ao transiente provocado pelo abandono do arco corda, ao final da nota.
SUSTENTAO COM VIBRATO (FLAUTA)

O vibrato para flauta constitui-se fundamentalmente numa modulao de amplitude intencional, que verificada por uma larga faixa de escalas ou nveis wavelet, do 1o ao 10o nveis mais finos, sendo que o 7o nvel mais fino apresenta maior sensibilidade aos gestos transientes do que propriamente modulao do vibrato. Em alguns nveis podese extrair uma estimativa da frequncia do vibrato por meio de simples avaliao das distncias entre linhas espectrais.

138

SUSTENTAO COM FRULATO

Ao oitavo nvel mais fino, o som caracterstico dos nveis baixos menos energticos, e reala os componentes ruidosos de baixa frequncia que existem no som original, sejam eles oriundos de rudos ambientes, ou produzidos nas fases de gravao, converses e preparo das amostras (mais provvel), seja oriundo de vibraes graves excitadas nos instrumentos durante a emisso dos tons, ou de gestos de arco, sopro, respirao e dedilhados. Testes de anlise wavelet em multiresoluo em sinais senoidais sintetizados (10002000 Hz) modulados em amplitude por frequncias baixas (20 Hz) mostram que as frequncias modulantes no ficam evidenciadas nos nveis baixos, por exemplo no quinto nvel mais grosso e nveis vizinhos.
Os rudos

Os rudos considerados neste tpico consistem em sinais no suaves com forma de onda e contornos irregulares, que geralmente no seguem um envelope definido, e apresentam um espectro espalhado por uma faixa larga, seja em alta frequncia (observado em nveis mais finos) ou nas baixas (em nveis menos finos). O som usualmente no transmite informao musical relevante, percebido como um estmulo sonoro desagradvel, constante e desinteressante, e a textura snica granulosa, spera. Excluem-se desta discusso os transientes, estalidos e outros sons impulsivos produzidos por gestos bucais e de arco que tenham sido referenciados nas anlises pela denominao genrica de rudos. Este constituem uma classe de objetos altamente correlacionados aos gestos musicais e no exibem propriedades de processos aleatrios. Basicamente duas classes de rudos foram observadas: uma em alta frequncia (agudos), manifestando-se nos nveis mais finos, e uma em baixa frequncia (graves), em alguns nveis mais baixos (menos finos). O rudo caracterstico do sopro (para a flauta) e do arraste/atrito do arco (para o violino) integram a classe de rudos verificados nos nveis mais finos, em particular concentrando-se no nvel mais fino da AWMR. Na classe de rudos graves dois tipos bsicos foram identificados: um de origem
instrumental, que usualmente se manifesta nas anlises de violino no 8o (oitavo) nvel

mais fino e nveis adjacentes, e outro de origem extra-instrumental, cuja causa pode

139

estar associada a rudos ambiente de fundo durante a gravao em estdio, a rudos de quantizao e/ou aos diversos processos realizados na manipulao e preparo das amostras digitais.
RUDO DE SOPRO EM FRASEADOS LIGADOS

Gestos de sopro so produzidos pela ao dos lbios (embocadura), lngua (moduladora do fluxo de ar) e pulmes (presso de ar); usualmente promovem variaes de intensidade e direcionamento no jato de sopro sobre o bucal, e servem a propsitos musicais diversos. O flautista, na iminncia de executar um pulo intervalar que esteja associado a uma grande mudana de posio (dedilhado), e que geralmente implica numa tambm longa variao do comprimento da coluna de ar excitada, perfaz um ajuste de foco da
embocadura, usualmente associado a uma breve interrupo parcial do fluxo de ar ou a

uma leve variao (acrscimo ou decrscimo) na presso de sopro. Esta modulao breve no fluxo de ar constitui um gesto de sopro, e pode servir aos seguintes objetivos: 1. Certificar que a prxima nota ter um leve ataque, sem comprometer a condio de fraseado ligado, de forma a garantir sua correta entonao e destaque na frase, e 2. Pontuar ou destacar a prxima nota fornecendo-lhe uma expressividade especial e s vezes realando o rudo de sopro, um componente natural flauta e caracterstico de seu timbre. Geralmente o gesto de sopro ocorre ainda sobre o colapso da nota anterior, alterando o padro vibratrio presente. Quando a interrupo ou desfocalizao do sopro ocorrerem, sero melhor visualizados nos nveis mais finos, porque o rudo de sopro sofrer modulao evidente. Os ajustes de foco da embocadura e modulaes na presso de sopro que provoquem direta variao na intensidade das vibraes harmnicas sero melhor localizados, porm, nos nveis mais energticos.
ORIGENS PROVVEIS DE RUDOS

Rudos podem ter diversas origens, dentre as quais citam-se as mais principais:

140

1. rudo ambiente do estdio. O estdio do departamento de cinema e televiso da ECA um estdio adequado para gravaes de jornalismo, e a despeito de apresentar boa isolao externa e baixa reflexo das ondas sonoras47 pode ter apresentado baixo isolamento acstico em faixas de alta e baixa frequncias 2. sensibilidade do microfone. O microfone utilizado foi um Neuman modelo MKH 416 P 48 U, com acentuada caracterstica direcional, sensvel a movimentos sutis e capaz de captar uma variedade de eventos acsticos e pequenos rudos causados pela respirao, movimento dos dedos sobre os instrumentos e a prpria manipulao do instrumento, alm de rudos de baixa frequncia (aqum do registro dos instrumentos), cochichos, manipulao de papis, arraste de ps, etc. 3. qualidade do DAT utilizado na gravao. O DAT TEAC modelo DA-P20 semiprofissional, e pode-se notar em vrias gravaes por ele feitas a presena de rudos. Fontes possveis de rudo num equipamento como esse esto diretamente ligadas qualidade e preciso do conversor analgico-digital, especificamente grandeza do rudo de quantizao, ao circuito de codificao PAM (Pulse
Amplitude Modulation) e eventuais estgios analgicos de pr-filtragem.

4. Transferncia de meio. A material sonoro gravado originalmente em estreo, em fita DAT, com taxa de amostragem de 48 KHz e largura de resoluo de 16 bits/amostra, foi lido por outro equipamento (DAT Silicon Graphics) e transferido para disco rgido de computador, armazenado neste meio como arquivos de som estreo, no formato proprietrio da Apple (AIFF). Nesta fase de transferncia existe a possibilidade de ocorrer um fenmeno de falta de sincronia na reproduo do clock original. Nas palavras digitais codificadas pelo DAT a informao de sincronia vem misturada aos dados do sinal amostrado, e em alguns casos, principalmente quando o equipamento de leitura diferente do de gravao, existe a possibilidade de os bits de sincronismo serem mal recuperados ou produzirem um clock inconstante para o conversor digital-analgico, causando uma distoro no linear conhecida pelo nome de "jitter". Nos sistemas mais modernos, entretanto, o nvel de jitter baixssimo, graas melhor preciso dos circuitos PLL's e baixa deformao do sinal eltrico (digital) no circuito de transporte. A codificao em formato AIFF no altera o contedo original de
47

no jargo tcnico diria-se que um "estdio morto".

141

informao, somente adicionando um cabealho (header) especfico s palavras digitais tal que sejam reconhecidas pelo sistema operacional como arquivos de som (AIF). 5. Converso de taxa de amostragem. A gravao original foi feita com taxa de amostragem de 48000 amostras/segundo (48 KHz) em dois canais (estreo). Previamente realizao das anlises as amostras sofreram uma mudana de taxa de amostragem, sendo convertidas para 44100 amostras/segundo (44,1 KHz, padro CD), monaurais (um canal). Foram utilizados dois tipos de equipamentos diferentes nesta fase: uma estao de trabalho Indy, da Silicon Graphics, rodando os softwares Soundfiler ou MediaConvert, e um PC Pentium 100 MHz, rodando o programa shareware Cool Edit. A reduo da taxa de amostragem e converso para padro monoaural foi necessria para realizar as anlises em microcomputador, com placa de som opervel at 44,1 KHz.48 No foi realizada nenhuma converso de largura de resoluo dinmica, originalmente em 16 bits e mantida inalterada, o que exclui a possibilidade de algum algoritmo de "dithering" ou modelamento de rudo (noise shaping) ter adicionado rudo. 6. normalizao das amostras. Os arquivos AIFF convertidos foram editados, e fragmentados em trechos menores, contendo somente os eventos analisveis desejados. Seguindo a edio, foram normalizados em amplitude, num processo que requer a localizao da maior amplitude no intervalo e a amplificao do trecho proporcionalmente maior amplitude. Apesar de ser uma etapa necessria para se preparar as amostras para a anlise, o processo pode realar rudos gerados nas fases anteriores, amplificando-os, e s vezes introduzindo distores no lineares (distoro harmnica diferencial). Dentre estas, a transferncia de meio digital, converso de taxa de amostragem e normalizao das amostras so as etapas com maior potencial para gerao de rudo. Tambm o prprio rudo de fundo acrescido dos sons oriundos de fontes que no os instrumentos musicais mas que exibam intensidades prximas ao nvel de amplitude dos sons musicais quando estes so baixos (como respirao, vozes, arraste dos ps,

48

para permitir a anlise snica. Os pacotes de anlises (WaveLab e Wavesynt) todavia no impem limite de frequncia de taxa de amostragem para o processamento.

142

manipulao de papis, etc.) constituem uma classe de rudos que se pronuncia em diversos das amostras gravadas e analisadas neste trabalho.
SOBRE O RUDO DE FUNDO VERIFICADO NO OITAVO NVEL MAIS FINO E ADJACNCIAS

No 8o (oitavo) nvel mais fino, e tambm nos nveis adjacentes, verifica-se que um rudo grave se manifesta de forma mais intensa, especialmente nas gravaes onde originalmente este tambm j era perceptvel. Todas as origens de rudos abordadas acima podem estar contribuindo para um aumento no nvel de rudo verificado. Estes nveis - em especial o 8o e o 9o nveis mais finos da anlise - apresentam uma textura snica ruidosa, concentrando e segregando componentes ruidosos associados aos rudos de fundo ambiente, manipulao do instrumento, a ressonncias e vibraes de baixa frequncia, e a gestos e modulaes de baixa periodicidade (em frequncias geralmente subsnicas). Por exemplo, verificou-se que se concentra nestes dois nveis a maior parte do rudo grave, de fundo ambiente, originrio da gravao - contribuies no procedentes das
vibraes musicais dos instrumentos.

Em gravaes baixas, i., onde a dinmica fraca e/ou existe uma baixa relao sinal/rudo no som, o processo de normalizao de amplitude acentua a contribuio dos sinais menos intensos e ruidosos codificados nos bits menos significativos das amostras digitais, evidenciando tambm o rudo de quantizao que gerado no processo de amostragem e codificao digital linear PCM (Pulse Coded Modulation). Esta contribuio ruidosa tambm concentra-se principalmente nos 8o e 9o nveis mais finos da anlise. Em vrias anlises de flauta e violino, tambm verificou-se a sensibilidade ao rudo de quantizao nos 11o e/ou 12o nveis mais finos da anlise, que exibiram as maiores amplitudes das formas de onda (envelopes) sobre as reas onde a dinmica era menor, e as menores amplitudes sobre as regies de sustentao das notas, exatamente onde os modos harmnicos estacionrios apresentam maior energia. Em reconstrues seletivas onde o 9o nvel mais fino foi amplificado (i., seus coeficientes foram amplificados) em at 12 vezes seu valor original, verificou-se que contribui com o rudo grave de fundo existente, no se mostrando importante na qualificao de gestos musicais.

143

Nas gravaes originalmente pouco ruidosas, onde o nvel dinmico alto o suficiente para preencher os bits mais significativos de cada amostra digital, o nvel de rudo apresentado nestes nveis menor, ainda que existente devido s outras fontes de rudo em especial as converses de taxa de amostragem e resoluo -

que tendem a

potencializar rudos presentes originais. Tome como exemplo o 8o nvel mais fino da anlise de fraseado ligado, trmulo dedilhado em flauta (o nvel 9 naquela anlise). Trata-se de um nvel pouco energtico, de textura irregular com contornos no suaves, de um som grave e ruidoso, e no demonstra segmentao de notas. A Figura 42 abaixo mostra o espectro (FFT) do sinal original (em verde) e do 8o nvel mais fino (em vermelho) para esta anlise, traado entre 0 e 300 Hz.
Figura 42 - FFT do sinal original (em verde) e do 8o nvel mais fino (em vermelho) entre 0 e 300 Hz

H um realce nas frequncias no 8o nvel mais fino, particularmente entre 50 e 250 Hz, faixa que no sinal original no apresenta amplitudes significativas. Estas bandas no consistem em bandas espelhadas geradas pela anlise/reconstruo wavelet. Note, contudo, que o grfico est normalizado, porque as amplitudes absolutas das linhas espectrais ruidosas so muito pouco intensas.
PERCEPO SONORA RUIDOSA

A sonorizao e subsequente anlise snica destes nveis podem, entretanto, conduzir a uma m interpretao de suas caractersticas e propriedades intrnsecas, mascaradas que

144

podem ser pela atribuio de uma qualidade ruidosa dominante percebida no som gerado. A rotina MATLAB preparada para sonorizar e converter o vetor do sinal em arquivo sonoro implementa uma normalizao de amplitude simples, promovendo um reescalamento dos nveis de amplitude para a faixa (linear) de 1-65536 nveis discretos (codificao para 16 bits/amostra). O MATLAB trabalha normalmente com uma resoluo de 8 bytes/amostra (64 bits/amostra) e uma reduo para 16 bits/amostra normalmente adiciona erros (de quantizao, usualmente aleatrios) ao sinal, traduzindo pequenas flutuaes de amplitude no sinal de alta resoluo em rudo no sinal de baixa resoluo. Felizmente, antes de serem convertidas para o formato MATLAB de alta resoluo todas as amostras foram previamente tratadas e pr-normalizadas, de forma a atenuar sobremaneira a possvel potencializao de rudos esprios nesta fase de sonorizao, e garantir a fidelidade das anlises. Um procedimento aplicvel para se corrigir o nvel de rudo em trabalhos futuros seria a utilizao de tcnicas de modelamento de rudo (noise shaping), muitas vezes referenciadas na literatura de processamento de udio e imagens genericamente como
dithering. Os algoritmos para se implementar tal processamento no so, todavia,

triviais, sua implementao implica em custos significativos, e os melhores algoritmos/sistemas de noise shaping atualmente so proprietrios (marcas registradas), desenvolvidos por indstrias do mercado de udio profissional. H evidncias ainda de que gestos de sopro podem ser localizados nestes nveis mais baixos ao redor do oitavo e nono mais finos, confirmadas pela localizao de objetos sonoros que casam com estruturas localizadas em nveis mais finos, onde o rudo e gestos de sopro so mais visveis.
O imageamento ou gerao de bandas espelhadas

Em praticamente todas as anlises e em vrios nveis verificou-se a ocorrncia de um fenmeno gerador de uma forma de modulao de amplitude sobre os sinais musicais. A anlise espectral (FFT) destes nveis mostra linhas espectrais organizadas em bandas lateralmente distribudas ( esquerda e direita) em relao a uma frequncia central, no populada (usando-se a terminologia apropriada: com a portadora suprimida, i., sem a presena da linha espectral central).

145

Em alguns exemplos uma flutuao peridica era observada no grfico do nvel e perceptvel auditivamente, sugerindo que houvesse uma frequncia ou grupo de frequncias modulantes bem mais baixas que uma frequncia (central) portadora, tal que a distncia entre as linhas (bandas) laterais do seu espectro fosse curta, usualmente inferior a 100 Hz, e consequentemente a taxa de flutuao (batimento) fosse em baixa frequncia, o suficiente para ser perceptvel grfica e auditivamente. Noutros casos a identificao de bandas laterais no espectro e a visualizao da flutuao no sinal eram mais complexas, impedindo um claro reconhecimento das supostas frequncias modulantes e portadora, ou mesmo sugerindo a existncia de mltiplas portadoras. Em primeira anlise, a modulao em amplitude poderia ser oriunda de gestos musicais modulando o sopro (para a flauta) ou o arraste do arco (para o violino) de maneira sutil e imperceptvel, mas que fossem reveladas pela anlise wavelet na forma de flutuaes peridicas nos sinais dos nveis wavelets. Neste caso, a frequncia modulante seria nica e de baixa frequncia, enquanto as linhas espectrais do sinal musical comporiam um grupo de portadoras, em oposio modulao de amplitude convencional onde uma nica portadora modulada por um grupo de frequncias modulantes de baixa frequncia. Todavia, a ausncia de portadora e a constatao de modulaes numa larga faixa de frequncias (particularmente entre 70 e 4000 Hz, alm das limitaes fisiolgicas para a produo de gestos fsicos com esta periodicidade) afastaram esta hiptese. De fato, as caractersticas que os sinais modulados apresentavam no sugeria que uma modulao de amplitude (AM - Amplitude Modulation) convencional estivesse ocorrendo, porque o efeito no se manifestava regularmente para todos os tons/notas, nem para todos os nveis, assim como tambm afastava a possibilidade de uma forma de modulao de amplitude mais simples conhecida por modulao de anel (ring
modulation), onde a portadora geralmente suprimida. Alm disso, no se manifestara

o padro e orientao das bandas laterais esperados de uma AM para quando um sinal de baixa frequncia (gestos) modula sinais de frequncia bem mais alta (vibraes musicais). A modulao produzida, entretanto, apresentava uma caracterstica comum em todas as suas ocorrncias, independente do tom ou nvel onde ocorria, fato que norteou sua decifrao e determinao de sua causa.

146

A causa est no algoritmo de decomposio e reconstruo wavelet utilizando-se estruturas piramidais, em particular no processo de reconstruo onde as etapas de superamostragem (2) provocam um efeito de imageamento ou replicao de bandas, usualmente espelhadas em relao a uma frequncia central que um divisor da frequncia de amostragem, i., uma frao racional da frequncia de amostragem (1/64fa, 1/128fa, etc.). A figura abaixo mostra como cada etapa do processamento no algoritmo piramidal age sobre um sinal x() no domnio da frequncia.
Figura 43 - Decomposio seguida de reconstruo (canal passa-alta do algoritmo wavelet)

x() -i

i
Gx()

2.G x()

i + k =
-k -i

(2)(2)G x()

i k
x'( )=G(2)(2)G x()

-/2

/2

Na decomposio o sinal filtrado ( Gx ) e decimado ( (2)Gx ). A decimao provoca um dobramento de frequncias, esticando x() em x(/2), e tambm gera uma imagem x(/2 + ) que aparece mais prxima de x(/2), isto , gera aliases. Caso x() no seja adequadamente limitado em frequncia ( x()=0 p/ || >/2 ) haver superposio destas bandas (aliasing). Na reconstruo a superamostragem (2) provoca a compresso do espectro e imagens das bandas comprimidas aparecem prximas a elas, o suficiente para ,em sinais de udio, equivaler a um efeito de modulao de amplitude. Veja na figura acima (decomposio seguida de reconstruo sem edio dos coeficientes) como o sinal x'() reconstrudo passa a apresentar bandas laterais espelhadas ao redor de fraes racionais divisoras da frequncia de amostragem (a= 2 fa=44100 amostras/s).

147

Algumas bandas presentes no sinal podem ser realadas, e a baixa eficincia da filtragem em eliminar as frequncias causadoras de aliasing um problema detectado neste esquema de decomposio, particularmente para wavelets menos regulares. Strang (1996) aborda o efeito de imageamento associado ao processo de reconstruo.[78] A anlise de sustentao com frulato para flauta documenta e caracteriza bem a ocorrncia do efeito de imageamento.
O efeito harmonizador

A audio do tema meldico no 5o nvel mais fino da anlise de fraseado ligado


normal para flauta (nvel 13 para este exemplo) revela dois aspectos importantes:

1. Surgem novas vozes para algumas notas, arranjadas em acorde (tendendo a compor uma funo harmnica), e 2. A melodia no nvel diferente da melodia original, pois que algumas notas esto em tons diferentes, havendo migrado intervalos variando de um semitom a vrios tons. As notas parecem haver migrado porque o que se ouve num nvel especfico so aqueles harmnicos que passam pela banda de passagem do nvel, alm claro das possveis bandas espelhadas (imagens) que so percebidas como pitchs de novos tons, formando novas vozes. Os parciais da srie harmnica da nota original podem naturalmente consistir em fundamentais para outras notas que esto a distncias intervalares fixas da nota original na escala musical. A figura abaixo mostra um exemplo ilustrativo disto:
Figura 44 - Harmnicos da srie de f2 (F2) como notas/tons na escala musical
f5 (8:1) mib5 (7:1) l4 (5:1) d5 (6:1) f4 (4:1) d4 (3:1) f3 (2:1) f2 (1:1)

Clave de Sol

frequncia
(notas)

Clave de F

A nota f2 (F2, inscrita na pauta de baixo, em clave de f) possui uma srie harmnica onde seus modos parciais podem ser considerados fundamentais de outras notas na escala. Por exemplo, a nota f3 (F3), que est uma oitava acima de f2, possui como

148

fundamental exatamente o segundo harmnico de f2; da mesma forma, d4 (C4) tem no terceiro harmnico de f2 a sua fundamental, e assim por diante, at a nota f5 (F5), que tem como fundamental o oitavo harmnico da srie de f2. Adicionalmente, a gerao de bandas laterais espelhadas ao redor de divisores (fraes racionais) da frequncia de amostragem faz surgir pitchs inexistentes no som original, que por sua vez podem consistir em fundamentais de outras notas na escala musical. A Figura 45 mostra a melodia tocada para esta anlise de fraseado ligado normal (flauta), e a Figura 46 seguinte mostra uma boa aproximao para a melodia/harmonia gerada ao 5o nvel mais fino: 49
Figura 45 - Melodia tocada - Anlise de fraseado ligado normal (flauta)

Figura 46 - Melodia percebida no 5o nvel mais fino (anlise de fraseado ligado normal, flauta)

A Figura 47 mostra o que ouvido no 6o nvel mais fino:


Figura 47 - Melodia percebida no 6o nvel mais fino (anlise de fraseado ligado normal, flauta)

A Figura 48 mostra a partitura sugerida para a melodia no 7o nvel mais fino:


Figura 48 - Melodia percebida no 7o nvel mais fino (anlise de fraseado ligado normal, flauta)

A funo harmnica ou tipo de acorde que se forma vai depender de vrios fatores:

aproximao porque as notas e suas alturas (pitchs) podem ser percebidas diferentemente, e diferentes pessoas podem atribuir a elas diferentes tons, microtons, interpretar uma mudana na tonalidade central, ou mesmo admitir a existncia de uma escala no temperada.

49

149

(1) a tonalidade da nota original, que ir determinar a posio no espectro da srie

harmnica da nota, e sob quais nveis wavelet ela ir contribuir com maior energia
(2) as intensidades relativas de cada um de seus harmnicos; alguns deles, mais

realados, podero produzir bandas espelhadas tambm realadas, e que podem eventualmente constituir-se no pitch mais relevante, uma nova voz que se sobressai
(3) o timbre do instrumento, que influi no padro exibido de intensidades relativas

dos vrios parciais harmnicos.


(4) a wavelet utilizada e o seu grau de regularidade, que iro determinar a quantidade

de sintonia nas bandas cobertas pelos nveis, e assim reduzir os efeitos de imageamento de bandas. Wavelets mais regulares propiciam bandas de passagem mais sintonizadas e uma atenuao maior nas frequncias acima desta banda.
Wavelets menos regulares apresentam uma banda de passagem definida e

individualizada, mas no apresentam um corte efetivo para as frequncias acima desta banda, admitindo uma srie de pequenas bandas em atenuao progressiva medida que cresce a frequncia, como mostra a Figura 9 no item 2.2 (p.32). O arranjo com que os parciais harmnicos de um timbre instrumental (como flauta ou violino) organizam suas intensidades relativamente entre si propicia percepo de um timbre nico e com uma identidade individualizada. A anlise wavelet em multiresoluo produz nveis onde as intensidades relativas entre os parciais ali presentes (i., o arranjo de harmnicos por nvel) no levam a uma fuso de forma a permitir a percepo do timbre, segregando a composio harmnica dos tons. Os nveis passam a exibir um timbre dissociado do original, dificultando a percepo do instrumento original. A percepo do timbre ser mais fcil pela anlise dos transientes, anlise de envelopes e da textura snica dos nveis, que forneam indcios sobre o tipo de excitao presente, sobre a forma de estabelecimento das vibraes e sobre as regies de colapsos. Neste processo de dissociao, vozes adicionais so geradas, produzindo acordes ou funes harmnicas pela sua combinao. Uma possibilidade a de que alguns harmnicos venham a produzir uma nova voz num nvel especfico, eventualmente compondo um acorde com outras vozes derivadas de outros harmnicos originais ou das bandas espelhadas destes, as quais na maioria das vezes no constituem parte integrante

150

da srie harmnica original, mas sim da srie harmnica de outras notas da escala cromtica. A intensidade relativa entre os harmnicos presentes num nvel parece ser o fator mais importante que ir determinar quais deles se integraro numa s voz perceptvel. Assim a dissociao da srie harmnica e o imageamento causado pelo processamento
wavelet constitui-se numa espcie de ferramenta harmonizadora, produzindo acordes

pela replicao e fuso de (bandas de) frequncias. Mais estudos dirigidos s leis de formao de acordes devem ser feitos tal que possa-se utilizar deste efeito harmonizador com um maior de grau de controle sobre o processo. Nas anlises realizadas verificou-se que os tons gerados por esse processo estavam inscritos na escala cromtica, i., eram percebidos como notas afinadas, em harmonia com outros tons (veja por exemplo a anlise de ataques normais de flauta, nota si4).
Anlise tempo-escala

Uma alternativa til para se interpretar os efeitos modulantes gerados pelo processamento na reconstruo wavelet abordar cada nvel da anlise em multiresoluo como uma verso do sinal original vista sob uma determinada escala. Oriundos de uma anlise de tempo-escala, os nveis corresponderiam a projees do sinal original vistas sob uma escala especfica. Esta por sinal a essncia da anlise tempo-escala. A gerao de escalas no algoritmo utilizado baseado em grades didicas, isto , as escalas so potncias de 2, e so obtidas por um processo simples de filtragem e decimao reduzindo a resoluo pela metade enquanto dobra a escala. Na decimao, certos razes das frequncias presentes originalmente podem ser realadas, num fenmeno de aliasing. A baixa eficincia da filtragem em eliminar as frequncias causadoras de aliasing um problema detectado neste esquema de decomposio. Na sntese, quando se geram tambm os sinais dos nveis, ocorre o imageamento (ou replicao) de bandas, o qual leva definitivamente s raias espelhadas entre si ao redor de uma frequncia que sempre uma razo racional da frequncia de amostragem, e geralmente apresentando amplitudes diferentes. Assim vibratos (de amplitude, para a flauta) poderiam estar facilmente visveis em alguns nveis especficos, como se eles modulassem mais certas faixas de frequncias

151

do espectro. Desse ponto de vista, modulaes de amplitude podem "residir" nalgumas escalas, enquanto ausentam-se noutras. O fato de que a transformada reversvel (desde que se no se edite os coeficientes entre a decomposio e a reconstruo) nos assegura que no existe um erro a priori no algoritmo. Como dito anteriormente, o banco de filtros de reconstruo realiza o processamento inverso do banco de decomposio, e os coeficientes dos filtros so escolhidos de maneira a cancelar os efeitos de aliasing e distoro, permitindo uma reconstruo perfeita. A equipe do pacote WaveLab, da Universidade de Stanford, foi informada sobre o efeito de imageamento gerado pela rotina de anlise em multiresoluo (plotmra.m), produzindo novas frequncias e um efeito de modulao de amplitude sobre os sinais dos nveis, mas at o desfecho final deste texto no havia comentado o fenmeno.
Reconstrues seletivas e compresso de dados

Verificou-se em todas as anlises que os nveis mais baixos, usualmente do 1o (primeiro) nvel mais grosso ao 9o (nono) nvel mais grosso50, no contribuem significativamente ao contedo energtico do sinal original, e reconstrues realizadas desprezando-se os coeficientes destes nveis (zerando-os) mostraram que no h perda significativa na qualidade do som, seja na textura do timbre, ou na informao quanto a eventos musicais existentes na amostra. Em algumas anlises esta faixa de insensibilidade foi mesmo maior, alcanando tambm o 10o (dcimo) nvel mais grosso. Em todas as anlises a eliminao dos coeficientes do 1o (primeiro) ao 8o (oitavo) nvel mais grosso para efeito de reconstrues seletivas no provocou nenhuma perda de qualidade perceptvel do som, igualando-se estas aos sinais originais. A eliminao destes nveis consiste numa forma direta (e trivial) de compresso de dados, o que possibilitado pela natural capacidade descorrelacionadora da transformada wavelet, reduzindo a entropia presente no sinal pela codificao. Para sinais de extenso 262144 pontos amostrais (218), desprezar-se coeficientes do 1o ao 9o nveis mais grossos implica na eliminao de somente 1024 pontos amostrais, o que representa uma reduo de

50

contando-se do nvel mais grosso em direo aos nveis mais finos.

152

aproximadamente 0,4% na quantidade de dados. Para sinais de extenso 131072 (217) a reduo seria de 0,78%, e para sinais de extenso 65536 (216), de 1,56%.51 Os nveis mais finos -em particular o nvel mais fino- so muito importantes para efetivar a transmisso das informaes musicais contidas nos gestos e eventos musicais, e tambm para garantir a preservao da qualidade do timbre, sua constituio espectral e textura perceptvel. A eliminao destes nveis em reconstrues seletivas trouxe perdas significativas, alterando por completo o som. Todavia, conforme verificado em vrias reconstrues seletivas, a eliminao somente do nvel mais fino - especialmente
para wavelets de anlise mais regulares- no leva a perdas significativas na informao

gestual, e o sinal reconstrudo eventualmente no apresentar diferenas relevantes na sua qualidade sonora em comparao ao original52. A eliminao dos nveis mais finos para efeito de reconstruo seletiva usualmente leva a uma perda das informaes codificadas nas bandas mais agudas, e influi principalmente na textura snica percebida, gerando sons "speros" ou "granulosos", embora tal efeito seja sutil, e seja mais evidente para a wavelet de anlise D4 do que para D16. Este fato nos leva s seguintes constataes: (1) o nvel mais fino contm detalhes que so importantes na textura final do timbre, e (2) o nvel mais fino apresenta amplitudes mdias e energia inferiores aos nveis menos finos subsequentes, e sua ausncia numa reconstruo altera sutilmente a qualidade do som final, sem no entanto implicar numa perda significativa de qualidade. A percepo deste nvel como um rudo agudo, com pouca informao audvel sobre os eventos musicais tocados, compreensvel, haja visto estarmos submetendo o nosso sistema auditivo ao som do nvel mais fino e agudo da anlise, o qual no apresenta componentes nas faixas de maior sensibilidade do sistema auditivo (1000 a 3000 Hz).

A eliminao do 9o nvel mais grosso para sinais dessa extenso entretanto j produz maiores perdas. Evidentemente que outras tcnicas adicionais tratando os coeficientes dos nveis superiores devem ser empregadas a fim de se utilizar wavelets para finalidades de compresso de dados, produzindo taxas de compresso muito mais elevadas (acima de 100:1).
52

51

A perda ser maior quanto menos regular for a wavelet e mais alto em frequncia for o registro da nota musical, e usualmente reflete-se numa textura granulosa imposta ao sinal.

153

Os mecanismos de transmisso da energia acstica/mecnica nos fluidos auditivos e na membrana basilar apresentam uma atenuao de frequncias nas faixas mais altas, implicando numa menor sensibilidade nesta faixa devido menor capacidade de transferncia de energia para as clulas ciliadas, as "clulas nobres do ouvido interno" que so os transdutores da energia mecnica em pulsos eletroqumicos neurais (p.261, cap.30, [29]). Enviar ao ouvido o nvel mais fino de uma anlise wavelet significa enviar um som contendo somente componentes que vo sensibilizar uma regio especfica e limitada da membrana basilar: aquela prxima base da membrana, onde a resoluo em frequncia menor, bem como o mecanismo de interpretao mais complexo. Tambm maior a impedncia mecnica da membrana transmisso de frequncias altas, repercutindo numa menor sensibilidade. Eventualmente, quando os tons em anlise situavam-se num registro mais alto (oitava 4 ou 5) as reconstrues eliminando o nvel mais fino (e tambm o segundo nvel mais fino) provocaram o aparecimento de vozes adicionais devido alterao na organizao original dos modos da srie harmnica (principalmente no que diz respeito s amplitudes relativas dos modos). O efeito direto disso est na quebra da fuso das linhas/bandas espectrais em um tom e timbre nicos. Os nveis finos intermedirios -entre o segundo nvel mais fino e os 9 primeiros nveis
mais grossos- frequentemente coincidem com os nveis mais energticos (aqueles que

concentram em conjunto mais de 99% da energia do sinal), e sua eliminao em reconstrues seletivas alteram significativamente o sinal reconstrudo, seja pela atenuao das informaes musicais, seja pela perda do timbre nico perceptvel do instrumento. A eliminao de um s deles usualmente produz um som onde a sua ausncia reflete-se na gerao de vozes (tons) adicionais, de timbres diferentes do timbre do instrumento original. Se o nvel concentrar consideravelmente informaes sobre algum gesto importante, geralmente ocorrer atenuao na percepo deste. A percepo disso pode entretanto numa primeira audio ficar mascarada, porque o efeito da deteriorao do timbre original e a gerao de tons adicionais mais proeminente. Usualmente, quanto maior for a diferena dos pesos de reconstruo de nveis vizinhos, maior ser a desintegrao do timbre e mais perceptvel ser o efeito harmonizador, pela gerao de vozes mais proeminentes.

154

A eliminao de dois nveis adjacentes geralmente produz um arranjo tonal diferente, corrigindo os efeitos causado quando um s nvel desprezado. Isto pode ser verificado por um simples experimento, qual seja o de analisar uma senide pura na faixa de udio, analis-la com o sistema de AWMR, e em seguida reconstrui-la desprezando um nvel intermedirio. No som reconstrudo usualmente aparecero tons adicionais, diferentes da frequncia da senide original. Se se realizar outra reconstruo desta vez eliminando mais um outro nvel adjacente observa-se que os tons da reconstruo anterior so atenuados ou mesmo eliminados, e outros surgem. Eventualmente, dependendo da frequncia da senide e dos nveis que se edita, a produo de tons adicionais pode ser bastante atenuada se dois nveis vizinhos so desprezados, em oposio a um s. A eliminao de nveis intermedirios alternadamente (isto , zera-se um e mantm-se o outro) usualmente produz reconstrues onde novas vozes (tons) surgem em acorde e o timbre original no reconhecvel. Quanto mais nveis so eliminados menor ser a percepo do timbre original e a perda da informao musical. Isto mostra que a transformada wavelet implementada por este algoritmo pode transformar um som completamente pela simples edio de seus coeficientes, alterando sua composio espectral, a fuso dos modos harmnicos, os eventos musicais e o timbre percebidos. O potencial para trabalhos de sntese grande, mas o controle deste processo no trivial, e pode necessitar de manipulaes espectrais adicionais. A escolha da wavelet ou conjunto de wavelets apropriadas tambm crtica.
Diferenas relevantes entre a anlise com D4 versus D16

As anlises com D4 mostraram ataques melhor caracterizados nos nveis mais finos, em particular no nvel mais fino, onde foi observado uma maior contribuio do contedo harmnico do tom em relao ao contedo harmnico observado para este nvel na anlise com D16. O nvel mais fino da anlise com D4 cobre frequncias mais baixas no cobertas pelo nvel mais fino da anlise com D16, o que perceptvel pela audio comparativa dos mesmos. Seu som apresenta ainda uma textura menos aguda que o som do mesmo nvel para D16. Isto mostra que wavelets diferentes encampam diferentes propriedades e detalhes do sinal por apresentarem bandas passantes de formato e alcance tambm diferentes. D4

155

menos seletiva, e permite a passagem de componentes que so atenuadas por D16, alterando o contedo frequencial de cada nvel da anlise, e consequentemente o seu som. Evidentemente, a excluso do nvel mais fino da anlise com D4 em reconstrues seletivas levar a uma maior degradao do timbre, percebida como uma granulosidade ou leve aspereza na textura snica, e eventualmente ocorrer a gerao de vozes pela desintegrao dos harmnicos mais altos da srie harmnica encampados na sua banda de passagem (efeito harmonizador). A avaliao do padro exibido de distribuio de energia linear praticamente a mesma tanto para a wavelet de anlise D16 quanto para a wavelet de anlise D4. No entanto, quando observamos o grfico de distribuio de energia em escala logartmica, verificamos que a energia se distribui mais uniformemente pelos nveis de uma anlise com D4, numa gradao mais suave entre a energia de um nvel e do nvel adjacente (degrau menos alto), como pode-se verificar comparando os grficos de distribuio (em escala logartmica) dos mesmos sinais analisados ora com D4, ora com D16. Um outro aspecto a ser notado a melhor resoluo propiciada pelas wavelets mais regulares nos sinais dos nveis mais grossos. D16, por exemplo, por ser mais regular, suave o suficiente para permitir ainda uma boa aproximao do sinal original nestes nveis, com formas de onda tambm mais regulares, e ampliando as possibilidades de extrair informaes relevantes sobre os eventos e estruturas musicais nos nveis mais baixos. O formato das estruturas em nveis mais baixos (em especial do 1o ao 6o nveis mais grossos) ficam muito semelhantes wavelet utilizada, tornando menos bvia a extrao de informaes musicais do sinal quando a wavelet menos regular. D4, por exemplo, leva a representaes do sinal menos suaves, j insinuando a sua forma de onda mais intensamente.
Consideraes sobre a qualidade e a inteno das gravaes

Numa produo musical existe sempre a preocupao em se valorizar determinados aspectos e componentes musicais de forma a dar a forma desejada ao som, atendendo a exigncias ou especificaes do compositor, do produtor e dos instrumentistas. Frequentemente o engenheiro de udio deve agir no sentido de propiciar o destaque

156

adequado a determinado instrumento, capturar detalhes especiais, sons acessrios e amplificar estruturas musicais pouco perceptveis normalmente. Para tanto, faz uso de diferentes tcnicas de microfonao, gravao, edio e processamento do som, que produzem substancial impacto sobre a qualidade da produo final. Cabe notar que cada regio de um instrumento musical irradia um som diferente em amplitude e composio espectral. Numa flauta, o som proveniente do bucal bem diferente daquele que se ouve no p do instrumento. Num violino, o som das cordas apresenta um alcance dinmico e qualidade tmbrica muito diferente do som que irradiado nas aberturas em f. Por exemplo, captar-se o som de um fraseado apontando um microfone direcional para o bucal da flauta permite a captura dos mnimos rudos de origem bucal, lingual e respiraes, enquanto a captura do som irradiado pela extremidade oposta (o p) valoriza algumas faixas mais graves da srie harmnica e excluem substancialmente os rudos e transientes ouvidos no bucal. As amostras sonoras que foram analisadas neste trabalho foram gravadas com um microfone direcional, extremamente capaz de capturar estruturas sonoras normalmente no percebidas em audies de auditrio, como rudos bucais, rudos produzidos pela mudana de dedilhados, respiraes, e tambm variaes de posio. Para as gravaes de violino, o microfone foi posicionado a uma distncia entre 40 e 60 cm do instrumento, em altura do cho aproximadamente igual altura do instrumento, e com foco centralizado sobre o cavalete. Esta microfonao permitiu a captura de rudos dos gestos interpretativos, da irradiao das cordas e aberturas em f, arraste do arco, e eventualmente respiraes da intrprete. Para as gravaes de flauta, o microfone foi posicionado entre 40 a 60 cm do instrumento, em altura ligeiramente superior altura do instrumento em relao ao piso, apontado para a cabea em ngulo de aproximadamente 45o com o eixo da flauta, com foco no tubo cerca de 6 a 8 cm abaixo do bucal. Isto permitiu a captura do sopro, da irradiao mais "brilhante" (faixas mais agudas), e tambm de estalidos, gestos bucais diversos, respirao e rudos de dedilhado. Originalmente, gravaes foram realizadas em quatro posies: uma com foco sobre o bucal, outra com foco sobre o corpo do instrumento (onde se localizam as teclas), outra com foco na regio da abertura ao fim do tubo (p), e na posio padro descrita acima. A escolha por adotar esta ltima conciliou diversos aspectos no que tange ao que se

157

desejava evitar em excesso (rudos bucais, respirao, estalidos intensos, movimentao da embocadura, etc.) e aquilo que desejava-se capturar (brilho sonoro, sopro, timbre caracterstico da flauta transversa). Verificou-se que a adoo de outras posies para o microfone exerce substancial influncia sobre a captura de gestos musicais, e consequentemente sobre a capacidade de analis-los e correlacion-los com as tcnicas de interpretao. Se a inteno da anlise repousa sobre objetivos didticos e estudos de ordem musicolgica, onde a avaliao dos gestos mais discretos reveste-se de importncia para melhorar a tcnica de interpretao, a microfonao a ser utilizada deve focalizar os pontos dos instrumentos onde ocorre a excitao. Se, no entanto, a inteno analisar o timbre geral e o impacto de gestos musicais sobre a expressividade percebida e variaes no tempo do espectro irradiado, as melhores opes aconselham evitar o foco nas regies de excitao e manipulao de dedilhados, dispor o microfone em ngulos menor ou igual a 45o com o eixo do instrumento (aproximando-o de um eixo paralelo), adotar distncias maiores tal que se capte a irradiao proveniente de vrios pontos, e mesmo utilizar microfones com caractersticas direcionais alternativas (respostas polares diferentes, como padres cardide, supercardiide, etc.).
Enumerao alternativa para os nveis

Uma forma alternativa de se enumerar os nveis de uma AWMR, atendendo simplesmente a uma maior facilidade notacional, consistiria em tomar o nvel mais fino como o primeiro nvel (nvel 1) e o menos fino ou menos resolvido como o nvel X (se a amostra original possuir 2X pontos). Esta nomenclatura alternativa poderia facilitar a referncia a nveis correspondentes de anlises de sinais diferentes que possuam extenses tambm diferentes, agilizando a identificao dos diversos nveis da anlise. Esta forma de enumerao mais prtica no sentido de ser independente do nmero de nveis ou da extenso da amostra sonora, uma vez que o nvel mais fino sempre ser o nvel 1 e os outros subsequentes so numerados em ordem crescente, at o nvel menos fino. A tabela de distribuio de gestos/eventos musicais por nveis wavelets, compilada no item conclusivo a seguir, utiliza preferencialmente esta ordenao para enumerar os nveis de uma AWMR.

158

Consideraes sobre o WaveLab

O pacote WaveLab atendeu como ferramenta aos objetivos propostos de anlise de gestos musicais. Suas vantagens principais esto na portabilidade dos cdigos e rotinas para diversas plataformas computacionais que suportam o MATLAB, e na filosofia adotada de permitir a reproduo da pesquisa e seus resultados eletronicamente, disponibilizando no somente o documento em texto, mas o software em si. Adicionalmente, os algoritmos codificados baseiam-se em implementaes discretas da transformada com bancos de filtros, um esquema veloz e com baixo custo computacional. Desvantagens esto nas limitaes da plataforma MATLAB, principalmente em relao ao esquema de entrada e sada de dados, de sonificao dos sinais (especialmente em plataformas PC's), do gerenciamento de memria e na traduo dos cdigos em MATLAB para cdigos executveis de baixo nvel. O MATLAB indubitavelmente uma plataforma adequada para experimentaes, pesquisas e validaes, no para implementaes de sistemas endereando a otimizao de velocidade e eficincia de entrada e sada. Adicionalmente, o algoritmo piramidal utilizado pelo WaveLab produz efeitos de imageamento na gerao dos nveis wavelets de um AWMR ou quando h a edio dos coeficientes entre a decomposio e reconstruo. Existem atualmente diversos outros pacotes e/ou sistemas computacionais para anlise
wavelet disponveis tanto na Internet (gratuitamente) quanto para aquisio (sistemas

comerciais), cada qual com suas prprias caractersticas, vantagens, desvantagens, e orientao a aplicaes e mquinas especficas. Entre muitos podemos citar o Wavelet
Toolbox para MATLAB da MathWorks (http://www.mathworks.com), o WaveBox, etc. As alternativas existentes para se implementar algoritmos wavelets so

muitas, e a escolha de um sistema ou paradigma de implementao deve atender s necessidades e requisitos do projeto a se desenvolver. As caractersticas que motivaram e justificaram o uso do pacote WaveLab neste trabalho atenderam ao propsito desta pesquisa acadmica, mas no atendero diversos requisitos prticos para implementao de sistemas de anlise mais robustos, portveis, adaptados ao processamento de sinais especficos, e orientados para operao em tempo real, devido principalmente a limitaes em velocidade, dependncia de outro pacote computacional (MATLAB),

159

limitaes da linguagem, deficincias na documentao, inadequao da circuitaria eletrnica (projeto do hardware) e do algoritmo para aplicaes especficas.

5.3 Concluses
As anlises realizadas no objetivaram uma caracterizao completa dos eventos e gestos musicais abordados. A anlise qualitativa visual e auditiva dos nveis o principal objeto de interesse no momento, fornecendo subsdios para fundamentar trabalhos futuros de anlise e sntese de timbres musicais. Sem dvida alguma a anlise com wavelets comprovou a complexidade de um tom natural de violino: as estruturas peridicas e transitrias em cada faixa de frequncias (nvel wavelet) possuem uma evoluo no trivial, sensvel aos gestos musicais cujas propriedades mudam continuamente (presso de arraste, dedilhado, velocidade, etc.), cultuando a variabilidade da msica. Semelhante constatao se aplica flauta. A maioria dos eventos amostrados compreenderam notas musicais situadas nas 3a e 4a oitavas de frequncias segundo o padro de referncia adotado para a escala temperada.53 A figura abaixo mostra, em partitura na clave de sol, a extenso deste intervalo que compreende essas duas oitavas. O d central do piano (C3) corresponde ao primeiro d na flauta transversa (o d mais grave); o l padro, em 440 Hz, o l3 (A3), tambm indicado na figura.
Figura 49 - Intervalo das terceira e quarta oitavas da escala temperada (registro em clave de sol)

C3

D3

E3

F3

G3

A3

B3

C4 Quarta oitava

B4

C5

Terceira oitava

importante frisar o intervalo de frequncia (ou registro tonal) onde a maioria dos eventos aqui analisados se situam, porque um deslocamento de uma (ou mais) oitava(s) para cima ou para baixo implicar diretamente num deslocamento dos padres snicos

53

A escala temperada apresentada no Glossrio.

160

de um ou mais nveis, para cima ou para baixo, alterando a identificao e a percepo dos componentes e estruturas musicais. As notas distribuem-se por vrios nveis, mas a concentrao de suas caractersticas e energia em certos nveis funo do seu registro tonal: notas mais graves se concentraro em nveis mais baixos do que as notas mais agudas. Se duas notas possuem a mesma expressividade e foram geradas com uma mesma dinmica, mesmo tipo de ataque, modulaes e efeitos, ento elas possivelmente tero descries semelhantes numa sequncia de nveis consecutivos da anlise wavelet. Entretanto, se foram tocadas em oitavas diferentes, suas sequncias consecutivas no coincidiro em ocupar os mesmo nveis, exatamente por elas ocuparem registros tonais diferentes, estando deslocadas entre si de um certo nmero de nveis, para cima ou para baixo. Por exemplo, transientes presentes nos 7o e 8o nveis mais finos, localizando um ataque acentuado de uma nota mi4 (E4) em violino, vo se transferir para os 8o e 9o nveis mais finos caso a nota acentuada seja um mi3 (E3), ou para os 6o e 7o nveis mais finos, caso seja um mi5 (E5). Na maioria das vezes as notas - tomadas as anlises dos perodos de sustentao, excluindo-se os perodos transitrios do ataque e colapso - distribuem-se numa AWMR concentrando quase a totalidade de sua energia em 4 nveis consecutivos, possuindo pouca energia distribuda nos outros nveis da anlise. Estas so caractersticas da anlise wavelet que a aproxima do tipo de representao usada em partituras, onde a frequncia (tons/registro) organizada verticalmente, e o tempo horizontalmente. Os tons se distribuem numa escala vertical, do nvel mais grosso (grave) at o mais fino (agudo), e o tempo se distribui na escala horizontal. Todas as notas executveis tanto na flauta como no violino apresentam sries harmnicas descritas nos primeiros 7 nveis mais finos de uma AWMR. A nota mais baixa executvel - um sol2 (G2) no violino, com pitch percebido em 196 Hz (na prtica,
a fundamental) - apresentar uma srie harmnica distribuda a partir do 7o nvel mais

fino da anlise, que cobre esta faixa de frequncias. Os nveis mais baixos fundamentalmente no apresentam contribuies das sries harmnicas. Em acentos, subidas e descidas observadas nas fases de ataque apresentam altas taxas de variao na amplitude, refletindo-se em estruturas como rampas ngremes nas representaes grficas do sinal nos primeiros oito nveis mais finos da anlise.

161

O nvel mais fino usualmente contm a maior parte dos rudos provocados pela excitao dos instrumentos, seja o rudo do arraste do arco no violino, ou o rudo do sopro na flauta. Um aspecto importante que este nvel quase no fornece informao auditiva para se determinar o tom de notas diferentes situadas at a 3a oitava da escala musical, frequentemente exibindo-as com mesmo pitch e qualidade de timbre idnticas, a de um rudo spero e agudo. A causa fundamental deste efeito est na contribuio irrelevante da srie harmnica do tom neste nvel, impedindo a sua identificao. Para notas situadas em registros mais altos (acima da 4a oitava) verifica-se alguma contribuio da srie harmnica no nvel mais fino, e a diferenciao das tonalidades torna-se possvel. Transientes associados a gestos de sopro e arco mostraram-se presentes nos trs primeiros nveis mais finos, no 7o e 8o nveis mais finos, e eventualmente no 9o nvel mais fino em anlises de acentos. O 7o nvel mais fino para as anlises de violino mostrou-se capaz de revelar sons e processos snicos em ao na caixa ressonante do instrumento, merecendo a denominao de nvel da madeira em funo desta propriedade. O 8o nvel mais fino para a maioria das anlises mostrou concentrar rudos de baixa frequncia, normalmente rudos de fundo ambiente e de quantizao. Os nveis mais energticos so aqueles que conjuntamente concentram mais de 99% de toda a energia do sinal analisado. Usualmente apresentam quantidade de energia variando de 1 a 4 ordens de grandeza acima dos nveis menos energticos, a diferena sendo maior em relao aos nveis mais grossos abaixo, e menor em relao aos nveis mais finos no energticos acima. Os grficos de distribuio de energia em escala linear permitem uma rpida identificao destes nveis. A audio dos nveis mais energticos mostra serem eles os que concentram a maior contribuio da srie harmnica dos sinais musicais, isto , onde a maior parte da energia das vibraes musicais do instrumento se concentra. Adicionalmente, so tambm nestes nveis onde ficam menos aparentes transientes, alteraes bruscas e descontnuas associadas a gestos sbitos e intensos. Tais objetos so melhor visualizados em outros nveis, acima e abaixo dos mais energticos. A segmentao das notas num fraseado analisado vai melhorando do nvel mais fino em direo aos menos finos abaixo, at atingir sua melhor forma nos nveis mais

162

energticos, onde a regularidade da forma de onda e suavidade do envelope so maiores, e piorando novamente nos nveis mais grossos subsequentes. O nvel mais energtico revela o envelope mais regular, formas de onda suaves, e os tons mais puros, de percepo clara e lmpida, sem clicks ou estalos. Dois fatores concorrem para esta percepo auditiva espetacular dos nveis mais energticos: o fato de as componentes harmnicas mais intensas e influentes sobre o
pitch percebido dos tons se situarem nas faixas de frequncias cobertas por estes nveis,

o que leva a um evidente destaque da composio harmnica (estacionria) presente, e o fato de usualmente os nveis mais energticos cobrirem a faixa de frequncias onde melhor a audibilidade humana: entre 1000 e 3000 Hz (KOBRAC apud
[29]

).

De posse das anlises de eventos e gestos musicais expressivos realizados para interpretaes de flauta e violino, e aps a avaliao de seus resultados mais relevantes, pode-se traar as seguintes concluses gerais: 1. A anlise wavelet em multiresoluo (AWMR) til para separar rudos (agudos e graves), transientes, e a poro estacionria e mais energtica normalmente associada srie harmnica das vibraes musicais. 2. til para identificar e isolar em nveis especficos os gestos musicais (gestos de sopro, bucais, de arco e dedilhados) produzidos em adornamentos, efeitos, ataques e fraseados expressivos 3. til para analisar o sinal em bandas de frequncias diferentes, acompanhar a evoluo dos sinais musicais em cada uma delas, e extrair informaes importantes sobre eventos e processos vibratrios distintos que ocorram em faixas de frequncia diferentes. 4. til para estudar articulaes velozes e complexas, com trinados, trmulos, frulatos e outros efeitos, e identificar os nveis onde seus efeitos so mais sensveis. 5. til para determinar a presena de alguns tipos de eventos musicais expressivos numa passagem musical, como staccatos, spiccatos, acentos, variaes dinmicas e vibratos. 6. til como ferramenta para se aferir a qualidade do timbre de instrumentos complexos e de sofisticada manufatura (como violinos).

163

7. til como ferramenta modificadora de timbres e seus aspectos expressivos, para efeito de sntese 8. til como ferramenta compressora de informao e codificadora de som. Apresenta adicionalmente potencial para aplicaes em modeladores de rudos de quantizao (dithering) em virtude de sua capacidade de segreg-los. 9. til para identificar e separar os nveis de resoluo ou oitavas mais energticas de um evento musical. Notas mais altas em frequncia (num registro mais agudo) apresentam maior concentrao de energia em nveis mais altos (finos), e as mais baixas em nveis inferiores (menos finos). Um deslocamento do padro de distribuio da nota pelos nveis ser to mais evidente quanto maior for o intervalo tonal em questo. A grosso modo, uma diferena de uma oitava para baixo implicaria no deslocamento do padro de distribuio de um nvel para baixo (em direo aos nveis mais grossos). 10.A anlise com wavelets exibe a propriedade de isolar transientes, caracterizar acentos e identificar gestos de sopro e de arco; a ocorrncia do fenmeno de imageamento de bandas produz ainda um prtico efeito harmonizador com algumas aplicaes musicais em potencial. Finalmente, a tabela abaixo relaciona os objetos snicos associados aos gestos/eventos musicais por nveis wavelets, procedendo a um sumrio dos resultados das anlises a
partir do ponto de vista dos nveis wavelets, isto , tomando-se cada nvel como

referncia e relatando-se os objetos e estruturas que nele se destacaram ou concentraram. A primeira coluna compila uma lista de sensibilidade (insensibilidade) do nvel a determinados objetos/padres snicos. A segunda coluna sumaria os aspectos e objetos que o nvel destaca ou concentra. A terceira coluna fornece indcios sobre como o nvel percebido, grfica e/ou sonicamente. Finalmente a ltima busca uma mensurao qualitativa quanto ao impacto que a ausncia do nvel ter sobre a reconstruo do som.

164

Tabela 2 - Distribuio de gestos/eventos musicais por nveis wavelets

Nvel

Sensvel a () Insensvel a ()

Concentra ou destaca

Percepo

1o

foco de embocadura,

variao de sopro, dinmica (intensidade dos tons), localizao do instante de ataques p/ trmulos dedilhados ligados (flauta). variao tonal de glissandos.

rudo de fundo, rudo de sopro, rudo de arco, rudo de gestos bucais, acentos; srie harmnica (para tons altos); intensifica parciais mais altos em ataques pontuais e energticos (violino); baixo poder de segmentao das notas em fraseados ligados. ataques staccatos, acentos, gestos bucais, chaveamento de sopro; parte alta da srie harmnica (principalmente p/ tons na 4 oitava).

2o

variaes transitrias

3o

na presso de sopro, foco de embocadura, sobrelevaes de acentos sforzato (violino), ataques sforzato muito rpidos (<8ms), gestos esprios indesejados portamentos, rangidos, movimentos bruscos de arco) (violino). sobrelevao destacada para acentos (sforzato), ataques sforzatos muito rpidos (<8ms).

rudo agudo; fase inicial transitria da excitao das vibraes dos tons; timbres originais no reconhecveis; diferenas tonais (para notas diferentes) so imperceptveis (exceto para notas altas); pitchs dos tons imperceptveis. padro caracterstico do ataque (rampa, sobrelevao e decaimento); acentos; pitchs (tonalidades) so perceptveis, notas so diferenciveis em tonalidades.

Impacto de sua ausncia em reconstruo som spero, granuloso, mais evidente se D4 for usada.

perdas na constituio harmnica; gerao de vozes (tons em funo harmnica).

acentos; regio de sustentao (flauta); sries harmnicas; caracteriza curvas da regio de colapso (violino).

padro caracterstico do ataque (rampa, sobrelevao e decaimento); variaes de sopro sobre a sustentao (variaes de amplitude, flauta); envelope no suave, apresenta muitos transientes e aspecto amorfo em fraseado no ligado com acentos p/ flauta).

perdas na constituio harmnica; gerao de vozes (tons em funo harmnica).

4o

srie harmnica; objetos e estruturas moldados pela composio harmnica dos tons.

perdas na constituio harmnica; gerao de vozes (tons em funo harmnica).

165

5o

se entre os nveis mais energticos: vibraes harmnicas; constituio das sries harmnicas.

6o

vibraes harmnicas

(maior contribuio das sries harmnicas); sobrelevaes de acentos (flauta); deslocamentos de ar (variao no sopro). transientes.
componentes da srie

srie harmnica; regies de sustentao; regies de colapso reverberantes (quando corda abandonada); destacam a evoluo dos modos estacionrios. espectro harmnico; curvas dos colapsos bem caracterizadas (violino e flauta); se entre os nveis mais energticos: destaque s flutuaes e modulaes de qualquer origem. ataques sforzato; curvas de colapso (flauta e violino); ataques no ligados; srie harmnica.

7o

harmnica (estados estacionrios), acentos (sforzato), transientes de respirao, gestos de arco (ataques).

8o

ataques staccatos,

9o

acentos (sforzato); abandono do arco corda (violino); gestos produzindo variaes de velocidade e contato de arco-corda; variaes de dinmica (violino), gestos bucais (estalidos e outros, flauta). transientes de ataques; transientes de sopro; transitrios em geral; alternncia de sentido de arco.

ataques staccatos; gestos bucais; rudo de fundo (ambiente e/ou quantizao); ataques sforzato (subida); transiente de ataques acentuados (flauta, notas na 3a oitava); transiente de chaveamento de sopro no colapso. rudo de fundo (ambiente e/ou quantizao); gestos de sopro; ataques sforzato (subida); transitrio de ataques acentuados (flauta).

se entre os nveis mais energticos: exibe textura snica "limpa", envelopes e contornos mais suaves, regulares e uniformes (envelopes padro ADSR). som mais puro, menos ruidoso, tons definidos (permite diferenciar tonalidades); admite diferentes agrupamentos sequenciais dos tons (evoluo percebida dos tons). "Nvel da madeira"; sopro percebido em reproduo a 11025 KHz; regies de mxima amplitude localizam regies centrais (sustentao) das notas (em trmulo dedilhado, flauta). sinal "contnuo", espalhado por toda a extenso do sinal, com propriedades ruidosas; textura ruidosa; rudo de fundo ambiente, rudo de quantizao em gravaes baixas.

perdas na constituio harmnica; gerao de vozes (tons em funo harmnica). perdas na constituio harmnica; gerao de vozes (tons em funo harmnica).

perdas na constituio harmnica; gerao de vozes (tons em funo harmnica).

rudo grave, textura ruidosa; os nveis abaixo deste contribuem pouco para a formao dos tons e eventos musicais; a participao energtica desprezvel; e sua ausncia no causa perdas qualitativas expressivas; rudo de quantizao em gravaes baixas.

166

10o

transiente de ataque;

11o

12o

alternncia de sentido de arco; sentido do arco (staccatos, violino); variao velocidade do arco; abandono do arco corda. gestos de arco (aumento de presso, variao no contato arco-corda); padres interpretativos (sucesso de gestos); rudos de fundo (ambiente, processamento, quantizao); dinmica baixa em sinais ruidosos (baixa relao S/R). variaes de velocidade, presso e contato arco-corda (a confirmar em trabalhos futuros); dinmica baixa em sinais ruidosos (baixa relao S/R).

gestos de arco; transientes de ataques acentuados (flauta).

rudo grave.

contribuio do rudo de quantizao (em sinais de baixa dinmica); gestos bucais de notas muito acentuadas.

"negativo do sinal"; amplitude menor nas regies de sustentao quando o sinal apresenta contaminao por rudos (baixa relao S/R e/ou dinmica baixa).

desprezvel

contribuio do rudo de quantizao em baixa frequncia (violino).

13o

14o 15o

informaes a nvel

musicolgico (violino, a confirmar em trabalhos futuros).

indicativo de padres musicais longos (repeties, progresses).

inaudvel; deste nvel para baixo o formato das estruturas, objetos, e formas de onda assemelham-se wavelet de anlise, tornando menos bvia a extrao de informao musical nestes nveis; "negativo do sinal" em sinais com baixa dinmica e/ou baixa relao S/R: amplitudes menores nas regies de sustentao dos tons, e maiores nas reas onde a dinmica menor. todos os nveis deste para baixo so inaudveis. -

desprezvel para este nvel e todos os demais abaixo (mais grossos).

167

5.4 Trabalhos Futuros


Mesmo populado de "pulsos" e picos locais, aparentemente distribudos aleatoriamente sem revelar correlao com os eventos musicais mais importantes, o sinal aos 8o e 9o nveis mais finos pode sofrer algum tratamento ou filtragem no tempo (ou frequncia) adicional que facilite a localizao de gestos musicais. Um tratamento suplementar ao sinal poderia mostrar correlaes importantes entre os picos intensos e eventos musicais. A verificao de tais hipteses deixada para um trabalho futuro, contando com a aplicao de tcnicas adicionais e complementares ao processamento com
wavelets.

A possibilidade de que os envelopes e pontos de mximos verificados aos 10o e 11o nveis mais finos forneam alguma informao relevante sobre os gestos musicais deve ser melhor explorada em trabalhos futuros, envolvendo inclusive o uso de ferramentas algortmicas adicionais no processamento do sinal nestes nveis.
Wavelet-packets podem ser teis para segmentar melhor as largas bandas cobertas pelos

nveis mais finos - em especial o mais fino - e permitir a separao e identificao de componentes e estruturas snicas que estejam fundidas nestas escalas mais finas. A separao de estruturas snicas em tons inscritos em registros mais altos - da 5a
oitava em diante - deve ser mais eficaz com wavelet-packets do que com a presente

anlise wavelet em multiresoluo simples, com separao de bandas por oitavas. Os tons mais altos naturalmente se decompem e concentram sua energia nos nveis mais altos/finos, que cobrem faixas mais largas de frequncia. Seus objetos snicos e componentes harmnicos estaro portanto fundidos dentro de uma banda (escala) maior, inviabilizando a sua identificao e separao. A aplicao de wavelet-packets para implementar uma segmentao mais fina das bandas mais altas, poderia viabilizar a anlise de processos que ocorram em bandas mais curtas, subescalas dentro de uma banda larga, e assim facilitar a separao de componentes snicos dos tons mais altos. Os nveis mais energticos tambm devem ser alvos de anlises com wavelet-packets, haja visto sua importncia na formao dos tons. As possveis correlaes entre a amplitude do sinal musical verificada no 8o nvel mais fino das anlise de violino e parmetros de manipulao do arco, como velocidade e ponto de engate do arco na corda, ainda no esto bem descritas, e merecem um estudo

168

mais criterioso para se avaliar o impacto destes parmetro sobre os sinais neste nvel, e consequentemente as possibilidades de sntese expressiva decorrentes.
Wavelet-packets so mais indicadas para aplicaes de rastreamento de eventos

musicais associados com gestos musicais, porque possuem uma diviso mais fina do espectro, fragmentando o espectro em nveis com largura de banda menores e mais sintonizados. Tambm de extrema importncia a escolha da base wavelet e do nmero de coeficientes de seu filtro. Filtros wavelets com mais coeficientes tendem a apresentar uma maior regularidade e suavidade na representao dos sinais, alm de possurem melhor localizao em frequncia. O aspecto de sintonia e cobertura em frequncia dos filtros wavelets relevante para implementar um bom sistema de anlise e sntese de msica com wavelets. Bases wavelets construdas de acordo com os modelos de representao auditiva das membranas da cclea54 podem se revelar mais adaptadas para a tarefa de interpretao (e sntese) de estruturas musicais. Irino e Kawahara (1993) construram bases wavelets que simulam as caractersticas de resposta em frequncia do sistema auditivo perifrico, utilizando-se para tal de um modelo coclear adicionado de um filtro de ouvido mdio (para casamento de impedncia)[33]. Seu objetivo era o de conceber uma representao para o sistema auditivo perifrico que tambm provesse um esquema para sntese de sinais para experimentos psicofsicos, entretanto a aplicabilidade dos filtros wavelet que produziram deve se estender anlise e sntese de msica, possivelmente com vantagens sobre outros sistemas pela similaridade com o filtro auditivo real, abrindo assim frente nova de experimentaes. O uso de bases wavelets adaptativas e "dedicadas" (i., para uso especfico orientado a classes especficas de sons) tambm poderiam ser outra frente de pesquisa interessante para a caracterizao de gestos musicais expressivos. Abry e Aldroubi (1994) comentam que as wavelets de Daubechies, de Battle-Lemari ou de splines so as mais comuns em implementaes da transformada wavelet discreta, enquanto que para decomposies contnuas uma maior variedade de wavelets encontrada. Motivados por essa constatao, propem vrios mtodos para sintetizar wavelets desejadas (semiortogonais), mantendo a estrutura computacional piramidal recursiva e a grade didica

169

de amostragem. [1] Outras estruturas algortmicas existem para ser exploradas no campo de aplicaes musicais e da fala, como os bancos de filtros iterados. Blu (1993) afirma que os esquemas de bancos de filtros iterados (didicos, como empregados neste trabalho) so "muito grossos para analisar sinais como udio de alta qualidade e fala" porque realizam uma decomposio em bandas de oitavas, e sugere o uso de bancos de filtros iterados racionais, uma arquitetura diferente de computao onde o sinal separado num conjunto de bandas de frequncias mais denso (resoluo em frequncia mais fina).
wavelet. [4]
[4]

Sua abordagem, entretanto, tambm levanta problemas e limitaes

associados a essa arquitetura, a qual no implementa propriamente uma transformada

Os sistemas capazes de reconhecer gestos musicais e investigar sua estrutura de formao encontram aplicao direta nos sistemas de sntese, para propsitos de reproduzir elementos das tcnicas de interpretao instrumental de msicos humanos, provendo recursos para se introduzir expressividade e naturalidade, enriquecendo as possibilidades de sntese de msica. Aplicaes interessantes estariam em habilitar determinados instrumentos (timbres) a executar fraseados e efeitos caractersticos de outros instrumentos (timbres), fornecendo-lhes graus de liberdade expressiva adicionais. Muitos aspectos da sntese de timbres acsticos para interpretao de peas musicais esto altamente relacionados no somente fisiologia da interpretao, i., aos aspectos funcionais e limitantes fsicos, mas tambm ao estilo da composio e uma variedade de adornamentos, variaes rtmicas, portamentos, dedilhados alternativos e pequenas alteraes tonais e temporais que ela admite. Por exemplo, observa-se muitas vezes no sistema interpretativo do Sculo XIX para flauta sequncias de notas colcheias tocadas diferentemente num arranjo alternativo com semnima pontuada, semi-colcheia e colcheias. Aceleraes no tempo tambm eram apropriadas para passagens excitantes, enquanto retardos no tempo o eram para passagens subjugadas ou reprimidas. A articulao do fraseado onde os instrumentistas procuram emular cantores ou oradores tambm imprime uma dinmica interpretativa prpria composio e modificam por completo sua realizao, o produto sonoro e suas impresses psicolgicas. Estes aspectos constituem uma classe mais elaborada ou elevada de parmetros controladores e moduladores para interpretaes sintticas, e devem ser melhor
54

em especial a membrana basilar.

170

compreendidos e modelados recorrendo-se ao ferramental provido pela rea de Inteligncia Artificial e outras abordagens cognitivas, a fim de se quantificar e possibilitar sua reproduo, guiando a sntese a nveis de expressividade e beleza sonora mais aperfeioados. Ansiedade, curiosidade, humor, fria, expectativa, dvida e outros objetos psicolgicos podem ser abstrados de uma execuo acstica, e esto presentes na msica atravs de um mapeamento que ainda no est bem definido e compreendido. Existe uma concordncia entre vrios pesquisadores de que a anlise wavelet pode ser til na investigao deste mapeamento, pela sua semelhana com o processamento de estgios primrios no sistema auditivo humano, e por suas propriedades de localizar eventos no espao tempo-frequncia. A facilidade em se proceder a implementaes algortmicas discretas, de complexidade computacional da ordem do tamanho das amostras (O(N)), torna as implementaes em dispositivos integrados (VLSI ou com DSPs) possibilidades viveis e atraentes objetivando aplicaes de alto desempenho e em tempo real. Diversas propostas de implementaes de algoritmos wavelet em VLSI podem ser encontradas na literatura escrita, bem como na Internet. PARHI e outros (1993) prope duas arquiteturas diferentes para implementao de transformadas
wavelet discretas de uma dimenso (1-D) em VLSI. [53]
SOBRE A APLICABILIDADE EM ANLISE MUSICOLGICA DOS NVEIS MAIS GROSSOS

Nveis abaixo do 7o nvel mais fino usualmente apresentam envelopes para as notas que no guardam semelhana com os envelopes dos nveis anteriores ou com o sinal original, apresentando formatos irregulares e no correlacionados com o modelo tradicional de envelope ADSR (ataque, decay, sustain, release) empregado em sintetizadores. Os nveis ainda mais baixos, cobrindo faixas subsnicas, apresentam informaes que poderiam justificar o seu emprego para analisar aspectos musicolgicos, como por exemplo inferir sobre a intensidade de determinado trecho tocado em relao a outros. Todavia, somente a anlise de partes orquestrais mais significativas e longas podero mostrar sua eficcia neste sentido. Apesar de serem descartveis numa reconstruo, praticamente sem repercusses sobre a qualidade do som reconstrudo frente ao original, os nveis mais baixos consistem em

171

mdias aproximadas do sinal original e dos nveis anteriores mais finos, observadas em escalas maiores, onde os detalhes foram extrados e restaram os contornos bsicos, os descritores de envelopes, os esboos do sinal original. Por cobrirem faixas de frequncias vrias oitavas abaixo do registro energtico da srie harmnica do timbre, no participam da formao das vibraes harmnicas. Tambm no permitem rastrear os transitrios muito finos e eventos de alta frequncia. Encaixam-se nesta categoria usualmente os nveis a partir do 12o nvel mais fino, que exibem formas de onda por vezes completamente diferentes do envelope do som original. Reconstrues utilizando-se pesos para estes nveis at 15 vezes maior que 1 (1500%) mostraram que eles no repercutem significativamente nos aspectos de larga escala do som, como poderia se esperar. No entanto, verificaes mais direcionadas, utilizando-se passagens musicais mais longas e endereando sua influncia sobre a dinmica geral do trecho, seriam necessrias para se avaliar sua utilidade para efeito de sntese.

5.5 Eplogo
Extensa nfase dada apresentao da ferramenta - a transformada wavelet e a teoria
da anlise em multiresoluo - bem como a sua histria, aplicaes, e tpicos correlatos

aplicao em msica computacional - a tcnica de anlise e sntese, os eventos e


definies musicais - deve-se a pouca literatura existente em lngua portuguesa at o

momento que os aborde em profundidade, principalmente quando abordados conjuntamente. As reas de msica computacional e engenharia de udio so relativamente novas no Brasil, e o desenvolvimento de tecnologia de udio emergente no pas. Existe no mercado uma grande variedade de timbres musicais disponveis em sintetizadores comerciais. A maioria destes timbres gerada por tcnicas convencionais como a sntese FM, a associao de unidades geradoras (hardware e/ou software), atravs de algoritmos descritivos (sntese de sinais), ou utilizando amostras de timbres naturais armazenados num banco de memria (wavetable synthesis). Muitos sintetizadores comerciais so desfavorecidos pela pobreza e artificialidade de seus timbres, por utilizarem tcnicas que no permitem incrementar ou adicionar

172

expressividade, realismo e vida aos tons gerados, e por usarem modelos tmbricos simplistas e limitados. A eventual adequao das wavelets como mtodo para permitir a incorporao destes aspectos dinmicos aos sistemas de sntese musical a tornaria uma ferramenta imprescindvel em msica computacional, tanto para a academia (musiclogos, maestros e compositores), como instrumento de auxlio anlise de orquestrao em estilos contemporneos, quanto para o sofisticado mercado musical e fonogrfico, empregada em estaes digitais de udio, em processadores de som, mdulos sintetizadores, teclados e outros instrumentos eletrnicos musicais. O Brasil, pela sua relevante produo musical, ocupa lugar de destaque no setor musical do planeta. Sua msica popular extremamente rica e expressiva. Seus instrumentistas e compositores esto entre os mais capacitados, criativos e requisitados. No entanto, a produo de tecnologia que possibilite uma participao expressiva do pas no setor produtivo da moderna indstria musical e de udio est muito aqum das suas possibilidades e potencialidades. O pas no tem tradio na produo de instrumentos musicais55, nem de sofisticados equipamentos de udio e vdeo para estdios, teatros ou instalaes a cu aberto. Os grandes canais de televiso do pas, entre os melhores do mundo, dispem da mais moderna tecnologia para produo de udio e vdeo, para o tratamento, manipulao e armazenamento de imagem e som, mas sua estrutura operacional est praticamente baseada em equipamentos concebidos e produzidos no exterior. No existe at ento no pas nenhuma instalao industrial de porte que produza sintetizadores, teclados, instrumentos musicais eletrnicos, estaes digitais de udio e vdeo, processadores digitais de udio, ou software houses que desenvolvam e comercializem produtos voltados para este nicho. Existe, entretanto, no Brasil uma elite de profissionais capacitados a mudar este clssico perfil de importador de tecnologia musical, tanto na rea tcnica e de engenharia, quanto na rea artstica e musical. Existem j grupos organizados no sentido de se integrar a comunidade da msica computacional, agregando msicos e engenheiros, artistas e cientistas, para fomentar a gerao de tecnologia de udio e incentivar o emprego de tecnologia para produo musical, mas talvez o direcionamento de suas

173

atividades e interesses no tenham ainda admitido massa crtica o suficiente para ultrapassar diferenas de ordem esttica e cobiar patamares mais estratgicos e desafiadores. Estas questes por si s justificam o uso desta dissertao como veculo para difundir nos meios acadmico e produtivo esta linha de pesquisa, mostrar as novas perspectivas do emprego direto da tecnologia computacional e eletrnica no segmento de udio e msica, e o insacivel mercado para tal tecnologia. Esta contribuio atende diretamente a anseios do autor em estimular novos pesquisadores, investidores do mercado produtivo, engenheiros, msicos e profissionais da Informtica produzir tecnologia e contribuir para o desenvolvimento da integrao arte e cincia.

55

com exceo de instrumentos percussivos.

174

REFERNCIAS BIBLIOGRFICAS

1 ABRY, P.; ALDROUBI, A. Designing multiresolution analysis-type wavelets and their fast algorithms. Journal of Fourier Analysis and Applications, v.2, p.135-59, 1995. 2 ARFIB, D.; DELPRAT, N. Musical transformations using modification of time-frequency images. Computer Music Journal, v.17, n.2, p.66-72, Summer 1993. 3 BELKIN, A. Orchestration, perception, and musical time: a composers view. Computer Music Journal, v.12, n.2, p.47-53, Summer 1988. 4 BLU, T. Iterated filter banks with rational rate changes: connection with discrete wavelet transforms. IEEE Transactions on Signal Processing, v.41, n.12, p.3232-44, Dec. 1993. 5 BREGMAN, A.S. Auditory scene analysis: the perceptual organization of sound. Cambridge, MIT Press, 1990. 773p. 6 BUCKHEIT, J. et al. About WaveLab. Stanford, Stanford University, Nov. 1995. Internet, ftp://playfair.stanford.edu/pub/wavelab/AboutWavelab.pdf, Nov. 1995. 35p. 7 BUCKHEIT, J.; DONOHO, D. WaveLab architecture: Version 0.700. Stanford, Stanford University, Nov. 1995. Internet, http://playfair.stanford.edu/reports/ wavelab/WaveLabArch.pdf, 1996. 38p. 8 CHIANN, C.; MORETTIN, P.A. A wavelet analysis for stationary processes. /Submetido ao Journal of Nonparametric Statistics; sob reviso/ 9 CHUI, C.K. An introduction to wavelets. San Diego, Academic Press, 1992. 226p. 10 CODY, M.A. A wavelet analyzer: an alternative to the FFT-based spectrum analysis. Dr. Dobbs Journal, p.44-54, 82-91, Apr. 1993. 11 CODY, M.A. The fast wavelet transform: beyond Fourier transforms. Dr. Dobbs Journal, p.16-28, 100-1, Apr. 1992. 12 DAUBECHIES, I. Orthonormal basis of compactly supported wavelets. Communications on Pure and Applied Mathematics, v.41, p.909-96, 1988. 13 DAUBECHIES, I. Ten lectures on wavelets. Philadelphia, SIAM, 1992. (CBMS-NSF Regional Conference Series on Applied Mathematics) 357p. 14 DAUBECHIES, I. The wavelet transform, time-frequency localization and signal analysis. IEEE Transactions on Information Theory, v.36, n.5, p.961-1005, Sept. 1990. 15 DE VORE, R.A.; JAWERTH, B.; LUCIER, B.J. Image compression through wavelet transform coding. IEEE Transactions on Information Theory, v.38, n.2, p.719-46, Mar. 1992. 16 DOERSCHUK, R.L. Bob Moog. Keyboard, v.21, n.2 (issue 226), p.92-100, Feb. 1995. 17 DOLSON, M. Fourier-transform-based timbral manipulations. In: MATHEWS, M.V.; PIERCE, J.R., eds. Current directions in computer music research. Cambridge, MIT Press, 1989. p.10512. 18 DRAKE, L.A. et al. Wavelet analysis in recruitment of loudness compensation. IEEE Transactions on Signal Processing, v.41, n.12, p.3306-12, Dec. 1993. 19 EVANGELISTA, G. Pitch-synchronous wavelet representation of speech and music signals. IEEE Transactions on Signal Processing, v.41, n.12, p.3313-30, Dec. 1993. Special edition.

175

20 FARIA, R.R.; ZUFFO, J.A. Wavelets as a multiresolution analysis and synthesis technique for sound timbres edition. In: SIMPSIO BRASILEIRO DE COMPUTAO E MSICA, 2o / CONGRESSO DA SOCIEDADE BRASILEIRA DE COMPUTAO, 15o, Canela, 1995. Anais. Porto Alegre, IIUFRGS, 1995. p.198-204. 21 FARIA, R.R.A.; RUSCHIONI, R.A.; ZUFFO, J.A. Wavelets in music analysis and synthesis: timbres analysis and perspectives. Proceedings of SPIE, v.2825, pt.2, p.950-61, 1996. /Apresentado ao Wavelet Applications in Signal and Image Processing IV; SPIE 1996, Denver, 1996/ 22 FUTURE MUSIC. Somerset, n.38, Dec. 1995. /Internet, "http://www.futurenet.co.uk"/ 23 FUTURE MUSIC. Somerset, n.39, Jan. 1996. /Internet, "http://www.futurenet.co.uk"/ 24 GARNET, G.E. An overview of CNMAT research. Berkeley, California University, Center for New Music and Audio Technologies (CNMAT), s.d. 25 GOMES, S.M.; CORTINA, E. Wavelet transform: a local time-frequency analysis. In: SEMINRIO BRASILEIRO DE ANLISE, 40O, Rio de Janeiro, 1994. Separatas. Rio de Janeiro, UFRJ, 1994. p.95-142. 26 GRAPS, A. An introduction to wavelets. IEEE Computational Science & Engineering, v.2, n.3, p.50-61, Summer 1995. 27 GRIFFITHS, P. A msica moderna: uma histria concisa e ilustrada de Debussy a Boulez. Trad. de Clvis Marques. Rio de Janeiro, Jorge Zahar, 1987. 206p. 28 GUYTON, A.C. Tratado de fisiologia mdica. 7.ed. Rio de Janeiro, Guanabara Koogan, 1989. cap.61, p.582-90. 29 HUNGRIA, H. Otorrinolaringologia. 7. ed. Rio de Janeiro, Guanabara Koogan, 1995. cap.29-32, p.243-95. 30 HUTCHINS, C.M., comp. Benchmark papers in acoustics/5: Musical acoustics, part I: violin family components. Stroudsburg, Dowden, Halsted Press, 1975. 478 p. 31 INTERNATIONAL CONFERENCE ON WAVELETS: TIME FREQUENCY METHODS AND PHASE SPACE, Marseille, 1987. Proceedings. 2. ed. Berlin, Springer, 1989. 331p. 32 IRCAM. Institut de Recherche et de Coordination Acoustique/Musique, Paris, Aubin Imprimeur, 1994. /Impresso Informativo/ 33 IRINO, T.; KAWAHARA, H. Signal reconstruction from modified auditory wavelet transform. IEEE Transactions on Signal Processing, v.41, n.12, p.3549-54, Dec. 1993. 34 JAFFE, D.A. An overview of criteria for evaluating synthesis and processing techniques. In: SIMPSIO BRASILEIRO DE COMPUTAO E MSICA, 2o / CONGRESSO DA SOCIEDADE BRASILEIRA DE COMPUTAO, 15o, Canela, 1995. Anais. Porto Alegre, IIUFRGS, 1995. p.53-61. 35 JAWERTH, B.; SWELDENS, W. An overview of wavelet based multiresolution analysis. SIAM Review, v.36, n.3, p.377-412, 1994. /Disponvel via Internet, ftp://ftp.math.sc.edu/ pub/imi_93/imi93_1.ps, Columbia, University of South Carolina, site do Dept. of Mathematics, 1997. 39p./ 36 KADAMBE, S.; BOUDREAUX-BARTELS, G.F. Application of the wavelet transform for pitch detection of speech signals. IEEE Transactions on Information Theory, v.38, n.2, p.917-24, Mar. 1992. Special edition. 37 KARLSEN, R.E.; GERHART, G.R. et al. Wavelet analysis of ground vehicle acoustic signatures. Proceedings of SPIE, v.2491, pt.1, p.560-70, 1995. /Apresentado ao Wavelet Applications II, Orlando, 1995/ 38 KRONLAND-MARTINET, R. The wavelet transform for analysis, synthesis, and processing of speech and music sounds. Computer Music Journal, v.12, n.4, p.11-20, Winter 1988.

176

39 LANCASTER, D. Hardware hacker: understanding transforms, video compression secrets, video crosshatch generator, power electronics resources and more wavelet breakthroughs. Radio Electronics, v.62, p.68-73, July 1991. 40 LEHRMAN, P.D. Microcomputer applications in music. In: BIRNES, W.J., ed. PC hardware and systems. New York, McGraw-Hill, 1989. p.75-92. 41 MALLAT, S.; HWANG, W.L. Singularity detection and processing with wavelets. IEEE Transactions on Information Theory, v.38, n.2, p.617-43, Mar. 1992. 42 MALLAT, S.G. A theory for multiresolution signal decomposition: the wavelet representation. IEEE Transactions on Pattern Analysis and Machine Intelligence, v.11, n.7, p.674-93, July 1989. 43 MALLAT, S.G. Multiresolution approximation and wavelet orthogonal bases of L2 (R). Transactions of the American Mathematical Society, v.315, n.1, p.69-87, Sept. 1989. 44 MATHEWS, M.V.; PIERCE, J.R., eds. Current directions in computer music research. Cambridge, MIT Press, 1989. 432 p. 45 McGILL, K.C.; TASWELL, C. Length-preserving wavelet transform algorithms for zero-padded and linearly-extended signals. Palo Alto, Rehabilitation Research and Development Center, Veterans Affairs Medical Center, Mar. 1992. Internet, http://www.wavbox.com/LPWTA92.ps, Nov. 1996. 20p. 46 MEYER, Y. Book reviews: An introduction to wavelets (Chui, C.K.) and Ten lectures on wavelets (Daubechies, I.). Bulletin (New Series) of the American Mathematical Society, v.28, n.2, p.35060, Apr. 1993. 47 MEYER, Y. Wavelets: algorithms and applications. Philadelphia, SIAM, 1993. 133p. 48 MULDER, A. Virtual musical instruments: accessing the sounds synthesis universe as a performer. In: SIMPSIO BRASILEIRO DE COMPUTAO E MSICA, 1o / CONGRESSO DA SOCIEDADE BRASILEIRA DE COMPUTAO, 14o, Caxambu, 1994. Anais. Belo Horizonte, UFMG, 1994. p.243-50. 49 NASON, G.P.; SILVERMAN, B.W. The discrete wavelet transform in S. Journal of Computational and Graphical Statistics, v.3, n.2, p.163-91, 1994. 50 NEWLAND, D.E. Harmonic and musical wavelets. Proceedings of the Royal Society London A, v.444, p.605-20, 1994. 51 NEWLAND, D.E. Harmonic wavelet analysis. Proceedings of the Royal Society London A, v.443, p.203-25, 1993. 52 OPPENHEIM, A.V.; SCHAFER, R.W. Discrete-time signal processing. Englewood Cliffs, Prentice-Hall, 1989. 879p. 53 PARHI, K.K.; NISHITANI, T. VLSI architectures for discrete wavelet transforms. IEEE Transactions on VLSI Systems, v.1, n.2, p.191-202, June 1993. 54 PELLMAN, S. An introduction to the creation of electroacoustic music. Belmont, Wadsworth, 1994. 441 p. 55 PERLIN, K.; VELHO, L. B-spline wavelet paint. New York, Computer Science Dept., New York University; Rio de Janeiro, Instituto de Matemtica Pura e Aplicada (IMPA), 1994. (Technical Report) 23p. 56 PIERCE, J.R. The science of musical sound. New York, Scientific American Books, 1983. 242 p. 57 PISTON, W. Orchestration. Nova York, W.W. Norton, 1955. 477 p. 58 REISSEL, L-M. Multiresolution and Wavelets. In: SIGGRAPH 94. INTERNATIONAL CONFERENCE ON COMPUTER GRAPHICS AND INTERACTIVE TECHNIQUES, 21., Orlando, 1994. Wavelets and their applications to computer graphics. New York, ACM, 1994. (Course notes, 11). p.31-61.

177

59 RIOUL, O.; DUHAMEL, P. Fast algorithms for discrete and continuous wavelet transforms. IEEE Transactions on Information Theory, v.38, n.2, p.569-86, Mar. 1992. Special issue. 60 RIOUL, O.; VETTERLI, M. Wavelets and signal processing. IEEE Signal Processing Magazine, v.8, n.4, p.14-35, Oct. 1991. 61 RISSET, J.C. The computer, music and sound models. In: INTERNATIONAL CONFERENCE ON WAVELETS: TIME FREQUENCY METHODS AND PHASE SPACE, Marseille, 1987. Proceedings. 2. ed. Berlin, Springer, 1989. p.102-23. 62 ROADS, C. Introduction to granular synthesis. Computer Music Journal, v.12, n.2, p.11-3, Summer 1988. 63 ROADS, C. et al. The computer music tutorial. Cambridge, MIT Press, 1996. 1234 p. 64 ROADS, C., ed. The music machine: selected readings from Computer Music Journal. Cambridge, MIT Press, 1989. 725 p. 65 SAHINER, B.; YAGLE, A.E. Image reconstruction from projections under wavelets constraints. IEEE Transactions on Signal Processing, v.41, n.12, p.3579-83, Dec. 1993. Special edition. 66 SCHOLL, J.F.; ROGOVIN, D. Audio signal compression with Circular Wavelet Packets. Proceedings of SPIE, v.2303, p.518-29, 1994. /Apresentado a Wavelet Applications in Signal and Image Processing II, San Diego, 1994/ 67 SHELBY, G.A.; ADHAMI, R.R. Tone detection using Wavelet transforms. Proceedings of SPIE, v.2491, pt.1, p.615-26, 1995. /Apresentado a Wavelet Applications II, Orlando, 1995/ 68 SIGGRAPH 94. INTERNATIONAL CONFERENCE ON COMPUTER GRAPHICS AND INTERACTIVE TECHNIQUES, 21., Orlando, 1994. Wavelets and their applications to computer graphics. New York, ACM, 1994. (Course notes, 11) 162p. 69 SIGGRAPH 95. INTERNATIONAL CONFERENCE ON COMPUTER GRAPHICS AND INTERACTIVE TECHNIQUES, 22., Los Angeles, 1995. Wavelets and their applications to computer graphics: CD-ROM. New York, ACM, 1995. (Course notes, 26) 70 SIMPSIO BRASILEIRO DE COMPUTAO E MSICA, 1o / CONGRESSO DA SOCIEDADE BRASILEIRA DE COMPUTAO, 14o, Caxambu, 1994. Anais. Belo Horizonte, UFMG, 1994. 251 p. 71 SIMPSIO BRASILEIRO DE COMPUTAO E MSICA, 2o / CONGRESSO DA SOCIEDADE BRASILEIRA DE COMPUTAO, 15o, Canela, 1995. Anais. Porto Alegre, IIUFRGS, 1995. 303p. 72 SINHA, D.; TEWFIK, A.H. Low bit rate transparent audio compression using adapted wavelets. IEEE Transactions on Signal Processing, v.41, n.12, p.3463-79, Dec. 1993. Special issue. 73 SINZIG, PEDRO, Frei. Dicionrio musical. 2.ed. Rio de Janeiro, Kosmos, 1959. p.261-3, p.601-2. 74 SOLBACH, L.; WHRMANN, R.; KLIEWER, J. The complex-valued continuous wavelet transform as a preprocessor for auditory scene analysis. Internet, "ftp://ftp.ti6.tuharburg.de/pub/paper/ijcai95-casa-rev1.ps.gz", Mar. 1997. 7p. /Apresentado no IJCAI 95/ 75 STOLLNITZ, E.J.; DeROSE, T.D.; SALESIN, D.H. Wavelets for computer graphics: a primer, Part 1. IEEE Computer Graphics and Applications, v.15, n.3, p.76-84, May 1995. 76 STOLLNITZ, E.J.; DeROSE, T.D.; SALESIN, D.H. Wavelets for computer graphics: a primer, Part 2. IEEE Computer Graphics and Applications, v.15, n.4, p.75-85, July 1995. 77 STRANG, G. Wavelet transforms versus Fourier transforms. Bulletin (New Series) of the American Mathematical Society, v.28, n.2, p.288-305, Apr. 1993. 78 STRANG, G.; NGUYEN, T. Wavelets and filter banks. Wellesley, Wellesley-Cambridge Press, 1996. 490p.

178

79 SWELDENS, W. The lifting scheme: a new philosophy in biorthogonal wavelet constructions. Proceedings of SPIE, v.2569, p.68-79, 1995. /Apresentado ao Wavelet Applications in Signal and Image Processing III, 1995/ /Obtido via Internet, "http:www.cs.sc.edu/~fernande/ liftpack/liftbibl.html", Dec. 1996/ 80 TASWELL, C.; McGILL, K.C. Wavelet transform algorithms for finite-duration discrete-time signals. In: INTERNATIONAL CONFERENCE ON WAVELETS AND APPLICATIONS, Toulouse, 1992. Proceedings. Gif-Sur-Yvette, Editions Frontieres, 1992. p.221-4. /Obtido via Internet, "ftp://sccm.stanford.edu/ , Out. 1993. 21p./ 81 TEOLIS, A. BARAS, J.S. The wavelet processing workstation: an interactive MATLAB based computational tool for wavelet processing. Proceedings of SPIE, v.2491, pt.1, p.592-603, 1995. /Apresentado a Wavelet Applications II, Orlando, 1995/ 82 UNSER, M. On the optimality of ideal filters for pyramid and wavelet signal approximation. IEEE Transactions on Signal Processing, v.41, n.12, p.3591-96, Dec. 1993. 83 VAIDYANATHAN, P.P. Multirate digital filters, filter banks, polyphase networks, and applications: a tutorial. Proceedings of the IEEE, v.78, n.1, p.56-93, Jan. 1990. 84 VETTERLI, M.; HERLEY, C. Wavelets and filter banks: theory and design. IEEE Transactions on Signal Processing, v.40, n.9, p.2207-32, Sept. 1992. 85 VIDAKOVIC, B.; MLLER, P. Wavelets for kids: a tutorial introduction. Durham, Duke University, Institute of Statistics and Decision Sciences, 1991. Internet, ftp://lorax.isds. duke.edu/pub/Users/brani/papers/wave4kidsA.ps.Z, Nov. 1996. 26p. 86 VILLASENOR, J.D. et al. Wavelet filter evaluation for image compression. IEEE Transactions on Image Processing, v.4, n.8, p.1053-60, Aug. 1995. 87 WEISS, L.G. Wavelets and wideband correlation processing. IEEE Signal Processing Magazine, v.11, n.1, p.13-32, Jan. 1994. 88 WICKERHAUSER, M.V. Adapted wavelet analysis from theory to software. Wellesley, A.K.Peters, 1994. 486p. 89 WOOD, P.; DUYNE, S.V., eds. Center for Computer Research in Music and Acoustics: overview. Stanford, Music Dept. of Stanford University, CCRMA, 1994. 72p. 90 XENAKIS, I. Formalized Music: thought and mathematics in composition. Bloomington, Indiana University Press, 1972. 273 p. 91 YANG, X.; WANG, K; et al. Auditory representation of acoustic signals. IEEE Transactions on Information Theory, v.38, n.2, p.824-839, Mar. 1992. Special edition. 92 YIP, WING-KEI; et al. Pitch detection of speech signals in noisy environment by wavelet. Proceedings of SPIE, v.2491, pt.1, p.604-14, 1995. /Apresentado a Wavelet Applications II, Orlando, 1995/ 93 YOST, W.A. Fundamentals of hearing: an introduction. San Diego, Academic Press, 1994. 317p.

GLOSSRIO

ADSR (Atack, Decay, Sustain and Release) - Modelo elementar de envelope para tons instrumentais, consistindo em 4 estgios ou regies sucessivas: um ataque, um decaimento, uma regio de sustentao e um colapso (queda final). AIFF - (Audio Interchange Format File). Formato digital de udio, proprietrio da Apple. ASIC (Application Specific Integrated Circuit) - Circuito integrado de aplicao especfica AWMR - Anlise Wavelet em Multiresoluo, ou, alternativamente, anlise em multiresoluo com wavelets. DAT - Digital Audio Tape. Equipamento para gravao/reproduo de udio em fita magntica, em formato digital. Dinmica - Em Msica, refere-se aos diferentes nveis de intensidade sonora durante a interpretao de um trecho musical, com variaes que vo do fortssimo ao pianssimo, quer em progresso brusca ou lenta. Dithering - Tcnica empregada em modeladores de rudo em udio digital que consiste na adio ao sinal de entrada (udio) de um sinal randmico adequado, no correlacionado ao sinal de entrada, de forma a eliminar a distoro associada ao erro de quantizao. DSP (Digital Signal Processing/Processor) - Processador/Processamento de sinais digitais Escala musical oficial - A escala (temperada) padro atual foi estabelecida em uma conferncia internacional em Londres, em 1953, quando ento definiu-se a altura padro para a nota L3 (o L central no piano) em 440 Hz. Na composio da escala temperada, a relao entre, por exemplo, as frequncias das notas D e Sol (uma quinta) igual a relao entre as freqncias da quinta formada por R # e L #, assim como a relao entre as freqncias de D e F (uma quarta) igual relao entre as freqncias de F # e Si. Consequentemente, o intervalo entre duas notas consecutivas quaisquer da escala de doze - um semitom - guarda sempre uma mesma relao matemtica: N2=N1.r, N3=N1.r2, ... , N13=N1.r12. Como a nota N13 a oitava de N1, i., N13=2 x N1, extrai-se o valor de r=1,05946. A escala temperada trouxe diversos benefcios, como a possibilidade de transposio perfeita para qualquer tom. Todavia, suas notas no permitem a criao dos intervalos acusticamente perfeitos, como as quinta perfeitas regidas pela relao "harmoniosa e divina" de 3:2, to cultuada nas sociedades asiticas mais antigas. Assim, um intervalo temperado de quinta (dsol, por exemplo) j no mais apresenta a relao 3:2; esta relao na escala temperada ser aproximadamente verificada entre, por exemplo, d e f#, que no uma quinta musical. A tabela abaixo mostra o padro de referncia estabelecido na conveno em Londres:

Tabela 3 - Notas da Escala Temperada e frequncias de referncia *

Notas
Sol2 (G2) L2 (A2) Si2 (B2) D3 (C3) (D central do piano) D#3 (C#3) R3 (D3) R#3 (D#3) Mi3 (E3) F3 (F3) F#3 (F#3) Sol3 (G3) Sol#3 (G#3) L3 (A3) L#3 (A#3) Si3 (B3) D4 (C4) R4 (D4) Mi4 (E4) F4 (F4) Sol4 (G4) L4 (A4) Si4 (B4) D5 (C5) R5 (D5) Mi5 (E5) F5 (F5) Sol5 (G5) L5 (A5) Si5 (B5) D6 (C6) R6 (D6) Mi6 (E6) F6 (F6) Sol6 (G6)

Frequncia de referncia (Hz)


196,0000 220,0000 246,9000 261,6256 277,1826 293,6648 311,1270 329,6276 349,2282 369,9944 391,9954 415,3047 440,0000 466,1638 493,8833 523,2511 587,3000 660,0000 698,4000 783,9000 880,0000 987,8000 1046,5000 1174,7000 1318,5000 1396,9000 1567,9000 1760,0000 1975,5000 2093,0000 2349,3000 2637,0000 2793,0000 3136,0000

* Mostradas 4 oitavas no registro alcanvel do violino (de G2 a G6) De C3 a C4 mostra-se a escala cromtica completa
Fontes: Internet, "http://www.rionet.com.br/~music-center/escalas.htm", Abril 1997; e [30] ITOKAWA, H. e CHIHIRO, K. On the study of violin and its making (1952). p.61

Em lngua latina as notas recebem os nomes de d, r, mi, f, sol, l, e si. Na notao anglosaxnica empregam-se letras para denomin-las: A (l), B (si), C (d), D (r), E (mi), F (f), G (sol). Uma nota l3 (A3) um l na 3a oitava da escala musical oficial. Embora em termos musicais a oitava do L padro seja a 3a comum a referncia a ela como pertencente 4a oitava. Muitos equipamentos musicais eletrnicos seguem esta referncia.

fa - Frequncia de amostragem. Neste trabalho duas foram usadas: 48000 Hz (amostras/s), no equipamento de gravao em estdio (DAT), e 44100 Hz (amostras/s) nas plataformas computacionais. FFT (Fast Fourier Transform) - Transformada rpida de Fourier Jitter - Distoro no linear devida a problemas de sincronismo ou problemas no mecanismo ou meio fsico (circuito eltrico) de transporte serial de udio digital. L2(R) - o espao de todas as funes quadraticamente integrveis em R (conjunto dos nmeros reais). Na prtica, o espao das funes com energia finita. Luthier - Fabricante de instrumentos de corda (vocbulo francs). Microtom - sonoridade que apresenta uma altura (pitch) intermediria entre semitons convencionais da escala musical, e portanto dista (de um semitom ou de outro microtom) de um intervalo (de frequncia) menor que o intervalo de um semitom convencional. MIDI (Musical Instrument Digital Interface) - Protocolo para comunicao digital entre instrumentos musicais eletrnicos e equipamentos computacionais. Msica Computacional - Campo de pesquisa e desenvolvimento de tecnologia musical. Referncia a um material musical cuja produo utiliza-se de recursos computacionais (hardware e/ou software) em uma ou mais de suas diversas fases (composio, transcrio, notao, harmonizao, orquestrao, gravao, processamento, sntese e reproduo). Alternativamente, o termo computao musical pode ser utilizado, mas este orienta a um contexto mais tcnico e de computao, fazendo mais referncia ao ferramental (tcnicas, algoritmos, dispositivos e recursos computacionais) do que ao produto musical. Msica eletrnica - Material sonoro que tenha sido concebido e sintetizado atravs dispositivos e/ou sistemas eletrnicos operando com frequncias na faixa audvel. Com o passar dos tempos a produo de msica por vias eletrnicas deu origem a sons e formas de organizao especiais que levaram ao nascimento de novos estilos musicais, onde no s os aspectos musicais importam, mas tambm as tcnicas de composio, sntese e as formas musicais modelveis com esta tecnologia. A terminologia Msica Eletroacstica faz referncia a estilos musicais contemporneos que empregam tcnicas e equipamentos eletrnicos (e computacionais) para conceber e sintetizar msica. Compositores e msicos adeptos da tecnologia musical, usualmente de formao musical erudita, constituem grupo relevante na produo da msica eletroacstica, em suas diversas formas e objetivos. Pitch - "Pitch aquele atributo das sensaes auditivas em termos do qual sons podem ser ordenados numa escala estendendo-se de baixo a alto. Do ponto de vista da psicoacstica, a unidade do pitch o mel". [93] (Leia mais sobre o conceito de pitch nos apndices). PLL - Phase-Locked Loop - Dispositivo eletrnico para capturar a fase de um sinal de referncia (clock) e possibilitar o sincronismo. Estima a variao de frequncia de um sinal de entrada de forma a manter o sincronismo. QMF (Quadrature Mirror Filter/Filtering) - Filtros/Filtragem de espelhamento de quadratura. R - Conjunto dos nmeros reais. Relao S/R - Relao sinal/rudo. TEF - Transformada enjanelada (ou emoldurada) de Fourier. Em sntese, uma transformao de Fourier sobre uma fatia do sinal, obtida pela sobreposio de uma moldura (uma segunda funo) sobre uma regio de interesse do sinal. Teoria Wavelet - Campo de pesquisa originrio da Matemtica - e estreitamente ligado a conceitos da anlise funcional - que lida com a representao de funes genricas em termos de blocos construtivos bsicos, ou tomos, fixos em diferentes escalas e posies. O termo

atualmente faz referncia a um contexto maior, abrangendo tambm reas correlatas e aplicaes das wavelets nas engenharias, na fsica, e em biologia. A teoria Wavelet representa hoje um corpo sinttico de diversas metodologias que endeream o tratamento e anlise de sinais, unificando-as sob uma mesma estrutura de referncia. A Transformada Wavelet uma ferramenta de implementao matemtica baseada na e nascida desta teoria. TW - Transformada Wavelet (termo genrico) TWC - Transformada Wavelet Contnua. TWCI - Transformada Wavelet Contnua Inversa TWD - Transformada Wavelet Discreta. TWDI - Transformada Wavelet Discreta Inversa VCA - Voltage Controlled Amplifier: amplificador controlado por tenso. Mdulo modelador de envelope em sistemas de sntese eletrnicos. VCO - Voltage Controlled Oscillator: oscilador controlado por tenso. Mdulo gerador de ondas em sintetizadores eletrnicos cuja frequncia controlada por tenso. VLSI (Very Large Scale Integration) - dispositivos com escala de integrao muito alta. Z - Conjunto dos nmeros inteiros.

APNDICES

I. DIFERENAS ENTRE TOM, PITCH

E NOTA MUSICAL

Nota musical se refere a uma posio dentro da escala cromtica (ou qualquer outra escala). A nota refere-se mais posio numa escala do que propriamente ao "contedo snico" emitido quando se a toca. Tambm refere-se a uma tecla, posio ou arranjo de dedilhado num instrumento musical. Por exemplo, quando dizemos que tocamos um d C4 num piano, estamos tocando a nota C4, d central localizado no meio do teclado do piano, que emite um contedo snico que identificado graficamente na escala por uma posio especfica na partitura (representao grfica). Tom refere-se ao contedo snico e caractersticas tempo-frequenciais da nota musical emitida. Por exemplo pode-se tocar um d C4 num piano e a mesma nota numa flauta, no entanto os timbres sero diferentes: o tom produzido pela mesma nota em instrumentos diferentes so tambm tons diferentes, mesmo que sejam percebidos como compartilhando uma mesma altura tonal. Tons podem ser confundidos por notas musicais em determinados contextos. Basicamente o tom de uma nota musical possui uma estrutura harmnica (composio espectral) especfica, apresenta uma evoluo no tempo (intensidade e espectro variantes), e um pitch. Tom tambm definido como um som em uma nica frequncia, apesar desta definio estar mais para a de pitch (a seguir) do que para o conceito de tom. Um tom geralmente possui vrias frequncias misturadas ou fundidas num nico som percebido (timbre). Pitch uma propriedade do som que permite identificar ou determinar sua altura em frequncia, seja ele um tom ou um "barulho". Esta uma definio muito direta, que se encaixa melhor dentro de uma abordagem puramente fsica, quando deseja-se extrair um nmero exato que represente a frequncia do som em questo. Na msica e na psicoacstica, no entanto, esta definio ampliada: o pitch ainda consiste numa identificao reducionria, onde se busca classificar o todo por um componente bsico essencial que o distinga dos demais, mas ao invs de se referir a uma frequncia nica, refere-se agora a um padro frequencial que percebido como o pitch de um tom, ou em outras palavras, sua altura tonal. Do lado da psicoacstica, o pitch interpretado como propriedade percebida do tom, e mensurvel por meio de uma unidade denominada "mel". Do lado fsico, o pitch sempre leva a uma medida de altura, a frequncia do som, mesmo que identificada por meio do padro de harmnicos presentes e no por uma nica componente frequencial. Existe uma certa confuso no emprego dos termos "pitch" e "tom", particularmente quando "tom" utilizado referindo-se altura tonal, na verdade uma propriedade sua muito importante para proceder afinao de instrumentos e identificao de sua frequncia. Se o som for um tom musical, seja de um instrumento comportado como flautas e violinos, ou de instrumentos inarmnicos (como sinos), o pitch est atado periodicidade das ondas sonoras, usualmente indicando a frequncia da sua forma de onda bsica. Se o som entretanto no for um tom musical (como por exemplo rudos rosas, alguns sons percussivos, sons de impacto, etc.) a identificao de seu pitch mais complexa, e depender do grau de treinamento do ouvido que o analisa. A determinao do pitch envolve o reconhecimento de padres de vibraes ao longo da membrana basilar no ouvido interno. Para as notas baixas num piano, verificou-se que o pitch no pode ser determinado a partir da fundamental. Para notas mais altas (em frequncia) a fundamental ou o primeiro harmnico (oitava da fundamental) predominam no julgamento do pitch do tom emitido. Na faixa mdia (mid-range) a fundamental importante quando est presente. E para pitchs mais baixos, a fundamental de pouca importncia no seu julgamento, e identifica-se o pitch a partir do padro de harmnicos. ([56] ; Pierce, J.R. Pitch and Repetition Rate Perception, in [89], p.46).

II.

CENTROS DE PESQUISA EM COMPUTAO E MSICA

O Center for Computer Research in Music e Acoustics (CCRMA), localizado na Universidade de Stanford (EUA), rene uma comunidade de pesquisadores bastante heterognea, com efetiva representao dos departamentos de Msica, Engenharia Eltrica, Mecnica, Cincia da Computao e Psicologia [89]. O CCRMA atua no magistrio, como parte integrante do Depto. de Msica, possui atividades nas rea de composio, e pesquisa em desenvolvimento de software para computao musical, em processamento de sinais digitais e modelamento fsico de instrumentos, em desenvolvimento de controladores e instrumentos musicais, em psicoacstica e psicologia da cognio, alm de uma extensa lista de reas de interesse, detalhadas em [89]. As atividades de pesquisa desenvolvidas no CCRMA desde a sua fundao respondem por contribuies expressivas no campo da msica computacional, com uma grande produo cientfica. Alm disso, convnios e projetos conjuntos com corporaes privadas permitem a integrao direta da pesquisa com a indstria. O centro desenvolveu junto Yamaha o teclado Yamaha VL1 (Virtual Acoustic Synthesizer), um sintetizador em tempo real de instrumentos de sopro metlicos, baseado em tcnicas de modelamento fsico, e junto Korg desenvolveu o Korg Wave Drum, um instrumento de percusso eletrnico com sntese baseada parte em tabelas de amostras, parte em modelamento fsico. O Center for New Music e Audio Technologies (CNMAT), da Universidade da Califrnia, Berkeley, tem como meta congregar recursos, ferramentas tcnicas e cientficas e conduzi-las a problemas e questes musicais, com particular nfase no desenvolvimento de tecnologia para execuo musical (interpretao), tpicos relacionados execuo, e problemas como controle e sntese em tempo real. As atividades de pesquisa objetivam a concepo de sistemas controladores e interfaces gestuais mais flexveis que os controladores MIDI. Outras atividades incluem a difuso de novas tecnologias de som, novos controladores, e apresentao de concertos e trabalhos de composio eletroacstica [24]. O Institut de Recherche et Coordination Acoustique/Musique (IRCAM), centro de pesquisa em tecnologia musical ligado ao Centre National dArt et de Culture Georges-Pompidou, localizado em Paris, Frana, foi fundado em 1970 pelo governo francs, e conduzido desde o incio por Pierre Boulez. Em 1974 Boulez declara publicamente os objetivos do instituto, quais sejam o de promover a pesquisa, o desenvolvimento, a experimentao, a criao e o treinamento nas reas de msica e tecnologia. As atividades do instituto centram-se na pesquisa de fenmenos acsticos (acstica instrumental, espacial, psicoacstica), na pesquisa em anlise e sntese de sons e estruturas sonoras, em representao musical, no desenvolvimento de ferramentas computacionais e instrumentos para pesquisa e criao musical, bem como em atividades de produo musical e educao. Dentro da estrutura produtiva do instituto h um enfoque especial orientado figura do compositor, buscando criar condies para o seu aprimoramento e assistindo-os no curso de suas atividades de criao, coordenando-se de forma a otimizar o processo de produo musical. O instituto nico no mundo em termos de instalaes, contando com uma cmara anecica para medies acsticas, vrios estdios e laboratrios equipados com computadores UNIX (DEC) e uma rede interligando estaes Sun, DEC e NeXT, um espao de projees (para concertos, testes e gravaes) cujas dimenses volumtricas e caractersticas acsticas podem ser modificadas atravs de um sistema computadorizado, laboratrios de eletrnica e mecnica adequados para produzir modelos e prottipos especiais, entre outras facilidades. Desde o incio de suas atividades, vem contribuindo no desenvolvimento de tcnicas para anlise e a sntese de sons musicais, de programas e mtodos para modelar e sintetizar o canto, de sistemas para composio, produo e processamento de som digital, bem como contribudo nas reas de modelamento e projeto de espaos acsticos [32].

Alm destes, importantes centros de pesquisa, laboratrios e grupos de trabalhos estabelecidos em vrias universidades e instituies governamentais e privadas realizam pesquisas no campo da engenharia de udio, computao musical, psicoacstica, processamento de sinais de udio (voz e msica), bem como na musicologia, na composio e na criao de obras musicais antes inconcebveis sem as facilidades tecnolgicas. Entre muitos, destacamos uma pequena amostragem, porm de participao significativa e relevncia na produo cientfica, pesquisa e desenvolvimento em computao musical, msica eletrnica e/ou eletroacstica e tecnologia musical:
IEEE Computer Society Technical Committee on Computer Generated Music (http://www.computer.org/tab/cgm/tc_cgm.htm) Audio Engineering Society - AES (http://www.aes.org/ ) International Computer Music Association - ICMA (http://music.dartmouth.edu/~icma/ ) NAMM - National Association of Music Merchants (http://www.namm.com) Hochschule fer Musik und Darstellende Kunst (Instituto de Msica Eletroacstica e Experimental), Academia de Msica de Viena, ustria Studio for Advanced Music Technology (SAMT), Hagenberg/Linz, ustria Music Department, The City University, Londres, Inglaterra Korg Research Center, Inglaterra AI/Music Group, Fac. of Music and Dept. of Artificial Intelligence, Univ. of Edinburgh, Esccia Signal Processing Research Group, Dept. of Electronics, Univ. of York, York, Reino Unido Dept. of Music, Keele University, Staffordshire, Inglaterra School of Cognitive and Computing Sciences, University of Sussex, Inglaterra Laboratorio de Musica & Sonologia, Dipartimento di Matematica Pura ed Applicata, Univ. di LAquila, Itlia AIMI - Associazione di Informatica Musicale Italiana. Laboratorio di Informatica Musicale, Dipartimento di Scienze dellInformazione, Universit degli Studi de Milano (LIM-DSI) Centro di Sonologia Computazionale, Istituto di Elettrotecnica ed Elettronica, Univ. di Padova, Itlia Laboratorio de Investigacin y Produccin Musical (LIPM), Argentina Instituto Rosario de Investigaciones en Ciencias de la Educacin (IRICE), Argentina Laboratoire Bordelais de Recherche en Informatique, Univ. Bordeaux I, Frana LAFORIA, Frana Laboratoire de Mcanique et dAcoustique, C.N.R.S., Frana Association pour la cration et la recherche sur les outils dexpression (ACROE) e Laboratoire dInformatique Fondamentale et dIntelligence Artificielle (LIFIA), Frana Institute for Psychoacoustics and Electronic Music, Univ. of Ghent, Blgica Dept. of Music, University of Copenhagen, Dinamarca NoTAM - Norwegian network for Technology, Acoustics and Music, Noruega (http://www.notam.uio.no) Sweelinck Conservatory Amsterdam, Holanda Institute of Sonology, Utrecht, Holanda Studio for Electronic Music, Musik-Akademie, Basel, Sua Dept. of Speech Communication and Music Acoustics, Royal Institute of Technology (KTH), Estocolmo, Sucia Institute for Computer Music and Electronic Media (ICEM), Folkwang Hochschule-Essen, Alemanha Lehrstuhl fuer Nachrichtentechnik, Univ. Erlangen-Nuernberg, Alemanha Banff Centre for the Arts, Alberta, Canad School of Kinesiology, Simon Fraser University, Canad Centre dApplications Musicales de lInformatique (CAMI), Facult de Musique, Univ. de Montral, Qubec, Canad Structured Sound Synthesis Project (SSSP), Computer Systems Research Group, Univ. of Toronto, Canad Dept. of Computing and Information Science, Queens University, Ontario, Canad Dept. of Music, Queens University, Ontario, Canad

Department of Communication and Centre for the Arts, Simon Fraser University, Canad Departamento de Cincias da Computao, Universidade de Hong Kong, China Media Laboratory, Music Cognition Group, Cambridge, EUA Center for Research in Computing and the Arts (CRCA), Univ. of California, San Diego, EUA Dept. of Music, State Univ. of New York at Buffalo (NY), EUA Dept. of Music, Colgate University, Hamilton (NY), EUA Dept. of Music, University of Washington, Seattle, EUA Music Department, Princeton University, New Jersey, EUA Electrical Engineering and Computer Science Department, Princeton University, New Jersey, EUA Computer Audio Research Laboratory, Center for Music Experiment, Univ. of California, San Diego, EUA Experimental Music Studio, M.I.T., Cambridge, EUA M.I.T. Media Lab, Cambridge, EUA Artificial Intelligence Laboratory, M.I.T., Cambridge, EUA Dept. Electrical Engineering, Cornell University, Ithaca (NY), EUA Lucasfilm Ltd., San Rafael, Califrnia, EUA Computer Science Department, Univ. of Rochester, Rochester (NY), EUA Dept. of Music, La Trobe University, Victoria, Austrlia Ingeniera de Sistemas, Univ. Javeriana de Cali, Colmbia Department of Microelectronics, Univ. Autnoma de Puebla, Mxico Laboratorio de Informtica Musical (LIM), Escuela de Msica de la Univ. de Guanajuato, Mxico Department of Electronics and Telecommunication, Applied Physics Division, Centro de Investigacin Cientfica y de Education Superior de Ensenada, Mxico Departamento de Artes, Univ. Federal da Paraba Departamento de Msica/CCHLA, Univ. Federal da Paraba Departamento de Msica, Univ. Federal de Pernambuco Ncleo Interdisciplinar de Computao Snica (NICS), Depto. de Matemtica Aplicada, UNICAMP Depto. de Semicondutores, Instrumentos e Fotnica (DSIF), Fac. Eng. Eltrica, UNICAMP Instituto de Informtica, Univ. Federal do Rio Grande do Sul Laboratrio de Processamento Espectral, Depto. Cincia da Computao, UNB, Braslia Departamento de Msica, UNB, Braslia Oficina de Anlise e Sntese da Imagem e do Som, Depto. Cincia da Computao, UFMG, Belo Horizonte Escola de Msica da Univ. Federal de Minas Gerais, Belo Horizonte Departamento de Formao Artstica, Univ. Federal do Esprito Santo COPPE/Sistemas, Univ. Federal do Rio de Janeiro Escola de Msica, Centro de Letras e Artes, Univ. Federal do Rio de Janeiro Depto. Cincia da Computao, Inst. de Matemtica e Estatstica, USP, So Paulo Studio PANaroma de Msica Eletroacstica da UNESP/FASM, So Paulo Laboratrio de Linguagens Sonoras / Comunicao e Semitica, PUC, So Paulo Grupo de Computao Musical, Laboratrio de Sistemas Integrveis (LSI), USP, So Paulo

A associao interdisciplinar entre engenheiros, matemticos, fsicos, psiclogos, e msicos s se tornou possvel graas transposio das barreiras preconceituosas e segregacionistas, que mantinham esses blocos convenientemente limitados em suas respectivas rea de atuao. Esta abordagem holstica, que influi nas relaes entre as cincias no mundo contemporneo, floresce em decorrncia do intercruzamento de necessidades, fruto de uma tendncia integradora que coloca o artista como co-autor da ferramenta, e o cientista como co-autor da criao artstica.

III. LINGUAGENS COMPUTACIONAIS PARA MSICA


A descrio formal de sons atravs de uma linguagem compatvel com o computador abriu o caminho para a sntese via software, como nas palavras de Risset [61]: sistemas inteligentes que reagem a ordens expressas de forma declarativa, mais fceis de se formular do que ordens que devam prescrever cada passo que o computador deva fazer, numa referncia facilidade de se descrever os passos algortmicos da sntese numa linguagem em nvel mais alto, que parametrize aspectos musicais. Em 1957 Max Mathews desenvolveu o primeiro programa para sntese de msica: o MUSIC I. Ele inaugurava a era da sntese digital direta. O MUSIC I foi o primeiro de uma srie. Mathews desenvolveu os primeiros compiladores modulares para msica, incorporados nas verses MUSIC III (1959), MUSIC IV e V (1967). Nestes, a sntese era determinada pela especificao da estrutura fsica do som desejado (instrumentos) e pela especificao das notas e respectivos argumentos (durao, intensidade, etc.). Isto permitiu de fato a definio de uma linguagem operacional formal para descrio de sons. Os programas MUSIC introduziram conceitos fundamentais para o desenvolvimento dos sistemas eletrnicos de sntese, como o de unidade geradora (no MUSIC III) e a concepo de interfaces grficas (no MUSIC V), paradigmas amplamente utilizados at hoje no projeto de sintetizadores e programas para sntese e sequenciamento de eventos musicais, como os populares sequenciadores MIDI e os teclados eletrnicos comerciais, produzidos por diversas indstrias de produtos musicais eletrnicos. O processo da criao musical auxiliada por computador adicionou ao vocabulrio do msico contemporneo termos como edio, abrir, salvar, cortar, copiar, colar, inserir, formatar, e outros intensamente disseminados entre os usurios de computadores, bem como um novo conjunto de termos operacionais apropriados manipulao de objetos musicais, como gravar, tocar, quantizar, transpor, retroceder, deslocar, inverter, amplificar, filtrar, distorcer, normalizar, reverberar, gerar onda, comprimir, converter formato, analisar espectro, setar base de tempo, volume, pista, canal, envelope, eco, taxa de amostragem... Um grande nmero de linguagens musicais, compiladores, programas e interfaces foram desenvolvidos em vrios centros de pesquisa em computao musical e tecnologia de udio estabelecidos pelo mundo. A tabela a seguir seleciona uma amostra (pequena mas significativa) de importantes contribuies tecnologia musical, que serviram e servem de base para o desenvolvimento de uma infinidade de produtos musicais eletrnicos, baseados em computadores, e de programas computacionais:

Music10 Music360 Music11 SCORE FORMES CHANT MIDI, protocolo CSOUND Common Music CMUSIC STELLA Finale

MUSIC V, de Max Mathews, portado para o PDP10 (1968) (1973) para edio de partitura (L.Smith, 1972) linguagem orientada a objetos, para composio e escalonamento de processos musicais (IRCAM,1984) para sntese de canto (IRCAM, 1984) para interfacear sintetizadores e dispositivos digitais (G.Loy, 1985) para sntese genrica (Vercoe, MIT, 1986) para composio (R.Taube, 1989/90) para sntese genrica (R.Moore, 1990) para edio de partitura (Taube, 1993) para edio de partitura (produto comercial da CODA)

Acrescente tambm lista os diversos ambientes de programao (sistemas de software) escritos para o desenvolvimento de aplicaes musicais em plataformas Macintosh, NeXT ou UNIX: MAX, LeLisp, Smalltalk, DMIX, Objective C, C, etc. Referncias adicionais so abordadas em [64] e [89]. Para uma viso do panorama atual no mercado de programas e pacotes computacionais para edio e gerao de udio/msica consulte [22; 23].

IV.

MTODOS PARA ANLISE, SNTESE E TRANSFORMAO MUSICAL

Os principais mtodos utilizados para a anlise, sntese e transformao de sons musicais podem ser agrupados nos tipos bsicos abaixo, classificados segundo o paradigma generativo de som adotado, e em funo dos mtodos matemticos que empregam: Modelamento Fsico Contempla o modelamento acstico de instrumentos musicais reais. Os modelos fsicos orientam-se no sentido de investigar os processos fsicos que ocorrem na gerao sonora e parametrizar o som na sua fonte fsica vibratria, por exemplo nas cordas/caixa ressonante de um violino, no trato vocal ou nos elementos vibrantes de qualquer outro instrumento acstico [89] . Este paradigma tem sido bastante utilizado em muitos modelos de teclados musicais comerciais recentes (por exemplo os Trinity e Prophecy, da Korg [22]) e em outros instrumentos eletrnicos1. Modelamento Espectral Os modelos espectrais se orientam no sentido de compreender a percepo e a cognio do som no seu destino final -o sistema auditivo, parametrizando-o junto membrana basilar na cclea, e levando em considerao tambm aspectos da psicoacstica e a interpretao da informao acstica pelo crebro. De uma maneira geral todas as tcnicas de anlise e sntese fundamentadas na descrio de contedo espectral, que operam modelando os sons no domnio da frequncia, podem ser admitidas nesta categoria:
anlise e sntese (Risset, 1969) mtodos das transformadas (Fourier, Karhunen-Love, Walsh-Radamar, Wavelet, etc.) sntese aditiva e sntese subtrativa sntese granular (Roads, 1978, 1985; Jones & Park, 1988; Truax, 1988; e outros) Phase-Vocoder (Portnoff, 1976; Moorer, 1978; Dolson, 1986) LPC -Linear Prediction Coding (Moorer, 1977; Lansky, 1981)

Mtodos no-lineares (ou globais) Os mtodos no lineares utilizam modelos abstratos, formulaes matemticas e tcnicas generativas no-lineares para construir os sinais acsticos. Esto entre eles:
Waveshaping (Arfib, 1979) Sntese FM (Chowning, 1973), amplamente utilizada em sintetizadores de placas multimdia para PCs, placas MIDI e teclados comerciais (como os da srie DX-n da Yamaha) Sntese Multiplicativa [64, p.439] Sntese por sinais aleatrios [64, p.434]

Sntese baseada em tabelas de formas de onda, amostras de timbres naturais (MIDI/wavetable based synthesis) Mtodo baseado na gerao do som a partir da reproduo de trechos amostrados (samples) de timbres instrumentais. A qualidade do timbre final est condicionada qualidade da gravao do timbre original amostrado, resoluo da amostragem, e aos nveis de rudo no conversor digital-analgico (DAC) embutido no sintetizador. A qualidade alcanada com esse mtodo
1

Como o Korg Wave Drum, com sntese de percusso baseada parte em modelamento fsico, parte em tabela de formas de onda (wavetable), desenvolvido com a participao do CCRMA de Stanford. Outro exemplo de sintetizador baseado em modelamento fsico, tambm com a participao do CCRMA, o Yamaha VL1 (Virtual Acoustic Synthesizer), capaz de sintetizar com realismo 2 notas em tempo real de metais (instrumentos de sopro metlicos), conforme tive a oportunidade de conferir pessoalmente em visita ao MIDI Studio do CCRMA em agosto de 1995.

razoavelmente satisfatria, estando o julgamento de sua qualidade um passo mais prximo do realismo alcanado na sntese acstica em instrumentos reais. Entretanto, devido simplificao e tamanhos reduzidos dos bancos amostrais, limitados a interpretaes medianas, pouco expressivas, muitas vezes com notas interpretadas alheias a um contexto musical, fica a qualidade final restringida em graus variveis de inexpressividade e artificialismo, deixando a incmoda impresso de ausncia de naturalidade e continuidade nos temas musicais sintetizados. Mtodos mistos (utilizando vrios tipos de sntese associadamente) Observa-se uma rpida absoro do estado da arte na concepo de sistemas de gerao sonora, encurtando substancialmente o tempo entre a concepo e o produto. As tendncias atuais so a de se propor sistemas mistos, a explorao de tcnicas de modelamento fsico e de transformadas especiais. A transformada wavelet, graas s suas propriedades matemticas na relao tempo-frequncia, e peculiaridades conceituais e estruturais, exibe vantagens sobre as tcnicas clssicas de anlise espectral e revela um potencial considervel para aplicaes musicais. As tcnicas de modelamento fsico, especialmente quando associadas com outros mtodos de gerao e processamento snico, implicam numa carga computacional elevada. Em grande parte isso se deve aos processos de simulao acstica em que se baseia o modelamento fsico. Sistemas de alto desempenho, capazes de processamento em tempo real, passam a ser uma necessidade real para a obteno de sistemas de sntese de alta qualidade, de manipulao flexvel, com vrios graus de liberdade para o msico. Nesta linha de desenvolvimento destaca-se a necessidade de sistemas que enderecem um melhor mapeamento da linguagem simblica, da temtica e contexto musical em eventos a nvel de sinal digital, tanto para efeito de melhoria, desenvolvimento e enriquecimento dos sistemas para anlise musical, anlise de orquestrao, identificao e isolamento de eventos/fraseados musicais elementares e complexos, quanto para efeito da concepo de sistemas de sntese mais eficientes computacionalmente. A migrao do padro de amostragem para udio de 44100 amostras/s e 16 bits de resoluo para 96000 amostras/s e 24 bits de resoluo trar ainda substancial ganho na qualidade sonora e acrscimo de realismo, entre outras importantes melhorias, e impelir a indstria do udio na direo de sistemas mais sofisticados.

V. WAVESYNT MUSICAIS

PACOTE PARA ANLISE WAVELET EM MULTIRESOLUO DE SINAIS

O Wavesynt consiste na contribuio em software deste trabalho. Ele rene um conjunto mnimo de rotinas em linguagem MATLAB orientada Anlise Wavelet em Multiresoluo (AWMR) de sinais unidimensionais (1D), especificamente sinais em faixas audveis (0 a 20 KHz). O pacote foi desenvolvido especialmente para suportar as tarefas de anlise de sinais musicais do presente projeto de pesquisa, e roda suportado pelo conjunto de funes e cdigos fontes do pacote WaveLab, de Stanford. Vrios de seus mdulos entretanto so independentes deste ltimo, e podem ser usados sem a prvia instalao do WaveLab. A chamada a vrios deles se d diretamente a partir da manipulao dos botes e controles da janela principal, a interface grfica, ou console de onde o usurio carrega os arquivos sonoros, define a wavelet de anlise e dispara tarefas de decomposio wavelet, plotagem, gravao e audio de nveis e coeficientes wavelet, reconstruo e mixagem. Outros mdulos so usualmente chamados diretamente via entrada de comando texto na janela de comandos do MATLAB, seguindo uma sintaxe conforme especificado nos comentrios de ajuda (help) logo no incio da listagem de cada cdigo fonte. Para utilizar plenamente o Wavesynt deve-se (1) ter instalado o MATLAB numa plataforma PC ou UNIX, (2) instalar o pacote WaveLab, (3) copiar todos os cdigos fontes (mdulos) do Wavesynt para um subdiretrio wavesynt criado dentro do diretrio do WaveLab (por exemplo ...matlab\toolbox\Wavelab\Wavesynt), (4) editar o arquivo ...\wavelab\wavepath.m para que ele inclua o novo diretrio wavesynt no caminho (path) do MATLAB2, (5) disparar o MATLAB e invocar a interface grfica do Wavesynt digitando-se "intrface" no prompt de comandos. Os principais cdigos fontes do Wavesynt esto relacionados na tabela a seguir, com uma breve descrio de suas respectivas funes. Os cdigos fontes compem ao todo 28 mdulos, que conjuntamente integram o pacote Wavesynt. Todos os mdulos encontram-se disponveis armazenados nos meios digitais em anexo: uma cpia do Wavesynt em CD-ROM (PCcompatvel) e em disquete (1,44Mbyte, PC-compatvel), arquivos em formato texto/ASCII, com extenso .m (executveis MATLAB). A verso atual a 3.0 (junho 1997). Verses futuras devero incorporar maior automatismo no processo de instalao e padronizar definitivamente a sesso de ajuda presente no incio de cada mdulo (help do MATLAB) tal que exibam informaes em uma s lngua. Tambm prev-se uma verso inglesa e outra em lngua portuguesa, alm de um pequeno tutorial introdutrio para guiar o usurio no uso do pacote.

Para se incluir o caminho do diretrio wavesynt, sugere-se por exemplo a incluso das seguintes linhas ao wavepath.m na sesso dentro deste arquivo onde se encontram linhas semelhantes: pref = [MATLABPATHSEPARATOR WAVELABPATH]; pref = [pref 'wavesynt' post]; p = [p pref];

Tabela - Principais mdulos do Wavesynt e respectivas funes

Mdulos AMP(var,a,b) CRUZAR(wx,wxx,n1,n2,n3,L,qmf,peso) ENERGRAF('tipo','nome') ENERGY(var,a,b) GERAFIG3(primeiro,ultimo,'nome','com_energia') INTRFACE.M MIXAR(wx,L,peso,qmf) NORMALIZ(varivel) PWFFT(x,fi,ff,'n') RECONST(wcoef, L, qmf, peso) SETWLET SOM(Y,fs,'pr') SONORIZE(Y,fs)

WNIVEL(wc,n,qmf)

Funes Calcula a amplitude mdia (absoluta) do vetor var entre os pontos a e b Reconstrutor para sntese cruzada Produz um grfico de barras de energia de todos os nveis da anlise Calcula energia do vetor var entre os pontos a e b Gera figura (formato GIF) com grficos dos nveis Gera a interface grfica principal (interface mestre) Mistura os nveis da anlise segundo os pesos atuais na tabela de pesos Faz um zero-padding sobre a varivel a fim de normalizar sua extenso Calcula e plota a FFT do vetor x Reconstrui o sinal com os coeficientes dos nveis ponderados Seta a famlia de wavelets sob uso Converte vetor Y em som, sonoriza-o, e grava em arquivo Converte vetor Y em arquivo de som AIF e toca-o numa mquina UNIX remota (Silicon Graphics) (para mquinas UNIX em rede) Gera e plota um nvel wavelet especfico da AWMR