Você está na página 1de 8

Sociedade de Engenharia de Audio Sociedade de Engenharia de Audio

Artigo de Congresso Convention Artigo


Apresentado no 10o Congresso de Engenharia de Audio Apresentado no 10a Convention a 16 Convencao Nacional da AES Brasil SP 08 a 10 de Maio de 2006, Sao Paulo, 08 a 10 de Maio de 2012, Sao Paulo, SP

Este artigo foi reproduzido do original entregue pelo autor, sem edioou correes consideraes co co e Este artigo foi reproduzido do original nal entregue pelo autor, sem edicoes, correcoces,consideracoesefeitas pelo comit feitas pelo com es tcnico deste evento. responsabiliza pelopodemdo. Outros artigos podem es da Audioatrav s da AudioSociety, 60 East 42nd Stre e A AES Brasil n o se Outros artigos conte ser adquiridos atrav adquiridos Engineering Engineering t cnico. e a u ser e New York, New York 10165-2520, USA; www.aes.org. Informa Informac a sobre Brasileira podem ser obtidas e co ca Society, 60 East 42nd Street, New York, New York 10165-2520, USA, www.aes.org.es sobre oesseo a secao Brasileira www.aesbrasil.org. Todos os direitos s a e podem ser obtidas em www.aesbrasil.org. Todos osao reservados. No N o e permitidaa reproducao total ou parcial deste deste artigo se direitos s o reservados. apermitida a reproduo total ou parcial a ca autorizao expressa da AES Brasil. ca artigo sem autorizacao expressa da AES Brasil.

T tulo Piano Baseada Sntese por Amostragem dedo Artigo em Codicacao Wavelet
Autor 1, Autor 2, Autor 3 Thiago Rossi Roque1 e Rafael Santos Mendes1
1

Universidade Estadual de Campinas, FEEC, DCA Campinas, Cdigo Postal, Cidade, Estado, Pa Sao Paulo, 13083-970, Brasil o s

Aliacao

endereco@eletr^nico o ra072515@fee.unicamp.br, rafael@dca.fee.unicamp.br

RESUMO RESUMO Um resumo, com aproximadamente de 60 a 80 palavras, dever apresentar o conte do deste artigo. U a u Este trabalho prop e a criacao de um de 60 a 80 de sinais musicais utilizando a t cnica de do deste artigo. Um r o resumo, com aproximadamente sintetizador palavras, dever apresentar e conte amostraa o u gem aliada a uma compress o de dados de altapalavras, dever apresentarwavelet. udo deste artigo. Um resum a e Inicialmente e sumo, com aproximadamente de 60 a 80 eci ncia pela transformada o conte a apresentada uma breve introducao aarespeito das t cnicas de apresentar o conte do destesartigo. Um resumo, co e dever sntese sonora, em especial da ntese por com aproximadamente de 60 80 palavras, a u amostragem, seguido por uma descricao do som doapiano, instrumento escolhido nesse trabalho, e da aproximadamente de 60 a 80 palavras, dever apresentar o conte do deste artigo. u criacao do banco de amostras. Em seguida e apresentada a transformada wavelet e a t cnica de com e press o utilizada, para ent o ser descrito o sistema completo de sntese a partir do banco de amostras a a comprimidas seguido pela demonstracao dos resultados obtidos. 1. ITEM dito, em fonte Times Roman, tamanho 9 e justi e cado (como este). A vel com Este template, em L TEX deve ser compat 0 qualquer PC ou Macintosh. O objetivo deste tem- merecem destaque a sntese subtrativa, sntese INTRODUC AO especial 1.1. Sub-Item 1 aditiva, FM, sntese por amostragem e por modelagem plate sugerir um formato padro para e da fsica,o seus sucessos tanto letras mai sculas e min sculas, com e a ca u u Desde o surgimento da v lvula de triodo apresenta por Subitens usam no meio musical quanto a de trabalhos t tem se e cient e eletr nica, o homem cnicos esforcado para incorporar no meio comercial [2] . A fonte Helvetica, tamanho 8, esti o cos. Para isto, basta acima. e as salvar este oes el tricas na m sica buscando novas arquivo novas invenctemplate com outro nome, e como e u negrito, alinhamento a esquerda, como no item pri ` formas de eexpress o [1]. A partir dessa busca surgiu a Cada tcipal. de sntese favorece diferentes ecnica *.tex, ir digitando o novo texto sobre este.

uma nova classe de instrumentos que n o mais produ- aplicacoes e diferentes resultados sonoros. A sntese a Os artigos submetidos ` Conveno da AES a a a ca ziam som a partir de cordas, membranas ou colunas de no so por amostragem em especial se demonstra muito ar, revisadospartir de oscilacoes na corrente el trica de eciente em2. CONTEUDO de difcil modelamas sim a pelo corpo editor, e podere ser publicados ao sintetizar instrumentos garantir que os artigos como ca um sistema. formas originais, como submetidos. gem e com Para oes de din mica previsveis,da Conveno da AE em suas Para variac a A essa novaoes nais devem ser musicas em e o caso piano e de instrumentos os objetivos a isto, as versclasse de instrumentosenviadasdeu- arquivos dosejam consistentes com de percuss o. da AES Bras se PDF (*.pdf) ou em postscript (*.ps), esses Pelo fato da sntese ces amostragem exigirser consideradas pel o nome de sintetizadores, pela capacidade que segundo este por as instruo abaixo devem baixa tinham de sintetizar sons. Com o avanco da tecnolo- capacidade computacional e possibilitar sintetizar sons autores. formato. gia, diversas t cnicas de sntese sonora surgiram. Em j existentes com grande delidade, esta t cnica se e a e

Itens principais (veja acima) so em letras a mai sculas, fonte Helvetica, tamanho 8, estilo u negrito, alinhado a esquerda. O texto, propriamente `

O conte do tcnico deve ser preciso e coerent u e Citao a trabalhos anteriores e/ou de terceiros d ca vem ter seus respectivos crditos. e

ROQUE ET AL.

SNTESE POR AMOSTRAGEM CODIFICADA POR WAVELET I

tornou a mais utilizada atualmente. Por m, por se e basear inteiramente em amostras de um som especco, a sntese por amostragem necessita de uma grande quantidade de informacoes a respeito do som a ser sintetizado para que o processo ocorra com qualidade. Para contornar o problema da quantidade de informacao necess ria para este processo de sntese so a nora, t cnicas de compress o de sinais geralmente s o e a a utilizadas em conjunto com a sntese. Muitas vezes ao inv s de armazenar longos trechos de amostras de um e sinal de audio, somente um perodo desse sinal e arma zenado e no momento da sntese e executado em laco (loop), a partir da t cnica chamada wavetable [3], ou e mesmo usando diversos perodos de diferentes instantes da amostra do sinal que se combinam criando m ltiplas u wavetables [1]. Por m ao armazenar somente pequenos instantes de e um sinal, muita informacao a respeito da variacao tem poral do som e perdida causando uma degradacao na qualidade da sntese. Para que as informacoes tanto temporais quanto frequenciais possam ser preservadas mesmo quando se disp e de quantidades reduzidas de o mem ria, t cnicas mais complexas de compress o de o e a sinais devem ser empregadas.

harm nica mais rica no trecho de som imediato. Com o o intuito de reduzir a quantidade de informacao arma zenada, decidiu-se n o armazenar as amostras inteiras a do piano, mas apenas trechos dos dois instantes do som para cada nota do instrumento. Notou-se no trecho de som imediato uma variacao intensa tanto em conte do u espectral quanto na amplitude do sinal, portanto optouse por manter um instante mais longo para esse trecho de som, que compreende cerca de dois tercos da duracao do trecho de som imediato, e varia entre 250 milissegundos a 800 milissegundos de acordo com a frequ ncia. J para o trecho de som remanescente o e a sinal e mais constante nos domnios temporais e fre quenciais, portanto de maior previsibilidade e de menor quantidade de informacao [6], o que justica utilizar um instante mais curto a ser armazenado sem grandes prejuzos na qualidade sonora a ser sintetizada. Ap s o diversos testes empricos chegou-se a trechos de cerca de 10 perodos do sinal, de forma a conciliar um tama nho razo vel que facilitasse a execucao em laco (como a veremos mais a frente) sem que fosse not vel alteracoes a de amplitude pelo decaimento natural do som do piano ao longo desse trecho.

1.1

O Banco de Amostras

O SOM DO PIANO

Para tornar possvel uma compress o de alta a eci ncia, foi necess rio um estudo do som do piano de e a forma a propiciar um melhor aproveitamento das amostras em um esforco de concentrar a maior quantidade de informacao possvel em amostras mais curtas. A mec nica de um piano consiste em um complexo a conjunto de dispositivos e sistemas de alavancas que transmitem o movimento das teclas para os martelos que percutem as cordas e as fazem vibrar [4]. De acordo com Henrique [4], a din mica de uma nota do piano e a composta por duas fases, a primeira e chamada de som imediato e corresponde ao instante de vibracao da corda provocada diretamente pela percuss o do martelo, onde a a oscilacao predominante da corda ocorre na mesma direcao em que o martelo se movimenta e e perpendi cular ao tampo harm nico, onde a corda se encontra o xada. A segunda fase e chamada de som remanescente, onde a vibracao da corda e paralela ao tampo harm nico o e por isso oferece maior sustentacao ao som. O tempo de duracao de cada fase do som varia muito de acordo com a nota analisada. As notas mais graves de um piano chegam a ter um som imediato de quase 10 segundos, e um som remanescente de at 20 e segundos, j as notas mais agudas podem ter um som a imediato de apenas 1 segundo, enquanto que o som remanescente de pouco menos de 3 segundos, conforme observado por Meyer [5]. Ao analisar tanto a envolt ria quanto o espectro de o uma amostra de uma nota de um piano pode-se notar claramente a distincao entre esses dois momentos do som do instrumento tanto com relacao ao decai mento da amplitude do sinal, quanto pela composicao

Para criar o banco de amostras do sintetizador foram obtidas amostras de 85 notas de um piano Steinway & Sons tocadas em intensidade m dia (mezzo forte) a e partir da biblioteca de sons de instrumentos musicais da universidade de Iowa [7], e a partir de cada amostra foram extrados os dois trechos pertencentes aos instantes de som imediato e som remanescente que ir o compor o a banco de amostras. A partir somente dos dois trechos e possvel sintetizar o som de uma nota de um piano com grande delidade. O processo de sntese a partir desses trechos ser descrito na secao 4.1. a

A TEORIA WAVELET

Similar a an lise de Fourier [8], a teoria wavea let consiste em decompor um sinal atrav s de outras e funcoes mais simples. Por m as funcoes utilizadas e nas transformadas wavelet s o funcoes nitas e n o a a possuem componentes de frequ ncia nula, sendo ase sim quadrado integr veis. A decomposicao de sinais a pela transformada wavelet possui a caracterstica de decomposicao de sinais em nveis de resolucao pro gressivos, isto e, permite a representacao de sinais em grau de renamento crescente [9]. E baseada na ideia de representar um sinal a partir de m ltiplas escalas u temporais (o que remete ao domnio frequencial) e de m ltiplos deslocamentos temporais (o que remete u ao domnio propriamente temporal), caracterstica que proporciona a multirresolucao a transformada [10]. ` A partir da funcao escala (t) e denido um con junto de funcoes escala (t k) para qualquer k inteiro de forma que a Equacao (1) seja satisfeita. (t) =
nZ

h(n)

2 (2t n).

(1)

10o CONGRESSO / 16a CONVENCAO NACIONAL DA AES BRASIL, SAO PAULO, 08 A 10 DE MAIO DE 2012

ROQUE ET AL.

SNTESE POR AMOSTRAGEM CODIFICADA POR WAVELET I

. Denindo uma funcao wavelet (t), ortogonal a (t), obt m-se a famlia de funcoes wavelets (2j tk) e de forma que o espaco descrito por essa famlia de funcoes seja a diferenca entre dois sub-espacos des crito por duas funcoes escala de nveis subsequentes. Condicao formalizada na Equacao (2). (t) =
nZ

h1 (n)

2 (2t n).

(2)

Qualquer sinal x(t) de energia nita pode ser decomposto pela transformada wavelet conforme apresentado na Equacao (3).

x(t)

= +

cr (k) (2r t k) +
k=

(3)

dj (k) (2j t k)
k= j=r

1, onde para cada nvel decomposto s o obtidos dois a nveis subsequentes gerando uma arvore bin ria, onde a o ultimo nvel obtido e composto pelas chamadas fo lhas, os coecientes de cada ultimo ramo da arvore. Desde o surgimento da teoria wavelet diversas funcoes wavelets foram criadas para as mais diversas aplicacoes, pois a realizacao da an lise wavelet a par a tir de diferentes funcoes base leva a resultados diver sos. Para representacao de sinais sonoros Faria [11] chegou a conclus o que a suavidade da funcao wavea let (seu n mero de momentos nulos) e o par metro de u a maior import ncia na escolha da base a ser usada, chea gando a conclus o que a wavelet que possui a maior a suavidade com menor custo computacional seria a Daubechie 16, com oito momentos nulos e 32 coecientes nos ltros h(n) e h1 (n) da wavelet. Por m para redue zir ainda mais o custo computacional com o objetivo de criar um sistema orientado ao funcionamento em tempo real optou-se por usar a wavelet Daubechie 8 por ter metade do n mero de coecientes em seus ltros. u

3.1
cr (k) e dj (k) s o os coecientes da transformada a wavelet do sinal x(t). Na Equacao (3) o n mero inteiro u r e arbitr rio e representa a escala mais grosseira de a representacao do sinal x(t) e cada valor do ndice j est a associado a um nvel de detalhe do sinal. Caso o sinal x(t) seja amostrado, esse passa a ser de banda limitada e consequentemente de maior nvel de resolucao limitado. Concomitantemente a funcao (2r t k) se aproxima de funcoes impulsos e cr (k) se aproxima consideravelmente de x(t) amostrado. A partir dessas aproximacoes e dos coecientes h(n) e h1 (n) apresentados nas equacaes (1) e (2) pode se obter a Equacao (4) onde e possvel obter tanto os coecientes cj (k) quanto dj (k) a partir somente dos coecientes h(n) e h1 (n) e de cj+1 (n) e consequentemente de x(t).

A Compressao

Para realizar a compress o das amostras foi desena volvida uma t cnica a partir da pesquisa de Luvizotto e [12] onde o sinal e decomposto pela transformada wavelet packet e os coecientes de cada folha s o ordenaa dos ascendentemente e ent o aproximados por curvas a mais simples. Assim pode-se recuperar o sinal original com grande proximidade a partir somente da descricao da curva e do posicionamento original dos coecientes. O m todo aqui utilizado segue os mesmos e princpios utilizados por Luvizotto [12], por m re e nados para utilizacao nas amostras de som do piano. Aqui cada um dos dois trechos de cada amostra e submetido a transformada wavelet packet de 4 nveis 1 . Para maximizar a taxa de compress o e dado um lia miar mnimo para os coecientes, onde os que estive rem abaixo desse limiar s o descartados. Assim s o a a avaliadas cada folha da wavelet packet com relacao a
1 A princpio desejou-se realizar a transformada com 8 nveis, por m para maiores nveis o tamanho da matriz da transformada ine versa se torna muito grande aumentando o custo computacional

cj (k) dj (k)

=
n

h(n 2k)cj+1 (n) h1 (n 2k)cj+1 (n)


n

(4)

Sendo o n mero de coecientes h(n) e h1 (n) u nito, essa equacao pode ser interpretada como um pro cesso de ltragem (tipo FIR) seguido de decimacao, onde h(n) funciona como um ltro passa-baixa e h1 (n) funciona como um ltro passa-alta.

A TRANSFORMADA WAVELET NO PROCESSO DE SNTESE I

Dentre os diversos m todos de realizacao das transe formadas wavelet discreta, o m todo adotado foi a wae velet packet onde tanto os coecientes cj (k) quanto dj (k) s o sucessivamente ltrados. Uma representacao a gr ca dessa transformacao e apresentada na Figura a

Figura 1: Transformada Wavelet Packet

10o CONGRESSO / 16a CONVENCAO NACIONAL DA AES BRASIL, SAO PAULO, 08 A 10 DE MAIO DE 2012

ROQUE ET AL.

SNTESE POR AMOSTRAGEM CODIFICADA POR WAVELET I

quantidade de coecientes que est o abaixo e acima do a limiar, caso todos os coecientes estejam abaixo do li miar, a folha inteira e descartada, caso contr rio e coma parada a quantidade de coecientes que est o abaixo e a acima do limiar, assim somente o que estiver em menor quantidade ter a posicao dos coecientes armazenado. a Para proporcionar melhor resultado sonoro, foi aplicado um processo que varia o limiar em determinadas folhas. Dado o fato de que cada folha compete a uma determinada faixa de frequ ncia, utilizou-se a curva e proposta por Fletcher-Munson [13] que determina a variacao da sensibilidade do ouvido humano para dife rentes faixas de frequ ncia. Assim as folhas que cont m e e frequ ncias mais sensveis a audicao humana t m seu e e limiar reduzido, enquanto frequ ncias menos sensveis e t m seu limiar aumentado, dado que possuem menos e import ncia para o resultado sonoro. a Em seguida todos os coecientes da folha s o ora denados de forma ascendente para ent o serem aproa ximados por um polin mio de grau pr -denido. Essa o e aproximacao e feita pelo m todo de mnimos quadra e dos [14], por m utilizando diferentes pesos para os coe ecientes, garantindo aos coecientes mais pr ximos o do limiar maior import ncia na aproximacao polinoa mial pois esses coecientes possuem mais inu ncia e no timbre e na qualidade sonora. Ap s a realizacao do o mnimos quadrados e obtida a equacao do polin mio o que melhor se aproxima pela curva dos coecientes e a equacao e armazenada atrav s dos coecientes mul e tiplicadores das sucessivas pot ncias de x que descreve e o polin mio. Um exemplo gr co dos coecientes de o a uma folha pode ser visto na Figura (2) enquanto na Figura (3) nota-se os mesmos coecientes ordenados sobrepostos pelo polin mio encontrado que melhor se o aproxima da curva obtida.

Figura 3: Coecientes de uma folha ordenados e polin mio aproximado o transformado ocorra amostra por amostra 2 , de forma que o processamento de sntese possa ser feito parale lamente a execucao do som favorecendo a execucao em tempo real. Para que isso fosse possvel foi necess rio imple a mentar um m todo de realizacao da anti-transformada e explicitada na Equacao (5) de forma matricial. cj+1 (k) =
n

cj (n)h(k 2n) +
n

dj (n)h1 (k 2n)

Figura 2: Coecientes de uma folha

3.2

A Transformada Inversa

Nos m todos tradicionais da transformada wavee let packet inversa, a recuperacao do sinal transformado e realizada de forma semelhante, por m no sentido e oposto, ao m todo tradicional de decomposicao dese crito na secao 3 pelo m todo dos ltros na criacao da e arvore bin ria. Por m essa t cnica tem a caracterstica a e e de recuperar o sinal inteiro de uma unica vez, o que n o e desej vel para este projeto. Para um processo de a a sntese sonora e prefervel que a recuperacao do sinal

(5) A solucao encontrada foi dispor os coecientes dos ltros em uma matriz similar a uma matriz de Toeplitz e concatenar os coecientes das folhas de um mesmo nvel da transformada em um unico vetor. A multiplicacao dessa matriz de ltros pelo vetor de coe cientes gera o nvel seguinte da arvore wavelet packet. A matriz de ltros esta esquematizada na Figura 4, onde n e o comprimento de cada folha para o mesmo nvel da matriz e nh e o comprimento dos ltros, que s o a dispostos verticalmente nas colunas e cada coluna de ltro e defasada em duas linhas garantindo o processo de decimacao. Nota-se que a matriz pode ser dividida verticalmente em duas, onde as duas metades s o praticamente a iguais, por m a primeira utiliza os coecientes do ltro e h0 e a segunda utiliza os coecientes do ltro h1. Essa divis o ocorre, pois cada metade ser multiplicada por a a cada folha bin ria desse mesmo nvel. a Por m essa matriz apresentada, que ser denomie a nada de matriz b sica, s pode ser usada para o caso a o de duas folhas da arvore wavelet packet. Para nveis de mais de duas folhas e necess rio compor uma nova a matriz. Para o caso de quatro folhas, essa nova matriz pode ser obtida pela multiplicacao de uma matriz dia gonal composta pela matriz b sica em sua diagonal com a uma nova matriz similar a b sica, por m de mesmas dia e mens es que a matriz diagonal. o Esse processo pode ser estendido para qualquer nvel, onde a matriz de anti-transformada de nvel k pode ser obtida a partir da matriz de nvel k 1, e
2 Aqui se usa amostra com signicado similar ao resultado da multiplicacao de um sinal por uma funcao impulso, ao contr rio do a uso mais decorrente nesse trabalho que se refere a um trecho repre sentativo de audio.

10o CONGRESSO / 16a CONVENCAO NACIONAL DA AES BRASIL, SAO PAULO, 08 A 10 DE MAIO DE 2012

ROQUE ET AL.

SNTESE POR AMOSTRAGEM CODIFICADA POR WAVELET I

Figura 4: Matriz b sica a consequentemente da matriz b sica. Esse processo est a a descrito na Figura (5). Inicialmente e criada a matriz b sica e ent o s o a a a feitas as sucessivas multiplicacoes at atingir a matriz e para o nvel necess rio. Dada a caracterstica recursiva a desse c lculo, esse se apresenta muito eciente, apesar a das grandes dimens es envolvidas. o Nota-se que a cada multiplicacao do vetor conca tenado das folhas com cada linha da matriz se obt m e uma unica amostra do sinal recuperado, como desejado inicialmente.

Figura 6: Estrutura do Sintetizador nota do evento MIDI ao banco de amostras e, em m se inicia a sntese sonora. Onde a amostra e descompri mida e processada. Caso o sistema receba dois eventos de execucao de notas simultaneamente, ou receba uma nova nota enquanto uma outra est sendo gerada, um gerenciador da a sntese faz com que n notas sejam geradas ao mesmo tempo, ou seja, em cada perodo de amostragem e ge rada uma amostra1 de cada nota e a soma das n amostras resulta no som correspondente ao som simult neo a das n notas. Isto e possvel pois para cada amostra gerada, o estado da nota que esta sendo sintetizada e atualizado, possibilitando ao sistema interromper o processo em qualquer etapa para sintetizar uma nova nota em qualquer momento. Conforme as amostras s o geradas, estas s o suba a metidas a fatores de amplitude que determinam a envolt ria da nota, al m de simular a din mica de inteno e a sidade da nota de acordo com o valor da intensidade na mensagem MIDI. Caso sintetizador receba uma mensagem de m de nota durante a execucao da mesma, o sistema atualiza o evento dessa nota no quadro-negro e submete as amostras que est o sendo geradas a um novo a decaimento mais acentuado, simulando a mec nica real a de um piano.

Figura 5: Construcao da matriz de anti-transformada para nvel gen rico e

O SINTETIZADOR

O diagrama do sistema est apresentado na Figura a 6. O processo comeca com a recepcao de uma mensa gem MIDI, que e decodicada e inicia o processo de gerenciamento das notas a serem executadas. Esse pro cesso de gerenciamento e feito por um m todo chamado e de quadro negro, baseado nas estruturas de mesmo nome muito utilizadas em arquiteturas de softwares [15], onde a mensagem MIDI decodicada, antes de iniciar a sntese, e escrita juntamente com vari veis a que representam o estado do processo de sntese. Esse m todo garante que mais de uma nota possa ser execue tada ao mesmo tempo, ou seja, que o sintetizador seja polif nico. o Ap s a escrita no quadro-negro da mensagem reo cebida, o sistema requisita a amostra correspondente a

4.1

A Sntese

O processo de sntese se inicia no momento em que o quadro negro e preenchido por uma mensagem MIDI de evento do tipo NOTE-ON, assim o sistema analisa qual nota deve ser executada e requisita ao banco de amostras os trechos necess rios. Por m como os a e trechos se encontram comprimidos e codicados sob forma de polin mios, estes s o previamente decodio a cados at que as folhas da wavelet packet sejam ree construidas. A partir das folhas a recuperacao do sinal ocorre atrav s da matriz da transformada inversa apree sentada na secao 3.2 conforme cada amostra de cada

10o CONGRESSO / 16a CONVENCAO NACIONAL DA AES BRASIL, SAO PAULO, 08 A 10 DE MAIO DE 2012

ROQUE ET AL.

SNTESE POR AMOSTRAGEM CODIFICADA POR WAVELET I

trecho e requisitada em cada instante de perodo de amostragem. O processo de sntese em si consiste em avaliar o es tado do processo e decidir se a amostra que ser gerada a deve ser sintetizada a partir do trecho de som imediato ou do trecho de som remanescente, e qual envolt ria o dever ser aplicada a amostra. Em um instante inicial, a o processo de sntese e feito por um m todo pr ximo e o ao PCM Playback onde as amostras s o sintetizadas a a partir do trecho de som imediato, por m conforme esse e trecho chega ao seu nal, a sntese passa a ocorrer a partir do trecho de som remanescente. No momento em que o contador de amostras do segundo trecho chega ao nal, este e zerado e o trecho comeca a ser lido desde seu incio, realizando a execucao em laco. A partir do momento em que a sntese passa a ocor rer a partir do trecho de sustentacao, cada amostra ge rada e submetida a um fator que gera um decaimento exponencial na amplitude do sinal, de forma a simular o decaimento natural do som do piano. Para cada nota do piano um decaimento diferente e aplicado, pois como visto na secao 1, a duracao do som varia muito de acordo com a nota analisada. Aliado a esse processo um segundo fator e aplicado a todas as amostras geradas, inclusive do trecho de som imediato, que e proporcional a mensagem MIDI de velocity e determina a intensidade da nota tocada. Sendo que o valor m ximo que a mensagem cont m e 127, a e esse valor e associado a um fator unit rio. a Por m um problema muito comum ocorre durante a e tentativa de emendar trechos de sinais peri dicos. Caso o os dois trechos a serem emendados sejam muito diferentes ou estejam em fases distintas de seu desenvol vimento e muito comum o surgimento de rudo de alta frequ ncia (chamado comumente de click) na emenda e dos sinais. Para que isso n o ocorra foi necess rio utia a lizar algumas ferramentas. Previamente, quando os dois trechos de cada nota foram selecionados, foi calculado o segmento de tamanho n do nal do trecho de som imediato que possui melhor correlacao com o segmento inicial de mesmo tamanho n do trecho sustentacao, e ent o o seg a mento de melhor correlacao do trecho de som imedi ato foi feito de segmento nal simplesmente apagando qualquer segmento sucedente. Assim pode-se garantir que a sobreposicao desses dois segmentos possuir a alta semelhanca e a mesma fase. O mesmo processo foi feito tamb m entre um segmento nal do trecho e de sustentacao com o segmento inicial do mesmo tre cho, garantindo uma sobreposicao de alta semelhanca e mesma fase entre o segmento nal e inicial do trecho de sustentacao. Garantindo semelhanca entre os segmentos a serem emendados, n o mais se muda a leitura de cada trea cho no momento em que o trecho chega ao nal, mas quando a leitura de primeiro trecho chega ao ultimo segmento de tamanho n, ocorre uma sobreposicao entre esse segmento e o segmento inicial do pr ximo trecho, o

por m o segmento nal sofre um processo de fade out e e o segmento inicial recebe um fade in. O processo de fade consiste em submenter um segmento a um fator crescente de 0 a 1 para o fade in e a um fator de 1 a 0 para o fade out, por m em qualquer instante a soma e dos dois fatores deve ser constante e de valor unit rio, a de forma que e mantida a linearidade da sobreposicao. Esse processo e feito tamb m tanto para a emenda do e trecho de som imediato com o trecho de sustentacao, como entre o nal e o incio do trecho de sustentacao para criar o loop. Aplicando esse processo de fade em trechos de alta correlacao as chances de ocorrer clicks diminuem consideravelmente, criando emendas praticamente im perceptveis, o que e de grande import ncia para garan a tir um som contnuo como o som natural de um piano.

CONCLUS AO E PR OXIMOS PASSOS

Os primeiros resultados obtidos foram a respeito do m todo de compress o das amostras, onde os primeie a ros testes foram muito promissores. A princpio fo ram criados arquivos bin rios contendo todos os trechos a de amostras de cada nota comprimidos e decodicados juntamente com dados necess rios para a sntese a para tir dessas notas. O conjunto das 85 notas originais ocupam uma mem ria de 421MB. Somente pelo fato das o amostras serem reduzidas aos trechos de som imediato e som remanescente, esse valor pode ser reduzido a apenas 5MB. Ap s as amostras serem comprimidas pelo o m todo acima descrito o banco de amostras criado pode e ser concentrado em apenas 1,44MB contendo todas as informacoes necess rias para a sntese, mesmo garan a tindo um resultado sonoro de qualidade com grande delidade ao som de um piano ac stico. u Apesar de atualmente o preco da mem ria ser muito o baixo, com o crescente mercado de tablets e smartphones t cnicas de sntese mais econ micas t m encone o e trado novas aplicacoes. Com possveis bancos de amos tras da ordem de 1MB, novas possibilidades de aplicativos para dispositivos port teis podem surgir. a Para avaliar os resultados obtidos, executou-se a sntese de uma nota A4, representada na Figura 7, para que a mesma fosse comparada com a nota original de onde foi extrada suas amostras. Nas Figuras 8 e 9 te mos um trecho de som imediato para o som original e para o som sintetizado respectivamente. Enquanto que nas Figuras 10 e 11 temos um trecho do som remanescente tamb m para o som original e para o som sintetie zado respectivamente. Pela an lise dos formatos de onda pode-se notar a grande semelhanca entre os trechos de som imediato. Para o trecho de som remanescente nota-se uma consi der vel diferenca, inclusive e possvel notar a repeticao a do trecho executado em laco, por m essa diferenca en e tre o som sintetizado e o som original n o e de grande a distincao sonora. Uma an lise mais complexa pode ser feita a para tir da an lise de espectro dos dois sinais. Os espectros a

10o CONGRESSO / 16a CONVENCAO NACIONAL DA AES BRASIL, SAO PAULO, 08 A 10 DE MAIO DE 2012

ROQUE ET AL.

SNTESE POR AMOSTRAGEM CODIFICADA POR WAVELET I

Figura 7: A4 sintetizado

Figura 10: Trecho de Som Remanescente Original

Figura 8: Trecho de Som Imediato Original dos sons podem ser analisados atrav s das Figuras 12 e e 13. Como esperado pela an lise anterior, o conte do a u espectral para os trechos iniciais de ambos os sons s o a semelhantes, por m nota-se mais uma vez a diferenca e entre os trechos de som remanescente. Pelo fato de ser utilizado somente um trecho curto executado em laco, o espectro desse trecho se torna constante, vari ando somente em amplitude pelo decaimento articial inserido no processo de sntese, em oposicao ao espec tro do som original onde o decaimento e distinto para cada harm nica. o Um grande problema encontrado se d no tempo de a

Figura 11: Trecho de Som Remanescente Sintetizado execucao do programa, que e muito longo e inviabiliza uma execucao em tempo real, como originalmente ide alizado. O principal motivo encontrado para esse tempo de processamento est na plataforma utilizada, por usar a uma linguagem de alto nvel o programa Matlab n o a e a ferramenta ideal para projetos que necessitem de funcionamento em tempo real. Uma solucao para esse problema seria a implementacao desse projeto em lin guagens de mais baixo nvel como a linguagem C, diminuindo o tempo de execucao do programa conside ravelmente. Outra limitacao que a plataforma Matlab apresentou foi a falta de ferramentas para implementar uma comunicacao externa com o programa para rea lizar o envio e recebimento de mensagens MIDI. Para isso foi feito um programa que simulasse o recebimento das mensagens nos instantes de ocorr ncia dos eventos e mediante um temporizador. A utilizacao da linguagem C como plataforma de implementacao tamb m resol e veria esse problema.

REFER ENCIAS BIBLIOGR AFICAS


Figura 9: Trecho de Som Imediato Sintetizado [1] Curtis Roads, The Computer Music Tutorial, MIT Press, 1995.

10o CONGRESSO / 16a CONVENCAO NACIONAL DA AES BRASIL, SAO PAULO, 08 A 10 DE MAIO DE 2012

ROQUE ET AL.

SNTESE POR AMOSTRAGEM CODIFICADA POR WAVELET I

[5] J rgen Meyer, Acoustics and the Performance of u Music, Springer, 2009. [6] Bernardo N. B. Lima e Leandro Martins Cioletti e Marcelo de O. Terra Cunha e Gast o A. Braga, a Entropia: Introducao a Teoria Matem tica da ` a (des)Informacao, 2004. [7] , http://theremin.music.uiowa.edu/MIS.piano.html. [8] Alan V. Oppenheim e Alan S. Willsky e S. Hamid Nawab, Signals & systems (2nd ed.), Prentice-Hall, Inc., 1996. [9] C. Sidney Burrus e Ramesh A. Gopinath e Haitao Guo, Introduction to Wavelets and Wavelet Transform: A Primer, Prentice Hall, 1998. [10] Paul S. Addison, Illustrated Wavelet Transform Handbook, Institute of Physics Publishing, 2002. [11] Regis Rossi Alves Faria, Aplicacao de wave lets na an lise de gestos musicais em timbres de a instrumentos ac sticos tradicionais, M.S. thesis, u Escola Polit cnica da Universidade de S o Paulo, e a 2007. Figura 13: Espectro da Nota Sintetizada [2] Ang Yaw Feng e Minni Ang, Sampling synthesis technique applied for the digital generation of musical tones of malaysian folk instruments, Tech. Rep., Music Department, Faculty of Human Ecology, Universiti Putra Malaysia. [3] Vesa V lim ki e Matti Karjalainen Tero Tolonem, a a Evaluation of modern sound synthesis methods, Tech. Rep., Helsinki University of Technology, 1998. [4] Lus L. Henrique, Ac stica Musical, Fundacao u Calouste Gulbenkian, 2009. [12] Andr Luiz Luvizotto, Modelos de representacao e de sinais musicais via transformada wavelets, M.S. thesis, Faculdade de Engenharia El trica e e de Computacao - Unicamp, 2007. [13] Harvey Fletcher e W. A. Munson, Loudness, its denition, measurement and calculation, Journal of the Acoustical Society of America, 1933. [14] Charles L. Lawson e Richard J. Hanson, Solving least squares problems, Prentice-Hall, 1974. [15] Antonio Mendes, Arquitetura de Software, Ed. Campus, 2002.

Figura 12: Espectro da Nota Original

10o CONGRESSO / 16a CONVENCAO NACIONAL DA AES BRASIL, SAO PAULO, 08 A 10 DE MAIO DE 2012