Você está na página 1de 92

UNIVERSIDADE FEDERAL DA PARABA

CENTRO DE CINCIAS EXATAS E DA NATUREZA


DEPARTAMENTO DE INFORMTICA
PROGRAMA DE PS-GRADUAO EM INFORMTICA

ANLISE DE PADRES MUSICAIS RTMICOS E


MELDICOS UTILIZANDO O ALGORITMO DE
PREDIO POR CORRESPONDNCIA PARCIAL

ANTONIO DEUSANY DE CARVALHO JUNIOR

JOO PESSOA-PB
Dezembro-2011

II
ANTONIO DEUSANY DE CARVALHO JUNIOR

ANLISE DE PADRES MUSICAIS RTMICOS E


MELDICOS UTILIZANDO O ALGORITMO DE
PREDIO POR CORRESPONDNCIA PARCIAL

DISSERTAO APRESENTADA AO CENTRO DE CINCIAS EXATAS E


DA NATUREZA DA UNIVERSIDADE FEDERAL DA PARABA, COMO
REQUISITO PARCIAL PARA OBTENO DO TTULO DE MESTRE EM
INFORMTICA (SISTEMAS DE COMPUTAO).

Orientador: Prof. Dr. Leonardo Vidal Batista

JOO PESSOA-PB
Dezembo-2011

III
IV
Agradeo s energias que proporcionam a existncia de tudo.
Resumo

O desenvolvimento da Teoria da Informao possibilitou formas diversas de


tratamento de dados que so relevantes para qualquer rea cientfica atualmente. Dentre elas,
temos a caracterizao da auto-informao, onde temos a possibilidade de determinar a
informao contida em um dado em prol de futuras anlises e, a partir deste ponto, a
probabilidade de ocorrncia de um elemento num determinado contexto tem como ser
avaliada em virtude da anlise da entropia. Em consequncia disso, modelos de compressores
foram desenvolvidos baseando-se em predio, e o algoritmo de Predio por
Correspondncia Parcial (Prediction by Partial Matching - PPM) foi o que mais se destacou
por se aproximar ao mximo da entropia de uma entrada qualquer com dependncia de
contextos. O PPM realiza predio por correspondncia parcial entre elementos em um
determinando contexto, permitindo o reconhecimento de padres e utilizado em diversas
reas.
Neste trabalho, a problemtica vem da avaliao da eficincia da utilizao do PPM
em arquivos de udio com o intuito de utiliz-lo no reconhecimento de padres meldicos e
rtmicos em melodias. Os testes foram realizados utilizando melodias no formato MIDI,
criando os modelos a partir das articulaes meldicas e rtmicas separadamente, modelando
os dados a partir da variao entre as alturas das notas das melodias e tambm considerando
as propores entre as duraes das notas. A avaliao da eficincia dos modelos foi realizada
atravs de Validao Cruzada a fim de verificar as melhores caractersticas da modelagem.
Os resultados obtidos com os primeiros testes realizados com obras para violino solo
serviram para se ter um domnio das possveis maneiras de utilizao. Houve uma taxa de
acerto mdio de 80%, mesmo sem considerar todos os conceitos importantes da Teoria
Musical. Com estes resultados, realizou-se um teste de similaridade de melodias, buscando 30
melodias num banco de 5223 arquivos obtendo timos resultados. A anlise de melodias com
o PPM utilizando os conceitos determinados confirma o PPM como um algoritmo verstil
para reconhecimento de padres em sequncias meldicas, considerando vlida a modelagem
dos dados de entrada utilizada neste trabalho.

Palavras-chave: Anlise musical, PPM, MIDI


Abstract

The development of Information Theory allowed various forms of data processing that
are relevant to any area of science today. Among them, we have the characterization of the
self-information, where we have the possibility to determine the information given in favor of
a future analysis, and, from this point, the probability of an element in a given context is to be
evaluated under the entropy analysis. By this concept, various models of compressors were
developed based on prediction, and the Prediction by Partial Matching algorithm (PPM) has
results closest to the maximum entropy of a given input with context dependence. The PPM
performs prediction by partial correlation between the elements, allowing for pattern
recognition and is used in several areas.
The aim of this work is the efficiency evaluation of the use of PPM in symbolic audio
files in order to be used in pattern recognition over the melodic and rhythmic patterns of
melodies. The tests were conducted using melodies on MIDI files, creating models from the
melodic and rhythmic parts, evaluating the efficiency of the models through cross-validation.
The results obtained with the first tests carried out on works for solo violin have been
meant as possibility ways to use. There was an average hit rate of 80%, even without
considering all the important concepts of Music Theory. With these results, we carried out a
test of similarity of melodies, 30 melodies were sought through a bank of 5223 files with great
significant results. The analysis of melodies with certain concepts using the PPM confirms the
PPM as a versatile algorithm for pattern recognition in melodic sequences, considering the
modeling of valid input data used in this work.

Keywords: Music analysis, PPM, MIDI


Lista de ilustraes

Figura 1. Representao da relao entre as frequncias, cdigo MIDI e notas musicais ....... 23
Figura 2. Representao da proporo temporal existente entre smbolos de notao musical27
Figura 3. Exemplo de articulaes rtmicas .......................................................................... 27
Figura 4. Parte inicial da Melodia do Hino Nacional Brasileiro ............................................ 29
Figura 5. Exemplo da representao grfica do Hino Nacional Brasileiro ............................. 29
Figura 6. Membrana timpnica, sistema ossicular do ouvido mdio e ouvido interno ........... 31
Figura 7. Mapa tonotpico da cclea .................................................................................... 32
Figura 8. Diagrama do caminho do estmulo auditivo ........................................................... 33
Figura 9. Violino Lady Blunt feito por Antonius Stradivarius em 1721 ............................. 42
Figura 10. Parte da partitura do primeiro movimento da obra BWV 1002 de Johann Sebastian
Bach .............................................................................................................................. 45
Figura 11. Parte da partitura do segundo movimento da obra BWV 1004 de Johann Sebastian
Bach .............................................................................................................................. 45
Figura 12. Representao comparativa entre os intervalos meldicos em obras de Bach ....... 46
Figura 13. Representao comparativa entre os intervalos rtmicos em obras de Bach .......... 46
Figura 14. Diagrama de Pacotes do Sistema de Anlise Musical .......................................... 49
Figura 15. Diagrama de Classe do Pacote Classificador ................................................... 50
Figura 16. Interface do Sistema de Anlise Musical ............................................................. 53
Figura 17. Interface do menu Arquivo .................................................................................. 53
Figura 18. Interface do menu Modelo ................................................................................... 54
Figura 19. Interface do menu Testes ..................................................................................... 54
Figura 20. Exemplo de interface dos resultados: Taxa por Contexto ..................................... 55
Figura 21. Exemplo de interface dos resultados: Taxa por Contexto/Compositor .................. 55
Figura 22. Exemplo de interface dos resultados: Taxa por Compositor/Contexto .................. 56
Figura 23. Comparao entre este sistema e o Sistema de Percepo Auditiva...................... 58
Figura 24. Interface do programa aps a realizao dos testes .............................................. 62
Figura 25. Interface do resultado da anlise no primeiro modo com melodia (1) ................... 63
Figura 26. Interface do resultado da anlise no primeiro modo com melodia (2) ................... 63
Figura 27. Interface do resultado da anlise no primeiro modo com melodia (3) ................... 63
Figura 28. Interface do resultado da anlise no primeiro modo com ritmo (1) ....................... 64
Figura 29. Interface do resultado da anlise no primeiro modo com ritmo (2) ....................... 64
Figura 30. Interface do resultado da anlise no primeiro modo com ritmo (3) ....................... 64
Figura 31. Interface do resultado na anlise no segundo modo (1) ........................................ 65
Figura 32. Interface do resultado da anlise no segundo modo (2) ........................................ 65
Figura 33. Interface do resultado da anlise no segundo modo (3) ........................................ 65
Figura 34. Interface do resultado da anlise no terceiro modo (1) ......................................... 66
Figura 35. Interface do resultado da anlise no terceiro modo (2) ......................................... 66
Figura 36. Interface do resultado da anlise no terceiro modo (3) ......................................... 66
Figura 37. Interface do resultado da anlise no quarto modo (1) ........................................... 67
Figura 38. Interface da anlise do resultado no quarto modo (2) ........................................... 67
Figura 39. Interface do resultado da anlise no quarto modo (3) ........................................... 67
Lista de tabelas

Tabela 1. Exemplo de tabela de probabilidades utilizadas para para classificao com PPM 20
Tabela 2. Porcentagem de acerto dos modos de avaliao .................................................... 68
Tabela 3. Durao dos testes dos modos de avaliao utilizando 7 contextos ........................ 68
Tabela 4. Resultado do teste simulando o MIREX................................................................ 69
Lista de abreviaturas e siglas

ADC Conversor Analgico-Digital (Analogic/Digital Converter)


API Interface para Programar Aplicaes (Application Programming Interface)
bpm Batidas por minuto (beats per minute)
CV Validao Cruzada (Cross Validation)
DAC Conversor Digital-Analgico (Digital/Analogic Converter)
DAP Processamento digital de udio (Digital Audio Processing)
IMSLP Projeto Biblioteca Internacional de Partituras Musicais (International Music Score
Library Project)
ISMIR Sociedade Internacional para Recuperao de Informaes em Musical
(International Society for Music Information Retrieval)
LCS Mais Longa Subsequncia Comum (Longest Common Subsequence)
LOOCV Validao Cruzada Deixando Um de Fora (Leave-One-Out Cross Validation)
MIDI Interface Digital para Instrumentos Musicais (Musical Instrument Digital
Interface)
MIR Recuperao de Informaes em Msicas (Music Information Retrieval)
MIREX Permuta de Avaliaes de Recuperao de Informaes em Msica (Music
Information Retrieval Evaluation eXchange)
NCD Distncia de Compresso Normalizada (Normalized Compression Distance)
PPM Predio por Correspondncia Parcial (Prediction by Partial Matching)
SMS Similaridade de Melodias Simblicas (Symbolic Melodic Similarity)
Sumrio

1 Introduo ....................................................................................................................... 11

2 Fundamentao Terica ................................................................................................. 15

2.1 Teoria da Informao ............................................................................................... 15


2.1.1 Predio por Correspondncia Parcial ................................................................... 16
2.1.2 Exemplo de aplicao do PPM .............................................................................. 19
2.2 Sinais de udio .......................................................................................................... 21
2.2.1 Processamento Digital de udio ........................................................................... 22
2.2.2 Formato MIDI....................................................................................................... 22
2.3 Anlise Musical ......................................................................................................... 24
2.3.1 Ritmo .................................................................................................................... 26
2.3.2 Melodia ................................................................................................................ 27
2.3.3 Percepo do som ................................................................................................. 30
2.4 Validao Cruzada .................................................................................................... 34
2.4.1 Exemplo de validao cruzada .............................................................................. 35

3 Aplicao do PPM para Anlise Musical ....................................................................... 37

3.1 Trabalhos Correlatos sobre Anlise Musical ........................................................... 37


3.1.1 Trabalhos Correlatos Utilizando o Formato MIDI ................................................. 39
3.2 Descrio da Anlise Musical Realizada .................................................................. 41
3.2.1 Definio da Anlise Musical com o PPM ............................................................ 43
3.2.2 Exemplo da aplicao do mtodo de tratamento das melodias e ritmos .................. 45
3.2.3 Descrio das avaliaes realizadas....................................................................... 47
3.3 Sistema para Anlise Musical ................................................................................... 49
3.3.1 Detalhes de desenvolvimento ................................................................................ 50
3.3.2 Interface para Interao com o Sistema ................................................................. 52
3.3.3 Comparativo deste sistema com o Sistema de Percepo Auditiva ........................ 56
3.3.4 Verso do sistema para o MIREX ......................................................................... 59

4 Resultados da Anlise ..................................................................................................... 61

4.1 Interfaces dos resultados........................................................................................... 62


4.2 Detalhes dos resultados ............................................................................................. 68

5 Consideraes Finais ....................................................................................................... 70

5.1 Discusso dos Resultados .......................................................................................... 70


5.2 Propostas para Trabalhos Futuros ........................................................................... 71

Referncias ......................................................................................................................... 73

APNDICE A Aplicao do PPM para preparao de um modelo .............................. 79

APNDICE B Compresso de entrada utilizando um modelo com PPM .................... 83

APNDICE C Lista de obras utilizadas......................................................................... 89


11

1 Introduo
A ligao entre as diversas reas da cincia impe uma visualizao mais ampla diante
de conceitos existentes, principalmente pelo fato de tornar-se possvel levar em considerao
os diversos pontos de vista e funes crticas referentes a cada rea. Considerando a ligao
entre todas as Cincias e a Computao possvel reconhecer o quo importante a
participao desta na evoluo daquelas. A interao com a msica, por sua vez predisps
anlises diversificadas que vo desde a determinao automtica de acordes criao de
msica atravs de sistemas computacionais.
Um dos principais objetos de estudo da msica o som, fenmeno acstico existente
atravs da propagao de ondas sonoras pelo espao. O estudo do som por estar diretamente
relacionado com o sistema auditivo adquire conceitos importantes tambm na psicologia da
percepo auditiva e fisiologia do sistema neurolgico e auditivo. Alm disso, h de se
considerar o foco no estudo artstico da msica, buscando as razes para justificar as reaes
humanas perante as sensaes passadas, por exemplo, pela ateno execuo de uma ode e
na composio da mesma.
O ser humano percebe o som utilizando-se do seu sistema auditivo e s vezes do
sistema ttil e visual, considerando que propagao de ondas pelo espao provocada por
energia mecnica e eltrica na maioria das vezes. Desde a Gestalt, psiclogos passaram a
analisar os sentidos de modo que se tornou possvel entend-los com experincias que
descrevem o funcionamento do crebro quanto percepo. A percepo em si depende tanto
das sensaes quanto da interpretao criteriosa das relaes entre tudo que sentido. No
sistema auditivo, o som adquirido sequencialmente ordenado pelo ouvido humano e
percorre um caminho atravs da cclea at o crtex auditivo. Sua interpretao vai desde o
ouvido interno e pode se relacionar com lembranas de outros sons encontradas na memria.
As marcas deixadas por uma simples melodia podem gerar outras melodias ou serem
utilizadas para o simples reconhecimento da melodia a partir da execuo de poucas notas da
mesma. Desta mesma maneira, a percepo de ritmo leva ao acompanhamento do mesmo,
seja atravs de um instrumento musical ou um simples bater do p no cho, dando a
impresso de predio. Esta predio est relacionada com diversos fatores atravs dos quais
12

o crebro possibilita uma recuperao de uma informao antiga para reconhecer algo j
existente ou predispor a criatividade.
O tratamento de informaes, sejam elas de qualquer tipo, d a possibilidade de
entendimento das mesmas. Conceitos da Matemtica junto Computao permitiram que
fosse ento desenvolvida a Teoria da Informao, propondo uma maneira inovadora para o
tratamento de dados contidos em informaes atravs de mtodos matemticos. A partir da,
diversos trabalhos correlacionando as informaes contidas em dados tornaram-se possveis.
Na rea da Msica no foi diferente, tendo em vista que a anlise de uma grande quantidade
de obras vem a ser invivel ou cansativa por um humano, enquanto que um computador
habilitado para tal tarefa capaz de realiza-la em tempo hbil e sem fatigar-se pelo esforo
realizado.
Diversas pesquisas em busca das relaes entre as estruturas musicais foram realizadas
ao longo dos sculos atravs de anlise de partituras e documentos histricos. Com o avano
das tecnologias, as pesquisas foram se tornando mais intensas e os objetivos mais ambiciosos.
Alguns trabalhos clssicos propuseram o estudo das estruturas musicais em busca de
determinao de autoria, gnero e ritmos entre outras caractersticas importantes. A partir
deste ponto uma nova subrea da cincia musical surgiu com o nome de Recuperao de
Informaes Musicais (Music Information Retrieval MIR). A complexidade desta busca por
informaes contidas em msicas com o auxlio da computao resultou em diversas
metodologias que fazem parte do cotidiano auxiliando a seleo musical das pessoas atravs
do aconselhamento musical atravs de preferncias semelhantes (www.lastfm.com.br) e
possibilitando a identificao de msicas a partir do cantarolar de parte de uma melodia
relembrada (www.midomi.com).
Tendo em vista a possibilidade de interao entre as cincias e com base nos diversos
trabalhos da rea, decidiu-se aplicar tais conhecimentos em busca de uma nova maneira de
tratamento do udio a fim de permitir um agrupamento baseado nas estruturas internas das
msicas, como melodia e ritmo. Considerando o fato de a msica conter informaes e estas
informaes apresentarem relaes entre si, a possibilidade de aplicao de conceitos da
Teoria da Informao tornou-se foco deste trabalho. Tomando como base os principais
mtodos desta rea, verificou-se a existncia de um mtodo considerado estado da arte em
compresso baseada em contexto chamado mtodo de Predio por Correspondncia Parcial
(Prediction by Partial Matching PPM).
O PPM, mtodo aplicado neste trabalho, detm de bons resultados em diversas reas,
como reconhecimento de texturas, anlise de textos e outros tipos de informaes, sendo
13

considerado um dos mtodos com melhores resultados em compresso de dados. A ideia


principal deste mtodo de compresso vem da realizao da predio de um prximo smbolo
a partir dos contextos nos quais o smbolo aparece normalmente. A utilizao deste mtodo
em msica proposta pelo fato de que os conceitos da Teoria Musical possibilitam a
determinao de condies sequenciais existentes na Msica, como a determinao de uma
escala musical a ser utilizada em uma harmonia especfica, sendo assim possvel a suposio
das notas que podero ser executadas ou o padro rtmico utilizado por certa cultura.
A anlise musical torna-se complexa a partir do ponto em que esta se utiliza de
conceitos de diversas reas para obteno de concluses relevantes. A utilizao de um
mtodo j aceito como timo em outras reas proposto na anlise musical considerando a
possibilidade de obteno de resultados significativos. Um ponto a enfatizar a necessidade
de modelagem da informao musical a ser tratada pelo PPM por existirem diversas
informaes que podem ser consideradas em relao a uma simples nota musical.
Este trabalho especifica um mtodo para o tratamento de melodias musicais com o
intuito de agrupar as informaes musicais de maneira mais prxima das sensaes e
percepes realizadas pelo ser humano. O agrupamento utilizado neste trabalho parte dos
conceitos de como o sistema auditivo trata o som, baseando-se num tratamento sequencial
variaes entre frequncias sonoras e considerando as relaes de proporo de durao. Para
representao destas informaes so utilizados os smbolos das notas musicais referentes s
frequncias e durao de cada nota.
A avaliao deste mtodo se d a partir de uma anlise inicial de obras voltadas para
violino solo em busca de caracterizao de autoria das obras. Esta avaliao inicial realizada
em busca de restringir o conjunto de obras para reconhecer os melhores resultados obtidos
com a aplicao do PPM nestas informaes. A validao cruzada utilizada como teste
principal dos modelos criados para classificao de cada autor a fim de qualificar os modelos
criados e validar a aplicao do mtodo.
Aps a validao do mtodo e obteno de variveis relevantes para aplicao do PPM
na anlise musical, torna-se possvel uma avaliao mais apurada do mtodo utilizando-se de
um banco de msicas com uma quantidade relativamente maior. A ideia do novo teste parte
do conceito de que com o mtodo proposto possvel reencontrar uma obra mesmo com
alteraes na mesma. Sendo assim, realizado um teste final com tais obras com a finalidade
de verificar a taxa de acerto.
Os prximos captulos do uma viso melhor do que se deseja apresentar com o
mtodo aqui aplicado. O Captulo 2 trata a fundamentao terica que serve de base para o
14

trabalho, sendo descritos conceitos da Teoria da Informao com foco na descrio do PPM.
Uma breve introduo s noes de sinais de udio e seu processamento apresentada junto
definio das caractersticas do formato MIDI que ser utilizado para leitura e interpretao
dos arquivos de udio do trabalho. O tpico sobre anlise musical trata algumas caractersticas
da msica, apresentando definies sobre ritmo e melodia de modo que estes sejam
compreendidos do ponto de vista em que se enquadram na metodologia aqui aplicada. Por
fim, apresentado o mtodo estatstico aqui utilizado para avaliao dos resultados obtidos.
O Captulo 3 apresenta diversos trabalhos correlatos com inteno de mostrar como
algumas pesquisas da rea so desenvolvidas e quais critrios so tomados como base para a
realizao deste trabalho. Os mtodos de utilizao dos arquivos no formato MIDI tambm
so apresentados a fim de demonstrar maneiras diferentes para o tratamento do udio, visto
que este formato exprime apenas os eventos ocorridos e no fora desenvolvido apenas para
representao de udio, mas tambm para a comunicao de dispositivos.
O Captulo 4 define o mtodo aqui aplicado correlacionando a Anlise Musical com o
PPM. O sistema desenvolvido para avaliao do mtodo apresentado neste captulo com a
apresentao de alguns diagramas, detalhes do desenvolvimento, a interface do sistema, um
comparativo com o Sistema de Percepo Musica humano, alm de ser descrita uma verso
especfica do sistema. Os resultados dos testes realizados com o sistema so apresentados no
Captulo 5 e algumas consideraes sobre todo o trabalho esto situadas no Captulo 6.
15

2 Fundamentao Terica
Por se tratar de um trabalho multidisciplinar, o qual envolve conceito de msica,
computao, psicologia, medicina e estatstica, sero apresentadas neste captulo diversas
definies relacionadas com os temas passveis de utilizao. O enfoque principal passa a ser
em relao Teoria da Informao e sua aplicao num mbito musical em busca do
reconhecimento de padres existentes em linhas meldicas. O conceito de melodia e ritmo
ser apresentado de maneira sucinta a fim de que se torne claro o foco deste trabalho.
A relao entre o processamento de sinais e o formato MIDI ser descrita com enfoque
na utilizao deste formato para a anlise musical, sendo apresentadas apenas as
caractersticas relevantes. Como haver a aplicao de uma metodologia estatstica para
avaliao dos resultados obtidos atravs da validao cruzada, esta ser detalhada com
exemplo para o tipo de validao efetuado nos testes a serem realizados.

2.1 Teoria da Informao


A Teoria da Informao foi desenvolvida no fim da dcada de 40 por Claude Shannon,
e desde ento todos os tipos de informaes passaram a ter definies e propriedades bem
especficas (SHANNON, 1948). Por ter sido o primeiro a considerar comunicao como um
problema matemtico rigorosamente embasado na estatstica, Shannon considerado o pai
da Teoria da Informao. A partir de seus estudos, a nova era da informao se iniciou,
levando a cincia a estudar a informao com bases filosficas e teorias cada vez mais
vigorosas.
Os conceitos criados desde ento levaram ao desenvolvimento de diversas tcnicas
para suprirem algumas necessidades que j existiam no passado. Uma dessas necessidades
que pode ser citada a maneira de analisar muitas informaes de maneira mais eficiente.
Neste ponto, surgiram tcnicas de codificao e compresso de informaes que vieram a
mudar a forma de tratamento de todo tipo de dado alm de contribuir com o reconhecimento
de padres.
Todo dado de uma informao pode ser tratado como um smbolo e este smbolo deve
carregar consigo uma auto-informao. Considerando que cada smbolo pertence a um
alfabeto A = {a0, a1,, aM-1}, temos que cada smbolo apresentar uma probabilidade de
16

ocorrncia a partir de uma certa fonte de informao. Sendo S uma fonte de informao -
como uma imagem, um texto ou uma msica, por exemplo -, temos que um elemento x
gerado por S pode ser considerado uma varivel aleatria que assume o valor a 1 com
probabilidade P(x = ai), para i = 0, 1,, M-1. Uma varivel aleatria pode ser entendida como
uma varivel quantitativa, cujo valor depende de fatores aleatrios. Desta maneira, a auto-
informao associada a um pode ser representada a partir da Equao 1.

I(ai) = - log2 P(x = ai) bits (1)

Num determinado alfabeto, se for atribudo a cada smbolo uma quantidade de bits
relativa a sua auto-informao, o comprimento mdio do cdigo eh minimizado. Shannon
(1948) provou que h a possibilidade de codificar sem perdas as informaes de uma fonte
qualquer chegando a uma taxa arbitrariamente prxima entropia, mas no inferior a ela.
Enquanto para a Fsica a entropia de um sistema uma medida de sua desordem, a teoria da
informao diz que a entropia ser menor se o modelo probabilstico utilizado para
codificao de um sistema for mais preciso. Logo, possvel utilizar a entropia para avaliar a
eficincia da codificao utilizada para uma fonte de informao, caracterizando um cdigo
como timo quando seu comprimento mdio igual entropia, pois neste caso a
probabilidade de ocorrncia de cada smbolo na sequencia estimada com preciso. Alm
disso, para atingir este comprimento mdio mnimo necessrio que cada smbolo seja
representado com nmero de bits igual sua auto-informao, obtendo desta forma uma
compresso de cdigo otimizada na transmisso ou armazenamento da mensagem.
As tcnicas de compresso so baseadas em mtodos de codificao para modelagem
de informao. Elas trabalham na relao entre o modelo e o cdigo a fim de encontrar a
compresso tima. Dentre estas diversas maneiras de codificao, surgiu um dos mais
sofisticados mtodos de codificao de informaes chamado mtodo de Predio por
Correspondncia Parcial. Este, que se caracteriza como um mtodo utilizado para compresso,
por sua vez, codifica smbolos a partir do reconhecimento de padres existentes em
sequncias e ser mais bem descrito a seguir.

2.1.1 Predio por Correspondncia Parcial

O mtodo de Predio por Correspondncia Parcial (Prediction by Partial Matching


PPM) um sofisticado estado da arte dos mtodos de compresso originalmente
desenvolvido por J. Cleary e I. Witten. O mtodo baseado em um codificador que mantm
um modelo estatstico da entrada baseando-se em contexto. Desta forma, o modelo estatstico
17

criado impe que a probabilidade de um smbolo no depende apenas da frequncia do


smbolo, mas tambm do contexto que o antecede (CLEARY e WITTEN, 1984).
Cleary e Witten (1984) afirmam que um modelo que captura mais precisamente as
caractersticas reais da fonte reduz sua entropia, aumentando as oportunidades de
compresso. Logo, a definio de um modelo que leve menor entropia para uma fonte
genrica um problema sem soluo definida. Ganhos de compresso podem sempre ser
obtidos com a construo de modelos mais precisos levando em considerao que os dados
podem ser remodelados de diversas maneiras para serem utilizados com este mtodo. No caso
do PPM, o modelo apresenta-se bastante eficiente quando a informao a ser modelada para a
codificao e compresso apresenta maior preciso quando o contexto pode ser considerado
importante e tem-se a partir da sua utilidade em casos especficos como um reconhecimento
de padres.
O algoritmo do PPM basicamente realiza a contagem das ocorrncias dos smbolos. A
cada smbolo lido, h uma verificao do seu contexto em diversas ordens com o intuito de
incrementar o contador de ocorrncia do smbolo seguido dos contextos nos quais tal smbolo
foi encontrado, alm do contador de ocorrncia do prprio smbolo. O contexto de um
smbolo a sequncia de smbolos que o antecedem, e a quantidade de contextos que sero
avaliados depende da ordem do PPM. Caso esteja se considerando uma ordem dois, sero
computados os contadores do smbolo, do smbolo junto ao seu antecessor e do smbolo junto
aos seus dois antecessores. A probabilidade de cada smbolo em cada ordem dada pela
diviso da quantidade de vezes que o smbolo apareceu seguido do contexto da ordem em
questo pela quantidade de vezes que o contexto ocorreu.
A aplicao do PPM resulta em uma tabela composta pela probabilidade dos smbolos
e contextos dos dados de entrada. Um dos casos especiais a ser tratado pelo mtodo est
relacionado situao na qual algum smbolo ou sequncia no tenha ocorrido durante a
criao da tabela, o que determinaria uma probabilidade igual a zero para a ocorrncia do
smbolo em questo. Existem diversas solues para sanar o problema da probabilidade zero,
o que garante a existncia de diversas verses de implementao do algoritmo do PPM. Para
gerar valores para os smbolos com probabilidade zero, algumas verses utilizam estimadores
como o de Laplace, outras utilizam smbolos de escape, e em casos mais simples o valor 1
atribudo nesta situao (SALOMON e MOTTA, 2009).
Temos que os modelos gerados pelo PPM so criados a partir dos dados de entrada e
do contexto selecionado. O contexto define a ordem do PPM, todavia, um contexto muito
elevado traz srios problemas ao processo de compresso com relao ao tempo e memria
18

definidos para a modelagem. Por exemplo, para um alfabeto de 256 smbolos, o nmero de
contextos de ordem dois e trs so, respectivamente, 65536 e 16777216. O contexto de ordem
dois gerencivel, enquanto o outro talvez seja muito grande para manipulao em alguns
casos. Na prtica, contextos relativamente curtos, entre dois e dez, so utilizados. Uma boa
implementao do PPM requer uma estrutura de dados cuidadosamente desenvolvida para
prover rpida busca e fcil atualizao diante dos milhares de smbolos. Em alguns casos
guardar em memria apenas a probabilidade de elementos que apareceram na criao do
modelo diminui o custo de memria para contextos altos.
Dentre as diversas caractersticas do PPM, alguns princpios podem ser levados em
considerao tanto na criao da tabela de probabilidades quanto na compresso. Um deles
o princpio da excluso, que retira da tabela os itens que no tero probabilidade de ocorrer no
momento da codificao. Outro princpio que pode ser citado se refere dinamicidade do
PPM, visto que o modelo pode ser esttico ou adaptativo. Um modelo esttico torna a
compresso mais rpida, alm de facilitar a descompresso visto que o modelo no ser mais
alterado durante a compresso por se utilizar de um conjunto fixo de probabilidades pr-
estimadas, o que pode levar a uma compresso ineficaz caso modelo seja incompatvel com o
que se deseja comprimir. J o modelo adaptativo, que se atualiza durante a compresso, pode
tornar mais lento o processo de compresso enquanto melhora a taxa de compresso por
utilizar as taxas reais durante este processo, j que vai se adaptando entrada.
O resultado da compresso dos smbolos de entrada baseando-se nos modelos o
armazenamento das probabilidades de ocorrncia de cada smbolo. Desta forma, os smbolos e
contextos com maior ocorrncia sero armazenados de uma maneira melhor por apresentarem
valores maiores para a probabilidade de ocorrncia, o que facilita a compresso utilizando um
bom codificador. Tendo em vista que as probabilidades sero resultados decimais, possvel a
utilizao do Codificador Aritmtico durante a compresso, visto que codificadores inteiros
dificultariam a aproximao do resultado entropia da fonte (WITTEN, 1987). O Codificador
Aritmtico tido como codificador timo por codificar cada smbolo com um nmero de bits
igual sua auto-informao, apresentando um cdigo timo de comprimento mdio igual
entropia.
Na prtica, pode-se utilizar o PPM apenas para calcular o resultado da sua compresso
a fim de comparar resultados de modelos utilizados. Para isto, aps a criao da tabela de
probabilidades de um modelo, realiza-se a compresso de uma fonte e obtm-se o resultado
final a partir da soma da quantidade de bits usada para representao de cada smbolo
baseando-se na frmula da auto-informao. O resultado da soma da quantidade de bits
19

utilizada para cada fonte no modelo em questo pode ser comparado a fim de verificar qual
fonte obteve uma melhor compresso, determinando qual delas garante uma maior adequao
da fonte ao modelo. H tambm a possibilidade de clculo da razo de compresso para
verificar onde obtido o melhor resultado em uma classificao. A razo de compresso
definida atravs da porcentagem entre o tamanho do arquivo comprimido e o no
comprimido. Uma aplicao do PPM apresentada a seguir a fim de facilitar seu
entendimento atravs de um exemplo voltado codificao de palavras.

2.1.2 Exemplo de aplicao do PPM


A aplicao do PPM parte da criao da tabela de contagem de ocorrncias a partir da
leitura de uma entrada que vir a criar um modelo seguindo o algoritmo do PPM com uma
ordem determinada. Uma possibilidade para esta aplicao a utilizao do PPM-C
(MOFFAT, 1990), algoritmo este que uma variao do PPM, acrescentando sempre um
caractere extra de escape quando uma nova ocorrncia em um contexto aparece. A utilizao
deste caractere feita para reservar uma probabilidade para a ocorrncia de um novo smbolo
no contexto em questo. Desta maneira, se um contexto foi seguido nove vezes por um
smbolo x ento este smbolo tem a probabilidade de ocorrncia de nove em dez enquanto o
escape em a probabilidade de ocorrncia de um em dez. Logo, se um smbolo que no
houvera ocorrido antes aparece aps este contexto, teremos neste momento que a
probabilidade de ocorrncia deste smbolo seria a do escape. Aps isto, a probabilidade do x
vir a ser nove em doze, a do novo smbolo ser uma em doze e a do escape ser duas em
doze.
A fim de explicar a aplicao do PPM na prtica, um exemplo ser apresentado a
seguir. Tomando como possibilidade de sinal de entrada o alfabeto representado por A = {A,
B, C, D, R}, ser utilizado o PPM-C para criar um modelo a partir a palavra
ABRACADABRA e buscar comprimir as palavras DACAR e ABBAD neste modelo a fim de
verificar as vantagens deste mtodo de predio. Os passos para a criao da tabela com os
contadores segue no APNDICE A.
Aps a criao da tabela com os contadores, a tabela preenchida com as
probabilidades atuais dos smbolos, resultando na Tabela 1. Esta tabela de probabilidades ser
utilizada e adaptada ao longo da compresso de cada palavra, partindo sempre deste modelo
inicial. A ordem -1 no se encontra na tabela por esta ordem ser utilizada apenas no incio da
criao da mesma com espao reservado para os itens que ainda no foram utilizados e que
no apresentam probabilidades de ocorrncia.
20

Tabela 1. Exemplo de tabela de probabilidades utilizadas para para classificao com PPM
Ordem 3 Ordem 2 Ordem 1 Ordem 0
ABR A 2/3 AB R 2/3 A B 2/7 A 5/16
esc 1/3 esc 1/3 A C 1/7 B 2/16
ACA D 1/2 AC A 1/2 A D 1/7 C 1/16
esc 1/2 esc 1/2 esc 3/7 D 1/16
ADA B 1/2 AD A 1/2 B R 2/3 R 2/16
esc 1/2 esc 1/2 esc 1/3 esc 5/16
BRA C 1/2 BR A 2/3 C A 1/2
esc 1/2 esc 1/3 esc 1/2
CAD A 1/2 CA D 1/2 D A 1/2
esc 1/2 esc 1/2 esc 1/2
DAB R 1/2 DA B 1/2 R A 2/3
esc 1/2 esc 1/2 esc 1/3
RAC A 1/2 RA C 1/2
esc 1/2 esc 1/2
Fonte: Autoria prpria (2011)

No Apndice B apresentado todo o procedimento para compresso das entradas a


partir da tabela de probabilidades criada. Realizando a soma da quantidade de bits necessria
para codificar cada smbolo, temos que "DACAR" comprimido em 10,807 bits, enquanto
que "ABBAD" comprimido em 12,911 bits, ambos utilizando o mesmo modelo. Aps a
codificao de ambas as entradas, percebe-se que a primeira palavra adquire uma compresso
melhor do que a primeira por apresentar sequncias de smbolos mais comuns no modelo
utilizado, como "DA" e "ACA" e que resultaram em uma reduo da entropia.
Considerando todas as caractersticas apresentadas temos que o PPM til para
reconhecimento de padres baseados em correspondncias parciais. Diante disto, a escolha do
que ser utilizado como dado simblico para o PPM deve ser bem definido. A definio dos
dados deve manter o foco sobre a informao contida no dado, j que ser utilizada sua auto-
informao para clculo da probabilidade. Esta etapa de definio de dados, tambm chamada
de modelagem de dados, importante para que seja possvel encontrar semelhanas que
possam gerar um bom modelo e predizer bem a partir dos padres encontrados.
Considerando estes fatores e o conhecimento dos bons resultados apresentados pelo
PPM em outras reas, surgiu a ideia de aplicar o PPM na Msica, rea pouco explorada pela
utilizao do mesmo. Como as obras musicais podem ser interpretadas a partir de diversos
pontos de vista, buscou-se foco na anlise a partir da representao do sinal de udio. Sendo
assim, os dados utilizados neste trabalho para a modelagem so definidos a partir da
representao simblica de sinais de udio de forma que a tanto segmentao como a
representao do sinal permita que se encontrem padres que tornem semelhantes as obras
musicais.
21

2.2 Sinais de udio


Operacionalmente, o sinal um tipo de mensagem, cujo texto composto de uma ou
mais letras, palavras, personagens, smbolos, displays visuais ou sons especiais, com
significado pr-arranjado e que veiculado ou transmitido por meios visuais, acsticos ou
eltricos. Os sinais de udio, considerados mensagens ou representaes sonoras, apresentam
representaes analgicas ou digitais e so utilizados para passar informaes ou
representaes de algo que pode ser produzido atravs de ondas sonoras.
A diferena entre udio e som precisa ser levada em considerao deste ponto em
diante. O som considerado um fenmeno acstico que existe a partir da propagao de
ondas sonoras produzidas por um corpo que vibra em meio material e que pode se estender
alm das capacidades audveis humanas. J o udio vem a ser um som reproduzido ou captado
eletronicamente. Logo, a partir do momento em que um som processado eletronicamente ele
passa a ser considerado como udio, e o udio ao ser reproduzido atravs de algum meio
torna-se som. A partir da temos que ambos podem ser interpretados e tratados.
A interpretao de um sinal se d atravs do seu processamento seja por meio da
sensao e percepo humana ou com a utilizao de equipamentos eletromecnicos. No meio
eletrnico e computacional, temos que o processamento de sinal uma rea da computao,
engenharia eltrica e matemtica aplicada, e que lida com operaes ou anlise de sinais em
tempo discreto ou contnuo para executar operaes teis sobre esses sinais. Outras reas
tambm se utilizam dos sinais para diversos fins, como a msica que se utiliza dos sinais de
udio para anlise de suas caractersticas acsticas.
Os sinais de udio podem ser tratados no formato analgico ou digital. O primeiro
formato baseia-se na utilizao de circuitos eltricos ou mecnicos, de maneira que a forma
pura do sinal seja utilizada. O formato digital normalmente resulta da converso do formato
analgico para alguma representao som atravs de smbolos ou com aplicao de
compresso do sinal analgico para facilitar seu tratamento atravs de computadores. Este
tratamento digital se d pelo fato de um sinal ser algo contnuo com infinitos pontos, o que
torna invivel o armazenamento de toda a representao bruta do sinal para seu tratamento
posterior em virtude das limitaes computacionais em relao ao processamento e
principalmente memria para armazenamento, alm de ser possvel considerar que em
muitos casos no h tal necessidade em virtude das prprias limitaes dos seres humanos em
perceber todas as variaes de um sinal analgico.
22

2.2.1 Processamento Digital de udio


O processamento digital de udio (Digital Audio Processing - DAP) est preocupado
com a representao de tempo discreto de sinais de udio por uma sequncia de nmeros ou
smbolos e o processamento desses sinais. O objetivo do DAP geralmente medir, filtrar ou
comprimir sinais analgicos contnuos do mundo real. O primeiro passo deste processo
converter o sinal de um formato analgico para um formato digital, por amostragem usando
um conversor analgico-digital (Analogic/Digital Converter - ADC), que transforma o sinal
analgico em um fluxo de nmeros. Algumas vezes, o sinal de sada necessrio pode ser
requerido em formato analgico, o que requer um conversor digital-analgico
(Digital/Analogic Converter - DAC). Estas converses citadas se do a partir da determinao
de valores como quantizao e amostragem do som, todavia, o udio em formato digital pode
ser adquirido atravs de representaes criadas diretamente atravs de meios digitais como
programas simuladores de ondas que utilizam funes especficas para gerar ondas nas
frequncias e amplitudes desejadas.
O sinal de udio em formato digital adquire diversos formatos, visto que o som pode
ser tratado de diversas maneiras. Os formatos digitais partem do princpio de que o udio
resultante de uma onda sonora e esta onda foi formada a partir uma ou mais ondas em
frequncias diferentes. Sua representao digital pode ser a partir de senides, valores ou
smbolos com carter representativo da onda, as frequncias existentes ou at as notas
musicais relativas s tais frequncias. Esta ltima forma de representao mais encontrada
em partituras escritas utilizando programas de computador ou meramente digitalizadas, sendo
ainda possvel a utilizao de formatos especficos como o MIDI (Musical Instrument Digital
Interface), que ser utilizado neste trabalho.

2.2.2 Formato MIDI


MIDI (Musical Instrument Digital Interface) um protocolo padro da indstria que
permite que instrumentos musicais eletrnicos (sintetizadores), computadores e outros
equipamentos eletrnicos (controladores MIDI, placas de som, samplers) se comuniquem e
sincronizem-se uns com os outros. Ao contrrio de dispositivos analgicos, os dispositivos
que utilizam o protocolo MIDI no transmitem um sinal de udio, ao invs disso, enviam
mensagens em formato de eventos. Estes eventos podem conter informaes sobre a notao
musical, altura musical e intensidade de execuo de uma nota, sinais de controle de
parmetros como vibrato, volume e panning, pistas e sinais de relgio para definir o tempo.
23

Todas as informaes citadas podem ser vistas com maiores detalhes atravs do site oficial
http://www.midi.org.
Por ser um protocolo eletrnico, nota-se sua ampla adoo por toda a indstria da
msica desde sua definio em 1982. Por ser um protocolo digital e trabalhar com mensagens,
estas mensagens podem ser armazenadas em memria para um futuro uso. O formato padro
utilizado para armazenamento em arquivos o Standard Midi Format (SMF) que pode gerar
arquivos com as extenses "smf" e "mid". Este formato pode ser utilizado para representar
uma msica inteira, e como a msica armazenada como instrues ao invs de formas de
onda, o tamanho dos dados dos arquivos bastante pequeno em comparao aos formatos
mais comuns como MP3 e WAVE, os quais buscam representar o sinal de udio o mais
prximo possvel do sinal originalmente analgico utilizando-se ou no de compresso.
As mensagens em um arquivo mid representam os eventos que podem estar
relacionados s frequncias do udio, mudana de configurao ou podem ser referentes a
efeitos. Algumas caractersticas destes eventos foram baseadas no formato padro da notao
musical. Os eventos voltados s frequncias utilizam a diviso de notas de um piano e
codificam cada nota com um valor representativo entre 0 (zero) e 128. Esta codificao tem
como referncia a frequncia 440 Hz, sendo esta frequncia equivalente ao quarto L da
notao musical ocidental temperada (explicada posteriormente) e com o cdigo igual a 69 no
formato mid como pode ser visto na Figura 1.

Figura 1. Representao da relao entre as frequncias, cdigo MIDI e notas musicais

Fonte: Adaptao de http://en.wikipedia.org/wiki/File:NoteNamesFrequenciesAndMidiNumbers.svg (2010)


24

O formato tambm se assemelha linguagem musical no que diz respeito durao


dos eventos, pois cada evento apresenta um incio e fim em uma linha do tempo guiada por
uma referncia s batidas por minuto (bpm) ou quantidade de quadros por segundo (SMPTE
system). Desta maneira, tratar o contedo deste formato de arquivo a partir de conceitos de
teoria musical uma alternativa para anlises musicais comparando-se com uma anlise de
partituras ou outros registros sonoros. Dependendo da anlise, vrios temas da teoria musical
podero ser abordados, e dentre eles tem-se a melodia e o ritmo musical, abordados neste
trabalho.
A escolha desde formato de descrio simblica do som visa facilitar o tratamento das
informaes. As frequncias so numeradas e identificadas como notas de diferentes oitavas
musicais. Considerando conceitos da Teoria Musical que sero descritos em 2.3, tem-se que o
formato MIDI segue o modelo ocidental de representao musical baseando-se na escala
temperada que consiste de 12 notas por oitava, a cada 12 notas teremos repetio de uma nota
anterior, sendo iniciada a ordem a partir do C(-1) com o valor 0 (zero) em cdigo MIDI e
tendo o C0 com cdigo 12. O C(-1) representa a nota mais grave a ser apresentada no formato
MIDI sendo referente frequncia 8,17 Hz, sendo possvel tratar at a nota G9 como a mais
aguda referente frequncia 12.543,85 Hz e ao cdigo 127 em MIDI, compreendendo assim
10 oitavas. Desta forma possvel perceber que a representao MIDI compreende uma
escala de frequncias til para a anlise musical.
Analisar aspectos meldicos e rtmicos a partir de ondas sonoras no deixa de ser uma
opo, no entanto, utilizar-se de uma representao simblica do som parte do julgamento de
que esta uma representao mais simples e mais prxima dos conceitos da Teoria Musical.
O tratamento da onda sonora de uma melodia atravs de suas frequncias normalmente levaria
converso da onda em valores numricos referentes s frequncias o que pode ser facilitado
atravs da representao simblica em formato de notas. J o tratamento do ritmo parte do
tratamento das repeties e duraes da execuo das frequncias, sendo assim possvel sua
representao numrica em escala de tempo. A partir destas observaes, considera-se que
seja possvel tratar parte da auto-informao contida em melodias e ritmos utilizando o
formato MIDI, avaliando uma modelagem especfica dos dados referentes a estes temas.

2.3 Anlise Musical


O termo analisar vem da ideia de examinar partes de um todo em busca do seu
entendimento. O resultado de uma anlise pode ser a compreenso de suas estruturas
25

orgnicas e suas relaes a fim de especificar uma lgica cientfica do que est sendo
analisado. A anlise musical caracterizada pelo entendimento de estruturas que fazem da
msica, uma arte to admirada e ao mesmo tempo questionada pelas sensaes passadas
atravs de sua execuo.
O som, matria prima da msica, sempre existiu, porm boa parte dos seres vivos
sente o som da mesma maneira que os seres humanos sentem as ondas de rdio atravessando o
corpo, ou seja, mal sentem ou no sentem. O sentido da audio est presente em muitos seres
vivos, mas a experincia de ouvir msica pelos seres humanos s possvel graas ao poder
do crebro em manipular padres complexos de som de maneira simultnea e sucessiva,
caracterizando assim a msica, fato que at ento no fora evidenciado em outros seres que
utilizam do sentido da audio com funo natural de sobrevivncia (JOURDAIN, 1998).
A palavra msica, que vem do grego musik tchne (arte das musas), d nome arte
de combinao de sons e silncios. Esta arte, cuja percepo auditiva e sequencial, existe
desde as primeiras civilizaes, com manifestaes prprias e teorias complexas que so
estudas at os dias atuais. Sua anlise teve fortes avanos no sculo XX a partir das
contribuies das diversas reas da cincia, como a psicologia, medicina, computao e a
prpria cincia musical. Isto gerou diversos conflitos entre msicos e pesquisadores, pelo fato
de estes buscarem formalizar logicamente os padres musicais, enquanto que aqueles
priorizam as relaes subjetivas apresentadas na msica.
O estudo da msica levou ao desenvolvimento da Teoria Geral Musical, muitas vezes
chamada de cincia musical, estruturada atravs de diversas disciplinas tidas no como fim,
mas como um meio de entendimento da msica. As principais disciplinas que compem esta
cincia so: teoria bsica da msica, solfejo, ritmo, percepo meldica, rtmica e dinmica,
harmonia, contraponto, formas musicais, instrumentos musicais, instrumentao,
orquestrao, arranjo, fisiologia da voz e fontica, psicologia da msica, pedagogia musical,
histria da msica, acstica musical, anlise musical, composio, regncia e tcnica de um
ou mais instrumentos musicais especficos (MED, 1996).
A estrutura musical determina que qualquer que seja o mtodo e o objetivo, o material
sonoro a ser usado pela msica tradicionalmente dividido de acordo com trs elementos
organizacionais: melodia, harmonia e ritmo. No entanto, quando nos referimos aos aspectos
do som nos deparamos com uma lista mais abrangente de componentes: altura, timbre,
intensidade, durao, entre outros.
A anlise realizada neste trabalho visa um estudo com base nos padres que podem ser
encontrados em articulaes rtmicas e meldicas de linhas meldicas. Uma articulao pode
26

ser considerada uma juno entre elementos semelhantes, e, neste caso, tem-se as notas
musicais como os elementos. As articulaes sero consideradas em relao diferena entre
as alturas das notas e diferena entre as duraes das mesmas, referentes s articulaes
meldicas e rtmicas, respectivamente.

2.3.1 Ritmo
Certas medidas so dispostas comumente como definidoras de ritmo. Uma frequncia
medida em unidade de tempo ou distncia d uma ideia de regularidade de acontecimento, no
entanto, o ritmo no algo que venha a ser regular. A razo de certa ordenao ou a noo do
fluir musical traz uma ideia estrutural muito mais abrangente em relao definio de ritmo.
Esta ordenao que pode ser de carter contnuo ou descontnuo requer maior ateno a partir
do momento em que sua diversas caractersticas so levadas em considerao na determinao
de um ritmo qualquer (KIEFER, 1979).
As caractersticas rtmicas voltadas msica esto relacionadas durao e
intensidade, todavia possvel caracterizar um ritmo tambm atravs de variaes de timbre e
altura. O ritmo na msica adquire condies especficas baseando-se nas culturas e nos
instrumentos atravs dos quais ele expresso. O msico, ao executar uma obra, tambm
interfere na forma como os ritmos so articulados, mesmo partindo de uma mesma
representao rtmica.
A representao rtmica na msica baseada em smbolos que so utilizados para dar
uma ideia de durao de movimentos. Estes smbolos seguem os conceitos de notaes
musicais, e partem da ideia de proporo temporal. A notao musical o nome comum dado
a qualquer sistema utilizado para representar graficamente uma obra musical, permitindo sua
execuo como fora composta (MED, 1996). Na Figura 2, algumas propores so
apresentadas utilizando a notao musical ocidental. Da esquerda para a direita temos
smbolos que representam as duraes: semibreve, mnima, semnima, colcheia, semicolcheia,
fusa e semifusa. A ideia de proporo existente entre elas se d a partir da durao em escala
temporal. Uma semibreve representa uma unidade de tempo proporcional a duas mnimas,
sendo assim, a semibreve apresenta-se como uma unidade e a mnima como metade desta
unidade, e assim por diante. Considerando que cada representao referente unidade
padro que semibreve neste caso. Logo, temos que a semifusa equivale a um sessenta e
quatro avos do tempo de durao da semibreve.
27

Figura 2. Representao da proporo temporal existente entre smbolos de notao musical

Fonte: POZZOLI (1983)

A partir da combinao destes smbolos possvel a criao e representao de um


nmero imenso de ritmos (POZZOLI, 1983). A combinao deles pode ser ordenada ou no e
permite que certos padres de sequncias sejam seguidos para caracterizar ritmos especficos,
alm de ser possvel articular ritmos diferentes em paralelo utilizando-se mais de um
instrumento, abrangendo assim uma gama de sensaes rtmicas distintas diante de poucos
smbolos. A Figura 3 apresenta alguns exemplos de articulaes rtmicas a partir da variao
entre smbolos da notao musical.

Figura 3. Exemplo de articulaes rtmicas

Fonte: POZZOLI (1983, p. )

Este representao musical utiliza-se de muitos outros smbolos da msica, todavia,


dando ateno apenas s sequencias de smbolos apresentados da Figura 2, possvel verificar
como tais smbolos podem ser agrupados. As sensaes passadas pela execuo de qualquer
uma das 15 sequncias apresentadas na Figura 3 so diferentes, mesmo quando as diferenas
so mnimas. Isso se d pelo fato de o sentido rtmico ser determinado por estas diferenas de
organizao. Porm, outras particularidades da execuo podem dar aspectos diferentes at a
uma mesma sequncia rtmica, e uma destas particularidades, a melodia, ser descrita a
seguir.

2.3.2 Melodia
A sucesso de notas proporcionando uma variao de frequncias sonoras caracteriza
o que pode ser chamado de melodia. Na teoria musical, tem-se que a base para o estudo das
28

melodias so as notas musicais, os motivos meldicos e temas, os quais fazem parte da


estrutura da melodia dando sentido mesma. O sentido musical de uma melodia sua
principal caracterstica, pois a partir dele que se sente o que tal melodia transparece
(KIEFER, 1979).
O sentido de uma melodia ter maior carter significativo em seu sistema nativo de
notao musical. Um sistema de notao musical pode ser comparado lngua de um pas no
que diz respeito ao modo de passar conhecimento ou descrever algo. Esta comparao se
baseia no fato de sistemas musicais existirem desde a antiguidade e variarem entre diferentes
culturas, sempre servindo como forma de eternizar o conhecimento musical e obras musicais.
Nos dias atuais, o sistema mais tradicional o ocidental, que emprega notas musicais
representadas em um pentagrama utilizando smbolos apresentados na Figura 2 para definio
de localizao e durao das notas musicais, sendo possvel o emprego de outros smbolos
para discriminar a forma como a melodia foi pr-definida pelo compositor para ser executada
posteriormente (MED, 1996).
As notas musicais utilizadas no sistema ocidental seguem um padro que permite sua
interpretao de forma mais prtica, considerando que este padro evita tanto o uso dos
valores das frequncias sonoras quanto a representao da durao de cada frequncia em
unidade de tempo padro como o segundo ou milissegundo. A princpio so definidas sete
notas musicais, sendo elas d, r, mi, f, sol, l e si, representadas tambm de maneira cifrada
por C, D, E, F, G, A e B, respectivamente. Estas sete notas podem adquirir a condio de
sustenido (#) ou bemol (b) dependendo da escala, e, desta maneira, passam a existir 21 notas
musicais. No entanto, alguns instrumentos apresentam apenas 12 notas diferentes em cada
oitava, como o piano, pelo fato de igualarem algumas notas: C# e Db, D# e Eb, E e Fb, E# e
F, F# e Gb, G# e Ab, A# e Bb, B e Cb, B# e C. Neste caso citado, uma representao para a
sequncia de notas pode ser C, C#, D, D#, E, F, F#, G, G#, A, A# e B, totalizando 12 notas
que se repetem em a cada oitava. O sistema de notao musical que utiliza esta definio
tido como sistema temperado. Em algumas culturas orientais tem-se a utilizao de mais notas
musicais em virtude de notaes antigas e divises diferenciadas, o que promove maneiras
diferentes de representao musical que no sero tratadas neste trabalho (JOURDAIN,
1998).
A apresentao de uma melodia atravs do sistema de notao musical ocidental
resulta na visualizao das relaes entre notas sucessivas. Uma breve representao de
melodia apresentada na Figura 4. Nela possvel observar a melodia inicial do Hino
Nacional Brasileiro com a letra acompanhando cada smbolo da notao ao qual se refere.
29

Tendo em vista a altura das notas em relao pauta, verifica-se que ocorre uma sequncia de
ascenso e queda.
A altura de uma nota determina quo grave ou quo aguda ela considerando a sua
localizao na pauta, de modo que podemos comparar a pauta com um grfico em que o eixo
das abscissas representa o tempo, enquanto que o eixo das ordenadas representa a frequncia
das ondas sonoras. Um exemplo grfico comparativo para a melodia do Hino Nacional
Brasileiro apresentado na Figura 5. Outro conceito da Teoria Musical que visto nesta
partitura o ponto aps o smbolo, tornando a nota com uma durao 50% maior que sua
durao original.

Figura 4. Parte inicial da Melodia do Hino Nacional Brasileiro

Fonte: SILVA (2011).


Figura 5. Exemplo da representao grfica do Hino Nacional Brasileiro

Fonte: Autoria prpria (2011).

A visualizao da melodia em uma pauta apresenta a mesma ideia de variedade


apresentada na definio de ritmo, visto que tambm possvel alternar a posio das notas na
pauta de maneira infinita. A melodia e o ritmo proporcionam uma diversidade de linhas
meldicas que so capazes de satisfazerem s diversas culturas e perodos desde a
antiguidade, passando pelos dias atuais e deixando ainda milhares de possibilidades de
composies para um futuro distante.
A composio de linhas meldicas se d baseada em diversos fatores. Fatores
harmnicos associados a outros conceitos da Teoria Musical predispem as sequencias
meldicas a seguirem algumas condies e regras. As escalas musicais, por exemplo,
30

determinam um conjunto de notas que possivelmente soaro bem ao serem utilizadas em


conjunto.
A possibilidade de uma linha meldica soar bem vem da condio de admirao do
som possuda pelo ser humano, o qual pode perceber o som atravs de seus sentidos e utilizar-
se de diversos artifcios para anlise musical, como seu conhecimento prvio, sua cultura ou
sua conjuntura social. A partir da temos que a percepo do som tanto influencia na audio
quanto na composio de obras musicais (JOURDAIN, 1998).

2.3.3 Percepo do som


Tem-se que o ato de perceber vem da arte de adquirir conhecimentos atravs das
sensaes obtidas pelos sentidos. Alguns atos ver, tocar, degustar, cheirar e ouvir, por
exemplo ajudam a compreender tudo o que se encontra em um ambiente atravs das
experincias sensitivas. A percepo, por sua vez, uma caracterstica nativa nos seres vivos,
possibilitando diversas aes que caracterizam o perfil de cada ser. A diferenciao das
percepes se d a partir de condies distintas (BOOTHROYD, 1986). Uma destas
condies o conhecimento prvio, o qual se relaciona com a interpretao dos sentidos no
momento da percepo. Neste contexto, temos uma relao entre o conhecimento e a
percepo segundo Morin (2000):

O conhecimento no um espelho das coisas ou do mundo externo.


Todas as percepes so, ao mesmo tempo, tradues e reconstrues
cerebrais com base em estmulos ou sinais captados e codificados
pelos sentidos. Da resultam, sabemos bem, os inmeros erros de
percepo que nos vm de nosso sentido mais confivel, o da viso.
Ao erro de percepo acrescenta-se o erro intelectual. (MORIN, 2000,
p. 20).

O conhecimento prvio e as caractersticas biolgicas do ser humano so elementos


fundamentais para caracterizao do funcionamento do sistema sensorial. As deficincias e
diferenas cognitivas entre seres proporcionam diferentes formas de sentir o mundo,
implicando nas diferentes percepes sob mesmas condies. Logo, seres diferentes podem
ter sensaes e percepes diferentes em uma mesma situao, como a audio de uma onda
sonora. Considerando as caractersticas neurolgicas dos seres, temos que a agregao de
significados s coisas do mundo dada utilizando-se da memria como fator crucial para
recuperar informaes que iro possibilitar o aperfeioamento dos sentidos. (SILVA, 2007)
O processo de percepo auditiva se da a partir da habilidade de interpretar sons e
modelos sonoros captados pelo sistema auditivo. Segundo Boothroyd (1986), perceber um
31

evento sonoro um processo rpido, porm minucioso, e este processo baseia-se em etapas,
como: deteco, sensao, discriminao, localizao, reconhecimento, compreenso, ateno
e memria. A partir disto, Boothroyd (1986) afirma que:

[...] um estmulo sonoro remoto um evento, o estmulo prximo


passa a ser o som, o rgo que sente o ouvido, os dados sentidos
consistem em padres eltricos estimulados no nervo auditivo, o
processamento se dar nas reas reservadas aos centros auditivos no
crebro, e a percepo resultante ser uma representao interna do
evento original. (BOOTHROYD, 1986, p.68, traduo prpria).

A onda em si uma perturbao que se propaga num meio. As ondas sonoras


utilizam dois meios para chegarem a ser perceptveis pelo ser: o ar e o corpo humano. As
ondas da prpria voz so transmitidas duas vezes e de maneiras diferentes ao emissor, tanto
pelo ar, quanto pelos ossos do corpo do mesmo, o que resulta no fato de os seres humanos
ouvirem sua prpria voz de maneira diferente da voz ouvida pelos seres ao seu redor
(JOURDAIN, 1998).
Considerando o ar como meio de propagao do som, temos que as ondas sonoras
seguem atravs deste meio at chegarem ao canal auditivo onde percorrero um curto
caminho at a membrana timpnica. A partir da, o som percorre o ouvido mdio em direo
ao ouvido interno. Neste ponto o som passa pelo martelo e pela bigorna, ossos que fazem
parte do sistema ossicular do ouvido mdio e ajudam a amplificar a vibrao causada pelo
som na membrana timpnica a fim de auxiliar na transmisso do som. A bigorna por sua vez
se articula com o cabo do estribo para que as ondas sonoras sejam ento transmitidas para
dentro da cclea onde ocorre o tratamento do som antes de ser transmitido ao crebro
(GUYTON, 2006). Os participantes deste processo podem ser localizados na Figura 6.

Figura 6. Membrana timpnica, sistema ossicular do ouvido mdio e ouvido interno

Fonte: GUYTON (2006, p. 652, traduo prpria)


32

Dentro da cclea, o rgo de Corti o receptor que gera impulsos nervosos em


resposta s vibraes que atravessam o lquido coclear ao longo da membrana basilar. Os
verdadeiros receptores sensoriais no rgo de Corti so as clulas ciliadas, as quais fazem
sinapse com a rede de terminaes nervosas da cclea. Estas clulas esto distribudas ao
longo da cclea de maneira que as frequncias so discriminadas separadamente. Esta
discriminao de frequncias seque uma sequncia que vai das frequncias mais altas no fim
da cclea para as mais baixas no seu centro (GOLDSTEIN, 2002). A Figura 7 apresenta um
mapa de localizao da mxima resposta para cada frequncia dentro da cclea.

Figura 7. Mapa tonotpico da cclea

Fonte: CULLER et al. (1943 apud GOLDSTEIN, 2002, p. 354, traduo prpria)

Aps a passagem pela cclea e pelo rgo de Corti, o estmulo causado pelo som segue
atravs dos neurnios do nervo da cclea at chegar ao crtex auditivo. Antes de chegar ao
crtex, os estmulos passam por alguns diversos caminhos onde ocorrem combinaes do que
percebido em cada ouvido. Neste percurso, os estmulos do ouvido direito e esquerdo se
cruzam nos ncleos olivares superiores e seguem para ambos os lados do crebro juntos,
como se o estmulo fosse duplicado, combinado com o estmulo do lado contrrio e assim
enviado para ser interpretado. Alm de se cruzarem nos ncleos olivares, h tambm um
encontro no colculo inferior antes de chegar ao ncleo geniculado medial e ser enviado para
o crtex auditivo. O caminho dos estmulos sonoros resultantes da percepo das frequncias
na cclea pode ser mais bem observado na Figura 8, onde setas representam os percursos dos
estmulos pelos neurnios atravs das fibras aferentes do nervo vestbulo-coclear. Estas fibras
33

aferentes so responsveis pela aferio dos estmulos sensoriais auditivos e fazem parte do
processo de percepo como intermedirias do translado de tais estmulos (GOLDSTEIN,
2002).

Figura 8. Diagrama do caminho do estmulo auditivo

Fonte: GOLDSTEIN (2002, p. 351, traduo prpria)

Ao chegar ao crtex auditivo, o estmulo interpretado, processado e entendido. Isso


s d a partir das funes do crtex auditivo primrio, secundrio e tercirio. H uma
diferenciao tambm em relao ao que tratado em cada lado do crebro. No lado direito, o
crtex auditivo secundrio mantm foco sob as relaes de sons simultneos, as quais tambm
so chamadas de relaes harmnicas. Enquanto isso, o crtex auditivo secundrio do lado
esquerdo d ateno s hierarquias de sequncias e percepo do ritmo (JOURDAIN, 1998,
p. 87). Considerando todo o processo do sistema auditivo, Jourdain (1998) diz:

Os neurocientistas esto longe de entender como os fenmenos


temporais so representados no crtex. Mas est claro que o crtex
auditivo no age como uma espcie de gravador, colocando em
escaninhos, ao chegar, cada som que entra. Se fosse este o caso,
inverter uma sequncia de sons significaria inverter o padro de
atividade neurolgica que ele produz. Mas isto no acontece: as
pesquisas mostram que os sons invertidos geram uma resposta nica.
Isto implica que o crtex auditivo no considera isoladamente os sons
individuais. Em vez disso, sempre interpreta os sons dentro do
contexto precedente. (JOURDAIN, 1998, p.87).

O processamento do som em relao ao contexto se d no crtex auditivo tercirio,


onde h um contato direto com o hipocampo, regio considerada principal sede da memria.
Quando evento sonoro chega ao crtex e estimulado no hipocampo, este interpreta as novas
informaes, associa-as s memrias anteriores e determina se vai codific-las como uma
34

memria de longo prazo. Para codificar algo na memria de longo prazo h a necessidade de
reforar o estmulo para que ocorra a persistncia da informao. Logo, quanto maior a
frequncia, maior ser a fixao do material "aprendido" (BARKER et al., 1999). Alm disso,
vale salientar que o tratamento do som sequencial e que o crebro trabalha normalmente
com foco nas alteraes do que percebido, pois se tem que a ateno a algo que se mantm
constante ou que repetitivo torna-se baixa (GOLDSTEIN, 2002). Percebe-se ento que ao
aprender, a ateno alterada e a partir da aprendizagem concluda o foco da ateno se dar
para novos objetos.
Tendo em vista toda esta descrio das caractersticas musicais e da percepo
auditiva, verifica-se que a repetio de um evento sonoro causa sua maior fixao e facilita
sua recuperao atravs da memria. Estes pontos fazem uma conexo com o PPM e com a
anlise musical de maneira que possvel propor uma anlise musical baseada na verificao
de repeties, considerando estas repeties posteriormente como padres e utilizando-as para
reconhecimento de materiais semelhantes a partir da busca por estes padres.
Os conceitos expostos tambm servem de base para os testes que so apresentados
neste trabalho a partir do mtodo proposto. Para validao do mtodo, h de se utilizar de
tcnicas estatsticas a fim de obter informaes sobre quo vlidos so os mtodos utilizados.
Dentre as diversas tcnicas existentes, a tcnica trabalhada neste estudo ser descrita a seguir.

2.4 Validao Cruzada


Em estatstica, tcnicas de reamostragem podem ser usadas para validar modelos
usando subconjuntos aleatrios, e temos a validao cruzada como uma das principais
tcnicas utilizadas. Esta tcnica algumas vezes chamada de estimativa de rotao, e seu
principal objetivo voltado validao de modelos preditivos. A tcnica tambm serve para
analisar como os resultados de uma anlise estatstica tende a generalizar um conjunto de
dados independentes (MOORE e LEE, 1994).
Esta prtica utiliza os itens de modelos para criar um conjunto de testes em prol da
validao de modelos. Os modelos so determinados normalmente por critrios que tornam
seus itens semelhantes. No final, o objetivo avaliar a qualidade da previso para os modelos,
e quo confivel o modelo pode ser para testes futuros.
A validao cruzada pode tratar os modelos a partir de diversos tipos de treinamentos.
O tipo usado neste trabalho o Deixando-Um-De-Fora (Leave-One-Out Cross Validation -
35

LOOCV). A escolha deste tipo se deu pelo fato de tal validao servir para qualquer tipo de
classificao, pois se torna possvel testar todos os grupos de itens.
No LOOCV, apenas um item dos modelos ser retirado por vez para compor o
conjunto de teste, deixando os demais itens compondo os modelos a serem testados. Os
resultados dos testes de cada item com todos os modelos sero comparados para estimar o
erro obtido com os modelos e validar qual modelo pode ser usado para prever melhor. Este
um mtodo caro a partir de um ponto de vista computacional, porque todos os subconjuntos
de modelos sero criados durante o processo de formao para validar com o conjunto de
teste.

2.4.1 Exemplo de validao cruzada

Considerando um grupo de N-modelos com C-itens e utilizando o LOOCV tem-se


uma representao dos seguintes modelos M com itens I a serem avaliados:
M1 = (M1I1, M1I2,..., M1IC);
M2 = (M2I1, M2I2,..., M2IC);
...
MN = (MNI1, MNI2,..., MNIC).
A criao do conjunto de teste e do conjunto de treinamento pode ser feita de diversas
maneiras visto que o intuito testar o maior nmero de subconjuntos dos modelos. Neste
trabalho, a cada iterao o primeiro elemento de cada modelo retirado criando o conjunto de
testes e deixando os outros elementos como parte dos modelos para o conjunto de
treinamento. A cada iterao todos os elementos do conjunto de testes so avaliados junto aos
modelos do conjunto de treinamento e ento cada elemento devolvido a seu respectivo
modelo. Desta forma, um elemento diferente de cada modelo retirado por vez para formar o
conjunto de teste, permitindo assim que todos os elementos sejam testados, alm de permitir
que os subconjuntos com C-1 elementos dos modelos sejam tambm testados.
Como a quantidade de subconjuntos ser "C", tem-se "C" conjuntos de teste T, "N"
elementos em cada conjunto de teste e "N" modelos para serem testados com os elementos
dos conjuntos de teste. Isto resulta num total de CxNxN testes e CxN classificaes de
elementos a serem realizadas. Os resultados obtidos com as classificaes so apresentados de
forma que cada elemento tenha uma lista ordenada dos resultados de sua classificao a fim
de determinar o modelo que melhor o classificou. Abaixo temos uma exemplificao dos
conjuntos de teste e do primeiro conjunto de treinamento com os itens restantes dos modelos.
36

A seguir tem-se uma descrio dos conjuntos de testes T, com os elementos


retirados dos modelos (C conjuntos com N itens):
T1 = M1I1, M2I1,..., MNI1;
T2 = M1I2, M2I2,..., MNI2;
...
TC = M1IC, M2IC,..., MNIC.
Um exemplo do primeiro conjunto modelos para treinamento com os elementos
restantes e sem os elementos do primeiro conjunto de teste (N modelos):
M1 = (M1I2, M1I3,..., M1IC);
M2 = (M2I2, M2I3,..., M2IC);
...
MN = (MNI2, MNI3,..., MNIC).
Os prximos conjuntos de treinamento sero formados a partir da insero dos
elementos retirados, seguida da retirada dos elementos seguintes para a formao de um novo
conjunto de testes. Este mtodo utilizar todos os itens de todos os modelos concluindo sobre
a qualidade de predio de cada modelo, verificando assim se possvel a utilizao do
modelo para classificao no domnio em questo.
Este tipo de avaliao qualifica o mtodo calculando a taxa de acerto entre os modelos
criados. Este resultado pode ser utilizado para comparaes com outros mtodos, porm, o
principal interesse aqui comparar o mtodo em si com outros trabalhos da rea. Sendo
assim, a descrio de alguns trabalhos ser realizada a seguir antes de ser exibido o mtodo
proposto.
37

3 Aplicao do PPM para Anlise Musical


A rea de Recuperao de Informaes em Msicas (Music Information Retrieval
MIR) trabalha diversas maneiras tratamento de sinais de udio e informaes musicais.
Muitas reas tambm tratam deste tema com destreza, como a psicologia, medicina, msica e
computao, no entanto, o enfoque em relacionar todas as reas ou algumas delas pode trazer
vantagens para os resultados. Este trabalho trata-se de uma anlise de ritmos e melodias em
busca da classificao de padres utilizando o PPM baseando-se em conhecimentos sobre o
sistema auditivo humano, tema capaz abrir possibilidades diversas para sua aplicao.
A utilizao do PPM na msica no fora tema de muitos trabalhos. Entretanto, a
utilizao deste mtodo ao longo dos anos voltado para a compresso e reconhecimento de
padres obteve bons resultados em diversos ramos, como na classificao de texturas
(HONRIO et al, 2007), anlise de imagens de mamografias (MARQUES et al, 2008) e
classificao de textos (BARBOSA et al, 2009).
Antes da apresentao da proposta deste trabalho, so apresentados a seguir trabalhos
correlatos ao tema em questo. Alguns trabalhos citados apresentam correspondncias com
este a partir da aplicao de mtodos diversos na anlise musical, incluindo a utilizao do
PPM. Outros trabalhos que so citados a seguir tratam da anlise musical utilizando o formato
MIDI.

3.1 Trabalhos Correlatos sobre Anlise Musical


A classificao de arquivos de udio tanto atravs do reconhecimento de padres
quanto com bases estatsticas so temas muito pesquisados na rea de MIR. Resultados
diversos mostram que h possibilidade de tratamento do udio para segmentao de suas
estruturas em busca de reconhecimento de estilos, autoria, acordes, voz, ttulo da msica,
autor da msica ou outras caractersticas musicais. Alguns dos principais trabalhos utilizados
como base para este sero apresentados a seguir com uma breve descrio e o que seus
resultados apresentam.
Em busca da modelagem de estilos musicais, comparativos entre algoritmos so
apresentados em Lartillot (2001). Esta modelagem se baseia na representao computacional
de caractersticas estruturais do udio. Os algoritmos utilizados neste trabalho partem dos
38

princpios de compresso e tambm de modelagem estatstica de sequncias complexas de


dados. Os resultados do trabalho apresentam formas de utilizao de tais algoritmos e suas
qualidades. Um ponto relevante a sugesto da aplicao do PPM como trabalho posterior
para anlise de udio com os mesmo princpios apresentados pelos algoritmos tratados.
O trabalho apresentado por Pearce e Wiggins (2003) apresenta comparaes sobre as
variadas formas de implementao do PPM na anlise musical. O PPM adquiriu diversas
formas variantes ao longo do tempo com o intuito de tratar melhor a probabilidade do smbolo
de escape ou melhorar o tratamento para contextos longos (SALOMON e MOTTA, 2009).
As variantes do PPM apresentadas por Pearce e Wiggins (2003) utilizam trs tcnicas
diferentes, sendo elas o mtodo do escape, o mtodo interpolated smoothing e a utilizao de
contextos ilimitados. Estas tcnicas foram aplicadas a msicas monofnicas, que so msicas
que executam apenas um som por vez. O objetivo deste trabalho foi demonstrar como
algumas variaes do PPM podem melhorar o desempenho dos modelos criados e
consequentemente comparar tais variaes no contexto em questo.
Alguns outros trabalhos so de bastante importncia na rea pelo fato de tratarem do
reconhecimento de padres atravs da anlise de segmentos. O trabalho de Dnnenberg e Hu
(2002) relevante neste ponto por testar diversas tcnicas de reconhecimento de padres para
udio em formato de onda. Os resultados apresentados analisam o udio monofnico,
polifnico e utilizando o chroma (espectro) revelando que nem todos os segmentos
semelhantes so encontrados e que o tratamento da polifonia ainda precisa ser evoludo para
tratar a harmonia existente entre os segmentos.
O tratamento do udio nos diversos trabalhos bem diferenciado por ser possvel
tratar o udio em formato de ondas, em formato espectral ou utilizando formatos descritivos
de alguns bancos de dados especficos. O formato escolhido vai diferenciar os possveis
resultados a serem obtidos tendo em vista que cada formato tem sua funo caracterstica.
Alm dos formatos citados, o foco sobre o tratamento do udio no formato MIDI relevante
perante as pesquisas visto que o formato mais prximo da representao do udio musical
atravs de smbolos.
O formato MIDI tambm se apresenta com grande valor para a anlise musical por
apresentar caractersticas que o aproximam da representao utilizada por partituras, que a
forma mais comum de representao musical. Algumas das diversas maneiras como o udio
tratado a partir do formato MIDI so analisadas a seguir com o intuito de expor vantagens e
embasar a utilizao deste formato no trabalho.
39

3.1.1 Trabalhos Correlatos Utilizando o Formato MIDI


O formato MIDI apresenta o udio a partir de eventos que simbolizam a frequncia e
sua durao, entre outras informaes como fora descrito na seo 2.2.2. A cada apario de
uma nota, registrado um evento no arquivo mid indicando seu incio de execuo em
funo do tempo, e posteriormente outro evento indicado com o intuito de especificar
quando a nota musical finalizada. Sendo assim, os trabalhos podem considerar tanto a notas
quanto sua durao durante o tratamento dos arquivos neste formato.
H uma grande dificuldade para tratamento de arquivos polifnicos pelo fato de estes
apresentarem caractersticas harmnicas, rtmicas e meldicas a serem consideradas durante
sua anlise, no entanto, alguns trabalhos aplicam metodologias prprias neste caso. Como o
caso do trabalho de recuperao de informaes atravs de arquivos polifnicos descrito por
Suyoto et al (2007), no qual arquivos de udio em formato de onda so convertidos para o
formato MIDI e mesmo os arquivos monofnicos geram arquivos polifnicos pelo efeito dos
harmnicos das notas.
O tratamento da polifonia neste caso basicamente converte sons simultneos em sons
sequenciais, como se transformasse acordes em arpejos. Se as notas C, E e G ocorrem
simultaneamente, elas se transformam em uma sequncia apresentada da mais grave para a
mais aguda. Suyoto et al (2007) utiliza o algoritmo de Mais Longa Subsequncia Comum
(Longest Common Subsequence - LCS) para buscar sequncias em comum nos arquivos.
Um ponto relevante deste trabalho a realizao da transposio das sequncias
durante os testes. Desta forma, cada sequncia testada 12 vezes, transpondo a sequncia da
seguinte maneira: cada nota adicionada de uma unidade a cada teste para gerar uma nova
sequncia a ser testada e avaliada, atribuindo-se uma pontuao para a comparao desta nova
sequncia. Tomando como base a sequncia C, E e G, teremos que a segunda sequncia
a ser testada seria C#, F e G#, e assim sucessivamente. Este trabalho no faz
diferenciao entre as oitavas das notas na representao dos smbolos.
Uma atitude diferente tomada por Londei et al (2003), no tratamento de melodias.
Neste trabalho, durante a leitura dos arquivos mid realizado o armazenamento do valor
resultante da subtrao de uma nota pela sua antecessora somando-se a 127, a fim de evitar a
dependncia das notas para seu tratamento posterior. Aps todo o tratamento dos arquivos, a
compresso dos arquivos feita em pares em busca da entropia relativa. Cada teste recebe
uma pontuao para posteriormente ser apresentado topograficamente o resultado da
comparao de todos os arquivos agrupando os semelhantes. Estes testes comprovaram que a
40

entropia relativa aparenta ser um bom parmetro para identificao de msica e para deteco
se similaridades entre obras.
Outro tipo de tratamento encontrado em Cilibrasi et al (2004), trabalho que tem um
foco na criao de clusters aps a comparao dos arquivos baseando-se em mtricas de
similaridade universais. H a fundamentao de tentar aproximar-se da noo da
complexidade de Kolmogorov, em que o tamanho do menor cdigo comprimido a partir de
um objeto original pode ser reproduzido sem perdas por um eficiente descompressor. No
entanto, por motivos computacionais se utiliza de tcnicas comuns de compresso e uma
mtrica de similaridade computvel a partir da Distncia de Compresso Normalizada
(Normalized Compression Distance - NCD).
De fato, o trabalho computa a distncia entre os pares de arquivos mid resultando
numa matriz de distncia. Para isto, os arquivos so pr-processados para se tornarem
uniformes, sem dados particulares como informaes dos artistas, tags, ttulos, entre outros
dados. Ocorre um clculo em busca de uma nota para se tornar referncia, chamada nota
modal, a partir da qual as notas seguintes so computadas. A nota modal escrita como o
primeiro byte de cada arquivo e cada nota comparada a ela antes de ser armazenada, sendo o
valor 1 (um) indicando que a nota a prxima nota aps a nota modal na sequencia de notas
existentes no formato MIDI e o valor -2 representando a penltima nota antes da nota
modal, por exemplo. O bzip2 utilizado como programa para compresso, sendo os
resultados desta compresso utilizados para a criao dos clusters.
Estes mtodos aqui apresentados mostram a complexidade do tratamento de arquivos
de udio perante os algoritmos e tcnicas existentes. A aproximao da metodologia aplicada
com a teoria musical levada em considerao a fim de adequar cada trabalho ao tipo de dado
a ser tratado, todavia, verifica-se que os trabalhos tratam normalmente a representao dos
conceitos musicais como bytes armazenados em arquivos ao invs de considerar o prprio
dado como objeto de estudo.
Tomando tal colocao como base terica, este trabalho prope um mtodo de anlise
musical baseado em melodias e ritmos, considerando alguns destes conceitos utilizados nestes
trabalhos correlatos e adicionando uma nova modelagem dos dados para uma classificao
voltada autoria e semelhana de linhas meldicas. Os detalhes da anlise realizada so
descritos a seguir junto apresentao do sistema desenvolvido e dos bancos de dados
utilizados para a anlise.
41

3.2 Descrio da Anlise Musical Realizada


A anlise musical abrange muitos aspectos divididos entre as grandes reas da cincia.
A msica tanto como cincia ou arte busca razes atravs das quais seja possvel afirmar
como as ondas sonoras chegam aos ouvidos humanos e passam diferentes sensaes
(JOURDAIN, 1998). A psicologia tambm uma rea da cincia que ao longo dos anos
passou a realizar diversas pesquisas em busca de entender como a relao do sistema
sensorial auditivo com o crebro (TIGHE e DOWLING, 1993). A medicina, por sua vez,
sempre manteve seus estudos sobre quais partes do corpo interferem na sensao e percepo
dos sons e quais partes do crebro realizam as interpretaes das estruturas sonoras
(GUYTON, 2006).
A cincia da computao, mais especificamente a computao musical, passou a
trabalhar em conjunto com diversas reas na anlise de som e udio, aumentando a dimenso
das pesquisas pela possibilidade de automatizar diversas anlises e clculos. A pesquisa aqui
realizada apresenta uma nova maneira de tratamento do udio em busca de reconhecimento de
padres atravs do processamento digital de smbolos representativos do sinal de udio. A
Teoria Musical base para este estudo junto Teoria da Informao, tendo em vista a
aplicao dos conceitos de ambas com o intuito de abrir novos rumos para pesquisas nesta
rea a partir do mtodo aqui utilizado.
Partindo dos conceitos j apresentados sobre Teoria Musical, constata-se que toda
linha meldica uma sequncia de notas com ritmo e melodia definidos considerando
diversas condies e probabilidades de variao. A composio de linhas meldicas por um
msico com noes de Teoria Musical ter por consequncia deste conhecimento prvio a
possibilidade de concordncia com as diversas definies e regras musicais existentes. O
perodo e local em que uma obra escrita tambm predispem vrias condies obra,
considerando aqui a grande influncia da literatura da poca e da cultura local no modo como
tais obras podem ser contextualizadas (BROWN, 1970).
Os compositores de certa forma tem toda liberdade para criarem e expressarem ideias
diferentes das comuns atravs de suas obras. Caractersticas pessoais dos compositores so
normalmente estudadas para especificarem estilos, perodos e atriburem definies peculiares
aos mesmos. Vrias similaridades entre obras musicais de um mesmo autor podem denotar
algumas destas caractersticas, como pode ser visto no trabalho de Larue (1961) no qual so
analisadas semelhanas coincidentes e significativas entre obras clssicas. Dentre as obras
citadas no trabalho de Larue (1961) se encontram obras de Bach e Mozart com diversas
42

caractersticas semelhantes, principalmente nos contornos meldicos, alm ser verificado que
as similaridades ocorrem em trechos meldicos de um mesmo instrumento, normalmente.
Na msica clssica existem compositores que desenvolveram trabalhos especiais para
instrumentos especficos, sendo geralmente estes instrumentos os expositores das melodias
musicais ou cantores das obras. Um instrumento muito utilizado para tal funo o violino,
normalmente acompanhado por piano ou outros instrumentos de corda como viola e
violoncelo com os quais a linha meldica pode ser compartilhada.
O violino um instrumento clssico que adquiriu seu formato atual por volta do sculo
XVI que apresenta quatro cordas e seu som extrado principalmente atravs da frico de
um arco nas cordas. O arco feito de madeira e a parte que entra em contato com as cordas do
violino feita de fios de crina de cavalo com tenso regulvel (SANDYS e ANDREW, 2006).
Um dos melhores fabricantes durante a Era de Ouro do violino foi a famlia Stradivarius,
cujo exemplo de violino pode ser visto na Figura 9.

Figura 9. Violino Lady Blunt1 feito por Antonius Stradivarius em 1721

Fonte: STRADIVARIUS VIOLIN (2011).

O violino, apesar de possibilitar a execuo de mais de uma nota ao mesmo tempo,


considerado um instrumento meldico, logo ele preferencialmente utilizado para a execuo
de linhas sequenciais de notas. Obras escritas para este instrumento vo do Barroco ao Jazz
resultando na sua versatilidade distinta. O limite de notas que so executadas por um violino
varia do G3 ao C8, sendo as ltimas notas produzidas por harmnicos naturais ou artificiais,
resultando num total de 51 notas. O fato de usar poucas notas e ser um instrumento meldico
ajuda na anlise de suas obras por um sistema computacional e por estes motivos que obras
de violino so utilizadas neste trabalho para avaliarem o mtodo proposto.
O mtodo aplicado neste trabalho visa correlacionar certas sequncias meldicas em
busca do reconhecimento de padres existentes em obras. O mtodo PPM utilizado aqui

1
O Violino Lady Blunt foi leiloado em junho de 2011 por aproximadamente 16 milhes de dlares em prol de ajudar ao
Japo com relao aos terremos e tsunamis ocorridos no ms de maro de 2011. Este violino pertenceu Lady Anne Blunt,
filha de Ada de Lovelace (considerada a primeira programadora da histria) e neta do Lorde Byron (um dos maiores poetas
europeus).
43

com o intuito de encontrar obras semelhantes com base nos padres que so tratados
previamente em seus modelos criados para predio. As obras utilizadas nos testes iniciais
foram compostas para violino solo por grandes compositores clssicos a fim de tentar garantir
que a sequncia de notas de cada obra sirva para criar um bom modelo para predio de outras
obras, permita a avaliao das variaes do mtodo utilizado. A avaliao parte da anlise das
linhas meldicas de obras com base no ritmo e na melodia extrados de arquivos no formato
MIDI. A partir dos resultados dos testes iniciais, as melhores variveis so utilizadas em um
teste com um banco de dados maior a fim de submeter o mtodo a uma anlise mais apurada.

3.2.1 Definio da Anlise Musical com o PPM


No contexto deste trabalho, a anlise da melodia e do ritmo se baseia em conceitos da
Teoria Musical para relacionar o PPM com a msica. A anlise realizada tanto
individualmente, tratando a melodia ou o ritmo, quanto em conjunto, agrupando os resultados
de ambos. O fato de trabalhar a melodia juntamente com o ritmo tem uma grande importncia
baseada em diversos fatores, alguns tcnicos e outros fisiolgicos como pode ser visto em
2.33, alm j ter sido enfatizado o valor representativo de ambos at na filosofia de Aristteles
em III a.C. como pode ser visto a seguir:

Os ritmos e as melodias podem representar a raiva e a doura, como


tambm a coragem e a temperana, e, igualmente, todas as qualidades
contrrias a essas, e das demais qualidades de carter, sem se
distanciarem da realidade desses sentimentos, como sabemos por
experincia prpria, pois ao ouvirmos tais acordes nossas almas
passam por verdadeiras transformaes. O hbito de sentir o prazer ou
o sofrimento a partir de meras representaes semelhante aos
sentimentos experimentados diante das realidades. (ARISTTELES,
2010, p. 275).

O tratamento do ritmo e da melodia neste trabalho parte do conceito de a percepo


sonora ser sequencial e com ateno para variaes. Sendo assim, a melodia analisada a
partir das distncias entre alturas das notas, propondo a utilizao dos contornos meldicos
como dados de entrada pelo fato de estes contornos representarem as variaes das notas.
Neste trabalho, os contornos so representados atravs da subtrao entre a altura de uma nota
pela altura de sua antecessora. Este mtodo de tratamento dos contornos se baseia nos
mtodos aplicadas por Londei et al. (2003) e Cilibrasi et al. (2004..
A altura da nota aqui considerada sua posio na sequncia de notas existentes no
sistema de notao musical ocidental temperado, sendo computado o valor inteiro do cdigo
MIDI equivalente. Como a sequncia de notas baseada na diferena de semitons, a diferena
44

entre duas notas consecutivas sempre ser de uma unidade de semitom. Caso aparea um C4
seguido de um D4 em uma sequncia de notas, a subtrao de suas alturas resultar em 2, que
seria equivalente contagem de semitons que separam tais notas, semitons estes que podem
ser representados por C4, C4# e C4#, D4, consecutivamente. Entretanto, se surgir um F5
seguido de um E5 em uma sequncia o resultado ser -1, pelo fato de haver uma diferena de
um semitom entre tais notas e elas aparecerem em ordem descendente.
A aplicao deste mtodo se d pelo fato que uma mesma melodia reconhecida pelo
ser humano mesmo quando esta executada em alturas diferentes da original, ou com centro
tonal alterado. Sendo assim, a anlise do contorno meldico se impe como mais convincente
do que a anlise apenas das notas existentes em uma melodia (TIGHE e DOWLING, 1993). A
representao do contorno com base nas diferenas entre as alturas das notas apenas uma
proposta, sendo possvel tal representao ser realizada de outras maneiras.
O ritmo musical por sua vez apresenta-se como uma forma complexa a ser avaliada.
Trabalhos como o de Shmulevich et al. (2001) tratam os diversos problemas encontrados no
reconhecimento de padres rtmicos argumentando que uma implementao bem sucedida de
um sistema para tal funo deve incorporar informaes voltas percepo, alm de critrios
de erro. Alguns mtodos para o tratamento dos ritmos so citados no trabalho considerando os
problemas encontrados. Tais mtodos juntos a diversos outros citados em Shmulevich e Povel
(1998) somam uma gama de frmulas complexas que no se aplicam a este trabalho por
tratarem de udio em formato de ondas, todavia, serviram de base para a concepo do
mtodo aqui aplicado.
Por partir de uma conjectura perceptual, o ritmo de uma orquestra baseado em uma
diviso inicial do tempo dada pelo maestro. Antes de dar incio execuo de uma pea
musical o maestro normalmente apresenta uma unidade de tempo demarcando seu o incio e
fim desta unidade com sua batuta, e os instrumentos iniciam na segunda ou terceira marcao
de tempo realizada pelo maestro. Assim se procede toda a execuo da pea, de maneira que a
durao de cada som baseia-se na unidade de tempo anteriormente apresentada. Esta
determinao de unidade de tempo consiste na definio do andamento que ser dado ao pulso
musical. Este pulso pode ser comparado com a pulsao do corao ou um pulso eltrico.
A partir destas condies, o ritmo tratado neste trabalho com base nas relaes
existentes entre as sequncias de duraes das notas2. Os valores a serem considerados so

2
Este mtodo foi proposto e aplicado por Antonio Deusany de Carvalho Junior, Carlos Peixoto Mangueira Jnior e Tiago de
Frana Souza em um trabalho prtico da disciplina Introduo Teoria da Informao do perodo 2009.2 do curso de
Bacharelado em Cincia da Computao da Universidade Federal da Paraba.
45

dados a partir da razo entre os tempos de durao de uma nota por sua antecessora, ou seja, o
valor correspondente a quo maior ou menor a durao da nota atual em relao anterior.
Desta maneira, se a unidade de tempo utilizada como referencia para a execuo de uma obra
diferente em outra obra e em ambas so encontradas sequncias de notas mantendo as
mesmas propores de durao, o padro rtmico ser encontrado e determinado como
similar, o que leva ao encontro de padres semelhantes em obras com tempos diferentes em
batidas por minuto (beats per minute - bpm).

3.2.2 Exemplo da aplicao do mtodo de tratamento das melodias e ritmos


Com o intuito de exemplificar a aplicao do mtodo descrito, nas Figuras 6 e 7 so
apresentadas partes de melodias de obras diferentes onde suas sequncias de notas apresentam
similaridades na melodia e no ritmo. Estas linhas meldicas fazem parte do conjunto de obras
de violino utilizadas neste trabalho e foram compostas por Johann Sebastian Bach durante o
perodo Barroco e para um conjunto de seis trabalhos divididos entre sonatas e partituras para
violino solo.

Figura 10. Parte da partitura do primeiro movimento da obra BWV 1002 de Johann Sebastian Bach

Fonte: BACH (2010a).


Figura 11. Parte da partitura do segundo movimento da obra BWV 1004 de Johann Sebastian Bach

Fonte: BACH (2010b).

A partir de uma anlise sequencial do contorno das melodias, perceptvel reconhecer


uma semelhana entre 6 intervalos consecutivos das mesmas, iniciando na terceira nota da
Figura 10 e na primeira nota da Figura 11. Considerando apenas as notas, esta sequncia
meldica citada da Figura 10 B4, G4, E4, D5, C5#, B4, A4#, enquanto que na Figura 11
h a sequncia D4, A3#, G3, F4, E4, D4, C4#, de maneira que ambas as sequncias podem
ser representadas como cdigo MIDI seguindo a notao apresentada na Figura 1 como 71,
67, 64, 74, 73, 71, 70 e 62, 58, 55, 65, 64, 62, 61, respectivamente. As notas apresentadas
no se assemelham em sua sequncia, todavia os intervalos existentes entre as notas so de
igual tamanho e podem ser representados pela sequncia -4, -3, +10, -1, -2, -1 a partir da
metodologia adotada neste trabalho. Uma representao comparativa com mais detalhes
exibida na Figura 12.
46

Figura 12. Representao comparativa entre os intervalos meldicos em obras de Bach

Fonte: Autoria prpria (2011).

Para a comparao dos ritmos, so apresentadas a seguir as duraes de todas as notas


exibidas em ambas as sequncias utilizando a notao descrita na Figura 2, onde a semibreve
equivale a uma unidade e os outros smbolos se apresentam pelas suas propores em relao
semibreve. Alm disso, o conceito de nota pontuada tambm se apresenta nestas partituras,
determinando que a durao da nota aumente em 50% em relao sua durao original. Na
Figura 10, a sequncia de duraes em relao unidade de tempo pode ser representada por
3/32, 1/32, 3/32, 1/32, 3/32, 1/32, 3/32, 1/32, 3/32, 1/32, 3/32, 1/32, 3/32, 1/32, 1/32, 1/32,
1/16, enquanto que a sequncia gerada aplicao da metodologia apresentada resulta em
1/3, 3, 1/3, 3, 1/3, 3, 1/3, 3, 1/3, 3, 1/3, 3, 1/3, 1, 1, 2. No caso da Figura 11, as duraes
so 3/16, 1/16, 3/16, 1/16, 3/16, 1/16, 3/16, 1/16, 3/16, 1/16, 3/16, 1/16, 1/16, 3/32, 3/32,
1/16, 3/32, 3/32, 1/16, 3/32, 3/32 e suas propores so 1/3, 3, 1/3, 3, 1/3, 3, 1/3, 3, 1/3, 3,
1/3, 1, 3/2, 1, 2/3, 3/2, 1, 2/3, 3/2, 1. A partir deste ponto, tem-se que apesar das duraes
serem diferentes, h uma constante alternncia entre as propores de 1/3 e 3, o que
demonstra uma semelhana rtmica entre as obras considerando a metodologia aqui aplicada.
Como demonstrao, na Figura 13 encontra-se a representao das propores rtmicas das
partes demarcadas na Figura 12.

Figura 13. Representao comparativa entre os intervalos rtmicos em obras de Bach

Fonte: Autoria prpria (2011).

Ter certeza sobre as razes pelas quais tais obras so similares requer um estudo
avanado sobre a maneira como fora realizada tal composio, o contexto histrico das
mesmas, alm das experincias musicais tidas pelo compositor antes da concepo destas
peas. Sabe-se que Bach pode ter criado estas melodias com tais semelhanas com inteno
47

de manter um tema meldico em comum entre elas. Este conjunto de obras foi concludo em
20 anos durante um nico perodo literrio e as obras foram compostas como movimentos
musicais em formato de dana. Existem outros trabalhos de outros compositores do mesmo
perodo semelhantes a estes, alm disso, sabido que outros trabalhos inspiraram Bach
durante a composio deste conjunto de obras (LESTER, 1999).
Como a realizao da anlise conceitual e histrica de muitas obras levaria tempo,
proposta aqui a utilizao do PPM com o propsito de tornar prtica a avaliao de tais
semelhanas. O PPM trabalha com a predio a partir de uma correspondncia parcial dos
contextos de cada elemento em uma sequncia. Sendo assim, a semelhana entre partes de
uma sequncia implica na correspondncia de contextos que podem ser utilizados para a
compresso de forma que quo maior for a quantidade de semelhanas, maior ser a
compresso.
Esta aplicao do PPM junto aos conceitos de Teoria Musical proposta com o intuito
de mostrar o valor de sua utilizao como parte de sistemas que necessitem buscar tais
caractersticas aqui tratadas. Esta prtica pode ser futuramente utilizada para reconhecimento
de melodias semelhantes ou decorrentes de plgio, reconhecimento de autorias de obras,
determinao de estilos musicais a partir do ritmo, criao de obras a partir das caractersticas
mais relevantes de um compositor, dentre outras maneiras. Para a realizao de alguns testes
com tal metodologia, um sistema foi de desenvolvido para agrupar obras compostas por um
mesmo autor e verificar quo eficiente seria a predio utilizando o PPM. Estes testes foram
realizados a partir de cinco tipos de avaliaes que so descritas a seguir. As avaliaes tem o
intuito de complementar o mtodo com outras formas de tratamento das obras.

3.2.3 Descrio das avaliaes realizadas


A fim de testar mais possibilidades de utilizao do PPM na Msica, algumas
avaliaes foram propostas. As avaliaes aqui realizadas foram propostas com base nos
conceitos da Teoria Musical junto a conceitos da estatstica que servem para avaliar a
validao cruzada. Cinco modos de avaliao so propostas, no entanto, elas so agrupadas
em quatro mtodos, pelo fato de o algoritmo da classificao individual por ritmo ou melodia
ser o mesmo.
Nestas avaliaes, os modelos so criados a partir de arquivos escolhidos para
participarem dos testes. H a necessidade de todos os modelos apresentarem a mesma
quantidade de arquivos para que os grupos de teste sejam no apresentem vantagens uns sobre
os outros. Outra normalizao necessria est relacionada quantidade de notas de cada obra.
48

Como cada obra detm de uma quantidade especfica de notas, que pode variar entre as obras
utilizadas nos testes, tambm preciso normalizar verificando qual a menor obra utilizada
com o intuito de limitar todas as outras e assim evitar que grupos adquiram quantidades
desproporcionais de articulaes para serem utilizadas na classificao.
A avaliao dos acertos pelos modelos considera que houve sucesso na classificao de
um arquivo quando uma obra retirada de um modelo durante a validao cruzada para criao
do grupo de testes posteriormente comprimida com menor razo de compresso utilizando o
modelo do qual ela foi originada. A razo de compresso calculada neste caso a partir da
diviso do tamanho final da obra comprimida utilizando um modelo pela quantidade de notas
selecionadas para normalizao.
Uma opo a ser utilizada na avaliao referente considerao de harmonias e das
pausas. Os modelos podem ser criados utilizando apenas as notas da linha meldica e
descartar notas que ocorrem ao mesmo tempo de outras, ou converter as harmonias em
arpejos quando selecionado para considerar harmonias. Ao considerar as pausas, os intervalos
entre duas notas so substitudos por um smbolo referente a este silncio. Por padro, as
harmonias so removidas e no se consideram as pausas.
Considerando os modos de avaliao, temos que o primeiro modo apresenta duas
variaes por utilizar a melodia ou o ritmo em cada caso, no entanto, ambos seguem o mesmo
algoritmo. Os arquivos so lidos, interpretados e decidida a criao do modelo PPM
utilizando apenas um tipo de dado, sendo este dado relacionado s articulaes meldicas ou
s propores rtmicas. Aps a criao dos modelos, a validao cruzada utilizada com
estes. Os resultados so dados a partir quantidade de acertos realizada por cada modelo. As
classificaes do primeiro modo so utilizadas para os prximos modos como base para o
algoritmo.
O segundo modo de avaliao realiza a mdia dos resultados obtidos pela classificao
de uma obra utilizando a melodia e o ritmo. O terceiro modo segue o mesmo princpio de
mdia, todavia, neste modo a mdia realizada utilizando-se da posio no ranking. No
terceiro modo, h a classificao normal por ritmo e melodia separadamente, e apenas os
valores das posies no ranking so utilizados para o clculo da mdia. Em ambos os modos,
os resultados so dados a partir dos acertos aps a realizao da mdia.
O quarto modo tambm parte dos resultados da classificao utilizando ritmo e
melodia, no entanto, verifica qual destas classificaes obteve maior certeza de acerto. Esta
certeza dada a partir da diferena entre a razo de compresso dos dois primeiros colocados
49

de ambas as classificaes. A classificao que obtiver a maior diferena ser considerada


como a melhor.
Alguns detalhes gerais da implementao do sistema so descritos na prxima seo.
Alm disso, a interface desenvolvida ser exibida e em seguida ser apresentado um
comparativo deste sistema com o Sistema de Percepo Auditiva do ser humano.

3.3 Sistema para Anlise Musical


O sistema desenvolvido neste trabalho apresenta uma estrutura dividida em pacotes,
exibidos na Figura 14. Cada pacote realiza uma interao com o outro de modo que h uma
dependncia direta entre eles. No entanto, h a possiblidade de separao dos mesmos,
permitindo a utilizao do sistema em partes. A interface grfica se encontra em um pacote
especfico, os elementos utilizados para a classificao esto isolados em outro pacote e o
PPM utilizado se encontra tambm separado, sendo assim, o sistema aceita a utilizao
posterior de um novo PPM ou de uma nova interface grfica.

Figura 14. Diagrama de Pacotes do Sistema de Anlise Musical

Fonte: Autoria prpria (2011).

O gui o pacote no qual se encontra a interface grfica, atravs do qual o usurio


pode interagir com o sistema. A partir da interface grfica o usurio pode interagir com todas
as funes do sistema que se encontram definidas no pacote definido a seguir. O pacote
classificador contm as unidades necessrias para realizar: a criao dos modelos; adio,
leitura e interpretao de arquivos; execuo da validao cruzada; e exportao dos
resultados obtidos.
As relaes entre as principais classes que compe o pacote classificador se
encontram definidas na Figura 15 sendo tambm apresentadas as relaes entre as classes
deste pacote, os tipos de dados utilizados e os mtodos existentes. Por sua vez, o ppm
agrupa as funes para a execuo do PPM e manipulao de sua estrutura de dados.
50

Figura 15. Diagrama de Classe do Pacote Classificador

Fonte: Autoria prpria (2011).

Os detalhes do desenvolvimento do sistema so descritos a seguir. A preparao do


sistema para aplicao no evento Music Information Retrieval Evaluation eXchange (MIREX)
tambm apresentada. Alm disso, uma breve comparao do sistema de percepo auditiva
humano realizada a fim de dar um sentido mais natural ao que foi desenvolvido.

3.3.1 Detalhes de desenvolvimento


Para o desenvolvimento do sistema utilizou-se a linguagem Java (verso 1.6). Esta
linguagem d suporte ao tratamento de arquivos do tipo mid utilizando a Java Sound API.
Atravs desta API possvel realizar a leitura de arquivos e obter informaes sobre os
eventos registrados nos arquivos e executar o que estiver descrito neles. A Java Sound API
51

suportada desde a verso 1.3 do Java e apresenta um aplicativo demo como exemplo de suas
funcionalidades disponibilizado junto documentao em JAVA SOUND DEMO (2010).
O site Java Sound Resources (JSRESOURCES, 2010) serviu de base para o estudo da
tecnologia aqui utilizada por se tratar de uma fonte de recursos sobre as possveis formas de
tratamento de sons utilizando a linguagem Java. O site contm diversos cdigos de exemplo
alm de aplicaes e uma lista das perguntas mais frequentes sobre o assunto.
O PPM e o Codificador Aritmtico utilizados neste trabalho foram desenvolvidos por
Bob Carpenter (ARITHMETIC CODING, 2011). A implementao apresenta-se adequada
para o tratamento dos dados por armazenar informaes utilizando um Byte por cdigo,
suficiente para o trabalho por ser possvel utilizao de at 256 possibilidades de valores. Este
PPM apresenta-se tambm adaptado a um codificador aritmtico que codifica a auto-
informao de cada smbolo em um arquivo final para fins comparativos em relao
compresso, visto que este arquivo ser utilizado na identificao dos melhores modelos a
partir do menor tamanho necessrio para tal armazenamento.
O sistema desenvolvido permite a adio de arquivos mid e criao de modelos com
os arquivos. Ao adicionar um arquivo ao sistema realizada a leitura e interpretao do
arquivo. Neste ponto apenas os eventos relacionados ao incio e fim de notas so verificados e
a partir da criada uma lista sequencial com o valor das notas e uma lista com a durao das
notas.
Como o PPM utilizado trabalha com o tipo de dado Byte, tem-se que os valores
utilizados se encontram entre 0 e 255. Na leitura das notas realizada a subtrao entre a nota
e sua antecessora, e o resultado somado a 127 antes de ser armazenado na lista. Tomando
como referncia a extenso de notas de um violino, tem-se que ele permite a execuo de um
total de 51 notas diferentes, o que garante que os resultados podem variar entre -50 e 50, que
somados a 127 levam existncia de valores entre 77 e 177 na lista de notas. Isto no impede
a utilizao de melodias de outros instrumentos, como, por exemplo, o piano que apresenta 88
teclas, o que levaria a uma extenso de valores entre 39 e 215.
A leitura dos tempos de durao teve um tratamento especial pelo fato de os valores
serem normalmente fracionrios. As razes menores que 1 (um) tem seus valores truncados na
segunda casa decimal, sendo este valor multiplicado por -100 e somado a 127. Nos casos em
que a razo for maior ou igual a 1 (um), o valor truncado na primeira casa decimal,
multiplicado por 10 e adicionado a 127. A amplitude da faixa de propores possveis vai de 0
a 0.99 e 1.0 a 9.9, o que leva a lista de duraes a apresentar valores entre 28 e 226.
52

H a possibilidade de considerar as pausas existentes entre as notas, atribuindo um


smbolo especfico quando elas aparecem na sequncia de notas, no entanto, por no ser
vivel utilizar algum valor para sua altura, o valor 255 armazenado no lugar do valor da
articulao. J na lista de duraes das notas, o tempo das pausas considerado como o tempo
de durao de uma nota comum para o clculo, caso seja solicitado considerar as pausas. Caso
se deseje considerar as harmonias, elas sero consideras como notas em sequncia,
transformando um acorde em um arpejo. Isto necessrio pelas restries do PPM utilizado
neste trabalho que considera apenas linhas sequenciais.
Aps a adio de arquivos ao sistema, faz-se necessria a criao dos modelos para
uma futura avaliao. A criao de um modelo permite a organizao dos arquivos de forma
que tais arquivos sejam considerados quando houver a criao da tabela de probabilidades. A
tabela de probabilidades neste caso criada a partir da aplicao do PPM s sequncias de
notas dos arquivos pertencentes ao modelo.
Aps a organizao dos modelos com a mesma quantidade de arquivos em cada,
torna-se possvel a realizao da validao cruzada. Antes da realizao dos testes ainda
possvel escolher os contextos utilizados pelo PPM em cada avaliao e o tipo de avaliao a
ser realizado. O resultado da validao cruzada visualizado em um grfico de barras com as
porcentagens de acertos e pode ser exportado no formato csv de forma que pode ser tratado
com qualquer programa voltado ao tratamento de tabelas de dados. Os resultados exibem as
taxas mdias de compresso obtida por cada modelo, contexto aplicado, tipo de classificao,
entre outras informaes.

3.3.2 Interface para Interao com o Sistema


A interface grfica do sistema d acesso s opes necessrias para a criao de
modelos e realizao de avaliaes. A lista de arquivos que fazem parte de cada modelo
selecionado exibida separadamente da lista de todos os arquivos adicionados ao sistema,
como pode ser visto na Figura 16. No momento da realizao da validao cruzada so
considerados apenas os arquivos pertencentes aos modelos criados. Antes da realizao da
validao cruzada possvel realizar uma checagem em relao menor quantidade de notas
existente nos arquivos selecionados para constituir os modelos.
53

Figura 16. Interface do Sistema de Anlise Musical

Fonte: Autoria prpria (2011).

As opes dos menus so apresentadas a seguir. O menu Arquivo a opo de


entrada de udio no sistema. Por ele so escolhidos os arquivos que possivelmente so
adicionados a modelos e tratados posteriormente. H tambm a opo de escolher Remover
Harmonias e Considerar Pausas. Por padro considerado que haver a remoo das
harmonias e desconsiderao das pausas a fim de analisar apenas a linha meldica contnua.
Sua visualizao apresentada na Figura 17.

Figura 17. Interface do menu Arquivo

Fonte: Autoria prpria (2011).

O menu Modelo apresenta opes de adio de modelos, desativao de modelos e


clculo dos limites de notas a serem consideradas pelos modelos na anlise. Uma visualizao
das opes deste menu se encontra na Figura 18 com destaque para a opo de limite. O limite
pode ser definido a partir de um valor inteiro ou ser definido aps o clculo do menor nmero
de notas encontrado nos arquivos selecionados para fazerem parte dos modelos.
54

Figura 18. Interface do menu Modelo

Fonte: Autoria prpria (2011).

O menu de testes apresenta as diversas opes de avaliaes que podem ser realizadas.
As opes de avaliao foram nomeadas de acordo com o modo de avaliao, sendo AV1 o
primeiro modo e assim sucessivamente. Como o primeiro modo pode variar entre ritmo e
melodia, existem as opes AV1M para anlise utilizando melodia e AV1R para anlise
utilizando ritmo. Enquanto a classificao no realizada, a opo de exportar resultados
continuar desativada, como pode ser visto na Figura 19, onde apresentada a interface do
menu Testes. A ltima opo deste menu serve para realizar todos os testes em sequncia
havendo a necessidade apenas de determinar os contextos iniciais e finais de cada teste, como
necessrio para a realizao de um dos testes quaisquer.

Figura 19. Interface do menu Testes

Fonte: Autoria prpria (2011).

Aps a realizao de uma classificao qualquer, uma nova aba aparece com os
grficos dos resultados obtidos. Nesta aba podem ser vistos os resultados atravs de
perspectivas diferentes. A primeira opo exibida na Figura 20 mostra o resultado mdio de
acertos em cada contexto aplicado ao PPM. A opo de contexto do PPM limita a quantidade
de smbolos que sero considerados como contexto. O contexto zero, por sua vez, no
considerar elementos antecessores e ir basicamente contar a quantidade de ocorrncias de
cada smbolo durante a criao da tabela de predio. A ltima barra representa a mdia de
acerto geral utilizando os contextos de 0 a 6, no caso da Figura 20.
55

Figura 20. Exemplo de interface dos resultados: Taxa por Contexto

Fonte: Autoria prpria (2011).

Outra forma de visualizao apresentada na Figura 21, onde os resultados so


agrupados pelos resultados em cada contexto sendo exibida a taxa de acerto de cada
compositor. A mdia de cada contexto exibida no mesmo grupo do contexto e a mdia geral
exibida separadamente aps os contextos.

Figura 21. Exemplo de interface dos resultados: Taxa por Contexto/Compositor

Fonte: Autoria prpria (2011).

O terceiro tipo de grfico apresenta os resultados agrupados por compositor e exibindo


os resultados dos compositores ordenados por contexto. A mdia de cada compositor
exibida junto a cada compositor, enquanto que a mdia de cada contexto e a mdia geral da
classificao exibida separadamente.
56

Figura 22. Exemplo de interface dos resultados: Taxa por Compositor/Contexto

Fonte: Autoria prpria (2011).

Estes grficos servem para observar a qualidade dos modelos diante dos contextos
testados. As perspectivas diferentes permitem uma anlise diferenciada dos resultados de
acordo com o que se deseja avaliar. A realizao de todos os testes de uma s vez torna-se
necessria quando se deseja encontrar as melhores configuraes para anlise de arquivos
selecionados para a criao dos modelos. Os resultados da aplicao sistema sero exibidos no
prximo captulo, no entanto, antes disso haver um breve comparativo do sistema aqui
descrito com os processos relacionados percepo auditiva.

3.3.3 Comparativo deste sistema com o Sistema de Percepo Auditiva


A proposta do sistema a ser desenvolvido para o tratamento das melodias partiu da
juno de conhecimentos de diversas reas com os conhecimentos sobre o PPM, visualizando
assim a possibilidade de seu uso na msica. Pesquisas da rea de psicologia indicam que
msicas so reconhecidas apenas por partes da mesma, seja parte da melodia ou do ritmo, ou a
combinao de ambos, sendo possvel estabelecer uma relao entre a percepo auditiva e o
reconhecimento de padres (TIGHE e DOWLING, 1993). Este reconhecimento se d a partir
de uma busca no conhecimento prvio armazenado no crebro, e para se armazenar algo em
uma memria de longo prazo h a necessidade de um estmulo forte ou repetitivo (BARKER
et al., 1999). Existem tambm fatores na rea da Teoria Musical que estabelecem conceitos
que permitem a predio do que pode ocorrer em seguida a certo evento musical, como o
conceito de escalas musicais e as noes de harmonias envolvidas nas melodias e nos ritmos
(MED, 1996).
57

Diante dos conceitos de psicologia, neurocincia e msica, os quais so melhores


descritos na seo 2.3.3 referente percepo do som, tem-se que a aplicao do PPM na
anlise musical torna-se vivel tambm pelo fato de haver semelhana do mtodo com o
sistema de percepo auditiva, o qual tambm experimenta o reconhecimento de padres. A
percepo auditiva baseia-se em caractersticas humanas e tambm na memria
(GOLDSTEIN, 2002). A memria, por sua vez, tem funcionamento complexo que no cabe
ao escopo deste trabalho, no entanto, ela responsvel pelo banco de dados cerebral e
trabalha a partir das experincias do ser (BARKER et al., 1999), o que permite a comparao
com um banco de dados computacional baseado nas experincias de eventos. As experincias
voltadas audio de msica podem ser representadas pela audio com ateno total ou
parcial msica, sendo este ltimo caso resultante da ateno apenas melodia, ritmo ou
outro componente da msica (JOURDAIN, 1998), enquanto as experincias do sistema
computacional dependem os arquivos de entrada.
Estes conceitos se assemelham com o sistema desenvolvido a partir do momento em
que o sistema realiza a leitura sequencial das notas das melodias e armazena sua frequncia de
ocorrncia com base no algoritmo do PPM que agrupa considerando os contextos. Sequncias
que se repetem com mais frequncia caracterizam padres que podem ser utilizados para
reconhecimento futuro quando algo semelhante a tais sequncias lido. Nestas condies, a
leitura de arquivos pelo sistema pode ser comparada com a audio de linhas meldicas pelo
sistema auditivo humano. J o agrupamento realizado pelo PPM se compara em parte com o
tratamento dos eventos sonoros pelo crebro na constituio da memria.
Quando algo novo ouvido, o conhecimento prvio utilizado para interpretao, e o
que mais houvera se repetido num passado relativamente prximo passa a ser comparado
inicialmente com o que inicia o processo de percepo no momento. Da mesma forma age o
PPM, que inicia o processo de anlise de algo novo a partir dos contextos mais comuns e j
existentes na tabela de probabilidades. Os itens da tabela que apresentam probabilidades
definidas representam smbolos que j ocorreram no passado e suas probabilidades podem ser
comparadas facilidade com a qual o crebro tornou tal smbolo uma memria de longo
prazo e assim consegue utiliz-lo para comparao com smbolos novos.
A interpretao das melodias para seu armazenamento no crebro um assunto que
envolve muitas teorias, todavia, alguns experimentos da psicologia afirmam que a melodia
no armazenada diretamente atravs das frequncias, mas sim das relaes entre frequncias
subsequentes (TIGHE e DOWLING, 1993). Este conceito j utilizado computao como foi
visto nos trabalhos correlatos. A ateno cerebral voltada a certo estmulo se relaciona com o
58

tratamento do ritmo com foco a durao das notas e suas propores relativas, sendo este o
tratamento do ritmo que analisado neste trabalho.
A Figura 23 exibe uma comparao entre os sistemas baseando-se no que j fora
descrito anteriormente. Seguindo o caminho do som, tem-se que as notas so interpretadas
com relao s suas frequncias pela cclea de forma semelhante como o arquivo mid
processado na classe Obra. O lobo temporal interage com o hipocampo na memorizao ou
na busca pelos padres encontrados nas obras escutadas, assim como a classe Classificador
interage com o pacote ppm no intuito de realizar a classificao atravs da busca por o que
lido atravs do arquivo mid. O tratamento do arquivo mid utilizando o PPM em um
modelo criado resultar em uma compresso maior deste arquivo quando houver uma maior
quantidade de smbolos semelhantes, o que se assemelha com classificao cerebral que ser
possvel quando houver conhecimento prvio armazenado na memria em relao ao que se
ouve.

Figura 23. Comparao entre este sistema e o Sistema de Percepo Auditiva

Fonte: Autoria prpria (2011, adaptado de GUYTON, 2006, p. 652 e GOLDSTEIN (2002, p. 351)

O fato de o sistema estar do lado esquerdo do crebro foi intencional pelo fato de haver
a anlise apenas do ritmo e da melodia, considerando que o crtex secundrio direito trata a
harmonia musical, tema no tratado neste trabalho. Outro ponto relevante desta comparao
est voltado para o fato de esta ideia de correlao com o crebro passar a ter mais sentido na
aplicao que ser apresentada na prxima seo onde haver uma busca de uma obra dentre
59

muitas outras, algo que normalmente ocorre ao se ouvir uma msica qualquer por algum com
muita experincia musical.

3.3.4 Verso do sistema para o MIREX


O MIREX uma campanha anual de avaliao de algoritmos voltados recuperao
de informaes atravs de msicas que pode ser acessada em MIREX DATA (2010). A sigla
MIREX vem do ingls Music Information Retrieval Evaluation eXchange, que significa
Permuta de Avaliaes de Recuperao de Informaes em Msica. O MIREX ocorre desde
2005 em conjunto com a conferncia da Sociedade Internacional para Recuperao de
Informaes em Msicas - International Society (and Conference) for Music Information
Retrieval (ISMIR) de modo que vrias tarefas so realizadas permitindo o teste de
diversos algoritmos.
Dentre as avaliaes do MIREX existe a tarefa voltada Similaridade de Melodias
Simblicas (Symbolic Melodic Similarity SMS), onde o objetivo recuperar os itens mais
semelhantes a partir de uma coleo de obras. A tarefa realiza realizada em 2011
compreendeu do teste de seis bases de questionamento compostas por arquivos mid
monofnicos para serem correlacionadas com um conjunto relativamente grande de arquivos
mid tambm monofnicos. A seis bases so formadas por quatro classes de mutaes, sendo
assim cada base consiste em: o arquivo original; o original com uma nota deletada; o original
com uma nota acrescentada; o original com um intervalo ampliado; e o original com um
intervalo comprimido.
Nesta avaliao cada sistema deve retornar os 10 itens mais semelhantes a cada item
pertencente s bases selecionadas. Isto resulta num total de 30 avaliaes por serem 6 bases
com 5 arquivos em cada. Para este teste utilizado um banco de arquivos que fazem parte do
banco de dados de cdigos associativos e msicas folclricas Essen (Essen Associative Code
and Folksong Database) que pode ser encontrado em ESAC-DATA (2010) ou no prprio site
do MIREX. Este corpus musical apresenta um total de 5223 obras das quais seis so retiradas
para compor as bases. A avaliao dos resultados realizada por pessoas que utilizaro um
sistema online para ouvir os arquivos combinados: o arquivo questionado e o arquivo
selecionado como semelhante.
Para adaptar o sistema desenvolvido neste trabalho para realizar testes com o banco de
dados do MIREX foi necessrio realizar alteraes em algumas classes. A interface grfica
passou a ser desnecessria pelo fato de o MIREX trabalhar atravs de linha de comando. A
classe Classificador passou a considerar apenas um arquivo como formador do modelo,
60

alm de no ser necessrio o clculo de limites de notas nem utilizao da validao cruzada.
O resultado passou a ser restrito exibio dos 10 primeiros colocados na avaliao. Alguns
testes realizados com esta verso e com a verso completa do sistema so apresentados no
captulo a seguir.
61

4 Resultados da Anlise
A fim de avaliar o mtodo proposto neste trabalho, um teste fora realizado com obras
criteriosamente selecionadas. Considerando que alguns compositores fizeram obras
especialmente para violinos, buscaram-se conjuntos de obras de violino solo de um mesmo
compositor, com o intuito de verificar a existncia de semelhanas entre as obras desta
categoria. Pelo fato de existirem obras com diferentes quantidades de notas, o procedimento
de normalizao realizado utilizando o mtodo de calcular a quantidade de notas mxima
em comum entre os arquivos e definir este valor como limite de notas a ser considerado
durante a anlise.
Os compositores selecionados para a anlise foram Albinoni, Bach, Beethoven,
Brahms e Mozart. As obras fazem parte de sonatas e concertos para violino, foram obtidas
atravs de sites da internet que disponibilizam reprodues em mid das partituras originais
de peas clssicas. O principal site utilizado nesta pesquisa para obteno dos arquivos foi o
KUNST DER FUGE (2010), site destinado a armazenar o maior contedo de msica clssica
em formato mid, apresentando biografias dos compositores e outras informaes
importantes para pesquisas na rea. A lista de obras utilizadas nestes testes se encontra no
APNCICE C.
Os arquivos foram tratados de modo manual para que apenas a trilha musical
correspondente ao violino fosse analisada pelo programa, tendo em vista que os arquivos
mid apresentam trilhas separadas para cada instrumento alm de outras informaes sobre
eventos. Alguns arquivos apresentavam vrios movimentos juntos sendo necessria uma
anlise minuciosa dos arquivos utilizando as partituras dos mesmos, realizando a busca pelas
partituras a partir do IMSLP (2010), projeto que prov a disponibilizao de partituras e
arquivos de udio referentes a uma coleo de obras clssicas separadas por compositor,
melodias, instrumentos e gneros.
Aps a preparao, os arquivos foram adicionados ao sistema para o agrupamento em
modelos separando-os por compositor. 10 arquivos foram utilizados por compositor,
resultando num total de 50 arquivos. O valor utilizado para a normalizao foi de 205 notas,
resultando num total de 204 intervalos desconsiderando pausas e harmonias.
62

A validao cruzada foi realizada criando modelos com contexto de 0 a 6 e realizando


todos os modos de avaliaes, totalizando um total de 35 testes. Os testes foram realizados
utilizando um MacBook Pro com processador 2.4GHz Intel Core 2 Duo, com memria ram de
4 GB 1067MHz DDR3, no sistema operacional Mac OS X Version 10.6.8 e com o mnimo de
aplicativos em execuo.

4.1 Interfaces dos resultados


A interface do programa aps a realizao dos testes pode ser vista na Figura 24, onde
possvel verificar que as classificaes foram realizadas com sucesso, alm exibir a durao
da classificao em milissegundos.

Figura 24. Interface do programa aps a realizao dos testes

Fonte: Autoria prpria (2011)

As abas de resultados seguem a ordem dos testes realizados e, como foram realizados
cinco testes, cinco abas foram acrescentadas. Os resultados so apresentados das trs formas
possveis dentro de cada aba e alguns detalhes so discutidos na seo a seguir a fim
Os resultados da anlise no primeiro modo com melodia utilizando contextos de 0 a 6
exibido nas Figuras 25, 26 e 27. Os resultados da anlise no primeiro modo com ritmo
utilizando contextos de 0 a 6 exibido nas Figuras 28, 29 e 30. Os resultados da anlise no
segundo modo utilizando contextos de 0 a 6 exibido nas Figuras 31, 32 e 33. Os resultados
da anlise no terceiro modo utilizando contextos de 0 a 6 exibido nas Figuras 34, 35 e 36.
Os resultados da anlise no quarto modo utilizando contextos de 0 a 6 exibido nas Figuras
37, 38 e 39.
63

Figura 25. Interface do resultado da anlise no primeiro modo com melodia (1)

Fonte: Autoria prpria (2011)


Figura 26. Interface do resultado da anlise no primeiro modo com melodia (2)

Fonte: Autoria prpria (2011)


Figura 27. Interface do resultado da anlise no primeiro modo com melodia (3)

Fonte: Autoria prpria (2011)


64

Figura 28. Interface do resultado da anlise no primeiro modo com ritmo (1)

Fonte: Autoria prpria (2011)


Figura 29. Interface do resultado da anlise no primeiro modo com ritmo (2)

Fonte: Autoria prpria (2011)


Figura 30. Interface do resultado da anlise no primeiro modo com ritmo (3)

Fonte: Autoria prpria (2011)


65

Figura 31. Interface do resultado na anlise no segundo modo (1)

Fonte: Autoria prpria (2011)


Figura 32. Interface do resultado da anlise no segundo modo (2)

Fonte: Autoria prpria (2011)


Figura 33. Interface do resultado da anlise no segundo modo (3)

Fonte: Autoria prpria (2011)


66

Figura 34. Interface do resultado da anlise no terceiro modo (1)

Fonte: Autoria prpria (2011)


Figura 35. Interface do resultado da anlise no terceiro modo (2)

Fonte: Autoria prpria (2011)


Figura 36. Interface do resultado da anlise no terceiro modo (3)

Fonte: Autoria prpria (2011)


67

Figura 37. Interface do resultado da anlise no quarto modo (1)

Fonte: Autoria prpria (2011)


Figura 38. Interface da anlise do resultado no quarto modo (2)

Fonte: Autoria prpria (2011)


Figura 39. Interface do resultado da anlise no quarto modo (3)

Fonte: Autoria prpria (2011)


68

4.2 Detalhes dos resultados


A Tabela 2 apresenta os resultados dos testes exibindo a porcentagem mdia de acerto
de cada modo de avaliao. As porcentagens so resultantes da mdia de porcentagem de
acerto de cada compositor no contexto em questo.

Tabela 2. Porcentagem de acerto dos modos de avaliao

Modo de Porcentagem de acerto mdio em cada contexto


avaliao C.0 C.1 C.2 C.3 C.4 C.5 C.6
AV1M 58% 78% 66% 70% 70% 66% 64%
AV1R 54% 76% 76% 70% 76% 68% 70%
AV2 70% 82% 82% 76% 82% 82% 76%
AV3 70% 86% 84% 78% 80% 80% 72%
AV4 58% 84% 84% 78% 84% 82% 72%

Fonte: Autoria prpria (2011).

A durao das classificaes de cada modo em todos os contextos, sendo a


classificao realizada em um contexto por vez, pode ser vista na Tabela 3. O segundo,
terceiro e quarto modos de avaliao apresentam aproximadamente o dobro de durao do
primeiro modo por haver necessidade de realizar a classificao completa em melodia e ritmo
para finalizao do algoritmo.

Tabela 3. Durao dos testes dos modos de avaliao utilizando 7 contextos

Modo de avaliao Durao da avaliao em 7 contextos


AV1M 28469 ms
AV1R 27187 ms
AV2 55384 ms
AV3 55455 ms
AV4 55381 ms

Fonte: Autoria prpria (2011)

A partir destes resultados optou-se por realizar os testes simuladores do MIREX com o
modo de avaliao AV3 e com o contexto 1, por ser a maior porcentagem encontrada na
Tabela 2. Os arquivos a serem avaliados fora escolhidos aleatria mente no banco de dados
ESAC-DATA (2010). Os arquivos selecionados foram: A0001.mid, A0004C.mid,
B0780.mid, E0679G.mid, Q21551.mid, Z1382.mid. Para formar cada uma das seis bases de
teste, as alteraes foram realizadas na terceira nota de cada arquivo: deletando a terceira
69

nota, inserindo um d central como colcheia aps a terceira nota (com cdigo 60 em MIDI,
referente ao d central), ampliando a terceira nota para semibreve pontuada e comprimindo
para semicolcheia. Os resultados dos testes so apresentados na Tabela 4.

Tabela 4. Resultado do teste simulando o MIREX

Obra a ser avaliada Ranking dos arquivos avaliados


1 2 3 4 5 6 7 8 9 10
A0001 A0001 Z0060 A0539C A0327 A0469 E0879 D0229 B0159 B0095 A0023B
A0001-notadeletada A0001 Z0060 A0539C A0327 A0469 B0159 B0095 E0879 A0539B A0023B
A0001-notainserida A0001 Z0060 A0327 A0539C A0469 B0159 B0062 B0095 Z0163 B0263
A0001-notaampliada A0001 Z0060 A0327 A0469 A0539C Z0163 B0095 B0159 Q0016A E0879
A0001-notacomprimida A0001 Z0060 A0539C A0327 A0469 E0879 B0095 A0023B Z0163 B0159
A0004C A0004C B0686 Z1035 A0327 Q0072C E0043D Z1108 B0092 A0633 F0799
A0004C-notadeletada A0004C B0686 Z1035 E0043D B0092 A0327 Q0072C F0294 F0510 A0594
A0004C-notainserida A0004C Z1035 F0294 E0043D B0686 A0327 Q0072C Z1108 B0092 A0594
A0004C-notaampliada A0004C B0686 Z1035 A0327 Q0072C E0043D Z1108 B0092 A0633 F0799
A0004C-notacomprimida A0004C B0686 Z1035 A0327 Q0072C E0043D Z1108 B0092 A0633 F0799
B0780 B0780 F0396 B0062 E0548 B0257 Z1217 A0359 Z0192 F0673 B0319
B0780-notadeletada B0780 B0319 F0396 Z0192 E0548 B0304 B0062 B0209 F0020 F1048
B0780-notainserida B0780 F0396 B0304 B0031 Z0192 B0319 B0062 F0690 B0582 B0526
B0780-notaampliada B0780 F0396 B0304 B0031 B0062 B0772 B0319 Z1217 Z1063 F0490
B0780-notacomprimida B0780 F0396 B0062 B0257 E0548 B0304 A0359 B0031 Z1217 B0319
E0679G E0679G Q1062C E0739D B0704 E0353C B0095 F0490 B0321 A0157 Q0155c
E0679G-notadeletada E0679G B0704 Q1062C E0739D B0321 E0353C E0334A B0095 F0490 F0246
E0679G-notainserida E0679G E0353C B0095 Q1062C F0490 E0739D B0704 Z1071 F0246 E0382
E0679G-notaampliada E0679G B0095 B0704 F0490 E0739D E0353C A0398B F0246 E1353 B0321
E0679G-notacomprimida E0679G Q1062C E0739D B0704 E0353C B0095 F0490 B0321 A0157 Q0155c
Q21551 Q21551 A0327 A0251 B0581 A0157 E0716 E0382 Z1055 F0246 E1917
Q21551-notadeletada Q21551 E0382 A0157 Z1119 A0327 F0580 F0349 F0294 E1542 E1026
Q21551-notainserida Q21551 B0581 E0355 A0157 E0382 Z0217 F0215 E1339 E1026 E0933
Q21551-notaampliada Q21551 F1011 Z1022 B0729 A0518 Q1061E Q0109A Q0102 Q0089A K2165
Q21551-notacomprimida Q21551 A0327 A0251 B0581 A0157 E0716 E0382 B0197 A0519 A0342
Z1382 Z1382 A0258 B0574 B0535 Z1219 E0521 Z1085 E0782C B0715 Z1047
Z1382-notadeletada Z1382 A0258 Z1219 B0574 B0715 E0521 D0019 Q0112A F0395 B0731
Z1382-notainserida Z1382 A0258 Z1219 B0535 B0574 E0521 B0715 E0782C B0282 B0731
Z1382-notaampliada Z1382 Z1047 B0535 F0378 B0574 A0258 Z1219 F0395 B0731 B0094
Z1382-notacomprimida Z1382 A0258 E0521 B0574 B0535 Z1219 B0731 Z1047 Q0112A E0782C
Fonte: Autoria prpria (2011)

O tempo necessrio para a realizao total dos 30 testes com as 5223 obras foi de 7,5
minutos. Aps a obteno destes resultados, pessoas so selecionadas para avaliar a
semelhana das obras ranqueadas em relao obra original de cada base, ponderando em trs
nveis: muito similar, pouco similar, no similar. Este tipo de avaliao no foi realizado no
caso deste trabalho. Os resultados apresentados nesta seo junto aos outros conceitos
dispostos neste trabalho sero correlacionados no prximo captulo.
70

5 Consideraes Finais
Aps a reviso dos contedos aqui aplicados foi possvel ter uma ideia de quantas
variveis devem ser consideradas para a anlise de uma representao sonora qualquer. O
estudo tornou-se cada vez mais complexo com o aprofundamento do contedo visando
promover uma viso mais prxima da real ou tentando simular as atitudes cerebrais perante a
percepo sonora. No entanto, o agrupamento dos conceitos de diversas cincias promoveu
uma maior apreenso de caractersticas importantes induzindo a uma viso mais clara do que
pode ser til para esta e outras pesquisas.
A pesquisa aqui apresentada props uma anlise dos padres musicais existentes em
ritmos e melodias considerando um grupo especfico de obras voltadas para violino solo com
intuito de realizar testes com diferentes modos de avaliao. A partir disto foi possvel
restringir a anlise por se considerar apenas linhas meldicas, alm de reduzir os conceitos
utilizados durante a anlise musical. A sugesto de aplicao do PPM neste mbito fora
deveras criteriosa a fim de garantir a fidelidade das comparaes realizadas com os outros
trabalhos na rea e com os conceitos envolventes. Os resultados obtidos predispem o uso dos
mtodos testados em outros trabalhos e propem novos testes em busca de avanos a partir da
utilizao de outros conceitos da Teoria Musical.

5.1 Discusso dos Resultados


Os resultados obtidos com o teste partindo de obras de violino mostram taxas de acerto
entre 54% e 86%. Essa variao est relacionada s diversas variveis a serem consideradas
neste tipo de avaliao, todavia, mesmo com uma anlise restrita apenas s linhas meldicas
considerando alguns conceitos de melodia e ritmo, foi possvel obter resultados relevantes a
partir dos modelos criados. Como a composio musical no se baseia na reproduo de
padres rtmicos e meldicos, a existncia dos mesmo de maneira repetitiva no se d
comumente, principalmente pela msica ser uma arte que se concebe primordialmente a partir
da criatividade. Neste caso, os conceitos que podem ter influenciado nos principais resultados
deste trabalho esto voltados para o uso de temas musicais e exerccio de estilos musicais.
A anlise meldica considerando os compositores resultou na verificao de que
alguns apresentaram uma variao meldica vasta que fez com que suas obras no fossem
71

identificadas claramente atravs da metodologia utilizada, como foi o caso de Beethoven e


Brahms. A anlise dos ritmos apresentou certa melhoria em alguns casos, como pode ser visto
no captulo anterior. Alguns compositores apresentaram resultados melhores especificamente
em melodia ou em ritmo, porm, os mtodos de anlise utilizando os resultados da melodia
junto ao ritmo demonstraram que esta unio teve grande valor para a avaliao, o que pode ser
enaltecido a partir do fato de o crebro tratar a melodia junto ao ritmo em um mesmo local
especfico.
Dentre todos os testes verificou-se que o melhor resultado foi encontrado na aplicao
do terceiro modo com o contexto 1. Isto significa que a melhor predio dentre os modelos
criados pelos compositores ocorreu considerando 3 notas, ou seja, um intervalo meldico e
rtmico prevendo o prximo. Alm disso, verifica-se que neste caso a mdia de ranking obteve
mais sucesso na avaliao.
A aplicao do melhor resultado encontrado na realizao do teste simulando o SMS
do MIREX tambm demonstrou bons resultados, tendo em vista que as obras foram
identificadas em todos os casos. No entanto, houve variao do ranking quando as obras
sofreram alteraes, o que s pode ser verificado como bom ou ruim caso realmente haja a
validao a partir da incluso do sistema aqui desenvolvido na avaliao anual do MIREX.

5.2 Propostas para Trabalhos Futuros


A partir dos resultados obtidos, prope-se algumas alteraes no trabalho em busca de
melhoramentos. Outros conceitos da Teoria Musical ho de ser utilizados nestas anlises a fim
garantir uma maior proximidade da computao com a msica. Dentre os conceitos que
podem ser utilizados, pertinente a presena de conceitos sobre harmonia tendo em vista que
ela envolve e d sentido tanto ao ritmo quanto melodia.
A possibilidade de tratar o ritmo tambm pelos pulsos e articulaes das notas algo
que merece ateno por ser algo intrnseco percepo do som tanto em um mbito musical
quanto no cerebral, j que a partir da forma como as notas soam que elas so interpretadas e
transformadas em impulsos eltricos ao serem enviadas pelos neurnios ao crebro. Se uma
nota soa baixo ou alto, com uma intensidade constante ou com uma variao de intensidade,
ou de qualquer outra maneira prefervel pelo seu interpretador, ela ser possivelmente
percebida desta maneira, dependendo da experincia musical do ouvinte (JOURDAIN, 1998).
Nem todos os eventos tratados pelo formato MIDI foram considerados neste trabalho,
logo, condies de mudana de andamento, intensidade das notas e outros diversos eventos
72

musicais podem trazer melhores resultados. O fato de o banco de dados de obras de violino ter
sido obtido atravs de sites da internet tambm oferece uma indagao sobre a validade dos
testes, o que pode ser resolvido com a utilizao de outros bancos especficos para teste ou da
avaliao das obras por msicos certificados para tal.
Na rea de Computao Musical existem trabalhos sobre identificao de obras a partir
do cantar de partes da obra, trabalhos que realizam a identificao de gneros musicais a partir
de trechos musicais, entre outros tantos que poderiam partir dos mtodos aqui avaliados para
obteno de resultados. A sua utilizao em sistemas de Inteligncia Artificial no deixa de
ser vivel tendo em vista a semelhana da modelagem realizada com os dados das msicas
com o tratamento pelo sistema de percepo musical, alm do fato de o algoritmo do PPM ter
semelhanas com o tratamento das informaes no crebro humano. De um modo geral, a
pesquisa abre diversas possibilidades para a utilizao dos mtodos aqui descritos,
principalmente pelo fato de ter sido concebida com base em conceitos de cincias diferentes.
73

Referncias

ARISTTELES. Poltica. Traduo de Pedro Constatins Tolens. 5. ed. So Paulo: Martin


Claret, 2010.

ARITHMETIC CODING. Compression via Arithmetic Coding. Bob Carpenter. Disponvel


em: <http://www.colloquial.com/ArithmeticCoding/>. Acesso em: 10 jun. 2010.

BARKER, R. A., BARASI, S., NEAL, M. J. Neuroscience at a Glance. Blackwell Science,


1999.

BACH, Johann Sebastian. Violin Partita No. 1 in B minor, BWV 1002. International Music
Score Library Project (IMSLP). Disponvel em:
<http://imslp.org/wiki/Violin_Partita_No.1_in_B_minor,_BWV_1002_(Bach,_Johann_Sebast
ian)>. Acesso em: 10 jun. 2010a.

______. Violin Partita No. 2 in D minor, BWV 1004. International Music Score Library
Project (IMSLP). Disponvel em:
<http://imslp.org/wiki/Violin_Partita_No.2_in_D_minor,_BWV_1004_(Bach,_Johann_Sebast
ian)>. Acesso em: 10 jun. 2010b.

BARBOSA FILHO, J. R. B.; BARUFALDI, B.; SANTANA, E. F.; POEL, J. V. D.;


BATISTA, L. V. Classificao Automtica de Textos por Perodo Literrio Utilizando
Compresso de Dados Atravs do PPM-C. In: Brazilian Symposium in Information and
Human Language Technology, 7., Anais... So Carlos, 2009.

BOOTHROYD, Arthur. The sense of hearing. In: Speech, Acoustic and Perception
Disorders. Austin: Pro-Ed Studies in Communicative Disorders; Pro-Ed Inc, 1986.
74

BROWN, Calvin S. The Relations between Music and Literature as a Field of Study. In:
Comparative Literature, Vol. 22, No. 2, p. 97-107, Special Number on Music and Literature.
Spring, 1970.

CILIBRASI, Rudi; VITNYI, Paul; WOLF, Ronald de. Algorithmic Clustering of Music
Based on String Compression. In: Computer Music Journal, 28:4, p. 4967, Winter.
Massachusetts Institute of Technology, 2004.

CLEARY, J. G.; WITTEN, I. H. Data Compression Using Adaptive Coding and Partial
String Matching. In: IEEE Transactions on Communications, COM-32(4), p.396402, April.
1984.

CULLE, E. A.; COAKLEY, J. D.; LOWY, K.; GROSS, N. A revised frequency-map of the
guinea-pig cohclea. American Journal of Psychology, 56, p. 475-500. 1943.

DANNENBERG, Roger B; HU, Ning.; Discovery Techniques for Music Audio. In: ISMIR
2002. Conference Proceedings: Third International Conference on Music Information
Retrieval, M. Fingerhut, ed., p. 63-70, Paris: IRCAM, 2002.

ESAC-DATA. Essen Associative Code and Folksong Database. Disponvel em:


<http://www.esac-data.org/>. Acesso em: 10 jun. 2010.

GOLDSTEIN, E. Bruce. Sensation and Perception. 6th ed. Wadsworth, 2002.

GUYTON, Arthur C. Textbook of Medical Physiology. 11th ed. Elsevier, 2006.

HONRIO, T. C. S.; DUARTE, R. C. M.; NOBRE NETO, F. D.; ALMEIDA, T. P.;


BATISTA, L. V. Classificao de Texturas Usando PPM. In: Reunio Anual da SBPC,
Belm. Anais/Resumos da 59a Reunio Anual da SBPC: publicao eletrnica. 2007.

IMSLP. International Music Score Library Project. Disponvel em: <http://imslp.org/>.


Acesso em: 10 jun. 2010.
75

JAVA SOUND DEMO. Java Sound API: Java Sound Demo. Oracle Technology Network -
Java. Disponvel em: <http://www.oracle.com/technetwork/java/index-139508.html>. Acesso
em: 10 jun. 2010.

JOURDAIN, Robert. Msica, Crebro e xtase - Como a msica captura nossa


imaginao. Ojetiva, 1998.

JSRESOURCES. Java Sound Resources. Disponvel em: <http://www.jsresources.org/>.


Acesso em: 10 jun. 2010.

KIEFER, Bruno. Elementos da Linguagem Musical. Porto Alegre, RS, Brasil. Editora
Movimento, 1979.

KUNST DER FUGE. The largest classical music resource in .mid files. Disponvel em:
<www.kunstderfuge.com>. Acesso em: 10 jun. 2010.

LARTILLOT, O.; DUBNOV, S.; ASSAYAG, G.; BEJERANO, G. Automatic modelling of


musical style. In: Proceedings of the 2001 International Computer Music Conference, p. 447
454, San Francisco: ICMA, 2001.

LARUE, Jan. Significant and Coincidental Resemblance between Classical Themes. In:
Journal of the American Musicological Society. Vol. 14, No. 2, p. 224-234, Summer. 1961.

LESTER, Joel. Bach's works for solo violin: style, structure, performance. Oxford
University Press, 1999.

LONDEI, Alessandro; LORETO, Vittorio; BELARDINELLI, Marta Olivetti. Musical Style


and Authorship Categorization by Informative Compressors. In: Proceedings of the 5th
Triennial ESCOM Conference, p. 200-203. 2003.
76

MARQUES, J. R. T.; POEL, J. V. D.; BATISTA, L. V.; GUILHERME C. G.


Mammographic Image Noisy Bit Planes Identification and Removal Using a Binary
PPM Algorithm and an Open Source Architecture. In: Congresso Brasileiro de Engenharia
Biomdica, Salvador - BA. Anais do XXI Congresso Brasileiro de Engenharia Biomdica
CBEB. 2008.

MED, Bohumil. Teoria da Msica. 4. ed. Braslia, DF; Musimed, 1996.

MIREX HOME. Music Information Retrieval Evaluation eXchange (MIREX). Disponvel


em: <http://www.music-ir.org/mirex/wiki/MIREX_HOME>. Acesso em: 10 jun. 2010.

MOFFAT, A. Implementing the PPM data compression scheme. In: IEEE Transactions on
Communications, 38(11), p. 19171921. 1990.

MOORE, A.W.; LEE, M.S. Efficient algorithms for minimizing cross validation error. In:
Proceedings 11th International Conference on Machine Learning, p. 190-198, New
Brunswick, New Jersy. Morgan Kaufmann. 1994.

MORIN, E. Os sete saberes necessrios educao do futuro. Traduo de Catarina


Eleonora F. da Silva e Jeanne Sawaya. 2. ed. So Paulo: UNESCO/Cortez Editora, 2000.

PEARCE, Marcus; WIGGINS, Geraint. An empirical comparison of the performance of


PPM variants on a prediction task with with monophonic music. In: Artificial Intelligence
and Creativity in Arts and Science Symposium, AISB. 2003.

POZZOLI, Ettore. Guia Terico-Prtico para o ensino do ditado musical I e II Partes.


So Paulo, SP, Brasil. Ricordi Brasileira S/A, 1983.

SALOMON, David; MOTTA, Giovanni. Handbook of Data Compression. 5. ed. Springer,


2009.

SANDYS, William; ANDREW, Simon. History of the Violin. Dover Publications, 2006.
77

SHANNON, C.E. A Mathematical Theory of Communication. In: The Bell System


Technical Journal, Vol. 27, p. 379423, 623656, Julho, Outubro. 1948.

SHMULEVICH, Ilya; POVEL, DickJan. Rhythm Complexity Measures for Music


Pattern Recognition. In: IEEE Second Workshop on Multimedia Signal Processing, p. 167-
172. 1998.

SHMULEVICH, Ilya; YLI-HARJA, Olli; COYLE, Edward; POVEL, Dirk-Jan;


LEMSTRM, Kjell. Perceptual Issues in Music Pattern Recognition: Complexity of
Rhythm and Key Finding. In: Computers and the Humanities, 35, p. 2335. Springer. 2001.

SILVA, Daniela Regina da. Psicologia da Educao e Aprendizagem. Indaial: Ed.


ASSELVI, 2007.

SILVA, Francisco Manuel da. Hino Nacional Brasileiro. Acervo Digital da Fundao
Biblioteca Nacional do Brasil, 1953. Disponvel em:
<http://objdigital.bn.br/acervo_digital/div_musica/mas198391/mas198391.pdf >. Acesso em:
10 nov. 2011.

STRADIVARIUS VIOLIN. Stradivarius violin sold for 9.8m at charity auction. BBC
News Entertainment & Arts, 2011. Disponvel em:
<http://www.bbc.co.uk/news/entertainment-arts-13852872>. Acesso em: 21 jun. 2011.

SUYOTO, Iman S. H.; UITDENBOGERD, Alexandra L.; SCHOLER, Falk. Effective


Retrieval of Polyphonic Audio with Polyphonic Symbolic Queries. In: Proceedings of
Multimedia Information Retrieval, p. 105-114. MIR. 2007.

TIGHE, Thomas J.; DOWLING, W. Jay. Psychology and music: The understanding of
melody and rhythm. Lawrence Erlbaum Associates, Publishers. New Jersey: Hillsdale, 1993.

WITTEN, I. H.; NEAL, R. M.; CLEARY, J. G. Arithmetic Coding for Data Compression.
In: Journal of the ACM, v. 30, n. 6. 1987
78
79

APNDICE A Aplicao do PPM para


preparao de um modelo
Exemplo de aplicao do PPM com ordem 3 utilizando o alfabeto A:{A, B, C, D, R} e
criando o modelo a partir da entrada "ABRACADABRA"

Ordem 3 Ordem 2 Ordem 1 Ordem 0 Ordem -1

A
B
C
D
R

Entrada: ABRACADABRA
Contexto: - - -

Ordem 3 Ordem 2 Ordem 1 Ordem 0 Ordem -1

A1 B
esc 1 C
D
R

Entrada: ABRACADABRA
Contexto: - - A

Ordem 3 Ordem 2 Ordem 1 Ordem 0 Ordem -1

AB1 A1 C
esc 1 B1 D
esc 2 R

Entrada: ABRACADABRA
Contexto: - A B

Ordem 3 Ordem 2 Ordem 1 Ordem 0 Ordem -1

AB R 1 AB1 A1 C
esc 1 esc 1 B1 D
BR1 R1
esc1 esc3

Entrada: ABRACADABRA
Contexto: A B R
80

Ordem 3 Ordem 2 Ordem 1 Ordem 0 Ordem -1

ABR A 1 AB R 1 AB1 A2 C
esc 1 esc1 esc 1 B1 D
BR A 1 BR1 R1
esc 1 esc 1 esc 3
RA1
esc 1

Entrada: ABRACADABRA
Contexto: B R A

Ordem 3 Ordem 2 Ordem 1 Ordem 0 Ordem -1

ABR A 1 AB R 1 AB1 A2 D
esc 1 esc 1 AC1 B1
BRA C 1 BR A 1 esc 2 C1
esc 1 esc 1 BR1 R1
RA C 1 esc 1 esc 4
esc 1 RA1
esc 1

Entrada: ABRACADABRA
Contexto: R A C

Ordem 3 Ordem 2 Ordem 1 Ordem 0 Ordem -1

ABR A 1 AB R 1 AB1 A3 D
esc 1 esc 1 AC1 B1
BRA C 1 AC A 1 esc 2 C1
esc 1 esc 1 BR1 R1
RAC A 1 BR A 1 esc 1 esc 4
esc 1 esc 1 CA1
RA C 1 esc 1
esc 1 RA1
esc 1

Entrada: ABRACADABRA
Contexto: A C A

Ordem 3 Ordem 2 Ordem 1 Ordem 0 Ordem -1

ABR A 1 AB R 1 AB1 A3
esc 1 esc 1 AC1 B1
ACA D 1 AC A 1 AD1 C1
esc 1 esc 1 esc 3 D1
BRA C 1 BR A 1 BR2 R1
esc 1 esc 1 esc 1 esc 5
RAC A 1 CA D 1 CA1
esc 1 esc 1 esc 1
RA C 1 RA1
esc 1 esc 1

Entrada: ABRACADABRA
Contexto: C A D
81

Ordem 3 Ordem 2 Ordem 1 Ordem 0 Ordem -1

ABR A 1 AB R 1 AB1 A4
esc 1 esc 1 AC1 B1
ACA D 1 AC A 1 AD1 C1
esc 1 esc 1 esc 3 D1
BRA C 1 AD A 1 BR1 R1
esc 1 esc 1 esc 1 esc 5
CAD A 1 BR A 1 CA1
esc 1 esc 1 esc 1
RAC A 1 CA D 1 DA1
esc 1 esc 1 esc 1
RA C 1 RA1
esc 1 esc 1

Entrada: ABRACADABRA
Contexto: A D A

Ordem 3 Ordem 2 Ordem 1 Ordem 0 Ordem -1

ABR A 1 AB R 1 AB2 A4
esc 1 esc 1 AC1 B2
ACA D 1 AC A 1 AD1 C1
esc 1 esc 1 esc 3 D1
ADA B 1 AD A 1 BR1 R1
esc 1 esc 1 esc 1 esc 5
BRA C 1 BR A 1 CA1
esc 1 esc 1 esc 1
CAD A 1 CA D 1 DA1
esc 1 esc 1 esc 1
RAC A 1 DA B 1 RA1
esc 1 esc 1 esc 1
RA C 1
esc 1

Entrada: ABRACADABRA
Contexto: D A B

Ordem 3 Ordem 2 Ordem 1 Ordem 0 Ordem -1

ABR A 1 AB R 2 AB2 A4
esc 1 esc 1 AC1 B2
ACA D 1 AC A 1 AD1 C1
esc 1 esc 1 esc 3 D1
ADA B 1 AD A 1 BR2 R2
esc 1 esc 1 esc 1 esc 5
BRA C 1 BR A 1 CA1
esc 1 esc 1 esc 1
CAD A 1 CA D 1 DA1
esc 1 esc 1 esc 1
DAB R 1 DA B 1 RA1
esc 1 esc 1 esc 1
RAC A 1 RA C 1
esc 1 esc 1

Entrada: ABRACADABRA
Contexto: A B R
82

Ordem 3 Ordem 2 Ordem 1 Ordem 0 Ordem -1

ABR A 2 AB R 2 AB2 A5
esc 1 esc 1 AC1 B2
ACA D 1 AC A 1 AD1 C1
esc 1 esc 1 esc 3 D1
ADA B 1 AD A 1 BR2 R2
esc 1 esc 1 esc 1 esc 5
BRA C 1 BR A 2 CA1
esc 1 esc 1 esc 1
CAD A 1 CA D 1 DA1
esc 1 esc 1 esc 1
DAB R 1 DA B 1 RA2
esc 1 esc 1 esc 1
RAC A 1 RA C 1
esc 1 esc 1

Tabela resultante com as probabilidades de ocorrncia de cada smbolo:

Ordem 3 Ordem 2 Ordem 1 Ordem 0


ABR A 2/3 AB R 2/3 A B 2/7 A 5/16
esc 1/3 esc 1/3 A C 1/7 B 2/16
ACA D 1/2 AC A 1/2 A D 1/7 C 1/16
esc 1/2 esc 1/2 esc 3/7 D 1/16
ADA B 1/2 AD A 1/2 B R 2/3 R 2/16
esc 1/2 esc 1/2 esc 1/3 esc 5/16
BRA C 1/2 BR A 2/3 C A 1/2
esc 1/2 esc 1/3 esc 1/2
CAD A 1/2 CA D 1/2 D A 1/2
esc 1/2 esc 1/2 esc 1/2
DAB R 1/2 DA B 1/2 R A 2/3
esc 1/2 esc 1/2 esc 1/3
RAC A 1/2 RA C 1/2
esc 1/2 esc 1/2
83

APNDICE B Compresso de entrada


utilizando um modelo com PPM
Utilizao da tabela de probabilidades criada a partir de "ABRACADABRA" para comprimir a entrada
"DACAR"

Tabela base:
Ordem 3 Ordem 2 Ordem 1 Ordem 0
ABR A 2/3 AB R 2/3 A B 2/7 A 5/16
esc 1/3 esc 1/3 A C 1/7 B 2/16
ACA D 1/2 AC A 1/2 A D 1/7 C 1/16
esc 1/2 esc 1/2 esc 3/7 D 1/16
ADA B 1/2 AD A 1/2 B R 2/3 R 2/16
esc 1/2 esc 1/2 esc 1/3 esc 5/16
BRA C 1/2 BR A 2/3 C A 1/2
esc 1/2 esc 1/3 esc 1/2
CAD A 1/2 CA D 1/2 D A 1/2
esc 1/2 esc 1/2 esc 1/2
DAB R 1/2 DA B 1/2 R A 2/3
esc 1/2 esc 1/2 esc 1/3
RAC A 1/2 RA C 1/2
esc 1/2 esc 1/2

Entrada: DACAR
Contexto: - - -
Sada: -log2(1/16)

Tabela atualizada:
Ordem 3 Ordem 2 Ordem 1 Ordem 0
ABR A 2/3 AB R 2/3 A B 2/7 A 5/17
esc 1/3 esc 1/3 A C 1/7 B 2/17
ACA D 1/2 AC A 1/2 A D 1/7 C 1/17
esc 1/2 esc 1/2 esc 3/7 D 2/17
ADA B 1/2 AD A 1/2 B R 2/3 R 2/17
esc 1/2 esc 1/2 esc 1/3 esc 5/17
BRA C 1/2 BR A 2/3 C A 1/2
esc 1/2 esc 1/3 esc 1/2
CAD A 1/2 CA D 1/2 D A 1/2
esc 1/2 esc 1/2 esc 1/2
DAB R 1/2 DA B 1/2 R A 2/3
esc 1/2 esc 1/2 esc 1/3
RAC A 1/2 RA C 1/2
esc 1/2 esc 1/2

Entrada: DACAR
Contexto: - - D
Sada: -log2(1/2)
84
Tabela atualizada:
Ordem 3 Ordem 2 Ordem 1 Ordem 0
ABR A 2/3 AB R 2/3 A B 2/7 A 5/17
esc 1/3 esc 1/3 A C 1/7 B 2/17
ACA D 1/2 AC A 1/2 A D 1/7 C 1/17
esc 1/2 esc 1/2 esc 3/7 D 2/17
ADA B 1/2 AD A 1/2 B R 2/3 R 2/17
esc 1/2 esc 1/2 esc 1/3 esc 5/17
BRA C 1/2 BR A 2/3 C A 1/2
esc 1/2 esc 1/3 esc 1/2
CAD A 1/2 CA D 1/2 D A 2/3
esc 1/2 esc 1/2 esc 1/3
DAB R 1/2 DA B 1/2 R A 2/3
esc 1/2 esc 1/2 esc 1/3
RAC A 1/2 RA C 1/2
esc 1/2 esc 1/2

Entrada: DACAR
Contexto: - D A
Sada: -log2(1/2) -log2(1/7)

Tabela atualizada:
Ordem 3 Ordem 2 Ordem 1 Ordem 0
ABR A 2/3 AB R 2/3 A B 2/8 A 5/17
esc 1/3 esc 1/3 A C 2/8 B 2/17
ACA D 1/2 AC A 1/2 A D 1/8 C 1/17
esc 1/2 esc 1/2 esc 3/8 D 2/17
ADA B 1/2 AD A 1/2 B R 2/3 R 2/17
esc 1/2 esc 1/2 esc 1/3 esc 5/17
BRA C 1/2 BR A 2/3 C A 1/2
esc 1/2 esc 1/3 esc 1/2
CAD A 1/2 CA D 1/2 D A 2/3
esc 1/2 esc 1/2 esc 1/3
DAB R 1/2 DA B 1/4 R A 2/3
esc 1/2 DA C 1/4 esc 1/3
RAC A 1/2 esc 2/4
esc 1/2 RA C 1/2
esc 1/2

Entrada: DACAR
Contexto: D A C
Sada: -log2(1/2)
85
Tabela atualizada:
Ordem 3 Ordem 2 Ordem 1 Ordem 0
ABR A 2/3 AB R 2/3 A B 2/8 A 5/17
esc 1/3 esc 1/3 A C 2/8 B 2/17
ACA D 1/2 AC A 2/3 A D 1/8 C 1/17
esc 1/2 esc 1/3 esc 3/8 D 2/17
ADA B 1/2 AD A 1/2 B R 2/3 R 2/17
esc 1/2 esc 1/2 esc 1/3 esc 5/17
BRA C 1/2 BR A 2/3 C A 1/2
esc 1/2 esc 1/3 esc 1/2
CAD A 1/2 CA D 1/2 D A 2/3
esc 1/2 esc 1/2 esc 1/3
DAB R 1/2 DA B 1/4 R A 2/3
esc 1/2 DA C 1/4 esc 1/3
DAC A 1/2 esc 2/4
esc 1/2 RA C 1/2
RAC A 1/2 esc 1/2
esc 1/2

Entrada: DACAR
Contexto: A C A
Sada: -log2(1/2)

Tabela atualizada:
Ordem 3 Ordem 2 Ordem 1 Ordem 0
ABR A 2/3 AB R 2/3 A B 2/8 A 5/17
esc 1/3 esc 1/3 A C 2/8 B 2/17
ACA D 2/3 AC A 2/3 A D 1/8 C 1/17
esc 1/3 esc 1/3 esc 3/8 D 2/17
ADA B 1/2 AD A 1/2 B R 2/3 R 2/17
esc 1/2 esc 1/2 esc 1/3 esc 5/17
BRA C 1/2 BR A 2/3 C A 1/2
esc 1/2 esc 1/3 esc 1/2
CAD A 1/2 CA D 1/2 D A 2/3
esc 1/2 esc 1/2 esc 1/3
DAB R 1/2 DA B 1/4 R A 2/3
esc 1/2 DA C 1/4 esc 1/3
DAC A 1/2 esc 2/4
esc 1/2 RA C 1/2
RAC A 1/2 esc 1/2
esc 1/2

Sadas:
[-log2(1/16)] + [-log2(1/2) ] + [-log2(1/2)] + [-log2(1/7)] + [-log2(1/2)] + [-log2(1/2)] =
4 + 1 + 1 + 2,807 + 1 + 1 =
10,807 bits
86
Utilizao da tabela de probabilidades criada a partir de "ABRACADABRA" para comprimir a entrada
"ABBAD"

Tabela base:
Ordem 3 Ordem 2 Ordem 1 Ordem 0
ABR A 2/3 AB R 2/3 A B 2/7 A 5/16
esc 1/3 esc 1/3 A C 1/7 B 2/16
ACA D 1/2 AC A 1/2 A D 1/7 C 1/16
esc 1/2 esc 1/2 esc 3/7 D 1/16
ADA B 1/2 AD A 1/2 B R 2/3 R 2/16
esc 1/2 esc 1/2 esc 1/3 esc 5/16
BRA C 1/2 BR A 2/3 C A 1/2
esc 1/2 esc 1/3 esc 1/2
CAD A 1/2 CA D 1/2 D A 1/2
esc 1/2 esc 1/2 esc 1/2
DAB R 1/2 DA B 1/2 R A 2/3
esc 1/2 esc 1/2 esc 1/3
RAC A 1/2 RA C 1/2
esc 1/2 esc 1/2

Entrada: ABBAD
Contexto: - - -
Sada: -log2(5/16)

Tabela atualizada:
Ordem 3 Ordem 2 Ordem 1 Ordem 0
ABR A 2/3 AB R 2/3 A B 2/7 A 6/17
esc 1/3 esc 1/3 A C 1/7 B 2/17
ACA D 1/2 AC A 1/2 A D 1/7 C 1/17
esc 1/2 esc 1/2 esc 3/7 D 1/17
ADA B 1/2 AD A 1/2 B R 2/3 R 2/17
esc 1/2 esc 1/2 esc 1/3 esc 5/17
BRA C 1/2 BR A 2/3 C A 1/2
esc 1/2 esc 1/3 esc 1/2
CAD A 1/2 CA D 1/2 D A 1/2
esc 1/2 esc 1/2 esc 1/2
DAB R 1/2 DA B 1/2 R A 2/3
esc 1/2 esc 1/2 esc 1/3
RAC A 1/2 RA C 1/2
esc 1/2 esc 1/2

Entrada: ABBAD
Contexto: - - A
Sada: -log2(2/7)
87
Tabela atualizada:
Ordem 3 Ordem 2 Ordem 1 Ordem 0
ABR A 2/3 AB R 2/3 A B 3/8 A 6/17
esc 1/3 esc 1/3 A C 1/8 B 2/17
ACA D 1/2 AC A 1/2 A D 1/8 C 1/17
esc 1/2 esc 1/2 esc 3/8 D 1/17
ADA B 1/2 AD A 1/2 B R 2/3 R 2/17
esc 1/2 esc 1/2 esc 1/3 esc 5/17
BRA C 1/2 BR A 2/3 C A 1/2
esc 1/2 esc 1/3 esc 1/2
CAD A 1/2 CA D 1/2 D A 1/2
esc 1/2 esc 1/2 esc 1/2
DAB R 1/2 DA B 1/2 R A 2/3
esc 1/2 esc 1/2 esc 1/3
RAC A 1/2 RA C 1/2
esc 1/2 esc 1/2

Entrada: ABBAD
Contexto: - A B
Sada: -log2(1/3) - log2(1/3) - log2(2/17)

Tabela atualizada:
Ordem 3 Ordem 2 Ordem 1 Ordem 0
ABR A 2/3 AB R 2/4 A B 3/8 A 6/18
esc 1/3 AB B 1/4 A C 1/8 B 3/18
ACA D 1/2 esc 2/4 A D 1/8 C 1/18
esc 1/2 AC A 1/2 esc 3/8 D 1/18
ADA B 1/2 esc 1/2 B B 1/5 R 2/18
esc 1/2 AD A 1/2 B R 2/5 esc 5/18
BRA C 1/2 esc 1/2 esc 2/5
esc 1/2 BR A 2/3 C A 1/2
CAD A 1/2 esc 1/3 esc 1/2
esc 1/2 CA D 1/2 D A 1/2
DAB R 1/2 esc 1/2 esc 1/2
esc 1/2 DA B 1/2 R A 2/3
RAC A 1/2 esc 1/2 esc 1/3
esc 1/2 RA C 1/2
esc 1/2

Entrada: ABBAD
Contexto: A B B
Sada: - log2(6/18)
88
Tabela atualizada:
Ordem 3 Ordem 2 Ordem 1 Ordem 0
ABB A 1/2 AB R 2/4 A B 3/8 A 6/19
esc 1/2 AB B 1/4 A C 1/8 B 3/19
ABR A 2/3 esc 2/4 A D 1/8 C 1/19
esc 1/3 AC A 1/2 esc 3/8 D 1/19
ACA D 1/2 esc 1/2 B A 1/7 R 2/19
esc 1/2 AD A 1/2 B B 1/7 esc 5/19
ADA B 1/2 esc 1/2 B R 2/7
esc 1/2 BB A 1/2 esc 3/7
BRA C 1/2 esc 1/2 C A 1/2
esc 1/2 BR A 2/3 esc 1/2
CAD A 1/2 esc 1/3 D A 1/2
esc 1/2 CA D 1/2 esc 1/2
DAB R 1/2 esc 1/2 R A 2/3
esc 1/2 DA B 1/2 esc 1/3
RAC A 1/2 esc 1/2
esc 1/2 RA C 1/2
esc 1/2

Entrada: ABBAD
Contexto: B B A
Sada: - log2(1/8)

Tabela atualizada:
Ordem 3 Ordem 2 Ordem 1 Ordem 0
ABB A 1/2 AB R 2/4 A B 3/9 A 6/19
esc 1/2 AB B 1/4 A C 1/9 B 3/19
ABR A 2/3 esc 2/4 A D 2/9 C 1/19
esc 1/3 AC A 1/2 esc 3/9 D 1/19
ACA D 1/2 esc 1/2 B A 1/7 R 2/19
esc 1/2 AD A 1/2 B B 1/7 esc 5/19
ADA B 1/2 esc 1/2 B R 2/7
esc 1/2 BA D 1/2 esc 3/7
BBA D 1/2 esc 1/2 C A 1/2
esc 1/2 BB A 1/2 esc 1/2
BRA C 1/2 esc 1/2 D A 1/2
esc 1/2 BR A 2/3 esc 1/2
CAD A 1/2 esc 1/3 R A 2/3
esc 1/2 CA D 1/2 esc 1/3
DAB R 1/2 esc 1/2
esc 1/2 DA B 1/2
RAC A 1/2 esc 1/2
esc 1/2 RA C 1/2
esc 1/2

Sadas:
[-log2(5/6)] + [-log2(2/7)] + [-log2(1/3)-log2(1/3)-log2(2/17)] + [-log2(6/18)] + [-log2(1/8) ] =
0,263 + 1,807 + 6,257 + 1,584 + 3 =
12,911 bits
89

APNDICE C Lista de obras utilizadas


Obras de Violino Solo

Obras de Albinoni:
Op. 4 No. 1 Sonata da Chiesa
Op. 4 No. 2 Sonata da Chiesa
Op. 4 No. 4 Sonata da Chiesa
Op. 4 No. 5 Sonata da Chiesa
Op. 4 No. 6 Sonata da Chiesa
Op. 6 Sonata I
Op. 6 Sonata II
Op. 6 Sonata III
Op. 6 Sonata IV
Op. 6 Sonata V

Obras de Bach:
BWV 1001 -Sonata No. 1 in G minor (1 mov. - Adagio)
BWV 1001 -Sonata No. 1 in G minor (2 mov. - Fugue)
BWV 1001 -Sonata No. 1 in G minor (4 mov. - Presto)
BWV 1002 -Partita No. 1 in B minor (1 mov. - Allemanda)
BWV 1002 -Partita No. 1 in B minor (2 mov. - Double)
BWV 1003 -Sonata No. 2 in A minor (1 mov. - Grave)
BWV 1003 -Sonata No. 2 in A minor (2 mov. - Fugue)
BWV 1004 -Partita No. 2 in D minor (1 mov. - Allemande)
BWV 1004 -Partita No. 2 in D minor (2 mov. - Courante)
BWV 1005 -Sonata No. 3 in C major (2 mov. - Fugue)

Obras de Beethoven:
Op. 12 No. 1 Sonata in D major for violin and piano (1 mov. - Allegro con brio)
Op. 12 No. 1 Sonata in D major for violin and piano (2 mov. - Tema con variazione - Andante con molto)
Op. 12 No. 1 Sonata in D major for violin and piano (3 mov. - Rondo - Allegro)
Op. 12 No. 2 Sonata in A major for violin and piano (1 mov. - Allegro vivace)
Op. 12 No. 2 Sonata in A major for violin and piano (2 mov. - Andante, piu tosto allegretto)
Op. 12 No. 2 Sonata in A major for violin and piano (3 mov. - Allegro piacevole)
Op. 12 No. 3 Sonata in E flat major for violin and piano (1 mov. - Allegro con spirito)
Op. 12 No. 3 Sonata in E flat major for violin and piano (2 mov. - Adagio con molta espressione)
Op. 12 No. 3 Sonata in E flat major for violin and piano (3 mov. - Rondo - Allegro molto)
Op. 23 Sonata in A minor for violin and piano (1 mov. - Presto)

Obras de Brahms:
Op. 100 No. 2 Sonata for Violin and Piano in A (1 mov. - Allegro amabile)
Op. 100 No. 2 Sonata for Violin and Piano in A (2 mov. - Andante tranquilo - Vivace - Andante - Vivace di piu -
Andante vivace)
Op. 100 No. 2 Sonata for Violin and Piano in A (3 mov. - Allegretto grazioso - Quasi andante)
Op. 108 No. 3 Sonata for Violin and Piano in D minor (1 mov. - Allegro)
Op. 108 No. 3 Sonata for Violin and Piano in D minor (2 mov. - Adagio)
Op. 108 No. 3 Sonata for Violin and Piano in D minor (3 mov. - Un poco presto e con sentimento)
Op. 108 No. 3 Sonata for Violin and Piano in D minor (4 mov. - presto agitato)
Op. 78 No. 1 In G Sonata for Violin and Piano (1 mov. - Vivace ma non troppo)
Op. 78 No. 1 In G Sonata for Violin and Piano (2 mov. - Adagio)
Op. 78 No. 1 In G Sonata for Violin and Piano (3 mov. - Allegro molto moderato)
90
Obras de Mozart:
KV 211 (IV 1775) Violin Concerto No. 2 in D major (1 mov. - Moderato assai)
KV 211 (IV 1775) Violin Concerto No. 2 in D major (2 mov. - Andante)
KV 211 (IV 1775) Violin Concerto No. 2 in D major (3 mov. - Rondo Allegro)
KV 216 (IX 1775) Violin Concerto No. 3 in G major (1 mov. - Allegro)
KV 216 (IX 1775) Violin Concerto No. 3 in G major (2 mov. - Andante)
KV 216 (IX 1775) Violin Concerto No. 3 in G major (3 mov. - Rondeau Allegro)
KV 218 (X 1775) Violin Concerto No. 4 in D major (1 mov. - Allegro)
KV 218 (X 1775) Violin Concerto No. 4 in D major (2 - Andante cantabile)
KV 218 (X 1775) Violin Concerto No. 4 in D major (3 mov. - Rondeau)
KV 219 (XII 1775) Violin Concerto No. 5 in A major (1 mov. - Allegro)

Todos os arquivos foram retirados dos sites:

http://www.kunstderfuge.com/ (principal site)


http://www.jsbach.net/midi/midi_solo_violin.html (Obras de Bach)
http://www.classical.net/
http://www.classicalarchives.com/
http://www.classicalmidiconnection.com/
http://www.midinet.com.br/
http://www.midiworld.com/
http://www.musedata.org/

As obras do banco de dados ESAC-DATA (2010) podem ser encontradas no prprio site ou
atravs do endereo:
http://www.ldc.usb.ve/~cgomez/essen.tar.gz

Os arquivos utilizados neste trabalho, o cdigo fonte e outras informaes sobre o projeto
podem ser encontradas no endereo:
http://deusanyjunior.dj/projetos/mestrado