Você está na página 1de 5

ESTUDO HEURISTICO DA CLASSIFICACO AUTOMTICA DE UDIO

DIGITAL

Alvaro B. M. Pereira
Universidade Federal de Goias. Escola de Engenharia Eletrica e de Computaco. Goinia GO. abmp89(gmail.com

Andre Campos Rodovalho
Universidade Federal de Goias. Escola de Engenharia Eletrica e de Computaco. Goinia GO. ande.rodovalho(gmail.com

Karina Rocha Gomes da Silva
Universidade Federal de Goias. Escola de Engenharia Eletrica e de Computaco. Goinia GO. karinarg(eee.uIg.br


Resumo - A msica interage e influencia o ser humano
de diversas formas. Algumas vezes ela pode mesmo at
influenciar no humor das pessoas. Uma classificaco de
estilo musical para definir as msicas a serem ouvidas de
acordo com o gosto musical e humor de cada indivduo
pode ser uma aplicaco riqussima. Neste trabalho
proposta uma classificaco de msicas em que seja
possvel organizar o udio em nveis de agitaco. tal como
msica calma. agitada e intermediria. Para realizar esse
intento. necessrio organizar a biblioteca de msicas
com um parmetro classificador.

Palavras-Chave - Entradas de udio. Mtodos
estatsticos. Classificaco de mdias. Automaco.

HEURISTIC STUDY OF AUTOMATIC
CLASSIFICATION OF DIGITAL AUDIO

Abstract - The music interacts with the people and
makes some influences in various ways. Sometimes it can
even change the mood of the people. A classification of
musical style to set the songs to be heard according to
musical taste and mood of each individual can be a rich
application. In this paper we propose a classification of
music taking in account the audio levels agitation. such as
music calm. agitated. and intermediate. To achieve this
purpose. it is necessary to organize the music library with
a parameter classifier.

evwords - Audio input. Statistical methods. Record
classification. Automation.
.%RODUCO
A musica interage com o ser humano de Iorma a
enriquecer a sua vida. ndependente de idade. a musica
interage com o corpo humano de Iorma a causar bem estar e
relaxamento no corpo humano. Algumas vezes a musica e




usada com Iins teraputicos. e o caso da musicoterapia. A
musica e conhecida como meio teraputico desde a
antiguidade. Papiros egipcios datados de cerca de a.C.
atribuiam a musica inIluncia teraputica. Durante a Segunda
Guerra Mundial houve um inicio eIetivo da utilizaco
cientiIica da musica. dando origem a Musicoterapia |4|.
O ser humano tem diIerentes gostos musicais. que podem
variar de acordo com o horario do dia. o ambiente em que se
encontra e ate mesmo de acordo com o seu humor. Um
aplicativo que pudesse classiIicar as musicas usando um
padro poderia Iacilitar bastante no momento de escolha de
qual musica ouvir em determinado momento. Um padro
para classiIicaco poderia ser deIini-las de acordo com o
nivel de agitaco.
Existem algumas pesquisas relacionadas a
classiIicaco de audio digital. porem a maioria delas enIoca a
classiIicaco quanto ao gnero musical. como e o caso do
trabalho citado em |2|. em que Ioram obtidos os dados de
resultados do processamento de ondas sonoras atraves do
soItware livre MARSYAS. E a saida do algoritmo deste
trabalho seria por exemplo: samba. rock. soul. e etc. Esse no
e o obietivo do trabalho aqui introduzido. esperamos
classiIicar o audio em: calmo. medio e agitado.
O nstituto alemo FraunhoIer desenvolveu um
sistema com classiIicaco bem mais Ilexivel do que os
plavers comuns. o Mood Player ||. Um tocador que usa o
humor do usuario para determinar o que ele quer ouvir ou
no. o entanto. esse trabalho e diIerente do que estamos
propondo. pois no deseiamos escolher pelo usuario. e sim
dar opces alternativas ao usuario para tocar por exemplo
apenas as musicas calmas de seu acervo de midia digital.
O trabalho sendo apresentado tem por obietivo
desenvolver uma tecnica eIiciente para classiIicaco de audio
digital. A motivaco maior e obter base suIiciente para
criaco de um tocador de audio (no o tocador em si) capaz
de organizar a biblioteca de midia tambem em niveis de
agitaco. proporcionando a opco de tocar musicas agitadas.
calmas ou medianas. de acordo com a preIerncia
momentnea.
O restante desse trabalho e organizado da seguinte Iorma:
Seco apresenta os padres para a classiIicaco de
musicas; na seco so apresentados os resultados e a
classiIicaco das musicas e na seco ' so apresentadas as
concluses.
.PADRES PARA CLASSFCACO DE MUSCAS
Encontrar uma alternativa para a classiIicaco de musicas
e uma tareIa complexa. E necessario estabelecer algum
parmetro que possa levar a uma comparaco equiparada. A
metodologia aplicada para o estudo utilizado nesse trabalho e
puramente heuristica e estatistica. O algoritmo desenvolvido
contabiliza os impulsos sonoros divididos em cinco Iaixas de
intensidade (amplitude da onda). e sero explanados
detalhadamente adiante.
Alem disso. e necessario estabelecer um Iormato para
utilizar na classiIicaco. Uma alternativa para a classiIicaco
de arquivos de midia e atraves do uso do Iormato MP3.
porem em pesquisa previa. constatamos que classiIicar este
tipo de arquivo seria mais dispendioso. aIinal estes so
compactados. e para acessar sua Iorma de onda e necessario
Iazer o processo contrario da compactaco atraves de
soItwares ou bibliotecas especiIicos. o que no e trivial.
Portanto. o padro de Iormatos adotado Ioi o WA'
(originario da palavra em ingls 'wave. que signiIica onda).
esse Iormato o som e digitalizado a partir do seu Iormato
analogico. que lembra o Iormato de uma onda. O Iormato
WA' contem audio em Iorma de modulaco de pulsos PCM
(pulse-code modulation). O PCM usa um metodo de
armazenamento de audio no-comprimido (sem perda).
Usuarios proIissionais podem usar o Iormato WA' para
qualidade maxima de audio. Audio WA' pode ser editado e
manipulado com relativa Iacilidade usando soItwares.
Para utilizar o Iormato WA' Ioi necessario o uso de uma
Ierramenta adequada para testes em processamento de sinais.
que pudesse importar tais arquivos WA'. Dessa Iorma. a
Ierramenta utilizada para o processamento dos sinais Ioi o
MA%LAB ||.
A proxima seco mostra os graIicos que correspondem
aos trechos analisados em relaco a 'ntensidade. ou seia.
valor de um pulso sonoro e ao 'tempo que se reIere ao
tempo de musica correspondente no trecho em analise.
3Elise visual da forma de o3da

As musicas estudadas nesse trabalho Ioram classiIicadas
em calmas. agitadas e medianas. Essa classiIicaco Ioi
realizada de acordo com o toque e melodia apresentados por
cada uma delas. Foram reunidas aproximadamente 3 midias
dentre elas musicas calmas. agitadas e medianas.
O primeiro passo para o desenvolvimento desse trabalho
Ioi a visualizaco da Iorma de onda de uma amostra de
musicas. escolhidas com caracteristicas marcantes do estilo a
que pertenciam (calmas. agitadas ou medianas). para que no
houvesse duvida quanto a sua classiIicaco. %odas as
musicas passaram por um algoritmo para plotagem de
graIicos. e tiveram suas Iormas de onda guardadas para
analise visual.
a Fig. e apresentada a Iorma de onda de uma
musica calma (%ears n Heaven de Eric Clapton). E possivel
veriIicar nessa Iigura que a intensidade da amplitude das
ondas Iica centralizada no graIico.



Fig. : Forma de onda de uma musica calma. %ears n Heaven de
Eric Clapton.
As musicas agitadas possuem maior numero de
amplitudes altas. o que Iaz com que o graIico Iique bastante
preenchido. em alguns casos. esta visualizaco com o tempo
em segundos Iica muito preenchida. e quase no e possivel
perceber as oscilaces na onda sonora. Como pode ser visto
na Fig. 2.
Comparando a Iorma de onda de uma midia calma com a
Iorma de onda de uma midia agitada. pode-se observar a
grande diIerenca entre a amplitude de ambas as midias.

Fig. 2. Forma de onda de uma musica agitada. Wait da banda
Earshot.
Por este motivo. para analise visual mais precisa e
interessante que se veia a Iorma de onda com uma
ampliaco. A Fig. 3 mostra a ampliaco de intervalos da
musica apresentada na Figura 2. A Fig. 4 mostra a ampliaco
de um trecho da musica apresentada na Fig..

Fig. 3: Ampliaco de musica agitada. Wait da banda Earshot.
Atraves da Iorma de onda ampliada. percebe-se que as
ondas sonoras ainda tm amplitudes muito proximas de ou
-. que so as intensidades maxima e minima
respectivamente.

Fig. 4: Ampliaco de musica calma. %ears n Heaven de Eric
Clapton.
Muito diIerente da ampliaco da musica calma (vide Fig.
4). onde as amplitudes esto em sua maioria proximas a Iaixa
de -.2 a .2.
As musicas medianas portanto. possuem amplitudes
intermediarias as amplitudes de musicas agitadas e calmas.
como e possivel concluir vendo a Fig. .

Fig. : Ampliaco de uma musica mediana. A Sua Maneira da
banda Capital nicial.
.CLASSFCACO E RESUL%ADOS
Apos a concluso de que e possivel distinguir uma musica
rapida de uma calma. e conseqentemente as medianas. a
partir da quantidade de amplitudes das ondas. Ioi necessario
plotar mais alguns graIicos. para so ento estipular um
intervalo otimo para analise e classiIicaco.

Fig. 6: Estatistica de uma musica calma. %ears n Heaven de Eric
Clap-ton.
Como era suposto. a grande maioria dos pulsos esto perto
da intensidade (vide Fig. 6).

Fig. 7: Estatistica de uma musica agitada. Wait da banda Earshot.
Fica evidente visualizando os graIicos. que nas musicas
calmas. a quantidade de pulsos no intervalo de -.2 a .2 e
enorme. enquanto nas agitadas ha certo equilibrio
(comparaco entre Fig. 6 e Fig. 7).

Fig. 8: Forma de onda de uma musica mediana. A Sua Maneira da
banda Capital nicial.
Mais uma vez o graIico relativo a uma musica mediana
Iica no meio termo entre uma musica agitada e uma calma
(vide Fig. 8).
3Elise Estatistica

Apesar de o graIico nos oIerecer numeros relativamente
conIiaveis. em relaco a Iaixa de Ireqncia em que as
intensidades aparecem. no e garantido que com a variaco
de tempo total da musica estes numeros se mantero.
Por isso o algoritmo classiIicador no analisa o nivel de
intensidade tendo como parmetro a Irequncia puramente
dita. Somando as intesidades de dada Iaixa pre-deIinida. e
dividindo o valor obtido pela quantidade total de pulsos de
um audio. obtemos a Ireqncia relativa da ocorrncia de
valores de tal Iaixa neste audio. Segue que:



F
r
Frequncia relativa de uma Iaixa.
i ntensidade compreendida na Iaixa.
%
i
%otal de intensidades de um audio.

a lista abaixo so deIinidos as cinco Iaixas de
intensidades. que Ioram assim deIinidas por observaco aos
graIicos de Irequncia.

. 'alores de -.2 a .2
2. 'alores de -.8 a -.2
3. 'alores de .2 a .8
4. 'alores o de - a -.8
. 'alores de .8 a

Para realizar a classiIicaco. soma-se as Irequncias
relativas das Iaixas 2. 3. 4 e e multiplicamos por . a Iim
de obter um parmetro percentual. Denomina-se este
parmetro de P. O valor de Irequncia relativa da Iaixa
multiplicado por nos retorna o segundo parmetro.
denominado P2.

P Parmetro de analise .
F
r
(i) Frequncia relativa da Iaixa i.
i ntervalo de reIerncia. assume: 2. 3. 4 e .



P2 Parmetro de analise 2.
F
r
() Frequncia relativa da Iaixa .

Sendo assim. quando P Ior maior ou igual a P2. o
algoritmo classiIica a midia como agitada. Quando a
percentagem P2 Ior superior a 7. o algoritmo classiIica a
midia como calma. Em ultimo caso. classiIica-se a midia
mediana.
TABELA I
Resultados obtidos em detalhe

a %abela so mostrados os resultados obtidos. O nome
da musica usada esta na coluna chamada Midia. P e P2 so
os parmetros analisados e reIerem-se ao conceito
classiIicatorio dado previamente. ClassiIicado e o resultado
do algoritmo obtido.
Com esta tecnica classiIicou-se quase todas as 3 midias
de acordo com conceito previo. Ficando apenas uma midia
considerada agitada classiIicado como mediana. Esta Ialha
atribuimos ao Iato de a musica em questo possuir um
intervalo mais calmo. e isso contrabalanceou a percentagem
de amplitudes mais altas.
Mdia P1 () P2 () Conceituado Classificado
%ears n Heaven 2 89 Calmo Calmo
A sua Maneira 44 Mediano Mediano
Wait 6 3 Agitado Agitado
Disturbed - Breathe 39 6 Agitado Mediano
3Elise fi3al dos resultados

Mesmo obtendo 96.6 de sucesso com o algoritmo. ainda
se estima que haia muito que melhorar. pois observando a
amostra cuidadosamente. percebemos que no ha musicas
com introduces longas. ou com intervalos de calmaria. o
que certamente aIetaria a perIormance da tecnica.
Conclui-se porem. que modiIicando o algoritmo para
analisar apenas algumas partes limitadas de toda a amostra
de ondas da midia. sera possivel desempenhar a classiIicaco
com muita preciso.
Alem da maior taxa de acerto. com esta modiIicaco no
algoritmo. a quantidade de dados analisada cairia
drasticamente. o que tornaria a soluco muito robusta.
as condices atuais. o algoritmo carrega toda a midia
para a memoria. e trabalha contabilizando vetores enormes.
Estima-se que para uma musica de 2 minutos so
consumidos em todo o processo . Gigabytes de memoria
RAM. taxa muito alta para uso um computador de usuario
popular.
'.COCLUSES
Acertos para um algoritmo aplicavel em aplicativos como
tocadores de midia so necessarios. Com esse estudo e
possivel classiIicar as musicas em trs diIerentes Iormatos
audiveis: calmas. medias e agitadas.
Como este estudo da atenco a simples classiIicaco em
niveis de agitaco. esperamos que os bons resultados obtidos
e grande possibilidade de uso deste resultado anime a
continuidade do trabalho desempenhado. Principalmente pela
possibilidade da interaco entre usuarios e maquina se
estreitarem cada vez mais. Iazendo a tecnologia a cada dia
dar passos mais largos.
Aproveitado esta capacidade. poderiam ser acopladas ao
tocador Iuturo testes que estimem o humor do usuario. para
que no seiam executadas musicas que no esteiam em
completa sintonia com o usuario em dado momento. o
entanto. esta parte sera deixada para trabalhos Iuturos.

REFERCAS BBLOGRAFCAS
|| . % - %e a3uae of %ec3ical
Computi3. Acedido em 3 de Setembro de 29. em:
http://www.mathworks.com/products/matlab/.
|2| SOUZA FLHO. Moacir da Cruz. Classificaco
utomEtica de G3eros de Audio Diital. 26.
(%rabalho de concluso de curso. bacharelado em
Engenharia de computaco) Universidade de
Pernambuco.
|3| Barba. Clarides Henrich de. rie3taces bEsicas 3a
elaboraco do artio cie3tifico. Acedido em 26 de
ovembro de 29. em:
http://www.unir.br/html/pesquisa/Pibic/Elaboracao2d
e2Artigo2CientiIico26.doc.
|4| Morais. Eduardo. musica como terapia. Acedido em
8 de Agosto de 2. em:
http://www.gostodeler.com.br/materia/3/A2mC
3BAsica2como2terapia.html.
|| BOBOLCU. Georgiana. ood Plaver Sets te Proper
tmospere. Acedido em 27 de Setembro de 29. em:
http://gadgets.soItpedia.com/news/Mood-Player-Sets-
the-Proper-Atmosphere-2-.html.