Você está na página 1de 10

Trabalho 3 - ENG1443

Lucas Vital Alves da Silva

Introdução
No experimento a seguir, foi tomado um arquivo de áudio denominado por “Kalimba.wav”. Para o áudio
em questão foi considerado somente um trecho de 6s. Primeiramente em cima desse mesmo trecho de 6s
foi-se realizado uma análise no domínio do tempo e das frequências. Em seguida o trecho de áudio em
questão foi reamostramento gerando-se um novo sinal, e a partir desse novo sinal foi-se realizado uma
análise de tempo e frequência como também em termos de energia. Desta forma, tem-se a seguir os
procedimentos realizados ao longo deste experimento como também as devidas pontuações quando
necessárias.

Processo de Análise:
Através dos seguintes comandos no MATLAB, obteve-se a frequência de amostragem como também o
sinal estéreo do áudio em questão:

Em seguida, por questões de conveniência, faz a conversão do sinal de estéreo para mono, para isso usa-
se a função “mean” do matlab para se obter o sinal desejado:

Com a adição do código:


O mesmo sinal é plotado no gráfico a seguir:

Assim como um trecho de 6s do mesmo:


Afim de se compreender comportamento do sinal plota-se sua magnitude no domínio da frequência por
numa janela de -4000Hz à 4000Hz:

Ao se olhar o sinal no espectro de frequência, fica bem nítido as características do áudio. Nota-se que as
frequência com maior magnitude são aquelas mais próximas do grave, isso se deve justamente porque no
trecho de áudio considerado predomina-se majoritariamente o som de instrumentos graves, tais como os
de percussão e o de um contrabaixo.
Realizando-se um zoom no sinal na faixa de 0 à 120 Hz:

Observa-se um pico nessa faixa de frequência nas proximidades de 70 Hz tal pico deve ser justificado
pelo fato de que, no trecho do áudio considerado tem-se, um som de contrabaixo, que por sua vez tem
frequências típicas nessa faixa como podemos vez na tabela abaixo:

Fonte: 1 https://musicaeadoracao.com.br/25376/tabela-comparativa-das-frequencias/
Prosseguindo, através dos seguintes comandos no MATLABS:
Faz se a reamostragem do sinal em questão à uma nova taxa de amostragem de 8Khz como também a
obtenção de seu espectro de frequências de -4 KHz à 4KHz
Realizando-se a análise tempo-frequência sem superposição de valores por meio do código:

Obtêm-se:

Considerando -se o espectrograma acima fica bem claro como esse sinal se comporta no tempo. Nos
instantes iniciais, aparecem frequências bem graves e pouco espaçadas, que coincide com o som tocado
do contrabaixo nesses instantes, note que as frequência com maior concentração de energia são a das
faixa de 0 à 0.5KHz, que é a faixa de frequência que atende as tocadas no contrabaixo. Após os instantes
iniciais, nota-se uma alternância, em uma certa frequência, entre as altas magnitudes e baixas magnitudes
ao longo de praticamente todo o espectro, com asaltas magnitudes concentradas na baixas frequências, o
que é claramente a identidade de um instrumento percussivo, o que de fato acontece ao se ouvir o áudio,
somente um instrumento percussivo é tocado após os instantes iniciais no trecho considerado.
Agora repetindo o mesmo código porém com o parâmetro “overlapped_values” vazio ([]), pois segundo
a documentação do MATLAB quando este parâmetro é definido como vazio a função “spectrogram” vai
produzir 50% de superposição entre os segmentos. Sendo assim, obtêm-se:
Comparando-se um espectrograma com o outro, percebesse que há leves diferenças entre eles,
principalmente as que estão nas faixas de frequências entre 0 e 0.5 KHz, o que fica um pouco mais nítido
plotando os espectrogramas lado à lado, observe:

Tais diferenças se devem a sobreposição de valores presentes no segundo espectrograma, contudo não são
significativas, devido ao fato da sobreposição entre valores ser sempre próximas entre os valores
sobrepostos, razão pela qual os dois espectrogramas possuírem poucas diferenças entre si.
Adicionando o código:

Obtêm-se o gráfico de energia médio de todas as janelas obtidas no gráfico de espectrograma:

Como também é possível ouvir o áudio do trecho reamostrado.

A partir dos dados de energia obtidos, pode-se perceber que o áudio ouvido condiz com a curva de
energia obtida. Pois logo de início, há um breve silencio no áudio, seguido de um som de contrabaixo que
aparece nos instantes bem iniciais cujo o volume vai crescendo progressivamente, após isso um som de
instrumento percussivo passa a dominar com um comportamento constate até o fim do trecho de áudio, o
que explica o fato do das curvas de energia se estabilizarem num valor constante. Além disso vale pontuar
que ao se ouvir o trecho de áudio reamostrado percebe-se uma perca de qualidade no áudio que se deve ao
fato da taxa de reamostragem ser menor do que a originalmente obtida pela função “audioread”, com isso
tem-se menos amostradas coletadas por segundos e consequentemente uma perca de qualidade do áudio
reamostrado.
Conclusão

A partir da análise realizada foi possível determinar uma espécie de assinatura dos instrumentos musicais
presentes no áudio, como também a dinâmica de como foi construído o áudio por meio desses
instrumentos por meio do espectrograma. Além disso a análise por meio das curvas de energia permitiu a
visualização de que a energia presente no áudio acompanha sua dinâmica e coincide com seu
comportamento, como fora explicado acima. Por último, foi possível ver a consequência da realização de
reamostragem do áudio e foi possível perceber de forma audível a perca de qualidade devido ao sub-
amostramento que fora realizado.

Você também pode gostar