Você está na página 1de 12

Centro de Engenharia, Modelagem e Ciências Sociais Aplicadas (CECS)

ESTO017-17 – Métodos Experimentais em Engenharia

Relatório: Projeto Final


Análise da frequência e timbre da voz de diferentes pessoas a partir do
mesmo som emitido.

Débora Marfil RA: 11111013


Giovanna Dias RA: 11201722649
Michelle Lira RA: 11108613

Santo André

2021
Resumo

1. Introdução
A voz humana consiste no som produzido pela vibração das pregas vocais
modificadas pelo trato vocal. A voz humana é usada para falar, cantar, gargalhar,
bocejar, soluçar, chorar, gritar etc. Sua frequência varia entre 50 e 3400 Hz. As
pregas vocais, juntamente com os articuladores, são capazes de produzir sons
altamente intrincados. O tom da voz pode ser modificado para sugerir emoções
como raiva, surpresa e felicidade. [1]
Enquanto ocorre a vibração, várias estruturas (cavidades da boca, garganta
e a passagem nasal) entram em ressonância produzindo várias ondas harmônicas
e amplificando o som. Como cada pessoa possui uma "caixa de ressonância" típica,
a qualidade vocal (ou timbre) varia. Além disso, podemos controlar voluntariamente
os movimentos da língua, lábios e palato mole para articular os sons que formam as
palavras faladas (fonemas).
Além disso, como sabemos, as ondas mecânicas dependem da duração,
frequência e da intensidade. No homem, as pregas vocais são mais grossas e mais
elásticas e vibram em torno de 125 vezes por segundo (125Hz). Na mulher, as
pregas são mais finas e tensas e, como consequência, vibram com maior frequência
(250Hz). Por sua vez, as crianças possuem vozes agudas porque as suas cordas
vocais são ainda mais curtas. Quando chega a puberdade, a voz fica mais grave
nos meninos porque o hormônio masculino, além de promover inúmeras
transformações no corpo, aumenta a massa das pregas vocais. [2]

2. Objetivo

Analisar as ondas sonoras produzidas pelas vozes dos integrantes do grupo


com a finalidade de investigar as propriedades de timbre e altura da voz, através do
software Soundcard Oscilloscope e verificar se a diferença das frequências entre as
vozes é constante para uma amostra de seis sílabas.

3. Descrição experimental

3.1 Metodologia
Os integrantes do grupo ingressaram em uma reunião via Google Meet com
o software do SoundCard Oscilloscope ativado em um computador. Sendo assim,
nas configurações do próprio programa foi alterada a entrada de voz para a
finalidade desejada, tendo a opção de capturar o som que o computador recebia
através de seu próprio microfone ou através do som capturado pela plataforma do
Google Meet.
Dessa forma, cada um dos integrantes do grupo pronunciou sílaba por sílaba
de maneira contínua das palavras “medida correta” a fim de capturar a onda sonora
respectiva a cada sílaba. A amplitude foi ajustada caso a caso para visualização da
onda, mas a escala referente ao tempo foi fixado um tempo máximo de 30
milissegundos por sílaba falada.
Além disso, as frequências foram analisadas em cinco períodos da mesma
onda a fim de encontrar incertezas estatísticas geradas pela onda e pela medição
da mesma através do software do osciloscópio. A figura 1 abaixo refere-se a
pronúncia da sílaba “me” falada por um dos integrantes do grupo, nela é possível
observar os limites adotados para análise da frequência, que possibilitam a análise
de cinco períodos:

Figura 1: Onda sonora produzida pela pronúncia da sílaba “me”.

Os limites adotados para a análise da frequência estão indicados pelas linhas


vermelhas verticais na figura 1. Sendo assim, de acordo com a onda gerada, foi
imposto um limite a fim de padronizar a análise da frequência em cinco períodos
para todas as sílabas pronunciadas por cada integrante do grupo. Dessa forma, cada
um dos cinco períodos informou uma determinada frequência, as quais foram
analisadas nos próximos tópicos deste trabalho.

3.2 Hipóteses

Como o objetivo do presente trabalho era analisar principalmente a frequência


das vozes dos integrantes do grupo na pronúncia de determinadas sílabas, o teste
de hipóteses foi feito a partir da hipótese nula e alternativa abaixo:

● H0: A diferença entre as frequências é constante entre as vozes para todas


as sílabas
● H1: A diferença entre as frequências não é constante entre as vozes para
todas as sílabas

4. Cálculo de incertezas
Para esse experimento foram consideradas apenas as incertezas estatísticas
e sua propagação nos cálculos realizados. Sendo assim, as incertezas das médias
foram calculadas com base na equação 1.

(1)

Para calcular a diferença entre as frequências, cálculo necessário para o


teste de hipótese foi utilizada a propagação de incertezas para o cálculo da
subtração que é dada pela equação 2.

(2)
5. Resultados e discussões

5.1. Análise da frequência e altura do som

Os valores das frequências para cada sílaba do conjunto amostral para as


alunas Giovanna, Michelle e Débora estão nas tabelas 1, 2 e 3 respectivamente.

Tabela 1 - Frequências para o conjunto de sílabas para a aluna Giovanna


Aluna: Giovanna
Frequência (Hz)
Aferição me di da co rre ta
#1 212,47 219,95 212,47 211,04 195,21 208,22
#2 213,93 218,41 211,04 212,47 196,44 205,48
#3 213,93 221,51 209,62 212,47 194,00 202,81
#4 212,47 219,95 212,47 212,47 192,21 205,48
#5 211,04 216,90 209,62 213,93 194,00 201,51
Média 212,8 219,3 211,0 212,5 194,4 204,7
var 1,5 3,1 2,0 1,0 2,5 6,8
desvpad 1,2 1,8 1,4 1,0 1,6 2,6

Tabela 2 - Frequências para o conjunto de sílabas para a aluna Michelle


Aluna: Michelle
Frequência (Hz)
Aferição me di da co rre ta
#1 213,93 216,90 190,45 209,62 202,81 192,80
#2 215,40 213,93 190,45 209,62 201,51 192,80
#3 211,04 215,40 190,45 208,22 202,81 192,80
#4 212,47 216,90 192,80 212,47 200,21 192,80
#5 212,47 216,90 192,80 209,62 202,51 192,80
Média 213,1 216,0 191,4 209,9 202,0 192,8
var 2,8 1,8 1,7 2,4 1,3 0,0
desvpad 1,7 1,3 1,3 1,6 1,1 0,1
Tabela 3 - Frequências para o conjunto de sílabas para a aluna Débora
Aluna: Débora
Frequência (Hz)
Aferição me di da co rre ta
#1 223,1000 227,9200 216,90 212,47 216,90 213,93
#2 224,70 234,84 219,95 215,40 221,51 216,90
#3 224,70 223,10 219,95 209,62 218,41 212,47
#4 223,10 234,84 219,95 215,40 219,95 221,51
#5 223,10 226,33 218,41 211,04 221,51 211,04
Média 223,7 229,4 219,0 212,8 219,7 215,2
var 0,8 27,6 1,9 6,7 4,0 17,3
desvpad 0,9 5,3 1,4 2,6 2,0 4,2

Foi constatado que a aluna Débora, pronunciou todas as sílabas em


frequências mais altas do que as outras alunas, ou seja, é possível concluir que ela
possui o tom mais agudo entre as três alunas.
Entre Giovanna e Michelle, é possível concluir que a frequência da aluna
Giovanna foi maior do que Michelle em todas as sílabas, com exceção da sílaba
“rre”, na qual ocorreu um desvio do padrão constatado. Dessa forma, se Débora
possui o tom mais agudo entre as alunas, Michelle possui o tom mais grave entre as
três alunas.
Além disso, é possível analisar a característica de afinação através dos dados
da tabela acima. Essa característica pode ser determinada pela consistência da
frequência durante a pronúncia da sílaba. Sendo assim, se a frequência for igual
para cada aferição é possível concluir que a pronúncia da sílaba foi afinada, ao ponto
de não apresentar variação na frequência. Por exemplo, quando a aluna Michele
pronunciou a sílaba “ta”, todas as aferições resultaram em uma frequência de 192,80
Hz, resultando em uma pronúncia afinada.

5.2. Timbre vocálico


Por meio da análise experimental foi possível visualizar o timbre de voz dos
integrantes do grupo. Quando todos pronunciaram a mesma sílaba, o formato da
onda gerada foi diferente para cada pessoa. Conceitualmente, o timbre está
associado à forma da onda e nos permite distinguir sons de mesma frequência,
produzidos por instrumentos diferentes.
No experimento, como todos os integrantes pronunciaram o mesmo som,
seguindo o conceito de timbre, era esperado que as ondas tivessem a mesma
frequência e formatos diferentes. Porém como não tratava-se de instrumentos
musicais e sim de vozes humanas, a frequência na pronúncia da mesma sílaba foi
diferente para cada um dos integrantes do grupo, ainda que em alguns casos muito
próximas, devido a altura da voz ser diferente para cada pessoa.
Nas figuras abaixo pode ser observada a forma da onda para cada um dos
integrantes do grupo quando esses pronunciaram a sílaba “co” da palavra “correta”.
Cada pessoa apresentou um formato de onda característico dessa sílaba,
caracterizando o timbre vocal pessoal.

Figura 2: Formato da onda gerado pela sílaba “co” pronunciado por Débora.

Figura 3: Formato da onda gerado pela sílaba “co” pronunciado por Giovanna.
Figura 4: Formato da onda gerado pela sílaba “co” pronunciado por Michelle.

5.3. Grandezas de interferência esperadas


A principal grandeza de interferência esperada para esse experimento foi o
ruído no local da gravação. Os integrantes do grupo procuraram um local tranquilo
e um horário da noite com pouco ruído para fazer a reunião no Google Meet a fim
de minimizar o ruído do local. Enquanto um dos integrantes pronunciava a sílaba, os
demais desativaram os microfones para evitar qualquer ruído complementar ao
ambiente da pessoa que falava.
Além disso, os computadores dos integrantes são de marcas e modelos
distintos, o que provavelmente gerou divergência nas comparações; e a
sensibilidade dos microfones utilizados provavelmente influenciou na qualidade do
som recebido pelo software do SoundCard Oscilloscope.

5.4. Teste de Hipótese

Para verificar a validade das hipóteses apresentadas na seção 3.2 foi


necessário analisar a diferença de frequência na pronúncia das sílabas pelas
diferentes vozes. Para que a hipótese nula fosse verdadeira, a diferença de
frequência entre a sílaba “me” dita por Michelle e por Giovanna, por exemplo, deveria
ser a mesma quando comparado com a diferença de frequência da sílaba “di” dita
pela as mesmas e assim por diante. Portanto, a diferença de frequência entre a
sílaba “me” e “di” pronunciada por Michelle, deveria seguir uma relação proporcional
à diferença de frequência entre a sílaba “me” e “di” pronunciada por Giovanna.
A tabela abaixo mostra esse exemplo descrito acima:

Tabela 4: Diferença entre frequências entre as vozes para sílaba “me” e “di”

me (Hz) di (Hz) Diferença de


frequência entre
sílabas

Giovanna 212,8 ± 1,2 219,3 ± 1,8 6,5 ± 2,2

Michelle 213,1 ± 1,7 216,0 ± 1,3 2,9 ± 2,2

Diferença de 0,3 ± 2,0 3,3 ± 2,22 -


frequência entre
integrantes

A partir da tabela, é possível verificar que a diferença de frequência entre as


alunas para a pronúncia da sílaba “me” e a sílaba “di” não são iguais. Além disso,
não há relação de proporcionalidade na diferença de frequência entre essas sílabas
quando ditas por diferentes pessoas.
O gráfico abaixo facilita a visualização e fortalece a rejeição da hipótese nula
(H0):

Gráfico 1: Relação entre a frequência e as sílabas pronunciadas


pelas alunas

No gráfico, as sílabas estão numeradas conforme ordem que foram


pronunciadas, seguindo a ordem direta da palavra “medida correta”. É possível
observar que a diferença no eixo y (referente a frequência em Hz) entre as sílabas
pronunciada por cada uma das alunas não é a mesma para nenhum dos casos
analisados. Além disso, as linhas são seguem uma relação de proporcionalidade
entre si ao longo da pronúncia.
Sendo assim, a hipótese nula (H0) é falsa e portanto a hipótese alternativa
(H1) é verdadeira.

6. Conclusão

A frequência é uma propriedade que refere-se à velocidade na qual as ondas


de som se propagam no ar. Ela ocorre por meio de vibrações, as quais podem ser
mais espaçadas ou mais intensas, formando o que conhecemos como ruídos
agudos e graves. Nesse experimento foi possível comparar como a frequência se
relaciona com a altura do som, sendo possível concluir que a aluna Débora tem a
voz mais aguda entre as três alunas. Por outro lado, a aluna Michelle apresentou
voz mais grave entre as três. Como as alunas são do sexo femino, as pregas são
mais finas e tensas e, como consequência, vibraram com frequência entre 190 Hz a
250 Hz.
Além disso, foi possível identificar os diferentes formatos de onda quando a
mesma sílaba é pronunciada por diferentes pessoas. Apesar das vozes
apresentarem frequências diferentes quando pronunciada a mesma sílaba, devido a
diferença de altura, foi possível visualizar o timbre característico de cada aluna,
devido aos diferentes formatos de onda.
Por fim, como cada pessoa tem um timbre diferente, altura de voz e possível
controle da entoação no momento da fala, esse experimento está sujeito a
interferências. Foi concluído que a diferença entre as frequências não é constante
entre as vozes para todas as sílabas, isso deve-se possivelmente ao fato de que
além de que cada pessoa possui uma "caixa de ressonância" típica, podemos
controlar voluntariamente os movimentos da língua, lábios e palato mole para
articular os sons que formam as palavras faladas (fonemas).
Sendo assim, as diferentes sílabas exigem diferentes articulações do som e
cada pessoa interpreta tais fonemas de maneira única para cada sílaba e portanto
as frequência das sílabas não são comparáveis entre si.

Referência bibliográfica
[1] Voz humana. Wikipédia. Disponível em:
<https://pt.wikipedia.org/wiki/Voz_humana>. Acesso em: 10 de dezembro de 2021.
[2] O corpo humano - A voz humana.Museu Escola do IB. Disponível em:
<https://www2.ibb.unesp.br/nadi/Museu2_qualidade/Museu2_corpo_humano/Muse
u2_como_funciona/Museu_homem_nervoso/Museu2_homem_nervoso_audicao/M
useu2_homem_nervoso_audicao_voz.htm>. Acesso em: 10 de dezembro de 2021.
[3] Raymond A. Serway e John W. Jewett, Jr. Princípios de Física – Volume 2,
Oscilações, ondas e termodinâmica. Tradução da 5ª edição norte-americana.
Frequência por sílaba (Hz)

Aluno me di da co rre ta

Giovanna 212,8 ± 1,2 219,3 ± 1,8 211,0 ± 1,4 212,5 ± 1,0 194,4 ± 1,6 204,7 ± 2,6

Michelle 213,1 ± 1,7 216,0 ± 1,3 191,4 ± 1,3 209,9 ± 1,6 202,0 ± 1,1 192,8 ± 0,1

Débora 223,7 ± 0,9 229,4 ± 5,3 219,0 ± 1,4 212,8 ± 2,6 219,7 ± 2,0 215,2 ± 4,2

Você também pode gostar