Você está na página 1de 185

Universidade Estadual de Campinas

Instituto de Estudos da Linguagem

Antônio Carlos Silvano Pessotti

Efeitos do treinamento e da prática vocal


profissional sobre o canto e a fala

Tese de Doutorado apresentada ao Departamento


de Linguística do Instituto de Estudos da
Linguagem (IEL), da Universidade Estadual de
Campinas (Unicamp) para a obtenção do título
de Doutor em Linguística.

Orientadora: Profª Drª Eleonora Cavalcante Albano.

Campinas
2012

i
FICHA CATALOGRÁFICA ELABORADA POR
CRISLLENE QUEIROZ CUSTODIO – CRB8/8624 - BIBLIOTECA DO INSTITUTO DE
ESTUDOS DA LINGUAGEM - UNICAMP

Pessotti, Antonio Carlos Silvano, 1969-


P439e Efeitos do treinamento e da prática vocal profissional
sobre o canto e a fala / Antonio Carlos Silvano Pessotti. --
Campinas, SP : [s.n.], 2012.

Orientador : Eleonora Cavalcante Albano.


Tese (doutorado) - Universidade Estadual de
Campinas, Instituto de Estudos da Linguagem.

1. Música e linguagem. 2. Canto. 3. Fonética. 4.


Fonologia gestual. 5. Fonética acústica. I. Albano, Eleonora
Cavalcante, 1950-. II. Universidade Estadual de Campinas.
Instituto de Estudos da Linguagem. III. Título.

Informações para Biblioteca Digital

Título em inglês: Effects of training and professional vocal practice over singing and
speech.
Palavras-chave em inglês:
Music and language
Singing
Phonetics
Gestural phonology
Acoustic phonetics
Área de concentração: Linguística.
Titulação: Doutor em Linguística.
Banca examinadora:
Eleonora Cavalcante Albano [Orientador]
Ricardo Molina de Figueiredo
Osvaldo Novais de Oliveira Junior
Luiz Augusto de MoraesTatit
Maria Jose Dias Carrasqueira de Moraes
Data da defesa: 23-01-2012.
Programa de Pós-Graduação: Linguística.

ii
iii
iv
Agradecimentos

Agradeço a ajuda, paciência e parceria da minha orientadora, Profª Drª Eleonora C.


Albano, que me acolheu no Laboratório de Fonética e Psicolinguística desde a graduação,
mesmo sendo eu de outra área. Sem ela eu não conseguiria terminar este e outros
trabalhos.
Agradeço aos membros da banca de qualificação de área (Sociolinguística) e de
tese (Fonética e Fonologia) pelas discussões e sugestões de trabalhos futuros: Profs.
Anna Bentes, Thais Cristófaro Silva, Regina Cruz, Adriana G. Kayama e Wilmar D'Angelis.
Agradeço aos membros da banca e suplentes pela colaboração e paciência na
leitura do trabalho: Profs. Ricardo Molina de Figueiredo, Osvaldo N. de Oliveira Jr., Luiz
Tatit, Maria José Carrasqueira, Beatriz R. de Medeiros, Leonardo Fuks, Cristina M.
Fargetti.
Agradeço aos professores que fazem parte da minha literatura estrangeira, que
conheci pessoalmente e muito me animaram a prosseguir nessa linha de estudos: Profs.
Johan Sundberg, David Howard, Donald Miller, Ronald Scherer, Sten Ternström, Gláucia
Salomão, Monika Hein, Christian Herbst, Pedro Amarante Andrade.
Agradeço aos professores artistas que me incentivaram a trabalhar com esse tema:
Profs. Niza Tank, Vania Pajares, Francisco Campos Neto, Adélia Issa, Edelton Gloeden,
Jônatas Manzoli, Jean Goldenbaum.
Agradeço aos professores do Cefala-UFMG pela ajuda e apoio em vários
momentos: Profs. Hani C. Yehia, Rui Rothe-Neves, Maurício Loureiro, Maurílio Nunes.
Agradeço aos meus colegas do Coro de Câmara de Piracicaba, especialmente ao
casal Cidinha e Ernst Mahle, cantores do Teatro Municipal de São Paulo, do Coro da
Orquestra Sinfônica do Estado de São Paulo, do Coro do Teatro São Pedro (SP),
locutores da Rádio Educativa FM de Piracicaba, amigos da Escola de Música de
Piracicaba Maestro Ernst Mahle, pela compreensão, apoio e paciência.
Agradeço aos docentes e funcionários do IEL que me apoiaram com conselhos,
orientações e incentivos.
Agradeço aos colegas do Dinafon e Lafape pelo companheirismo e incentivo.
Agradeço às minhas informantes, pois sem elas eu não realizaria esse trabalho.
Agradeço ao Sálvio Nienkötter (Sendas Edições) pela revisão e conselhos.
Agradeço à Fapesp pela bolsa concedida no período em que conduzi minhas
análises (Processo nº 2008/10036-4).

v
vi
Resumo:

Neste estudo observam-se os efeitos decorrentes do treinamento e da prática vocal


profissional, tendo por base três hipóteses que evidenciem semelhanças e diferenças
entre fala e canto: 1) a fala é diferente entre grupos, 2) o canto é semelhante entre
grupos, 3) fala e canto possuem semelhanças e diferenças influenciadas por formação
musical e treinamento. Foi escolhida a canção Conselhos (Carlos Gomes), cujo texto foi
lido e cantado cinco vezes por três grupos, cada qual com cinco informantes: cantoras
solistas (SOL), cantoras coralistas (COR) e locutoras de rádio (LOC). Os dados obtidos da
partitura da canção foram analisados com procedimentos não paramétricos. Os dados
acústicos das gravações de fala e canto (com e sem acompanhamento) foram analisados
com procedimentos paramétricos. As análises não-paramétricas mostraram que a
partitura musical mantém as restrições linguísticas, sem perda da função fonológica nem
da pertinência linguística. As diferenças observadas na análise da duração de fala
corroboram a primeira hipótese. Tais diferenças sugerem influência de treinamento,
distinção dos grupos com prática profissional, e manutenção da hierarquia prosódica. A
gradiência entre os grupos na análise da entoação da fala separa cantoras das locutoras,
e indicam influência do treinamento vocal profissional. A análise das estimativas de
espaço vocálico evidenciou as tônicas, usadas pelos grupos como marcadores de
expressividade. A intensidade na fala ressaltou locutoras e solistas como grupos com
prática vocal profissional. As solistas se destacam na fala com valores elevados dos
formantes e proximidade tonal com a partitura, fato que poderia explicar a tendência das
cantoras com maior prática e treinamento em ler um texto próximo ao canto. A análise da
duração global no canto sem acompanhamento mostra semelhança entre as cantoras que
reflete a segunda hipótese, referente à formação musical. As diferenças de duração das
variáveis linguísticas no canto refletem a influência da prática e do treinamento. A análise
da entoação indicou que as coralistas atrelam a afinação à pulsação rítmica, e, o
acompanhamento facilita essa tarefa. A análise das estimativas de espaço vocálico no
canto mostrou áreas semelhantes entre os grupos. A distinção entre eles aparece nas
tônicas, menos centralizadas pelas solistas, e, ainda, com intensidade e formantes mais
altos. A comparação entre dados acústicos e estimativas da partitura no canto mostrou as
solistas com entoação próxima à partitura. As tônicas foram melhor investigadas na fala,
no canto, e entre as modalidades. Na fala, as diferenças entre os grupos são explicadas
pela formação, pois solistas e locutoras são treinadas para produzir maior abertura oral.
As consequências articulatórias seriam o abaixamento de laringe e redução do espaço
faríngeo. A investigação das tônicas no canto mostrou formantes elevados para as
solistas, implicando em estiramento labial (ou elevação de laringe, prática não
recomendada pela pedagogia do canto). A comparação entre modalidades indicou
influência da proficiência musical ou do treinamento vocal, em busca de postura vocal
confortável. Esses resultados na fala e no canto indicam possível transferência gestual do
canto para a fala, e vice-versa, tal como ocorre na aquisição de segunda língua. Tal
fenômeno resultaria de adaptação biomecânica, coerentemente com a Fonologia Gestual.

Palavras chave: música e linguagem, canto, fonética, fonologia gestual, fonética acústica.

vii
viii
Title: Effects of training and professional vocal practice over the singing and speech.

Abstract:

The aim of this study is to observe the effects of training and professional voice practice,
the basis of three scenarios that show similarities and differences in spoken and sung
productions: 1) speech is different among groups, 2) singing is similar in the two groups of
singers, 3) speech and singing have similarities and differences influenced by musical
education and training. Conselhos, a song by Carlos Gomes, was chosen to constitute the
corpus, whose text was read and sung five times by three groups, each with five subjects:
solo singers (SOL), choir singers (COR) and news broadcasters (LOC). The data obtained
from the musical score were analyzed with nonparametric procedures, and the data from
acoustic recordings of speech and singing (with and without accompaniment) were
analyzed using parametric procedures. Non-parametric analysis showed that the musical
score maintains language restrictions, without loss of phonological function or linguistic
relevance. Differences observed in the analysis of spoken duration support the first
hypothesis. Such differences suggest the influence of training distinctions based on
professional practice and maintenance of the prosodic hierarchy. Analysis of speech
intonation shows gradient performance among groups, and separates singers from
broadcasters, as well as indicate the influence of professional vocal training. The analysis
of vowel space estimations shows the stressed vowels as expressiveness markers used
by both groups. The intensity in speech distinguishes broadcasters and soloists such as
groups with professional vocal practioneers. The soloists stand out with high values in
intensity and formants. The way of keeping close to the score may explain the tendency of
singers with more practice and training to read a text with an intonation that reminds the
melody. Analysis of overall duration in singing without accompaniment shows that the
similarity between groups reflects the second hypothesis, referring to musical training.
Differences in duration of the linguistic variables in singing reflect the influence of practice
and training. The analysis indicated that pitch singers' intonation ties the musical score,
and accompaniment makes it easy. The analysis of vowel space area estimations in
singing showed similar between groups. The distinction between them appears in the tonic
vowels, more centralized by the soloists, and with higher intensity and formants. The
comparison between acoustic data and estimations of the musical score in singing showed
the soloists with similar pitch to the score. The stressed vowels were investigated in
speech, singing, and between modalities. In speech, the differences between groups are
explained by their background, as soloists and broadcasters are trained to open their
mouth widely. The articulatory consequences would be the larynx lowering and reduction
of pharyngeal space. Research results indicate the stressed vowels in singing have higher
formants for soloists, resulting in stretching (or lifting of the larynx). The results of these
comparisons indicate the influence of music proficiency or vocal training seeking a
comfortable vocal space. These results, observed in the speech and singing, suggest
gestural transference between singing to speech, and vice-versa, as occurs in second
language acquisition. This phenomenon could be the result of bio-mechanical adaptation,
consistent with the Gestural Phonology.

Keywords: music and language, singing, phonetics, gestural phonology, acoustic


phonetics.

ix
x
Lista de Figuras
Figura 2.5.1: Alinhamento Temporal Dinâmico de séries entoacionais.............................................18
Figura 2.6.1: Segmentação dos dados do corpus................................................................................24
Figura 4.2.1: Histograma dos dados de duração de fala, com curvas de densidade de probabilidade
para cada informante..........................................................................................................................40
Figura 4.3.1: Histograma dos dados de entoação (f0) de fala, com curvas de densidade de
probabilidade para cada informante...................................................................................................44
Figura 4.4.1: Espaços vocálicos nas posições acentuais de fala das coralistas (COR)......................47
Figura 4.4.2: Espaços vocálicos nas posições acentuais de fala das solistas (SOL)..........................47
Figura 4.4.3: Espaços vocálicos nas posições acentuais de fala das locutoras (LOC).......................48
Figura 5.2.1: Histograma de duração dos dados de canto sem acompanhamento..............................62
Figura 5.2.2: Histograma de duração de canto com acompanhamento..............................................65
Figura 5.3.1: Histograma de entoação (f0) para canto sem acompanhamento...................................69
Figura 5.3.2: Histograma dos dados de canto com acompanhamento................................................73
Figura 5.4.1: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento
das coralistas (COR)...........................................................................................................................76
Figura 5.4.2: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento
das solistas (SOL)...............................................................................................................................77
Figura 5.4.3: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento
das coralistas (COR)...........................................................................................................................77
Figura 5.4.4: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento
das solistas (SOL)...............................................................................................................................78
Figura 6.1.1: Gráfico de médias de F1 por grupo e modalidades: fala, canto sem acompanhamento
(cantoS), canto com acompanhamento (cantoC)................................................................................96
Figura 6.1.2: Gráfico de médias de F2 por grupo e modalidades: fala, canto sem acompanhamento
(cantoS), canto com acompanhamento (cantoC)................................................................................98
Figura 6.1.3: Gráfico de médias de F3 por grupo e modalidades: fala, canto sem acompanhamento
(cantoS), canto com acompanhamento (cantoC)................................................................................99
Figura 10.1: Partitura da linha vocal de Conselhos (Carlos Gomes)................................................147
Figura 11.1: Espaços vocálicos nas posições acentuais de fala das coralistas (COR). Pretônicas...157
Figura 11.2: Espaços vocálicos nas posições acentuais de fala das coralistas (COR).Tônicas........158
Figura 11.3: Espaços vocálicos nas posições acentuais de fala das coralistas (COR). Postônicas. .159
Figura 11.4: Espaços vocálicos nas posições acentuais de fala das solistas (SOL). Pretônicas.......160

xi
Figura 11.5: Espaços vocálicos nas posições acentuais de fala das solistas (SOL). Tônicas...........161
Figura 11.6: Espaços vocálicos nas posições acentuais de fala das solistas (SOL). Postônicas......162
Figura 11.7: Espaços vocálicos nas posições acentuais de fala das locutoras (LOC). Pretônicas. . .163
Figura 11.8: Espaços vocálicos nas posições acentuais de fala das locutoras (LOC). Tônicas........164
Figura 11.9: Espaços vocálicos nas posições acentuais de fala das locutoras (LOC). Postônicas...165
Figura 11.10: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento
das coralistas (COR) Pretônicas.......................................................................................................166
Figura 11.11: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento
das coralistas (COR) Tônicas...........................................................................................................167
Figura 11.12: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento
das coralistas (COR) Postônicas.......................................................................................................168
Figura 11.13: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento
das solistas (SOL) Pretônicas...........................................................................................................169
Figura 11.14: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento
das solistas (SOL) Tônicas...............................................................................................................170
Figura 11.15: Espaços vocálicos nas posições acentuais da produção cantada sem acompanhamento
das solistas (SOL) Postônicas...........................................................................................................171
Figura 11.16: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento
das coralistas (COR).Pretônicas.......................................................................................................172
Figura 11.17: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento
das coralistas (COR).Tônicas...........................................................................................................173
Figura 11.18: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento
das coralistas (COR). Postônicas......................................................................................................174
Figura 11.19: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento
das solistas (SOL). Pretônicas..........................................................................................................175
Figura 11.20: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento
das solistas (SOL). Tônicas..............................................................................................................176
Figura 11.21: Espaços vocálicos nas posições acentuais da produção cantada com acompanhamento
das solistas (SOL). Postônicas..........................................................................................................177

xii
Lista de Tabelas
Tabela 3.1: Resumo das análises não paramétricas da partitura de Conselhos (Carlos Gomes); S –
resultado significativo; NS – resultado não significativo...................................................................31
Tabela 3.2: estatística descritiva dos dados acústicos estimados da partitura....................................36
Tabela 4.1: ANOVA para dados de duração de fala............................................................................41
Tabela 4.3: ANOVA para dados de entoação de fala..........................................................................45
Tabela 4.5: ANOVA das medidas de espaço vocálico para a produção falada: área de espaço
vocálico (VSA); significância: significativo (S), não-significativo (NS)...........................................48
Tabela 4.7: teste t para as estimativas de espaço vocálico (VSA) comparando grupos na produção
falada..................................................................................................................................................50
Tabela 4.8: ANOVA das medidas de espaço vocálico para a produção falada: razão de centralização
formântica (FCR); significância: significativo (S), não-significativo (NS).......................................51
Tabela 4.10: teste t para as estimativas de espaço vocálico (VSA e FCR) comparando grupos na
produção falada...................................................................................................................................52
Tabela 4.12: ANOVA dos formantes por grupo..................................................................................53
Tabela 4.13: Médias e desvios padrões dos formantes por grupo......................................................54
Tabela 4.14: teste t comparando os formantes por grupo na fala......................................................54
Tabela 4.15: Médias e desvios-padrão de duração e entoação para partitura e grupos......................55
Tabela 4.16: teste t com os dados acústicos da produção falada e as estimativas da partitura...........55
Tabela 5.1: ANOVA para os dados de duração da produção cantada sem acompanhamento............63
Tabela 5.4: Médias e desvios padrão de duração para as variáveis linguísticas por grupo, canto com
acompanhamento................................................................................................................................67
Tabela 5.5: ANOVA para os dados de entoação da produção cantada sem acompanhamento...........70
Tabela 5.6: Médias e desvios padrão de entoação por grupo, canto sem acompanhamento..............71
Tabela 5.7: ANOVA para os dados de entoação da produção cantada com acompanhamento..........74
Tabela 5.8: Médias e desvios padrão de entoação por grupo, canto com acompanhamento..............74
Tabela 5.9: Teste t entre grupos para VSA na produção cantada sem acompanhamento...................79
Tabela 5.10: Médias e desvios padrão de VSA por grupo, canto sem acompanhamento...................79
Tabela 5.11: teste t das estimativas de VSA entre grupos no canto com acompanhamento...............80
Tabela 5.12: Médias e desvios padrão para VSA por grupo, canto com acompanhamento...............80
Tabela 5.13: Teste t entre grupos para FCR na produção cantada sem acompanhamento.................80
Tabela 5.14: Médias e desvios padrão de FCR por grupo, canto sem acompanhamento...................81
Tabela 5.15: teste t das estimativas de FCR entre grupos no canto com acompanhamento...............83

xiii
Tabela 5.16: Médias e desvios padrão de FCR por grupo no canto com acompanhamento..............83
Tabela 5.17: Teste t das medidas de intensidade entre grupos no canto sem e com acompanhamento
............................................................................................................................................................83
Tabela 5.18: Médias e desvios padrão de intensidade(SPL) por grupo no canto, sem e com
acompanhamento................................................................................................................................84
Tabela 5.19: Comparação entre médias para os formantes do canto sem acompanhamento.............84
Tabela 5.20: Médias e desvios padrão dos formantes por grupo no canto sem acompanhamento.....85
Tabela 5.21: teste t entre grupos dos formantes no canto com acompanhamento..............................85
Tabela 5.22: Médias e desvio padrão para os formantes por grupo no canto com acompanhamento.
............................................................................................................................................................86
Tabela 5.23: teste de comparação entre dados acústicos da produção cantada sem acompanhamento
com as estimativas da partitura...........................................................................................................87
Tabela 5.24: Médias e desvios padrão para duração e entoação por grupo e partitura no canto sem
acompanhamento................................................................................................................................87
Tabela 5.25: teste t comparando duração e entoação entre grupos na produção cantada com
acompanhamento................................................................................................................................88
Tabela 5.26: Médias e desvio padrão de duração e entoação por grupo e partitura no canto com
acompanhamento................................................................................................................................90
Tabela 6.1: ANOVA dos Formantes F1 e F2 (Bark) por vogais e grupo na fala..............................100
Tabela 6.2: Médias e desvios padrão dos formantes por vogal na fala.............................................101
Tabela 6.3: Teste t comparando formantes das vogais tônicas por grupo, canto sem
acompanhamento..............................................................................................................................103
Tabela 6.4: Médias e desvios padrão dos formantes das vogais tônicas por grupo, canto sem
acompanhamento..............................................................................................................................104
Tabela 6.5: Teste t comparando formantes das vogais tônicas por grupo, canto com
acompanhamento..............................................................................................................................105
Tabela 6.6: Médias e desvios padrão dos formantes das vogais tônicas por grupo, canto com
acompanhamento..............................................................................................................................106
Tabela 6.7: Quadro resumo das relações entre formantes das vogais tônicas, modalidade e grupo:
Com – canto com acompanhamento, Sem – canto sem acompanhamento, Fala – fala...................107
Tabela 9.1: Análises não paramétricas de Conselhos (Carlos Gomes): Pearson (x2), Fisher exato e
V-Cramer...........................................................................................................................................138
Tabela 9.2: Análises não paramétricas de Conselhos (Carlos Gomes): desvios de Freeman-Tukey.
..........................................................................................................................................................140

xiv
Tabela 9.3: Estatística Descritiva dos dados de fala e canto; loc – locutoras, cor – coralistas, sol –
solistas, desvpad – desvio-padrão.....................................................................................................141
Tabela 9.4: ANOVA entre formantes e vogais por modalidade........................................................142
Tabela 9.5: Comparações entre modalidades e cantoras (TukeyHSD).............................................143

xv
xvi
Sumário
1 Introdução.........................................................................................................................1
1.1 Considerações Preliminares.....................................................................................3
1.2 Abordagens sobre o assunto.....................................................................................3
1.3 Objetivo.....................................................................................................................7
1.4 Fatores envolvidos....................................................................................................8
1.5 Estrutura da tese.......................................................................................................9
2 Metodologia....................................................................................................................11
2.1 Considerações Preliminares...................................................................................13
2.2 Descrição dos procedimentos de análise de partitura e letra..................................13
2.3 Descrição da metodologia de gravação e análise dos dados acústicos.................15
2.4 Justificativa da escolha dos sujeitos e montagem do corpus..................................16
2.5 Método de gravação, descrição de variáveis e segmentação.................................17
2.5.1 Método de segmentação e análises semiautomáticas.....................................17
2.5.2 Descrição das Variáveis...................................................................................19
2.5.2.1 Variáveis Acústicas e Categóricas............................................................19
2.5.2.2 Variáveis Estimadas..................................................................................19
2.5.2.2.1 Área de Espaço Vocálico...................................................................20
2.5.2.2.2 Razão de Centralização Formântica.................................................20
2.6 Análise fonológica do corpus...................................................................................20
2.6.1 Dados de Fala..................................................................................................22
2.6.1.1 Texto da Canção.......................................................................................22
2.6.2 Dados de Canto...............................................................................................24
2.6.2.1 Produção cantada sem acompanhamento...............................................25
2.6.2.2 Produção cantada com acompanhamento...............................................25
2.7 Comparação entre Partitura e Interpretações Cantadas quanto a f0 e duração ....25
2.8 Análises Estatísticas: Descritivas e Inferenciais......................................................26
2.8.1 Análises Descritivas.........................................................................................26
2.8.2 Análises Inferenciais........................................................................................26
3 Resultados e Análises: Partitura e Letra.........................................................................27
3.1 Considerações Preliminares...................................................................................29
3.1.1 Análise Exploratória em Partituras...................................................................30

xvii
3.1.1.1 Análise das associações entre categorias linguísticas e musicais...........30
3.1.1.2 Análises das Estimativas Acústicas da partitura a partir das categorias da
letra........................................................................................................................33
4 Resultados e Análises: Gravações de Fala....................................................................37
4.1 Considerações preliminares....................................................................................39
4.2 Análises dos dados de duração .............................................................................39
4.2.1 Análise descritiva ...........................................................................................39
4.2.2 Análises inferenciais.........................................................................................41
4.3 Análise dos dados de entoação (f0) .......................................................................42
4.3.1 Análise Descritiva.............................................................................................42
4.3.2 Análises Inferenciais........................................................................................45
4.4 Análise das estimativas de espaço vocálico nas posições acentuais ....................46
4.4.1 Área de Espaço Vocálico (VSA).......................................................................48
4.4.2 Razão de Centralização Formântica (FCR).....................................................50
4.5 Análise da Intensidade (SPL)..................................................................................52
4.6 Análise dos Formantes............................................................................................53
4.7 Comparação entre dados acústicos e estimativas da partitura...............................54
5 Resultados e Análises: Gravações de Canto.................................................................57
5.1 Considerações Preliminares...................................................................................59
5.2 Análises dos dados de duração .............................................................................59
5.2.1 Canto sem acompanhamento .........................................................................59
5.2.1.1 Análise descritiva......................................................................................59
5.2.1.2 Análises inferenciais.................................................................................62
5.2.2 Canto com acompanhamento..........................................................................64
5.2.2.1 Análise descritiva......................................................................................64
5.2.2.2 Análises inferenciais.................................................................................66
5.3 Análise dos dados de entoação (f0) .......................................................................67
5.3.1 Canto sem acompanhamento..........................................................................67
5.3.1.1 Análise Descritiva......................................................................................67
5.3.1.2 Análises inferenciais.................................................................................70
5.3.2 Canto com acompanhamento..........................................................................71
5.3.2.1 Análise Descritiva......................................................................................71
5.3.2.2 Análises Inferenciais.................................................................................74
5.4 Análise das estimativas de espaço vocálico nas posições acentuais ....................75

xviii
5.4.1 Área de Espaço Vocálico (VSA).......................................................................78
5.4.1.1 Canto sem acompanhamento...................................................................79
5.4.1.2 Canto com acompanhamento...................................................................79
5.4.2 Razão de Centralização Formântica (FCR).....................................................80
5.4.2.1 Canto sem acompanhamento...................................................................80
5.4.2.2 Canto com acompanhamento...................................................................81
5.4.3 Análise da Intensidade (SPL)...........................................................................83
5.4.4 Análise dos Formantes.....................................................................................84
5.4.4.1 Canto sem acompanhamento...................................................................84
5.4.4.2 Canto com acompanhamento...................................................................85
5.5 Comparação entre dados acústicos e estimativas da partitura...............................86
5.5.1.1 Canto sem acompanhamento...................................................................86
5.5.1.2 Canto com acompanhamento...................................................................87
6 Análise das vogais tônicas.............................................................................................92
6.1 Considerações preliminares....................................................................................94
6.2 Investigação sobre as tônicas na fala...................................................................100
6.3 Investigação sobre as tônicas no canto................................................................102
6.3.1 Canto sem acompanhamento........................................................................103
6.3.2 Canto com acompanhamento........................................................................105
6.4 Comparação entre modalidades...........................................................................107
7 Discussão e Considerações Finais...............................................................................110
7.1 Recapitulação........................................................................................................112
7.2 Discussão..............................................................................................................113
7.3 Considerações Finais............................................................................................116
8 Referências Bibliográficas............................................................................................118
9 Anexo I – Tabelas.........................................................................................................136
10 Anexo II – Partitura ...................................................................................................145
11 Anexo III – Espaços Vocálicos....................................................................................155
........................................................................................................................................155

xix
xx
1 Introdução

1
2
1.1 Considerações Preliminares

No mundo em que vivemos é comum o emprego da voz como instrumento de uso


cotidiano profissional. Tal prática depende de formação prévia e treinamento continuado,
quer por professores, atores, locutores, e cantores, entre outros. Esses profissionais
fazem uso da voz sem perceber suas implicações na fala coloquial.

Indiscutivelmente, fala e canto são duas formas de produção linguística com o


mesmo trato vocal. Muitas vezes elas são consideradas variantes de uma mesma
produção, tomando-se a fala stricto sensu (coloquial, lida, entre outras) e a fala cantada
como duas modalidades distintas (MEDEIROS, 2002). Há autores que também tratam
toda e qualquer produção do trato vocal como fala, admitindo gradientes diversos, e
caracterizam desde a fala isócrona e sem entoação, ao canto melismático e sem
palavras. Tais produções seriam dependentes do ambiente de origem, refletindo assim
características socioculturais (LIST, 1963).

Considerando que a prática vocal profissional transcende o cotidiano, e pode


apresentar gradiência semelhante à descrita na literatura sobre as diversas modalidades
de produção, pergunta-se que efeitos possíveis seriam observados na fala daqueles que
fazem uso profissional da voz. Em outras palavras, que efeitos de adaptação resultariam
do trabalho da fala profissional impostada, trabalho esse comum a profissionais tais como
locutores, atores e cantores? Quais efeitos poderiam ser observados no canto executado
por cantores com maior ou menor proficiência em canto lírico? Como observar tais fatos?

1.2 Abordagens sobre o assunto

Várias pesquisas foram realizadas por diversos autores sobre a relação fala-canto,
principalmente quanto à descrição dessas produções em diversos níveis: acústicos,
fisiológicos, linguísticos, semióticos. O trabalho de dois pesquisadores são referências
necessárias nesse campo de estudo, principalmente no enfoque de aspectos prosódicos
e segmentais (fones).

Em sua obra, Nicole Scotto di Carlo descreve vários aspectos da produção vocal
no canto e sua comparação com a fala. Seus trabalhos sobre os fatores envolvidos na

3
inteligibilidade do canto (SCOTTO DI CARLO, 1972, 1985, 1995) abordam desde as
condições acústicas mínimas de altura e intensidade, bem como a influência dos métodos
de canto na articulação das frases (sintagmas) linguísticas, se pareadas às frases
musicais.

Sobre a frase cantada e a articulação musical, Scotto di Carlo (1976) faz um estudo
comparativo entre emissão falada e cantada, no sentido de entender que nível de
perturbação da articulação no canto exerce influência sobre os diversos elementos
constituintes da musicalidade da frase cantada, bem como suas consequências. Tais
resultados questionam as técnicas vocais baseadas na articulação de encontros
consonantais ou apoiadas em consoantes. Essa discussão é ampliada em Scotto di Carlo
(1993), que afirma que tais métodos de canto com base nessas articulações devem ser
evitados, a fim de preservar o equilíbrio entre a compreensão do texto cantado e a
estética musical.

Outro achado de Scotto di Carlo (1997 e 2005b) é que o aprendizado do canto faz
uso da memória proprioceptiva1. Nesse trabalho, a autora descreve o papel do professor
de canto ao ensinar como o aluno deve fazer os ajustes articulatórios de cavidade
faríngea e abertura oral, a fim de adaptar as cavidades de ressonância, e, assim,
aumentar seu volume.

Tal processo de aprendizado faz uso da memória cinestésica, isto é, da memória


dos movimentos musculares. Em outro momento, o aluno é estimulado ao uso da
memória paleo estética, ou ainda, a memória local das vibrações mais intensas sentidas
na música, diretamente correlacionada ao fraseado musical.

Esse processo de aprendizado tem implicações motoras refletidas nas expressões


faciais do canto (SCOTTO DI CARLO, 2004). A autora descreve nesse trabalho a
influência da abertura oral na identificação das emoções ou na avaliação de tal
intensidade.

Tais atividades gestuais da face têm consequências nos níveis da hierarquia


prosódica, incluindo os inferiores. Dentre essas consequências, há fatores
microprosódicos do canto que não são percebidos na fala (SCOTTO DI CARLO, 1977).
Esses efeitos de microprosódia foram aprofundados em Scotto di Carlo (2005a), que
descreve as limitações fisiológicas dos cantores, e suas consequências sobre a produção
1 Memória proprioceptiva é a memória da percepção de posição e deslocamento, também responsável por
coordenar os movimentos da fala.

4
das consoantes cantadas, deixando sua duração intrínseca e elasticidade com valores
muito próximos aos das consoantes faladas.

Nesse mesmo estudo, a autora afirma que as vogais no canto são mais alongadas
por haver certa desaceleração significativa no ritmo, que é inerente à produção musical.
Há um consequente aumento da duração dessas vogais, fato que se deve à amplitude
considerável dos movimentos realizados pelos articuladores. A redução temporal das
consoantes e expansão vocálica são explicadas não somente pelas fortes restrições
aerodinâmicas enfrentadas na sua produção, mas, também, pelas limitações estéticas
necessárias para manter o legato, que é um dos parâmetros-chave da musicalidade.

Um autor que vem contribuindo com suas pesquisas há mais de cinquenta anos é
Johan Sundberg. Sua obra abrange diversos aspectos da produção cantada, desde a
análise acústica à percepção e simulação em laboratório dos efeitos da voz falada e
cantada.

Dentre seus trabalhos, em colaboração e/ou individual, destacam-se seus estudos


sobre a acústica da voz cantada (SUNDBERG, 1973), a sintonização formântica, ou
ainda, o formante do cantor (SUNDBERG, 1972), entre outros. Tais estudos evidenciam o
conforto obtido com o abaixamento de laringe, também observados e indicados nos
tratados de canto.

Alguns dos seus estudos com colaboradores trataram de esmiuçar tal sintonia com
testes perceptivos (CARLSSON-BERNDTSSON e SUNDBERG, 1991). As consequências
articulatórias, conforme já mencionado, são do abaixamento de laringe e abertura oral,
também observadas em outro estudo (SUNDBERG e SKOOG, 1999), notando-se a
dependência da abertura oral sobre o pitch e vogais nos cantores profissionais, pois,
segundo esse estudo, a princípio, tal gradiência de abertura oral ajudaria na sintonia de f0
com F1.

A diferença entre solistas e coralistas é observada em vários trabalhos. Em


especial, o trabalho de Rossing, Sundberg e Ternström (1985) faz a comparação acústica
do uso da voz no canto solista e coralista, com o emprego da análise espectral (espectro
médio de longo termo, LTAS) para observar o formante2 do cantor. Notou-se nesse estudo
que cantores solistas não dependem do acompanhamento para se manter fiéis à partitura
proposta.

2 Formante é a frequência de ressonância que mostra um pico de intensidade em torno de um tom.

5
Outro trabalho que Sundberg orientou é relativo aos efeitos da formação do cantor
solista. Em Murbe et al. (2003) são observados os efeitos da educação de um cantor
solista profissional sobre o retorno auditivo e cinestésico, visando um estudo longitudinal
do controle tonal dos cantores. Novamente, notou-se que os solistas não dependem do
acompanhamento.

Outros autores abordaram o mesmo assunto, com diferentes enfoques. Dalla Bella
et al. (2006) trata da proficiência cantada na população em geral, proficiência que estaria
correlacionada às diferenças de tempo, pois cantores ocasionais (amadores) tendem a
cantar mais rápido e com maiores erros de tom e duração.

Outros autores abordam a relação entre fala e canto no nível prosódico. Lehiste
(2004) observa esse tópico relativo à prosódia no canto e na fala: como é a manifestação
do sistema prosódico de uma língua no canto, que contrastes de duração têm
semelhantes oposições prosódicas em relação à melodia, ou, se a melodia da canção
interage com contrastes de tom, ou ainda, se a melodia ultrapassa contrastes prosódicos
baseados na entoação falada.

A mesma relação entre fala e canto é observada em Boersma e Kovacic (2006),


que avaliam as características espectrais de três estilos de canção folclórica croata, com
o emprego do LTAS como ferramenta de análise. De forma semelhante, De Anima e De
Audibilibus (ARISTOTELES, apud DUEY, 1946) tratam da arte vocal na antiguidade,
enfatizando a necessidade de maior abertura oral, trabalhos muito mais antigos em que
se nota a necessidade dessa abertura correlacionada à inteligibilidade na fala e no canto.

No Brasil, destacam-se alguns trabalhos semelhantes. Medeiros(2002) faz uma


comparação de aspectos fonético-acústicos entre fala e canto. Fazendo uso de
logatomas3 inseridos num trecho de uma canção de câmara brasileira, a autora avalia
medidas acústicas de duração, entoação e formantes dos segmentos dos logatomas em
posição acentual tônica, concluindo que tais vogais estão submetidas às restrições
musicais da afinação e do volume da nota musical, proposta na partitura.

Como Scotto di Carlo, a autora observa certa negociação entre a fala e o canto,
para manter inteligibilidade do texto com o “encurtamento” das consoantes no canto, além
do pareamento dos três primeiros formantes com os harmônicos entoacionais, sem haver
coarticulação no canto. Ainda, ela propõe que tal negociação implicaria em capacidades

3 Palavras sem sentido semântico, usadas em experimentos linguísticos.

6
cognitivas linguísticas e musicais.

Em trabalhos anteriores a este, foram observados aspectos segmentais e


prosódicos. Em Pessotti (2005) foram estudados aspectos segmentais de certas vogais e
dos róticos4, discutindo a influência da técnica vocal de origem italiana, ou a escola
italiana de canto, na pronúncia cantada em vernáculo, isto é, no português do Brasil, de
informantes paulistas.

Pessotti (2007) estudou aspectos prosódicos e seus reflexos sobre o estilo


empregado por cantoras líricas brasileiras na interpretação falada e cantada de uma
canção de câmara brasileira. A variação desses elementos prosódicos na fala e no canto
podem marcar estilo pessoal ou estilo de grupo (escola), observados nos dados acústicos
de fala e de canto, referentes à duração, à entoação e ao timbre, correlacionado à
variabilidade dos formantes. A variabilidade observada nesses três níveis reflete a escolha
do intérprete entre várias formas de interpretação, que dão mais ou menos peso aos três
fatores alvidados: o texto, a melodia e a escola.

1.3 Objetivo

O objetivo desse estudo é observar os efeitos decorrentes do treinamento e da


prática vocal profissional, através das análises de parâmetros fonético-acústicos que
possam constatar semelhanças e diferenças na fala e no canto. Os parâmetros estudados
são: tom, duração, intensidade e formantes.
Para tanto, foram escolhidos grupos de informantes, a saber: cantoras solistas
(SOL), cantoras coralistas (COR), e locutoras (LOC). As análises compararam os grupos
citados, e, considerando que fala e canto são modalidades diferentes, pautou-se as
seguintes hipóteses para caracterizar os grupos:
• H1: a fala é distinta entre os grupos;
• H2: entre os grupos, o canto tem semelhanças dependentes da formação musical,
e diferenças dependentes da prática e do treinamento vocal; e
• H3: fala e canto refletem identidade de grupo através das semelhanças/diferenças
observadas nos parâmetros acústicos, que indicam possíveis usos dos

4 Róticos no português brasileiro (PB) pertencem ao conjunto sons que se assemelham (alofones)
mantendo mesma função fonológica. O [r], vibrante múltipla, foi analisado no estudo citado.

7
articuladores semelhantes ou diferentes entre os grupos.

1.4 Fatores envolvidos

Conforme já mencionado, diversos fatores podem influenciar a produção da fala e


do canto. Dentre eles está experiência e seus reflexos quanto à prática continuada, em
outras palavras, a proficiência e a prática profissional.
Esses dois fatores dependem do tipo e do tempo de formação que o indivíduo ou
grupo recebem. Consequentemente, podem ter efeitos que são observados como
gradientes, pois cada indivíduo tem seu processo particular de aprendizagem e
assimilação de conhecimento. Ainda, nota-se que determinados grupos apreendem com
maior rapidez certos conceitos ou habilidades motoras de forma distinta. É o caso dos
músicos, que podem tocar bem um instrumento ou instrumentos, mas, muitas vezes não
cantam.
Como compreender a proficiência canora? Assume-se que ela depende de
aprendizado dentro de uma linha de estudos ou estética, aqui assumida como escola,
além da prática cotidiana. Tal proficiência tem diferentes níveis, dependentes do tempo de
prática e imersão dentro de tal escola. Logo, mesmo com as diferenças entre a prática do
canto erudito e a do rap, ou de outros gêneros de canto popular, todos dependem do
tempo de prática e inserção nos seus ambientes. Neste trabalho foi analisado um padrão
de canto, o canto de câmara, deixando para trabalhos futuros a análise e enfoque de
outros gêneros.
Há várias formas de emissão cantada dentro do conceito de canto erudito. Sem
dúvida, o Bel Canto foi o período que mais influenciou o século XIX, com reflexos até
hoje. A emissão sofreu mudanças ao longo dos séculos, principalmente na escola Italiana
(PACHECO, 2002 e 2005). Tal emissão cantada não teria a mesma aceitação na música
de câmara brasileira (ANDRADE, 1938), pois, segundo o autor, criaria algo como
“sotaque italianizado”. Neste trabalho, foram escolhidas informantes que conhecem tais
efeitos, mas, procuraram seguir as normas para a pronúncia do canto em português
brasileiro.
A habilidade de falar pode ser entendida como instrumental a partir do momento
que se faz uso dela em uma profissão, como acontece com os cantores, locutores, atores,

8
oradores, professores, entre outros. Essas práticas profissionais dependem de
treinamento, como já mencionado. Em especial, a prática do canto e da locução
profissionais tornam o indivíduo mais proficiente com o tempo, com o aprimoramento da
técnica que acontece com a prática cotidiana.
Deve-se considerar que o aprendizado musical tem semelhanças com a aquisição
de linguagem, quer de primeira ou de segunda língua. O indivíduo depende de prática
continuada e imersão no meio musical para atingir a proficiência necessária na prática
profissional, se assim deseja. O mesmo indivíduo tem a mesma necessidade de imersão
ou prática cotidiana para o aprendizado da língua materna ou segunda língua.
Como observado por estudiosos desses fenômenos (FLEGE, 1988; SANCIER e
FOWLER, 1998), existe a possibilidade da transferência de traços da língua materna para
a segunda língua, e vice-versa, num processo de interação que resulta em modificações
da atividade de fala desses indivíduos. O aprendizado musical tem processo semelhante,
pois, quando se aprende a tocar um instrumento da família das cordas é mais fácil
aprender outro instrumento da mesma família. O mesmo ocorre com outros instrumentos,
como madeiras ou percussão.
Ocorreria o mesmo processo no canto em relação à fala? Haveria traços que se
transferem da fala para o canto, e vice-versa, como acontece no aprendizado de línguas?
Seria possível observá-los de que forma?

1.5 Estrutura da tese

Como já dito, esse trabalho tem essa finalidade: observar os efeitos do treinamento
e da prática vocal profissional no canto e na fala. Que efeitos seriam esses? Quais seriam
os traços a observar?
A Metodologia explicita os procedimentos adotados para essa tarefa. O capítulo 3
faz a análise da concepção idealizada de uma canção, a partitura, sob os aspectos da
letra e da música, de onde foram extraídos os parâmetros para as análises das
gravações. Essas, serão discutidas em dois capítulos, sobre as gravações de fala
(capítulo 4) e de canto (capítulo 5).
Notou-se durante o trabalho a importância das tônicas como local próprio para
distinções e semelhanças entre os grupos. Por isso, foram analisadas à parte no capítulo
6. O último capítulo faz as discussões e considerações finais.

9
10
2 Metodologia

11
12
2.1 Considerações Preliminares

Em muitas culturas, a fala é considerada como referência ideal para o canto. A


explicação é baseada no fato de o canto conter os conteúdos musical e linguístico,
simultaneamente. Neste trabalho são analisados dados de fala e canto, por isso, a
metodologia aqui adotada é mais complexa.

A metodologia empregada na análise de dados acústicos de fala é comum à


Fonética e à Fonologia de Laboratório. Aqui são descritos os procedimentos empregados
nas análises em busca de indicadores, de uma hierarquia de variáveis que caracterizem
as semelhanças e diferenças entre essas produções, falada e cantada.

2.2 Descrição dos procedimentos de análise de partitura e letra.

O primeiro objeto a ser investigado é referente à representação categórica da


canção, que pode dar pistas quanto à interpretação. Nesse sentido, a partitura, que é
criação do compositor, interpretada posteriormente pelo artista, se torna fonte de dados
preditores. Os dados produzidos a partir dessa categorização são nominais e remetem a
tratamento e análises específicos, não-paramétricos.

Considerando-se esses pontos, e os dados extraídos da partitura de acordo com o


procedimento descrito em Pessotti (2007), foram feitas análises não-paramétricas com os
dados da canção em foco (Conselhos, de Carlos Gomes – anexo II), posteriormente
gravada pelas informantes, para se observarem as possíveis interações existentes entre
música e texto.

Os dados de duração, entoação (doravante, termo referente à f0), e fronteiras


prosódicas foram obtidos das partituras, e categorizados em proeminência de tom, de
duração, tonicidade, tempo forte, conforme descrição detalhada que segue, e aplicados
aos dados obtidos das gravações. As partituras oferecem parâmetros acústicos
idealizados, obtidos através da conversão dos valores da nota musical, referentes à
duração em segundos (s) e à entoação (f0) em Hertz (Hz). Esses valores idealizados
podem divergir daqueles obtidos na gravação de intérpretes/informantes, já que foram

13
estimados e categorizados.
Os dados referentes às proeminências foram obtidos via derivada primeira das
curvas de duração e f0. Tal procedimento não replica o processo semelhante executado
em Pessotti (2007). Suspeitou-se que alguns alinhamentos observados nas partituras não
se ajustavam ao se aplicar o método da razão tonal (DILLEY, 2005). A aplicação da
derivada primeira produziu resultados mais coerentes com a variação de tom e duração
observada diretamente nas partituras, justificando a troca de procedimento.
Eis as categorias aplicadas à partitura em análise que permitiram contagem de
frequência de ocorrência para a realização de testes não paramétricos:
• Tonicidade linguística: sílaba tônica/átona do texto,

• Posição de Sintagma Entoacional (pos_SE): sílaba ocorrendo nos limites do


sintagma entoacional à direita (SED) ou à esquerda (SEE), ou em posição
medial (SEM), de ordem linguística,

• Posição de Sintagma Fonológico (pos_SF): sílaba ocorrendo nos limites do


sintagma fonológico à direita (SFD) ou à esquerda (SFE), ou em posição medial
(SFM), de ordem linguística,

• Tempo musical: forte/fraco, da partitura,

• Proeminência linguística de Duração (proemDur): sim/não, há ou não


proeminência de duração,

• Proeminência linguística de Tom (proemTom): pico/platô; há proeminência, pico


na curva da derivada, ou, não há proeminência, platô na mesma curva,

• Ocorrência de pausas musicais (pausas): presente/ausente na partitura.

Com as frequências dessas categorias na partitura, foram realizados testes não


paramétricos de Pearson (2 :chi-quadrado), Fisher exato, V de Cramer, e desvios
(resíduos) de Freeman-Tukey, a fim de evidenciar associação entre variáveis de texto e
variáveis relacionadas à composição musical. Adotou-se o nível de significância a 5% com
o teste de Bonferroni, com valores críticos de Sokal-Rohlf (1995).

Células com frequências muito baixas dificultam a solução do problema da


avaliação das associações entre categorias. Para evitar esse problema com a análise em
questão, e considerando certas alternativas ao uso do erro médio, optou-se pelo teste
exato de Fisher (1932), recomendado por Sokal e Rohlf (1995).

14
2.3 Descrição da metodologia de gravação e análise dos dados
acústicos.

Num primeiro olhar sobre o falar e o cantar nota-se que a variabilidade de ambos
passa basicamente pelos níveis duracional e entoacional. Quem tem a fala como
instrumento profissional como locutores e cantores usa o trato vocal para tarefas distintas,
ou seja, locuções profissionais e não profissionais. Ajustes na realização dessas tarefas
têm consequências acústicas e articulatórias que podem ser mensuradas.

Com esses dados, pode-se empregar para a análise diversos métodos comuns em
Fonética Experimental e Fonologia de Laboratório. Aqui se emprega a metodologia quasi-
experimental (CAMPBELL e STANLEY, 1963, 1966; COOK e CAMPBELL, 1979; WOODS,
FLETCHER e HUGHES, 1989).

Na investigação experimental há controle e manipulação deliberados, que visam


determinar pontos de interesse, com manipulação de uma variável (independente), e a
observação do efeito dessa mudança em uma ou mais variáveis (dependente). Esse
isolamento e controle de variáveis permite estabelecer certa casualidade, que é própria ao
ambiente de laboratório. Nesse caso, a amostragem é necessariamente aleatória.

Na investigação que envolve um quasi-experimento os grupos não são aleatórios,


ou ainda, são pré-selecionados de acordo com certo critério adotado. Esse método exige
grande quantidade de dados, normalmente obtidos por várias repetições, permitindo
testar múltiplas variáveis (análise multivariada), além de não necessitar de longos
períodos de observação na coleta de dados.

Aqui, observam-se os efeitos do treinamento e da prática vocal sobre o canto e a


fala com o auxílio da metodologia quasi-experimental. As gravações foram feitas com
cinco repetições de fala e de canto por grupos distintos, com sujeitos aleatoriamente
escolhidos, mas, nivelados quanto ao tom de fala.

15
2.4 Justificativa da escolha dos sujeitos e montagem do corpus.

Procurou-se escolher e analisar informantes com mesmo tipo de voz, tendo-se


optado por sopranos, mulheres, com f0 médio em 220Hz, aproximadamente. Aqui,
trabalhou-se com não cantoras e cantoras para distinguir fala e canto, e, para isso,
procurou-se escolher as não cantoras com mesmo tipo de voz, locutoras de rádio (LOC),
ou seja, também profissionais. Elas foram avaliadas de oitiva e a corroboração da escolha
veio a partir da análise preliminar dos dados acústicos.

A entrevista feita nas gravações permitiu dividir as cantoras em solistas (SOL) e


coralistas (COR) e observar o grau de experiência profissional e treinamento vocal de
cada uma. Os critérios de seleção foram o número de apresentações como solistas,
inclusive fora do Brasil, e o tipo de trabalho realizado: concertistas, coralistas, cantoras de
eventos, ou professoras de canto/técnica vocal.

As LOC tem entre 30 e 45 anos, tiveram formação não formal em música, não cantam
em grupos, corais ou como solistas, porém, fazem uso profissional da voz no rádio. As
COR tem entre 18 e 41 anos, cantam em grupos ou corais e realizam pequenos solos,
porém, não tem essa atividade canora como profissão. Já as SOL tem entre 23 e 51 anos,
atuam como solistas em corais, óperas, e têm atividade pedagógica vocal grande (aulas
de canto), além de atuarem em gravações de jingles e peças de teatro, com pelo menos
uma atuação no exterior como solistas, quer em concerto de câmara, quer ópera.

Para comparar fala e canto foi escolhido o texto da canção Conselhos (Carlos
Gomes), cuja partitura (linha vocal e piano) está no anexo II. Esse texto tem 195 sílabas,
segmentadas conforme metodologia descrita adiante. Ele foi lido por todos os grupos e
cantado por SOL e COR, não declamado, com a execução sem e com acompanhamento
digital. A taxa de elocução obtida na leitura realizada pelas locutoras justificou a pulsação
escolhida posteriormente para o acompanhamento.

Também foram gravados dados de fala de gêneros textuais distintos, que, no


entanto, devido ao volume de dados, foram reservados para futuros estudos, sendo eles:
texto jornalístico (255 palavras sem repetição, aproximadamente 400 sílabas) poesia
(cinco repetições com 119 palavras, aproximadamente 1500 sílabas), e fala coloquial
condicionada por entrevista, totalizando em torno de 12h30min de gravações e 64800
ocorrências silábicas.

16
2.5 Método de gravação, descrição de variáveis e segmentação

Os dados de produção falada e cantada foram gravados em estúdio profissional. A


taxa de amostragem inicial de 96KHz estéreo foi ajustada posteriormente para 16KHz
mono para as análises. A seguir, são descritos os métodos semiautomáticos de
segmentação e análise, e as variáveis e estimativas empregadas.

2.5.1 Método de segmentação e análises semiautomáticas.

Para o processamento desses dados foram criadas rotinas (scripts) específicas


dentro dos programas Praat (www.praat.org) e R (www.r-project.org), ambos de domínio
público, afim de extrair e analisar os dados. A extração dos formantes foi elaborada a
partir da rotina criada por Oliveira e Arantes (2009), adaptada para a extração automática
de várias séries de dados e montagem das tabelas do corpus. Com o programa
MuseScore versão 0.95 (www.musescore.org) foram criados o acompanhamento musical
digitalizado, a linha melódica e a duração silábica. Todos esses parâmetros foram obtidos
da partitura e usados como referência para a produção cantada.

Num primeiro momento, as gravações foram segmentadas manualmente.


Posteriormente, elas foram reavaliadas com o uso do algoritmo de Alinhamento Temporal
Dinâmico (Dynamic Time Warping, doravante DTW, de acordo com ITAKURA, 1975;
MYERS, RABNER e ROSENBERG, 1980; COLEMAN, 2005; MORI ET AL. 2006). Várias
são as aplicações desse algoritmo, principalmente em reconhecimento de padrões visuais
ou de fala.

O DTW é usado para ajustar séries temporais, e permite avaliar a similaridade, ou


melhor, o grau de semelhança entre duas séries comparadas (MEYER e BUCHTA, 2009;
LI ET COLS, 2010). Especificamente, o algoritmo DTW fornece uma solução eficaz para o
problema de medida de similaridade entre duas séries temporais (cadeias sonoras) de
fala de comprimentos diferentes (LEITNER ET COLS., 2010).

17
O gráfico seguinte mostra um exemplo dessa aplicação. As segmentações foram
reavaliadas por meio dessa técnica de alinhamento, permitindo correção das
segmentações realizadas manualmente.

Figura 2.5.1: Alinhamento Temporal Dinâmico de séries entoacionais

O gráfico apresenta o alinhamento de séries temporais via DTW. Ele mostra dois
eixos de índices, de referência e de consulta, para dados de entoação (f0, em semitons)
de uma informante na produção falada. Os índices de referência pertencem à amostra
que é usada como “padrão” de comparação, enquanto que os índices de consulta
pertencem à amostra que será analisada. O ajuste da curva de alinhamento permite
aproximar, ou melhor, alinhar as duas amostras através dos índices gerados pelo
algoritmo.

18
2.5.2 Descrição das Variáveis

2.5.2.1 Variáveis Acústicas e Categóricas

As variáveis acústicas são f0, duração, intensidade do nível de pressão sonora


(SPL) e formantes. As medidas de f0, em Hertz (Hz) foram convertidas em semitons (st),
com referência em 440Hz, para padronizar fala e canto, permitindo assim a comparação
direta. A duração foi medida em segundos (s); intensidade em decibéis (dB); e os
formantes F1, F2 e F3, em Hertz, tendo posteriormente sido convertidos em Bark.

As variáveis categóricas são: grupo; padrão acentual (PA); tonicidade (TN);


sintagma fonológico (SF); sintagma entoacional (SE) (NESPOR e VOGEL, 1986;
SELKIRK, 1984); posição de proeminência de sintagma entoacional (PSE); e posição de
proeminência de sintagma fonológico (PSF), conforme já explicado para a partitura.

Grupo compreende as informantes LOC, COR e SOL. O padrão acentual (PA) é


definido segundo Mattoso Câmara (1970 e 1977): 0 para as pós-tônicas, 1 para as
pretônicas, 2 para as tônicas não proeminentes, e 3 para as tônicas proeminentes. A
Tonicidade (TN) é definida como fraca (w) ou forte (s), segundo Hayes (1985).

A duração e os limites de Sintagma Fonológico (SF) e Sintagma Entoacional (SE)


foram medidos e avaliados, e suas posições de proeminência nas linhas de letra foram
categorizadas à esquerda, medial ou à direita. Assim, recapitulando, a posição de
proeminência de sintagma entoacional (PSE) compreende as categorias à esquerda (SEE
), medial (SEM), e à direita (SED). A posição de proeminência de sintagma fonológico
(PSF) recebe rótulos semelhantes à posição de sintagma entoacional (SFE, SFM, SFD).

2.5.2.2 Variáveis Estimadas

A variabilidade formântica de cada produção é decorrente da articulação da


mandíbula, do corpo da língua e dos lábios. Duas variáveis foram estimadas para analisar
os seus efeitos: a Área de Espaço Vocálico (VSA, Vowel Space Area) e a Razão de
Centralização Formântica (FCR, Formant Centralization Ratio). Ambas foram analisadas
para cada posição acentual (pretônica, tônica e pós-tônica).

19
2.5.2.2.1 Área de Espaço Vocálico

A observação dos espaços vocálicos pode dar pistas da atividade articulatória


executada pelas informantes. Esses espaços foram estimados pelas regras de
triangularização, de acordo com a Geometria Plana, segundo a fórmula de Heron. A sua
observação permite fazer inferências sobre abertura/fechamento e
posterização/anteriorização, decorrentes, como já se disse, da atividade dos articuladores
mandíbula, lábios e língua (LINDBLOM e SUNDBERG, 1971).

Os formantes, medidos em Hertz, foram usados no cálculo dos espaços vocálicos a


partir da conversão em Bark. Essa medida psicoacústica está relacionada à percepção, e
é também conhecida como medida de banda crítica. Sua conversão foi feita pela
transformação de Traunmuller (1990). As vogais foram rotuladas de acordo com o texto
da partitura, não tendo sido consideradas as vogais nasais e os encontros vocálicos
(ditongos e hiatos).

2.5.2.2.2 Razão de Centralização Formântica

A Razão de Centralização Formântica (FCR) é uma nova medida para a avaliação


global das distâncias relativas entre as vogais dos falantes (SAPIR et al., 2010). Esse
procedimento é empregado para normalizar os formantes vocálicos, e usado para reduzir
a variabilidade associada ao falante nos estudos de percepção vocálica (ADANK, SMITS,
e van HOUT, 2004).

A avaliação da variabilidade dos espaços vocálicos com essas duas estimativas,


VSA e FCR, permite fazer inferências sobre a produção da fala. Valores altos de FCR
refletem centralização das vogais, ao passo que valores baixos indicam a sua expansão.
Vogais centralizadas mostram possível imprecisão articulatória e consequente menor
inteligibilidade, enquanto vogais periféricas indicam precisão.

2.6 Análise fonológica do corpus

Por tratar-se de um único texto, a canção teve o mesmo tipo de segmentação e


análise fonológica nas duas produções, falada e cantada. Ainda que outros trabalhos

20
citem pelo menos quatro níveis prosódicos com base em evidências duracionais
(WIGHTMAN et al. 1991; LADD e CAMPBELL 1991), adotou-se aqui os níveis
hierárquicos de constituintes prosódicos que muitos trabalhos consideram em seus
experimentos: os sintagmas entoacional e fonológico, segundo a nomenclatura de Nespor
e Vogel (1986).
Diversas teorias linguísticas descrevem de forma semelhante a estrutura
hierárquica da prosódia, com diversos níveis (LIBERMAN e PRINCE, 1977; SELKIRK,
1980, 1984; BECKMAN e PIERREHUMBERT, 1986; NESPOR e VOGEL, 1983; LADD,
1986). Nessas abordagens, é comum a estrutura prosódica ter pelo menos dois níveis de
constituintes: o sintagma entoacional e o sintagma fonológico. Esse último sintagma
(fonológico) é chamado de intermediário na terminologia de Beckman e Pierrehumbert.
Para os autores citados, a sentença é composta de sequência(s) de sintagmas
entoacionais, que, por sua vez, são compostos de sequências de sintagmas fonológicos,
onde as pausas são consideradas quebras entre sintagmas. Assim, a quebra de sintagma
entoacional é percebida como mais forte ou mais saliente que a quebra de sintagma
fonológico. Ainda, os sintagmas entoacionais são delimitados por fronteiras tonais, e os
sintagmas fonológicos são, teoricamente, marcados com acento frasal, onde os
marcadores inflexão de curva entoacional podem ser altos ou baixos (BECKMAN e
PIERREHUMBERT, 1986).
Em outras teorias de entoação (por exemplo t´HART, COLLIER e COHEN, 1990),
os marcadores entoacionais também ocorrem nas fronteiras acentuais, mas são
identificados com o movimento, e são ambos referidos como elevação e/ou abaixamento.
A transição entre os constituintes prosódicos costuma também ser marcada por
alongamento segmental e silábico em final de sintagma (WIGHTMAN et al., 1992).

21
2.6.1 Dados de Fala

A seguir são descritas as análises do corpus de fala, considerando-se o modelo


fonológico descrito anteriormente.

2.6.1.1 Texto da Canção

A observação das amostras gravadas da produção falada com o texto da canção


revelou uma estrutura similar quanto à produção das pausas nas fronteiras prosódicas. As
pausas em fronteiras prosódicas previstas pelo modelo adotado foram confirmadas pelas
gravações de fala com uma taxa de concordância de aproximadamente 72% entre os
dados observados e o modelo (esperado). Esse fato levou adotar a segmentação dos dois
constituintes prosódicos citados (sintagmas entoacional e fonológico), primeiramente, com
posterior avaliação por parte de juízes, os quais observaram o texto, sem explicitar
marcadores de pontuação, e colocaram as devidas marcas de pausas e fronteiras,
obtendo aproximadamente 69% de concordância.
Para avaliar e comparar a proeminência tonal ou a duracional, ou ainda, a
combinação das duas foram calculadas as derivadas primeiras das curvas dos dados de
duração e entoação. Esse procedimento permitiu observar que 85 % dos dados de fala
tiveram fronteiras coincidentes. Com base nesses resultados preliminares assumiu-se nos
níveis sintagma entoacional (SE) e fonológico (SF) a seguinte estrutura de segmentação:

22
SE01:[Menina venha cá]SF01 [veja o que faz]SF02
SE02:[Se por seu gosto o casamento quer]SF03
[a vontade ao marido há de fazer]SF04
SE03:[que este dever o casamento trás]SF05
SE04:[Se o homem velho for ou se ainda rapaz]SF06
[tome tome a lição que ele quiser lhe dar]SF07
SE05:[Se funções e contra danças não quiser]SF08
[também não queira que é melhor]SF09
[pra não brigar]SF10
SE06:[Menina venha cá veja o que faz]SF11
SE07:[Procure de agradar sem contrariar]SF12 [pronta sempre a obedecer]SF13
SE08:[Tenha dele cuidados com amor enquanto ao resto deixe lá correr]SF14
SE09:[Se ainda muito moço e arrebatado for]SF15
[nada nada de ciúmes que seria pior]SF16
SE10:[Oh menina venha cá]SF17 [veja o que faz]SF18
SE11:[A mulher só faz o homem bom e mau]SF19
SE12:[Que assim como dá pão]SF20 [pode dar pau]SF21
SE13:[Ai]SF22

Nas proeminências em que as falantes apresentavam um percentual de


concordância baixo, a estrutura foi atribuída segundo o algoritmo preconizado pelo
modelo fonológico adotado. Com isso, a segmentação final atribuída foi aquela feita pela
maioria das informantes, em concordância com os resultados obtidos pela análise de
julgamento, e pelas análises via derivada primeira. Várias pausas apareceram em menor
número e em fronteiras possíveis e previsíveis pela teoria adotada.
As pausas foram segmentadas, incluindo algumas menos numerosas e de menor
duração, mas, não analisadas. Elas apresentaram alta variabilidade duracional em
diversos contextos sintagmáticos, ainda que previsíveis pela teoria. Tal variabilidade é,
aliás, uma questão controversa entre vários autores que abordam a hierarquia prosódica.
A recursividade algorítmica adotada por modelos hierárquicos pode, em alguns casos,

23
criar categorias prosódicas não concordes, ou até duvidosas para algumas línguas, como,
por exemplo, os clíticos na abordagem de Nespor e Vogel. Outros níveis hierárquicos são
concordes, como nos níveis entoacional e intermediário nas abordagens de SELKIRK
(1980, 1984) BECKMAN e PIERREHUMBERT (1986), e NESPOR e VOGEL (1986). A
figura a seguir mostra a aparência final da segmentação.

Figura 2.6.1: Segmentação dos dados do corpus.

2.6.2 Dados de Canto

Como já explicado, os dados da produção cantada foram obtidos da canção de


câmara Conselhos, composta por Carlos Gomes. Essa canção tem em seu subtítulo um
indicativo da sua “filiação” à música popular brasileira. Ela foi escolhida por ter sua
tessitura próxima à tessitura da produção falada no Português Brasileiro (PB). Sua
segmentação seguiu os pressupostos explicitados anteriormente.

24
2.6.2.1 Produção cantada sem acompanhamento

A produção cantada sem acompanhamento foi gravada cinco vezes pelas


coralistas (COR) e solistas (SOL). Como foi dito, espera-se que essa produção seja
distinta entre os grupos de informantes. Se as solistas (SOL) mantiverem menor
variabilidade de produção nos três tipos de variáveis (duração, entoação e espaços
vocálicos) do que as coralistas (COR), ter-se-á um efeito da proficiência, que é
condicionada pelo treinamento e prática vocal.

2.6.2.2 Produção cantada com acompanhamento

A produção cantada com acompanhamento foi gravada cinco vezes pelas cantoras
(COR e SOL). Como já foi dito, espera-se que essa produção seja semelhante entre os
grupos dois grupos de informantes. Se as solistas (SOL) mantiverem a mesma
variabilidade de produção nos três tipos de variáveis (duração, entoação e espaços
vocálicos) que as coralistas (COR), supõe-se que elas se apoiem em recurso cognitivo
externo, no caso, o acompanhamento musical

2.7 Comparação entre Partitura e Interpretações Cantadas quanto a f0


e duração

Com dados categóricos originados das partituras, e gravações das performances


cantadas e lida, fez-se a comparação dos dados de duração e entoação (f0) a fim de
avaliar o pareamento entre produção e idealização. Esse problema já havia sido abordado
em Pessotti (2007), onde se suspeitou que tais produções eram muito semelhantes. Aqui
procurou-se reavaliar esse procedimento por meio da análise estatística inferencial
(ANOVA), uma vez que os dados são em maior quantidade.

25
2.8 Análises Estatísticas: Descritivas e Inferenciais.

2.8.1 Análises Descritivas

As análises estatísticas empregadas foram de dois níveis: descritivas e


inferenciais. As análises descritivas servem para ter uma visão geral dos dados, ou ainda,
explorar seu comportamento e tendências.
Para tanto, foram empregadas medidas de tendência central e dispersão,
histogramas e gráficos de médias com desvio-padrão. Primeiramente fizeram-se análises
exploratórias com os dados da partitura da canção e, posteriormente, com os dados
acústicos coletados e estimados.

2.8.2 Análises Inferenciais

As análises inferenciais realizadas permitiram aprofundar as descrições e


tendências encontradas na estatística descritiva dos dados. Elas foram realizadas com
testes de comparação de médias (teste t) quando há dois grupos, e Análise de Variância
(ANOVA) com mais grupos (SOL, COR, LOC).

26
3 Resultados e Análises: Partitura e Letra

27
28
3.1 Considerações Preliminares

Neste estudo assume-se que canto e fala se assemelham por transmitirem


informação com os mesmos aparatos, mais especificamente, com o trato vocal. Com essa
premissa, assume-se que o falante possivelmente ajusta, “sintoniza”, ou nos termos da
teoria de Traunmuller (1998), faz a modulação dos gestos articulatórios para executar as
diferentes produções, falada ou cantada. Ainda, segundo o autor, a percepção pode ser
assim considerada como o processo inverso. Esse processo de demodulação por parte
do ouvinte permite que ele possa replicar o que ouve.
Nessa perspectiva, a inteligibilidade pode estar correlacionada à percepção do que
é produzido pelo falante ou cantante. Ao se cantar certo texto, é preciso manter a mínima
inteligibilidade, que é muitas vezes requerida e melhor realizada por indivíduos/sujeitos
que se mostram mais proficientes com as práticas orais da língua em uso e, no caso, com
a composição musical.
Como a produção falada e a produção cantada possuem diferenças de modulação,
investigou-se três variáveis (duração, entoação e espaços vocálicos) que podem indicar a
mínima inteligibilidade requerida e executada pelas informantes descritas no capítulo
anterior (Metodologia).
Este capítulo descreve as análises exploratórias dos dados da partitura, e os
capítulos seguintes (4 e 5) descrevem as análises dos dados acústicos coletados,
considerando a estatística descritiva básica, via medidas de tendência central e de
dispersão. Os resultados aqui descritos mostraram que a tonicidade está correlacionada a
fatores linguísticos e musicais, bem como à manutenção da estrutura linguística. As
análises inferenciais realizadas naqueles dois capítulos (4 e 5) servem para a reavaliação
dos resultados da estatística descritiva dos dados acústicos e a comparação com os
dados analisados neste capítulo.

29
3.1.1 Análise Exploratória em Partituras

Canção é o resultado da interação entre letra e música. Considerando essa


premissa, assume-se a partitura como fonte de dados preditores de certa produção,
concebida pelo compositor, cuja interpretação cabe ao artista. Esse decidirá e realizará a
melhor performance da obra dentro de certas convenções estabelecidas, quer por certa
linha interpretativa, quer por certos parâmetros consagrados pelo gosto de certa audiência
(público).

Como se viu, a partitura é fonte de dados preditores, os quais podem ser


categorizados ou não. Dados nominais ou categóricos não são medidos, são contados e
considerados quanto à frequência de ocorrência. Tais dados não paramétricos porque as
distribuições de frequência não obedecem à curva normal. Foram feitas análises não-
paramétricas com os dados da canção (Conselhos, de Carlos Gomes – anexo II) gravada
pelas informantes, para se observar as possíveis interações existentes entre música e
texto.

3.1.1.1 Análise das associações entre categorias linguísticas e musicais

Os dados de duração e f0 (contínuos), e fronteiras prosódicas (categóricos) foram


todos obtidos da partitura, conforme descrição e segmentação fonológica previamente
descritas. Os parâmetros acústicos esperados foram calculados (no caso dos dados
contínuos) e categorizados (no caso das fronteiras prosódicas).
Como anteriormente exposto, os dados referentes às proeminências de tom e de
duração foram estimados via cálculo da derivada primeira das curvas de duração e f0,
conforme descrito no capítulo anterior. A aplicação da derivada primeira produziu
resultados mais coerentes e, possivelmente, esse procedimento poderia ser aplicado a
outras partituras5.
Retomando, os dados categóricos obtidos da partitura em análise são: Tonicidade,
Posição de Sintagma Entoacional (pos_SE), Posição de Sintagma Fonológico (pos_SF),
Tempo, Proeminência de Duração (proemDur), Proeminência de Tom (proemTom),
Pausas. Com os cômputos de frequência, foram realizados os testes não paramétricos
5 Aqui são relatados os resultados para Conselhos. O mesmo procedimento foi realizado em outras quatro
canções, com resultados semelhantes, e serão reportados em trabalhos futuros.

30
descritos anteriormente:

• Associação: Pearson (2), valor exato de Fischer;

• Força da associação: V-Cramer;

• Significância por célula: desvios de Freeman-Tukey, com valores críticos de


Sokal-Rohlf (Sokal e Rohlf, 1981).

Variáveis significância
Tônica versus Sintagma Fonológico à Direita (SFD) S
Tônica versus Sintagma Entoacional à Direita(SED) S
Tônica versus Ocorrência de Pausa (presente) S
Tônica versus Proeminência de Tom (pico) S
Tônica versus Proeminência de Duração (sim) S
Tônica versus Tempo (forte) S
SFD/SED pareado com SFE/SEE S
SFD versus Ocorrência de Pausa (presente) S
SFE versus Proeminência de Tom (pico) NS
SFD versus Proeminência de Duração (sim) S
SFD versus Tempo (forte) S
SED versus Ocorrência de Pausa (presente) S
SEE versus Proeminência de Tom (pico) NS
SED versus Proeminência de Duração (sim) S
SED versus Tempo (forte) S
Ocorrência de Pausa (presente) versus Proeminência de Tom (pico) NS
Ocorrência de Pausa (presente) versus Proeminência de Duração (sim) S
Ocorrência de Pausa (presente) versus Tempo (forte) S
Proeminência de Tom (pico) versus Proeminência de Duração (sim) S
Proeminência de Tom (pico) versus Tempo (forte) S
Proeminência de Duração (sim) versus Tempo (forte) S
Tabela 3.1: Resumo das análises não paramétricas da partitura de Conselhos
(Carlos Gomes); S – resultado significativo; NS – resultado não significativo.

A tabela 3.1, expandida no anexo I (tabela 9.1), mostra os resultados significativos


da análise não paramétrica de Conselhos, com os valores realçados, para os testes  2 e
V-Cramer. Esses resultados mostram que onde há uma sílaba tônica (tonicidade), há
possível proeminência de tom e de duração, e o tempo é considerado forte. Esses
resultados são esperados, pois tais sílabas estão em fronteiras prosódicas que são
marcadas por pausas, à direita e/ou à esquerda desses sintagmas.

Os altos valores de V-Cramer para as variáveis referentes à proeminência de


duração, pausa, posição de sintagma fonológico e entoacional, tem alta significância na
correção de Fisher e em 2. Esse resultado é esperado e mostra possível coerência entre

31
a partitura e o texto, entre o musical e o linguístico.

A tabela expandida no anexo I (tabela 9.2) mostra os valores assinalados na tabela


anterior considerados significativos, de acordo com o procedimento de Sokal-Rohlf. A
associação constatada via correção de Sokal-Rohlf aplicada ao teste de Freeman-Tukey
mostra que as fronteiras prosódicas são mais significativas em proeminências de duração
que em proeminências de tom.

Esses resultados evidenciam, também, relações linguísticas esperadas, como o


encontro das fronteiras prosódicas em níveis sintagmáticos hierárquicos (SFD e SED
pareados com SFE e SEE), sintagmas fonológico e entoacional à direita com ocorrência
de pausas, tempo forte e proeminência de duração. Tal proeminência se dá devido ao
alongamento silábico de fronteira, que é esperado na produção cantada, assim como na
produção falada.
O alinhamento tonal nas fronteiras prosódicas é aparentemente respeitado como
restrição linguística, como se pode notar nos resultados da análise da peça. A
significância para a associação entre posição tônica e a ocorrência das proeminências de
tom também é esperada no nível linguístico. Esse fato é coerente com a não significância
da ocorrência de pausas em fronteiras prosódicas à esquerda (SFE e SEE).
Esses resultados preliminares podem dar pistas para tentativa dos compositores de
criar canções que reflitam as estruturas da língua, esperando que os intérpretes recriem
essas estruturas nas suas “releituras” (performances). Tal busca é comum nas canções de
cunho popular, pois supõe-se que, nesse gênero, haveria maior compromisso com a
inteligibilidade e com a manutenção das estruturas sintagmáticas da língua.
Considera-se que a busca pela inteligibilidade é uma demanda do gênero música
popular. É interessante notar que Conselhos é considerada música de “cunho popular”, e
traz inclusive em sua partitura esse indicativo, embora ela faça parte do repertório
camerístico brasileiro. Pensando nessa valorização da inteligibilidade que a música
popular busca  de acordo com Tatit (1996)  pode-se levantar a hipótese de que a
palavra falada no canto deixa de ser instrumento simples, perde parta da sua função
fonológica e da pertinência linguística, e ganha uma função fonética suplementar,
tornando-se instrumento musical, sem perder sua inteligibilidade.
Os resultados até aqui obtidos mostram que a partitura musical sustenta a
idealização da manutenção das restrições linguísticas, pois o texto em análise não
apresenta perda da sua função fonológica nem da pertinência linguística. No entanto,

32
essas funções podem ser alteradas na produção, pois o que foi observado aqui é a
idealização e não a cadeia sonora gravada que seria resultante da performance de um
intérprete.

3.1.1.2 Análises das Estimativas Acústicas da partitura a partir das


categorias da letra

Antes de ser feita a análise acústica das produções gravadas serão aqui
detalhadas as análises das estimativas acústicas obtidas dos dados da partitura, cuja
finalidade é realizar posterior comparação com os dados das gravações. Foram
estimados valores para duração e entoação, adotando-se a taxa de 75 bpm para estimar
a duração em segundos (s). As estimativas para entoação (f0) foram obtidas em semitons
(st), com o referencial em 440Hz.

33
D e n s id a d e d e P r o b a b ilid a d e d e C o n s e lh o s - D u r a ç ã o

3 .0
2 .5
d e n s id a d e d e p ro b a b ilid a d e

2 .0
1 .5
1 .0
0 .5
0 .0

0 1 2 3 4

N = 195 B a n d w id th = 0 .0 7 3 1 1

Figura 3.1: Curva de Densidade de Probabilidade para os dados de


duração (em segundos) da partitura  Conselhos

O gráfico de densidade de probabilidade (figura 3.1) exibe os valores de duração


em segundos (s) estimados da partitura, onde os picos indicam a frequência das
durações. Pode-se observar dois valores mais proeminentes, refentes às figuras
semicolcheia e colcheia da partitura. A duração estimada mostra possível proximidade
com a taxa de elocução na fala moderada, que é de aproximadamente cinco sílabas por
segundo, conforme também observado em Barbosa (2006).

34
D e n s id a d e d e P r o b a b ilid a d e d e C o n s e lh o s - E n to a ç ã o

0 .1 0
0 .0 8
d e n s id a d e d e p ro b a b ilid a d e

0 .0 6
0 .0 4
0 .0 2
0 .0 0

-1 0 -5 0 5 10 15

N = 195 B a n d w id th = 1 .1 7

Figura 3.2: Curva de Densidade de Probabilidade para os dados de entoação (f0)


com valores estimados da partitura - Conselhos

O gráfico da curva de densidade de probabilidade (figura 3.2) é relativo aos dados


de entoação, obtidos da estimativa da partitura. A entoação foi estimada em semitons (st),
com referência em 440Hz. A bimodalidade observada no gráfico é relativa aos dois tons
mais frequentes na partitura, cuja tessitura é próxima à da fala.
Esses gráficos mostram o que pode ser expresso na estatística descritiva dos
dados de duração e entoação, que são apresentados a seguir (tabela 3.1). Os valores de
assimetria e curtose indicam o deslocamento do gráfico (assimetria, nesse caso, à
esquerda) e o grau de afilamento/achatamento da distribuição dos dados (curtose),
valores que são relativos à frequência de ocorrência das notas na partitura.
Os resultados observados para a duração mostram que existe alta variância, pois o
desvio padrão é próximo ao valor da média. Os resultados observados para a entoação

35
mostraram também alta variabilidade, tendência mais central dos dados e possibilidade
de achatamento da curva, pois os valores são baixos, apesar da bimodalidade acima
aludida.

média desvio padrão assimetria curtose n


duração 0,6218 0,6029 3,4902 15,2966 195
entoação 0,7641 4,8157 0,6702 -0,1424 195
Tabela 3.2: estatística descritiva dos dados acústicos
estimados da partitura

Os resultados até agora obtidos mostram que é necessário realizar a descrição e


análise dos dados acústicos de gravações. Com os valores estimados e as estatísticas
obtidas é possível realizar uma comparação direta com os dados acústicos, com o intuito
de avaliar as semelhanças e diferenças no nível duracional e entoacional.
Por outro lado, esses resultados mostram que é necessário investigar melhor a
magnitude da força das fronteiras prosódicas como caracterizadoras da estrutura
linguística refletida na música, especialmente na música de câmara, ou melhor, averiguar
que peso têm os alinhamentos de força silábica (Tempo Forte) com as proeminências
musicais como marcadores de fronteiras.
Recapitulando, os resultados obtidos para as associações entre fatores prosódicos
relativos à comparação letra versus partitura teve valores significativos para tonicidade em
relação às seguintes variáveis: posição de sintagma (SE e SF), proeminência de duração,
proeminência de tom, tempo e pausa. Também tiveram valores significativos as
associações para proeminência de duração em relação às seguintes variáveis: tonicidade,
posição de sintagma (SE e SF), proeminência de tom, tempo e pausa. Não foram
significativas as associações para proeminência de tom em relação às seguintes
variáveis: posição de sintagma (SE e SF) e pausa. Tais resultados evidenciam a
manutenção da estrutura linguística pela partitura, mas, nada revelam sobre a produção
do intérprete, pois ela, a partitura, é uma idealização concebida pelo compositor.
Nos capítulos seguintes faz-se a análise acústica da produção falada (capítulo 4) e
cantada (capítulo 5) da canção de câmara em questão, lida e cantada por informantes
cantoras, coralistas e solistas, e lida por outro grupo de informantes, locutoras
profissionais não cantoras. A metodologia de análise já foi exposta no capítulo anterior.

36
4 Resultados e Análises: Gravações de
Fala

37
38
4.1 Considerações preliminares

Este capítulo descreve os testes realizados com os dados de gravação de fala, os


quais procuram averiguar a primeira hipótese (H1) elencada na Introdução: a fala é
distinta entre os grupos. Recapitulando, foram gravados três grupos de informantes (LOC,
SOL e COR) que leram o texto de Conselhos com cinco repetições.
As gravações foram segmentadas de acordo com o modelo descrito na
Metodologia. Os dados foram extraídos das segmentações de acordo com as variáveis
descritas anteriormente. A tabela do anexo I (tabela 9.3) mostra os resultados da
estatística descritiva: média, desvio padrão (desvpad), assimetria e curtose. O índice nT
na tabela mostra o número de sílabas.

4.2 Análises dos dados de duração

4.2.1 Análise descritiva

As medidas de tendência central (média e desvio padrão) dos dados de duração de


fala mostram que as informantes aparentemente realizam a leitura com durações
semelhantes entre si. A assimetria mostra a dispersão dos dados mais à esquerda, isto é,
há maior frequência de valores de menor duração.

39
Figura 4.2.1: Histograma dos dados de duração de fala, com curvas de densidade de
probabilidade para cada informante.

O histograma da figura 4.1 ilustra a estatística descritiva. Nesse caso, optou-se


pela padronização via função densidade de probabilidade, procedimento estatístico que
permite comparar os histogramas em mesma escala, por meio da sua suavização em
uma curva. As curvas de cada grupo foram sobrepostas para comparação visual, junto
com a curva dos valores médios, mostrando que não há diferença aparente entre os
grupos.

40
Os resultados ilustrados no gráfico foram preditos pela assimetria. Eles podem dar
pistas da taxa de elocução produzida por todas as informantes, que aparenta ser
semelhante entre elas, e, consequentemente, entre os grupos. Esse fato pode ser
explicado com base no conhecimento que as informantes têm da língua para produzir
taxas de elocução semelhantes, pois não se pediu leitura acelerada ou lenta, nem
declamação com peso emotivo. A grande maioria das informantes permaneceu numa taxa
de elocução em torno de cinco sílabas por segundo, com produções mais alongadas em
sílabas tônicas.

4.2.2 Análises inferenciais

Considerando-se as categorias usadas na análise não paramétrica foram


realizadas as análises de variância (ANOVA), considerando a duração como variável
independente, e as seguintes como variáveis dependentes: duração total do texto da
canção (grupo), posição proeminência de sintagma entoacional (PSE), posição de
proeminência de sintagma fonológico (PSF), padrão acentual (PA), e Tonicidade (TN).

Fala
Variável Resposta: duração
Df F valor p significância
Grupo 2 24,4690 0,0000 S
Posição de Proeminência de Sintagma Entoacional 2 17,6692 0,0000 S
Posição de Proeminência de Sintagma Fonológico 2 2,0285 0,1316 NS
Padrão Acentual 3 4990,0303 0,0000 S
Tonicidade 1 382,7251 0,0000 S
Tabela 4.1: ANOVA para dados de duração de fala

A ANOVA realizada (tabela 4.1) mostra significância para quase todas as variáveis,
ou melhor, a duração é distinta para Grupo, Padrão Acentual (PA), Tonicidade (TN) e
Posição de Proeminência de Sintagma Entoacional (PSE). Já o resultado não significativo
para Posição de Proeminência de Sintagma Fonológico (PSF) indica duração semelhante
nessa variável.

41
SOL COR LOC
VariáveisLinguísticas relação
média desvio padrão média desvio padrão média desvio padrão
grupo 0,2181905 0,1180361 0,2075892 0,1135793 0,2162057 0,1077118 SOL = LOC > COR
PSE 0,2643188 0,1074260 0,2598994 0,1073581 0,2628682 0,0953636 SOL = LOC = COR
PSF 0,2651427 0,0992833 0,2578589 0,0988952 0,2604579 0,0886757 SOL = LOC = COR
PA 0,2438672 0,0827485 0,2330028 0,0824891 0,2391601 0,0737291 SOL = LOC > COR
TN 0,2201306 0,0900891 0,2093257 0,0888998 0,2183306 0,0831092 SOL > LOC > COR
Tabela 4.2: Médias e desvios padrão das variáveis linguísticas em relação à duração por grupo.

A tabela 4.2 exibe as médias e desvios padrão de duração para as variáveis


linguísticas analisadas na ANOVA. A relação entre os grupos foi avaliada por teste post-
hoc (Tukey), com os seguintes resultados para as variáveis relativas à hierarquia
prosódica: a) posição de sintagma entoacional e fonológico mostram semelhança entre
os grupos (SOL = COR = LOC); b) as médias para o Padrão Acentual tem valores
semelhantes entre LOC e SOL, porém, maiores que COR; d) Tonicidade mostra a
gradiência entre os grupos que têm prática profissional (SOL > LOC > COR).

As diferenças observadas sugerem que a primeira hipótese desse estudo se


mantém, ou melhor, a fala é diferente entre os grupos. Tais diferenças também sugerem
influência de treinamento, como notado em Padrão Acentual e nas medidas de duração
para a variável grupo. Nessas variáveis, os dois grupos com prática profissional (LOC e
SOL) tem valores próximos. A semelhança nas posições de sintagma indicam que todos
os grupos respeitam a estrutura linguística, pois procuram manter a hierarquia prosódica.

4.3 Análise dos dados de entoação (f0)

4.3.1 Análise Descritiva

As medidas de tendência central (média e desvio padrão) mostram valores


próximos entre os grupos, apesar dos desvios padrões altos. Já as medidas de dispersão
mostram as diferenças entre os grupos. O histograma da figura 4.2 ilustra o que foi obtido
na estatística descritiva.

42
Figura 4.3.1: Histograma dos dados de entoação (f0) de fala, com curvas de densidade de
probabilidade para cada informante.

A figura 4.2 ilustra as curvas de densidade de probabilidade de cada grupo para os


dados de entoação (f0) em semitons (st). Conforme já mencionado, optou-se pela
padronização via função densidade de probabilidade e a suavização da curva dos dados,
com a sobreposição das curvas de cada grupo e da curva de valores médios para
comparação visual. Esse gráfico mostra que há diferença entre os grupos e levanta a
hipótese da influência do treinamento vocal, pois LOC mantém a entoação mais grave,
enquanto que SOL e COR mantiveram entoação mais aguda, porém distinta, pois SOL

43
está próxima do valor médio.

4.3.2 Análises Inferenciais

Considerando-se as categorias usadas na análise não paramétrica foram


realizadas as análises de variância (ANOVA), sendo a entoação (f0) como variável
independente, e as seguintes como variáveis dependentes: duração total do texto da
canção (grupo), posição proeminência de sintagma entoacional (PSE), posição de
proeminência de sintagma fonológico (PSF), padrão acentual (PA), e Tonicidade (TN).

Fala
Variável Resposta: f0
Df F valor p significância
Grupo 2 889,1952 0,0000 S
Posição de Proeminência de Sintagma Entoacional 2 64,5581 0,0000 S
Posição de Proeminência de Sintagma Fonológico 2 6,2107 0,0020 S
Padrão Acentual 3 343,8876 0,0000 S
Tonicidade 1 22,8440 0,0000 S
Tabela 4.3: ANOVA para dados de entoação de fala.

O resultado significativo na ANOVA dos dados de entoação (tabela 4.3) mostra a


diferença de produção entre os grupos, o que é esperado, além de corroborar a primeira
hipótese (fala diferente entre os grupos).

SOL COR LOC


VariáveisLinguísticas relação
média desvio padrão média desvio padrão média desvio padrão
grupo -10,0690 4,7179 -10,2484 3,9244 -13,2489 4,1956 SOL > COR > LOC
PSE -9,5992 4,8329 -11,0247 3,7740 -13,9583 4,2244 SOL > COR > LOC
PSF -13,3892 4,5978 -10,8174 3,6575 -13,6250 4,1249 COR > SOL > LOC
PA -10,0222 4,5325 -10,6326 3,8118 -13,6237 3,9721 SOL > COR > LOC
TN -9,3415 4,6585 -10,2633 3,8872 -13,2643 4,1585 SOL > COR > LOC
Tabela 4.4: Médias e desvios padrão para f0 em relação às variáveis linguísticas.

A tabela 4.4 mostra as médias e desvios padrão de f0 para as variáveis linguísticas


analisadas na ANOVA. Essas medidas são globais, e o resultado mais frequente mostra a
gradiência SOL > COR > LOC, separando cantoras das locutoras, e, ainda, um indicativo
da influência do treinamento para o canto. No entanto, a relação é diferente para PSF:

44
COR > SOL > LOC. Esse resultado sugere o mesmo efeito observado nas curvas dos
histogramas de f0, isto é, levanta a hipótese da influência do treinamento vocal
profissional, pois LOC e SOL são os grupos que possuem maior tempo de treinamento,
além da prática profissional.

4.4 Análise das estimativas de espaço vocálico nas posições acentuais

Os espaços vocálicos são estimativas acústicas que mostram as possíveis


configurações de abertura/fechamento, posterização/anteriorização vocálica, e podem dar
indícios da atividade dos articuladores mandíbula, lábios e língua (LINDBLOM E
SUNDBERG, 1971). Como já dito, o cálculo dos espaços vocálicos foi feito com as
medidas dos formantes realizadas em Hertz, posteriormente convertidas em Bark via
transformação de Traunmuller (1990). Bark é uma medida psicoacústica que está
relacionada à percepção, também conhecida como medida de banda crítica.

As vogais foram rotuladas com o alfabeto SAMPA6 durante a segmentação, e


plotadas com o IPA, a seguir. SAMPA é o alfabeto fonético que utiliza fontes comuns a
todos os editores de texto e programas de análise fonético-fonológica, sem a necessidade
da instalação de fontes especificas, como aquelas empregadas pelo IPA.

A plotagem das vogais foi concebida quanto à tonicidade – pretônica, tônica ou


postônica – sem considerar as vogais nasais e os encontros vocálicos. As vogais [i, I, e,
E, a, A, o, O, u, U] foram os pontos de base para o cálculo das estimativas: área de
espaço vocálico (VSA) e razão de centralização formântica (FCR).

6 Conferir: http://www.phon.ucl.ac.uk/home/sampa/index.html

45
Figura 4.4.1: Espaços vocálicos nas posições acentuais de fala das coralistas (COR).

A figura 4.3 (ampliada no anexo III) mostra os espaços vocálicos da fala das
coralistas (COR). As tônicas aparentam maior área, além de centralização formântica em
[E, a, o]. As pretônicas possuem maior área de espaço vocálico que as postônicas, com
dispersão vocálica em todas as vogais, nas duas posições acentuais. Esse dado de
dispersão pode indicar imprecisão articulatória, com possível falta de inteligibilidade.

Figura 4.4.2: Espaços vocálicos nas posições acentuais de fala das solistas (SOL).

A figura 4.4 (ampliada no anexo III) mostra os espaços vocálicos da fala das
solistas (SOL). A maioria das vogais tônicas aparenta áreas mais delimitadas e menor
dispersão que em COR. Além disso, a área desses espaços vocálicos aparenta ser

46
homogênea em todas as posições acentuais, e, com certo abaixamento de [a] nas
tônicas, indicativo de maior abertura mandibular.

Figura 4.4.3: Espaços vocálicos nas posições acentuais de fala das locutoras (LOC).

A figura 4.5 (ampliada no anexo III) mostra os espaços vocálicos da fala das
locutoras (LOC). Como notado com as SOL, elas têm maior área de espaço vocálico nas
três posições acentuais, além de aparentar áreas mais delimitadas com menor dispersão,
que implica em melhor inteligibilidade. Esse fato comum aos dois grupos é indicativo da
prática vocal profissional que possuem.

4.4.1 Área de Espaço Vocálico (VSA)

Recordando, foram calculadas estimativas de Área de Espaço Vocálico (VSA) e


Razão de Centralização Formântica (FCR), que permitem fazer inferências do ponto de
vista da precisão articulatória e da inteligibilidade.

df F valor p significância
pretônica 2 0,5409 0,5958 NS
VSA tônica 2 8,5791 0,0049 S
pós-tônica 2 1,6344 0,2357 NS
Tabela 4.5: ANOVA das medidas de espaço vocálico
para a produção falada: área de espaço vocálico (VSA);
significância: significativo (S), não-significativo (NS).

47
A análise de variância (ANOVA) da tabela 4.5 foi conduzida considerando o grupo
(LOC, COR e SOL) em relação a VSA na posição acentual (pretônica, tônica e pós-tônica
). Os resultados foram significativos para as tônicas e não significativos para as pretônicas
e pós-tônicas, resultado que indica diferença entre as informantes para as áreas dos
espaços vocálicos nas tônicas, e certa semelhança entre as informantes nas pretônicas e
postônicas.

SOL COR LOC


VSA relação
média desvio padrão média desvio padrão média desvio padrão
pretônica 4,8736 1,2374 4,6595 1,7661 5,6176 1,5371 LOC = SOL = COR
tônica 5,6456 1,0805 4,9535 1,1638 9,4844 2,8097 LOC > SOL = COR
postônica 2,4061 0,5326 1,8866 0,4382 2,6880 1,0204 LOC = SOL = COR
Tabela 4.6: Médias e desvios-padrão para VSA por grupo e padrão acentual.

A tabela 4.6 exibe as médias e desvios padrões das áreas dos espaços vocálicos
para cada grupo e em cada contexto acentual (pretônica, tônica e postônica), bem como a
relação entre os grupos verificada pelos resultados dos testes post-hoc (Tukey). Conforme
já observado, as átonas são semelhantes entre os grupos, enquanto que as tônicas de
LOC aparentam ser maiores que as das cantoras (SOL e COR). Médias com valores
elevados para as tônicas é indicativo de articulações mais extremas. Tais resultados
corroboram a influência da prática vocal profissional de LOC na leitura.

variável grupo t valor p significância


loc-sol 0,8431 0,4247 N
VSA-pretônicas loc-cor 0,9150 0,3874 N
sol-cor 0,2220 0,8305 N
loc-sol 2,8515 0,0345 S
VSA-tônicas loc-cor 3,3314 0,0188 S
sol-cor 0,9745 0,3585 N
loc-sol 0,5477 0,6036 N
VSA-postônicas loc-cor 1,6137 0,1629 N
sol-cor 1,6842 0,1320 N
Tabela 4.7: teste t para as estimativas de espaço vocálico
(VSA) comparando grupos na produção falada

A tabela 4.7 exibe a comparação entre os grupos por meio do teste t (tabela 4.7), e,
novamente, observa-se que a diferença entre as informantes está nas tônicas. Conforme

48
já mencionado, esses resultados significativos para VSA mostram que LOC realiza
movimento articulatório maior que SOL e COR, principalmente nas tônicas, reforçando a
influência da prática vocal profissional nessa tarefa de leitura. Locutores buscam melhor
inteligibilidade na sua produção, que, além de exigência da profissão, é alcançada com
muita prática e treinamento de precisão articulatória.

4.4.2 Razão de Centralização Formântica (FCR)

As médias da razão de centralização formântica (FCR) por grupo e contexto


acentual exibem diferenças entre os grupos nas tônicas, e nenhuma diferença entre os
grupos nas pretônicas e postônicas. Recapitulando: valores altos de FCR refletem
centralização das vogais, ao passo que valores baixos indicam a sua expansão; vogais
centralizadas indicam imprecisão articulatória e consequente menor inteligibilidade,
enquanto vogais periféricas indicam precisão.

df F valor p significância
pretônica 2 0,9303 0,4211 NS
FCR tônica 2 5,5512 0,0196 S
pós-tônica 2 2,5478 0,1196 NS
Tabela 4.8: ANOVA das medidas de espaço
vocálico para a produção falada: razão de
centralização formântica (FCR); significância:
significativo (S), não-significativo (NS).

Os resultados da análise de variância (ANOVA) para as estimativas de razão de


centralização formântica (tabela 4.8) mostraram-se significativos somente para a tônica, e
não significativos para pretônicas e postônicas, resultados semelhantes aos obtidos para
VSA.

49
SOL COR LOC
FCR relação
média desvio padrão média desvio padrão média desvio padrão
pretônica 1,5024 0,0631 1,5200 0,0765 1,4659 0,0497 COR = SOL = LOC
tônica 1,4410 0,0251 1,4979 0,0526 1,3827 0,0747 COR > SOL > LOC
postônica 1,5999 0,0316 1,6364 0,0270 1,5815 0,0536 COR = SOL = LOC
Tabela 4.9: Médias e desvios-padrão para FCR por grupo e padrão acentual.

A tabela 4.9 mostra os valores das médias e desvios-padrão para FCR por grupo e
padrão acentual. As LOC são o grupo de informantes que têm menor FCR nas tônicas,
seguidas de SOL, que tem as médias desses índices entre os dois grupos nos padrões
acentuais (pretônicas, tônicas e pós-tônicas). COR é o grupo com maior FCR, resultado
que implica em menor precisão articulatória.

variável grupo t valor p significância


loc-sol -1,0178 0,3401 N
FCR-pretônicas loc-cor -1,3274 0,2268 N
sol-cor -0,3964 0,7025 N
loc-sol -1,6563 0,1599 N
FCR-tônicas loc-cor -2,8212 0,0251 S
sol-cor -2,1836 0,0738 N
loc-sol -0,6597 0,5322 N
FCR-postônicas loc-cor -2,0452 0,0876 N
sol-cor -1,9682 0,0854 N
Tabela 4.10: teste t para as estimativas de espaço vocálico
(VSA e FCR) comparando grupos na produção falada

A tabela 4.10 mostra os resultados da comparação entre os grupos por meio do


teste t. O resultado não significativo para FCR em relação a LOC e SOL indica
semelhança entre os dois grupos, e pode ser interpretado como marca de proficiência
resultante da prática vocal profissional. Os dois grupos são profissionais da voz que
buscam inteligibilidade nas suas produções. O resultado significativo para LOC e COR
indica a diferença entre os grupos com prática profissional (LOC) e os sem (COR),
diferença relativa à leitura.

As tônicas ficam evidenciadas novamente, fato já observado na análise dos dados

50
de duração, entoação e VSA. Esses resultados indicam que os grupos usam as tônicas
como marcadores de expressividade, pois elas, as tônicas, são as protagonistas da
conjunção letra/partitura.

Tais resultados parecem ter respaldo na literatura. Muitos estudos mostram que é
sobre a tônica que incide a maior variabilidade de f0 (LADD, 1996; GRABE et al, 1998;
GUSSENHOVEN, 1984). As mesmas vogais, tônicas, são as mais importantes para a
manutenção do ritmo na fala, conforme é observado em vários modelos de ritmo de
produção falada e de produção cantada (SMITH, 1991; SMITH, 1999; LARGE e COLEN,
1994; KAY et cols, 1987; SALTZMAN e BYRD, 1999; MARCUS, 1976; BARBOSA, 2002;
BURROWS, 1997).

4.5 Análise da Intensidade (SPL)

A tabela 4.11 mostra as médias e desvios-padrão para os dados de intensidade na


fala. Os resultados obtidos ressalvam a gradiência LOC > SOL > COR já observada
anteriormente, evidenciando os grupos que possuem prática vocal profissional. A análise
de variância realizada mostrou significância (F = 227521; df = 2; p < 0,05), bem como a
comparação aos pares por teste t (p < 0,05).

SOL COR LOC


relação
média desvio padrão média desvio padrão média desvio padrão
Intensidade 68,0165 7,4748 64,7001 6,0438 74,3447 4,3082 LOC > SOL > COR
Tabela 4.11: Médias e desvios padrão de intensidade (SPL) por grupo.

51
4.6 Análise dos Formantes

Aqui serão realizadas as análises dos formantes, que foram tomados como base
para o cálculo das estimativas dos espaços vocálicos. Recordando, tais espaços
mostraram evidências sobre a atividade articulatória realizada pelos grupos.

df F p
F1 2 500,55 0,00
F2 2 920,22 0,00
F3 2 402,90 0,00
Tabela 4.12: ANOVA dos
formantes por grupo.

A tabela 4.12 mostra a ANOVA dos formantes por grupo, com diferenças
significativas entre os grupos. Esses resultados são esperados, e endossam a hipótese
da diferença entre os grupos na fala.

SOL COR LOC


Formantes relação
média desvio padrão média desvio padrão média desvio padrão
F1 3,3776 1,3228 2,4993 1,4185 2,7267 1,4621 SOL > LOC > COR
F2 9,4770 1,7723 8,5984 1,8436 8,9767 1,9690 SOL > LOC > COR
F3 14,3423 0,8896 13,7697 1,0742 14,1116 0,9916 SOL > LOC > COR
Tabela 4.13: Médias e desvios padrões dos formantes por grupo.

A tabela 4.13 exibe as médias e desvios padrão dos formantes (F1 a F3), e a
relação entre os grupos avaliada com teste post-hoc (Tukey). Os resultados apontam
para a gradiência entre os grupos (SOL > LOC > COR), evidenciando mais uma vez os
grupos que possuem prática vocal profissional (SOL e LOC).

52
variável grupo t valor p significância
loc-sol -22,7183 0,0000 S
F1-Bark loc-cor 7,6837 0,0000 S
sol-cor 31,1705 0,0000 S
loc-sol -12,9963 0,0000 S
F2-Bark loc-cor 9,6545 0,0000 S
sol-cor 23,6494 0,0000 S
loc-sol -11,9169 0,0000 S
F3-Bark loc-cor 16,1017 0,0000 S
sol-cor 28,2628 0,0000 S
Tabela 4.14: teste t comparando os formantes por
grupo na fala.

A tabela 4.14 exibe os resultados do teste t efetuado para a comparação entre os


grupos, com resultados evidenciando a diferença entre eles. Mais uma vez, esses
resultados reforçam a primeira hipótese sobre a diferença entre os grupos na fala.

4.7 Comparação entre dados acústicos e estimativas da partitura

Conforme já mencionado, a comparação dos dados de duração e entoação (f0)


tem por objetivo avaliar o pareamento entre produção e idealização. A tabela 4.15 mostra
as médias e desvios-padrão de duração e entoação (f0) para a partitura e os grupos.

Variáveis PARTITURA SOL COR LOC


relação
Acústicas média desvio padrão média desvio padrão média desvio padrão média desvio padrão
duração 621,7949 602,8532 218,1905 118,0361 207,5892 113,5793 216,2057 107,7118 PAR > SOL = LOC > COR
entoação 0,7641 4,8157 -10,0690 4,7179 -10,2484 3,9244 -13,2489 4,1956 PAR > SOL = COR > LOC
Tabela 4.15: Médias e desvios-padrão de duração e entoação para partitura e grupos.

A tabela 4.15 exibe as médias e desvios padrão de duração (em milissegundos) e


entoação em semitons (st), com referência em 440Hz. Recordando, essa medida para
entoação foi adotada por permitir comparação direta entre fala e canto, por isso, entende-
se que os valores negativos para entoação são aqueles abaixo da referência.

De forma geral, observa-se na tabela 4.15 claramente as diferenças entre partitura


e grupos. SOL tem valores maiores que LOC e SOL na duração e na entoação,

53
aproximando-se da partitura. Esse fato poderia explicar a tendência das cantoras com
maior prática e treinamento em ler um texto de maneira próxima ao canto.

Outro fato que também pode justificar essa tendência é a relação SOL = COR para
a entoação, pois, esse resultado semelhante entre os grupos indica distinção entre
cantoras e locutoras. Por outro lado, a igualdade de SOL com LOC para duração sugere
leitura proficiente quanto ao ritmo, reflexo também da prática e do treinamento, pois
ambos os grupos são profissionais da voz.

Os dois fatos têm explicação na prática profissional, pois LOC deve fazer uso do
aumento duracional e da entoação baixa para elocução, diferente de COR. Já a
comparação das duas variáveis para SOL em relação aos outros grupos (COR e LOC)
mostra valores maiores, que pode indicar reflexo da prática vocal profissional do canto na
fala.

Fala
variável
grupo t valor p significância
loc-partitura -9,389 0,000 S
duração sol-partitura -9,342 0,000 S
cor-partitura -9,587 0,000 S
loc-partitura -40,013 0,000 S
entoação sol-partitura -30,810 0,000 S
cor-partitura -31,506 0,000 S
Tabela 4.16: teste t com os dados acústicos da produção
falada e as estimativas da partitura

A tabela 4.16 mostra os resultados da comparação via teste t dos dados acústicos
de duração e entoação com as estimativas obtidas da partitura. Os resultados
significativos reforçam o esperado: há diferença entre a produção falada e os valores
obtidos das estimativas, preditores para a produção cantada. Com esses resultados,
pode-se entender que os grupos têm produções duracionais e entoacionais próprias, não
refletindo o que está na partitura, que é uma representação musical, idealizada, e, sim, a
maior variabilidade típica da fala.

54
5 Resultados e Análises: Gravações de
Canto

55
56
5.1 Considerações Preliminares

Este capítulo descreve os testes realizados com os dados de gravação de canto,


sem e com acompanhamento. Recapitulando, foram gravados dois grupos de informantes
cantoras (SOL e COR) que cantaram a canção Conselhos sem e com acompanhamento
musical, com cinco repetições em cada condição.
As análises aqui realizadas procuram averiguar a segunda hipótese (H2) elencada
na Introdução: o canto pode ser semelhante ou diferente entre os grupos. Se o canto for
semelhante entre os grupos, ele apresenta propriedades dependentes da formação
musical. Se o canto for diferente entre os grupos, então ele apresenta propriedades
dependentes do treinamento e da prática.
Como já dito, as gravações foram segmentadas conforme o modelo descrito na
Metodologia, de onde foram extraídos os dados de acordo com as variáveis já descritas. A
tabela do anexo I (tabela 9.3) mostra os resultados da estatística descritiva: média, desvio
padrão (desvpad), assimetria e curtose. O índice nT na tabela mostra o número de
sílabas.

5.2 Análises dos dados de duração

5.2.1 Canto sem acompanhamento

5.2.1.1 Análise descritiva

Recapitulando, a produção sem acompanhamento foi realizada pelos grupos de


cantoras COR e SOL como descrito na Metodologia. Cantar dessa forma (a capella) é
uma tarefa que exige proficiência por parte das informantes, ou ainda, a memorização das
informações contidas na partitura para a sua interpretação.

57
Figura 5.2.1: Histograma de duração dos dados de canto sem acompanhamento.

O histograma da figura 5.1 ilustra a estatística descritiva citada. Como já feito


antes, optou-se pela padronização via função densidade de probabilidade, procedimento
que permite comparação direta por meio da suavização da curva dos dados. As curvas de
cada grupo foram sobrepostas com a curva dos valores médios, sem diferença aparente
entre os grupos.

58
5.2.1.2 Análises inferenciais

Como já dito, foram realizadas as ANOVAs considerando a duração como variável


independente, e as seguintes como variáveis dependentes: duração total do texto da
canção (grupo), posição proeminência de sintagma entoacional (PSE), posição de
proeminência de sintagma fonológico (PSF), padrão acentual (PA), e Tonicidade (TN).

Canto sem acompanhamento


Variável Resposta: duracao
Df F valor p significância
Grupo 1 0,1861 0,6662 NS
Posição de Proeminência de Sintagma Entoacional 2 143,8518 0,0000 S
Posição de Proeminência de Sintagma Fonológico 2 64,2064 0,0000 S
Padrão Acentual 3 2216,4388 0,0000 S
Tonicidade 1 6,7150 0,0096 S
Tabela 5.1: ANOVA para os dados de duração da produção cantada sem
acompanhamento

A tabela 5.1 apresenta as ANOVAs com o modelo já descrito. Os resultados


mostram que a duração não é significativa para grupo. Entende-se com esse resultado
que os grupos aparentemente não variam seu ritmo sem o acompanhamento. Essa
manutenção rítmica é afetada apenas pelos fatores prosódicos, como se pode verificar
nos resultados significativos para as demais variáveis.

Variáveis SOL COR


relação
Linguísticas média desvio padrão média desvio padrão
grupo 0,2967 0,1304 0,3065 0,3712 SOL = COR
PSE 0,6271 0,4468 0,6181 0,4144 SOL > COR
PSF 0,5924 0,4196 0,5925 0,3968 COR > SOL
PA 0,5104 0,3082 0,5038 0,2933 SOL > COR
TN 0,4233 0,3216 0,4258 0,3037 COR > SOL
Tabela 5.2: Médias e desvios padrão de duração nas variáveis linguísticas por grupo.

A tabela 5.2 exibe as médias e desvios-padrão para as variáveis linguísticas


citadas. As diferenças significativas encontradas nos testes post-hoc entre os grupos são
apresentadas. Observa-se os seguintes resultados distintos: a) SOL > COR para Padrão
Acentual (PA) e posição de proeminência de sintagma entoacional (PSE), b) COR > SOL
para Tonicidade (TN) e posição proeminência de sintagma fonológico (PSF).

59
Esses resultados mostram que os grupos tentam manter a seu modo a estrutura
musical. Espera-se que a posição de sintagma entoacional esteja pareada com a
idealização das frases musicais propostas na partitura. Os resultados para PA e PSE
indicam o foco de SOL nos níveis mais altos da hierarquia prosódico musical, pois a
posição acentual está atrelada ao posicionamento de sintagma entoacional. Os resultados
para TN e PSF indicam que COR usa estratégia contrária à de SOL, marcando unidades
rítmicas de nível mais baixo (TN) e apoiando-se no nível fonológico mais próximo à
palavra (PSF) e não na entoação (PSE).

A semelhança geral entre os grupos reflete parte da segunda hipótese (H2)


referente à formação musical, pois tendem a manter a duração total semelhante. Já as
diferenças locais nas variáveis linguísticas refletem a influência da prática e do
treinamento, pois, enquanto SOL preocupa-se com níveis linguísticos que pareiam com os
musicais mais altos, COR preocupa-se com níveis linguísticos que pareiam com os
musicais mais baixos.

5.2.2 Canto com acompanhamento

5.2.2.1 Análise descritiva

Como já dito na Metodologia, as gravações cantadas com acompanhamento


musical foram segmentadas conforme modelo adotado. A estatística descritiva desses
dados (tabela 9.3 do anexo I) mostra resultados semelhantes aos obtidos para o canto
sem acompanhamento.

60
Figura 5.2.2: Histograma de duração de canto com acompanhamento.

A figura 5.2 mostra a sobreposição quase total das curvas suavizadas dos dados.
Como já feito antes, optou-se pela padronização via função densidade de probabilidade,
pois esse procedimento permite comparação visual direta, com a sobreposição das
curvas de cada grupo. A estatística descritiva corrobora a semelhança entre as curvas,
cujo resultado pode ser interpretado como realização rítmica semelhante. Diferente do
canto a capella, o acompanhamento fornece bases rítmicas e harmônicas com as quais
o/a cantor(a) pode fiar-se na interpretação. As análises inferenciais vão endossar essas
observações, como segue.

61
5.2.2.2 Análises inferenciais

Recapitulando, considerou-se nas análises de variância (ANOVA) realizadas a


duração como variável independente, e as seguintes como variáveis dependentes:
duração total do texto da canção (grupo), posição proeminência de sintagma entoacional
(PSE), posição de proeminência de sintagma fonológico (PSF), padrão acentual (PA), e
Tonicidade (TN).

Canto com acompanhamento


Variável Resposta: duracao
Df F valor p significância
Grupo 1 0,3243 0,5690 NS
Posição de Proeminência de Sintagma Entoacional 2 81,5537 0,0000 S
Posição de Proeminência de Sintagma Fonológico 2 68,3232 0,0000 S
Padrão Acentual 3 2346,9893 0,0000 S
Tonicidade 1 6,9331 0,0085 S
Tabela 5.3: ANOVA dos dados de duração do canto com acompanhamento.

A tabela 5.3 apresenta os resultados da ANOVA, e, da mesma forma que no canto


sem acompanhamento, eles mostram que a duração não é significativa para grupo, ou
melhor, pode-se entender que as informantes mantêm seu ritmo estável. De forma
semelhante ao canto sem acompanhamento, os grupos aparentam semelhante duração,
mas, essa manutenção poderia ser justificada pela presença do acompanhamento se não
fossem as diferenças significativas observadas nas variáveis linguísticas.

62
Variáveis SOL COR
relação
Linguísticas média desvio padrão média desvio padrão
grupo 0,2753 0,1144 0,2839 0,3376 SOL = COR
PSE 0,5413 0,3562 0,5346 0,3618 SOL > COR
PSF 0,5522 0,3627 0,5462 0,3652 SOL > COR
PA 0,4682 0,2578 0,4594 0,2672 SOL > COR
TN 0,3913 0,2735 0,3880 0,2757 SOL > COR
Tabela 5.4: Médias e desvios padrão de duração para as variáveis linguísticas por grupo,
canto com acompanhamento.

A tabela 5.4 exibe as médias e desvios-padrão para a duração no canto com


acompanhamento, referente às variáveis linguísticas analisadas na ANOVA. As relações
entre os grupos são apresentadas, com semelhança global, e distinção nas variáveis
linguísticas. Como já observado, essas diferenças mostram como os grupos manipularam
tais variáveis para interpretar a partitura. O acompanhamento parece facilitar uma
aproximação da partitura para SOL, diferente de COR, que possui médias menores.

Esses resultados corroboram a segunda hipótese (H2) como observado no canto


sem acompanhamento, mas também a diferença entre os grupos com a influência do
acompanhamento, ressaltando a relação SOL > COR, resultado que enfatiza a influência
da prática e do treinamento.

5.3 Análise dos dados de entoação (f0)

5.3.1 Canto sem acompanhamento

5.3.1.1 Análise Descritiva

Recordando, o canto sem acompanhamento foi realizado por COR e SOL, como
descrito na Metodologia. O histograma da figura 5.3 ilustra o que foi obtido na estatística
descritiva: diferenças aparentemente justificadas pelos valores de desvio-padrão e
medidas de dispersão (assimetria e curtose).

63
Figura 5.3.1: Histograma de entoação (f0) para canto sem acompanhamento.

Como já mencionado, optou-se pela padronização via função densidade de


probabilidade, procedimento que permite comparação direta por meio da suavização da
curva dos dados. As curvas de cada grupo, sobrepostas com a curva dos valores médios,
mostram diferenças mínimas entre os grupos, corroborando a estatística descritiva.

64
5.3.1.2 Análises inferenciais

Novamente, considerou-se na análises de variância (ANOVA) realizadas f0 como


variável independente, e as seguintes como variáveis dependentes: duração total do texto
da canção (grupo), posição proeminência de sintagma entoacional (PSE), posição de
proeminência de sintagma fonológico (PSF), padrão acentual (PA), e Tonicidade (TN).

Canto sem acompanhamento


Variável Resposta: f0
Df F valor p significância
Grupo 1 7,5967 0,0059 S
Posição de Proeminência de Sintagma Entoacional 2 37,1138 0,0000 S
Posição de Proeminência de Sintagma Fonológico 2 9,4762 0,0001 S
Padrão Acentual 3 51,9449 0,0000 S
Tonicidade 1 0,8962 0,3438 NS
Tabela 5.5: ANOVA para os dados de entoação da produção cantada sem acompanhamento.

A tabela 5.5 apresenta os resultados das ANOVAs, com diferenças significativas


em grupos, padrão acentual e posições de sintagma (entoacional e fonológico). Esses
resultados indicam que os grupos usaram estratégias entoacionais distintas. O resultado
não significativo para Tonicidade indica semelhança rítmica nos níveis mais baixos,
mesmo sem acompanhamento (SOL = COR), pois Tonicidade é o correlato rítmico mais
próximo entre música, letra e produção (falada ou cantada).

Variáveis SOL COR


relação
Linguísticas média desvio padrão média desvio padrão
grupo 0,2161 3,8997 -0,0017 3,8946 SOL > COR
PSE 0,6103 4,4743 -0,3460 4,4123 SOL > COR
PSF 0,9001 4,4066 0,0738 4,3851 SOL > COR
PA 0,5634 3,9461 0,1659 3,9544 SOL > COR
TN -0,4094 3,8803 0,0063 3,8762 COR > SOL
Tabela 5.6: Médias e desvios padrão de entoação por grupo, canto sem acompanhamento.

A tabela 5.6 exibe as médias e desvios-padrão para entoação por grupo das
variáveis analisadas na ANOVA para o canto sem acompanhamento. Note-se a relação

65
SOL > COR para as variáveis, exceto em Tonicidade (COR > SOL), resultados que
podem ser interpretados como reflexo da prática e do treinamento de SOL no emprego
das variáveis linguísticas para a interpretação da canção, enquanto que COR tenta
manter a entoação atrelada à pulsação rítmica, que é reflexo do conhecimento musical.
Em outras palavras, COR tenta manter a afinação sem perder o ritmo. Ainda que as
médias sejam diferentes em TN, a ANOVA considerou sem diferença significativa entre os
grupos por terem desvios-padrão elevados.

5.3.2 Canto com acompanhamento

5.3.2.1 Análise Descritiva

Recapitulando, o canto sem acompanhamento foi realizado por COR e SOL, como
descrito na Metodologia. O histograma da figura 5.4 ilustra a estatística descritiva,
mostrando poucas diferenças que podem ser justificadas pelo desvio-padrão e medidas
de dispersão (assimetria e curtose).

66
Figura 5.3.2: Histograma dos dados de canto com acompanhamento

Novamente, optou-se pela padronização via função densidade de probabilidade,


por permitir a comparação direta com a suavização da curva dos dados. Tais curvas
sobrepostas com a curva dos valores médios mostram poucas diferenças entre os grupos.
Tal observação visual corrobora a segunda hipótese (H2), quanto à semelhança entre os
grupos, pois ambos possuem formação musical para seguir o acompanhamento.

67
5.3.2.2 Análises Inferenciais

A análise de variância (ANOVA) apresentada a seguir é referente aos dados de


canto com acompanhamento, realizada com o modelo antes descrito. Recapitulando, as
variáveis adotadas foram f0 como variável independente, e as seguintes como variáveis
dependentes: duração total do texto da canção (grupo), posição proeminência de
sintagma entoacional (PSE), posição de proeminência de sintagma fonológico (PSF),
padrão acentual (PA), e Tonicidade (TN).

Canto com acompanhamento


Variável Resposta: f0
Df F valor p significância
Grupo 1 4,6819 0,0305 S
Posição de Proeminência de Sintagma Entoacional 2 36,9068 0,0000 S
Posição de Proeminência de Sintagma Fonológico 2 10,3966 0,0000 S
Padrão Acentual 3 58,4538 0,0000 S
Tonicidade 1 0,5916 0,4418 NS
Tabela 5.7: ANOVA para os dados de entoação da produção cantada com acompanhamento

A tabela 5.7 mostra a ANOVA da entoação (f0) referente às variáveis linguísticas


mencionadas. Os resultados mostram diferença não significativa de f0 para TN, que indica
manutenção dos acentos musicais por parte das cantoras. Como já notado anteriormente,
as outras diferenças significativas distinguem os grupos e suas possíveis estratégias de
interpretação, com a manipulação dos níveis hierárquicos prosódicos, já observado por
GELAMO(2006).

Variáveis SOL COR


relação
Linguísticas média desvio padrão média desvio padrão
grupo -0,0036 4,0000 0,1681 3,8361 COR > SOL
PSE 0,3777 4,4882 0,2659 4,3153 SOL > COR
PSF 0,7643 4,5528 -0,1367 4,3554 SOL > COR
PA 0,3953 4,0259 0,3493 3,8957 SOL > COR
TN -0,6693 3,9827 0,1763 3,8160 COR > SOL
Tabela 5.8: Médias e desvios padrão de entoação por grupo, canto com acompanhamento.

68
A tabela 5.8 exibe as médias e desvios-padrão da entoação para as variáveis
linguísticas analisadas na ANOVA. As relações entre os grupos são as seguintes: a) COR
> SOL em grupo e Tonicidade (TN); b) SOL > COR em Padrão Acentual (PA), posição de
proeminência de sintagma entoacional (PSE) e posição de proeminência de sintagma
fonológico (PSF).

Como observado nos resultados para o canto sem acompanhamento, COR parece
manter a afinação atrelada à pulsação rítmica. Neste caso, o acompanhamento parece
facilitar essa tarefa, fato notado na elevação da média do grupo em relação ao canto sem
acompanhamento.

5.4 Análise das estimativas de espaço vocálico nas posições acentuais

Recapitulando, os espaços vocálicos são estimativas acústicas que podem dar


indícios da atividade dos articuladores mandíbula, lábios e língua (LINDBLOM e
SUNDBERG, 1971). Como já dito, o cálculo dos espaços vocálicos foi feito com a
conversão para Bark das medidas dos formantes obtidas em Hertz. Bark é conhecida
como medida de banda crítica, uma medida psicoacústica relacionada à percepção, cuja
conversão foi feita via transformação de Traunmuller (1990)

Conforme já mencionado, As vogais foram rotuladas com o alfabeto SAMPA


durante a segmentação, e plotadas com o IPA. A plotagem das vogais foi concebida
quanto à tonicidade – pretônica, tônica ou postônica – sem considerar as vogais nasais e
os encontros vocálicos. As vogais [i, I, e, E, a, A, o, O, u, U] serviram como base para o
cálculo das estimativas de área de espaço vocálico (VSA) e de razão de centralização
formântica (FCR).

69
Figura 5.4.1: Espaços vocálicos nas posições acentuais da produção cantada sem
acompanhamento das coralistas (COR)

A figura 5.5 (ampliada no anexo III) exibe os espaços vocálicos para o canto sem
acompanhamento das coralistas (COR). Observa-se certa homogeneidade das áreas
totais entre as posições acentuais. As áreas de cada vogal nas pretônicas não estão bem
delimitadas, diferente das tônicas e postônicas.

Figura 5.4.2: Espaços vocálicos nas posições acentuais da produção cantada sem
acompanhamento das solistas (SOL)

A figura 5.6 (ampliada no anexo III) ilustra os espaços vocálicos nas posições
acentuais do canto sem acompanhamento das solistas (SOL). Esse grupo apresenta área
aparentemente maior que COR, quanto ao eixo de F2, em todas as posições acentuais.
Na sua maioria, as áreas correspondentes às vogais são melhor definidas, exceto em [o]
nas pretônicas.

70
Figura 5.4.3: Espaços vocálicos nas posições acentuais da produção cantada com
acompanhamento das coralistas (COR).

A figura 5.7 (ampliada no anexo III) ilustra os espaços vocálicos nas posições
acentuais no canto com acompanhamento das coralistas (COR). Nota-se áreas bem
definidas nas tônicas e postônicas, e dispersão nas pretônicas.

Figura 5.4.4: Espaços vocálicos nas posições acentuais da produção cantada com
acompanhamento das solistas (SOL).

A figura 5.8 (ampliada no anexo III) ilustra os espaços vocálicos nas posições
acentuais no canto com acompanhamento das solistas (SOL). Note-se a melhor definição
das áreas das vogais em todas as posições acentuais, exceto em [o] das pretônicas, que
aparenta dispersão.
Como observado, as vogais foram separadas por padrões acentuais (pretônicas,
tônicas e pós-tônicas), permitindo ver as diferentes realizações dos grupos. Note-se
visualmente a variabilidade de área de espaço vocálico, bem como a dispersão e
centralização vocálicas. Recordando, a avaliação dessas impressões foi realizada com o

71
cálculo das estimativas de Área de Espaço Vocálico (VSA) e de Razão de Centralização
Formântica (FCR), que permitem fazer inferências do ponto de vista da precisão
articulatória e da inteligibilidade.

5.4.1 Área de Espaço Vocálico (VSA)

Recapitulando, a avaliação da variabilidade dos espaços vocálicos com as


estimativas de área de espaço vocálico (VSA) e razão de centralização formântica (FCR),
permite fazer inferências sobre a atividade articulatória vocálica. Valores altos de VSA
indicam maior atividade de mandíbula e de corpo de língua, enquanto valores baixos
indicam menor atividade desses articuladores. Valores altos de FCR refletem
centralização das vogais, ao passo que valores baixos indicam a sua expansão. Vogais
centralizadas mostram possível imprecisão articulatória e consequente menor
inteligibilidade, enquanto vogais periféricas indicam precisão.

5.4.1.1 Canto sem acompanhamento

A análise aqui adotada empregou o teste t para comparação das médias dos
grupos, pois são apenas dois (COR e SOL).

variável grupo t valor p significância


VSA-pretônicas sol-cor 0,2220 0,8305 N
VSA-tônicas sol-cor 0,9745 0,3585 N
VSA-postônicas sol-cor 1,6842 0,1320 N
Tabela 5.9: Teste t entre grupos para VSA na
produção cantada sem acompanhamento

A tabela 5.9 exibe os resultados do teste t aplicado para as estimativas de VSA por
grupo. Os resultados não significativos mostram que os grupos apresentam áreas
semelhantes nas posições acentuais, fato observado na inspeção visual dos espaços
vocálicos.

72
SOL COR
VSA relação
média desvio padrão média desvio padrão
pretônica 4,8736 1,2374 4,4595 1,5960 SOL = COR
tônica 5,6456 1,0805 4,9606 1,1628 SOL = COR
postônica 2,4061 0,5326 1,8858 0,4381 SOL = COR
Tabela 5.10: Médias e desvios padrão de VSA por grupo, canto sem
acompanhamento.

A tabela 5.10 exibe as médias e desvios padrão de VSA por grupo no canto sem
acompanhamento. A relação de igualdade entre eles é novamente enfatizada.

5.4.1.2 Canto com acompanhamento

Conforme procedimento já realizado, foram realizadas as comparações entre os


grupos por meio do teste t. A tabela 5.11 mostra os resultado obtidos sem diferenças
significativas entre os grupos, com resultados idênticos aos já observados para o canto
sem acompanhamento.

variável grupo t valor p significância


VSA-pretônicas sol-cor 0,1841 0,8587 N
VSA-tônicas sol-cor 0,7354 0,4842 N
VSA-postônicas sol-cor 2,2239 0,0702 N
Tabela 5.11: teste t das estimativas de VSA entre
grupos no canto com acompanhamento

SOL COR
VSA relação
média desvio padrão média desvio padrão
pretônica 4,8489 1,4749 4,6595 1,7661 SOL = COR
tônica 5,5705 1,4716 4,9535 1,1638 SOL = COR
postônica 2,9073 0,9281 1,8866 0,4382 SOL = COR
Tabela 5.12: Médias e desvios padrão para VSA por grupo, canto com
acompanhamento.

A tabela 5.12 exibe as médias e desvios-padrão de VSA por grupo, enfatizando os


resultados obtidos no teste t.

73
5.4.2 Razão de Centralização Formântica (FCR)

5.4.2.1 Canto sem acompanhamento

Conforme já mencionado, não se empregou a ANOVA por haver apenas dois


grupos em análise, assim como nas análises de VSA.

variável grupo t valor p significância


FCR-pretônicas sol-cor -0,3964 0,7025 N
FCR-tônicas sol-cor -2,1836 0,0738 N
FCR-postônicas sol-cor -1,9682 0,0854 N
Tabela 5.13: Teste t entre grupos para FCR na
produção cantada sem acompanhamento

A tabela 5.13 exibe os resultados do teste t aplicado para as estimativas de FCR


por grupo, sem diferenças significativas. Novamente, tais resultados indicam atividade
articulatória semelhante entre os grupos.

SOL COR
FCR relação
média desvio padrão média desvio padrão
pretônica 1,5024 0,0631 1,5022 0,0937 SOL = COR
tônica 1,4410 0,0251 1,4903 0,0574 SOL = COR
postônica 1,5999 0,0316 1,6407 0,0263 SOL = COR
Tabela 5.14: Médias e desvios padrão de FCR por grupo, canto sem
acompanhamento.

A tabela 5.14 apresenta as médias e desvios-padrão de FCR por grupo no canto


sem acompanhamento. Mais uma vez é salientada a igualdade entre os grupos.

Os resultados de VSA e FCR para o canto sem acompanhamento reforçam a


semelhança entre os grupos, e salientam a segunda hipótese, que concerne à
semelhança entre eles relativa ao conhecimento musical. A formação musical e a técnica
vocal apreendida são os fatores que explicam a semelhança entre os grupos, fato esse
corroborado pela literatura sobre o canto (TOSI, 1783) e pesquisas instrumentais recentes
(ROSSING, SUNDBERG e TERNSTRÖM ,1985; SUNDBERG, LINDBLOM e

74
LILJENCRANTS, 1992; SUNDBERG, 1972, 1973, 1977, 1979, 1987,1999a, 1999b, 2001;
SUNDBERG e ASKENFELT, 1981; SUNDBERG e NORDSTRÖM, 1976; PABST e
SUNDBERG, 1993; MURBE et al., 2002; SUNDBERG, FAHLSTEDT e MORELL, 2005).

5.4.2.2 Canto com acompanhamento

A tabela 5.15 exibe os resultados do teste t realizado para FCR por grupo. Note-se
a diferença significativa para as tônicas, indicando diferença entre os grupos. O resultado
para as postônicas poderia ser considerado marginalmente significativo, e mostra possível
diferença entre os grupos.

variável grupo t valor p significância


FCR-pretônicas sol-cor -0,0587 0,9546 N
FCR-tônicas sol-cor -2,6319 0,0331 S
FCR-postônicas sol-cor -2,3937 0,0563 N
Tabela 5.15: teste t das estimativas de FCR entre
grupos no canto com acompanhamento

SOL COR
FCR relação
média desvio padrão média desvio padrão
pretônica 1,5172 0,0753 1,5200 0,0765 SOL = COR
tônica 1,4223 0,0369 1,4979 0,0526 COR > SOL
postônica 1,5679 0,0580 1,6364 0,0270 SOL = COR
Tabela 5.16: Médias e desvios padrão de FCR por grupo no canto com
acompanhamento.

A tabela 5.16 exibe as médias e desvios-padrão de FCR por grupo no canto com
acompanhamento. A relação COR > SOL mostra a precisão articulatória de SOL, pois
valores baixos de FCR indicam posições mais periféricas no espaço vocálico, implicando
em melhor inteligibilidade.
Esse fator endossa outro ponto da segunda hipótese (H2), relativo às diferenças
entre os grupos baseada no treinamento e na prática. Cantores com maior tempo de
treinamento e prática certamente buscam maior precisão na sua emissão.

75
5.4.3 Análise da Intensidade (SPL)

A intensidade, ou melhor, o nível de pressão sonora (SPL), foi medida em decibéis


(dB) e avaliada entre os grupos. A tabela 5.17 mostra os resultados com diferenças
significativas entre os grupos

intensidade t df valor p
sem acomp. 11,9351 9219,611 0
com acomp. 10,2707 9212,195 0
Tabela 5.17: Teste t das medidas de intensidade entre
grupos no canto sem e com acompanhamento

SOL COR
intensidade relação
média desvio padrão média desvio padrão
sem acomp. 71,8702 6,8633 70,3173 5,7647 SOL > COR
com acomp. 71,9157 7,1366 70,5280 5,9774 SOL > COR
Tabela 5.18: Médias e desvios padrão de intensidade(SPL) por grupo no canto,
sem e com acompanhamento.

A tabela 5.18 exibe as médias e desvios-padrão das medidas de intensidade entre


os grupos no canto, sem e com acompanhamento. Observa-se a relação SOL > COR,
ressaltando o grupo que tem maior tempo de treinamento e prática, resultado que
corrobora os achados anteriores relativos à diferença entre os grupos.

5.4.4 Análise dos Formantes

A avaliação dos espaços vocálicos foi baseada nas estimativas VSA e FCR, que
derivam do cálculo baseado nos formantes. Como já mencionado, foram conduzidos os
testes com os três primeiros formantes de todas as vogais (F1, F2 e F3), desconsiderando
os encontros vocálicos e as vogais nasais. Os formantes foram medidos de acordo com o
procedimento descrito na Metodologia.

76
5.4.4.1 Canto sem acompanhamento

Foram conduzidos testes de comparação de médias entre os grupos para os


formantes. A tabela 5.19 mostra os resultados do teste t aplicado aos formantes (em Bark
), com diferenças significativas em todos.

variável grupo t valor p significância


F1-Bark sol-cor 11,2504 0,0000 S
F2-Bark sol-cor 21,4312 0,0000 S
F3-Bark sol-cor 31,8432 0,0000 S
Tabela 5.19: Comparação entre médias para os formantes do
canto sem acompanhamento

SOL COR
Formantes relação
média desvio padrão média desvio padrão
F1 4,2657 1,2163 3,9416 1,5676 SOL > COR
F2 10,2322 1,5091 9,5641 1,5274 SOL > COR
F3 14,4554 0,8629 13,8187 1,0730 SOL > COR
Tabela 5.20: Médias e desvios padrão dos formantes por grupo no canto sem
acompanhamento.

A tabela 5.20 exibe as médias e desvios-padrão dos formantes por grupo. A


relação SOL > COR mostra a diferença entre os grupos. Esse resultado também foi
encontrado na fala, indicativo de distinção entre os grupos e de estratégia articulatória
particular, que será discutida a diante.

77
5.4.4.2 Canto com acompanhamento

Replicando o procedimento anterior, foram conduzidos testes de comparação de


médias entre os grupos para os formantes. A tabela 5.21 mostra os resultados do teste t
aplicado aos formantes (em Bark), com diferenças significativas em todos.

variável grupo t valor p significância


F1-Bark sol-cor 17,7831 0,0000 S
F2-Bark sol-cor 27,8610 0,0000 S
F3-Bark sol-cor 41,6687 0,0000 S
Tabela 5.21: teste t entre grupos dos formantes no canto com
acompanhamento

SOL COR
Formantes relação
média desvio padrão média desvio padrão
F1 4,5444 1,1493 4,0401 1,5796 SOL > COR
F2 10,5496 1,4360 9,7078 1,5070 SOL > COR
F3 14,7005 0,7323 13,9319 1,0382 SOL > COR
Tabela 5.22: Médias e desvio padrão para os formantes por grupo no canto com
acompanhamento.

A tabela 5.22 exibe as médias e desvios-padrão para os formantes por grupo no


canto com acompanhamento. Novamente, observam-se valores maiores para SOL em
relação a COR em todos os formantes, já observado na fala e no canto sem
acompanhamento. Esse aumento sistemático é outro fator que distingue esse grupo, pois
sugere estratégia articulatória distinta, que será discutida adiante. Além disso, esse fator
corrobora a segunda hipótese (H2) sobre a diferença entre os grupos, baseada na prática
e treinamento.

78
5.5 Comparação entre dados acústicos e estimativas da partitura

5.5.1.1 Canto sem acompanhamento

Conforme já mencionado, a comparação dos dados de duração e entoação (f0)


tem por objetivo avaliar o pareamento entre produção e idealização. A tabela 5.23 mostra
as médias e desvios-padrão de duração e entoação (f0) para a partitura e os grupos.

variável grupo t valor p significância


sol-partitura -4,6710 0,0000 S
duração
cor-partitura -4,6171 0,0000 S
sol-partitura -1,5682 0,1184 N
entoação
cor-partitura -2,1914 0,0296 S
Tabela 5.23: teste de comparação entre dados acústicos da produção
cantada sem acompanhamento com as estimativas da partitura

Variáveis PARTITURA SOL COR


relação
Acústicas média desvio padrão média desvio padrão média desvio padrão
duração 621,7949 602,8532 418,3328 399,6974 420,9191 371,2295 PAR > SOL = COR
entoação 0,7641 4,8157 -0,0608 3,4609 -0,2345 3,4233 PAR > SOL > COR
Tabela 5.24: Médias e desvios padrão para duração e entoação por grupo e partitura no canto sem
acompanhamento.

A tabela 5.24 exibe as médias e desvios-padrão para duração e entoação por


grupo e partitura. A relação entre esses grupos mostra o que já foi observado nos dados
anteriormente analisados, que é a semelhança dos grupos na duração e a diferença entre
eles na entoação no canto sem acompanhamento. Esses resultados mostram também
que os grupos estão abaixo do esperado e idealizado na partitura, ou melhor, “desafinam”
no ritmo e na entoação, efeitos já observados por outros autores (BROWN et cols. 2000,
2004; MENDES, 2003).

79
5.5.1.2 Canto com acompanhamento

A tabela 5.25 exibe os resultados do teste t para duração e entoação por grupo,
considerando a comparação com a partitura. As diferenças significativas para duração
indicam que os grupos não estão se adunando à partitura e ao acompanhamento. Já a
entoação tem resultado não significativo para SOL e partitura, que indica semelhança
entre os dois parâmetros, ou melhor, SOL se aduna à partitura quanto à entoação quando
há o acompanhamento. Por sua vez, COR não se aduna ao acompanhamento na duração
e na entoação.

variável grupo t valor p significância


sol-partitura -5,4115 0,0000 S
duração
cor-partitura -5,4812 0,0000 S
sol-partitura -1,7062 0,0895 N
entoação
cor-partitura -2,1953 0,0293 S
Tabela 5.25: teste t comparando duração e entoação entre grupos na
produção cantada com acompanhamento

Variáveis PARTITURA SOL COR


relação
Acústicas média desvio padrão média desvio padrão média desvio padrão
duração 621,7949 602,8532 386,6310 342,3663 383,6462 337,5930 PAR > SOL = COR
entoação 0,7641 4,8157 -0,2908 3,5937 -0,0752 3,3607 PAR > COR > SOL
Tabela 5.26: Médias e desvio padrão de duração e entoação por grupo e partitura no canto com
acompanhamento.

A tabela 5.26 exibe as médias e desvios-padrão de duração e entoação por grupo


e partitura no canto com acompanhamento. As diferenças das médias sugerem as
relações observadas, com semelhança entre SOL e COR na duração e diferença entre
esses grupos na entoação.

Ainda, as diferenças entre os grupos e a partitura mostram que os grupos se


assemelham no ritmo e na entoação quando há o acompanhamento. A explicação para
esse resultado, que diverge dos testes da tabela 5.26 quanto à entoação, tem base
possível no emprego do vibrato usado por SOL, justificado nos valores altos dos desvios-
padrão que aproximam as médias dos harmônicos.

80
Mais uma vez, esses fatores endossam a segunda hipótese (H2). As semelhanças
observadas em SOL quanto à entoação sugerem a influência da formação musical para
se adunar ao acompanhamento. As diferenças observadas sugerem a influência da
prática e do treinamento, necessários para se alinhar ao acompanhamento.

No entanto, aqui não foi analisada a correlação direta entre o acompanhamento e


as mudanças locais das vogais. Esse estudo traria luzes sobre as variantes de
interpretação, ou melhor, as diversas possibilidades de interpretação, pois o que se
observou foi a adaptação do intérprete ao acompanhamento controlado, sem aprofundar
esse grau de adaptação. Tal procedimento deve ser averiguado em trabalhos futuros.

81
82
6 Análise das vogais tônicas

83
84
6.1 Considerações preliminares

Os resultados obtidos nos capítulos anteriores mostram relações de semelhança e


diferença entre os grupos, na fala e no canto. Nesses capítulos (4 e 5) observou-se as
estratégias que os grupos empregaram na interpretação do texto da canção, lida ou
cantada, através da análise das variáveis acústicas e das variáveis linguísticas.
Recapitulando, foram estudados três grupos (SOL, COR, LOC) que leram o o texto
da canção Conselhos (Carlos Gomes), não declamaram, com as gravações segmentadas
e analisadas de acordo com o modelo descrito na Metodologia.

Dentre os diversos resultados, as análises mostraram que as vogais tônicas têm


um lugar privilegiado nas duas produções (fala e canto). Conforme já mencionado, essas
vogais são responsáveis pela manutenção do ritmo e da entoação, além de definir
características que tornam os grupos semelhantes ou distintos.
Tais resultados reforçam aspectos diferentes das duas hipóteses elencadas na
Introdução. A primeira hipótese (H1) trata da diferença da fala entre os grupos, que é
esperada. A segunda (H2) é sobre as semelhanças/diferenças no canto: se há
semelhanças, então, elas são definidas por fatores que dependem da formação musical;
se há diferenças, então, elas são definidas por fatores que dependem da prática e/ou
treinamento.
A terceira hipótese (H3) elencada na introdução trata da identidade dos grupos
expressa na fala e no canto. Tal identidade tem semelhanças e diferenças entre as duas
modalidades, que são expressas através dos parâmetros acústicos analisados. Ainda,
esses parâmetros indicam as semelhanças/diferenças de articulação vocálica.
As análises conduzidas até então ressaltam a importância de um parâmetro
acústico específico: os formantes. Eles serviram como base para o cálculo de VSA e FCR,
estimativas de espaço vocálico que permitem inferir sobre a precisão articulatória e a
inteligibilidade, conforme já mencionado. Eles apresentaram valores distintos entre os
grupos em todas as modalidades, fala e canto, conforme a exposição a seguir.

85
Figura 6.1.1: Gráfico de médias de F1 por grupo e
modalidades: fala, canto sem acompanhamento (cantoS),
canto com acompanhamento (cantoC).

A figura 6.1 exibe o gráfico de médias de F1 por grupo nas modalidades: fala, canto
sem acompanhamento (cantoS) e canto com acompanhamento (cantoC). As medidas dos
formantes, conforme já mencionado, foram feitas em Hertz e convertidas em Bark, aqui
apresentadas.

Nota-se nesse gráfico que as locutoras (LOC) estão entre os grupos com F1 mais
alto (SOL) e mais baixo (COR) na fala. COR possui pouca diferença entre o canto sem
acompanhamento e o canto com acompanhamento. SOL apresenta valores de F1
maiores que os outros grupos, com diferença aparente ainda maior entre o canto sem e o
canto com acompanhamento.

86
Figura 6.1.2: Gráfico de médias de F2 por grupo e
modalidades: fala, canto sem acompanhamento (cantoS),
canto com acompanhamento (cantoC).

A figura 6.2 exibe o gráfico de médias de F2 conforme já descrito na figura anterior.


Aqui são observados resultados idênticos àqueles da figura 6.1: a) LOC entre SOL e COR
na fala, b) pouca diferença no canto sem e com acompanhamento para COR, c) valores
maiores para SOL em todas as modalidades, d) diferença aparente entre o canto sem e o
canto com acompanhamento de SOL.

87
Figura 6.1.3: Gráfico de médias de F3 por grupo e modalidades:
fala, canto sem acompanhamento (cantoS), canto com
acompanhamento (cantoC).

A figura 6.3 exibe o gráfico de médias de F3, segundo a descrição feita na figura
6.1. Os resultados são semelhantes aos anteriores: a) gradiência observada na fala (SOL
> LOC > COR), b) valores de COR nas três modalidades com pouca diferença; c) SOL
com valores maiores, d) valor mais alto no canto com acompanhamento em relação ao
canto sem de SOL.

De modo geral, nota-se que os formantes têm valores baixos para a fala em
relação ao canto, mas, SOL apresenta valores sistematicamente maiores que os outros
grupos. Observa-se também a influência do acompanhamento musical, que eleva os
formantes de todas as cantoras (SOL e COR).

Dadas essas observações, foram investigadas as vogais tônicas [i, e, a, o, u]


através da análise dos formantes F1 e F2. Para os dados de fala foram conduzidas a
análise de variância (ANOVA) e o teste post-hoc de Tukey. Para os dados de canto foram

88
conduzidos testes de comparação de médias (teste t), por haver apenas dois grupos (SOL
e COR). Ainda, foram conduzidas análises comparando canto e fala de SOL e COR, por
meio de ANOVA e teste post-hoc de Tukey. Essa última análise foi conduzida devido às
suspeitas levantadas em MEDEIROS (2002) e em PESSOTTI (2007) sobre semelhanças
entre fala e canto, decorrentes de certa negociação entre essas modalidades no nível
segmental a fim de manter a inteligibilidade.

6.2 Investigação sobre as tônicas na fala

Conforme já mencionado, foram conduzidas a ANOVA e a comparação entre os


grupos com teste post-hoc de Tukey, para averiguar as semelhanças entre os grupos nas
vogais da fala.

vogais df F valor p significância


i 2 6,2359 0,0022 S
e 2 32,5030 0,0000 S
F1 a 2 32,5250 0,0000 S
o 2 15,6550 0,0000 S
u 2 17,7070 0,0000 S
i 2 2,4983 0,0840 N
e 2 26,2070 0,0000 S
F2 a 2 17,6410 0,0000 S
o 2 1,0070 0,3660 N
u 2 6,6576 0,0015 S
Tabela 6.1: ANOVA dos Formantes F1 e F2 (Bark) por
vogais e grupo na fala.

A tabela 6.1 exibe os resultados da ANOVA dos formantes F1 e F2 por vogais e


grupo. Os resultados para F1 mostram diferenças significativas, e podem ser
interpretados como diferenças de estratégias de abertura oral entre os grupos em todas
as vogais.
Os resultados significativos para F2 nas vogais [e, a, u] indicam anteriorização/
posterização diferentes entre os grupos. Já os resultados não significativos em [i, o] para
F2 indicam semelhante articulação entre os grupos nessas vogais.

89
vogais média desvio padrão relação
i 1,4712 1,0585 SOL > LOC = COR
e 2,2211 1,1015 SOL > LOC = COR
F1 a 2,9644 1,7732 SOL > LOC = COR
o 4,2012 1,3400 SOL > LOC > COR
u 3,5596 1,0987 SOL > LOC > COR
i 6,8595 2,6667 SOL = LOC = COR
e 9,1653 2,2090 SOL > LOC > COR
F2 a 9,0761 1,3771 SOL > LOC > COR
o 8,4614 1,1012 SOL = LOC = COR
u 8,8140 1,2479 SOL > LOC = COR
Tabela 6.2: Médias e desvios padrão dos formantes por vogal na
fala.

A tabela 6.2 exibe as médias e desvios-padrão para os formantes por vogal na fala,
e a relação entre os grupos, avaliada pelo teste post-hoc de Tukey. SOL tem valores
maiores em F1 para todas as vogais, enquanto que LOC e COR são semelhantes em [i,
e, a] e distintas (LOC > COR) em [o, u]. Em F2 há semelhança nas vogais [i, o] entre os
grupos, gradiência de grupos (SOL > LOC > COR) em [e, a], e distinção de SOL em [u].

Os resultados obtidos em F1 podem ser interpretados como abertura oral maior em


SOL para todas as vogais, semelhança entre LOC e COR em [i, e, a], e maior abertura
oral de LOC em relação a COR em [o, u]. Os resultados obtidos em F2 podem ser
interpretados como maior anteriorização/posterização em [e, a, u] de SOL em relação aos
grupos. Os outros resultados parecem refletir diferenças da atividade labial, com maior
estiramento por parte de SOL em relação aos outros grupos, justificado também pelos
valores elevados de todos os formantes.

Tais resultados, aliados aos anteriores, sugerem comportamento articulatório


distinto dos grupos com maior prática e treinamento vocal (SOL e LOC). SOL é o grupo
que tem formantes mais elevados, com evidente articulação mandibular distinta
comprovada pelos valores de F1. Nota-se também que os resultados de F2 mostram a
distinta articulação de corpo de língua em [e, a], vogais que exigem maior abertura oral.

90
As diferenças entre SOL e LOC podem ser explicadas pela formação que
receberam. SOL é o grupo de cantoras solistas, que, devido à sua formação foram
ensinadas a exagerar a abertura oral a fim de melhor sintonizar a entoação, com fins
estéticos e/ou emotivos. LOC é o grupo de locutoras profissionais e, de forma
semelhante, foram treinadas para obter uma articulação maior, porém, não tão ampla
como no canto, enfatizando a chamada voz de locução, com entoação grave. Tal recurso
tem consequências articulatórias já observadas, como o abaixamento de laringe e
aumento do espaço faríngeo.

Esses resultados corroboram o comportamento articulatório particular na fala desse


grupo (SOL), pois essas duas vogais podem ser articuladas com possível estiramento
labial, cuja explicação, já mencionada, estaria baseada nos valores elevados dos
formantes. A saber, formantes elevados implicam duas estratégias articulatórias distintas:
ou elevação de laringe ou estiramento labial. A primeira é desaconselhada porque pode
causar cansaço vocal, enquanto a segunda é recomendada até por questões estilísticas.

6.3 Investigação sobre as tônicas no canto

Os resultados obtidos no capítulo 5 para a produção cantada, com e sem


acompanhamento, mostram diferenças entre os grupos SOL e COR, ressaltando as
tônicas, como observado na análise dos dados de fala. Conforme já observado, todos os
formantes de SOL são mais elevados.

91
6.3.1 Canto sem acompanhamento

vogais df t valor p significância


i 195,729 0,9093 0,3643 N
e 415,089 2,6423 0,0085 S
F1 a 491,581 0,7713 0,4409 N
o 291,308 1,9998 0,0465 S
u 180,56 -1,1488 0,2521 N
i 197,319 2,2652 0,0246 S
e 438,423 5,2357 0,0000 S
F2 a 497,608 2,4238 0,0157 S
o 342,986 2,3687 0,0184 S
u 196,99 -0,2829 0,7776 N
Tabela 6.3: Teste t comparando formantes das vogais tônicas por grupo,
canto sem acompanhamento.

A tabela 6.3 apresenta os resultados do teste de comparação de médias (teste t)


dos formantes das vogais tônicas por grupo. Os resultados não significativos foram
obtidos em F1 para [i, a, u], e não significativo em F2 ocorre na vogal [u].

Os resultados não significativos foram obtidos em F1 indicam semelhante abertura


mandibular dos grupos. Já o resultado não significativo em F2 pode ser interpretado como
semelhante anteriorização/posterização de corpo de língua, além de semelhante
protrusão labial entre os grupos, pois a vogal [u] tem essa articulação dos lábios.

92
SOL COR
relação
vogais média desvio padrão média desvio padrão
i 4,4358 1,4984 4,2318 1,6695 SOL = COR
e 4,1244 1,2490 3,7574 1,6681 SOL > COR
F1 a 4,6886 1,7095 4,5633 1,9174 SOL = COR
o 4,9574 1,0036 4,6675 1,6243 SOL > COR
u 4,1818 0,8599 4,3505 1,1866 SOL = COR
i 11,2043 1,8938 10,5790 2,0085 SOL > COR
e 10,9168 1,5379 10,0945 1,7848 SOL > COR
F2 a 9,8870 1,1640 9,6381 1,1318 SOL > COR
o 9,3210 1,0767 9,0415 1,1156 SOL > COR
u 9,1515 1,1601 9,1984 1,1802 SOL = COR
Tabela 6.4: Médias e desvios padrão dos formantes das vogais tônicas por grupo, canto sem
acompanhamento.

A tabela 6.4 apresenta as médias e desvios-padrão dos formantes das vogais


tônicas por grupo no canto sem acompanhamento. A relação entre os grupos mostra que
prevalecem os valores altos dos formantes de SOL, superando os de COR nas vogais
onde se observou diferença significativa nos testes anteriores.

Esses resultados corroboram as análises anteriores. Os resultados de F1 mostram


atividade mandibular semelhante nas vogais [i, a, u]. Os resultados de F2 mostram
semelhante atividade em [u] entre os grupos, devido ao possível papel compensatório dos
lábios. Note-se os valores altos de F2 nas outras vogais em SOL, resultado que pode ser
interpretado como maior estiramento labial.

93
6.3.2 Canto com acompanhamento

vogais df t valor p significância


i 183,419 2,2443 0,0260 S
e 396,861 4,8623 0,0000 S
F1 a 483,334 2,6587 0,0081 S
o 288,691 2,4307 0,0157 S
u 184,266 -1,9981 0,0472 S
i 167,152 5,2639 0,0000 S
e 411,525 7,6915 0,0000 S
F2 a 492,641 5,0331 0,0000 S
o 341,918 2,0067 0,0456 S
u 169,614 -0,2847 0,7762 N
Tabela 6.5: Teste t comparando formantes das vogais tônicas por grupo,
canto com acompanhamento.

A tabela 6.5 apresenta os resultados do teste de comparação de médias (teste t)


dos formantes das vogais tônicas por grupo no canto com acompanhamento. Note-se a
predominância das diferenças significativas em F1, indicativo de maior abertura
mandibular distinta no canto com acompanhamento. Em F2 há distinta
anteriorização/posterização de corpo de língua entre os grupos para as vogais [i, e, a, o]
no canto com acompanhamento, exceto em [u], pois não há diferença significativa entre
os grupos.

94
SOL COR
relação
vogais média desvio padrão média desvio padrão
i 4,5171 1,3642 4,0061 1,8228 SOL > COR
e 4,4324 1,2078 3,7408 1,7586 SOL > COR
F1 a 5,0673 1,5434 4,6634 1,8404 SOL > COR
o 5,2421 0,9127 4,9182 1,5003 SOL > COR
u 4,3608 0,9338 4,6709 1,1997 SOL > COR
i 11,5990 1,3933 10,2256 2,2058 SOL > COR
e 11,3315 1,3367 10,1748 1,8171 SOL > COR
F2 a 10,2159 0,9838 9,7480 1,0923 SOL > COR
o 9,4571 1,0234 9,2388 0,9959 SOL > COR
u 9,3826 1,3418 9,4330 1,0659 SOL = COR
Tabela 6.6: Médias e desvios padrão dos formantes das vogais tônicas por grupo, canto com
acompanhamento.

A tabela 6.6 exibe as médias e desvios-padrão dos formantes das vogais tônicas
por grupo, no canto com acompanhamento. Os resultados mostram o que já foi
observado, com valores maiores dos formantes para SOL e semelhança em [u] de F2.

Os valores altos observados em SOL indicam, em F1, maior abertura mandibular,


e, em F2, maior anteriorização/posterização de corpo de língua. Como já observado, o
resultado semelhante de F2 em [u] pode ser interpretado como a possível compensação
labial devido à protrusão exigida para executar a vogal. Ainda, os formantes elevados de
SOL sugerem maior estiramento labial, principalmente nas vogais [e, o, a].

Esses resultados corroboram os achados anteriores, e levantam suspeitas da


atividade articulatória de SOL. Como já observado, os formantes altos implicam em
estiramento labial ou elevação de laringe, com preferência do primeiro em relação ao
segundo.

95
6.4 Comparação entre modalidades

A comparação entre as modalidades foi conduzida somente com as cantoras (SOL


e COR), pois elas leram e cantaram, diferente de LOC, considerando as análises das
vogais separadamente. Fez-se a ANOVA dos formantes por modalidade e grupo, além da
comparação via teste post-hoc de Tukey, cujas tabelas estendidas estão nas tabelas 9.4 e
9.5 do anexo I.

Formantes Grupo [i] [e] [a] [o] [u]


SOL Com = Sem > Fala Com = Sem > Fala Com = Sem = Fala Com = Sem > Fala Com = Sem = Fala
F1
COR Com > Sem > Fala Com = Sem > Fala Com = Sem > Fala Com > Sem > Fala Com = Sem > Fala
SOL Com = Sem > Fala Com > Sem > Fala Com = Sem > Fala Com = Sem > Fala Com = Sem = Fala
F2
COR Com = Sem = Fala Com = Sem > Fala Com = Sem > Fala Com = Sem > Fala Com = Sem = Fala
Tabela 6.7: Quadro resumo das relações entre formantes das vogais tônicas, modalidade e
grupo: Com – canto com acompanhamento, Sem – canto sem acompanhamento, Fala – fala.

A tabela 6.7 apresenta o quadro resumo das análises (ANOVA e testes post-hoc de
Tukey) entre os formantes F1 e F2 das vogais tônicas por modalidade e grupo,
disponíveis no anexo I. A modalidade é definida por fala (Fala), canto sem
acompanhamento (Sem) e com (Com). Observam-se três tipos de resultados: a) Com >
Sem > Fala, b) Com = Sem = Fala, c) Com = Sem > Fala.

O primeiro (Com > Sem > Fala) indica a diferença entre as modalidades, que
ocorre em F1 de [i, o] em COR, em decorrência da diferença de abertura mandibular
nessas vogais entre as modalidades, e em F2 de [e] em SOL, indicativo de diferença de
anteriorização/posterização de corpo de língua entre as modalidades.

O segundo (Com = Sem = Fala) mostra a semelhança entre as modalidades,


indicando semelhante atividade articulatória. Observa-se esse resultado em F2 de [i, u]
em COR, F1 de [a, u] em SOL e F2 de [u] em SOL. Isso indica que COR tem semelhante
anteriorização/posterização de corpo de língua e protrusão labial nas vogais [i, u]. SOL
tem semelhante articulação mandibular em [a, u] e semelhante articulação de corpo de

96
língua em [u].

O terceiro (Com = Sem > Fala) mostra a realização semelhante no canto sem e
com acompanhamento, diferindo da fala. Esse resultado é o predominante, e, esperado,
pois o canto tende a ter formantes maiores que a fala, como já demonstrado nos gráficos
das figuras 6.1 a 6.3.

Tais resultados podem derivar da proficiência musical que possuem, em


decorrência do treinamento vocal. De modo geral, esse treinamento objetiva a busca por
manutenção de postura vocal confortável. Conforme já observado, formantes elevados
têm consequências articulatórias distintas, que podem levar ao desconforto ou ao
conforto. Um profissional da voz dificilmente procura o desconforto vocal, ainda mais
durante uma jornada cotidiana de trabalho. Com esses resultados, supõe-se a ocorrência
de algum tipo de processo adaptativo, entre as modalidades, a fim de facilitar a passagem
de uma à outra.

97
98
7 Discussão e Considerações Finais

99
100
7.1 Recapitulação

Faz-se necessária uma recapitulação dos objetivos, procedimentos e resultados


obtidos. O objetivo deste estudo é observar os efeitos decorrentes do treinamento e da
prática vocal profissional, através das análises de parâmetros fonético-acústicos que
evidenciam semelhanças e diferenças na fala e no canto. Para isso, elencaram-se três
hipóteses: H1) a fala é distinta entre os grupos; H2) entre os grupos, o canto tem
semelhanças dependentes da formação musical, e diferenças dependentes da prática e
do treinamento; e H3) fala e canto refletem identidade de grupo através das
semelhanças/diferenças observadas nos parâmetros acústicos.
Para tanto, foram realizadas análises com os dados obtidos da partitura da canção
escolhida (Conselhos, Carlos Gomes), de natureza não paramétrica, e análises com os
dados acústicos das gravações de fala e canto, de natureza paramétrica. As variáveis das
análises não paramétricas influenciaram a escolha e definição das variáveis paramétricas.
Foram estipuladas variáveis acústicas e linguísticas tomadas como base nas análises.
As análises não-paramétricas mostraram que as estimativas prosódicas de nível
linguístico e musical parecem manter a estrutura linguística da canção, pondo em
evidência as tônicas. As análises paramétricas das estimativas acústicas de duração e
entoação obtidas das partitura foram pareadas com os dados das gravações. Os
resultados dessas análises mostraram que a fala difere entre todos os grupos quanto à
duração e quanto à entoação. O canto difere entre SOL e COR quanto à duração, porém,
se assemelha quanto à entoação.
As gravações de fala e canto foram analisadas de forma pareada entre os grupos.
As análises realizadas com as variáveis linguísticas para os dados de fala mostram
semelhanças e diferenças duracionais que separam os grupos com maior prática e
treinamento vocal (LOC e SOL) quanto ao padrão acentual (PA), e semelhante produção
de posicionamento de sintagma fonológico (PSF).
Já no canto, sem e com acompanhamento, a semelhança ocorre na Tonicidade
(TF) quanto à entoação; PA quanto à duração. Ainda, os resultados mostram que SOL
procura manter o alongamento nos níveis prosódicos mais altos, enquanto COR procuram
manter o mesmo nos níveis mais baixos. Tais estratégias parecem manter a estrutura
linguística da composição nas produções das modalidades (falada e cantada).

101
A intensidade parece evidenciar a proficiência das leitoras, pois é maior na fala das
locutoras (LOC) que das cantoras (SOL e COR). Os formantes marcam o grupo com
maior proficiência no canto (SOL), pois observou-se que os seus formantes (F1, F2, F3)
têm valores maiores que os de LOC e de COR, diferenciando as tônicas das átonas na
fala e no canto.
Novamente, tais resultados diferenciam o grupo SOL, possivelmente pela
proficiência musical e pela prática e treinamento vocal. Esses resultados sugerem uma
busca por possível manutenção de postura vocal confortável.

7.2 Discussão

As análises dos dados acústicos apresentam diversos resultados interessantes que


corroboram as hipóteses elencadas (H1, H2 e H3), evidenciando as estratégias realizadas
pelos grupos nas tarefas de leitura e canto do mesmo texto. Tais estratégias incluem a
manipulação e interação entre níveis linguísticos e estrutura musical, ou melhor, a
manipulação de níveis prosódicos para a manutenção da estrutura musical. Além disso,
levantam outras questões.
Primeiramente, esses resultados apontam valores elevados dos formantes do
canto em relação aos da fala, já relatados na literatura (LINBLOM e SUNDBERG, 1972 e
2005; SUNDBERG e NORDSTRÖM, 1976; SUNDBERG e ASKENFELT, 1981;
SUNDBERG, 1973 e 1987; MEDEIROS, 2002; SUNDBERG et al., 2005; PESSOTTI,
2007). Deve-se notar a gradiência de todos os formantes na fala é SOL > LOC > COR,
corroborada pela análise de variância e pelos testes post-hoc de comparações aos pares
(Tukey HSD < 0,05). Ainda, ocorre no canto a mesma gradiência observada na fala (SOL
> COR).
É preciso notar que a fala das locutoras também tem formantes sistematicamente
mais altos que a das coralistas. Existem estudos que apontam outro formante especial, o
do ator/leitor (LEINO e KARKKAINEN, 1995; PINCZOWER e OATES, 2005; MASTER et
al. 2006, 2008 e 2011; LEINO et al., 2009), e outros que reportam um uso sistemático da
“fala sorridente” (LEINO e KARKKAINEN, 1995; PINCZOWER e OATES, 2005; BELE,
2006; MASTER et al., 2006, 2008 e 2011; LEINO et al. 2009).

102
A maior abertura oral, provocada pelo abaixamento da mandíbula ou pelo
estiramento dos lábios, tem como possível resultado a elevação dos formantes
observada, fato ausente do grupo das cantoras coralistas, menos treinado. Pode-se supor
que as estratégias utilizadas pelas locutoras sejam semelhantes às das solistas, mas,
sejam aplicadas à fala, onde a melodia veiculada por f0 é a da entoação.
Tais diferenças sistemáticas de elevação dos formantes podem indicar que as
solistas usam estratégias articulatórias que permitem o encurtamento do trato vocal. Duas
estratégias distintas podem ser executadas, com consequências distintas: a) a elevação
da laringe, que não implica maior abertura oral; b) o estiramento dos lábios, que implica
necessariamente maior abertura oral.
A elevação de laringe é desaconselhada na literatura da pedagogia do canto (TOSI,
1723[1968]; MANCINI, 1774; GARCIA, 1854; LAMPERTI, 1864), por acarretar esforço
vocal. Esse fato foi corroborado por estudos recentes (SUNDBERG e ASKENFELT, 1981;
PABST e SUNDBERG, 1993).
O estiramento dos lábios resulta numa mudança de timbre (SUNDBERG e
ASKENFELT, 1981; PABST e SUNDBERG, 1993; GARNIER et al., 2008), recomendada
pela pedagogia do canto (GARCIA, 1854; MILLER, 1977). Outro uso positivo desse gesto
articulatório é encontrado na literatura sobre expressividade, pois o estiramento e suas
consequências acústicas decorrem necessariamente da “fala sorridente” (FAGEL, 2009),
agregando valor estilístico positivo.
Há na literatura fonética sobre o canto bases que justificam as manobras
articulatórias citadas. Estudos recentes identificam a sintonização do segundo formante
com algum harmônico de f0 (SUNDBERG, 1974; SUNDBERG, 1987; SUNDBERG et al.,
1999; JOLIVEAU et al., 2004, WOLFE e SMITH, 2008, GARDNER et al., 2010). Seria
esse um complemento da abertura da mandíbula, que é uma maneira conhecida de
sintonizar o primeiro formante com f0 (LESSAC, 1967; RAPHAEL e SCHERER, 1987;
MILLER e SCHUTTE, 1990; CARLSSON-BERNDTSSON e SUNDBERG, 1991;
SUNDBERG et al., 1992; KAYES, 2003).
No entanto, somente a abertura mandibular e o estiramento labial poderiam
acarretar a distorção de certas vogais, principalmente as altas. Como a prática vocal
profissional busca o conforto, é natural que um cantor proficiente tente parear f0 ou
qualquer de seus harmônicos com o formante menos passível de alteração, pois essa
estratégia de “sintonia” permite aumentar o volume sem esforço vocal, além de preservar
a inteligibilidade.

103
Os resultados mostram ainda outro fator interessante: o canto com
acompanhamento parece ser um lugar privilegiado para a elevação dos formantes. O
acompanhamento tende a marcar o ritmo e servir de apoio da harmonia, independente da
melodia. Além disso, uma vez que a sintonização promove um aumento de volume, deve-
se investigar no futuro a sua importância em momentos de saliência rítmica.
Para tanto, pode-se em trabalhos futuros, recorrer à síntese de fala, replicando
alguns dos trechos gravados de forma semelhante ao que se faz com a fala de
laboratório. As elevações de formantes observadas são possíveis de simular de acordo
com a literatura (Sanguinetti et al., 1994; Beautemps et al., 1995; Perrier et al. 2003 e
2005).
Esses resultados chamam a atenção para a possível transferência articulatória da
prática vocal profissional para a situação informal de leitura. O treinamento tanto das
solistas como das locutoras parece aumentar o conforto na abertura oral, com a elevação
dos formantes e, assim, sintonizá-los da maneira menos custosa possível com f0 ou seus
harmônicos, criando um efeito de maior ressonância.
Esses seriam indícios de uma possível adaptação fônica semelhante à que ocorre
nas interlínguas, onde uma prática sedimentada sofre influência de outra mais recente e
menos frequente. O uso da voz profissional, por razões de saúde vocal, não costuma
exceder determinado limite diário. Porém, é improvável que um profissional da voz faça
pouco uso da oralidade no cotidiano. É possível que a transferência articulatória aqui
observada na tarefa de leitura possa ser mais generalizada, hipótese que deve ser
investigada no futuro.
Além disso, esse pode ser um fenômeno de “interprática” vocal, semelhante ao
observado na aquisição de segunda língua. Em outras palavras, um recurso usado
anteriormente com pouca frequência passa a ser mobilizado cada vez mais, visando à
proficiência, e acaba por “invadir” contextos onde não é esperado.

104
7.3 Considerações Finais

Várias teorias poderiam contribuir para explicar os resultados aqui reportados,


dentre elas, a Fonologia Gestual (BROWMAN e GOLDSTEIN, 1995 e seguintes). Nesse
teoria, postula-se que a fala pode ser explicada pela ativação dos gestos dos
articuladores. Os gestos são considerados nessa teoria linguística como a unidade
mínima de descrição.

Aqui foram estudadas as produções de cantoras e locutoras que possuem prática


profissional cotidiana, e, possuem treinamento vocal prévio. Tal treinamento desenvolvido
diária e continuamente, deve envolver a percepção do que se produz e produção do que
se percebe, muitas vezes como um processo de imitação.

Essas profissionais certamente buscaram aproximar a fala cotidiana das suas


práticas profissionais, transferindo muitos dos gestos articulatórios de uma produção para
a outra, de forma semelhante ao que ocorre na aquisição de segunda língua. As
estratégias das solistas aqui reportadas para elevação dos formantes poderiam ser
explicadas como sintonização dos gestos em busca de conforto durante o canto, gestos
que, por sua vez, seriam transferidos para a fala por um processo inverso, que é
decorrente da prática continuada. O mesmo se pode dizer das locutoras, que transfeririam
sua gestualidade oral para além da prática profissional, para a fala cotidiana.

Como observado nos resultados obtidos, há possível sintonia gestual com a


entoação, em busca de conforto da produção falada ou cantada. Tais resultados poderão
ser reavaliados com diversas ferramentas, entre elas, a análise espectral com o LTAS
(ROSSING, SUNDBERG e TERNSTRÖM, 1985; BOERSMA e KOVACIC, 2006). Esse é o
primeiro caminho a explorar num aprofundamento futuro da análise dos dados desta tese.

105
106
8 Referências Bibliográficas

107
108
ABRAHAMSSON, M., e SUNDBERG, J. Subglottal pressure variation in actors’ stage
speech. In REES, M. (Ed.), Voice and Gender Journal for the Voice and Speech
Trainers Association (pp. 343-347); 2007.
ADAMI, Andre G., MIHAESCU, Radu, REYNOLDS, Douglas A., GODFREY, John J.
Modeling Prosodic Dynamics for Speaker Recognition. In ICASSP 2003 -
Proceedings, Oregon,USA; 2003

ALBANO, Eleonora C. O gesto e suas bordas: esboço de fonologia acustico-


articulatoria do português brasileiro - Campinas: Mercado das Letras; 2001.

AMIR, O., AMIR, N., e KISHON-RABIN, L. The effect of superior auditory skills on
vocal accuracy, J. Acoust. Soc. Am. 113-2, 1102– 1108; 2003.

BAAYEN, R.H. DAVIDSON, D.J. BATES, D.M. Mixed-effects modeling with crossed
random effects for subjects and items, Journal of Memory and Language,
Volume 59, Issue 4, Special Issue: Emerging Data Analysis, November 2008, pp.
390-412, ISSN 0749-596X, DOI: 10.1016/j.jml.2007.12.005. Url:
http://www.sciencedirect.com/science/article/B6WK4-4RYXSNC-
1/2/bcebe3e8046b6c776f211f6c078b6f20

BARBOSA, P. A.,. Explaining Brazilian Portuguese resistance to stress shift with a


coupled-oscillator model of speech rhythm production, Cadernos de Estudos
Lingüísticos 43, 71-92; 2002b

BARBOSA, P. A.,. Explaining cross-linguistic rhythmic variability via a coupled-


oscillator model of rhythm production. Speech Prosody 2002 Conference. Aix-en-
Provence, France, 163-166; 2002a

BARBOSA, P. A. Incursões em torno do Ritmo da Fala, Campinas, SP, Ed. Pontes/


FAPESP; 2006.

BEAUTEMPS D., BADIN P. e LABOISSIÈRE R. Deriving vocal-tract area functions


from midsagittal profiles and formant frequencies: a new model for vowels and
fricative consonants based on experimental data. Speech Comm.16, 27-47; 1995
BELE, I.V. The Speaker’s Formant. Journal of Voice; 2006.
BOERSMA, Paul e WEENINK, David Praat: doing phonetics by computer (Version
5.1.05) software; último acesso: 06.06.2010; URL: http://www.praat.org/

109
BROWMAN, C., GOLDSTEIN, L. Competing constraints on intergestural coordination
and self-organization of phonological structures. Bull. Comm. Parle 5, 25-34,
2000.

BROWMAN, Catherine P. e Louis GOLDSTEIN Articulatory gestures as phonological


units. Phonology 6: 201–252; 1989.

BROWMAN, Catherine P. e Louis GOLDSTEIN Articulatory phonology: An overview.


Phonetica 49: 155–180; 1992.

BROWMAN, Catherine P. e Louis GOLDSTEIN Gestural specification using


dynamically-defined articulatory structures. Journal of Phonetics 18: 299–320;
1990.

BROWMAN, Catherine P.; GOLDSTEIN, Louis “Targetless” schwa: an articulatory


analisys; in DOCHERTY, Gerard J. and LADD, D. Robert Papers in Laboratory
Phonology: Gesture, Segment, Prosody; Cambridge University Press; pp 26-67;
1992.

BROWN, S., MARTINEZ, M. J., HODGES, D. A., FOX, P. T., e PARSONS, L. M. The song
system of the human brain, Brain Res. Cognit. Brain Res. 20, 363–375; 2004.

BROWN, W. S., Jr., ROTHMANN, H. B., e SAPIENZA, C. Perceptual and acoustic study
of professionally trained versus untrained voices, Journal of Voice 14(3), 301–
309; 2000.

BURROWS, David A Dynamical Systems Perspective on Music; The Journal of


Musicology, Vol. 15, No. 4 (Autumn, 1997), pp. 529-545; University of California
Press, 1997.

BYRD, D. Articulatory vowel lengthening and coordination at phrasal junctures,


Phonetica, 57, 3-16; 2000.

BYRD, Dani & SALTZMAN, Elliot Intragestural dynamics of multiple prosodic


boundaries; Journal of Phonetics 26, 173–199; 1998.

BYRD, Dani & SALTZMAN, Elliot The elastic phrase: modeling the dynamics of
boundary-adjacent lengthening; Journal of Phonetics 31 149–180; 2003.

BYRD, Dani Articulatory Vowel Lengthening and Coordination at Phrasal Junctures;


Phonetica; 57:3–16; 2000.

110
CARLSON, Rolf; FRIBERG, Anders; FRYDÉN, Lars; GRANSTRÖM, Björn e SUNDBERG,
Johan Speech and music performance: Parallels and contrasts; Contemporary
Music Review, vol 4, #1; 1989; online reprinted by Routledge, Taylor & Francis Group
(2006) ISSN 0749-4467

CARLSSON-BERNDTSSON, G., e SUNDBERG, J. Formant frequency tuning in


singing. STL-QPSR, 32(1), 029-035; 1991.
CASTRO, S.L., MARQUES, C., & BESSON, M. Aprendizagem musical e linguagem: A
percepção do contorno melódico e da entoação. Psychologica, Extra-Série, 69-
77; 2004.

CLAYTON, Martin; SAGER, Rebecca e WILL, Udo In time with the music: the concept
of entrainment and its significance for ethnomusicology. European Meetings in
Ethnomusicology, 11, pp. 3–142; 2005.

COLEMAN, J. Introducing speech and language processing. Cambridge University


Press, Cambridge, UK, 2005.

COOK, Thomas D. & CAMPBELL, Donald T. Quasi-Experimentation: design & analysis


issues for field settings; Houghton Mifflin Co. Boston, USA; 1979.

D’AUTILIA, Roberto Prosody and the Music of the Human Speech; International Journal
of Modern Physics B;World Scientific Publishing Company, 2006.

DALLA BELLA, Simone, GIGUÈRE, Jean-François e PERETZ, Isabelle Singing


proficiency in the general population, Journal of Acoust. Soc. Am. 121 (2), 1182–
1189, 2007.

DE BOER, B The origins of vowel systems Oxford University Press, USA, 2001.

DE JONG, K., Acoustic and Articulatory Correlates of Pcenter Perception, UCLA


Working Papers in Linguistics, 81: 66-75, 1992.

DE JONG, N.H. e WEMPE, T. Praat script to detect syllable nuclei and measure
speech rate automatically. Behavior research methods, 41 (2), 385 – 390; 2009.

DELATTRE, Pierre Vowel Color and Voice Quality: an acoustic and articulatory
comparison. Chicago. NATS Bulletin, October, 1958.

111
DELATTRE, Pierre; LIBERMAN, Alvin M.; COOPER, F. S. , GERSTMAN, C. J. An
Experimental Study of the acoustic determinants of vowel color: observations
on one and two-formant vowels synthesized from spectrographic patterns.
New York; Haskins Laboratories, reimpressão da WORD, 1952.

DUEY, P. A. Vocal Art in Antiquity The Musical Quarterly, Vol. 32, No. 3., pp. 390-410,
1946.

FAGEL, Sascha Effects of Smiling on Articulation: Lips, Larynx and Acoustics. In


Proceedings of COST 2102 Training School, 2009. pp.294~303; 2009.
FELD, Steven e FOX, Aaron A. Music and Language; Annual Review of Anthropology,
Vol. 23., pp. 25-53; 1994.

FISCUS, Jonathan G., AJOT, Jerome, RADDE,Nicolas, LAPRUN, Christophe, Multiple


Dimension Levenshtein Edit Distance Calculations for Evaluating Automatic
Speech Recognition Systems During Simultaneous Speech National Institute of
Standards and Technology (NIST), 100 Bureau Drive, Stop 8940, Gaithersburg, MD
20899, USA;url: http://www.nist.gov/speech/tools/index.htm ; 2007.

FLEGE, J. E. The detection French accent by American listeners. Journal of the


Acoustical Society of America, 76, 692-707; 1984.

FLEGE, J. E. The production and perception of foreign language speech sounds. In


Human Communication and its Disorders, Vol II (H. Winitz, editor) Norwood, NJ;
Ablex Publishing; 1986.

FLEGE, J. E. The production of "new" and "similar" phones in a foreign language:


evidence for the effect of equivalence classification. Journal of Phonetics, 15, 47
– 65;1987.

FOWLER, C. A., Converging Sources of Evidence on Spoken and Perceived


Rhythms of Speech: Cyclic Production of Vowels in Monosyllabic Stress Feet,
Journal of Experimental Psychology: General, 112 (3): 386-412, 1983.

GARCIA, Manuel; Observations on the Human Voice, in Proceedings of The Royal


Society of London, 1854-55, In Contributions of Voice Research to Singing,
Houston, College-Hill Press; 1980.
GARNIER, M.; HENRICH, N.; SMITH, J.; WOLFE, J. Vocal tract adjustments in the
high soprano range. Journal of Acoustic Society of America, 127-6; 2010.

112
GARNIER, Maeva WOLFE, Joe HENRICH, Nathalie SMITH, John : Interrelationship
between vocal effort and vocal tract acoustics: a pilot study, In INTERSPEECH-
2008, 2302-2305; 2008.
GELAMO, Renata P. Organização Prosódica e Interpretação de Canções: A Frase
Entoacional em Quatro Diferentes Interpretaçòes de “Na Batucada Da Vida”;
Dissertação de Mestrado; Oritentador: Prof. Dr. Lourenço Chacon Jurado Filho;
UNESP, São José do Rio Preto; 2006.

GIORGINO T . Computing and Visualizing Dynamic Time Warping Alignments in R:


The dtw Package. Journal of Statistical Software, 31(7), 1–24. URL
http://www.jstatsoft.org/v31/i07/ . 2009a.

GIORGINO T, Tormene P . dtw: Dynamic Time Warping Algorithms. R package version


1.13-1, URL http://CRAN.R-project.org/package=dtw ; 2009b.

GOLDSTEIN, Louis; BYRD, Dani e SALTZMAN, Elliott The role of vocal tract gestural
action units in understanding the evolution of phonology. In From Action to
Language: The Mirror Neuron System, M. Arbib (ed.), 215–249. Cambridge:
Cambridge University Press. 2006

GRABE, Esther; GUSSENHOVEN, Carlos; HAAN, Judith; MARSI, Erik; POST, Brechtje.
Preaccentual pitch and speaker attitude in Dutch. Language and Speech. 41/1,
63–85. 1998

GUSSENHOVEN, Carlos. On the grammar and semantics of sentence accents.


Dordrecht: Foris. 1984

HOWELL, P., Prediction of p-center location from the distribution of energy in the
amplitude envelope I & II, Perception and Psychophysics, 43: 90-93, 99, 1988.

ITAKURA F . Minimum Prediction Residual Principle Applied to Speech Recognition.


IEEE Transactions on Acoustics, Speech, and Signal Processing, 23(1), 67–72;
1975.

JANKER, P. M., Evidence for the P-Center Syllable-Nucleus-Onset Correspondence


Hypothesis, ZAS Papers in Linguistics, 7: 94-124, 1996.

JOLIVEAU, E. SMITH, J. e WOLFE, J. Vocal Tract Resonances in Singing: The


Soprano Voice, Journal of. Acoustic Society of America. 116, 2434-2439; 2004.

113
JONES, M. R., e PFORDRESHER, P. Q. Tracking melodic events using Joint Accent
Structure, Can. J. Exp. Psychol. 51, 271–291; 1997.

JUNGERS, Melissa K., PALMER, Caroline & SPEER, Shari R. Time after time: The
coordinating influence of tempo in music and speech; Cognitive Processing, 1-2
21-35; International Quarterly of Cognitive Science; Ohio State University; Ohio;
USA; 2002.

KALMUS, H., e FRY, D. B. On tune deafness (dysmelodia): frequency, development,


genetics and musical background, Ann. Hum. Genet. 43, 369–382; 1980.

KAY, B.A., KELSO, J.A.S., SALTZMAN, E.L., e SCHÖNER, G. Space-time behavior of


single and bimanual rhythmical movements: Data and limit cycle model. J. Exp.
Psychol.: Hum. Percept. & Perform., 13, 178-192; 1987.

KAYES, Gillyanne Belting, Range and Register: A Practical Introduction for Singers;
In PEVoC 5 Workshop; Graz, August 2003. última visita: 24.07.2011; url:
http://www.vocalprocess.co.uk/resources/belting-range-and-register.pdf
KEARNEY, Gavin; MASTERSON, Claire; ADAMS, Stephen; BOLAND, Frank; Dynamic
Time Warping for Acoustic Response Interpolation: possibilities and
limitations. in 17th European Signal Processing Conference (EUSIPCO 2009), pp
705-709, Glasgow, Scotland, 2009.
KEATING, Patricia. The window model of coarticulation: articulatory evidence, in John
KINGSTON e Mary BECKMAN (eds.), Papers in Laboratory Phonology I:
Between the Grammar and Physics of Speech, 451-470.1990

KOLINSKY, Régine LIDJI, Pascale PERETZ, Isabelle BESSON, Mireille MORAIS, José
Processing interactions between phonology and melody: Vowels sing but
consonants speak; Cognition 112: 1–20; 2009.

LABOV, William. Sociolinguistics patterns. Pennsylvania: University of Pennsylvania


Press, 1972.

LADD, Dwight Robert. Intonational phonology. Cambridge: Cambridge University Press;


1996.

LAMPERTI, F. Guida teorico-pratica-elementare per lo studio del canto. Milan: Ricordi,


1864

114
LARGE, E.W. and KOLEN, J.F. Resonance and the perception of musical meter.
Connection Science, 6, 177-208; 1994.

LAVER. J. The phonetic description of voice quality. Cambridge University Press,


Cambridge, 1994.

LEHISTE, I. and ROSS, J. Spoken and Sung Styles in Estonian Prosody; ICPhS 1999,
1499-1500; San Francisco; 1999.

LEHISTE, I. Timing of utterances and linguistic boundaries. Journal of the Acoustical


Society of America, 51, 2018-2024; 1972.

LEHISTE, Ilse Suprasegmentals; The MIT Press, Cambridge; 1970. 2nd Edition 1977.

LEHISTE, Ilse Prosody in Speech and Singing; Proceedings of Speech Prosody 2004,
Nara, Japan; 2004.

LEINO T, KARKKAINEN P. On the effects of vocal training on the speaking voice


quality of male student actors. In: ELENIUS K, BRANDERUD P, eds. Proceedings
of the XIIIth International Congress of Phonetic Sciences, Stockholm, Sweden
13–19 August, 1995, Vol. 3 of 4. Stockholm, Sweden: Department of Speech
Communication and Music Acoustics, Royal Institute of Technology; Department of
Linguistics, Stockholm University; pp. 496–499; 1995
LEINO T, LAUKKANEN A-M, RADOLF V. Formation of the Actor’s/Speaker’s Formant:
A Study Applying Spectrum Analysis and Computer Modeling. Journal of Voice,
2009.
LEITNER, Christina; SCHICKBICHLER, Martin; e PETRIK, Stefan. Example-based
Automatic Phonetic Transcription, Graz University of Technology, Austria, 2010.
LÉON, Pierre Précis de phonostylistique, Paris, Nathan Université, 1991.

LERDAHL, F. The Sounds of Poetry Viewed as Music. In I. Peretz & R. Zatorre, eds.,
The Cognitive Neuroscience of Music. New York: Oxford University Press; 2003.

LERDAHL, F. Tonal pitch space. New York: Oxford University Press; 2001.

LESSAC, A. The Use and Training of the Human Voice, Drama Book, New York, 2ª ed;
1967.
LINDBLOM, B. E. e SUNDBERG, J. E., Acoustical consequences of lip, tongue, jaw,
and larynx movement, Journal of the Acoustic Society of America, 50(4): 1166-1179,
1971.

115
LINDBLOM, B. Spectrographic study of vowel reduction. Journal of the Acoustical
Society of America 35 1773-1781; 1963.
LINDBLOM, B., e SUNDBERG, J. Observations on tongue contour length in spoken
and sung vowels. STL-QPSR, 13(4), 001-005; 1972.
LINDBLOM, B., e SUNDBERG, J. The human voice in speech and singing. Springer
Verlag; 2005.
LINDBLOM, B., SUNDBERG, J., BRANDERUD, P., e DJAMSHIDPEY, H. On the
acoustics of spread lips. Proceedings of Fonetik, TMH-QPSR, 50(1), 13-16; 2007.
LIST, G. The boundaries of speech and song. Etnomusicology 7(1): 1-16; 1963.

MANCINI, Giambattista; Practical Reflections on Figured Singing, edições de 1774 e


1777 comparadas, traduzidas e editadas por Edward Foreman, Masterworks on
Singing, Vol. VII, Pro Musica Press, Champaign, IL; 1967.
MARCUS, S. M., Acoustic determinants of Perceptual center (p-center) location,
Perception and Psychophysics, 30 (3): 247-256, 1981.

MARCUS, S. M., Perceptual-centres. PhD Thesis, Cambridge University, 1976.

MASTER S, DE BIASE N, CHIARI BM, LAUKKANEN AM. Análise acústica e


perceptivoauditiva da voz de atores e não atores masculinos: long term average
spectrum e o "formante do ator". In Anais do XIV Congresso Brasileiro de
Fonoaudiologia. Sociedade Brasileira de Fonoaudiologia – Suplemento Especial;
Salvador, Bahia; 2006.
MASTER, S., DE BIASE, N.G., MADUREIRA, S. What about the "actor's formant" in
actresses' voices? Journal of Voice. Mar (2); 2011.
MASTER, S., DE BIASE. N., CHIARI, B.M., LAUKKANEN, A.M. Acoustic and perceptual
analyses of Brazilian male actors' and nonactors' voices: long-term average
spectrum and the "actor's formant". Journal of Voice. Mar;22(2):146-54; 2008.
MATTOSO CÂMARA Jr, J. Contribuição à Estilística Portuguesa. Rio de Janeiro; Ao
Livro Técnico; 1977.

MATTOSO CÂMARA Jr, J. Contribuição à Estilística Portuguesa. Rio de Janeiro; Ao


Livro Técnico; 1977.

MATTOSO CÂMARA Jr, J. Estrutura da Língua Portuguesa. São Paulo; Vozes; 1970,
reeditada em 2001.

MATTOSO CÂMARA Jr, J. Estrutura da Língua Portuguesa. São Paulo; Vozes; 2001.

116
MEDEIROS, Beatriz R. Descrição comparativa de aspectos fonetico-acusticos
selecionados da fala e do canto em portugues brasileiro; Tese de Doutorado;
Instituto de Estudos da Linguagem. Universidade Estadual de Campinas.Campinas,
SP; 2002.
MENDES, A. P., ROTHMAN, H. B., SAPIENZA, C., e BROWN, W. S., Jr. Effects of vocal
training on the acoustic parameters of the singing voice, Journal of Voice 17(4),
529–543; 2003.

MEYER D, BUCHTA C. proxy: Distance and Similarity Measures. R package version


0.4-3, URL: http://CRAN.R-project.org/package=proxy. ;2009.

MILLER, D.G. e SCHUTTE, H.K. Formant tuning in a professional baritone, Journal of


Voice 4:3, pp. 231-237; 1990.
MILLER, Richard English, French, German and Italian Techniques of Singing: a study
in national tonal preferences and how they related to functional efficiency; The
Scarecrow Press, Inc.; 1977.
MORI A, UCHIDA S, KURAZUME R, TANIGUCHI R, HASEGAWA T, SAKOE H . Early
Recognition and Prediction of Gestures. In B Werner (ed.), Proceedings of the
18th International Conference on Pattern Recognition – ICPR 2006, volume 3,
pp. 560–563. IEEE Computer Society, Los Alamitos, CA, USA.
doi:10.1109/ICPR.2006.467; 2006.

MURAYAMA, J., KASHIWAGI, T., KASHIWAGI, A., e MIMURA, M. Impaired pitch


production and preserved rhythm production in a right braindamaged patient
with amusia, Brain Cogn 56, 36–42, 2004.

MURBE, D, PABST, F., HOFMANN, G., e SUNDBERG, J. Significance of auditory and


kinesthetic feedback to singers’ pitch control, Journal of Voice 16, 44–51; 2002.

MURRY, T. Pitch-matching accuracy in singers and nonsingers, Journal of Voice 4,


317–321; 1990.

MURRY, T., e ZWINER, P. Pitch matching ability of experienced and inexperienced


singers, Journal of Voice 5, 197–202; 1991.

MYERS C, RABINER L, ROSENBERG A . Performance Tradeoffs in Dynamic Time


Warping Algorithms for Isolated Word Recognition. IEEE Transactions on
Acoustics, Speech, and Signal Processing, 28(6), 623–635; 1980.

117
NESPOR, M e VOGEL, I. Prosodic Phonology; Dordrecht, Netherlands; Foris
Publications; 1986.

NESPOR, Marina e VOGEL, Irene. On clashes and lapses. Phonology 6, 69-116; 1989.

OHNO, Sumio e FUJISAKI, Hiroya Quantitative Analysis of the Effects of Emphasis


Upon Prosodic Features of Speech, in Eurospeech Proceedings 2001;
Scandinavia; 2001.

OLIVEIRA, Leonardo e ARANTES, Pablo An algorithm for token-by-token linear


predictive coding analysis of oral monophthongs. Journal of Acoustic Society of
America, vol 125 (4) 2529, URL: http://www.biomedsearch.com/nih/algorithm-token-
by-linear-predictive/19354686.html : 2009.

PABST, F. e SUNDBERG, J., Tracking multi-channel electroglottograph measurement


of larynx height in singers, STL-QPSR, 33(2-3): 67-78, 1992.
PABST, F., e SUNDBERG, J. Tracking multi-channel electroglottograph measurement
of larynx height in singers. Scandinavian Journal of. Logopedic Phoniatry; 1993.
PALMER, Caroline & HUTCHINS, Sean What is Musical Prosody? In ROSS, Bryan H.
The Psychology of Learning and Motivation: advances in research and theory.
Vol. 46: 245-278; Beckman Institute and Department of Psychology; University of
Illinois at Urbana-Champaign; Elsevier Inc; 2006.

PERRIER, P. About speech motor control complexity. In J. HARRINGTON & M.


TABAIN (eds), Speech Production: Models, Phonetic Processes, and
Techniques. Psychology Press: Sydney, Australia ; 2005.
PERRIER, P., PAYAN, Y., ZANDIPOUR, M., e PERKELL, J. Influences of tongue
biomechanics on speech movements during the production of velar stop
consonants: A modeling study. Journal of the Acoustical Society of America, 114,
1582-1599; 2003.
PESSOTTI, Antônio C. S. A influência da técnica vocal sobre a emissão cantada no
vernáculo; Estudos Lingüísticos XXXV, 53º GEL, São Carlos; 2005.

PESSOTTI, Antônio C. S. O estilo na interpretação cantada e falada de uma canção


de camara brasileira : dados de cinco cantoras liricas brasileiras. Dissertação
de Mestrado; UNICAMP Orientador: Eleonora Cavalcante Albano; Campinas, SP,
2007; 277p.

118
PETRY, Adriano; Reconhecimento automático de locutor utilizando medidas de
invariantes dinãmicas não-lineares; Tese de Doutorado, PPGC; UFRGS; 150 pp.;
Porto Alegre, 2002.
PINCZOWER, Rachel; OATES, Jennifer Vocal projection in actors: the long-term
average spectral features that distinguish comfortable acting voice from voicing
with maximal projection in male actors. Journal of Voice; September 1, 2005
R Development Core Team. R: A Language and Environment for Statistical
Computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-
900051-07-0, URL http://www.R-project.org/ ; 2009.

RAPHAEL, B.N. e SCHERER, R.C. Voice modifications of stage actors: acoustic


analyses, Journal of Voice 1:1,pp. 83-87; 1987.
RAPOSO DE MEDEIROS, Beatriz. Descrição comparativa de aspectos fonetico-
acusticos selecionados da fala e do canto em portugues brasileiro / Campinas,
SP; Universidade Estadual de Campinas. Instituto de Estudos da Linguagem; 2002.

ROSS, J. and LEHISTE, I. The Temporal Structure of the Estonian Folk Songs.
Mouton de Gruyter: Berlin and New York; 2001.

ROSS, Jaan Same Words Performed Spoken and Sung: An Acoustic Comparison;
Proceedings of the 5th Triennial ESCOM Conference; Hanover University of Music
and Drama, Germany; 2003.

ROSSING, T., SUNDBERG, J., e TERNSTRÖM, S Acoustic comparison of soprano


solo and choir singing. STL-QPSR, 26(4), 043-058; 1985.
SALTZMAN, E., e BYRD, D. Dynamical simulations of a phase window model of
relative timing. In J.J. Ohala, Y. Hasegawa, M. Ohala, D. Granville, e A.C. Bailey,
(Eds.). Proceedings of the XIVth International Congress of Phonetic Sciences (pp.
2275-2278). New York: American Institute of Physics; 1999.

SANCIER, M.L.; FOWLER, C. A. Gestural drift in a bilingual speaker of Brazilian


Portuguese and English, Journal of Phonetics, 25: 421-436, 1997.
SANCIER, Michele L. e FOWLER, Carol A. Gestural drift in a bilingual speaker of
Brazilian Portuguese and English; Journal of Phonetics, 25, 421 - 436; 1997

SANGUINETI, V., LABOISSIERE, R., PAYAN, Y. A control model of human tongue


movements in speech. Biological Cybernetics;77:11–22; 1997.

119
SAPIR S, RAMIG LO, SPIELMAN JL, FOX C. Formant centralization ratio: a proposal
for a new acoustic measure of dysarthric speech. Journal of Speech Lang Hear
Feb;53(1):114-25. Epub 2009 Nov 30, doi:10.1044/1092-4388(2009/08-0184); 2010.

SCOTTO DI CARLO, N. Contraintes phonatoires et contraintes articulatoires dans le


chant. Actes des IX° Journées de Pathologie Vocale et de Pratique Orthophonique de
Nice. GEROP, pp. 1-27, 1995.
SCOTTO DI CARLO, N. Diction et musicalité. Médecine des Arts, vol. 5, pp 4-11.1993.
SCOTTO DI CARLO, N. Etude acoustique et auditive des principaux facteurs
d'intelligibilité de la voix chantée. Actes du VII° Congrès International des Sciences
Phonétiques. Mouton, La Haye, pp. 1017-1023; 1972.
SCOTTO DI CARLO, N. Etude acoustique et statistique de l'influence des consonnes
sur l'attaque des voyelles subséquentes en voix chantée. Communication au II°
Symposium International de Recherches sur le Chant. T.I.P.A., vol. 4, pp. 237-260;
1977.
SCOTTO DI CARLO, N. Influence de l'articulation sur la musicalité de la phrase
chantée. Communication au VIII° Congrès International des Sciences Phonétiques.
T.I.P.A., vol. 3, pp. 117-146; 1976.
SCOTTO DI CARLO, N. L'influence de la fréquence sur l'intelligibilité des voyelles
chantées. Phonetica, vol. 42, 4, pp. 188-197, 1985.
SCOTTO DI CARLO, N. Les Divas et le Diapason. Médecine des Arts, 21, pp. 10-13,
1977.
SCOTTO DI CARLO, N. Les mimiques expressives dans le chant.(Facial Expressions
in Singing).Semiotica, 2004, 149, 1/4, pp. 37-55, 2004.
SCOTTO DI CARLO, N. Réflexes conditionnés et apprentissage du chant. La Lettre
du Musicien, 318, pp. 52-53, 2005b.
SCOTTO DI CARLO, N. Structure temporelle de la syllabe parlée et chantée.
Médecine des Arts, 52, pp. 2-11, 2005a.
SCOTTO DI CARLO, Nicole, AUTESSERRE, D. Parole, chant et musique dans l'art
lyrique, Travaux de l'Institut de Phonétique d'Aix, 1989-1990, 13 : 131-154; 1990.

SCOTTO DI CARLO, Nicole, GERMAIN, A. A perceptual study of the influence of pitch


on the intelligibility of sung vowels, Phonetica, 42, 4: 188-197; 1985.

SELKIRK, E.O. Phonology and syntax: The relation between sound and structure.
Cambridge, MA: MIT Press; 1984.

120
SLEVC, L. Robert e MIYAKE, Akira, Individual Differences in Second-Language
Proficiency: Does Musical Ability Matter?; Psychological Science, Vol. 17 —
Number 8; 2006.

SLOBODA, J. A., WISE, K. J., e PERETZ, I. Quantifying tone deafness in the general
population, Ann. N.Y. Acad. Sci. 1060, 255–261; 2005.

SMITH, C. L. The timing of vowel and consonant gestures in Italian and Japanese.
In Actes du XIIème Congrès International des Sciences Phonétiques, Aix-en-
Provence, France, vol. 4, pp. 234-237; 1991.

SMITH, Leigh M. A Multiresolution Time-Frequency Analysis and Interpretation of


Musical Rhythm PhD Thesis; Department of Computer Science; University of
Western Australia; 1999.

SNODGRASS, Richard T. Developing Time-Oriented Database Applications in SQL,


Morgan Kaufmann Publishers, USA, 2000.

STEELS, Luc The synthetic modeling of language origins; Evolution of Communication


Journal, 1 (1), John Benjamins, Amsterdam; 1997

STEWART, L., von KRIEGSTEIN, K., WARREN, J. D., e GRIFFITHS, T. D. Music and
the brain: disorders of music listening, Brain 129(10), 2533– 2553; 2006.

SUNDBERG J, JOHANSSON C, WILBRAND H & YTTERBERGH C From sagittal


distance to area. A study of transverse, vocal tract cross-sectional area.
Phonetica, 44: 76-90; 1987.

SUNDBERG J., LINDBLOM, B. e LILJENCRANTS, J. Formant frequency estimates for


abruptly changing area functions: A comparison between calculations and
measurements, Journal of Acoustic Society of America, 91(6):3478-3482; 1992.
SUNDBERG, J. The perception of singing, in The Psychology of Music, editado por D.
Deutsch Academic, San Diego, pp. 171–214; 1999a.

SUNDBERG, J. The Science of the Singing Voice. Northern Illinois U. P., DeKalb, IL;
1987.

SUNDBERG, J. An articulatory interpretation of the 'singing formant'. STL-QPSR,


13(1), 045-053; 1972.

121
SUNDBERG, J. Formants and fundamental frequency control in singing. An
experimental study of coupling between vocal tract and voice source. STL-
QPSR, 20(1), 065-078; 1979.
SUNDBERG, J. Level and center frequency of the singer's formant. TMH-QPSR, 40(3-
4), 087-094; 1999b.
SUNDBERG, J. Music performance. In MOSART project workshop. Padova; 2001.

SUNDBERG, J. Observations on a professional soprano singer. STL-QPSR, 14(1),


014-024; 1973.
SUNDBERG, J. The acoustics of singing voice, Scientific American; Março, pp. 104-
116; 1977.
SUNDBERG, J., e ASKENFELT,T Larynx height and voice source. A relationship?.
STL-QPSR, 22(2-3), 023-036; 1981.
SUNDBERG, J., e NORDSTRÖM, P-.Raised and lowered larynx - the effect on vowel
formant frequencies. STL-QPSR, 17(2-3), 035-039; 1976.
SUNDBERG, J., FAHLSTEDT, E., e MORELL, A. Effects on the glottal voice source of
vocal loudness variation in untrained female and male voices. The Journal of the
Acoustical Society of America, 117 (2), 879–885; 2005.
TATIT, Luis. Semiótica da canção: melodia e letra. São Paulo: Escuta, 1994
TATIT, Luiz. O cancionista: composição de canções no Brasil. Rio de Janeiro: Edusp,
1996.

TERNSTRÖM, S., SUNDBERG, J., e COLLDEN, A. Articulatory F0 perturbations and


auditory feedback, J. Speech Hear. Res. 31, 187–192; 1988.

TOSI, Pier Francesco; Opinioni de’ cantori antichi e moderni, o sieno osservazioni sopra il canto
figurato; (Bologna, 1723), facsimile reimpresso por Broude Brothers, New York, 1968.
TRAUNMÜLLER, H. Modulation and demodulation in production, perception, and
imitation of speech and bodily gestures, in FONETIK 98, Dept. of Linguistics,
Stockholm University, pp. 40 – 43; 1998.

TRAUNMÜLLER, H. Analytical expressions for the tonotopical sensory scale, JASA,


SUPPL 1, VOL. 88, PP 97-100; 1990.

WILLIAMS, Brian, Biostatistics; Chapman & Hall; London, UK, 1994.

WOLFE, J. e SMITH, J. Acoustical coupling between lip valves and vocal folds,

122
Acoustics Australia, 36, 23-27; 2008.
WOODS, Anthony; FLETCHER, Paul, e HUGUES, Arthur, Statistics in Language
Studies. Cambridge University Press; Cambridge, UK, 1989.

123
124
9 Anexo I – Tabelas

125
126
conselhos
Valor-p
variáveis Pearson(X2) GL (X2) Fisher_exact V-Cramer
(p-value)
Tonicidade + pos_SF 34,574 2 0,000 0,000 0,421
Tonicidade + pos_SE 20,459 2 0,000 0,000 0,324
Tonicidade + pausa 32,432 1 0,000 0,000 0,408
Tonicidade + proemTom 7,676 1 0,006 0,008 0,198
Tonicidade + proemDur 36,244 1 0,000 0,000 0,431
Tonicidade + Tempo 90,005 1 0,000 0,000 0,679
pos_SF + pos_SE 218,180 4 0,000 0,000 0,748
pos_SF + pausa 166,150 2 0,000 0,000 0,923
pos_SF + proemTom 1,989 2 0,370 0,353 0,101
pos_SF + proemDur 60,994 2 0,000 0,000 0,559
pos_SF + Tempo 25,371 2 0,000 0,000 0,361
pos_SE + pausa 115,567 2 0,000 0,000 0,770
pos_SE + proemTom 0,638 2 0,727 0,739 0,057
pos_SE + proemDur 45,518 2 0,000 0,000 0,483
pos_SE + Tempo 16,317 2 0,000 0,000 0,289
pausa + proemTom 0,582 1 0,446 0,416 0,055
pausa + proemDur 73,058 1 0,000 0,000 0,612
pausa + Tempo 23,334 1 0,000 0,000 0,346
proemTom + proemDur 20,168 1 0,000 0,000 0,322
proemTom + Tempo 4,886 1 0,027 0,037 0,158
proemDur + Tempo 33,904 1 0,000 0,000 0,417

Tabela 9.1: Análises não paramétricas de Conselhos (Carlos Gomes): Pearson (x2),
Fisher exato e V-Cramer.

127
Freeman
Tukey -
desvios
Variáveis-Influencia
Tônica versus Sintagma Fonológico à Direita (SFD) 3,3214
Tônica versus Sintagma Entoacional à Direita(SED) 2,5653
Tônica versus Ocorrência de Pausa (presente) 3,2461
Tônica versus Proeminência de Tom (pico) 1,7320
Tônica versus Proeminência de Duração (sim) 3,4146
Tônica versus Tempo (forte) 4,5167
SFD/SED pareado com SFE/SEE 4,7268
SFD versus Ocorrência de Pausa (presente) 5,8179
SFE versus Proeminência de Tom (pico) 0,9570
SFD versus Proeminência de Duração (sim) 4,2888
SFD versus Tempo (forte) 2,8571
SED versus Ocorrência de Pausa (presente) 4,7782
SEE versus Proeminência de Tom (pico) 0,7053
SED versus Proeminência de Duração (sim) 3,6933
SED versus Tempo (forte) 2,0964
Ocorrência de Pausa (presente) versus Proeminência de Tom (pico) 0,6767
Ocorrência de Pausa (presente) versus Proeminência de Duração (sim) 4,6120
Ocorrência de Pausa (presente) versus Tempo (forte) 2,7827
Proeminência de Tom (pico) versus Proeminência de Duração (sim) 2,8812
Proeminência de Tom (pico) versus Tempo (forte) 1,3788
Proeminência de Duração (sim) versus Tempo (forte) 3,2500

Tabela 9.2: Análises não paramétricas de Conselhos (Carlos Gomes): desvios de


Freeman-Tukey.

128
grupo média desvpad assimetria curtose média desvpad assimetria curtose nT
fala
loc -10,8670 4,3545 0,0831 -0,3465 0,2200 0,1057 0,8179 -0,1270 948
loc -14,0660 3,9731 0,3997 -1,0323 0,2299 0,1073 0,8634 0,4583 949
loc -13,7380 3,0257 0,4641 0,4237 0,2235 0,1216 1,0950 0,2612 949
loc -13,1654 4,2324 0,0058 -0,0923 0,2037 0,0991 0,9740 0,3631 953
loc -14,4209 4,2825 0,5256 -0,1676 0,2039 0,1009 0,9927 0,2736 937

cor -10,2859 5,1853 0,4641 0,3033 0,2514 0,1442 1,5042 2,8050 947
cor -9,2809 2,7805 -0,6347 3,1277 0,2061 0,1175 1,4605 1,7369 947
cor -10,4700 3,4741 0,3098 0,0290 0,1990 0,0906 1,1694 1,3950 958
cor -12,9358 3,3899 0,2125 1,7864 0,1819 0,0973 1,8258 3,5654 945
cor -8,2729 2,6088 -0,5113 0,3183 0,1994 0,0979 1,3689 1,9113 945

sol -9,3336 4,5968 -0,1141 -0,3320 0,2162 0,1139 1,2187 0,8336 949
sol -9,8003 4,9839 0,6310 0,1051 0,2346 0,1399 1,1535 0,6079 951
sol -8,5305 4,6806 -0,0065 0,6585 0,2081 0,1108 1,1232 0,5167 945
sol -11,4566 2,5141 0,0319 -0,2609 0,1909 0,0985 1,4564 1,7844 945
sol -11,2289 5,5604 0,3403 -0,0615 0,2410 0,1162 1,1430 0,9910 945
canto sem acompanhamento
cor -0,4773 3,8643 -0,0367 -0,2466 0,4423 0,3815 3,6791 20,0205 950
cor 0,4099 3,8625 0,0215 -0,4887 0,4113 0,3579 3,0131 12,7421 950
cor 0,7558 3,7628 0,0927 -0,5358 0,4281 0,3800 3,0539 12,9659 955
cor -1,0151 3,9806 0,0431 -0,6164 0,4331 0,3981 3,0870 14,3458 950
cor 0,3124 3,6933 0,1371 -0,4378 0,3822 0,3332 3,3298 16,1311 955

sol 0,3531 3,9083 0,0186 -0,5161 0,4211 0,4166 3,5456 17,5796 950
sol -0,0653 3,8713 0,0005 -0,4691 0,4519 0,4348 3,7656 20,4503 950
sol 0,0026 3,9156 0,0163 -0,4909 0,3624 0,3424 3,7667 20,0706 950
sol 0,8400 3,7358 0,1851 -0,4222 0,3502 0,3339 3,9842 23,1059 950
sol -0,0502 3,9938 0,0809 -0,5882 0,5059 0,4376 2,8871 11,4614 950
canto com acompanhamento
cor 0,0514 3,7760 0,0414 -0,6984 0,3844 0,3485 2,9973 11,9362 953
cor 0,3653 3,8795 0,0944 -0,6056 0,3834 0,3221 2,7840 10,4115 950
cor 0,2776 3,7773 0,0999 -0,5212 0,3841 0,3516 3,3692 16,0636 953
cor 0,0407 3,9425 0,0124 -0,6445 0,3878 0,3283 2,5127 8,1006 949
cor 0,1029 3,7677 0,0646 -0,6922 0,3735 0,3369 3,7240 19,8421 954

sol 0,2238 3,9306 0,0120 -0,5258 0,3883 0,3506 2,7202 9,6915 950
sol 0,0217 3,8685 0,0427 -0,4843 0,3784 0,3231 2,4621 7,7133 950
sol -0,0945 3,9407 0,0162 -0,6140 0,3861 0,3529 2,8307 10,6223 950
sol 0,1193 3,8161 0,1478 -0,4551 0,3845 0,3305 2,6699 9,3452 950
sol -0,2883 4,4048 -0,3415 0,6287 0,3959 0,3540 2,8176 10,6164 950
Tabela 9.3: Estatística Descritiva dos dados de fala e canto; loc – locutoras, cor – coralistas, sol
– solistas, desvpad – desvio-padrão.

129
F1
GL F valor p sign.
grupo 2 8,2451 0,0003 S
grupo:vogal 12 100,2512 0,0000 S
grupo:vogal: i 1 25,7964 0,0000 S
grupo:vogal: e 1 15,8604 0,0001 S
grupo:vogal: a 1 25,7876 0,0000 S
grupo:vogal: o 1 212,2947 0,0000 S
grupo:vogal: u 1 116,0646 0,0000 S
F2
grupo 2 0,3785 0,6851 N
grupo:vogal 12 161,2003 0,0000 S
grupo:vogal: i 1 232,8288 0,0000 S
grupo:vogal: e 1 250,2927 0,0000 S
grupo:vogal: a 1 306,1171 0,0000 S
grupo:vogal: o 1 174,5678 0,0000 S
grupo:vogal: u 1 287,9974 0,0000 S
F3
grupo 2 11,6119 0,0000 S
grupo:vogal 12 29,6413 0,0000 S
grupo:vogal: i 1 15,9711 0,0001 S
grupo:vogal: e 1 4,0629 0,0445 S
grupo:vogal: a 1 9,6048 0,0021 S
grupo:vogal: o 1 94,0135 0,0000 S
grupo:vogal: u 1 56,8066 0,0000 S
Tabela 9.4: ANOVA entre formantes e vogais por modalidade.

130
cor sol
F1-Bark F1-Bark
p significância p significância
canto-S-canto-C 0,975 N canto-S-canto-C 0,918 N
fala-canto-C 0,000 S fala-canto-C 0,000 S
fala-canto-S 0,000 S fala-canto-S 0,000 S
[i]
F2-Bark F2-Bark
canto-S-canto-C 0,653 N canto-S-canto-C 0,584 N
fala-canto-C 0,171 N fala-canto-C 0,001 S
fala-canto-S 0,622 N fala-canto-S 0,016 S

F1-Bark F1-Bark
canto-S-canto-C 0,914 N canto-S-canto-C 0,721 N
fala-canto-C 0,000 S fala-canto-C 0,000 S
fala-canto-S 0,000 S fala-canto-S 0,000 S
[e]
F2-Bark F2-Bark
canto-S-canto-C 0,394 N canto-S-canto-C 0,758 N
fala-canto-C 0,003 S fala-canto-C 0,181 N
fala-canto-S 0,000 S fala-canto-S 0,038 S

F1-Bark F1-Bark
canto-S-canto-C 0,293 N canto-S-canto-C 0,010 S
fala-canto-C 0,151 N fala-canto-C 0,864 N
fala-canto-S 0,003 S fala-canto-S 0,002 S
[a]
F2-Bark F2-Bark
canto-S-canto-C 0,987 N canto-S-canto-C 0,997 N
fala-canto-C 0,001 S fala-canto-C 0,000 S
fala-canto-S 0,001 S fala-canto-S 0,000 S

F1-Bark F1-Bark
canto-S-canto-C 1,000 N canto-S-canto-C 0,967 N
fala-canto-C 0,458 N fala-canto-C 0,001 S
fala-canto-S 0,451 N fala-canto-S 0,002 S
[o]
F2-Bark F2-Bark
canto-S-canto-C 0,971 N canto-S-canto-C 0,522 N
fala-canto-C 0,002 S fala-canto-C 0,000 S
fala-canto-S 0,004 S fala-canto-S 0,000 S

F1-Bark F1-Bark
canto-S-canto-C 0,547 N canto-S-canto-C 0,996 N
fala-canto-C 0,000 S fala-canto-C 0,958 N
fala-canto-S 0,004 S fala-canto-S 0,979 N
[u]
F2-Bark F2-Bark
canto-S-canto-C 0,824 N canto-S-canto-C 0,997 N
fala-canto-C 0,873 N fala-canto-C 0,423 N
fala-canto-S 0,522 N fala-canto-S 0,384 N
Tabela 9.5: Comparações entre modalidades e cantoras (TukeyHSD)

131
132
10 Anexo II – Partitura

133
134
135
Partitura: na codificação Lilypond:
%=============================================
% created by MuseScore Version: 0.9.5
% reviewd in MuseScore Version: 0.9.6
% Monday, January 18, 2011
%=============================================

\version "2.12.0"

#(set-default-paper-size "a4")

\paper {
line-width = 190\mm
left-margin = 10\mm
top-margin = 10\mm
bottom-margin = 20\mm
%%indent = 0 \mm
%%set to ##t if your score is less than one page:
ragged-last-bottom = ##t
ragged-bottom = ##f
%% in orchestral scores you probably want the two bold slashes
%% separating the systems: so uncomment the following line:
%% system-separator-markup = \slashSeparator
}

\header {
}

AvoiceAA = \relative c'{


\set Staff.instrumentName = #""
\set Staff.shortInstrumentName = #""
\clef treble
%staffkeysig
\key as \major
%bartimesig:

136
\time 2/4
r8 r4 ees8 |%1
ees16 f g aes ees8 r |%2
c' aes16 f ees f g f |%3
ees f g aes bes8 ees |%4
ees4~ ees8 c16 d |%5
ees8 d16 c d a b g |%6
c4 c8 bes16 aes |%7
g8~ g16 g g f ees g |%8
g4 ees'~ |%9
ees~ ees16 r ees,8 | % 10
ees f g aes | % 11
c4~ c8 ees, | % 12
ees f g aes | % 13
des4~ des8~ des16 r | % 14
f4~ f8 ees | % 15
f ees c aes | % 16
g bes aes16 g aes f | % 17
ees4~ ees8 aes16 bes | % 18
cbcbcbcb | % 19
c4~ c16 g aes bes | % 20
c b c b c g aes bes | % 21
aes4 r8 ees' | % 22
f ees c aes | % 23
des4~ des8~ des16 r | % 24
f,4 c'8~ c16 bes | % 25
aes4 r | % 26
R2 *3 | %
r8 r4 ees8 | % 30
ees16 f g aes ees8 r | % 31
c' aes16 f ees4 | % 32
ees16 f g aes bes8 ees | % 33
ees4~ ees8 c16 d | % 34
ees8 d16 c d a b g | % 35
c4 r16 c bes aes | % 36

137
g8 g g16 f ees g | % 37
g4 ees'~ | % 38
ees~ ees16 r ees,8 | % 39
ees f g aes | % 40
c4 c8 ees, | % 41
ees f g aes | % 42
des4~ des8~ des16 r | % 43
f4~ f8 ees | % 44
f ees c aes | % 45
g bes aes16 g aes f | % 46
ees4~ ees8 aes16 bes | % 47
cbcbcbcb | % 48
c4 r8 aes16 bes | % 49
c b c b c g aes bes | % 50
aes4~ aes8 ees' | % 51
f ees c aes | % 52
des4~ des8~ des16 r | % 53
f,4 c'8~ c16 bes | % 54
aes8 r aes' r \bar "|."
}% end of last bar in partorvoice

ApartAverseA = \lyricmode { \set stanza = " 1. " Me -- ni -- na ve -- nha cá, ve -- jao que faz se
por seu gos -- too ca -- sa -- men -- to quer a von -- ta -- deao ma -- ri -- dohá de fa -- zer quees -- te
de -- se -- joo ca -- sa -- men -- to tra -- az _ Seo ho -- mem ve -- lho for ou sea -- in -- da ra -- paz
_ To _ me, to -- me a li -- ção quee -- le qui -- ser -- lhe dar Se fun -- ções e con -- tra -- dan -- ças
não qui -- ser tam -- bem não quei -- ra queé me -- lhor pra não bri -- gar Me -- ni -- na, ve -- nha cá
_ ve -- ja o que faz! Pro -- cu -- re dea -- gra -- dar, sem con -- tra -- riar pron -- ta sem -- preao -- be
-- de -- cer Te -- nha de -- le cui -- da -- dos com a -- mor, en -- quan -- toao res -- to, dei -- xe lá cor
-- re er _ Sea -- in -- da mui -- to mo -- ço ou sea -- in -- da ra -- paz _ Na _ da, na -- da de ci -- u
-- mes, que se -- ri -- a pior! _ Oh me -- ni -- na, ve -- nha cá, ve -- jao que faz! A mu -- lher só faz o
ho -- mem bom e mau _ Queas -- sim co -- mo dá pão _ po de _ dar pau! Ai! }

\score {
<<
\context Staff = ApartA <<
\context Voice = AvoiceAA \AvoiceAA
>>

138
\context Lyrics = ApartAverseA\lyricsto AvoiceAA \ApartAverseA

\set Score.skipBars = ##t


%%\set Score.melismaBusyProperties = #'()
\override Score.BarNumber #'break-visibility = #end-of-line-invisible %%every bar is
numbered.!!!
%% remove previous line to get barnumbers only at beginning of system.
#(set-accidental-style 'modern-cautionary)
\set Score.markFormatter = #format-mark-box-letters %%boxed rehearsal-marks
\override Score.TimeSignature #'style = #'() %%makes timesigs always numerical
%% remove previous line to get cut-time/alla breve or common time
\set Score.pedalSustainStyle = #'mixed
%% make spanners comprise the note it end on, so that there is no doubt that this note is
included.
\override Score.TrillSpanner #'(bound-details right padding) = #-2
\override Score.TextSpanner #'(bound-details right padding) = #-1
%% Lilypond's normal textspanners are too weak:
\override Score.TextSpanner #'dash-period = #1
\override Score.TextSpanner #'dash-fraction = #0.5
%% lilypond chordname font, like mscore jazzfont, is both far too big and extremely ugly
(olagunde@start.no):
\override Score.ChordName #'font-family = #'roman
\override Score.ChordName #'font-size =#0
%% In my experience the normal thing in printed scores is maj7 and not the triangle. (olagunde
):
\set Score.majorSevenSymbol = \markup {maj7}
>>

%% Boosey and Hawkes, and Peters, have barlines spanning all staff-groups in a score,
%% Eulenburg and Philharmonia, like Lilypond, have no barlines between staffgroups.
%% If you want the Eulenburg/Lilypond style, comment out the following line:
\layout {\context {\Score \consists Span_bar_engraver}}
}%% end of score-block

#(set-global-staff-size 20)

139
140
141
142
11 Anexo III – Espaços Vocálicos

143
144
Figura 11.1: Espaços vocálicos nas posições acentuais de fala das coralistas (COR). Pretônicas

145
Figura 11.2: Espaços vocálicos nas posições acentuais de fala das coralistas (COR).Tônicas

146
Figura 11.3: Espaços vocálicos nas posições acentuais de fala das coralistas (COR). Postônicas

147
Figura 11.4: Espaços vocálicos nas posições acentuais de fala das solistas (SOL). Pretônicas

148
Figura 11.5: Espaços vocálicos nas posições acentuais de fala das solistas (SOL). Tônicas

149
Figura 11.6: Espaços vocálicos nas posições acentuais de fala das solistas (SOL). Postônicas

150
Figura 11.7: Espaços vocálicos nas posições acentuais de fala das locutoras (LOC). Pretônicas

151
Figura 11.8: Espaços vocálicos nas posições acentuais de fala das locutoras (LOC). Tônicas

152
Figura 11.9: Espaços vocálicos nas posições acentuais de fala das locutoras (LOC). Postônicas

153
Figura 11.10: Espaços vocálicos nas posições acentuais da produção cantada sem
acompanhamento das coralistas (COR) Pretônicas

154
Figura 11.11: Espaços vocálicos nas posições acentuais da produção cantada sem
acompanhamento das coralistas (COR) Tônicas

155
Figura 11.12: Espaços vocálicos nas posições acentuais da produção cantada sem
acompanhamento das coralistas (COR) Postônicas

156
Figura 11.13: Espaços vocálicos nas posições acentuais da produção cantada sem
acompanhamento das solistas (SOL) Pretônicas

157
Figura 11.14: Espaços vocálicos nas posições acentuais da produção cantada sem
acompanhamento das solistas (SOL) Tônicas

158
Figura 11.15: Espaços vocálicos nas posições acentuais da produção cantada sem
acompanhamento das solistas (SOL) Postônicas

159
Figura 11.16: Espaços vocálicos nas posições acentuais da produção cantada com
acompanhamento das coralistas (COR).Pretônicas

160
Figura 11.17: Espaços vocálicos nas posições acentuais da produção cantada com
acompanhamento das coralistas (COR).Tônicas

161
Figura 11.18: Espaços vocálicos nas posições acentuais da produção cantada com
acompanhamento das coralistas (COR). Postônicas

162
Figura 11.19: Espaços vocálicos nas posições acentuais da produção cantada com
acompanhamento das solistas (SOL). Pretônicas

163
Figura 11.20: Espaços vocálicos nas posições acentuais da produção cantada com
acompanhamento das solistas (SOL). Tônicas

164
Figura 11.21: Espaços vocálicos nas posições acentuais da produção cantada com
acompanhamento das solistas (SOL). Postônicas

165

Você também pode gostar