Você está na página 1de 17
cApiTULo f 1 Introducdo Aprendendo a prosédia de uma lingua se entra mais intimamente no espirito da nagao que a fala mais do que por qualquer outro tipo de estudo que possa haver, [Madame de Staél, “Sobre a Alemanha’] Que mistério 6 esse, evocado pela romancista suiga, que associa a prosédia ao espirito de uma nacdo, a intimidade com uma lingua? Faz-nos pensar ser a prosédia um modo intrinseco de expressiio ou do “modo” de falar de uma comunidade. De fato, essa interpretacao nao esta distante da acep¢ao da palavra “prosédia” na fonética. De origem grega, 0 termo prosédia (npoowSia), em que mpoo signi- fica “em direcdo a” ou “junto com” e wéia significa “canto”, foi usado pela primeira vez no livro Reptiblica de Plato na expressao phthon- gous te kai prosddias (algo como “segmentos vs. prosédias”) para opor aquilo que é dito (phthongous) a forma como é dito (prosddias). A expressao aparece no contexto de uma discussdo sobre a oposi¢ao entre narrativa pura e imitagao em que Sécrates sugere uma censura 4 imitag4o, especialmente quando sao calques do modo de falar de determinados herdis gregos, por essa imitagao poder ferir a reputa- Gao desses herdis (Liddel, Scott e Jones, 1996). Da expressao acima se deduz que Platao se refere ao termo “prosé- dia” em contraste com o contetido dos enunciados, considerando-a um componente sonoro em “sintonia com o canto". Portanto, desde a origem, “prosddia” retém ao menos a acepgao de “modo de falar’, seja ele intencional ou nao. Digitalizado com CamScanner a 19) PROSOOIA « py, ‘ 0A eng Com 0 passar dos séculos, no entanto, 0 termo agregara Sentidos er pecializados associados a outros termos muito usados nas areas > fonética, fonologia e ciéncias da fala como acento, entoacao!, enfase ritmo, bem como sentidos associados ao discurso, a atitudes @ a ges, todos eles imbricados com fatores sociais e biolégicos como género, identidade, classe social, entre outros. Aos estudos de prosédia cabe a andlise fonética e fonolégica das re. lagdes entre unidades silabicas, que sao a base de Constituicao de relagdes entre unidades superiores, no intuito de moldar um modo de falar para determinado fim. Assim, o estudo da prosédia nao con- sidera diretamente o contetido segmental, ou 0 “que se diz” e sima forma sonora e sua fungdo ligadas ao “como se diz”. Para empreender esse estudo, a andlise prosédica se da em eixos lin- guisticos tradicionais, 0 eixo sintagmdtico e 0 eixo Paradigmatico. 0 primeiro eixo diz respeito a relacdo entre elementos presentes no trecho falado, enquanto o segundo diz respeito a relacao entre tre- chos em contraste de enunciados distintos. Como exemplo de andlise prosédica paradigmatica, consideremos o contraste entre dois atos de fala, uma asser¢ao e uma questio, paraa mesma sequéncia de palavras. Assim, o enunciado interrogativo 1.1 correspondente a sentenga “Pedro fez bem seu trabalho?” pode ser comparado, via andlise, ao enunciado assertivo 1.2 corresponden- te a sentenca “Pedro fez bem seu trabalho”. A escuta atenta dos dois enunciados revela que a principal diferenca reside na emissio mais aguda da sflaba t6nica final (“ba”) no enunciado interrogativo. Como exemplo de andlise prosédica sintagmatica, consideremos 0 enunciado 1.3 @@ correspondente a sentenga “Jodo comprou a moto VERDE:, em que a dltima palavra é realizada por seu enunciador com foco contrastivo, isto é, com destaque em relagdo as demais pa Javras, para deixar claro a seu interlocutor que a moto a que se refere nao é, por exemplo, a moto vermelha também a sua frente. A anilise sintagmatica pode, nesse exemplo, descrever os aspectos sonoros da * As formas do substantivo “entonagao e do adjetiva “entonacional também sio possives® [Rais proximas do substantivo latino medieval intonatio, Qptamos pelas formas mais vernse\, {3s do portugués: “entoacao"e “entoacional’, acompanhando o paralelo entre “tom” ¢“e° (endo “entonar”) e entre “som e “soar” Digitalizado com CamScanner palavra “verde” em relagao aos da palavra precedente (“moto”), am- bas enunciadas na mesma frase. A palavra focada é pronunciada de maneira mais forte, mais aguda e mais lenta do que a palavra “moto”. Aimportancia dos estudos da prosédia para os estudos linguisticos emergira claramente para o leitor a partir dos préximos capitulos, mas podemos dar dois exemplos para chamar a atencao sobre o ca- rater essencial desses estudos. 0 primeiro exemplo envolve a nogao de proeminéncia ou destaque de uma unidade em relacao as demais, como vimos no caso da palavra “verde” em foco contrastivo. 0 segundo exemplo envolve a nogao de segmentagao ou divisio da se- quéncia falada numa série de agrupamentos. Tomemosa sequéncia de palavras, “Nao’, “comprou’, “a” e “moto”. A enunciagao dessa sequén- cia em dois agrupamentos sonoros, o primeiro formado por “nao” eo segundo por “comprou a moto”, significa que a pessoa anteriormente mencionada de fato comprou aquela moto. Por outro lado, a enuncia- so como um tinico agrupamento de palavras significa que a pessoa mencionada nao comprou a moto. Essa distin¢do também é feita pela prosédia. Embora assinalar uma proeminéncia ou fazer uma segmen- taco nao sejam as tinicas fungées prosédicas, os exemplos esclare- cem ao leitor a importancia do estudo desse componente da fala. No que diz respeito aos estudos fonéticos, o pesquisador pode exa- minar tanto aspectos prosddicos na produgio da fala quanto em sua Percepeao, Esses aspectos prosédicos podem ser observados porque sdo mensurAveis a partir de seus correlatos fisicos. Correlatos sao varidveis de um determinado nivel que se relacionam ou variam con- juntamente com variaveis de outro nivel. Assim, os correlatos fisicos da prosédia sao as medidas obtidas a partir do enunciado, chamadas de parémetros prosédicos ou prosédico-actisticos, que assinalam a in- formagao prosédica desse mesmo enunciado, 1.1 Correlatos fisicos da prosédia Sao trés os principais correlatos fisicos da prosédia: frequéncia fundamental, duragio ¢ intensidade. A esses trés se pode acres- centar a qualidade de voz. = ® Digitalizado com CamScanner 1.1.1 A frequéncia fundamental (FO) A frequéncia fundamental (FO) é 0 equivalente actisticg quéncia de vibragdo das pregas vocais (termo mais apropri que “cordas vocais’, por razdes anatomofisiolégicas) e corre ao niimero de vezes em que as pregas oscilam em um segun unidade fisica mais comum 6 0 Hertz, abreviado Hz, 4 fre fundamental também pode ser medida em semitom a Partir transformagao logaritmica do seu valor em Hertz, Através de ficio matemiatico, sua medida reflete melhor a forma como des sao processadas por nosso sistema auditivo. a fre, ado dy ‘SPonde do. Sua ‘Wéncig de uma SSE arti. aS Vibra. O semitom corresponde a um dos 12 intervalos da divisdo da oitava, sendo que a oitava corresponde na misica ao intervalo em que as. frequéncias que o delimitam sao o dobro uma da outra, Assim, o in- tervalo entre duas frequéncias na relacao de oitava 6 de 12 semitons, 0 valor de uma frequéncia em Hertz pode ser convertido em semi- tom com referéncia a frequéncia de 100 Hz, cuja medida é abreviada “st ref 100 Hz’, pelo uso de uma escala logaritmica como se vé na figura 1.1 A referéncia a determinada frequéncia 6 arbitréria, E uma decisao do pesquisador ou provém do uso consagrado em pes- Quisa. Significa decidir qual frequéncia sera 0 semitom. Assim, quan- do 100 Hz é a referéncia, essa frequéncia sera 0 semitom. Os valores em Hertz inferiores a 100 Hz terao valores negativos de semitom e os valores acima de 100 Hz terao valores Positivos de semitons. Assim, por exemplo, se 0 som é 0 ld fundamental, cuja frequéncia € 440 Hz, seu valor em semitons referidos a 100 Hz é de 25,65. Se usarmos a metade dessa frequéncia, 220 Hz, seu valor em semitons é de 13,65. Observe que a diferenga entre esses niimeros é de 12 se- mitons, exatamente uma oitava. Aimportancia do uso de uma escala logaritmica como o semitom esta em duas caracterfsticas de nossa percep¢ao auditiva. A primeira c o fato de nossa audigao nao perceber pequenas diferengas de frequen cia. O valor mfnimo paraa percepedo, referido na literatura como Just Noticeable Difference (JND), isto é, a Diferenga Minimamente Perce? tivel, écercade 1 semitom, que correspondeaproximadamentea 6 He. Mas esse valor é valido apenas para regides até cerca de 1.000 Hz Digitalizado com CamScanner F em semitons ref 100 Hz F(st re 100 Hz) 100 200 300 400 500 Amp (micropascal) Figura 1.1: Relaglo entre frequéncia em Hertz (abscissa) e semitons ref 100 Hz (ordenada).. Equacdo 1.1 @ [12.10g2(/100)] pois quando a diferenga espectral, isto é, de frequéncia, se dé em fai- xas superiores a cerca de 2.000 Hz, nossa capacidade de perceber es- sas diferengas cai rapidamente. Essa segunda caracteristica de nossa audigao, a de discriminar melhor 0 som em baixa frequéncia e nem tanto em alta frequéncia, faz com que a expressdo dessa discrimina- 40 de valores de frequéncia em semitom corresponda melhor a nos- sa percepgao e 6, assim, a medida mais apropriada para expressar frequéncia quando se trata do ser humano. 20 Nee Nal KD -BA- | ee | — | 0 1.795 Figura 1.2: Curvas de FO de enunciados assertivo “Pedro fez bem seu trabalho" (contorno claro) fe Interrogativo “Pedro fez bem seu trabalho?" (contorno mais escuro), 0 eino das ordenadas (vertical) é a FO em semitons ref 100 Hz e 0 das abscissas, ‘tempo em segundos. 0 intervala correspondente &tOnica de “trabalho” est assinalado, ntRooUgho Digitalizado com CamScanner PROSOOM + Pinon a evolugao dos valores da frequéncia fund. feridos a 100 Hz dos enunciados Asser. (contorno claro) e inter. A figura 1.2 (@ mostra mental (FO) em semitons re! trabalho” ivo 1.4 §@ “Pedro fez bem seu 7 I a ‘es “Pedro fez bem seu trabalho?” (contorno mais escurg) A diferenca mais importante entre eles se dé durante a sflaba tonicg ‘pa’ da palavra “trabalho’, cujo intervalo temporal & mostrado. Nesse intervalo, o contorno de FO é ascendente no enunciado interrogatiyg e descendente no enunciado assertivo. Observa-se assim que a frequéncia fundamental pode ser controlada pelo falante para veicular a entoacao que ele deseja imprimir a sey enunciado, visando interagir com o ouvinte. Para ser bem-sucedida, essa interacdio se da a partir da realizacao de fungGes ligadas a entoa- ¢o da fala como no caso dos enunciados ilustrados aqui, bem como para assinalar acentos melddicos e segmentagées da fala em unidades menores, entre outras fungdes, como sera apresentado no capitulo 4, 1.1.2 A duragéo A duragao se refere as unidades linguisticas que estruturam a infor- magao prosédica dos enunciados. As medidas mais comuns sao a du- rasao de unidades sildbicas, medida em milissegundos, e a durardo de unidades superiores a sflaba, especialmente dos chamados gru- Pos acentuais, medida em segundos. Essas unidades serao apresen- tadas no capitulo 2, que mostrara que as duragoes silabicas aliadas 4 intensidade estruturam o ritmo da fala, constitufdo pela alternancia de silabas fortes e fracas, Sua medida se da pelo estabelecimento de dois pontos especificos guiados primariamente pelo espectrograma de banda larga, uma re- Presentacao em n{veis de cinza da composi¢ao frequencial (ou es- pectral) de trecho de fala ao longo do tempo, como se vé na figura 1.3 a seguir. Se a duragao é de vogal, os Pontos especificos mencio- nados para sua delimitasio sao o infcio de energia espectral do se- gundo formante (F2) para marcar o infcio da Vogal e o esmaecimento brusco da energia desse mesmo formante para marcar seu término. 0 formante é um modo de vibracao obtido pela formacao de ondas eo Digitalizado com CamScanner estacionarias que maximiza a energia de uma banda de frequéncia, por isso aparecendo como uma regiao escurecida no espectrograma. A duragao de consoantes é determinada a partir da determinagao de pontos especificos no espectrograma de banda larga que depen- dem da classe da consoante, Para as laterais e nasais, o procedimen- to 60 mesmo que para as vogais, enquanto as fricativas requerem a identificacdo do infcio e término do rufdo de friccao, e as oclusivas requerem a identificacao do inicio de oclusao e término do rufdo de friccéo apds soltura. Os sons “r” requerem um cuidado a parte, dada sua variagdo em portugués brasileiro (doravante PB), por exemplo. Se forem fricativos, o procedimento é o da fricativa. Se forem taps, é preciso segmentar as vogais que o flanqueiam e ter sua duracao determinada por consequéncia. Asegmentacao de vogais e consoantes é necessdria também em pesqui- sa prosédica, uma vez que é preciso determinar segmentos actisticos correspondentes a silabas, grupos acentuais, entre outros, que comegam e terminam com palavras que envolvem diferentes vogais e consoantes. Um exemplo de segmentacao em sflabas e palavras pode ser visto na figura 1.3 @. Os critérios de segmentagao de vogais e consoantes fo- ram usados para determinar o inicio e fim das variadas sflabas desse trecho de “A Menina do Nariz. Arrebitado’, de Monteiro Lobato: “Em seguida apareceu um papagaio real que [...]", lido por um falante do interior de S40 Paulo com cerca de 20 anos no momento da gravacao. E possivel ver, em sua fala, uma pausa silenciosa entre “em seguida” e “apareceu’, bem como depois de “real”, Essa tiltima pausa silen- ciosa impossibilita a determina¢do do inicio da consoante /k/ que a segue, por nao ser possivel determinar quando termina a pausa e quando comega a oclusio do /k/. Nesses casos, a determinagao da duragao dessa oclusiva, bem como da palavra “que”, nao é possivel. A silaba mais longa, /aw/, com cerca de 260 ms, precede uma pausa silenciosa, 0 que marca uma fronteira prosddica, isto &, 0 limite de um agrupamento de palavras que termina com a palavra “real”. Esse exemplo sugere a relacdo que pode existir entre a presenga de um parAmetro prosédico (a pausa), 0 valor de um parametro prosédico (duragdo alongada do ditongo e duragao da pausa) e sua fungio pro- sédica (fronteira na cadeia de fala). =e © Digitalizado com CamScanner Frequency (Hz) = real 7 fej seguida = Figura 1.3: Exemplo de segmentacdo em silabas e palavras (em baixo) no Praat a partir do cespectrograma de banda larga (em cima). Observe no intervalo correspondente a slaba /da/ regido escura mais inferior, onde atua o primeiro formante (F1) e a regio escura logo acima, 2, referida no texto. 1.1.3 A intensidade Aintensidade de uma unidade prosédica pode ser absoluta ou re- lativa, mas, em ambos os casos, ela é proporcional ao quadrado da pressdo sonora e expressa quao forte é um som. Calculada em toda a faixa de frequéncia de um som, a intensidade é dita absoluta. Se calculada a partir da diferenga de intensidade em faixas de baixa e alta frequéncia, delimitadas por um limiar consagrado na literatura, a intensidade é dita relativa. Por dupla conveniéncia, a intensidade é comumente expressa por uma unidade logaritmica, o decibel, abreviado dB. Procedendo as- sim, além de trabalharmos com ntimeros mais convenientes do que aqueles da medida de intensidade direta, nos aproximamos também da maneira como nosso sistema auditivo avalia a sensagao derivada da variagao de intensidade, o volume, 0 decibel (dB) é definido em relagao a uma amplitude ou intensidade sonoras absolutas de referéncia escolhidas em fungao do uso que se queira fazer da medida. Uma referéncia muito usada é a amplitude do limiar de audigéo, isto 6, a amplitude minima que alguém é caP* Digitalizado com CamScanner de ouvir. Uma representacao grafica da relacdo entre decibel e ampli- tude sonora pode ser vista na figura 1.4 @ @ Amplitude em dB. ‘Amp (4B) 40 20 0 200 400 600 800 1000 ‘Amp (micropascal) Figura 1.4: Relacio entre amplitude em micropascal (abscissa) e decibel (ordenada) para uma amplitude de referéncia de 20 micropascais [Equacio 1.2 @J Amplitude sonora em dB = 20.log,, (Vl) €a intensidade sonora de referéncia e | &a intensidade cujo valor em dB se quer calcular] Pela figura se pode ver que, até cerca de 200 micropascais, uma di- ferenca em micropascais implica grandes diferengas em dB, mas, a partir dai, diferencas entre duas amplitudes em micropascais corres- pondem a diferencas bem menores em dB. Quando se usa 0 limiar de audicao como referéncia, a unidade fisica é tecnicamente chamada de dB,,,, em que SPL significa Sound Pressure Level ou nivel de pres- sdo sonora, isto é, quanto um som tem de pressao. Quando algum meio de comunicagao se refere a, por exemplo, nivel de intensidade de um avido de 130 dB, na verdade se trata de 130 dBsp,. A intensidade de referéncia pode também ser a de um limiar audi- tivo relativo a uma frequéncia especifica, e nado absoluta, como no caso do limiar de audigao. A razdo disso é que nossa sensibilidade ao som ¢ distinta para frequéncias distintas. Em uma frequéncia de cerca de 1000 Hz somos mais sensiveis ao som. Em torno dessa fre- quéncia, situa-se o limiar de audi¢ao, mas, em frequéncias como 100 ou 10.000 Hz, somos pouco sensiveis e precisamos de som com in- tensidade bem mais alta do que a do limiar de audigao para poder ouvi-lo nessas faixas. Por isso, podemos definir um tipo de calculo mms ) Digitalizado com CamScanner em decibel com relagao ao limiar de cada frequéncia e aessa ™Medida chamamos de dB,,, em que SL significa Sensation Level, isto 60 Nive} da sensago sonora, Essa medida é usada pelos foncaudidlogo, atg fazer testes de audiometria para avaliar 0 nfvel de audigao dos pa. cientes em diversas faixas de frequéncia. Podle-se ainda usar como referéncia a intensidade de determinagy som para que sua intensidade possa ser comparada 4 de outro, Por exemplo, se queremos saber quanto de intensidade tem a mais uma vogal t6nica (V;) em relagao a intensidade de uma vogal étona conti. gua (V,), podemos simplesmente calcular a diferenca em dB entre as duas intensidades para informar quanto a mais ou a menos a inten. sidade de uma vogal est com relagao a outra. Embora a intensidade em dBsp, possa ser medida Por um aparelho especial, chamado de decibelimetro ou medidor de Pressao sonora, @ medida da intensidade do sinal de fala por sua captaao pelo mi- crofone depende da distancia desse com rela¢ao a boca, Assim, um cuidado experimental importante é a manutengao dessa distancia o mais constante possivel para fazer comparagées entre medidas de intensidade que dependam apenas do uso que o falante faz desse Parametro. Esse uso exige maior ou menor esforso vocal, que pode ser indiretamente medido Pelo calculo da intensidade relativa (ou énfase espectral) em dB, Essa medida tem a vantagem de ser imune a posi¢ao do microfone com Telacdo a boca. As medidas de intensi- dade relativa mais empregadas na literatura de Prosédia da fala sao as de diferenca espectral @@}, de énfase espectral B entre outras, e envolvema diferenga de intensidade entre duas faixas de frequéncia, © que permite avaliar o esforco vocal do falante, 1.1.4 A qualidade de voz A qualidade de voz (qv) esta ligada a vibragao das pregas vocais e 4 configurasao laringea durante um enunciado ou trecho de enunciado. Ela se manifesta acusticamente por modificagées em aspectos como a regularidade e a tensaio das Pregas vocais, o que pode produzir uma voz crepitante ou a presenga de rufdo devido ao escape de ar, 0 que pode produzir uma qualidade soprosa, entre outras qualidades. a Digitalizado com CamScanner Essas diferentes qualidades, consequéncia de diferentes ajustes la- ringeos, produzem efeitos no sinal de fala. O que justifica uma inves- tigacdo da Qv no campo de estudos prosédicos é 0 fato de ela poder marcar diferentes estilos de fala, atitudes e emogées do falante, to- dos aspectos relevantes para a prosédia da fala. 1.1.5 Covariagdo entre parémetros prosédico-actsticos Ao movimentar as estruturas articulatérias envolvidas com a produ- cao da fala, mais de um correlato fisico da prosédia varia conjunta- mente em termos actisticos. Observe na figura1.5 @@ duas curvas de parametros aciisticos do enunciado 1.6 (@ correspondente a senten- ca “Eu vi uma moto VERDE.’ com foco contrastivo na ultima palavra. Vé-se que, apesar de uma interrup¢ao no meio de seu curso por conta da realizagdo da consoante /t/, durante a qual as pregas vocais nao vibram, a curva de FO (preta) comega e termina de crescer durante a palavra “moto”. Apés essa subida de FO, a curva cai bem rapidamente no inicio da palavra em foco, “verde’, atingindo um valor baixo ao final da sflaba tonica “ver-. A curva de intensidade tem valores mais altos durante a palavra “verde” e na primeira sflaba de “moto”. Além disso, a duragao da silaba focada, “ver-’, é de 366 ms, a mais longa do trecho. 0 uso conjunto desses trés parametros prosédico-actisticos guia o ouvinte para a percepso do foco na palavra “verde” 120. ators | wan Time (6) | fw [oma | mono VERDE, Figura 1.5: Curva de FO (escura com pontos) ¢ intensidade absoluta (linha continua clara) do cenunclado “Eu vi uma moto VERDE.” ItBODUGAO Digitalizado com CamScanner © PROSODIR Phin 9. Bory Esse movimento de descida da FO a um nivel baixo durante a Stab “ver-” permite assinalar ao ouvinte o cardter Proeminente @ Contras, tivo da palavra “verde’, como se pode ouvir no exemplo dado, Apay, ticipagao de mais de um pardmetro prosédico-actistico Paraa imple. mentagao da fungao de proeminéncia contrastiva 6 comum, Assim a realizacdo conjunta, nesse mesmo exemplo, de intensidade abso, luta com valores elevados reforga a relevancia da Palavra final, Se se guiasse apenas pela intensidade, o infcio da frase Poderia ser consi. derado como igualmente importante, pois se vé ue a intensidade também ¢ elevada nesse momento. No entanto, a FO é © pardmetry principal para o foco em trecho estreito, correspondente aqui a uma palavra, com a intensidade entrando como parametro de apoio. Fica claro, entao, que a forma como percebemos as variagées dos pa- Tametros prosédicos e a forma como eles se conjugam é um mecanis- mo complexo que precisa ser examinado com mais vagar. 1.2 Correlatos Perceptivos da prosédia O falante controla os Parametros prosédico-actisticos vistos acimaa Partir da articulagao da fala para provocar no ouvinte efeitos percep- tivos, isto é, uma sensagdo. Embora a cada um dos parametros vistos acima equivalha um efeito principal para a percepcao, a relacao nao é de um para um. Os trés correlatos Perceptivos da prosédia sao 0 pitch, a dura¢ao percebida e o volume (loudness, em inglés). A esses, como na produgdo, acresce-se a Percep¢ao da qualidade de voz. Ne- nhum desses correlatos tem medida fisica, pois sao sensagées, isto 6, sao efeitos no ouvinte nao diretamente acessiveis 4 mensuragao. 1.2.1 Pitch enunciado. £ importante observar que, embora o principal parame- tro aciistico que provoque a sensagao de grave/agudo sejaa frequé’ cla fundamental (FO), hé dois cuidados importantes a esse respeito. Digitalizado com CamScanner Em primeiro lugar, a sensagao de pitch nao cresce linearmente com essa frequéncia, mas de forma logarftmica. Daf o interesse em usar escalas como a de semitom, pois essa medida aproxima o valor em Hertz da sensagao de pitch. Assim, a medida que a FO aumenta, serio precisos va- lores cada vez maiores para sentir o mesmo grau de aumento de pitch. Outro cuidado a tomar é: para mesmos valores de FO, mas de dife- rentes intensidades ou duragdes, a sensagao de pitch é distinta, isto 6 embora dependa primariamente da FO, o pitch 6 decorrente do concurso dos demais pardmetros prosédico-actisticos. A sensagao de pitch de tons agudos aumenta com a intensidade, isto 6, a sensagao de agudo é tanto maior em tons agudos quanto maior a intensidade. Contrariamente, 0 pitch de tons graves decresce coma diminuigao da intensidade. Outro aspecto composicional importante entre parame- tros aciisticos e sensagao é que, A medida que a duracao diminui para o mesmo valor de FO, a sensagao de grave aumenta, isto é, 0 pitch fica mais baixo. Por conta disso, é incorreto usar FO e pitch indistin- tamente. O primeiro é da esfera da produgao, portanto, mensuravel, enquanto o segundo é da esfera de percepgao, uma sensacdo sonora cujos efeitos se pode medir através da resposta de um sujeito. Como vimos acima quando falamos de semitom, o ser humano tam- bém nao é capaz de distinguir diferencas de qualquer valor entre duas frequéncias. Aquém de determinado limiar, essas duas frequén- cias teriam o mesmo pitch. Frequéncias fundamentais com valores de 100 e 101 Hz sao numericamente distintas, ou seja, sao distintas na produgdo, nao na percep¢do, uma vez que habitualmente uma pessoa nao distingue uma diferenca de apenas 1 Hz. Tais frequéncias terdo para essa pessoa 0 mesmo pitch. Por isso, em termos experi- mentais, nao basta mostrar que duas medidas prosédicas sao obje- tivamente diferentes. £ preciso também avaliar se elas sao percep- tivamente diferenciaveis, se provocam sensagées distintas, de outra forma nao terao validade comunicativa. 1.2.2 A duragGo percebida A durago percebida é a sensacao que permite avaliar se uma uni- dade é longa ou curta em relagao a outra, O ser humano nao é capaz, wRODUKAO, Digitalizado com CamScanner oN PROSODIA * Pini A. Bertoon assim como para o pitch, de discriminar quaisquer disparidades entre valores de duragao. Somos, por exemplo, mais sensivels Para apontar a diferenga de duragdo entre duas sflabas dtonas do que entre duas sflabas tonicas. Dito de outra forma, uma diferenga de 40ms entre duas sflabas pode ser facilmente percebida se essas sila- bas forem atonas, nao percebida se forem ténicas. Se a comparagiio se da entre sflaba tonica e sflaba atona, a percep¢ao de maior dura- gio da primefra é uma das propriedades acusticamente marcadas de sua tonicidade. Essa sensag3o depende, portanto, da forma como os demais parame- tros actisticos variam ao longo de uma unidade linguistica. £ experi- mentalmente conhecido que ouvimos estimulos em que o valor de FO varia como sendo mais longos do que aqueles em que FO é cons- tante, isto é, se o valor de FO ao longo de uma vogal varia — sobe ou desce, por exemplo —, essa vogal é percebida como mais longa do que outra de mesma dura¢do objetiva em que FO ndo varia. Da mesma forma que para a percepsao de pitch, sé se pode perguntar ao sujeito se uma unidade lhe parece mais longa ou curta do que outra ou se uma unidade parece durar o dobro (0 triplo etc.) da outra, Mas nao ha como medir em unidade de tempo: é uma sensacao. 0 que sig- nifica que pode variar entre os ouvintes também, devido a diferentes modos de perceber estimulos sonoros entre diferentes individuos. 1.2.3 O volume (loudness) 0 volume é a sensagao que se da na escala forte/fraco. Ela é de- terminada primariamente pela intensidade de um som, mas nao varia de forma linear com essa intensidade, mas, assim como para a frequéncia vs, pitch, A medida que a intensidade aumenta, serao necessdrios valores cada vez maiores para sentir 0 mesmo grau de aumento de volume. A relacao entre intensidade e volume é, conse- quentemente, logaritmica. Por conta do funcionamento de nossa orelha, a sensagdo de volume varia coma frequéncia do som ¢ isso pode ser medido por testes com tons puros como mostra o resultado na figura 1.6, Digitalizado com CamScanner 500 Tk 2k Frequency (hz) lume segundo, a frequénci Reproduzida de Zwicker e Fast! (1999). intensdade (48) tum tom de 50 Hz precisa de intensidade de 40 dB, : », Para ser per- cebido como de mesmo volume cebido que um tom de 1 kHz (1000 Hz) com intensidade de 0 dBgp,. A figura mostra que o volume depende tanto da intensidade do som quanto de sua frequéncia, Por conta da forma como nossa audi¢ao funciona. Da mesma forma, Para um mesmo valor de intensidade, 0 volume aumenta coma alta da frequéncia, A principal consequéncia dessa rela iso, no que tange a percepsio da entoagao, € 0 aumento de volume para uma mesma intensidade Sonora a medida que o valor de FO se eleva. Sendo assim, em trechos de énfase com FO crescente, o som tendea ser mais forte pelo fato de © volume aumentar também com a frequéncia, 1.2.4 A qualidade de voz percebida A defini¢ao de qualidade de voz é matéria controversa, embora exista um consenso em propor tratar-se de uma resposta perceptiva a um si- nal actistico nao relacionada nem com acento de pitch nem com volu- me. £ uma sensagiio auditiva relacionada a aspectos da voz compreen- WNTRODUGHO Digitalizado com CamScanner PROSODIA + Princ A. Borbonn didos com relativa facilidade quando evocados, como “voz rouca’, “voz soprosa’, “voz trémula’, “voz melodiosa’, entre outros. Seu estudo en- volve técnicas de avaliacao por jufzes especializados (fonoaudidlogos, foneticistas, entre outros) e sua relacdo com pistas actisticas. O termo também pode se referir a modos de fonagao, isto é,a modos de vibragao das pregas vocais que compreendem estados de voz la- ringalizada ou crepitante &@ (creaky voice), voz tensa (harsh voice), voz murmurada ou soprosa (J (murmured voice), voz modal Ben. tre outros. Alguns desse modos podem aparecer em trechos especi- ficos da fala de uma pessoa com fungao prosédica, por exemplo, de- marcativa. A voz laringalizada, ao fim de um enunciado ou diante de uma pausa silenciosa, assinala, por exemplo, uma fronteira da cadeia de fala. Em outros casos, pode assinalar uma atitude em relacao ao interlocutor, como 0 uso de uma voz tensa para marcar hostilidade. 1.3 Softwares para o estudo da prosddia Na literatura, encontram-se tanto programas para andlise do sinal de fala que podem ser usados para estudos prosédicos quanto progra- mas especificos para esse tipo de estudo. O Praat e 0 WinPitch sao exemplos de programas do primeiro tipo. Desde seu langamento em 1996, o Praat se constituiu como o software mais usado pela comunidade cientifica para andlise actstica da fala, tan- to segmental quanto prosédica. Acessivel em , © programa integra uma série de funcionalidades que incluem aque- las que dizem respeito diretamente a andlise prosédico-acistica como analisador de FO, analisador de intensidade e diversas medidas de qualidade de voz, Além disso, camadas de anotagao podem ser as- sociadas ao arquivo de Audio, permitindo segmentagdes de qualquer unidade lingufstica ou discursiva. A partir da combinagao de anota- 40 e 4udio, podem-se obter medidas de duragao, FO, intensidade e pardmetros relacionados a qualidade de voz para qualquer unidade prosédica de interesse. O programa permite ainda: (1) _montar testes de percepgao de fala, que apresentaremos nas segdes de procedimentos experimentais nos capitulos 3 e 4; Digitalizado com CamScanner rr q (2) _filtrar o sinal de fala e manipular parte de seus parametros actisticos para estudar efeitos na percepgao da fala; @) realizar algumas analises estatisticas; , (4) elaborar scripts para a automatizagao das andlises prosédico- -actisticas com uma série de scripts dispontveis em reposité- rios na internet. A possibilidade de criar e utilizar scripts 6 um dos pontos fortes do programa e ja existem muitos dispontveis para diversos tipos de an- lise. Uma lista dos que desenvolvemos ao longo dos anos pode ser encontrada no capitulo 7. De interesse para os estudos prosddicos, 0 WinPitch, acessivel em , também vem sendo desenvolvido des- de 1996. Se, como o Prat, faz anlise de FO e possibilita anota¢do em camadas integradas ao arquivo de audio, por outro lado, duas carac- teristicas que Ihe sao singulares sao 0 fato de dispor de um alinha- dor automdtico, ferramenta que segmenta e etiqueta o sinal de fala em unidades do tamanho do fonema, e de permitir integracao com arquivos de video. Essa ultima funcionalidade constitui um ganho quando as agdes sdo componentes importantes do estudo prosédi- co. Os pesquisadores da area cunharam o termo prosédia audiovisual para a investigacio da relagao entre aspectos prosddicos sonoros visuais, veiculados essencialmente pela face. Semelhante as possi- bilidades de alteragaio de parametros aciisticos do Praat pelo obje- to Manipulation, o WinPitch permite o mesmo tipo de modificagao, mas de forma grafica, o que apresenta certa vantagem, uma vez que se podem fazer as modificagées mais rapidamente quando nao se dispde de um script do Praat para tanto. E importante observar que © programa |é e salva arquivos de anotagao em formato (TextGrid) usado pelo Praat. 0 programa vem sendo utilizado ha muitos anos por equipes que investigam corpora de fala espontanea, como é 0 caso do projeto C-ORAL, de Cresti e Moneglia, e seus derivados, como 0 C-ORAL-Brasil, organizado hd muitos anos por Raso ¢ Mello. Exemplos de programas especificos para estudos prosédicos sao 0 Prosograma @@, de Mertens, e 0 Analor @ para o francés, Reme- temos 0 leitor a informagdes sobre eles no hotsite dedicado a nosso livro no site da Parabola. INTRODUGAO Digitalizado com CamScanner

Você também pode gostar