Você está na página 1de 6

Anais do 6 Encontro Celsul - Crculo de Estudos Lingsticos do Sul

ESTUDO-PILOTO DE UMA NOTAO ENTOACIONAL PARA O PORTUGUS


BRASILEIRO: ToBI OR NOT ToBI?
Luciana LUCENTE (Universidade Estadual de Campinas)
Plinio A. BARBOSA (Universidade Estadual de Campinas)

ABSTRACT: This paper presents a pilot study that evaluates two prosodic transcription systems of
speech - ToBI and INTSINT based on phonetic-acoustic analysis of Brazilian Portuguese (BP). We aim
to test the advantages, disadvantages and complementary aspects of each system for an intonational
transcription system for BP.
KEYWORDS: intonation; prosodic transcription; prosody; pitch; Brazilian Portuguese.
0. Introduo: ToBI e INTSINT. Este trabalho apresenta um estudo-piloto com a finalidade de avaliar dois
sistemas de transcrio prosdica da fala (entoao e fronteiras rtmicas), a partir da anlise fonticoacstica (com ateno especial para a curva de freqncia fundamental - f0 - e o espectrograma), para a
proposta de um sistema de transcrio entoacional para o portugus brasileiro (PB). Os sistemas de
notao avaliados so: ToBI (Tone and Break Indices), de base fonolgica, e o INTSINT (International
System for Intonation Transcription), de base fontico-fonolgica. O primeiro sistema, inicialmente
desenvolvido para a notao prosdica do ingls americano, vem sendo adaptado para a transcrio de
diversas lnguas. Pretendemos avaliar os limites de tal sistema, o tipo de conhecimento da Fonologia
Entoacional do PB que ele pressupe, bem como a consistncia entre transcritores. Quanto ao segundo
sistema, o INTSINT, por se tratar de um mtodo de transcrio automtica, ser avaliado a partir dos
resultados de transcrio realizada pelo programa MOMEL/INTSINT, fornecido por D. Hirst, da
Universidade de Provence, pesquisador que o props.
Para que o sistema ToBI se estabelea como um mtodo de transcrio a partir de uma
transcrio fonolgica larga, ele pressupe um inventrio dos padres tonais da lngua j estabelecido.
Por sua vez, o INTSINT que se considera equivalente a uma transcrio fontica estreita, pode
conseqentemente ser usado para angariar dados, atravs de uma transcrio automtica, de lnguas que
ainda no foram descritas. Acreditamos que o sistema ToBI possa ser adaptado para a transcrio do PB,
a partir da observao de sua aplicao na transcrio de outras lnguas, possibilitando tambm um
melhor conhecimento da organizao entoacional dessa variedade do portugus. Por se tratarem de
sistemas que privilegiam transcries distintas, uma mais ampla e outra mais estreita, os dois sistemas
acabam se interpelando e ressaltando eventos possivelmente sem interesse lingstico-entoacional em
INTSINT e eventos, significativos do ponto de vista lingstico, possivelmente perdidos em ToBI.
ToBI no pretende se estabelecer como um Alfabeto Fontico Internacional (IPA, da sigla
em ingls) para a prosdia, pelo fato de a entoao e a prosdia possurem caractersticas particulares
entre diversas lnguas e dialetos, mas sim um instrumento para que a pesquisa de uma determinada lngua
possa ter uma transcrio especfica e comum entre vrios trabalhos. A transcrio ToBI de uma sentena
consiste minimamente na gravao da fala associada a um programa que reproduza sua freqncia
fundamental (f0 ), como o software Praat, e rtulos simblicos para os eventos da fala dispostos em quatro
camadas (tiers) paralelas. As quatro camadas, dispostas na ordem em que aparecem nos exemplos so:
tone tier, orthographic tier, break index tier e miscelaneous tier, que respectivamente assinalam tom,
ortografia, fora de fronteira e aspectos comunicativos diversos (ver figura 1).
As camadas tone (To) e break index (BI) representam o foco da anlise prosdica desse
sistema. Sendo o tone tier a parte da transcrio que corresponde mais especificamente anlise
fonolgica do padro de entoao da sentena. Ele consiste em um rtulo para diferentes eventos de pitch,
transcritos na sentena como tons altos e baixos, respectivamente representados por H e L (do ingls hight
e low). O inventrio dos diferentes eventos de pitch e sua definio so baseados na anlise autosegmental
proposta originalmente por Pierrehumbert (1980) e em algumas modificaes propostas por Ladd (1983).
As seguintes camadas usadas para transcrio, break index, orthographic e miscelaneous, marcam
respectivamente: o agrupamento prosdico das palavras da sentena em uma escala de nmeros que vai
de 0 (para a seqncia mais coesa) a 4 (para a mais disjunta); a transcrio ortogrfica de todas as
palavras da sentena; e comentrios acerca de eventos importantes para a anlise, como pausas, tosses,
hesitaes.

Fig.1.Transcrio ToBI para a sentena Thats what I thought


A partir da apresentao das linhas-mestras iniciais do sistema, o aprendizado da notao se
dar com sesses de treinamentos de transcrio com diversos pesquisadores, que devem manifestar uma
consistncia medida a partir de uma concordncia de no mnimo 80% entre as transcries. A descrio
dos treinamentos e a definio da simbologia de transcrio em ToBI esto resumidas em Beckman et al
(1992) e Pitrelli, Backman e Hirsberg (1994). Para o treinamento dos transcritores nesse trabalho
inicialmente usamos o guia fornecido pela universidade de Ohio, Guidelines for ToBI Labelling, Mary E.
Backman e Gayle Ayers Elam (1993), posteriormente usamos da mesma metodologia para a transcrio
de sentenas semi-espontneas do PB.
O INTSINT (Hirst e Di Cristo, 1998), ao contrrio do anterior, pretende, aos modos do
Alfabeto Fontico Internacional (IPA), ser um sistema internacional de transcrio para entoao, como
sua prpria sigla sugere (INternational Transcription System for INTonation). O INTSINT pode ser
avaliado a partir dos resultados de transcrio automtica, atravs do programa MOMEL/INTSINT,
quando utilizado em conjunto com o software Praat.

Fig.2. Transcrio automtica (INTSINT) da sentena Thats what I thought


Para que o INTSINT se estabelea como um alfabeto internacional para transcrio da
entoao necessrio que um nmero grande de hipteses sobre possibilidades e caractersticas

prosdicas significantes em diversas lnguas sejam avaliadas, tal como os proponentes do sistema
procuram fazer em Hirst e Di Cristo (1998) que inclui em seu contedo a aplicao de INTSINT para a
transcrio prosdica do portugus brasileiro (PB), realizada por Joo A. de Moraes (UFRJ).
A simbologia desse sistema de notao difere da notao do ToBI, enquanto o ltimo usa
quatro camadas e uma simbologia baseada somente em dois tons (alto H e baixo L), o INTSINT,
representa o contorno prosdico da fala com os seguintes smbolos: H (higher), L (lower), S (same ), D
(downstep), U (upstep), T (top), B (botton) e M (mid), o que em si j uma transcrio mais refinada do
contorno entoacional (ver figura 2).
1. Simbologia. A proposta original de Pierrehumbert (1980) de uma notao prosdica que apresentava
um elenco de sete eventos de pitch, mais frase accents e fronteiras silbicas, como mostra o esquema
abaixo:

boundary tones

pitch accents

phrase accents

boundary tones

Fig.3. Proposta original para notao entoacional do ingls americano, Pierrehumbert (1080)
Em ToBI os eventos de pitch passaram a cinco, sendo H*+L, H+L* e H*+H eliminados e
substitudos por apenas H* e por H+!H* indicando downstepping. Os phrase accents e os boundary tones
continuam os mesmos, apresentando a seguinte simbologia: H*, L*, L+H*, L*+H e H+!H* para pitch
accents, H- e L- para phrase accents, H%, L% e %H para boundary tones, sendo que o smbolo
acompanhado de asterisco representa a posio de alinhamento com a slaba lexicalmente acentuada
proeminente (observar contraste entre L+H* e L*+H nas figura 4 e 5).

Fig. 4. Transcrio ToBI para a setena That ones for Marianna.

Fig.5 Transcrio ToBI para a sentena Theres a lovely one in Bloomingdales.


Em INTSINT todos os smbolos de pitch so usados para definir um ponto ou um alvo. Os
smbolos H, L e S (respectivamente, hight, low e same) so usados precisamente na marcao de uma
proeminncia; D e U (downstep e upstep) representam queda e subida relativa de pitch precedendo uma
proeminncia, podem tambm corresponder a picos e vales, porm correspondem a uma variao na
altura de pitch no to significativa como as marcadas por H e L. Smbolos como T e B (top e bottom) se
referem aos limites extremos superior e inferior da curva entoacional, sendo que M (mid) marca uma
excurso intermediria. Posies iniciais e finais de pitch quando no so marcadas representam,
respectivamente, M e S.
Apesar da transcrio de ambos os sistemas coincidir simbolicamente, a interpretao que
fazem dos fenmenos no a mesma, por exemplo, um evento marcado em ToBI por L+H* pode ser
marcado em INTSINT por T ou H (veja figuras 6 e 7). Isso se deve ao fato de a transcrio ToBI levar em
considerao, alm da curva de f0 , a percepo do transcritor.
2. ToBI or not ToBI? Experincias realizadas com sentenas do PB no Laboratrio de Fontica e
Psicolingstica (LAFAPE - Unicamp), j possibilitaram a verificao de que os dois sistemas acabam por
se complementarem na anlise do PB. O ToBI, por usar um inventrio limitado de smbolos para uma
transcrio mais larga, por vezes pode negligenciar aspectos significativos do ponto de vista lingstico, o
INTSINT, por sua vez, ao fazer uma anlise muito fina da entoao da fala, acaba por descrever aspectos
que no so significativos do ponto de vista de uma notao entoacional.
Por exemplo a variao no percebida pelo ouvido (ToBI) da subida marcada U (figuras
6 e 7). Essa variao que a transcrio do INTSINT apresenta em relao transcrio ToBI se deve
anlise fontica fina que o programa de transcrio automtica realiza. O algoritmo do MOMEL
(programa que executa a transcrio INTSINT), ver Hirst et al (2000), consiste na fatorizao de uma
curva de f0 em dois componentes: um componente microprosdico causado pela natureza dos segmentos
(funo de transferncia) e um componente macroprosdico independente dos segmentos (fonte). A
inteno encontrar na macroprosdia os gestos da laringe correspondentes a informao entoacional da
mensagem, como esses gestos so independentes dos fonemas possvel que haja um ponto-alvo em uma
parte no vozeada, pois a laringe continua a se estender e distender mesmo quando no h vibrao. Os
pontos-alvos correspondem aos pontos onde a inclinao da curva de f0 subjacente nula, Hirst supe que
esses pontos-alvo resumem a informao prosdica do enunciado.
A anlise da transcrio da curva entoacional do PB mostra (como previsto) que devido a
grande diferena entre as curvas de pitch do ingls - lngua para a qual o sistema ToBI foi desenvovido e o do PB - que se mostra menos pronunciada em relao curva do ingls um casamento entre os
resultados mais relevantes nas duas transcries possibilitar uma transcrio mais acurada do padro
entoacional do PB

Fig.6. Transcrio ToBI para a sentena do PB Um lindo beb calvo.

Fig. 7. Transcrio INTSINT para a mesma sentena do PB. Observe as marcaes de U e T que
aparecem grifadas aqui e que no aparecem na transcrio ToBI.
3. Consideraes finais. Tendo em vista o nmero crescente de pesquisadores analisando a organizao
entoacional de um certo nmero de lnguas, incluindo vrias lnguas romnicas como espanhol, portugus
europeu, francs, italiano, a fim de propor um sis tema satisfatrio para a transcrio da entoao, ser de
grande importncia tambm um estudo nessa direo aplicado s variedades do PB, comeando por
aquelas circunscritas ao estado de So Paulo. Posteriormente a inteno ser a aplicao dessa transcrio
prosdica a casos para os quais existam fenmenos fonolgicos relevantes para a pesquisa, como o caso
do fenmeno de encontro acentual no PB, entre outros. Temos conhecimento apenas do uso informal de
uma notao de cunho fonolgico-entoacional nos trabalhos brasileiros.
A partir desse estudo-piloto pretendemos propor uma notao entoacional mais fonolgica
para o PB, a qual denominaremos BP-ToBI (Brazilian Portuguese ToBI).

RESUMO: Apresentamos um estudo-piloto a fim de avaliar dois sistemas de transcrio prosdica da


fala - ToBI e INTSINT - a partir da anlise fontico-acstica para o PB. O objetivo testar vantagens,
desvantagens e aspectos complementares de cada sistema na proposta de um sistema de transcrio
entoacional para o PB.
PALAVRAS CHAVE : entoao; transcrio prosdica; prosdia; pitch; portugus brasileiro.
REFERNCIAS BIBLIOGRFICAS
BECKMAN, Mary E., DIAZ-CAMPOS, M., McGORY, J.T. Intonation across Spanish,
in the Tones and Break Indices Framework. Intonation in Romance Special
Issue. Local: Probus, 2002.
BECKMAN, Mary E., ELAM, Gayle A.,. Guidelines for ToBI Labeling. The Ohio State University
Research Foundation, 1993. (Disponvel em http://www.ling.ohio-state.edu/~tobi/ame_tobi/)
BECKMAN, Mary E., HIRSCHBERG, J., PITRELLI, John F. Evaluation of Prosodic
Transcription Labeling Reliability in the ToBI Framework.1994 (Disponvel em
http://www.ling.ohio-state.edu/~tobi/ame_tobi/ )
BOTINIS, A., GRANSTRN, B., MBIUS, B. Developments and Paradigms in Intonation
Research. Speech Communication , local, n. 33, 2001
HIRST, D., DI CRISTO, A. Intonational Systems, a survey of twenty languages. Cambridge:
Cambridge University Press, 1998
HIRST, D., DI CRISTO, A., ESPESSER, R. Levels of Representation and Levels of Analysis for the
Description of Intonation Systems. 2000 (Disponvel em http://www.lpl.univaix.fr/~hirst/publis.html.)
LADD, D. Robert. Intonational Phonology. Cambridge: Cambridge University Press,1996.
LADD, D. Robert. Phonological features of intonational peaks. Language 59: 721-59, 1983.
MADUREIRA, S. Pitch Patterns in Brasilian Portuguese: an Acoustic-Phonetic Analysis,
publicao. 1994, proceedings of the Fifth Australian International Conference on Speech
Science and Technology, 156-59.
MORAES, J. Antnio. F0 Declination in Brasilian Portuguese in Read and Spontaneous
Speech, Proceedings of the 14 th International Congress of Phonetic
Sciences, 1999 San Francisco, 2323-26.
PIERREHUMBERT, J. B. The Phonology and Phonetics of English Intonation. PhD
disseratition. Cambridge: Mass: MIT, 1980.
SILVERMAN, K. et al. ToBI: a Standard for Labeling English Prosody. 1992 (Disponvel em
http://www.ling.ohio-state.edu/~tobi/ame_tobi/)