Você está na página 1de 19

Em busca de processos automticos para a

identificao de fronteiras de enunciados em


corpora orais:
uma avaliao da pausa
Maryual Malvessi Mittmann
Tommaso Raso
Anna Carolina Oliveira Mendes
Brbara Heloh Falco Teixeira

Simpsio Temtico: Abordagem e metodologia


Lingustica de Corpus na anlise lingustica
25-28/fevereiro/2015

IX Congresso Internacional da ABRALIN

da
1

1 Introduo
Neste trabalho discutimos a utilizao da pausa como parmetro para
a identificar fronteiras de enunciados em corpora orais.

Interesse crescente no estudo da fala espontnea, aumento da


compilao de corpora de fala.
Necessidade de aprimoramento das tcnicas de processamento
dos dados ampliao dos bancos de dados.
Melhoria de sistemas de reconhecimento de fala.

O desenvolvimento de tcnicas automticas para tratamento de


corpora de fala representa grande contribuio para a rea.

Simpsio Temtico: Abordagem e metodologia


Lingustica de Corpus na anlise lingustica
25-28/fevereiro/2015

IX Congresso Internacional da ABRALIN

da
2

1 Introduo
A segmentao da fala

Diviso do contnuo da fala em unidades discretas.


Segmentao manual: realizada atravs do exame do sinal
acstico (onda, espectrograma). Processo tedioso, demorado,
grande treinamento para os segmentadores, erros.
Segmentao automtica: fala segmentada por uma mquina
em unidades definidas acusticamente. Amplamente utilizado
para segmentao fontica da fala (Svendsen e Soong, 1987;
Kaur e Kaur, 2013; Hemert, 1991; Selmini e Violaro, 2008;
Arantes, 2011), mas ainda pouco aplicado para segmentao
da fala em enunciados.
Simpsio Temtico: Abordagem e metodologia
Lingustica de Corpus na anlise lingustica

25-28/fevereiro/2015

IX Congresso Internacional da ABRALIN

da
3

1 Introduo
A segmentao automtica da fala em unidades maiores do que a
palavra normalmente aplicada na tentativa de produzir uma
pontuao para o texto falado, ou de identificar os limites de
sentenas no texto falado (Serra 2009, 2010; Langus et al., 2012;
Cutler, Oahan e Donselaar, 1997).

MAS, no h uma correspondncia de um para um entre o domnio


sinttico e o prosdico (Steedmna, 1990; Hirst, 1993; Shattuck-Hufnagel &
Turk, 1996).
E, ainda que limites de uma sentena sejam alinhados com os limites de
uma frase entonacional, uma fronteira de frase entonacional pode
ocasionalmente ser encontrada dentro de uma sentena, e sua
localizao pouco previsvel (Langus et al, 2012).
Ex. 1: EMF: l mil-e-duzentos // que eu t pagando //
Simpsio Temtico: Abordagem e metodologia
Lingustica de Corpus na anlise lingustica

25-28/fevereiro/2015

IX Congresso Internacional da ABRALIN

da
4

1 Introduo
A unidade de referncia considerada para fins de segmentao da fala
espontnea no mbito do projeto C-ORAL-BRASIL o enunciado.

Menor unidade lingustica pragmatica e prosodicamente autnoma


na comunicao.
Grande consistncia do ponto de vista perceptual
Unidade representativa da realidade dos eventos de fala
espontnea, que nem sempre se realizam na forma de estruturas
que podem ser descritas como sentenas, conforme Cresti e
Gramigni (2003), Biber et al. (1999), Raso e Mittmann (2012).
Ex. 2: BRU: no // assim //
Ex. 3 : CAR: nenhuma tem ferro no // mas muito bonita //
Simpsio Temtico: Abordagem e metodologia
Lingustica de Corpus na anlise lingustica

25-28/fevereiro/2015

IX Congresso Internacional da ABRALIN

da
5

2 Objetivos
A pausa o parmetro acstico que mais recebe ateno quando se
trata de identificar fronteiras de enunciados no fluxo da fala. A
simplicidade de identificar interrupes no sinal acstico justifica sua
utilizao como principal parmetro na segmentao automtica da
fala.

Em que medida as pausas correspondem a fronteiras prosdicas


na fala espontnea?
possvel relacionar a durao da pausa com um determinado tipo
de fronteira prosdica (fronteiras de enunciados ou de unidades
menores)?

Simpsio Temtico: Abordagem e metodologia


Lingustica de Corpus na anlise lingustica
25-28/fevereiro/2015

IX Congresso Internacional da ABRALIN

da
6

3 Sobre a pausa
Na literatura o termo pausa frequentemente utilizado para se
referir a um conjunto diferente de fenmenos.
Nespor e Vogel (1986) contrastam pausa perceptual e pausa
real.

Pausa perceptual: o que percebido como pausa, podendo


foneticamente corresponder a uma variedade de fenmenos:
mudana de pitch, durao. S algumas vezes corresponde
cesso da fonao.
Pausa real: existncia de poro de silncio no sinal da fala
Ex. 4: BAO: as recarregveis / to aqui //
Ex. 5 : BAO: quando sai / n stop //
Simpsio Temtico: Abordagem e metodologia
Lingustica de Corpus na anlise lingustica

25-28/fevereiro/2015

IX Congresso Internacional da ABRALIN

da
7

3 Sobre a pausa
Merlo e Barbosa (2012) diferenciam entre:

Pausa silenciosa fluente: perodo de silncio, localizado entre


sintagmas, havendo mudana no movimento da curva de F0 antes
e depois da pausa (Campione & Vronis, 2004).
Hesitao: momentos de desacelerao em qualquer nvel
lingustico (fontico, fonolgico, morfolgico, sinttico ou
semntico), caracterizados pelas seguintes manisfestaes
(Campione & Vronis, 2004; Marcuschi, 2006; Wingate, 1987)

Pausa silenciosa hesitativa: perodo de silncio, localizado no interior


de sintagmas, no havendo mudana no movimento da curva de F0
antes e depois da pausa.
Ex. 6: JOR: e esses empresrios no fazem / esses tipo de clculo //
Simpsio Temtico: Abordagem e metodologia
Lingustica de Corpus na anlise lingustica

25-28/fevereiro/2015

IX Congresso Internacional da ABRALIN

da
8

3 Sobre a pausa

Pausa preenchida: sons de preenchimento, que, em portugus


brasileiro, costumam ser transcritos ortograficamente como h, h,
ah, mm.

Repetio hesitativa: ocorrncias sucessivas de um mesmo trecho,


sem funo de nfase. As repeties podem ser de parte de palavra
(fone ou slaba) ou de palavras (isoladas ou em sequncia).

Alongamento hesitativo: aumento na durao de um fone, sem funo


de nfase, em incio ou final de palavra.

Ex. 7: CAR: aqui / mas / a [/1] a prefeitura / &he / &he / j levou l //


Ex. 8: SHE: ento / a orientadora / ela n quer fazer o papel da coordenadora //
e / vice-versa //
Simpsio Temtico: Abordagem e metodologia
Lingustica de Corpus na anlise lingustica
25-28/fevereiro/2015

IX Congresso Internacional da ABRALIN

da
9

3 Sobre a pausa

Pausa preenchida: sons de preenchimento, que, em portugus


brasileiro, costumam ser transcritos ortograficamente como h, h,
ah, mm.
Repetio hesitativa: ocorrncias sucessivas de um mesmo trecho,
sem funo de nfase. As repeties podem ser de parte de palavra
(fone ou slaba) ou de palavras (isoladas ou em sequncia).
Alongamento hesitativo: aumento na durao de um fone, sem funo
de nfase, em incio ou final de palavra.
Falso incio: construo problemtica, que pode ser abandonada ou
corrigida.
Bloqueio: posio articulatria fixa, que ocasiona suspenso
temporria do enunciado
Ex. 7: CAR: aqui / mas / a [/1] a prefeitura / &he / &he / j levou l //
Ex. 8: SHE: ento / a orientadora / ela n quer fazer o papel da coordenadora //
e / vice-versa //
Simpsio Temtico: Abordagem e metodologia
Lingustica de Corpus na anlise lingustica

25-28/fevereiro/2015

IX Congresso Internacional da ABRALIN

da
10

3 Sobre a pausa
Em PB, Serra (2010) considera a pausa silenciosa como a pista
mais relevante para a percepo de fronteiras prosdicas tanto
na fala espontnea como na leitura.

Segundo a autora a pausa delimita predominantemente o


domnio do enunciado fonolgicos (I), contudo observa que na
fala espontnea pausas internas a I so mais frequentemente
observadas do que na leitura.

Problema da unidade de referncia (confuso sentena X


enunciado).

Simpsio Temtico: Abordagem e metodologia


Lingustica de Corpus na anlise lingustica
25-28/fevereiro/2015

IX Congresso Internacional da ABRALIN

da
11

4 Anlise da pausa
Comparao entre os resultados de uma segmentao
automtica com base em pausas versus a segmentao manual
de um corpus de fala espontnea.

Identificar a coincidncia entre pausa e fronteira de enunciado; e/ou


entre pausa e fronteira de unidade entonacional menor que o
enunciado.
Verificar a exisncia de um valor de durao de pausa que
coincidisse o mximo possvel com as fronteiras de enunciados e o
mnimo possvel com fronteiras de unidades entonacionais
menores que o enunciado.

Simpsio Temtico: Abordagem e metodologia


Lingustica de Corpus na anlise lingustica
25-28/fevereiro/2015

IX Congresso Internacional da ABRALIN

da
12

4 Anlise da pausa
Para operacionalizar a anlise utilizaram-se os conceitos
seguintes:

Silncio: interrupo do sinal acstico no provocado pela


existncia de consoantes surdas.
Pausa: durao de silncio convencionalizada para marcao
de fronteira em um modelo de segmentao automtica da
fala.

Analisaram-se contextos marcados como fronteira de tipo


conclusiva e no-conclusiva de enunciado anotadas
manualmente quanto a presena ou no de pausa e sua
durao, em intervalos de 10ms.
Simpsio Temtico: Abordagem e metodologia
Lingustica de Corpus na anlise lingustica
25-28/fevereiro/2015

IX Congresso Internacional da ABRALIN

da
13

4 Anlise da pausa
Amostra

Trechos aleatrios de udio que contivessem 9 fronteiras de


enunciado de cada gravao do C-ORAL-BRASIL informal.

1251 fronteiras conclusivas

2580 fronteiras no conclusivas

Contagem da coincidncia entre cada tipo de fronteira e


pausas.

Durao entre 10ms a 200ms (em intervalos de 10ms).

A partir do percentual de coincidncia em cada ponto, foram


feitas regresses no lineares considerando os dois tipos de
fronteiras.
Simpsio Temtico: Abordagem e metodologia
Lingustica de Corpus na anlise lingustica

25-28/fevereiro/2015

IX Congresso Internacional da ABRALIN

da
14

4 Anlise da pausa
Resultados
Pausa
Durao
ms
10
20
30
40
50
60
70
80
90
100

Coincidncias com
fronteira
conclusiva

no
conclusiva

842
842
841
839
837
833
827
823
815
810

675
675
675
675
673
673
668
667
663
660

Pausa
Durao
ms
110
120
130
140
150
160
170
180
190
200

Coincidncias com
fronteira
conclusiva

no
conclusiva

807
799
792
785
776
767
763
759
750
746

655
646
639
630
629
623
615
607
595
587

4 Anlise da pausa
Percentual de coincidncia entre pausas e fronteiras conclusivas de
enunciado (terminais) e no conclusivas (no-terminais), em relao
durao de pausas (ms)

Simpsio Temtico: Abordagem e metodologia


Lingustica de Corpus na anlise lingustica
25-28/fevereiro/2015

IX Congresso Internacional da ABRALIN

da
16

4 Anlise da pausa

Para fronteira de enunciado: quando o valor da pausa tende a


0ms, h uma coincidncia limite mxima (67%) entre pausa e
fronteira.
Para fronteira de unidade entonacional: a coincidncia mnima
entre pausa e fronteira chega a 19% a partir de uma durao
de pausa de 300ms. Coincidncia chega abaixo de 5%
somente a partir dos 687ms de durao de pausa.
Pausa maior ou igual a 100ms:

65% de coincidncia com fronteiras conclusivas

25,4% de coincidncia comfronteiras no conclusivas.

Simpsio Temtico: Abordagem e metodologia


Lingustica de Corpus na anlise lingustica
25-28/fevereiro/2015

IX Congresso Internacional da ABRALIN

da
17

4 Anlise da pausa

A segmentao deixaria de identificar 35% das fronteiras de


enunciados, e 25,4% das fronteiras no conclusivas seriam
assinaladas como fronteiras de enunciado.
Total de 1251 fronteiras conclusivas de enunciado

409 no coincidem com pausas (33%)

Total de 1627 enunciados:

913 enunciados apresentam fronteiras no conclusivas

565 no apresentam pausas (62%)

Simpsio Temtico: Abordagem e metodologia


Lingustica de Corpus na anlise lingustica
25-28/fevereiro/2015

IX Congresso Internacional da ABRALIN

da
18

5 Prosseguimentos
Estudo de um sistema que considere diversos parmetros
acsticos na identificao de fronteiras, realizado a partir de
aprendizado com base em um amostra segmentada por mltiplos
juzes.

O sistema consideraria diversos parmetros para gerar uma


probabilidade de fronteira, entre eles:

Julgamento quanto existncia ou no de fronteira e seu


tipo;

Durao silbica em posies pr e ps fronteiria;

F0 mdia de slaba pr e ps fronteiria;

- Presena e durao de pausa.

25-28/fevereiro/2015

Simpsio Temtico: Abordagem e metodologia


Lingustica de Corpus na anlise lingustica
IX Congresso Internacional da ABRALIN

da
19