Você está na página 1de 48

1

MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Sons Vocais do Ingls Americano
Existem mais de 40 sons vocais no ingls americano que podem ser
classificados de acordo com a forma bsica em que so produzidos.
Vogais e consoantes diferem no grau de contrio
Consoantes Sonoras no tem presso na contrio
Consoantes Nasais permitem fluxo de ar na cavidade nasal
Consoantes contnuas no bloqueiam o fluxo de ar na cavidade oral
1 Aspiradas
2 No fricativas
4 Semi vogais
3 Nasais
6 Oclusivas
8 Fricativas
18 Vogais
Nmero Classe quanto forma
2
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Produo das Vogais
Pouca contrio no trato vocal
Geralmente produzida com excitao peridica
Caractersticas Acsticas dependem da posio do maxilar, lngua e
lbios.
3
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Vogais do Ingls Americano
Existem aproximadamente 18 vogais no ingls americano feitos de
monotongos, ditongos e vogais reduzidas.
Elas so freqentemente descritas mediante caractersticas da
articulao: Altas/Baixas, Anteriores/Posteriores, Retroflexas,
Arredondadas, e Tensas/Relaxadas.
4
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Espectrograma das Principais Vogais
5
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Mdias dos Formantes de Vogais
Vogais so freqentemente caracterizadas pelos trs formantes
mais baixos.
Alto/Baixo correlacionado com o primeiro formante, F1.
Anterior/Posterior correlacionado com o segundo formante, F2.
Retroflexo marcada pelo terceiro formante, F3.
6
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Durao das Vogais
Cada vogal tem uma durao intrnseca diferente
As vogais reduzidas tem uma menor durao (50ms)
/I, E, , U/ so os monotongos mais curtos
O contexto pode influenciar fortemente a durao das vogais
7
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
R
o
b

s
Quadro de Vogais Pequeno e Feliz
Impreciso, mas mesmo assim til.
Anterior
Posterior
Reflexo
Simples
Anterior
8
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Produo de Fricativas
Turbulncia produzida na contrio estreita.
A posio da contrio determina as caractersticas acsticas.
Pode ser produzida com excitao peridica.
9
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Fricativas do Ingls Americano
Existem 8 fricativas no ingls americano.
Quatro posies de articulao: Lbio-Dental (Labial), Inter-dental
(Dental), Alveolar, e Palato-Alveolar (Palatal).
So freqentemente descritas pelas caractersticas
Sonoras/Surdas, ou Agudas/No Agudas (contrio atrs da
salincia alveolar).
Tipo Surdas
Sonora
10
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Espectrograma das Fricativas Surdas
11
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Energia das Fricativas
Fricativas agudas tendem a ser mais fortes que as fricativas no agudas.
12
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Durao das Fricativas
Fricativas sonoras tendem a ser mais curtas que as fricativas no sonoras.
Sonora
Surda
13
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Exemplos do Contraste das Fricativas Sonoras
14
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Um pequeno quadro amigvel de Consoantes
"Um pouco mais preciso, mas um pouco menos til"
R
o
b

s
extremo
extremo
extremo
extremo
As africativas
Surda, Sonora
F
r
i
c
a
t
i
v
a
O
c
l
u
s
i
v
a
15
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Qual a palavra?
16
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Produo de Oclusivas
Fechamento completo to trato vocal, aumento da presso
Abandono repentino da contrio, rudo de turbulncia
Pode ter excitao peridica durante o fechamento
17
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Oclusivas do Ingls Americano
Existem 6 consoantes oclusivas no ingls americano.
Trs posies de articulao: Labial, Alveolar, e Velar.
Cada posio de articulao tem uma oclusiva sonora e surda.
Oclusivas surdas so tipicamente aspirados.
Oclusivas sonoras geralmente exibem uma voice-bar durante o
fechamento.
Informao acerca da transio e abandono dos formantes til
para a classificao.
Tipo Sonoro No Sonoro
18
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Espectrograma de Oclusivas Surdas
19
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Exemplos do contraste na sonorizao da oclusiva
20
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Durao da oclusiva de um nico tom
Durao dos sonoros (Voice Onset Times - VOTs) so maiores que
as oclusivas surdas.
21
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
F
r
e
q

n
c
i
a
Amplitude da rajada
Tempo
Durao da
Vogal
Energia nas freqncias baixas
Durao
Antes da
emisso da voz
Freqncia
Fundamental
Formas de Sonorizao para oclusivas
Existem vrias formas de sonorizao para um stop.
22
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
/s/-Duraes das Oclusivas
Oclusivas surdas no so aspiradas em seqncias /s/ stop.
23
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Exemplos de Velar Anterior/Posterior
24
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Qual a palavra?
25
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Produo Nasal
Fluxo de ar atravs da cavidade nasal.
Consoantes produzidas mediante fechamento da cavidade oral.
Sons (murmrios) nasais tem caractersticas espectrais
semelhantes.
26
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Nasais do Ingls Americano
Trs posies de articulao: Labial, Alveolar, e Velar.
Consoantes nasais sempre acompanham uma vogal, e podem
formar uma slaba inteira ([], [m], []).
/ / esta sempre aps uma vogal em ingls.
A posio identificada pelas transies dos formantes vizinhos.
Tipo
Tipo
27
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Espectrograma dos Nasais
28
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Qual a palavra?
29
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Produo de semivogais
Constrio no trato vocal, no turbulncia.
Movimento da articulao mais lento que os das outras consoantes.
Formas Laterais completo fechamento com a ponta da lngua e
fluxo de ar saindo pelos lados da contrio.
30
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Semivogais do Ingls Americano
Existem 4 semivogais no Ingls Americano
As vezes referidas como Lquidas ou Deslizante
As deslizantes tem uma articulao maior que a de uma vogal;
Similar posio dos formantes, muito embora mais extrema;
Geralmente mais fraca devido contrio mais estreita.
Semivogais esto sempre acompanhadas por vogais, muito embora
/l/ pode formar uma silaba inteira ([])
Semivogal Vogal mais prxima Tipo
Deslizante
Lquida
31
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Espectrograma de Semivogais
32
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Propriedades acsticas das Semivogais
/w/ e /l/ so as semi vogais que mais se confundem.
/w/ caracterizado por F1 e F2 bem baixos.
Tipicamente um rpida cada acima de F2.
/l/ caracterizado por um baixo F1 e F2.
Freqentemente h presena de alta energia.
/l/ aps vogal caracterizado por uma mnima descontinuidade.
espectral, movimento gradual dos formantes.
/y/ caracterizado por um F1 muito baixo, e um F2 muito alto.
/y/somente ocorre em uma slaba quando antes de vogal.
/r/ caracterizado por um F3 muito baixo.
F3 Pr-voclico < F3 mediano < F3 Ps-voclico.
33
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Qual a palavra?
34
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Produo de No fricativas
Existem duas no fricativas no Ingls Americano:
Pares Alveolar-oclusiva palatal-fricativa.
Abandono repentino da contrio, rudo de turbulncia.
Pode haver excitao peridica durante o fechamento.
Sonoro Surda
35
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Produo Aspirante
Existe um aspirante no Ingls Americano: /h/ (ex., hat).
Produzido mediante gerao de excitao turbulenta na glote.
No h contrio no trato vocal, excitao normal do formante.
Acoplamento Subglotal resulta em pequena energia na regio F1.
Excitao Peridica pode estar presente na posio mediana.
36
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Espectrograma de No Fricativas e Aspirantes
37
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Qual a palavra?
38
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Limitaes Fonotticas
Fonottica o estudo da seqncia permitida de sons
Anlise da palavra inicial e final de aglomerados (clusters) revela:
73 aglomerados iniciais distintos (cerca de 10 aglomerados
estrangeiros);
208 aglomerados finais.
Podem ser usados para eliminar seqncias impossveis de
fonemas:
/tk/ no pode terminar uma palavra, e
/kt/ no pode iniciar uma palavra,
Portanto, */: : : t k t : : :/ uma seqncia impossvel.
39
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Consoantes Iniciais de Palavras a Partir do
Dicionrio MWP
40
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
A slaba
A estrutura das slabas captura muitas generalizaes teis.
A realizao de fonemas depende muitas vezes das slabas.
Muitas regras fonolgicas dependem da estrutura das slabas.
A estrutura das slabas se baseia na noo do posicionamento dos
sons da voz em termos de seus valores de sonoridade.
Exemplos Valores de Sonoridade
Sons
Vogais Baixas
Vogais Mdias
Vogais Altas
Flaps
Lateral
Nasais
Fricativas sonoras
Fricativas surdas
Oclusivas sonoras
Oclusivas surdas
41
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Slabas e Sonoridade
Expresses podem ser divididas em slabas.
O nmero de slabas igual ao nmero de picos de sonoridade.
Dentro de qualquer slaba, existe um segmento constituindo um
pico de sonoridade que precedido e/ou seguido por uma
seqncia de segmentos com valores de sonoridade que
decrescem progressivamente.
42
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Representao Silbica
Ramos marcados por _ so opcionais.
Ncleos devem conter um no ocluisva.
A sonoridade decresce a partir do ncleo.
Um _x contm somente: /s, z, t, d, T, D, C, J/.
Somente a ltima slaba de uma palavra pode ter um _x.
/sp/, /st/, e /sk/ so tratados como nicos obstruente.
43
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Alguns Exemplos
44
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Palavras contendo /r/ e /l/
45
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Realizao Acstica do /r/
46
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Realizao Acstica do /l/
47
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Variaes alofnicas nos contornos silbicos
48
MIT
Teoria Acstica da Produo de Voz 6.345 Sistema de Reconhecimento de Voz
Tarefa 2

Você também pode gostar