Escolar Documentos
Profissional Documentos
Cultura Documentos
Niterói – RJ
Janeiro / 2017
Sumário
Introdução .................................................................... Erro! Indicador não definido.
2. Características da voz .............................................. Erro! Indicador não definido.
3. Codificadores paramétricos .................................................................................... 3
3.1 Codificadores LPC (Linear Predictive Coding) ...................................................... 3
3.2 Codificadores híbridos ........................................................................................... 4
3.2.1 Codificadores RPE (Regular Pulse Excitation) ................................................... 4
3.2.2 Codificadores MPE (Multi-Pulse Excitation) ....................................................... 6
3.2.3 Codificadores CELP(Code-Excited Linear Prediction) ....................................... 6
3.2.3.1 - Janelamento do sinal de voz ........................................................................ 7
3.2.3.2 - Filtro de Síntese 7
Referências ............................................................................................................... 13
Agradecimentos ........................................................................................................ 14
1
Introdução
Tendo em vista o constante avanço tecnológico, o controle de dados tem
demandado cada vez mais poder de processamento e capacidade de
armazenamento. Com a necessidade de espaço, velocidade, integridade e
segurança das informações, somos direcionados aos estudos da compressão dos
dados. Necessitando transmitir certa informação, é preciso que se tente enviar
sempre o menor número de bits possível, não apenas para diminuir o tempo de
transmissão mas também os seus custos.
Para a compressão de dados, existem técnicas para certos tipos de dados,
tais como voz, imagem ou texto. Porém neste trabalho iremos falar sobre a
compressão de voz, que muitas vezes é designada de codificação de voz. Na
maioria das vezes esses métodos são baseados em algoritmos com perdas de
dados, porém essa perda não é perceptível ao ouvido humano.
Existem tipos de codificadores diferentes, os baseados na forma de onda do
sinal e os que são analisados na fonte do sinal.Portanto será abordado no trabalho
os codificadores que analisam a fonte do sinal, no caso, são projetados para
funcionar sobre um tipo específico de sinal de entrada, e utilizam este tipo de
entrada para modelar o sinal da fonte.
Os codificadores paramétricos que se baseiam em modelos matemáticos do
aparelho fonador, das características da voz e da fala para aproximar o sinal de voz
são conhecidos como vocoders. Os vocoders apresentam taxas de codificação bem
abaixo das oferecida pelos codificadores de forma de onda, ideal para telefonia
móvel. Historicamente os vocoders começaram a ser implantados na telefonia móvel
a partir da segunda geração (2G), quando ocorreu a digitalização das redes
celulares.
2. Características da voz
A fala humana pode ser dividida entre dois grupos, os sons vocálicos e os não
vocálicos. O primeiro (origina-se de um sinal excitado oriundo dos pulmões e cordas
vocais que abrem e fecham em diferentes frequências, modulando o ar que passa
que por sua vez é filtrado pelo trato vocal (garganta, língua, cavidade nasal e
lábios))*, já os sons não vocálicos são oriundos de uma turbulência de ar que nasce
nos pulmões e que é filtrada também pelo trato vocal, as cordas vocais não
participam da geração desse tipo de som.
Os dois sinais(vocálicos e não vocálicos), se diferenciam justamente na
participação das cordas vocais. Enquanto nos sons vocálicos com por exemplo, na
pronúncia das vogais, a variação de tensão muscular sobre as cordas vocais faz
com que as mesmas vibrem em torno de frequências específicas(frequências
fundamentais) gerando pulsos de ar periódicos que por fim chegam ao trato vocal,
2
nos sons não vocálicos como na pronúncia de letras como o “f” e o “s”, não existe
nenhuma frequência fundamental no sinal de excitação que chega ao trato vocal,
tendo o som gerado apenas por alguns diferentes bloqueios gerados no próprio
trato, podendo em diversos lugares entre a glote e a boca, gerando turbulência, o
que é considerado como uma fonte de ruído de amplo espectro, logo a excitação
neste caso pode ser considerada um ruído branco. Tal diferenciação dos tipos de
sinais é de grande importância para o estudo dos codificadores paramétricos.
Os sinais de fala como já dito podem ser divididos entre vocálicos e não
vocálicos porém, em certos casos eles se situam entre estas formas, aliando ao fato
de que o processo de fala contínua ser composto por conjunto de sinais de áudio
complexos, torna o trabalho de produzi-los artificialmente complexo. Outro fato que
demonstra a dificuldade desse trabalho é a observação de que um som vocálico
quando sussurrado também não possui frequência fundamental na excitação.
3
3. Codificadores paramétricos
Neste item estamos interessados em introduzir os conceitos teóricos que são
base dos modelos e dos vocoders. Os parâmetros dos modelos podem ser
determinados de diversos métodos pelo codificador, usando técnicas no domínio do
tempo ou no domínio da frequência.
(a) Codificador
(b) Decodificador
A chave na figura não existe no programa, ela serve para ilustrar o sistema.
Conclusão
Referências
[1] http://www.midiacom.uff.br/~debora/fsmm/trab-2004-1/voz.pdf
[2] http://monografias.poli.ufrj.br/monografias/monopoli10002916.pdf
[3] file:///C:/Users/victor/Desktop/carvalho-dias2000_vocoders.pdf
[4] http://www.morgadinho.org/vocoder/vocoder-doc/node2.html
[5] https://www.gta.ufrj.br/grad/10_1/codec/Tecnicas_de_Codificacao.html
14
[6] http://www.radio-electronics.com/info/cellulartelecomms/gsm_technical/audio-
codecs-vocoders-amr-celp.php
[7] https://en.wikipedia.org/wiki/Vocoder
[8] Livro Discrete-Time Processing of Speech Signals (IEEE Press Classic Reissue)-
John R. Deller Jr., John H. L. Hansen, John G. Proakis.
Agradecimentos
Ao Prof. José Panaro pelas aulas, a todos os membros do grupo por seu
engajamento e a família e amigos pelo suporte.