Você está na página 1de 12

Must University/2018

Formas de Multimídia: Som


DESIGN EFFECTIVE MULTIMEDIA INSTRUCTION - EDU609 - 3.2
Formas de Multimídia: Som • 2/14

Formas de Multimídia: Som

Conteúdo organizado por Tatiana dos Santos do livro An Introduction to Digital


Multimedia, Second Edition, publicado em 2014 por Jones & Bartlett.

Objetivos de Aprendizagem
• Reconhecer a importância do recurso de som para os projetos multimídia.
• Conhecer as diferentes possibilidades de uso de sintetizadores de voz.
Formas de Multimídia: Som • 3/14

Introdução
Assim como a flexibilidade do texto foi aprimorada por suas associações com
gráficos, ele também tem sido beneficiado por suas conexões recentemente
desenvolvidas para o som.
A interconexão de texto e som apresenta duas formas principais: reconhecimento
de fala e síntese de fala. No reconhecimento de fala, o software especializado
analisa os padrões de som da fala humana para identificar palavras individuais. Esses
padrões podem então ser convertidos no texto correspondente e exibidos na tela
como se o usuário digitasse as palavras. Programas como Dragon Naturally
Speaking permitem aos usuários falarem o texto que gostariam de escrever em um
microfone conectado ao computador. O sucesso desses programas depende de
técnicas desenvolvidas em outra área da informática, a inteligência artificial.

Texto e som

O reconhecimento de voz continua a ser qualificado, mas, devido às variações entre


as vozes dos oradores, programas de reconhecimento de voz por vezes requerem
ajustes, como separar cuidadosamente as palavras com pausas, ou ‘formação’
do sistema para responder corretamente, falando para ele palavras ou frases
específicas.
Na síntese de voz, o texto recebe voz (áudio). O software especializado é usado
para analisar o texto para os elementos distintivos de sons de fala que compõem a
linguagem falada. A síntese de fala tem sido amplamente desenvolvida. Os textos
impressos (que são digitalizados para utilização do recurso) são “lidos” para os
cegos, e este se tornou um grande recurso de acessibilidade.
Formas de Multimídia: Som • 4/14

A assistência de diretório é automatizada, assim como uma ampla gama de sistemas


de pedidos de marketing por telefone. Recursos de texto para voz (TTS)
fornecidos no OS X e Windows podem sintetizar o discurso a partir de qualquer
texto selecionado, bem como ler alertas do sistema. Os usuários podem selecionar
uma variedade de vozes e taxas de fala. O Windows e o OS X também suportam o
reconhecimento de fala. Os usuários podem controlar diretamente determinadas
operações do computador por comandos de voz, como “Alternar para o Microsoft
Word” ou “Obter meu correio”.
Estudos sobre sistemas de voz foram fundamentais para o desenvolvimento de
softwares leitores de telas. O leitor de telas é um programa que, interagindo
com o sistema operacional do computador, captura toda e qualquer informação
apresentada em forma de texto e a transforma em áudio utilizando um sintetizador
de voz. A pessoa com deficiência visual pode ouvir tudo o que está sendo mostrado
em texto conforme navega pelo sistema e/ou utiliza os comandos do programa.
Atualmente, são quatro os leitores mais usados pelas pessoas com deficiência
visual, a saber: NVDA, Virtual Vision, Jaws e F123.
O NVDA (NonVisual Desktop Access) é um leitor de telas livre e gratuito, criado no
ano de 2006. Entre as características mais importantes do NVDA está a utilização
de síntese de voz em mais de quarenta idiomas, incluindo o português. Outra
característica que o diferencia dos demais leitores é sua portabilidade, ou seja, é
possível instalá-lo no desktop ou ainda fazer uma cópia portátil, em pen drive ou em
outra mídia, para usá-lo em qualquer computador.
Formas de Multimídia: Som • 5/14

O Virtual Vision é considerado um dos


principais softwares brasileiros utilizado
por pessoas cegas. Foi desenvolvido pela
Micropower, em São Paulo, com o
objetivo de propiciar ao usuário acesso
às ferramentas do ambiente Windows. É
comercializado, contudo, algumas
instituições o distribuem gratuitamente
para usuários cegos.
O Jaws é um software desenvolvido nos
Estados Unidos e mundialmente
conhecido como o leitor de tela mais
completo e avançado. Possui uma ampla
gama de recursos e ferramentas com
tradução para diversos idiomas, inclusive
para o português. No Brasil, não há
alternativa de subvenção ou distribuição
gratuita do Jaws, que é
o mais caro entre os leitores de tela
existentes no momento (Brasil, 2007).
O F123 é um software desenvolvido
no Brasil que possibilita acesso à
informação e à educação, favorecendo
oportunidades de trabalho e a
utilização de tecnologias por pessoas
com deficiência visual. Auxilia a
navegação na internet, o trabalho com
documentos e planilhas eletrônicas, e-
mails e mensagens instantâneas em
qualquer computador. É
comercializável, porém, segundo
seus idealizadores, com um custo
muito inferior aos demais softwares
disponíveis no mercado.
Existem dois principais tipos de aplicações de som para o desenvolvimento
multimídia: amostrados e sintetizados.
Sons amostrados são representações digitais de fontes de som analógicas
capturadas a partir de microfones ou outros dispositivos. As configurações do
software controlam o formato de som da gravação de som. Sons amostrados podem
ser editados em uma ampla variedade de maneiras, tais como corte para eliminar o
espaço morto, splicing para combinar segmentos de som, ajuste fade-in e fade-out
(envolvente), ajuste de volume e adicionar efeitos especiais, como ecos ou
reversões de som. No programa de edição Audacity, o som analógico é gravado
para um ficheiro digital e editado. Os efeitos especiais podem ser aplicados e faixas
adicionais podem ser inseridas e misturadas para criar um arquivo de som para um
projeto multimídia, por exemplo.
Formas de Multimídia: Som • 6/14

Sons sintetizados são criados a partir de aplicativos que usam comandos digitais
para gerar sons. Esses comandos podem ser capturados a partir de um instrumento
MIDI, como um teclado eletrônico, ou desenvolvidos com um programa
sequenciador. Usando um programa sequenciador, como Cakewalk ou
GarageBand, os desenvolvedores podem inserir anotações de música, determinar
instrumentos para tocar, tocar músicas de camada para alcançar um efeito de
orquestra completa e sincronizar faixas sonoras para tocar uma rica partitura
musical. O arquivo musical é salvo e reproduzido no computador de sintetizador,
um dispositivo eletrônico para gerar som. As aplicações MIDI são uma boa fonte de
música original para aplicações multimídia.
Sons amostrados e sintetizados têm diversas vantagens sobre os formatos
tradicionais analógicos. Estas incluem cópias de alta qualidade, durabilidade, acesso
aleatório e facilidade de edição e distribuição. O som tornou-se um elemento
essencial em muitas aplicações multimídia e é amplamente distribuído através da
internet, como downloads ou streaming de áudio.
Os desafios do som digital tornam particularmente importante para os
desenvolvedores considerarem cuidadosamente se o som atende aos seus
propósitos e às suas aplicações, e as técnicas que utilizam para otimizar a qualidade
e a eficiência do som multimídia.
Formas de Multimídia: Som • 7/14

Saiba Mais

Para saber mais sobre este tema, leia os artigos indicados a


seguir:
“Introdução à computação musical.” Disponível em: <https://
bit.com/9k8a>. Acessado em 14 de setembro de 2023.
Avaliação de Sintetizadores de Voz Aplicados em Livros Digitais
Como Apoio a Deficientes Visuais”. Disponível em: https://bit.ly/8ja7
Acessado em 14 de setembro de 2023.
Assista a estes vídeos para entender mais sobre sintetizadores.
“O que são sintetizadores? Aula do curso sintetizadores e síntese
subtrativa.”

Disponível em: <https://www.youtube.com/watch?


v=LEUtGhYygak>.
Formas de Multimídia: Som • 8/14

Saiba Mais

“Programas de computador ajudam deficientes a se


comunicarem e se informarem.”

Disponível em: <https://www.youtube.com/watch?


v=L1NjZASQWUg>.

Em resumo

A interconexão de texto e som se apresenta de duas formas principais:


reconhecimento de fala e síntese de voz. Os recursos que relacionam texto e som,
por meio das formas citadas, permitem ouvir o texto escrito e propiciam o acesso à
informação para pessoas com deficiência visual. No e-learning, o uso de texto e som
é uma alternativa para os diferentes estilos de aprendizagem.
Formas de Multimídia: Som • 9/14

Na ponta da língua

Link Sugerido na Aula


Uso dos Leitores de Tela

Disponível em: <https://www.youtube.com/embed/0kqowip139A>.


Formas de Multimídia: Som • 10/14

Referências Bibliográficas
Brasil. Atendimento Educacional Especializado: Deficiência Visual. Brasília, MEC,
2007.
Savage, T. M. and Vogel, K. E. (2014) An introduction to digital multimedia. 2. ed.
Burlington: Jones & Barlett Learning
Formas de Multimídia: Som • 14/14

Você pode acessar o livro base deste tema


na Biblioteca Lirn:
An Introduction to Digital Multimedia, Second Edition
T. M. Savage and K. E. Vogel
Jones and Bartlett Learning © 2014

Imagens: Shutterstock

Você também pode gostar