Você está na página 1de 6

DSpeech (por Dimio)

~~~~~~~~~~~~~~~~~~

A vers�o atualizada pode ser encontrada no seguinte link:

Home: "http://dimio.altervista.org/"

DESCRI��O:
~~~~~~~~~~~~

O DSpeech � um programa de TTS (Text To Speech) com funcionalidade de ASR


(Automatic Speech Recognition) integrada. E 'que est� preparado para ler em voz
alta o texto escrito e escolher as frases para Pronunciar de acordo com as
respostas vocais do consumidor. � 'projetado especificamente para dar respostas de
forma r�pida
Poss�i as fun��es de maior utilidade pr�tica que s�o necess�rias para os programas
deste tipo, Mantendo, entretanto, a limpeza do registo do computador e o consumo de
recursos (n�o � Instalado, mas pode ser colocado no menu de contexto, mantendo uma
leveza constante).

As principais caracter�sticas do DSpeech s�o:

1. Permite salvar a sa�da na forma de um arquivo Wav ou Mp3.


2. Permite selecionar rapidamente vozes diferentes e combin�-las para criar
di�logos entre as mesmas.
3. Cont�m um sistema de reconhecimento vocal que, atrav�s de uma linguagem simples
de script, permite criar Di�logos interativos com o consumidor (v�lido apenas para
alguns idiomas).
4. Permite configurar as vozes de forma independente.
5. Atrav�s de etiquetas especiais, permite variar dinamicamente as caracter�sticas
das vozes durante a reprodu��o (Velocidade, volume e frequ�ncia), para inserir
quebras, enfatizar termos ou fazer a ortografia.
6. Permite capturar e reproduzir automaticamente o conte�do da �rea de
transfer�ncia.
7. Suporta todos os mecanismos vocais compat�veis com SAPI 4 e 5, possuindo,
tamb�m, uma s�rie de caracter�sticas secund�rias, entre as quais se destacam:

1. No arranque do programa, permite carregar automaticamente o �ltimo ficheiro


aberto, indo directamente para a posi��o relativa de leitura onde o usu�rio tinha
ficado.
2. Suporta a linha de comando, permitindo ao usu�rioa constru��o de livros em
�udio, sem recurso � interface gr�fica ou para outros fins.
3. Permite especificar o formato da sa�da de �udio, o que pode ser �til em
situa��es muito particulares, quando Existe a necessidade de operar com alguns
arquivos wav de caracter�sticas definidas.
4. Permite criar algumas montagens inserindo, atrav�s de palavras-chave especiais,
alguns elementos nos arquivos wav ou mp3. Isso pode ser �til para apresentar,
durante a leitura, os efeitos particulares como um golpe de tosse, riso ou Tamb�m
do seu filme musical.
5. Quando os mp3s s�o guardados, � poss�vel especificar a qualidade dos mesmos, de
forma a privilegiar as Dimens�es ou a qualidade do resultado.
6. Agora, � poss�vel converter integralmente um texto em mp3 ou dividi-lo em
ficheiros de 5, 10 ou 15 minutos cada.
7. No ficheiro "CustomTAG.TXT", � poss�vel inserir etiquetas personalizadas que
aparecer�o no Menu contextual (por exemplo, as tags expressivas de Loquendo).

TEXTO PARA VOZ:


~~~~~~~~~~~~~~~

Atrav�s do menu contextual (clique direito) � poss�vel especificar com qual das
vozes deve ser lido uma frase, o que facilita a cria��o de di�logos entre
diferentes vozes.
Tamb�m � poss�vel inserir etiquetas especiais que permitem modificar as
caracter�sticas da voz, ao longo da leitura (velocidade, volume, freq��ncia etc).

OP��ES DE �UDIO:
~~~~~~~~~~~~~~

� 'poss�vel especificar a placa de �udio, para redirecionar a sa�da e, acima de


tudo, a taxa de bits das vozes Que est�o a ser usadas. � conveniente tentar sempre
usar a mesma taxa de bits das vozes em uso, caso contr�rio, poder� haver perdas De
qualidade (como se a voz falasse com uma lata).
Em geral, a performance usada pela maior parte das vozes sint�ticas �: "16 Khz 16
Mono Bit",
Enquanto as vozes da Microsoft usam "22 Khz 16 Mono Bit".
Estas performances s�o particularmente importantes pois uma convers�o pode
influenciar os ficheiros Wav ou Mp3.

CONVERS�O EM FICHEIRO WAV OU MP3:


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

� 'poss�vel usar o DSpeech para a convers�o do texto em um arquivo Wav ou Mp3. Se o


formato mp3 for o escolhido, � dada a possibilidade de especificar as
caracter�sticas da compress�o, na verdade, pode ser configurado para privilegiar as
dimens�es, em detrimento da qualidade do �udio do arquivo produzido, ou para obter
uma convers�o equilibrada entre tamanho e qualidade.

EDITAR O TEXTO:
~~~~~~~~~~~~~~~~~~~~

Para al�m das fun��es de edi��o padr�o (encontrar, substituir, cortar etc.), este
programa possui uma fun��o particular, que permite "Remover os retornos in�teis".
Serve para eliminar todos os retornos in�teis que estejam presentes no texto, os
quais poderiam limitar a fluidez da leitura das vozes artificiais. Na verdade,
muitas vezes os textos cont�m retornos, quase desnecess�rios, que afectariam
negativamente a leitura.

CRIA��O DE AUDIOLIVROS:
~~~~~~~~~~~~~~~~~~~~~~~
*/*
O programa suporta Uma s�rie de op��es para a cria��o de audiolivros, de forma
particular, a possibilidade de dividir O texto em v�rios ficheiros com diversas
dura��es. Tamb�m � poss�vel usar a subdivis�o manual do texto em ficheiros.
Neste caso, � necess�rio inserir a palavra-chave #BREAK toda a vez que se deseja
iniciar um novo ficheiro.
Atrav�s do menu "Anexar" � poss�vel unir mais ficheiros de texto, um depois do
outro.
Entre um e o outro, a palavra-chave, #BREAK, de divis�o ser� inserida
#automaticamente para que permita a Subdivis�o dos arquivos separados por texto.
Tamb�m � poss�vel inserir uma pausa no in�cio do texto, de modo que seja mantida a
compatibilidade com leitores de CD ou mp3 mais antigos.

RECONHECIMENTO VOCAL:
~~~~~~~~~~~~~~~~~~

O DSpeech suporta um sistema de reconhecimento vocal que, unido a um simples


sistema de scripts, lhe permite criar di�logos interativos com o utilizador do
tipo:
USU�RIO: "Computador"
PC: "Computador pronto, quem �?"
USU�RIO: "Dimio"
PC: "Bem-vindo ent�o"
Etc.

O sistema de scripts � muito semelhante ao do BASIC, por agora as seguintes


palavras-chave s�o suportadas:

Nota do tradutor:

Dado que o sistema de reconhecimento de voz n�o � v�lido para o idioma portugu�s,
optou-se por n�o proceder � tradu��o das palavras-chave. Caso o utilizador deseje
saber quais s�o, s� ter� que recorrer ao manual (ingl�s ou italiano) para que delas
possa ter conhecimento.

No menu contextual (clique direito), � poss�vel encontrar todas estas PALAVRAS-


CHAVE com exemplos relativos.

TECLAS DE ATALHO:
~~~~~~~~~~

Todas as fun��es da interface apresentam teclas de atalho


F1 = Abre a ajuda
F2 = Leva o foco para o texto
F2 + CTRL = Ir para o bot�o "ler"
F4 = Pausa-Continua.
F5 = Ler-Parar.
F6 = Ler a partir da linha anterior
F7 = Ler a partir da linha corrente
F8 = Ler a partir da pr�xima linha
F9 = Ler desde o in�cio
F11 = Passar para a voz anterior
F12 = Passar para a voz seguinte
F11+SHIFT = Passar para a primeira voz
F12+SHIFT = Passar para a �ltima voz
ESC = Parar.

ALT+LEFT = Ler a linha corrente


ALT+RIGHT = Ler a pr�xima linha
ALT+UP = Ler a linha anterior
ALT+DOWN = Ler a pr�xima linha

ALT+1 = Diminuir o volume.


ALT+2 = Aumentar o volume.
ALT+3 = Diminuir a velocidade
ALT+4 = Aumentar a velocidade
ALT+5 = Diminuir a tonalidade
ALT+6 = Aumentar a tonalidade

CTRL+SHIFT+R = Iniciar/Parar a grava��o


CTRL+SHIFT+P = Tocar/Parar o que foi gravado
CTRL+SHIFT+S = Guardar/inserir o que foi gravado

ATALHOS INTELIGENTES:

Space = Ler-Parar.
Home = Ler a partir da linha corrente
PgUp = Ler a partir da linha anterior
PgDn = Ler a partir da linha seguinte

COMANDOS DE VOZ:

PLAY = Ler.
SPEAK = Ler e activar os comandos de voz.
STOP = Parar.
PAUSE = Pausar.
RESUME = Continuar.
UP = Ler a partir da linha anterior
DOWN = Ler a partir da pr�xima linha.
START = Ler desde o in�cio.
DISABLE = Desactivar os comandos de voz.

LINHA DE COMANDO:
~~~~~~~~~~~~~

� poss�vel especificar um nome de arquivo para abrir e reproduzir automaticamente.


Isso permite executar em autom�tico, Como um script.

SINTAXE:

DSPEECH.ExE [/ Play] [/ Speak] [/ Wav] [/ Mp3] [/ Ogg] [/ Hidden | / HiddenFix]


[FileToSpeech.txt]

INSTRU��ES DE LINHA DE COMANDO:

- Para abrir um ficheiro:

DSpeech.exe source.txt

- Para iniciar uma reprodu��o de ficheiros:

DSpeech.exe / Play source.txt

- ler em voz alta uma frase curta:

DSpeech.exe / Speak Hello!

- Para converter um ficheiro de texto em mp3:

DSpeech.exe / mp3 source.txt [destination.mp3]

- Para converter um ficheiro de texto para ogg:


DSpeech.exe / ogg source.txt [destination.ogg]

- Para converter um ficheiro de texto em wav:

DSpeech.exe / wav source.txt [destination.wav]

CONFIGURA��O DO SISTEMA:
~~~~~~~~~~~~~~~~~~~~

Com o Windows NT / 2000, primeiro precisa instalar o pacote MSIC-SAPI5.1, que pode
baixar da p�gina da Microsoft ou Tamb�m de um dos seguintes links:

Http://aldostools.mysite4now.com/sapi51.msi
Http://www.arlington.com.au/sapi51.msi

Com o Windows NT / 2000, se deseja usar o reconhecimento vocal, tamb�m precisa


instalar o mecanismo para o reconhecimento; Isso pode ser feito a partir da p�gina
da microsoft, baixando o pacote completo, SAPI 5.1 SDKs (60MB), o qual, depois de
instalado, � assumido pelo DSpeech. Tamb�m pode baixar o motor sozinho (30MB) A
partir deste link:

Http://clans.gameclubcentral.com/shoot/SR.zip

O Windows XP / 2003 / VISTA n�o precisa de nada, pois estes mecanismos j� se


encontram inclu�dos nos idiomas que os suportam.

O DSpeech solicita uma resolu��o de ecr� de pelo menos 1024x768.


O DSpeech n�o funciona nos sistemas Windows 9x.

AS VOZES:
~~~~~~~~~~~

O DSpeech, usa as vozes instaladas no sistema, por padr�o.


no Windows XP, existe apenas o Microsoft SAM (em Ingl�s.
se o MS-SAPI5.1 estiver instalado no Windows NT / 2000, ficam dispon�veis Duas
vozes (Mike e Mary) tamb�m em ingl�s.
Os utilizadores do XP podem descarregar aqui:

Http://download.microsoft.com/download/speechSDK/SDK/5.1/WXP/EN-US/Sp5TTIntXP.exe

Estas �ltimas vozes s�o melhores que o Sam, mas muito inferiores �s vozes
comercializadas pelas empresas

Como vozes pagas, de melhor qualidade que as disponibilizadas de forma gr�tis,


encontramos as seguintes:

Acapela (vozes claras e intelig�veis, mas n�o o m�ximo em termos de naturalidade).


Cepstral (apresentam uma qualidade razo�vel, mas os seus pre�os s�o os mais
equilibrados)
Loquendo (muito bom, especialmente em termos de naturalidade e expressividade,
tamb�m apresentam pre�os elevados)
RealSpeak (certamente bom).
VoiceWare (Tamb�m n�o s�o muito ruins, mas n�o s�o italianos).
Ivona (provavelmente o melhor).
Notas:
~~~~~~

Quando um ficheiro de mp3 � inserido no texto, especialmente se tiver grandes


dimens�es, uma pequena pausa pode ser introduzida entre a Reprodu��o da linha
anterior e a reprodu��o do ficheiro de �udio, isso � normal e n�o Constitui um
erro, por�m, quando se guarda o resultado no formato de arquivo wav ou mp3, a
quebra Desaparece completamente.
Para a compress�o em mp3, o codec utilizado � o Blades (www.mp3dev.org), que
corresponde ao arquivo "Lame.exe" inclu�do no pacote.

CODERS:
~~~~~~~
Dimitrios Coutsoumbas (Dimio)
SKYPE: katafratto
ICQ: 145633952
E-MAIL: cyberdimio@gmail.com
HOME: http://dimio.altervista.org/

BETA-TESTERS:
~~~~~~~~~~~~~

Talksina (talksina@gmail.com)

TRADUTOR PORTUGU�S:
~~~~~~~~~~~~~
�ngelo Miguel Abrantes
angelomiguelabrantes@sapo.pt

S. Domingos de Rana, 18:48 26-07-2017

Você também pode gostar