Você está na página 1de 5

FFTranscriber: Documentação

Renan Moura

Laboratório de Processamento de Sinais


Universidade Federal do Pará
e-mail: renanmoura@ufpa.br

18 de agosto de 2010

1 Descrição
O FFTranscriber possui agora duas janelas, uma com a edição de áudio e outra com a edição de texto.
O menu de Reconhecimento está localizado na janela correspondente ao editor de texto, ou seja, não
está mais integrado à interface de edição de áudio.
A Figura 1 é um print screen da tela inicial da aplicação sendo que seus principais módulos estão
identificados por legendas.

Figura 1 - Versão Beta da Aplicação

Abaixo segue uma lista descritiva dos itens destacados pelas legendas:

1
Controle de Áudio

• Pausa: pausa a reprodução de áudio e fica no ponto em que parou;


• Reproduzir: Reproduz o som a partir de onde o Cursor estiver. Se houver algum trecho selecio-
nado, apenas ele será reproduzido;
• Parar: para a reprodução de áudio e retorna para o ı́nicio do arquivo;
• Retornar ao inı́cio: move o cursor para o inı́cio do arquivo;
• Avançar até o final: move o cursor até o final do arquivo;
• Gravar: grava o áudio proveniente de alguma entrada como um microfone (para parar a gravação
pressiona-se o botão Parar).

Velocidade do Áudio

• A barra de ferramentas de Velocidade do Áudio permite fazer alterações na velocidade em que o


áudio está sendo reproduzido de sorte que o transcritor tenha mais tempo para digitar à medida
que ouve determinado segmento de voz.

Edição de Áudio

• Representação visual do áudio que, por padrão é a forma de onda. Clicando no nome do arquivo
se encontra do lado do “X” temos então um menu, conforme mostrado na figura abaixo, seguindo
da descrição de cada item:

Mostrador de Volume de I/O

• Mostra a intensidade de saı́da e/ou entrada de áudio, importante para ter certeza de que o
software está detectando o áudio para fazer o reconhecimento.

Volume de I/O

• Regular o volume de entrada e saı́da de áudio

Figura 2 - Menu da área de edição de áudio

2
• Nome: permite renomear o arquivo em que se está trabalhando;
• Mover faixa para cima: quando temos múltiplas faixa abertas permite que determinada faixa se
desloque para cima da outra imediatamente acima;
• Mover faixa par abaixo: quando temos múltiplas faixa abertas permite que determinada faixa se
desloque para baixo da outra imediatamente abaixo;
• Forma de Onda: representação em forma de onda do áudio;
• Forma de Ona (dB): representação em forma de onda em escala logarı́timica;
• Espectro: representação em forma espectral;
• Espectro log(f): representação em forma espectral usando-se a constante de atenuação;
• Tom (EAC): destaca o contorno da frequência fundamental do áudio, com Correlação Realçada
(EAC);
• Mono: saı́da de áudio de apenas uma saı́da ou das saı́das esquerda e direita igualmente;
• Canal Esquerdo: saı́da de áudio somente do canal esquerdo;
• Canal Direito: saı́da de áudio somente do canal direito;
• Fazer Faixa Stereo: se houver outra faixa abaixo da corrente, junta as duas em uma única faixa
stereo de sorte que as alterações feitas são aplicadas tanto ao canal esquerdo quanto ao direito;
• Dividir Faixa Stereo: se o arquivo for stereo, pode-se separá-lo em duas faixas e editá-las inde-
pendentemente;
• Stereo para Mono: converte a faixa de stereo para mono;
• Ajustar Formato da Amostra: define formato da amostra em 16, 24 ou 32 bits;
• Ajustar Taxa: permite selecionar a frequência em Hertz que será usada no projeto.

Edição de Texto

• Mostra uma área em branco para edição de texto e possui uma barra de ferramentas com funci-
onalidades descritas na ordem da esquerda para a direita (nenhuma das funcionalidades desta
barra interfere no áudio, somente no texto):
– Abrir Documento com extensão “.txt”;
– Salvar Documento com extensão “.txt”;
– Cortar: recorta uma parte selecionada do texto;
– Copiar: copia uma parte selecionada do texto;
– Colar: cola um texto que se encontra na área de transferência;
– Desfazer: desfaz a última ação realizada no texto;
– Refazer: refaz a última ação realizada no texto.

Barra de Seleção

• Taxa do Projeto: permite selecionar a frequência em Hertz que será usada no projeto;
• Inı́cio da Seleção: mostra em que ponto o inı́cio da seleção do aúdio está localizado (por padrão
começando em zero quando não há seleção);

3
• Fim/Tamanho: opção de mostrar em que ponto o fim do áudio estã localizado ou quanto do áudio
está selecionado (Tamanho);
• Posição do Áudio: mostra em que ponto o áudio está quando está sendo reproduzido.

Abaixo segue uma lista descritiva de cada item dos menus:

Arquivo

• Novo: abre nova instância da aplicação;


• Abrir: abre janela para escolher arquivo que se deseja abrir. Os formatos de arquivos reconheci-
dos são WAV, AIFF, NeXT/AU, IRCAM, MP3, Ogg Vorbis, MIDI, e o formato de arquivo de projeto
(AUP).;
• Arquivos Recentes: lista de todos os útlimos arquivos abertos;
• Fechar: fechar instância da aplicação;
• Salvar Projeto: salvar projeto para edição futura com uma extensão “.aup”;
• Salvar Projeto Como: abre uma janela com opções de local e forma de salvar o projeto;
• Importar: importar um arquivo de áudio;
• Exportar: exportar o arquivo que está sendo editado para os formatos WAV, MP3 e Ogg Vorbis;
• Exportar Seleção: exportar parte selecionada do arquivo que está sendo editado para os forma-
tos suportados;
• Sair: fecha todas as instâncias da aplicação.

Editar

• Desfazer: defaz a última ação realizada;


• Refazer: refaz a última operação realizada;
• Cortar: recorta a parte do áudio selecionada;
• Copiar: copia a parte do áudio selecionada;
• Colar: insere um determinado segmento de áudio no lugar em que se encontra o cursor;
• Apagar: apagar a parte do áudio selecionada;
• Selecionar: apresenta opções para seleciona todo o áudio ou nenhuma parte dele;
• Remoção de Ruı́do: abre janela para que o realce de voz possa ser realizado.
A remoção de ruı́dos é um processo feito em duas etapas. Na primeira, seleciona-se um trecho
do áudio que contenha só o ruı́do. Então em “Remoção de Ruı́do” e clica-se em “Pegar Amostra
de Ruı́do”. O programa entenderá que esse é o tipo de som que se quer filtrar.
Então seleciona-se todo o áudio onde se quer que o ruı́do seja removido e em “Remoção de
Ruı́do” novamente, clica-se no botão “OK”. O tempo gasto para a remoção dos ruı́dos depende
do tamanho da seleção que for feita.

Ver

• Zoom +: aumenta o zoom do segmento de áudio;

4
• Zoom Normal: retorna o segmento à forma de visualização original;
• Zoom -: diminui o zoom do segmento de áudio;
• Ajustar à Janela: redimensiona a visualização do segmento de forma que este seja exibido
completamente na tela;
• Zoom na Seleção: trata o zoom somente na parte selecionada do áudio;
• Histórico: abre uma janela com um histórico de todas as operações realizadas no projeto.

Reconhecedor (Na janela do editor de texto)

• Ativar: ativa o reconhecedor para transcrição automática;


• Desativar: desativa o reconhecedor para transcrição automática.

Você também pode gostar