Você está na página 1de 1

Manual de uso do script de transcrição de vídeos

Este script foi criado para transcrever o áudio de arquivos de vídeo em


formato .mp4, .avi, .mkv, .mov, .wmv, .flv, .webm para texto usando a API de
reconhecimento de voz Vosk-API. O texto transcrita é salvo em um arquivo .srt.

Para usar o script, siga as etapas abaixo:

Instalação das dependências:


As seguintes dependências precisam ser instaladas para usar este script:

pydub
pysubs2
vosk
Você pode instalá-las usando o seguinte comando pip no terminal ou prompt de
comando:

pip install pydub pysubs2 vosk

Certifique-se de executar este comando no terminal ou prompt de comando antes de


executar o script.

Baixando o modelo de linguagem:


Baixe o modelo de linguagem para o Vosk-API no link a seguir e salve-o em um
diretório: https://alphacephei.com/vosk/models

Executando o script:
Para executar o script, siga as seguintes etapas:

Abra um terminal ou prompt de comando


Navegue até o diretório onde o script criar-srt.py está salvo
Digite o seguinte comando e pressione Enter:

python criar-srt.py

O script solicitará o caminho para o diretório raiz onde os vídeos estão


localizados e o caminho para o diretório do modelo Vosk-API. Certifique-se de
digitar o caminho correto.

O script percorrerá todos os diretórios e subdiretórios buscando arquivos de vídeo.


Para cada arquivo de vídeo encontrado, o script extrairá o áudio do vídeo usando o
FFmpeg, detectará os silêncios no áudio, transcreverá cada trecho não silencioso do
áudio usando Vosk-API em paralelo, adicionará os eventos de legenda ao arquivo
SSAFile (SRT) e salvará o arquivo SRT.

O script removerá o arquivo de áudio extraído após a transcrição ser concluída.

Arquivo SRT gerado:


O arquivo SRT gerado é salvo no mesmo diretório do vídeo e tem o mesmo nome do
vídeo, mas com a extensão .srt. O arquivo SRT contém os tempos de início e fim de
cada legenda e o texto transcrita.

Você também pode gostar