Escolar Documentos
Profissional Documentos
Cultura Documentos
Este documento é a tradução das Guidelines do Cliente para o mercado brasileiro. É de uso EXCLUSIVO da OneForma
by Pactera e sua reprodução ou divulgação não é permitida conforme contrato de NDA.
CONFIDENCIAL
Ortografia e Gramática:
Para a transcrição utilize a ortografia formal seguindo as regras ortográficas em vigor para o
idioma pt-BR. Faça uma verificação ortográfica dos arquivos quando completos antes de realizar o
envio. Para dúvidas sobre palavras consulte o dicionário Michaelis https://michaelis.uol.com.br/.
Para buscar referências sobre nome de filmes, Programas de TV, marcas, pessoas famosas etc.
utilize buscadores como Google ou Bing.
Confidential
Page 1 of 19
Café & chá. Café e chá.
Você é d+! Você é demais!
Regionalismo:
Transcreva pronúncias regionais usando a forma padrão da língua portuguesa, a menos que tais
pronúncias regionais sejam aceitas e estejam presentes nos dicionários formais do nosso idioma.
Frase com Palavra INCORRETA Transcrição CORRETA
O naiscimento foi dia nove. O nascimento foi dia nove.
Desejo um Filiz Natal! Desejo um feliz Natal?
Mas que muié mais linda! Mas que mulher mais linda!
Vai custa mir reais. Vai custar mil reais.
Transcrição esperada
Quero ir para o Canadá.
Vou para o México na quinta-feira.
O e-mail é Lucas Lopes arroba Gmail ponto com.
Acesse a Amazon, por favor.
Mande para Ana arroba Gmail ponto com
Eu trabalho na <initial>IBM</initial>.
Eu me mudei em março.
O nome é J O N A S.
O Brasil faz parte da ONU.
Acrônimos
Acrônimos se referem a palavras ou nome de entidades (empresas, marcas, produtos etc.) que
são formadas por letras iniciais de outras palavras ou sequência de letras. Elas são pronunciadas
como palavras (ex: SUS, OTAN, MEC).
Transcreva os acrônimos como palavras, com letras maiúsculas e sem espaço ou pontos entre as
letras. Também não se deve usar nenhuma tag para diferenciá-la.
Eu trabalho na ONU.
A AIDS tem um grande impacto na sociedade.
Imprime esse arquivo JPEG para mim?
A NASA é uma agência espacial americana.
Inicialismos
Inicialismo se refere a palavras a nome de entidades, marcas e abreviações. Formadas por uma
sequência de letras e tem sua pronúncia soletrada, ou seja, letra por letra.
Exemplo: CPF, CNPJ, INSS, FGTS
Transcreva os inicialismos de acordo com sua forma de escrita usual. Nesses casos, o inicialismo
deve estar no meio das seguintes tags <initial></initial>.
Exemplos:
Confidential
Page 4 of 19
O <initial>INSS</initial> fará um pente fino nas aposentadorias e seguros.
Trabalhadores contratados por <initial>CLT</initial> possuem <initial>FGTS</initial>.
O <initial>ICM</initial>Bio é um órgão ambiental brasileiro.
Não inclua nenhuma tag adicional dentro da tag <initial></initial>. Se uma tag adicional (Ex:
[tosse]) precisar ser utilizada posicione ela antes da tag <initial></initial.
Exemplos:
ERRADO: Quero entrar na <initial>U [cough] FRJ<initial> ano que vem
CORRETO: Quero entrar na [cough] <initial>UFRJ<initial> ano que vem.
Não use <initial></initial> tags para acompanhar uma sequência de letras que não representa
uma palavra com significado. Nesses casos, transcreva-as como sequências de letras.
Veja o exemplo.
"O autor de Senhor dos Anéis é J. R. R. Tolkien " → O autor de Senhor dos Anéis é J. R. R. Tolkien.
(NOT: <initial>J. R. R.</initial>, uma
vez que J. R. R. não forma uma palavra com significado)
Palavras Soletradas:
Similares aos inicialismos, são uma sequência de letras soletradas. Pode ser um nome, palavra,
endereços, e-mails, fórmulas químicas que são faladas letras por letras.
Transcreva as sequências de letras soletradas com letras maiúsculas, cada letra separada por
espaço e sem nenhuma pontuação ou marcação.
Exemplos Adicionais
Confidential
Page 5 of 19
CBN cê bê ene Inicialismo <initial>CBN</initial>
Inicialismo +
CPFs cê pê efes <initial>CPF</initial>s
inflexão (plural)
Acrônimo lido
FAQ fak FAQ
como palavra
Acrônimo lido
VIP Vip VIP
como palavra
Acrônimo lido
PIB Pib PIB
como palavra
Confidential
Page 6 of 19
Contrações
Contração, em gramática, é a junção de duas ou mais palavras com perda de fonema. Contrações
padrões da língua portuguesa devem ser transcritas como são pronunciadas. Veja os exemplos
abaixo:
Pra(s)/ pro(s) Dum/duns/duma(s) Noutro(s)/noutra(s)
nesse(s)/nisso Dalí/daqui/daí
Interjeições
Interjeições são palavras ou expressões que o interlocutor usa no contexto de uma frase para
expressar afirmação, surpresa ou negação.
Para o português, transcrevemos as seguintes interjeições:
ah
ui
ei uau
oh
aff ih
eh
bah hum
ué
nossa oba
oxente
Ixi/vixe ufa
puxa
Eita Uai
Uhum
ai caramba
aham
Atenção:
Interjeições não devem ser confundidas com fillers. Veja na seção Filler.
Atenção redobrada com a interjeição “hum”, que não deve ser confundida com o filler #hum.
Interprete o contexto para diferenciar o uso de um caso ou de outro.
Números
Os números devem ser transcritos como palavras. Sejam eles números cardinais (ex: 1, 2, 3), ou
ordinais (ex: 2ª, 5ª)
Exemplo:
Áudio Transcrição
Confidential
Page 7 of 19
Tocar rádio 104.9 FM Tocar rádio cento e quatro ponto nove <initial>FM</initial>.
O número de série é rtma98 O número de série é R T M A noventa e oito
O número de emergência é 180 O número de emergência é cento e oitenta.
Ele chegou em 5° lugar Ele chegou em quinto lugar.
Nomes Próprios
Nomes Humanos Genéricos
Transcreva nomes de pessoas de acordo com a escrita comum para os nomes do nosso país.
Utilize sempre a forma mais comum em nomes com mais de uma grafia (Luís, Luíz). Caso você não
tenha certeza faça uma busca lateral e em último caso use seu melhor palpite.
Atenção: seja consistente, use a mesma forma de escrever o nome caso ele reapareça no mesmo
arquivo de áudio.
Se o nome falado soar como um nome estrangeiro, não devemos adicionar a tag <lang:Foreign>.
Veja mais detalhes sobre estrangeirismo na seção correspondente.
Catarina/Katarina são duas grafias comuns do mesmo nome humano; eles são igualmente
aceitáveis.
Katharyna é uma grafia incomum do mesmo nome humano acima; deve ser evitado.
Siga o padrão de letras maiúsculas ou minúsculas de acordo com a escrita original da marca ou
nome específico. eBay, iPad, YouTube.
Mantenha os hifens de nomes próprios se eles fazem parte da forma original da escrita.
Vamos para o Chick-fil-A. Quero uma Coca-Cola.
Confidential
Page 8 of 19
Escreva por extenso os números usados em nomes próprios, usando o alfabeto de acordo com a
forma como o interlocutor o diz.
Fala Transcrição
CPM22 é uma banda brasileira. <initial>CPM</initial> vinte e dois é uma banda brasileira.
U2 é minha banda favorita. U two é minha banda favorita.
O jogo é Grand Theft Auto V. O jogo é Grand Theft Auto cinco.
João Paulo II foi canonizado. João Paulo segundo foi canonizado.
Nomes de marcas de origem estrangeira que são adotados comumente no nosso idioma devem
ser transcritos usando a ortografia padrão para o português.
Pontuação
Use apenas apóstrofos, vírgulas, pontos de exclamação, hífens, pontos finais, pontos de
interrogações. Não use outras pontuações comuns do nosso idioma (ex: barra, hashtag, arroba
etc.). Use essas pontuações de acordo com as normas gramaticais da ortografia brasileira.
Use um ponto final ao fim de uma sentença completa que seja uma afirmação.
Ponto final
O trânsito na cidade está intenso.
Use um ponto de interrogação, após uma pergunta direta ou uma tag com
Pontos de entonação de pergunta.
interrogação Não é simples?
Você sabe o que fazer, não sabe?
Confidential
Page 9 of 19
Use vírgulas para pausar longos trechos de fala. Essa pontuação é usada para
facilitar a compreensão do leitor. Abaixo seguem algumas sugestões de quando
uma vírgula deve ser usada:
Para separar itens de uma lista:
Confidential
Page 10 of 19
Use hífen de acordo com as regras de pontuação do nosso idioma. Se você não tem
certeza se uma palavra (ou mais de uma) deve vir acompanhada de um hífen,
consulte os dicionários de língua portuguesa.
Veja alguns exemplos:
Contra-ataque
Hífens
Pré-escola
Sobre-humano
Extra-hospitalar
Vice-versa
Self-service
Cavalo-marinho
E. B. White
Pontos George W. Bush
J. K. Rowling
Quando estiver transcrevendo algo que seja distinto do português, use as pontuações e símbolos
que se aplicam a esse determinado idioma. Isso pode ser aplicado, por exemplo, quando um
interlocutor muda a linguagem para um idioma estrangeiro no meio de um segmento. Nesses
casos, a pontuação estrangeira deve ser respeitada, por exemplo:
Fala disfluente
Enquanto fala, o interlocutor pode sofrer alguma interrupção do ritmo normal da fala. Eles podem
gaguejar enquanto pronunciam, repetir palavras, recomeçar frases e sentenças e usar sons de
hesitação (fillers)
Confidential
Page 11 of 19
Faça o seu melhor para transcrever palavras gaguejadas pelo interlocutor, além das repetições, de
acordo com o que você ouviu. Procure ouvir o segmento mais de uma vez.
"Direção para o… para o… o hotel" --> Direção para o, para o o hotel.
Use a pontuação “til” para indicar palavras truncadas, isso pode ser no início ou no fim da
pronúncia de uma determinada palavra
Fala Transcrição
Ale... Alexa... pare a musi... a música. Ale~ Alexa, pare a musi~ a música.
...lexa...toca Caetano. ~lexa, toca Caetano.
Quero ir para o shop... shopping. Quero ir para o shop~ shopping.
N… n… não. É Ch… Chom… Chomsky quem disse isso" N~ n~ não. Foi Ch~ Chom~ Chomsky quem disse isso.
Filler Words:
Filler são “palavras” que os interlocutores usam para indicar hesitação ou preencher (fill) uma
pausa para poder manter controle da conversa enquanto ele está pensando no que vai dizer em
seguida. Cada idioma tem um conjunto de fillers que os falantes podem usar. Na língua
portuguesa, utilize apenas os fillers elencados aqui nesse exemplo, sempre precedidos por uma
hashtag (#).
Múltiplos Falantes:
Falantes múltiplos devem ser segmentados. Em cada segmento, transcreva a fala de um único
falante escolhido.
Quando os interlocutores se sobrepõem na fala, cada falante identificado deve receber o seu
próprio segmento de fala, que deve apenas conter as palavras transcritas desse interlocutor.
Fazer previamente a segmentação de maneira apropriada e cuidadosa, além da identificação do
interlocutor, é fundamental para minimizar o número de segmentos com interferência extensa de
fala.
Confidential
Page 12 of 19
Fala com Interferência Não-Sobreposta
Quando um segmento de fala contém uma fala não-sobreposta de outros falantes, ou seja,
discurso independente, insira a tag [other-speech], para cada situação em que uma fala alheia
apareça no áudio, independente da compreensão do áudio.
Não transcreva a fala secundária.
A tag [other-speech] aplica-se apenas na fala secundária que não se sobrepõe (ou se sobrepõe
minimamente), com a fala do interlocutor principal.
Exemplo:
Se você mencionar o tamanho do meu escritório (fala audível de um interferente com
sobreposição mínima) eu gritarei.
Se você mencionar o tamanho do meu escritório, [other-speech] eu gritarei.
A TAG [other-speech] é o segundo falante no mesmo áudio (ou terceiro em caso de 3). Você vai
transcrever apenas o falante principal, para qualquer outro falante insira a tag [other-speech].
É possível utilizar outras tags dentro de uma tag overlap (riso, choro, tosse, não compreensível
(()).
Confidential
Page 13 of 19
Se a sobreposição se inicia no meio de uma palavra, insira a tag (<overlap>) de abertura antes
dessa palavra. Da mesma forma, se a sobreposição termina no meio de uma palavra, adicione a
tag overlap (de fechamento) após essa palavra.
Veja os exemplos.
Ex Transcription Content
Eu sei. Okay, ainda há <overlap>alguma pergunta ((então quer fazer uma por uma ))?
1
[laugh]</overlap>
2 <overlap>Não, não, não, não, está tudo bem, está tudo bem</overlap>
Nota: Ignore
Quando estiver transcrevendo uma fala sobreposta, o transcritor não deve gastar muito tempo
tentando selecionar a fala do interlocutor principal e separando-as dos falantes secundários num
segmento. Se o transcritor não consegue distinguir facilmente a fala de cada interlocutor em um
segmento com muita gente falando ao mesmo tempo, considere refazer a segmentação para
facilitar a transcrição, por exemplo:
Divida o tamanho da fala sobreposta em alguns segmentos por fala menores, cada uma visando
gerenciar melhor um conjunto de falantes sobrepostos, ou
Substitua o segmento de fala sobreposta ininteligível, com um único segmento Babble (()),
portanto, removendo a necessidade de transcrever a fala completamente.
Para usar as tags <overlap></overlap> em conjunção com inicialismos e idiomas estrangeiros, veja
sessões correspondentes
Fala Ininteligível
Use parênteses duplos (()) para marcar trechos da fala que são difíceis ou impossíveis de entender
ou de transcrever (quando o falante está, por exemplo, falando muito baixo ou falando ao mesmo
tempo que outra pessoa e não se consegue entender). Deve-se inserir um espaço antes e depois
do parêntese duplo, mas não dentro dos parênteses.
Exemplo:
Confidential
Page 14 of 19
Se você tem um palpite sobre o que foi dito, transcreva o que acha que ouviu dentro dos
parênteses duplos.
Exemplo:
Áudio: Diga-me o que farás hoy y manãna, por favor.
Transcrição: Diga-me o que farás <lang:Spanish>hoy y mañana</lang:Spanish>, por favor.
Se você compreende o idioma pode transcrever a fala, utilizando a ortografia correta do idioma
em questão. Se você não compreender o idioma basta utilizar os parênteses duplo no trecho em
outro idioma (()).
Exemplo:
Áudio: Diga-me o que farás hoy y manãna, por favor.
Transcrição: Diga-me o que farás <lang:Foreign>(())</lang:Foreign>, por favor.
Áudio: Practice makes perfect é o mesmo que a prática faz a perfeição.
Transcrição: <<lang:Foreign>(())</lang:Foreign>, é o mesmo que a prática faz a perfeição.
Confidential
Page 15 of 19
“Loanwords” são empréstimos. Palavras emprestadas de outros idiomas comumente utilizadas no
nosso idioma. Elas devem ser transcritas seguindo a ortografia padrão do português brasileiro.
Não use <lang:Foreign></lang:Foreign> entre essas palavras (emprestadas), uma vez que elas são
aceitas e usadas pelos nossos dicionários. Se não está claro para você se uma palavra é uma
“loanword” ou não, consulte os dicionários como o https://michaelis.uol.com.br/.
Uma palavra que é listada no dicionário possui uma fonte sólida para ser considerada uma
loanword estabelecida, mesmo que ela seja originária de um idioma estrangeiro.
Palavras emprestadas não necessitam da tag, veja os exemplos abaixo.
Exemplo:
Acabou de acontecer um tsunami na Indonésia.
Alexa, receitas para guacamole.
Se o falante estiver falando em nosso idioma padrão e falar em outro idioma e mencionar uma
cidade, país, etc. Nesse contexto a palavra estrangeira deverá ficar dento da tag <lang:Foreign>
tsunamis </lang:Foreign>. Apenas se o falante mudar o idioma, para outros casos não é
necessário.
Exemplo:
Áudio: Quero viajar para New York porque I love New York!
Transcrição: Quero viajar para New York porque <lang:English>I love New York</lang:English>!
Nomes de pessoas ou entidades estrangeiras não devem ter a tag <lang:Foreign></lang:Foreign>
mesmo que a pronúncia tenha a entonação estrangeira.
Caso você não se sinta confiante para transcrever o nome em português, a tag ininteligível (())
pode ser usada.
Exemplos:
Áudio Transcrição
Xi Jinping é um politico chinês. Xi Jinping é um politico chinês.
Confidential
Page 16 of 19
Foi demonstrado por Ramanujan em 1913. Foi demonstrado por Ramanujan em mil novecentos e
treze.
Acho que Zhangjie não vai conseguir vir. Acho que (()) não vai conseguir vir.
Saeid Mohammadpourkarkaragh ganhou ouro em Saeid (()) ganhou ouro em Londres.
Londres.
Use a tag (()) apenas para nomes realmente difíceis e que você não consegue compreender. Para
nomes que são falados com sotaque americano, chinês, russo e são compreensíveis, faça uma
busca e tente transcrever corretamente.
Transcrição:
Non-speech noises
Tags Descriptions
Aquele som que camufla uma palavra considerada profana ou informação sigilosa.
[beep]
Confidential
Page 18 of 19
Música com duração de um ou mais segundos sem ninguém falando no fundo.
Isso inclui música de espera telefônica, músicas ou cantoria.
[music]
Observação: não use essa tag para música tocando de fundo enquanto alguém está
falando.
Silêncio/Pausas
Apesar dos esforços para criar segmentos contínuos, um segmento ocasionalmente pode conter
silêncio ou pausa perceptível, sem fala.
Nesses casos, use a tag [no-speech] para indicar pausas ou silêncio de 2 ou mais segundos,
mesmo em casos em que há barulhos de fundo misturados com a pausa.
Exemplo:
Áudio: Eu não vou (pausa) (respiração) (pausa) falar com ele.
Transcrição: Eu não vou [no-speech] falar com ele.
Confidential
Page 19 of 19