Escolar Documentos
Profissional Documentos
Cultura Documentos
JORGE DAVIDSON
jmdavidson@uol.com.br
jmdrio64@hotmail.com
Skype: Jorge Davidson
1
DÍA 1
8:00 1
TRADUMÁTICA: CONCEITOS BÁSICOS
10:00
10:20 2
FERRAMENTAS DE TRADUÇÃO AUTOMÁTICA
12:00
13:00 3
FERRAMENTAS DE TRADUÇÃO ASSISTIDA
15:00
2
DÍA 2
8:00 1
TRADUÇÃO DE ARQUIVOS INDIVIDUAIS
RECURSOS GERAIS: DA ANÁLISE A TRADUÇÃO
10:00
MEMÓRIAS DE TRADUÇÃO IMPORTAÇÃO E EXPORTAÇÃO
10:20 2
TRABALHO COM PROJETOS E PACOTES
TAGS (ETIQUETAS)
12:00
BASES TERMINOLÓGICAS
14:00 3 AUTOPROPAGAÇÃO
AUTOSUGGEST
15:30 APLICATIVOS SDL OPENEXCHANGE
ALINHAMENTO
15:50 4
CONTROLE DE QUALIDADE
17:30 RECURSOS ADICIONAIS
3
TRADUMÁTICA
MÓDULO I
CONCEITOS BÁSICOS
4
PARA COMEÇAR A
PENSAR
Em 2016:
Language industry: mercado de USD 40
bilhões (45 bilhões estimados para
2020)
Language technology industry: mercado
de USD 28 bilhões
Setor impulsado pela tecnología
Explosão de conteúdo e ferramentas
inédita
5
Fonte: Common Sense Advisory
TRADUMÁTICA
➢ BACKGROUND
6
TRADUMÁTICA
➢ BACKGROUND
Desenvolvimento da ciência e a
tecnologia
Avanço dos meios de comunicação
Incremento das relações
internacionais
Desenvolvimento do comércio
internacional
7
TRADUÇÃO TRADICIONAL
➢ BACKGROUND
Redação perfeita
8
TRADUÇÃO EMPRESARIAL
MODERNA
➢ BACKGROUND
Comunicação entre as empresas e o mundo exterior
Indústria de alta tecnologia
Tradutores
Especialistas em DTP (Desktop Publishing)
Analistas de sistemas
Programadores
Organizações multinacionais
Organizações regionais
Ferramentas de software
Criadas por tradutores técnicos que dominam
ferramentas informáticas
9
TRADUÇÃO
EMPRESARIAL MODERNA
MERCADO ATUAL
10
TRADUÇÃO EMPRESARIAL MODERNA
11
TRADUÇÃOEMPRESARIAL
MODERNA
Elaboração de documentação técnica
multilíngue
Localização de produtos
Exigências do mercado:
Estandardização
Qualidade
Produtividade
Prazos ajustados
Preços
Profissionais capacitados
13
TRADUMÁTICA
14
TRADUMÁTICA
Objetivo:
Proporcionar aos estudantes de
tradução e os tradutores todos os
conhecimentos e habilidades
necessários para aproveitar ao
máximo os recursos, tanto os
específicos da tradução como os de
caráter genérico
16
TRADUMÁTICA
Ferramentas de
tradução
Ferramentas de auxílio a
tradução
Ferramentas de envio e
recepção de documentos
Ferramentas acessórias
para a tradução
Ferramentas gerais
Ferramentas de tradução:
Programas que intervêm no processo
de tradução de forma direta (MT, CAT
Tools) ou indireta (processador de texto,
programas de tratamento de imagem ou
edição)
Programas para conversão de arquivos
18
TRADUMÁTICA
Navegadores
Extensões (The Great Suspender,
OneTab, WebBoost, etc.)
Estratégias de refinamento de busca
20
TRADUMÁTICA
21
TRADUMÁTICA
22
Ferramentas mínimas
necessárias
Microsoft Office (ou similar)
Software de tradução assistida
Conversor de pdf/OCR
23
CONVERSÃO DE PDF
27
CONTAGEM DE
PALAVRAS
Contagem de palavras em arquivos em Word
Contagem de palavras em diferentes formatos
de arquivo
Contagem de palavras em conjuntos de
arquivos de diferentes formatos
CountAnything
FineCount
MÓDULO II
TRADUÇÃO AUTOMÁTICA
29
TRADUÇÃO AUTOMÁTICA
30
TRADUÇÃO AUTOMÁTICA
Ferramentas de tradução
Programas de tradução automática
(MT, Machine Translation)
Programas de tradução assistida
(CAT, Computer-Assisted Translation)
31
TRADUÇÃO AUTOMÁTICA
Americanos e ingleses
35
TRADUÇÃO AUTOMÁTICA
EUROTRA
36
TRADUÇÃO AUTOMÁTICA
Problema: reproduzir o pensamento humano
Compreensão
Nível semântico: palavras fora do contexto
Nível sintático: palavras dentro da frase
Nível pragmático: palavras numa situação ou contexto
determinado
Cinco tipos de conhecimento
Língua de origem
Língua de chegada
Equivalências entre ambas línguas
Conhecimento do campo específico/geral
Aspectos socioculturais
37
TRADUÇÃO AUTOMÁTICA
Tipos:
MT baseada em regras
• Regras linguísticas
• Dicionários / Bases de dados
MT baseada em estatísticas /exemplos /corpus
textuais (Google)
MT híbrida
Adaptive Machine Translation (Lilt)
Neural Machine Translation (Google/MS)
38
Phrase-based MT
39
Phrase-based MT
40
Neural MT
41
Aprendizagem Vs
Memorização
42
TRADUÇÃO AUTOMÁTICA
Abordagens:
MT básica (ou tradução “bruta”)
MT treinada
Básica + glossários / bases
terminológicas
MT com pós-edição
Integração entre MT e TM
43
TRADUÇÃO AUTOMÁTICA
45
TRADUÇÃO AUTOMÁTICA
46 Fonte: http://langtech.autodesk.com/productivity.html
TRADUÇÃO AUTOMÁTICA
47 Fonte: http://langtech.autodesk.com/productivity.html
TRADUÇÃO AUTOMÁTICA
A mitad del largo zaguán del hotel Metade do longo corredor do hotel
pensó que debía ser tarde y se apuró a pensamento que deve estar atrasado
salir a la calle y sacar la motocicleta del e correu para a rua e levar a bicicleta
rincón donde el portero de al lado le no canto onde a porta porteiro
permitía guardarla. En la joyería de la próxima permitido para salvá-lo. Em
esquina vio que eran las nueve menos jóias canto vi que era 08:50, vem
diez; llegaría con tiempo sobrado com muito tempo ele foi. O sol
adonde iba. El sol se filtraba entre los filtrada através do centro de prédios
altos edificios del centro, y él -porque altos, e ele disse para si mesmo de
para sí mismo, para ir pensando, no começar a pensar, nenhuma
tenía nombre- montó en la máquina máquina montada em nome de
saboreando el paseo. La moto saborear o passeio. A moto ronronou
ronroneaba entre sus piernas, y un entre as pernas, e um vento fresco
viento fresco le chicoteaba los chicote as calças.
pantalones.
La noche48boca arriba, Julio Cortázar. Traduzido com Google Translate.
TRADUÇÃO AUTOMÁTICA
O olhar de Gregor virou-se para a janela. O
Gregor’s glance then turned to the window. clima morto - as gotas de chuva caíam
The dreary weather—the rain drops were audivelmente na calçada da janela de metal -
falling audibly down on the metal window o fazia bastante melancólico. “Por que eu não
ledge—made him quite melancholy. “Why estou dormindo um pouco mais e esqueço
don’t I keep sleeping for a little while longer toda essa tolice", pensou ele. Mas isso era
and forget all this foolishness,” he thought. inteiramente impraticável, pois ele estava
But this was entirely impractical, for he was acostumado a dormir no lado direito, mas no
used to sleeping on his right side, but in his estado atual ele não conseguia se colocar
present state he could not get himself into nessa posição. Por mais que ele se atirasse
this position. No matter how hard he threw no lado direito, ele sempre rolava sobre suas
himself onto his right side, he always rolled costas novamente. Ele deve ter tentado cem
onto his back again. He must have tried it a vezes, fechando os olhos para que ele não
hundred times, closing his eyes so that he tivesse que ver as pernas tortuosas e desistiu
would not have to see the wriggling legs, apenas quando ele começou a sentir uma dor
and gave up only when he began to feel a clara e maçante no lado dele que ele nunca
light, dull pain in his side which he had sentira antes.
never felt before.
49
The Metamorphosis, Franz Kafka. Traduzido com Google Translate.
TRADUÇÃO AUTOMÁTICA
Para verificar la versión de Windows, siga los Para verificar a versão do Windows, siga
pasos que se indican a continuación: as etapas abaixo:
Novas possibilidades:
MT interactiva/adaptable/Neural
52
MT COM LINGUAGEM
CONTROLADA
Uso de regras na redação dos textos
para facilitar a tradução automática
CLOUT™: Controlled Language
Optimized for Uniform Translation
TAUS (Translation Automation User
Society)
Conteúdo que, pelo volume e prazo, não seria possível traduzir de outra maneira
Conteúdo criado para melhorar e acelerar a comunicação com clientes globais que
preferem um modelo de autosserviço·
Jost Zetszche
55
TRADUMÁTICA
MÓDULO III
FERRAMENTAS DE
TRADUÇÃO ASSISTIDA
56
FERRAMENTAS DE TRADUÇÃO
ASSISTIDA (CAT TOOLS)
Por qué?
Década de 1980: explosão da informática
(produção e tradução de software)
Do volume de trabalhos de agência dos
últimos 10 anos, o conteúdo médio reutilizou
aproximadamente um 50% de material
prévio (SDL pesquisa realizada entre 2003 e
2005)
57 / 62
FERRAMENTAS DE TRADUÇÃO
ASSISTIDA (CAT TOOLS)
Volumes enormes de
informação repetitiva
Reutilização
Integração
Intercâmbio de informação
58
FERRAMENTAS DE TRADUÇÃO
ASSISTIDA (CAT TOOLS)
60
FERRAMENTAS DE TRADUÇÃO
ASSISTIDA (CAT TOOLS)
MEMÓRIA
DE
TRADUÇÃO
(TM)
AMBIENTE
DE EDIÇÃO
GLOSSÁRIO
(TB)
62
LÓGICA DO FUNCIONAMENTO
Aproveitamento da repetição
Repetição intratextual e intertextual
Memoria de tradução (TM – translation memory)
Segmentação do texto
Armazenamento de pares de segmentos linguisticamente
equivalentes nos idiomas de partida e de destino =
unidades de tradução (TU – translation units)
64
Lógica do funcionamento
TM: Segmentação e adição de TU’s
65
Lógica do funcionamento
TM: Aproveitamento
Memoria de tradução: aproveitamento
Repetições
Segmento (frase) repetido dentro do próprio texto
(ou em vários textos analisados em conjunto)
Correspondência (match)
Relação de similaridade entre a frase que estamos
traduzindo e uma frase armazenada na memória (de
100%
66 até no match)
Lógica do funcionamento
TM: Aproveitamento
Três casos:
Exact match (100%)
o Segmento exatamente igual a outro armazenado na
memória
Fuzzy match (1 A 99%)
o Segmento similar a outro armazenado na memória
(sugestão até 75%)
No match
o Segmento que não guarda similitude com nenhum
outro
67 armazenado na memoria
REPETIÇAO E MATCH
Repetições são aquelas palavras (sempre formando parte
de um segmento, desculpem a reiteração) que aparecem
mais de uma vez no arquivo que estamos traduzindo. Por
exemplo, um manual pode conter a frase: “Desconecte o
aparelho da tomada” (lembrem que eu traduzo para
espanhol!) (5 palavras) antes de explicar cada um dos
procedimentos de manutenção. Isso aparecerá na
contagem como repetição para todas as ocorrências depois
da primeira (que deveremos traduzir). Ou seja, caso a frase
apareça 10 vezes no arquivo (50 palavras no total), na
primeira ocorrência as (5) palavras serão classificadas
como “novas” (no match) e no resto (45 palavras [50 - 5])
como repetição.
68
REPETIÇAO E MATCH
Correspondência (match) se refere à relação de similaridade
entre os segmentos do texto que estamos traduzindo e os que
fazem parte da memória de tradução. Os percentuais, que vão
de 100% match (correspondência total ou segmento exatamente
igual) até No match (sem nenhuma correspondência), indicam o
grau de similaridade (em %) que tem o segmento do arquivo que
estamos traduzindo com o segmento que está na memoria. Ou
seja, um match de 95 a 99% implica que o segmento é muito
similar a outro que existe na memória; um percentual de match
menor indica que o segmento é menos parecido ao que existe
na memória. Retomando o exemplo anterior, se na nossa
memória já estiver o segmento “Desconecte o aparelho da
tomada” e no arquivo que estamos traduzindo ele aparecer 10
vezes, teremos 50 palavras (10x5) como 100% match. Caso o
segmento da memória não seja exatamente igual, mas similar,
isso se refletirá com um % de match X (menor).
69
Lógica do funcionamento
TM: Aproveitamento – 100% match (ou CM)
70
Lógica do funcionamento
TM: Aproveitamento – Correspondência (%)
71
Lógica do funcionamento
Glossário (TB)
Base de dados de termos e seus equivalentes em uma
ou várias línguas
Multidirecional
Por área
Por cliente
73
Lógica do funcionamento
Glossário (TB):
Reconhecimento de termos
74
CAT Tools: Outros recursos e funções
que aumentam a produtividade
• Análise
• Alinhamento
• Integração com tradução
automática
• Texto preditivo
• Trabalho com diversos formatos
• Conversor de PDF/OCR
75
CAT Tools: Análise
• Volume para processar
• Tempo e esforço demandados em função
da repetição
• As palavras nunca são palavras soltas,
mas sempre fazem parte de segmentos!
Elementos
Total Tipo Segmentos Palabras Caracteres Porcentaje Etiquetas
reconocidos
Archivos:2 PerfectMatch 0 0 0 0.00% 0 0
Caracteres/palabra:5.72 Coincidencia de contexto 299 417 2627 5.50% 99 8
Repeticiones 350 947 5048 12.50% 289 131
Repeticiones entre archivos 0 0 0 0.00% 0 0
100% 671 1215 7629 16.03% 147 80
95% - 99% 425 708 4672 9.34% 393 10
85% - 94% 35 165 919 2.18% 34 16
75% - 84% 51 243 1306 3.21% 67 14
50% - 74% 13 64 342 0.84% 13 6
Nuevos 665 3820 20795 50.40% 231 102
76
Total 2509 7579 43338 100% 1273 367
CAT Tools: Análise
Mas na visão das agências...
(USD)
77
CAT Tools mais utilizadas
Classificações possíveis
Com instalação de add-in no Com ambiente de edição
Word próprio
OmegaT
SDL Trados Studio
MemoQ
Wordfast Classic Wordfast Pro
Déjà Vu
Trados 2007 Across
Swordfish
78
CAT Tools mais utilizadas
Wordfast Classic (add-in no Word)
79
CAT Tools mais utilizadas
memoQ e DVX (ambiente de edição próprio,
local)
80
CAT Tools mais utilizadas
Memsource (ambiente de edição próprio,
online)
81
CAT Tools mais utilizadas
Classificações possíveis
Instaladas no PC Na nuvem
MemoQ Wordfast Anywhere
OmegaT Memsource
SDL Trados Studio XTM
Wordfast Classic ABBYY SmartCAT
Wordfast Pro Wordbee
Déjà Vu MateCat
Swordfish
Across
82
CAT Tools mais utilizadas
Classificações possíveis
Pagas Gratuitas
Memsource (€ 20/USD 27)
MemoQ Translator Pro (€ 372) Wordfast Anywhere
Fontes: TGB – Translator group buying, do Proz; distribuidores do SDL Trados Studio
para Brasil e83
América Latina; sites das empresas. Dados obtidos em 30/05/2015.
CAT Tools : em resumo
• CONSISTÊNCIA • QUALIDADE
• TM • Recursos de
controle de
• Glossários
qualidade
• PRODUTIVIDADE • MERCADO
• Repetição • TRABALHO EM
• Automatização EQUIPE /
de tarefas COLABORAÇÃO
• Previsibilidade • Servidor
(análise) • Intercâmbio
84
• Organização
Como escolher sua CAT Tool?
• Avaliar a nossa
• Investimento, não capacidade técnica
despesa
• Acompanhar discussões
• Não sair correndo para
em blogs, grupos do FB,
comprar nada
etc.
• Pensar nas
necessidades • Comparar (Software
• Rumo a padronização:
Comparison Tool – Proz)
XLIFF (XML • Testar, testar, testar, testar
Localization • Evitar raciocínios tipo
Interchange File SPFC X Corinthians ou
Format), TMX “cool”/”hipster” X
(Translation Memory mainstream/démodé
eXchange), TBX
(TermBase Exchange) • Observar as exigências do
mas... mercado
A melhor ferramenta é aquela que você mais gosta,
domina85 e satisfaz as suas necessidades.
FERRAMENTAS DE TRADUÇÃO
ASSISTIDA (CAT TOOLS)
Vantagens
Consistência: uniformidade terminológica
Layout
Maior velocidade
Redução de custos
Previsibilidade (análise)
Intercâmbio de memórias
Trabalho em equipe
Mercado (agências)
Desvantagens
Perda de visão da totalidade do texto (segmentação)
Investimento
Necessidade de treinamento
Diversidade de ferramentas e problemas de compatibilidade
86 / 62
RECONVERGÊNCIA
ENTRE MT E TM
Jost Zetzche
ATA – LANGUAGE TECHNOLOGY
DIVISION
87
Reconvergência entre MT e
TM
1990 – Os caminhos se dividem
TM – Trados – Dèja Vu
MT - Ineficiente
88
Reconvergência entre MT e
TM
1- SDL TRADOS
Mistura de TM e MT
Freetranslations.com
o Conexão a MT com memória
personalizada
o Nova habilidade para desenvolver:
o Editar traduções automáticas
89
Reconvergência entre MT e
TM
Combinação entre TM e MT
Memória coletiva
90
TRADUMÁTICA
MÓDULO IV
Wordfast Anywhere
SDL TRADOS STUDIO
91
Wordfast Anywhere
Vantagens
Limitações
92
Wordfast Anywhere
Manual:
https://www.wordfast.net/w/index.php/
Wordfast_Anywhere_Manual
Criação de TM (memória de tradução)
e Glossário
93
Wordfast Anywhere
Controle de qualidade
Descarga do arquivo
Verificação final
94
Wordfast Anywhere
Atalhos:
Começar/Próximo segmento: Alt+
95
TRADOS
96
SDL TRADOS STUDIO
97
CAT TOOLS MAIS UTILIZADAS
Fonte:http://prozcomblog.com/2013/03/28/cat-tool-use-by-translators-
98 what-are-they-using/ (3000 tradutores)
CAT TOOLS MAIS UTILIZADAS
Fonte:http://prozcomblog.com/2013/03/28/cat-tool-use-by-
translators-what-are-they-using/ (3000 tradutores)
Tradução automática e
qualidade
Silvio Picinini
100