Escolar Documentos
Profissional Documentos
Cultura Documentos
profissional da língua 4
4.1. INTRODUÇÃO
evolução. Assim, cada ramo da lingüística tem seu próprio conjunto de aplicações informáticas
através das quais pode otimizar ou realizar diretamente suas atividades.
Entretanto, os diferentes tipos de necessidades que podem surgir para indivíduos e comunidades
dentro do mesmo ramo da linguística levaram, na maioria dos casos, à fragmentação do mercado
e ao surgimento de uma grande variedade de ferramentas com funções semelhantes, mas com
diferenças entre elas que podem levar o profissional da língua a fazer uma série de perguntas que
já foram levantadas ao longo deste material de estudo. Quais são as ferramentas certas para o
desempenho de uma determinada atividade profissional? Que fatores podem determinar a
escolha de uma ferramenta em detrimento de outra? Mais uma vez, estas são perguntas que
somente o profissional pode responder com base em suas próprias necessidades.
Por esta razão, o objetivo deste capítulo é apresentar alguns dos tipos de ferramentas mais
utilizados nos diferentes ramos da linguística e comparar, em casos específicos, a gama de
aplicações disponíveis. Como há tantas aplicações quanto necessidades específicas que a
comunidade profissional tem sido capaz de encontrar, é impossível listar todas elas, de modo que
somente aquelas com uma porcentagem considerável de uso e que, na medida do possível e
graças à sua simplicidade técnica, podem ser utilizadas por todos os profissionais da língua,
independentemente do seu perfil, serão levadas em consideração.
55
Ferramentas para o profissional da língua
“Um texto é uma unidade de linguagem em uso. Não é uma unidade gramatical, como
uma cláusula ou uma frase; e não é definida por seu tamanho [....] Um texto é melhor
considerado como uma unidade semântica; uma unidade não de forma, mas de
significado”.
A tarefa mais básica que um profissional pode enfrentar em seu dia-a-dia ao lidar com textos é sua
elaboração, especialmente textos escritos. Os textos são criados espontaneamente ao longo do
dia: ao cumprimentar alguém, ao pedir uma xícara de café em um bar, ao sinalizar para outra
pessoa para deixá-la entrar, etc., mas também são criados voluntariamente: ao escrever uma nota
para lembrar de algo, ao incluir uma mensagem em uma rede social, ao escrever um e-mail, ao
programar um aplicativo de computador, etc. Qualquer que seja sua finalidade, é mais provável
que ao longo de seu dia de trabalho um profissional de praticamente qualquer especialidade
produza voluntariamente, além dos textos orais necessários à comunicação com outras pessoas,
um ou mais textos escritos (com a exceção, obviamente, daqueles de natureza física onde a
produção de material escrito não é necessária).
A computação, como já feito com papel e posteriormente com impressão, facilitou o processo de
redação de textos e forneceu as ferramentas necessárias para que qualquer tipo de usuário possa
realizar todas as fases de sua produção, desde a codificação no formato de representação
escolhido até o formato para posterior publicação ou impressão. Além disso, com o crescimento
da Internet, surgiram ferramentas de processamento de texto online que permitem o
processamento de texto de qualquer computador através de um navegador da Internet,
eliminando a necessidade de transferir o arquivo e resolvendo o problema de possíveis diferenças
de software entre uma máquina e outra.
56
Embora haja uma grande variedade de ferramentas de processamento de texto com objetivos
muito diferentes, há dois tipos principais, dependendo das opções de formatação que oferecem:
editores de texto e processadores de texto. As características de cada um desses tipos e exemplos
de cada um são dadas abaixo, bem como os possíveis usos que eles podem ter para o profissional
do idioma.
Os editores de texto são ferramentas que permitem a elaboração e edição de arquivos de texto
puro (ou texto puro), que consistem em uma seqüência pura de códigos de caracteres
não-formatados. Além disso, os únicos caracteres de controle que aceitam este tipo de editor são
tabulação, quebra de linha e quebra de página. Portanto, neste tipo de editor, não é possível
configurar opções de estilo (como tamanho da fonte, tipo ou cor), nem incluir imagens, tabelas e
outros elementos que não correspondem aos caracteres do conjunto de caracteres (ASCII, UTF-8,
etc.) utilizados.
Com base no tipo de texto para o qual eles são orientados e nas funções que incorporam como
base, os editores de texto podem ser classificados de acordo com sua especialização:
• Os editores de texto simples são aqueles que não têm nenhum propósito especializado e
incorporam apenas as funções mais básicas. Na maioria dos casos, eles não têm funções
tais como transformação de codificação ou destaque de sintaxe. Os exemplos mais comuns
são o Notepad do Windows ou os editores UNIX Pico, Nano e Vi. O OS X inclui TextView, um
híbrido entre um editor de texto e um processador de texto que lhe permite aplicar opções
básicas de formatação como negrito, itálico ou sublinhado.
57
Ferramentas para o profissional da língua
• Os editores sem distração são editores de texto simples cuja interface foi projetada de
forma minimalista, evitando a inclusão de barras de ferramentas e outras opções, para que
o usuário possa se concentrar apenas na redação do texto. Alguns exemplos desses
editores são ZenWriter, FocusWriter ou LightWrite.
• Os editores de código fonte incluem funções para facilitar e otimizar o uso de linguagens de
programação. Normalmente, elas incluem destaque de sintaxe, auto-completamento e
opções de navegação por código. Alguns exemplos destes editores são Emacs, Notepad++ e
SublimeText.
• Os editores da web são muito semelhantes aos editores de código fonte, mas estão focados
em linguagens de programação web, tais como HTML, XML e CSS. Além das funções
relacionadas ao processamento do código fonte, elas freqüentemente incluem opções de
visualização do resultado final em um navegador ou na própria aplicação. Os exemplos mais
comuns desses editores são Adobe Dreamweaver e Microsoft ShareStudio, embora muitos
dos editores de código fonte e processadores de texto permitam a exportação para formatos
web.
• IDEs (ambientesintegradosdedesenvolvimento) são conjuntos de editores para código fonte
e outras aplicações para controlar todas as fases do processo de programação de uma
Figura 4.1. Interface com Brackets, editor de texto da Adobe especializado em linguagens de
programação web, com destaque de sintaxe habilitado
58
Outra característica comum deste tipo de editor é sua extensibilidade, pois geralmente permite a
instalação de complementos, próprios ou de terceiros, que servem para ampliar suas funções por
padrão. Por exemplo, em um editor de código fonte é possível instalar novas definições de sintaxe
para destacar ou autocompletar no caso de aparecer uma nova linguagem de programação.
Para o profissional da língua, os editores de texto podem ser usados para produzir textos que não
requerem formatação ou que serão importados posteriormente para outra aplicação que requer
uma certa sintaxe e não aceita formatação (por exemplo, ao importar um banco de dados de
terminologia para um programa de tradução assistida por computador). Os profissionais de ramos
da lingüística diretamente relacionados à computação, como a lingüística computacional,
freqüentemente usam esses editores como sua principal ferramenta.
Além das opções básicas de formatação que permitem alterar a forma do texto (fontes, cores,
pesos, tamanhos, etc.), os processadores de texto incluem outras características avançadas que
permitem maior controle sobre a aparência final do texto. Entre outros, alguns dos mais
destacados são:
59
Ferramentas para o profissional da língua
Processadores de texto, juntamente com navegadores de Internet e gerentes de e-mail, são uma
das ferramentas mais utilizadas no dia-a-dia de qualquer pessoa e seu uso se estende à
educação, negócios, jornalismo, redação e praticamente qualquer profissão hoje em dia na qual o
processamento de texto é necessário. Algumas dessas ferramentas incluem características que
permitem que elas sejam utilizadas para outras funções, como desenvolvimento ou layout da web,
embora não com a mesma flexibilidade que as ferramentas especializadas permitem, mas que as
tornam adequadas para uma gama mais ampla de usuários.
O processador de texto mais popular é o Word, da suíte Microsoft Office, e o formato proprietário
DOC (e sua variante atual DOCX) é o formato de referência para muitas outras ferramentas que
trabalham com textos e podem importar ou exportar arquivos de texto, tais como ferramentas de
tradução assistida por computador. Entretanto, existem outras alternativas, tanto proprietárias
quanto de código aberto, e tanto pagas e gratuitas, como o Writer das suítes OpenOffice e
LibreOffice que, embora utilize o formato ODT gratuito por padrão, é compatível com outros
formatos, incluindo o DOC. Outro exemplo é o Google, que oferece gratuitamente a seus usuários a
suíte Drive online, que inclui um processador de texto conhecido como Docs que não tem
formatação própria, mas aceita muitos outros, inclusive os mencionados acima. Entretanto,
deve-se levar em conta que a compatibilidade entre essas aplicações não é total e, às vezes,
60
Para os profissionais da língua, os usos a que este tipo de ferramenta pode ser aplicada são os
mesmos que para outros profissionais: a elaboração de textos complexos para publicação ou
impressão. Além disso, como mencionado acima, os tipos de arquivo produzidos por estas
aplicações são os preferidos pelas empresas e clientes e são os formatos padrão em muitas
outras ferramentas. Por exemplo, algumas ferramentas de tradução assistida por computador,
como o SDL Trados ou OmegaT, utilizam preferencialmente este tipo de arquivo para obter as
cordas de texto a serem traduzidas, embora aceitem muitos outros tipos.
Algumas das características incluídas nestes processadores de texto são especialmente úteis para
algumas das profissões relacionadas à linguística, tais como tradutores e revisores, que podem
usar verificadores ortográficos e gramaticais como ferramentas de apoio para facilitar sua tarefa.
Outras opções menos óbvias, tais como criar modelos com estilos predefinidos ou criar macros,
podem ajudar a otimizar o processo de trabalho.
Como mencionado acima, uma das grandes vantagens das tecnologias de automação da
informação é a possibilidade de processar grandes volumes de dados com o mínimo ou nenhuma
intervenção humana. Neste sentido, a TI tornou possível que tarefas como classificação,
catalogação ou indexação de informações, que geralmente requerem um alto investimento em
recursos humanos, sejam realizadas em questão de segundos, hoje em dia. As grandes coleções
de cartões de bibliotecas e arquivos deram lugar a arquivos de apenas alguns MB que podem ser
carregados na palma da mão e podem ser alimentados com o mínimo esforço. Isto se torna ainda
mais evidente se considerarmos a Internet como o que ela realmente é, um repositório de
informações de enormes proporções que serviços como motores de busca ou diretórios estão
encarregados de catalogar e indexar constantemente.
A facilidade com que as informações podem ser consultadas na Internet tornou popular entre
seus usuários o slogan “Se não está na Web, não existe de todo”. Embora este slogan já tenha
sido provado como falso (Stevens-Rayburn, S.; Bouton, E., 1998), ele serve como exemplo para
demonstrar o poder da rede de redes para encontrar informações e a concepção que as pessoas
têm delas: praticamente tudo pode ser pesquisado e encontrado porque a Web coloca o mundo
inteiro ao alcance de um clique. Obviamente, muitas das informações disponíveis e que aparecem
nos resultados da busca não são muito relevantes e são consideradas como ruído, mas mesmo
assim há informações relevantes suficientes para considerar a Internet como uma das principais
fontes de consulta de informações em qualquer campo.
61
Ferramentas para o profissional da língua
Não se deve esquecer que, embora a Internet seja o principal meio de consulta, existem recursos
off-line que também servem ao mesmo propósito e podem até ser gerados pelos usuários para
sua exploração pessoal. Como será visto abaixo, algumas ferramentas diretamente relacionadas à
lingüística, tais como ferramentas de tradução assistida por computador, têm seus próprios
bancos de dados e métodos de indexação e consulta. Entretanto, as vantagens da Internet vão
além do fácil acesso à informação. A possibilidade de contatar pessoas com ocupações ou
interesses similares torna possível obter diferentes pontos de vista e pode ajudar a obter
informações que têm sido negligenciadas. Portanto, não é surpreendente que as redes sociais,
blogs e fóruns sejam geralmente incluídos como possíveis ferramentas de consulta.
62
© TODOS OS DIREITOS RESERVADOS
Entretanto, não devemos esquecer que o Google não é o único mecanismo de busca que existe.
Um mecanismo de busca se refere a qualquer sistema de recuperação de informações projetado
para ajudar a encontrar informações armazenadas em um sistema de computador. Nesse sentido,
não são apenas os sistemas utilizados para pesquisar na Web, como o já mencionado Google ou
outros como Bing ou Yahoo! A seguir estão alguns dos tipos de motores de busca que podem ser
encontrados, dependendo de como eles funcionam para o usuário:
• Motores de busca na web. Eles buscam informações na Web e em servidores FTP com base
em texto. Como fazer buscas em tempo real seria impossível devido ao volume de dados
que existe na Internet, esses mecanismos de busca indexam o conteúdo antecipadamente
através de programas conhecidos como spiders que continuamente rastejam a Web e usam
diferentes tipos de algoritmos para ordenar os resultados para oferecer os mais otimizados.
Exemplos deste tipo de mecanismo de busca são Google, Bing e Yahoo!
• Motores de busca visual. Eles buscam informações em vários contextos a partir de uma
entrada gráfica, ou seja, de uma imagem, e retornam diferentes tipos de resultados:
páginas web, localizações em um mapa, outras imagens, etc. Eles usam algoritmos para
analisar a imagem e interpretá-la. Um exemplo deste tipo de mecanismo de busca é a
aplicação Google Goggles.
• Navegadores de mesa. Eles buscam informações no computador do usuário: arquivos,
histórico do navegador, e-mails, etc. Como no caso dos motores de busca da Web, estes
motores de busca utilizam um processo prévio de indexação para otimizar as buscas. Eles
são geralmente um componente padrão dos sistemas operacionais. Exemplos deste tipo de
mecanismo de busca são: Windows Search (Windows), Spotlight (OS X), Unity Dash (Linux)
ou Google Desktop Search.
63
Ferramentas para o profissional da língua
• Pesquisas em bancos de dados. Eles buscam informações em bancos de dados com base
em uma entrada de texto. Ao contrário de outros mecanismos de busca, não há processo
prévio de indexação e as consultas são feitas diretamente em todos os resultados, portanto,
a otimização da busca depende de o banco de dados estar bem construído. Todos os
motores de banco de dados atuais incluem um motor de busca ou de consulta através de
uma linguagem de programação.
• Buscadores humanos. Eles buscam informações em vários contextos e retornam resultados
que foram previamente filtrados por agentes humanos, ao invés de por processos
automáticos usando algoritmos. Um exemplo de tal mecanismo de busca é Mahalo2 .
• Super motores de busca ou meta motores de busca. Eles buscam informações em vários
mecanismos de busca ao mesmo tempo. São comuns, por exemplo, nas páginas de reserva
de vôos, que oferecem resultados obtidos anteriormente através dos motores de busca das
diferentes companhias aéreas.
Outra possível categorização dos motores de busca poderia ser de acordo com o tipo de
resultados que oferecem: motores de busca de notícias, motores de busca de blogs, motores de
busca de viagens, etc. Esses tipos de mecanismos de busca que retornam resultados de natureza
específica são conhecidos como mecanismos de busca vertical e seu funcionamento é
64
um classificador de perguntas, um módulo de recuperação de documentos, um filtro e um módulo
de extração de respostas. Entretanto, devido à complexidade da linguagem natural, as soluções
atuais para encontrar respostas são limitadas a contextos específicos e apresentam alguns
problemas relacionados principalmente à identificação das questões colocadas (Burger et al.,
2002).
A principal utilidade dos mecanismos de busca para profissionais da língua dependerá do tipo de
mecanismo de busca, mas sua utilização será reduzida principalmente à busca de outros
recursos. No caso de ferramentas como memórias de tradução, corpus paralelo ou glossários, os
mecanismos de busca, neste caso de natureza local, serão utilizados para simplificar o processo
de busca e facilitar a navegação através de seu conteúdo.
Abaixo está uma lista de alguns mecanismos de busca que podem ser úteis para os profissionais
do idioma.
As redes sociais são um dos serviços mais saudáveis na Internet atualmente, como indicado por
dados como o Facebook sendo a segunda página mais visitada na Internet4 , logo atrás do
mecanismo de busca do Google. Embora sua principal função seja promover e melhorar as
relações humanas, as redes sociais atuais incluem características que permitem que sejam
utilizadas para muitas outras funções, tais como consultar notícias ou comprar produtos. Muitas
instituições e figuras públicas as utilizam como meio de promoção, uma vez que lhes permitem
alcançar um número muito elevado de pessoas às quais oferecem um contato direto.
Os profissionais de idiomas podem usar muitas dessas características para apoiar sua atividade
profissional. Por exemplo, em redes sociais como Facebook ou LinkedIn, os usuários podem usar
as ferramentas de grupo e página para se organizarem em pequenas comunidades para discutir
65
Ferramentas para o profissional da língua
tópicos específicos. Nesse sentido, existem grupos e páginas criadas por profissionais onde é
permitido o acesso a outros profissionais para discutir, carregar recursos, etc., sobre a atividade
profissional que exercem. No que diz respeito à lingüística, existem, por exemplo, grupos e
websites de associações profissionais (linguistas, tradutores, etc.) nos quais os participantes
pedem ajuda com problemas lingüísticos, consultam outros sobre tarifas para um determinado
projeto e organizam palestras e conferências sobre vários tópicos.
Entretanto, não é necessário descer a um nível tão específico de utilização das redes sociais, uma
vez que um profissional da língua pode utilizá-las como ferramentas de uso geral para
comunicação com contatos conhecidos ou novos, graças às novas possibilidades abertas pela
natureza global da Internet para o trabalho em rede. Como a grande maioria das redes sociais
permite a exibição de contatos de segundo nível (ou seja, contatos das pessoas que “são amigas”
ou “se seguem”), é possível encontrar novos contatos e até mesmo oportunidades de trabalho
apenas navegando através de cadeias de contatos. O fenômeno de saltar de cadeia em cadeia de
contatos é tão difundido que existe até mesmo uma teoria sociológica, agora obsoleta, conhecida
como teoria dos seis graus de separação, que diz que em apenas seis saltos entre essas cadeias
seria possível contatar qualquer pessoa no mundo (Strogatz, S.; Watts, D.; Barabasi, A., 2012).
66
Voltando aos casos específicos, outro uso possível das redes sociais é aquele feito por algumas
instituições lingüísticas, que aproveitaram o escopo e o imediatismo dessas ferramentas não
apenas para se darem a conhecer e promoverem, mas também para oferecerem seus serviços
diretamente através delas. Um exemplo é a Fundación del Español Urgente (Fundéu), que utiliza
sua conta no Twitter5 tanto para promover os artigos que publica em seu portal como para
oferecer conselhos específicos e resolver as eventuais dúvidas lingüísticas dos usuários que o
solicitem quase imediatamente. Esta pode ser uma boa razão para que um profissional da língua
abra uma conta no Twitter, caso ainda não a tenha.
© TODOS OS DIREITOS RESERVADOS
Tenha também em mente que o Facebook, Twitter, LinkedIn e outros sites populares não são as
únicas redes sociais que existem. Como no caso de qualquer outro serviço web, existem redes
sociais com finalidades específicas sobre praticamente qualquer assunto. Para profissionais da
língua, existem, por exemplo, redes sociais dedicadas especificamente aos tradutores, como o
Translator's Café6 ou Traditori7 , onde, além da possibilidade de contato com outros profissionais,
são oferecidas ofertas de trabalho, cursos, eventos e outros recursos úteis para a profissão de
tradução.
67
Ferramentas para o profissional da língua
Abaixo estão algumas redes sociais e recursos específicos dentro delas que podem ser úteis para
os profissionais do idioma.
4.3.3. FÓRUNS
Os Fóruns são outra das muitas ferramentas de comunicação fornecidas pela Internet. Eles são
assíncronos, portanto não requerem atenção constante, e organizam as discussões de forma
hierárquica, através de mensagens e cadeias de mensagens, permitindo assim seguir uma
discussão concreta sem o barulho de outras discussões e acessar facilmente o histórico da
mensagem.
Embora pela definição do conceito de rede social, os fóruns de discussão poderiam ser
considerados um tipo de rede social (O'Keefe, 2010), a principal diferença entre eles é que,
enquanto na rede social a comunicação gira em torno do usuário, em um fórum a comunicação
gira em torno de um tópico de discussão. Os fóruns de discussão têm sua origem em listas de
distribuição de e-mails e grupos de notícias, que serão discutidos abaixo, e embora seu uso tenha
diminuído desde o surgimento das redes sociais centradas no usuário, como o Facebook, alguns
ainda estão de boa saúde, como o serviço de fórum japonês 2channel, que tem em média mais de
um milhão de mensagens por dia8 .
Existem fóruns sobre muitos tópicos diferentes, desde fóruns de suporte onde algumas empresas
resolvem as dúvidas de seus clientes até fóruns gerais onde tudo pode ser postado, sem um
tópico definido, popularmente conhecido como aleatório. Dentro desta grande variedade de
tópicos existem, como no caso das redes sociais, fóruns onde profissionais se reúnem para
discutir aspectos de sua atividade profissional. Os profissionais de idiomas têm acesso a fóruns
sobre muitos assuntos diferentes: aprendizagem de idiomas, tradução, ofertas de trabalho, etc.
68
Abaixo estão alguns exemplos de fóruns que podem ser úteis para profissionais do idioma.
4.3.4. BLOGS
Blogs são websites onde um ou mais autores periodicamente publicam textos ou artigos,
© TODOS OS DIREITOS RESERVADOS
conhecidos como entradas ou posts, que são exibidos em ordem cronológica inversa para facilitar
a leitura do conteúdo mais recente e que normalmente permitem que outros usuários participem
na forma de comentários. O conteúdo dos artigos não precisa se limitar a texto e pode incluir
outros formatos, como imagens, áudio ou vídeo. De fato, alguns serviços de blogs se concentram
apenas em um destes formatos e só permitem a publicação de, por exemplo, imagens (Instagram)
ou vídeos (Vine).
Tradicionalmente, eles sempre foram considerados como meios de expressão pessoal, uma vez
que se originaram em revistas pessoais on-line, mas com o súbito aumento de popularidade que
sofreram no final dos anos 90 com o aparecimento do Pitas, Blogger e outros serviços de blogs
(Blood, 2000), começaram a ser utilizados para muitos outros fins: mídia de opinião, publicação
de notícias, mídia promocional para instituições, backlogs de projetos, etc.
Embora à primeira vista possa parecer que eles não são muito úteis para um profissional, a
verdade é que, como as demais ferramentas de comunicação, os blogs podem ser usados para
atividades profissionais tanto direta quanto indiretamente. Por um lado, eles podem ser usados
como ferramenta de consulta: muitas instituições e personalidades usam blogs em nível
profissional para publicar artigos, opiniões ou informações sobre eventos, cursos, etc. Por outro
lado, a publicação de um blog pelo profissional da língua pode ter aplicações que influenciam
diretamente a atividade profissional: por exemplo, ao publicar um artigo de opinião, uma
discussão pode ser gerada nos comentários com o resto dos leitores que pode ser útil para extrair
informações ou novos pontos de vista. Além disso, como no caso das redes sociais, os blogs
podem ser uma ferramenta ideal para networking: incluir um blog em uma página web pessoal e
atualizá-la mais ou menos constantemente pode ajudar o profissional a receber mais visitas, entre
as quais podem ser encontrados novos contatos profissionais e novas oportunidades de trabalho.
69
Ferramentas para o profissional da língua
Como o principal uso desta ferramenta é em uma única pessoa, a grande maioria dos exemplos
que podem ser fornecidos servem apenas como fontes de referência para comparação de
opiniões com outros profissionais, portanto, ao contrário dos outros recursos, nenhuma lista será
fornecida. Entretanto, podemos tomar como exemplo o blog do tradutor profissional Pablo Muñoz,
Algo más quetraducir9 , iniciado quando ele ainda era estudante de Tradução e Interpretação e
com exemplos dos muitos recursos que estas ferramentas podem fornecer: opiniões pessoais,
difusão de eventos, ensaios, etc.
Embora sejam dois conceitos diferentes, listas de distribuição e grupos de notícias podem ser
agrupados em uma única categoria, pois ambos são meios de distribuição em massa de
mensagens de natureza descentralizada, ou seja, meios que não utilizam um único servidor
central para sua operação, mas são distribuídos entre vários servidores, para enviar uma única
mensagem a vários destinatários. Como no caso dos fóruns, em ambos os serviços a
comunicação gira em torno de um tópico de discussão e não em torno dos usuários. No entanto,
para o usuário final existem algumas diferenças técnicas de acesso e operação que as tornam
consideradas serviços diferentes.
Os grupos de notícias são repositórios de mensagens enviadas por vários usuários dentro da
Usenet, um dos mais antigos sistemas de comunicação entre redes de computadores e ainda um
dos mais populares, embora seu uso em comparação com outros sistemas similares, como fóruns
ou grupos em redes sociais, tenha diminuído. Para acessar a Usenet e, portanto, os grupos de
notícias, o usuário não precisa se registrar, mas deve utilizar software de leitura de notícias, como
o GrabIt (Windows)13 , UNISON (OS X)14 ou LottaNZB (Linux)15 , ou um serviço on-line, como o
70
Google Groups (que também permite, como mencionado acima, a criação de listas de discussão).
Na Usenet, os grupos de notícias são organizados de forma hierárquica e são acessados através
de endereços que são muito semelhantes aos URLs na Web, onde são usados pontos para
diferenciar as diferentes hierarquias. Por exemplo, no grupo “rec.arts.sf.starwars.games”,
encontraríamos o seguinte:
• Um primeiro nível, rec.*, conhecido como hierarquia de nível superior, que se refere a
grupos de notícias de atividades recreativas.
• Um segundo nível, rec.arts.*, que se refere às artes.
• Um terceiro nível, rec.arts.sf.*, que se refere à ficção científica.
• Um quarto nível, rec.arts.sf.starwars.*, que se refere ao universo StarWars.
• Um último nível, rec.arts.sf.starwars.games, que se refere a videogames baseados nesse
universo.
Há um total de oito hierarquias de nível superior, que aderem a um conjunto de regras sobre o que
pode ser publicado nos grupos de notícias que eles contêm. Eles são os próximos:
© TODOS OS DIREITOS RESERVADOS
Um nono nível, conhecido como alt.*, surgiu para permitir um maior grau de liberdade nas
discussões do que os outros níveis, de modo que os tópicos discutidos neles têm um nível de
moderação muito menor.
Para o profissional do idioma, o uso que pode ser feito de listas de distribuição e grupos de
notícias é basicamente o mesmo que pode ser feito da mídia que tem sido discutida até agora: um
grupo de profissionais com preocupações e interesses semelhantes pode criar uma lista de
distribuição ou grupo de notícias para discutir questões relacionadas à sua profissão, fazer
perguntas, sugerir eventos, etc. Devido à idade desses dois serviços, há um grande número de
listas e grupos cujo tema de discussão está relacionado aos diferentes ramos da lingüística.
Algumas delas estão listadas abaixo.
71
Ferramentas para o profissional da língua
Além das ferramentas gerais de consulta que têm sido discutidas até agora, há uma série de
recursos de natureza puramente linguística. Embora sejam apoiados pelas mesmas tecnologias
que as outras ferramentas de consulta, seu design é projetado para atender às necessidades de
sua natureza lingüística. Nesse sentido, podemos encontrar ferramentas como dicionários, corpus
paralelo e tradutores cuja aplicação está sempre relacionada às línguas.
Embora existam ferramentas deste tipo que podem ser instaladas e executadas em um
computador sem conexão à Internet, seu real potencial está nas ferramentas disponíveis na rede
de redes, que permitem, entre outras coisas, a constante atualização e contribuição do usuário
para seu conteúdo. Entretanto, algumas destas ferramentas, especialmente em dispositivos
móveis, permitem ambas as opções: ser executado sem conexão à Internet e ser atualizado uma
vez conectado.
A seguir são definidos alguns dos principais tipos de recursos linguísticos que podem ser
encontrados na Internet, assim como alguns exemplos específicos de recursos disponíveis em
espanhol e inglês.
72
4.3.6.1. Dicionários
Uma das ferramentas utilizadas pelos profissionais da língua que mais se beneficiaram com o
surgimento dos computadores e da Internet são os dicionários. Livros ou coleções de livros que
tiveram que ser utilizados para encontrar o significado de uma palavra ou sua tradução para outro
idioma foram substituídos por softwares de computador que podem ser transportados em
pequenas unidades de memória ou acessados diretamente através da Internet. A Real Academia
Española, por exemplo, começou por incluir a versão digital de seu dicionário em CD junto com a
versão física e atualmente o oferece on-line e totalmente gratuito em seu site, junto com o
Dicionário Pan-Hispânico de Dúvidas e o Dicionário Essencial16 .
Entretanto, o tamanho não é a única coisa que os dicionários têm se beneficiado com a
adaptação aos meios digitais. Os processos de busca são agora muito mais simples e diferentes
tipos de resultados podem ser obtidos através de uma única consulta. Por exemplo, a consulta de
um termo no dicionário bilíngue espanhol-inglês do WordReference17 nos oferece não apenas a
tradução para o inglês do termo introduzido, mas também outros dados como: a definição em
espanhol do termo; a transcrição fonética e os áudios com a pronúncia em ambos os idiomas;
possíveis sinônimos e antônimos; exemplos de uso; outras entradas que contenham o termo
© TODOS OS DIREITOS RESERVADOS
introduzido; e até mesmo mensagens do fórum em que algum tópico relacionado ao termo
introduzido é discutido. Além disso, as operações complexas de busca que antes exigiam alto
esforço ou eram diretamente impossíveis, tais como a busca reversa ou a busca de término, agora
são muito mais fáceis.
Monolíngüe
Bilíngüe e multilíngüe
73
Ferramentas para o profissional da língua
Especializado
Entretanto, se eles aparecem como recursos de referência, o formato dessas bases de dados
terminológicos é geralmente exatamente o mesmo que o dos dicionários gerais, tanto no aspecto
visual quanto na operação. Entretanto, devido a sua natureza técnica e sua utilidade exclusiva em
muitos casos para um único campo, eles são geralmente oferecidos como recursos
independentes, embora a instituição que os oferece também tenha um dicionário geral.
• IATE (http://iate.europa.eu/): sigla para InterActive Terminology for Europe, uma base de
dados terminológicos que reúne a terminologia utilizada nos documentos das principais
instituições européias em mais de 20 idiomas e a cataloga de acordo com uma ontologia
temática, permitindo buscas em microtesaurs especializados.
• UNTerm (http://unterm.un.org/): um banco de dados terminológico que reúne a
terminologia utilizada na documentação das Nações Unidas em seus seis idiomas oficiais:
inglês, francês, espanhol, russo, chinês e árabe.
• FAO TERM (http://www.fao.org/faoterm/en/): um banco de dados terminológico contendo a
terminologia utilizada na documentação da Organização das Nações Unidas para
Alimentação e Agricultura em seus seis idiomas oficiais: inglês, francês, espanhol, russo,
chinês e árabe. Ela corresponde em grande parte à maior parte da terminologia encontrada
na UNTerm, mas utiliza apenas a encontrada nos próprios documentos da organização
74
• WTOTerm (http://wtoterm.wto.org/): um banco de dados terminológico que compila a
terminologia utilizada na documentação da Organização Mundial do Comércio em seus três
idiomas oficiais: inglês, francês e espanhol.
Apesar de o processo de migração de um recurso existente deste tipo ser lento devido ao grande
volume de dados, as ferramentas de tradução assistida por computador, que serão discutidas
posteriormente, ajudaram a acelerar o processo de criação e manutenção, pois se baseiam no
conceito de um corpus paralelo como base de sua operação e o resultado final das traduções
realizadas com uma ferramenta deste tipo pode ser exportado diretamente para um destes
recursos.
75
Ferramentas para o profissional da língua
4.3.6.4. Tradutores
Devido à natureza pragmática das línguas humanas, é impossível encontrar uma forma
automática de lidar com a correção linguística dos textos, portanto, neste tipo de tarefa será
sempre necessária a participação de um profissional humano. Entretanto, há uma série de
aplicações informáticas que permitem algum grau de automação na correção e revisão de alguns
aspectos formais da linguagem, tais como ortografia ou gramática, mas como mesmo alguns
desses aspectos formais dependem em grande parte do contexto em que são usados, essas
ferramentas devem ser usadas apenas como referência ou suporte e nunca devem ser confiáveis
para garantir a correção linguística do texto. Além disso, existem outras ferramentas que, embora
sua principal função não seja garantir a correção linguística dos textos, podem ser utilizadas para
facilitar algumas das tarefas relacionadas a esta atividade, tais como ferramentas de comparação
ou de exibição paralela de documentos.
Abaixo estão alguns dos diferentes tipos de ferramentas que podem ser úteis para a comparação,
revisão e correção de textos e alguns casos específicos são mostrados com mais detalhes. Na
maioria dos casos, será feita referência aos tipos de arquivos DOC e PDF, pois são considerados
os arquivos mais utilizados no processo de correção e revisão e são estatisticamente os tipos de
arquivos mais utilizados na Internet19 .
76
4.4.1. VERIFICADORES ORTOGRÁFICOS E GRAMATICAIS
As ferramentas que podem ser mais úteis na correção e revisão de textos são obviamente os
verificadores ortográficos e gramaticais. A origem dessas ferramentas data dos anos 60
(Peterson, 1980), quando a necessidade de detectar informações inseridas incorretamente em
computadores levou o cientista Les Earnest a investigar a possibilidade de verificá-las
automaticamente e um de seus alunos, Ralph Gorin, a desenvolver o primeiro corretor ortográfico
para um dos supercomputadores da época, o DEC PDP-10: a aplicação SPELL, cuja base
conceitual ainda permanece na aplicação UNIX ispell. Entretanto, os primeiros corretores
ortográficos funcionaram de forma muito diferente dos que existem hoje e poderiam ser
considerados mais como “verificadores” do que como “corretores”, uma vez que sua operação se
reduziu à verificação de erros tipográficos, comparando-os com uma lista controlada de palavras,
e faltavam muitas das funções que são consideradas indispensáveis hoje: correção gramatical,
possibilidade de feedback das listas controladas, detecção em tempo real, etc.
No que diz respeito aos computadores pessoais, os primeiros corretores ortográficos datam dos
anos 80 e, ao contrário dos atuais, eram programas de software autônomos. Anos depois, os
processadores de texto WordStar e WordPerfect incluíram pela primeira vez um corretor
© TODOS OS DIREITOS RESERVADOS
ortográfico em seus pacotes de software, iniciando uma tendência que continua até hoje, onde a
implementação de corretores ortográficos se espalhou para outros programas de software, tais
como aplicações web, navegadores gerais de internet e sistemas operacionais em geral.
Como pode ser visto, a pronúncia fonética destes versos é muito semelhante à do significado
pretendido, mas obviamente as palavras utilizadas não são as corretas. No entanto, uma vez que
eles são feitiços de verificação, a grande maioria dos corretores ortográficos não se apercebem de
sua incorreção. Embora ainda estejam em um estágio muito inicial, uma possível solução para
este tipo de problema é encontrada em verificadores ortográficos contextuais, que, utilizando
redes semânticas, são capazes de detectar problemas com palavras corretas usadas em palavras
incorretas graças à análise do resto das palavras usadas ao seu redor. Um sistema semelhante é
usado para detectar problemas gramaticais, onde além das relações semânticas das palavras que
19. Johnson, D. (2014). Os 8 formatos de documentos mais populares na web. Link da Web: http://duff-johnson.com/
2014/02/17/the-8-most-popular-document-formats-on-the-web/
77
Ferramentas para o profissional da língua
compõem as frases, outros fatores como a ordem ou a categoria gramatical a que pertencem são
levados em conta.
Entretanto, deve-se ter em mente que estes problemas se multiplicam quando se trata de idiomas
diferentes do inglês, como no caso das línguas românicas, onde a ordem das estruturas sintáticas
é freqüentemente alterada, ou como no caso do alemão, onde os substantivos compostos são
comuns. Os corretores ortográficos atuais, embora possam detectá-los até certo ponto, não são
capazes de lidar com este tipo de problema e na maioria dos casos são omitidos ou detectados
como falsos positivos. Por esta razão, estas ferramentas devem ser utilizadas apenas como
suporte e nunca devem ser confiáveis para garantir a exatidão do texto. Por enquanto, e até que a
tecnologia seja aperfeiçoada o suficiente para permitir a automação completa da correção do
texto, a revisão final de um texto deve sempre depender do fator humano.
Como os corretores ortográficos geralmente aparecem como funções dentro de outros programas,
não há exemplos específicos de aplicações separadas que possam ser fornecidas. Entretanto, os
principais navegadores de Internet (Mozilla Firefox, Google Chrome, Internet Explorer, Safari) e
suítes de escritório (Microsoft Office, LibreOffice, Google Drive) são exemplos de ferramentas que
os incluem.
78
4.4.2. TEXTO AUTOCOMPLETO E PREDICTIVO
sua aplicação mais comum seja em teclados para dispositivos móveis, muitas ferramentas de
computador freqüentemente utilizadas incluem sistemas preditivos ou autocompletos:
processadores de texto, motores de busca, formulários, etc. O mecanismo de busca do Google,
por exemplo, exibe buscas freqüentes relacionadas às letras ou palavras digitadas na caixa de
busca e as adapta em tempo real de acordo com as próximas letras ou palavras digitadas.
Para seu funcionamento, são necessários grandes bancos de dados, compostos pelos termos ou
unidades fraseológicas que podem ser sugeridos e as diferentes redes de relações que podem
ocorrer entre eles. Eles devem ser organizados eficientemente para que o acesso em tempo real
seja rápido e consuma o menor número possível de recursos e devem permitir o feedback
automático ou semi-automático (supervisionado pelo usuário humano) de novos termos para
melhorar as sugestões futuras.
79
Ferramentas para o profissional da língua
Por razões de usabilidade, a grande maioria das aplicações em um computador é usada em modo
de tela cheia ou, no máximo, exibindo alguns elementos da interface do sistema operacional, tais
como a barra de ferramentas. Isto permite, além de uma questão óbvia de visibilidade relacionada
ao tamanho dos elementos dentro da aplicação, concentrar-se em uma tarefa sem a
contaminação visual que outras aplicações ou outros elementos possam implicar. Já vimos o
caso, por exemplo, de editores de texto como o ZenWriter que são projetados com uma interface
minimalista e têm um modo “somente texto” para evitar distrações mesmo dentro da mesma
aplicação.
Entretanto, às vezes pode ser preferível ter mais de uma aplicação aberta e poder visualizá-las
simultaneamente: ao procurar informações na Internet enquanto escreve um texto, ao assistir a
Todos os principais sistemas operacionais permitem o ajuste automático de duas ou mais janelas
em paralelo de forma simples, com ações tão simples quanto arrastar uma janela para a borda
esquerda da tela e a outra para a borda direita. Embora para a maioria das tarefas de comparação
esta característica possa ser suficiente, ferramentas com características de comparação paralela
dedicadas incluem outras funções que podem torná-las mais úteis. Estas funções incluem a
rolagem paralela (ao rolar em uma janela também é feito na janela paralela para manter a mesma
posição em ambas) e o destaque das diferenças (as diferentes partes entre um texto e outro são
destacadas em cores diferentes para facilitar sua detecção), bem como a possibilidade de aplicar
estas diferenças automaticamente em um dos dois textos.
80
© TODOS OS DIREITOS RESERVADOS
Mais uma vez, embora existam aplicações de comparação separadas em paralelo, seu maior
potencial é encontrado quando são utilizadas em combinação com outras ferramentas de
processamento de texto ou quando são incluídas como características das mesmas. Nesse
sentido, os principais editores e processadores de texto, assim como outras aplicações das suítes
de automação de escritório principal, incluem recursos de comparação paralela: Microsoft Word,
LibreOffice Writer, Brackets, Atom, etc.
Outra característica incluída em alguns programas de software que pode ser útil para realizar
tarefas de correção e revisão é o destaque da sintaxe , ou seja, destacar em cores diferentes os
diferentes tipos de elementos que compõem uma frase. Entretanto, esta utilidade está
atualmente limitada ao tratamento de línguas formais, já que, como no caso dos corretores
ortográficos, a natureza abstrata das línguas naturais pode apresentar problemas de identificação
em casos de polissemia ou transformação da função gramatical de algumas palavras, como no
caso dos substantivos verbais. No entanto, alguns editores de texto com foco em idiomas de
processamento natural incluem o destaque de palavras invariantes dentro do idioma natural,
como os pronomes interrogativos do inglês: who, where, when, etc.
Como visto acima, a maioria dos editores de texto se concentrou no tratamento das linguagens de
programação, incluindo características de destaque de sintaxe.
81
Ferramentas para o profissional da língua
Uma das funções incluídas na grande maioria dos programas de processamento de texto que
pode passar despercebida à primeira vista, uma vez que normalmente funciona em segundo
plano e é completamente invisível para o usuário, é a indexação automática. Como é escrito em
alguns editores ou processadores de texto, como o Microsoft Word, um processo de fundo realiza
tarefas de indexação que permitem, entre outras coisas, obter estatísticas em tempo real sobre o
texto: número de páginas, número de palavras, espaços em branco, iterações da mesma palavra,
número de auto-correções, etc.
Embora não seja uma característica que geralmente possa ajudar diretamente na tarefa de
correção e revisão de textos, pode ser útil para comparar o texto original com o texto corrigido.
Entretanto, um revisor pode ser capaz de usar algumas de suas funções para realizar sua tarefa.
Por exemplo, pode ser interessante observar o número de iterações de uma palavra ao longo do
texto para utilizar sinônimos em caso de uso excessivo de uma palavra e assim evitar redundância
ou saturação terminológica.
A indexação automática de texto não deve ser confundida com outros tipos de indexação
automática que foram vistos até agora, como a realizada por sistemas operacionais ou
mecanismos de busca para otimizar os processos de acesso à informação. Os recursos de
indexação automática de texto são exclusivos das ferramentas de processamento de texto e, como
a maioria das funções relacionadas à correção vistas até agora, muitas vezes só estão disponíveis
dentro destas aplicações. Entretanto, é possível utilizar ferramentas separadas para realizar estas
82
tarefas sem abrir o arquivo que contém o texto ou aplicá-las a vários documentos ao mesmo
tempo. O aplicativo Linux wc, por exemplo, permite obter estatísticas a partir de um arquivo de
texto da linha de comando.
Às vezes, um revisor ou editor pode precisar manter a versão original de um texto para posterior
comparação ou para facilitar a identificação de mudanças em relação ao texto original. A maneira
mais fácil de fazer isso é salvar o documento modificado com um nome diferente para ter uma
cópia das duas versões. Entretanto, alguns editores e processadores de texto, assim como alguns
PDF e outros formatos não editáveis, incluem recursos que permitem manter ambas as versões
em um único documento: controle de mudanças e comentários.
© TODOS OS DIREITOS RESERVADOS
O controle de mudanças, por um lado, permite registrar as mudanças feitas no texto a partir do
momento de sua ativação. Embora estas mudanças permaneçam ocultas, é possível ativar sua
exibição para que apareçam em sua posição original, ao lado do texto modificado, e geralmente
riscadas e com uma cor diferente. Além disso, o controle de mudança permite a possibilidade de
aceitar ou reverter a mudança em um momento posterior.
83
Ferramentas para o profissional da língua
Por outro lado, os comentários permitem acrescentar anotações a partes específicas do texto,
invisíveis também para o usuário, tais como lembretes, notas para um usuário posterior, etc. São
particularmente úteis em leitores de PDF e outros formatos não editáveis, como o Adobe Reader,
pois permitem que um texto enviado em um destes formatos seja revisado diretamente para
posterior inclusão no texto original pelo autor.
Praticamente todos os processadores de texto (não processadores online como Google Docs ou
Word Online) e leitores de texto incluem ferramentas de controle de mudanças e comentários.
Para outros formatos, assim como para outros tipos de ferramentas de processamento de texto,
existe a alternativa de usar programas como o Eclipse para controle de versão. O que estes
programas fazem é salvar as diferentes versões de um documento em arquivos independentes,
mas eles permitem sua comparação em tempo real e a regressão para uma versão anterior.
Finalmente, uma última ferramenta que pode ser útil para tarefas de correção e revisão, são as
ferramentas de detecção de plágio, que permitem a detecção de textos idênticos ou fragmentos
de texto entre um conjunto de documentos ou com comparação direta com textos da Internet.
Como será visto no próximo capítulo, as ferramentas de tradução assistida por computador
utilizam ferramentas similares para identificar correspondências com traduções previamente
realizadas disponíveis nas memórias de tradução.
Um dos ramos da lingüística que mais se beneficiou com a introdução da informática em sua
profissão é a tradução. Como foi demonstrado em várias ocasiões ao longo deste material de
estudo, tentar fazer com que as máquinas entendam os seres humanos e sejam capazes de
responder na mesma língua ou mesmo em uma língua diferente sempre foi uma das principais
maneiras de estudar a lingüística computacional no que diz respeito aos computadores. A
tradução, portanto, sempre foi concebida como uma das operações que os computadores
poderiam realizar e, como tal, sempre teve um forte apoio tanto de pesquisadores quanto de
desenvolvedores de software.
84
Entretanto, como será visto mais tarde, a tradução automática ainda está longe de ser totalmente
automática devido aos problemas que o processamento em linguagem natural apresenta para um
computador. Por esta razão, uma grande parte da comunidade científica com interesse no uso de
computadores para atividades de tradução preferiu concentrar suas pesquisas no uso de
computadores, não tanto como um substituto da tradução humana, mas sim como um
complemento ou uma ferramenta de apoio. Desta pesquisa, surge o que é conhecido como
tradução assistida por computador, cuja diferença é que o processo de tradução requer a
participação de um tradutor humano.
Tanto a tradução automática quanto a tradução assistida por computador são ferramentas
particularmente úteis para tradutores e outros profissionais da língua. Entretanto, é necessário
considerá-las como o que são: ferramentas auxiliares criadas com base lógica de idiomas formais
e que, como no caso dos corretores ortográficos, é necessário utilizá-las apenas como
ferramentas de apoio e não depender delas para garantir a qualidade do resultado da atividade
profissional.
Os aspectos específicos de cada uma dessas ferramentas são detalhados abaixo, assim como as
diferentes funcionalidades e características que normalmente as compõem e exemplos de alguns
© TODOS OS DIREITOS RESERVADOS
Ainda hoje, a tradução automática é uma das tarefas pendentes da lingüística computacional. A
linguagem natural coloca os mesmos problemas à tradução automática que às ferramentas de
correção ortográfica e gramatical, e acrescenta aqueles decorrentes da necessidade de trabalhar
com as características de mais de um sistema linguístico. Parte da comunidade científica até
levanta a possibilidade de que a tradução totalmente automática nunca se tornará uma realidade.
Mathias W. Madsen, PhD, Universidade de Amsterdã, afirma (2009) que a história da pesquisa de
tradução automática tende a repetir seus erros e que uma melhoria nos processos de tradução
automática não deve ser esperada em um futuro próximo, mas também não deve ser esperada
após 20 ou 30 anos. Madsen acrescenta que a tradução de alguns textos, como documentos
85
Ferramentas para o profissional da língua
A causa deste pessimismo está na forma como este tipo de tradução é concebido, uma vez que se
baseia no funcionamento da tradução humana. Este se reduz a duas etapas:
Embora possa parecer um processo simples, há toda atividade cognitiva complexa por trás dele,
pois para decodificar o significado do texto original é necessário levar em conta não apenas o
significado literal de cada palavra, mas também outros aspectos lingüísticos, alguns dos quais
podem ser reduzidos a cadeias lógicas de relações, como morfologia ou sintaxe, e outros com
maior complexidade, como idiossincrasias ou recursos retóricos. A tecnologia atual está longe de
ser capaz de processar, muito menos de compreender (em um sentido estritamente humano),
estes aspectos da linguagem. Apesar disso, vale mencionar que parte da pesquisa realizada
permitiu a incorporação de novas técnicas ou abordagens que, embora não tenham resolvido
totalmente os problemas de tradução automática, melhoraram muito seus processos. Atualmente,
• Tradução automática baseada em regras. Esta é a forma tradicional pela qual o conceito de
tradução automática tem sido abordado. Para isso, é necessário fornecer as regras
morfológicas e sintáticas das línguas de origem e destino, bem como um léxico de
transferência suficientemente grande para contemplar a semântica completa de ambas as
línguas, incluindo possíveis ambigüidades.
• Tradução estatística. Seu funcionamento é baseado no uso de corpus paralelo para obter
usos lingüísticos através de uma abordagem estatística. Normalmente, eles levam em conta
as cadeias lingüísticas destes corpúsculos que são idênticas às encontradas no texto a ser
traduzido e fornecem como tradução a equivalência oferecida pelo corpus. Entretanto, as
ferramentas mais recentes incorporam a identificação de padrões em textos de referência,
o que torna possível o uso de um corpus monolíngüe.
• Tradução baseada em exemplos. Embora funcione de forma semelhante à tradução
estatística, a tradução baseada em exemplos tem a diferença de comparar o texto a ser
traduzido com as traduções anteriores e obter fragmentos, ou cordas semelhantes em uma
determinada porcentagem, e depois juntá-los para formar as frases do texto traduzido. Este
é um conceito semelhante ao das memórias de tradução que, como será visto na próxima
seção, utilizam ferramentas de tradução assistida por computador.
Um dos muitos problemas com essas abordagens é que, por serem baseadas em estatísticas ou
coincidências com traduções semelhantes, não foi possível contemplar o surgimento de uma
cadeia de textos inteiramente nova e sua tradução deveria ser reduzida a uma abordagem
baseada em regras, voltando novamente ao problema de interpretação do texto original e aos
aspectos complexos da linguagem natural.
86
Entretanto, independentemente de seu ponto de vista sobre o futuro da tradução automática,
apoiadores e detratores concordam que os 60 anos de pesquisa desde a experiência
Georgetown-IBM resultaram em avanços tecnológicos que permitiram a criação de ferramentas
totalmente funcionais que, embora não tenham a mesma qualidade de um texto traduzido por um
humano, podem obter resultados interessantes e ser consideradas como ferramentas de apoio,
sempre levando em conta a margem de erro que pode ser contemplada.
Na verdade, atualmente essas ferramentas são utilizadas para algumas aplicações que vão além
de seu uso pelos tradutores para apoiar sua atividade e ganharam o interesse de algumas das
maiores instituições públicas e privadas. Por exemplo, a União Européia investiu mais de 2,375
milhões de euros no projeto MOLTO20 , da Universidade de Gotemburgo, para a criação de uma
ferramenta de tradução automática que abrange a maioria dos idiomas dos países membros. Os
Estados Unidos, devido a recentes episódios de terrorismo internacional e intervenções militares
em países estrangeiros, gastam muito dinheiro em engenharia lingüística, com exemplos como o
DARPA, que mantém programas como o TIDES ou o Babylon, ou a Força Aérea americana, que
ofereceu um milhão de dólares para a criação de uma ferramenta universal de tradução
automática (William, 2003). Outro exemplo, talvez mais conhecido, é o das redes sociais como o
Facebook ou ferramentas de comunicação como o Skype, que incorporam funções de tradução
© TODOS OS DIREITOS RESERVADOS
Abaixo estão alguns exemplos de ferramentas de tradução automática disponíveis na Internet que
podem ser utilizadas por um tradutor, ou qualquer outro profissional de idiomas com necessidade
de tradução, para apoiar sua atividade profissional.
Uma lista mais completa das diferentes opções de tradução automática pode ser encontrada no
texto “Los traductores automáticos en la red” de María Amparo Alcina Caudet, incluído no anuário
do Instituto Cervantes 2012-201121 .
87
Ferramentas para o profissional da língua
Como já vimos, parte da comunidade científica acredita que a tradução automática nunca poderá
ser tão perfeita quanto o esperado. Entre os cientistas que compartilham este ponto de vista,
Madsen (2009) afirma que a pesquisa sobre tradução automática dificilmente obterá melhores
resultados do que aqueles obtidos nos 60 anos desde a experiência de Georgetown-IBM. No
entanto, Madsen também afirma que muito do que foi descoberto pela pesquisa em tradução
automática tem uma aplicação melhor: apoiar a tradução automática. Se um computador é capaz
de traduzir metade das palavras em um texto mais ou menos corretamente, isso não
economizaria muito tempo para um tradutor humano?
De fato, a visão de Madsen é totalmente compatível com a filosofia por trás do conceito de
tradução assistida por computador (CAT), que é uma forma de tradução em que o ser humano usa
o computador como ferramenta de apoio, aproveitando as diferentes ferramentas que a
tecnologia da informação coloca à sua disposição para otimizar seu trabalho. Ao contrário do caso
da tradução automática, o uso dessas ferramentas normalmente não segue um propósito
específico, mas normalmente é usado por um tradutor ou grupo de tradutores como ferramenta
de apoio, independentemente do propósito final da tradução. Entretanto, devido à natureza
Como o conceito de CAT se refere a uma forma de trabalho, e não a um tipo específico de
ferramenta, ele inclui todas aquelas ferramentas que podem ajudar o tradutor a realizar sua
atividade profissional, incluindo algumas que já foram tratadas até agora, tais como verificadores
ortográficos ou bancos de dados de terminologia. Entretanto, CAT geralmente se refere a
ambientes de produção que integram todas as ferramentas necessárias para o tradutor trabalhar
sem a necessidade de recorrer a outras ferramentas. Estes ambientes integrados geralmente têm
as seguintes ferramentas:
21. Alcina, M. A. (2011). “Principais tradutores mecânicos: produtos, empresas de desenvolvimento, prestadores de
serviços, etc.”. Anuário do Instituto Cervantes 2012-2011. Link da Web: http://cvc.cervantes.es/lengua/anuario/
anuario_10-11/alcina/p04.htm
88
alinhamento dos segmentos com seu equivalente no(s) idioma(s) de destino para formar
pares lingüísticos a serem incorporados à memória de tradução.
• Ferramentas de correspondência. Estas ferramentas, como mencionado acima, sugerem ao
tradutor correspondências idênticas ou similares ao segmento que está sendo traduzido
com base no que está contido em uma memória de tradução. Além disso, permitem que o
tradutor estabeleça regras para a identificação de correspondências, como a porcentagem
de coincidência entre o segmento a ser traduzido e aquele armazenado na memória para
oferecê-lo como sugestão.
• Ferramentas de gerenciamento de projetos de tradução. Eles permitem a criação de
pacotes de tradução, compostos de um ou mais documentos a serem traduzidos, a serem
enviados a um ou mais tradutores de um ou mais idiomas. Além disso, permitem a
atribuição de funções dentro do projeto (gerente, tradutor, revisor, etc.) e permitem que
alguns aspectos sejam configurados, tais como datas de entrega ou memórias de tradução
das quais eles têm que obter informações.
• Ferramentas gerais para o processamento de texto Finalmente, elas incluem todas as
ferramentas que foram vistas até agora e que tornam possível o processamento de texto,
desde processadores de texto para poder abri-las até verificadores ortográficos para
© TODOS OS DIREITOS RESERVADOS
garantir sua qualidade. Além disso, incluem ferramentas, geralmente invisíveis para o
tradutor, que permitem a conversão de diferentes tipos de documentos em um único
formato e a possível exportação para o mesmo formato ou para um formato diferente depois
que a tradução for concluída.
Também deve ser levado em conta que os textos escritos não são os únicos com os quais um
tradutor pode trabalhar e que existem ambientes de tradução assistida que incluem ferramentas
de localização, tais como IDE ou sincronizadores de legendas.
O trabalho de um tradutor utilizando este tipo de ambiente CAT é reduzido a tarefas como traduzir
os segmentos únicos identificados, adicionar termos às bases de dados terminológicas e verificar
se os resultados inseridos automaticamente a partir da memória de tradução estão corretos.
Devido à automatização de uma grande parte da tradução graças às memórias de tradução e
bancos de dados terminológicos, a revisão do texto para garantir consistência e homogeneidade,
por exemplo, torna-se secundária e até desnecessária em textos de natureza técnica.
A escolha mais comum quando se fala em ferramentas de tradução assistida por computador é o
SDL Trados, principalmente porque ele tem a maior participação de mercado e é utilizado por
empresas multinacionais e instituições internacionais não apenas para atender suas
necessidades de localização nos países onde operam, mas também para cobrir outras como a
gestão de documentos. Entretanto, como acontece com praticamente todas as ferramentas
informáticas, existe uma ampla gama de soluções de tradução assistida que podem ser
adaptadas às diferentes circunstâncias de cada tradutor (práticas, econômicas, etc.). Exemplos de
alguns deles são fornecidos abaixo.
89
Ferramentas para o profissional da língua
Até agora, apenas aquelas ferramentas cujo objetivo é satisfazer as necessidades derivadas
diretamente do trabalho com o idioma foram levadas em consideração. Entretanto, pode-se dizer
que as tarefas que um profissional da língua pode realizar nem sempre estão relacionadas com o
idioma. Muitas vezes, o profissional tem que realizar tarefas para satisfazer outros tipos de
necessidades que, na grande maioria dos casos, têm sua origem na natureza multidisciplinar de
sua atividade profissional. Por exemplo, a lingüística computacional exige que o profissional seja
especialista não apenas em lingüística, mas também em programação, lógica e até em
90
matemática. Em outros casos, o próprio profissional gera estas tarefas voluntariamente a fim de
otimizar seu trabalho ou por falta de recursos para satisfazer uma certa necessidade. Por
exemplo, se uma ferramenta similar ainda não existe, um terminólogo pode considerar a criação
de um recurso automático de indexação e catalogação de termos, o que requer habilidades de
programação, banco de dados e análise de dados.
Entretanto, às vezes é necessário procurar a origem dessas tarefas não lingüísticas em fatores
relacionados ao contexto em que elas são realizadas. Uma das mais comuns é a falta de um
profissional especializado para realizar as tarefas das quais depende a atividade do profissional
de idiomas, ou vice-versa, seja por falta de recursos (profissionais autônomos, pequenas
empresas, etc.) ou por causa das políticas de recrutamento de uma empresa (busca de
candidatos com várias tarefas, etc.). Por exemplo, no caso de legendagem e dublagem, na
ausência dos profissionais correspondentes, o tradutor às vezes assume as tarefas de
sincronização e edição de vídeo que seguem o processo de tradução. Os aspectos éticos e morais
desta assunção de tarefas de outros profissionais podem ser discutíveis, mas realizadas de forma
apropriada, oferecendo um alto grau de especialização, evitando sobrecarga e exigindo a
compensação econômica correspondente aos diferentes tipos de trabalho realizado, o multitarefa
é geralmente muito positivo, tanto para a parte que requer os serviços quanto para o próprio
© TODOS OS DIREITOS RESERVADOS
profissional (Otto, S., Wahl, K., Lefort, C., Frei, W., 2012).
Abaixo estão alguns dos tipos de ferramentas não lingüísticas que os profissionais da língua
podem utilizar em suas atividades profissionais.
Uma das tarefas que um profissional da língua pode enfrentar, seja por sua própria necessidade
ou por causa das condições estabelecidas pelo empregador ou pelo cliente, é o layout do
conteúdo, que consiste basicamente em dar um formato visual adequado a um conteúdo baseado
em critérios estéticos ou de legibilidade para sua posterior publicação ou impressão. Portanto, é
uma tarefa que não requer habilidades linguísticas, mas sim outras relacionadas ao design
gráfico. Entretanto, é verdade que se forem encontrados problemas com o layout de um conteúdo
e for necessário alterar um texto, por exemplo, por razões de espaço, os conhecimentos
linguísticos podem ajudar na busca de alternativas.
Os processadores de texto, que foram discutidos acima, são exemplos de ferramentas que
permitem a criação e layout de conteúdo, embora geralmente muito mais simples do que aqueles
dedicados ao design gráfico. E mesmo dentro do design gráfico, embora seja verdade que existe
uma grande variedade de ferramentas que permitem controlar o aspecto visual de um conteúdo,
existem ferramentas dedicadas exclusivamente ao design de conteúdo para publicação ou
impressão. Exemplos são Microsoft Publisher, Adobe FrameMaker ou Adobe InDesign.
91
Ferramentas para o profissional da língua
Além disso, há outra tarefa, em grande parte relacionada ao layout, que um profissional da língua
pode realizar: a criação de conteúdo, entendido não como a elaboração de um texto, mas como
todo o processo que deve ser realizado para levar um conteúdo desde sua fase inicial como uma
idéia ou conceito até sua publicação. Em relação a isto, a popularização do design gráfico e das
ferramentas de layout e a crescente tendência de gerar e publicar conteúdo próprio através da
Internet, contornando os intermediários, levou ao surgimento de ferramentas de editoração
eletrônica ou de autoria, que permitem ao usuário controlar todas as fases de criação e design de
um conteúdo, qualquer que seja seu tipo. Algumas das ferramentas de layout discutidas acima,
por exemplo, incluem a capacidade de exportar o resultado final para formatos não editáveis
como PDF e publicá-lo diretamente para mídias auto-editadas, como o Scribd.
Falar de automação de tarefas em um contexto de TI pode ser redundante, uma vez que, como já
vimos, TI não é nada além de processamento automatizado de informações e, como tal, usa a
automação de tarefas como base. Entretanto, as ferramentas de automação de tarefas aqui
referidas estão em um nível mais superficial e diretamente relacionadas com o trabalho de um
profissional.
Uma macro (abreviação de “instrução”) é uma série de instruções que são inseridas
seqüencialmente para que possam ser reproduzidas posteriormente na mesma ordem usando um
único comando. No exemplo acima, cada um dos passos que o praticante segue para dar o
formato desejado poderia ser registrado como uma instrução e depois executado para um
determinado fragmento de texto de uma só vez executando um determinado comando (por
exemplo, um atalho de teclado personalizado ou um botão na interface de um programa projetado
para este fim).
92
utilidade em uma capacidade específica está no processamento de texto. Por esse motivo, as
principais suítes de automação de escritório, como o Microsoft Office ou o LibreOffice, as incluem
como características padrão nos programas que as compõem. Além disso, elas podem ser feitas
de duas maneiras: uma, a mais simples, permite começar a gravar com um botão, realizar as
ações desejadas e parar de gravar com o mesmo botão; a outra, mais complicada mas com mais
possibilidades, permite sua construção através de uma linguagem de programação.
Entretanto, dentro dessas ferramentas há algumas que não são tão amplamente utilizadas quanto
outras, mas podem ser igualmente úteis para um profissional. Um exemplo disso são as
ferramentas de gerenciamento de tempo baseadas no conceito de Getting Things Done (Allen,
2001), que ajudam o profissional a criar listas de tarefas organizadas por prioridade e que
permitem a configuração de outras configurações, tais como o tempo estimado para realizar a
tarefa, para que o aplicativo possa fazer sugestões sobre como organizar o tempo. Exemplos
destas ferramentas são Remember The Milk (multiplataforma) ou Get Things Feito (Linux).
Também relacionado ao gerenciamento do tempo, e diretamente focado em evitar procrastinação,
existem aplicações baseadas na técnica Pomodoro (Cirillo, 1989) que permitem estabelecer um
tempo para realizar uma tarefa e bloquear durante esse tempo aspectos que podem causar
distrações, tais como acesso a redes sociais ou software de comunicação.
Nas seções anteriores falamos sobre tipos muito diferentes de ferramentas, relacionadas tanto ao
trabalho de um profissional da língua quanto ao uso geral de TI, mas omitimos intencionalmente
aquelas ferramentas cuja aplicação ou complexidade técnica as torna demasiado específicas para
certos tipos de perfis dentro da lingüística. Isto é especialmente evidente em alguns ramos da
lingüística aplicada que exigem o uso de ferramentas de outras especialidades profissionais às
quais são transversais. Nesse sentido, se tomarmos por exemplo o caso da neurolinguística, seria
necessário levar em conta as ferramentas informáticas médicas que são utilizadas para o
propósito da disciplina.
93
Ferramentas para o profissional da língua
Entretanto, o leitor destes conteúdos pode ser muito claro sobre o campo no qual ele ou ela quer
se especializar ou simplesmente estar curioso sobre o que mais a TI tem a oferecer para ajudá-lo
em seu futuro profissional. Embora muitas delas serão tratadas especificamente no contexto
apropriado mais tarde em seu treinamento, o leitor é convidado a explorar estas possibilidades
por conta própria, sempre levando em conta os conselhos dados ao longo deste material de
estudo, especialmente no que diz respeito à segurança.
4.8. CONCLUSÃO
As acima são apenas algumas das ferramentas que um profissional da língua pode utilizar. O
número de opções disponíveis é muito maior e continuará a aumentar à medida que a
computação e as possibilidades que ela oferece evoluem. Além disso, estas opções se tornarão
mais fragmentadas à medida que a lingüística desenvolver novos caminhos de trabalho e
pesquisa de natureza cada vez mais especializada.
Apesar desta fragmentação, um profissional do idioma deve estar ciente das diferentes
94
[3] Bowker, L. (2002). Tecnologia de tradução assistida por computador: Uma introdução
prática. Ottawa: Universidade de Ottawa Press.
[4] Madsen, M. W. (2009). The Limits of Machine Translation. Tesis sin publicar. Universidad
de Copenhague.
© TODOS OS DIREITOS RESERVADOS
95
Ferramentas para o profissional da língua
96
© TODOS OS DIREITOS RESERVADOS
Resumo
97
Ferramentas para o profissional da língua
98