Você está na página 1de 25

185

Traduo, cognio e tecnologia...

TRADUO, COGNIO E TECNOLOGIA:


INVESTIGANDO A INTERFACE ENTRE O
DESEMPENHO DO TRADUTOR E A TRADUO
ASSISTIDA POR COMPUTADOR

Fabio Alves
Universidade Federal de Minas Gerais
fabio.ufmg@gmail.com

Resumo: Baseando-se em estudos sobre segmentao cognitiva em traduo


e no surgimento de novos modos de produo decorrentes da criao de
tecnologias de traduo (Dragsted, 2004), este artigo apresenta a estrutura e
o desenho de um projeto de pesquisa que tem por objetivo investigar o
impacto das novas tecnologias de traduo na cognio humana. Atravs da
reviso da literatura sobre segmentao cognitiva em traduo e tecnologias
de traduo, o artigo discute possveis implicaes que o uso de sistemas de
memria de traduo possa ter no desempenho de tradutores.
Palavras-chave: Segmentao cognitiva, tecnologias de traduo, sistemas
de memria de traduo, unidade de traduo, competncia em traduo.
Abstract: Building on studies of cognitive segmentation in translation and
on the emergence of new modes of production with the advent of translation
technologies (Dragsted, 2004), this article presents the structure and design
of a research project which aims at investigating the impact of translation
technology on human cognition. By reviewing the literature on cognitive
segmentation in translation and on translation technology, it discusses the
possible implications that the use of translation memory systems may have
on the performance of translators.
Keywords: Cognitive segmentation, translation technologies, translation
memory systems, translation unit, translation competence.

186

Fabio Alves

Introduo
Embora ainda seja considerado um campo de pesquisa incipiente,
os estudos sobre o processo de traduo avanaram bastante nos
ltimos quinze anos. A partir de um quadro multifacetado em que
havia uma notvel carncia de rigor metodolgico e pouca familiaridade com a prtica de experimentao (cf. Fraser, 1996, para
uma reviso bibliogrfica), os ltimos anos foram testemunha de
esforos feitos por pesquisadores na Alemanha, Brasil, Canad,
Dinamarca, Espanha e Finlndia, entre outros, para desenvolver
desenhos experimentais sobre o processo de traduo, passveis de
serem replicados em diferentes pares lingsticos e em distintas
condies de produo (cf. Alves (ed.) 2003; Alves & Gonalves
2003, Hansen (ed.) 1999, 2002; Jakobsen 2002, 2003; Lauffer 2004;
Lorenzo 2004; Lrscher 2004; PACTE 2003, Tirkkonen-Condit &
Jskleinen (ed.) 2000). Com base nos resultados dessas pesquisas, sabe-se hoje que o processo de traduo uma atividade
cognitiva complexa caracterizada por um ritmo cognitivo especfico que requer a utilizao de mltiplas habilidades. Trata-se de um
processo que tem uma natureza no-linear, de carter recursivo, e
que pode ser mapeado atravs de experimentos desenhados para
fins especficos.
Embora esses trabalhos tenham contribudo de forma significativa para o avano das pesquisas sobre o processo de traduo e
seus resultados sejam significativos, o advento de tecnologias de
traduo acabou por introduzir modificaes significativas na prtica de traduo que repercutem na forma como o processo
tradutrio ocorre. Se, por um lado, conhece-se hoje muito mais
sobre os processos cognitivos subjacentes ao ato tradutrio, por
outro lado, novas variveis, surgidas a partir de mudanas concretas na prtica da traduo, interferem e modificam de maneira
significativa as condies de processamento mental dos tradutores. Atualmente, tradutores experientes, alm de incorporarem
ferramentas tecnolgicas, tais como consultas em tempo real e

Traduo, cognio e tecnologia...

187

editorao eletrnica, prtica da traduo, passam, cada vez mais,


a se valer dos sistemas de memria de traduo como forma de
otimizar suas condies de trabalho. Os sistemas de memria de
traduo configuram, portanto, uma varivel adicional recente que
aporta mudanas significativas na forma como seres humanos segmentam e processam o texto para fins de uma traduo. Investigar
de forma emprico-experimental como o uso de sistemas de memria de traduo afeta o processo de traduo cresce, portanto,
em importncia para os pesquisadores interessados na vertente
processual dos Estudos da Traduo.
Buscando uma melhor compreenso desta nova modalidade de
fazer tradutrio, este artigo se prope a analisar pesquisas em dois
campos disciplinares distintos mas complementares: o campo dos
processos cognitivos e do processamento de informao em traduo e o campo das tecnologias de traduo. A partir da reviso da
literatura, o artigo procura destacar a relevncia de se estudar de
forma mais detalhada a interface entre o homem e a mquina no
campo da traduo e prope a estrutura de um projeto de pesquisa
para tal fim.

Quadro terico
Faz parte do senso comum que a traduo de um texto feita
por partes, ou seja, por unidades de traduo. A idia da palavra
como constituinte desta unidade tida por leigos praticamente como
condio sine qua non do processo de traduo. Sabe-se, contudo,
que a segmentao cognitiva em traduo um processo complexo
que no pode ser delimitado exclusivamente por caractersticas
morfolgicas, lexicais ou sintticas. A segmentao em traduo
depende de uma srie de fatores cognitivos e contextuais que abarcam, entre outros, o papel da memria humana, dos processos
inferenciais, da soluo de problemas e da tomada de deciso (cf.
Alves (ed.) 2003; Alves (org.) 2004 e Alves 2005).

188

Fabio Alves

Nesse sentido, no mbito da investigao sobre as interfaces


entre processos cognitivos e sistemas automticos de memria de
traduo, faz-se necessrio explorar a segmentao humana e eletrnica do processo de traduo, discutir o papel da memria humana e computacional, e identificar as caractersticas bsicas dos
sistemas de memria de traduo em sua interface com o tradutor
humano. Dada sua prtica ainda incipiente, so poucos os estudos
feitos at o momento sobre a influncia desses sistemas de memria de traduo sobre o comportamento cognitivo de tradutores.
Dragsted (2004), em tese de doutorado defendida na Escola de
Administrao de Copenhague (Copenhagen Business School), revela que existem diferenas significativas na forma como tradutores segmentam um texto a ser traduzido e como isto feito quando
esses mesmos sujeitos trabalham assistidos computacionalmente
por sistemas de memria de traduo. As concluses de Dragsted
apontam para a necessidade de modificaes na forma como os
atuais sistemas de memria segmentam o texto a ser traduzido a
fim de que tradutores possam, de fato, se beneficiar da interface
com a mquina. Em outras palavras, somente com um melhor conhecimento dos processos de segmentao cognitiva observado entre
tradutores ser possvel emul-los em sistemas virtuais na forma
de uma traduo assistida por computador.
As prximas sees deste artigo buscaro delimitar, em separado, caractersticas especficas a cada uma dessas reas e enfatizar
a necessidade de um melhor entendimento da interface entre elas.

Segmentao cognitiva
Definir a unidade de traduo (daqui em diante, UT) um problema bastante complexo. Na literatura sobre o tema, nota-se uma
linha divisria entre uma corrente de orientao cognitiva e outra
de orientao lingstica. Em uma reviso recente sobre o conceito
de UT, Dragsted (2004) sugere ser necessrio levar em considera-

Traduo, cognio e tecnologia...

189

o tanto a perspectiva lingstica quanto aquela cognitiva, buscando-se uma convergncia entre elas. Para Dragsted, a UT
identificada como sendo um segmento lingstico que pode ser processado pela memria de trabalho do tradutor. Trata-se de uma
delimitao conceitual que pode ser identificada com base nas pausas observadas no decorrer do fluxo do processo de produo textual e que pode variar de acordo com a percepo do nvel de dificuldade de tarefa por parte do tradutor.
Lingisticamente, para Dragsted, a UT pode ser entendida como
um item flexvel abaixo do nvel da sentena, como um item focado
na sentena ou orao, ou como sendo o pargrafo ou o texto. As
duas primeiras categorias no so excludentes j que UTs abaixo
do nvel da sentena podem, s vezes, se constituir no nvel da
orao. Por outro lado, cognitivamente, a UT considerada como
sendo a unidade efetivamente processada pelo tradutor em oposio uma unidade ideal, qual seja, aquela de natureza lingstica.
Concordo com Dragsted que estudos emprico-experimentais sobre o processo de traduo em geral devam privilegiar sobretudo
uma orientao cognitiva em suas definies de UT. Proponho,
portanto, que a UT deve ser identificada inicialmente com base nos
processos cognitivos observveis indiretamente em um conjunto de
dados. Somente aps esta identificao, a UT deve passar por uma
classificao de natureza lingstica. Nesse sentido, uma definio
de UT processualmente relevante deve se afastar de uma perspectiva normativa na qual a UT descrita como o segmento mais apropriado para fins de estabelecimento de uma equivalncia entre os
textos de partida e de chegada. A UT deve, portanto, ser definida
como o segmento efetivamente processado pelo tradutor e em consonncia com a proposta de Alves (2000:128) citada abaixo:
A UNIDADE DE TRADUO um segmento do texto de
partida, independente de tamanho e forma especficos, para o
qual, em um dado momento, se dirige o foco de ateno do
tradutor. Trata-se de um segmento em constante transformao

190

Fabio Alves

que se modifica segundo as necessidades cognitivas e


processuais do tradutor. A UNIDADE DE TRADUO pode
ser considerada como a base cognitiva e o ponto de partida
para todo o trabalho processual do tradutor. Suas caractersticas
individuais de delimitao e sua extrema mutabilidade
contribuem fundamentalmente para que os textos de chegada
tenham formas individualizadas e diferenciadas. O foco de
ateno e conscincia o fator direcionador e delimitador da
UNIDADE DE TRADUO e atravs dele que ela se
torna momentaneamente perceptvel.

A partir da definio de Alves, assume-se, de forma complementar, que os segmentos processados cognitivamente tero sempre uma natureza idiossincrtica, mas podem ser investigados atravs da aferio de parmetros de intersubjetividade entre os sujeitos constituintes de uma determinada amostra. Nesse sentido, a
investigao de aspectos da segmentao cognitiva em traduo
deve se pautar pelo estabelecimento de parmetros comparativos
entre os sujeitos tradutores que participem de um determinado experimento. Para tanto, sugiro que definio proposta por Alves
(2000), seja acrescentada a seguinte definio proposta por Dragsted
(2004:78):
A UT pode ser definida como a compreenso simultnea/
consecutiva na lngua de partida e a produo na lngua de
chegada de um segmento textual cujo tamanho limitado pela
capacidade da memria de trabalho e cujas fronteiras podem
ser identificadas atravs de pausas.

Conseqentemente, seguindo a sugesto de Dragsted, a fim de


tornar observvel ainda que de forma indireta um fenmeno
existente apenas na mente do tradutor, o conceito de UT e sua
segmentao cognitiva precisam ser operacionalizados em termos
de tempo, incluindo-se as pausas observadas ao longo do processo
de traduo. Nesse sentido, os padres de segmentao cognitiva

Traduo, cognio e tecnologia...

191

observados entre tradutores sero decorrentes do tempo real investido pelo tradutor na execuo da tarefa de traduo e delimitados por intervalos de pausa durante o tempo de produo textual.

Segmentao automtica
Em contraposio segmentao cognitiva observada em tradutores, a segmentao computacional existente nos sistemas de
memria de traduo tem uma natureza completamente distinta.
Um sistema de memria de traduo (daqui em diante, SMT) um
banco de dados que armazena e recupera tradues prvias que
compem a base desse sistema. Esta recuperao feita na forma
de sentenas cuja fronteira preferencial o ponto final. A partir
desta marca ortogrfica, um SMT destaca uma sentena determinada na tela do computador e disponibiliza possveis correspondncias para que uma delas venha a ser selecionada pelo tradutor. Os
SMTs tm, portanto, um foco explcito na sentena enquanto instncia de segmentao e delimitao da UT. Eventualmente, esses
sistemas so capazes de executar outros tipos de processamento de
natureza sinttica, mas a segmentao sempre feita atravs de
marcadores ortogrficos, sejam eles o ponto, o ponto e vrgula, a
vrgula e outros sinais ortogrficos previamente definidos. Contudo, no de conhecimento pblico os princpios de programao
computacional que norteiam esta segmentao.
Para fins de exemplificao, o manual do usurio do Translators
Workbench, um SMT de uso bastante disseminado, produzido pela
empresa alem Trados no informa qual o mtodo utilizado pelo
programa para recuperar os segmentos relevantes da sua base de
dados. Aparentemente, o objetivo de um SMT alcanar o nvel
de recuperao mais alto e preciso possvel. Para tanto, esses sistemas calculam a semelhana das ocorrncias ortogrficas
identificadas entre o insumo fornecido pelo texto de partida e as
correspondncias existentes no banco de dados do sistema. O valor

192

Fabio Alves

de recuperao (match value) , portanto, calculado com base no


nmero de caracteres idnticos que ocorrem em uma ordem especfica no insumo e na base. (cf. Reinke, 1999).
Constata-se, assim, uma diferena fundamental entre o processo de segmentao cognitiva natural e a segmentao automtica.
Sabe-se que a sentena no constitui a unidade bsica do processo
de segmentao cognitiva em traduo. Pelo contrrio, os tradutores parecem alternar o foco da UT com predileo por segmentos
micro-textuais abaixo do nvel sentencial. Na busca de uma correlao entre parmetros de segmentao cognitiva natural com os
parmetros da segmentao utilizada pelos SMT, faz-se necessrio abordar adicionalmente as caractersticas da memria humana
e daquela utilizada por sistemas automticos de traduo com o
intuito de verificar se o processo tradutrio e o produto da traduo
so afetados positiva ou negativamente quando se traduz utilizando SMTs.

Caractersticas da memria humana


Nas pesquisas sobre a memria humana parece ser consenso
que a informao processada pelo crebro humano armazenada
em diferentes tipos de memria, cada qual com diferentes capacidades e caractersticas de acesso, armazenamento e recuperao.
Esses diferentes tipos de memria so classificados como sistemas sensoriais, memria de curto prazo, memria de trabalho,
memria de longo prazo, etc.
Miller (1956/1967), em um artigo seminal intitulado The magical
number seven, plus or minus two: some limits on our capacity for
processing information sugeriu que a capacidade limite para
processamento da memria de trabalho estaria restrita entre cinco
e nove itens com uma freqncia predominante em torno do nmero sete. Este parmetro quantitativo vigorou at Baddeley (1986)
propor que o foco principal do conceito de memria de trabalho

Traduo, cognio e tecnologia...

193

no deveria se restringir capacidade limite do nmero de segmentos passveis de armazenamento, mas deveria ser observado a
partir da varivel tempo, diretamente atrelada capacidade de
armazenamento e recuperao de informaes. Obviamente, h
restries quantitativas no que diz respeito quantidade de tarefas
que um dado individuo pode executar simultaneamente, mas o tempo utilizado para a sua execuo em correlao com o nmero de
atividades desempenhadas simultaneamente parece ser um fator
mais relevante na investigao dos processos de memria. A noo de memria de trabalho sugere, portanto, uma correlao entre a recuperao de uma determinada informao e o tempo gasto
nesta execuo. Mesmo que esse tempo de execuo seja extremamente rpido, ser considerado como um processo de elaborao cognitiva e no como um processo decorrente de automatismos
prvios.
Conseqentemente, para fins dos interesses de pesquisa aqui
relatados, a traduo, vista como uma atividade de produo textual que envolve a recuperao de informaes (lingsticas, culturais, contextuais, etc.), deve ser considerada como um processo
no automtico no qual a memria de trabalho do tradutor est
constantemente envolvida, ainda que em graus de magnitude diferenciados. Para que possa construir significado a partir de um determinado insumo lingstico veiculado pelo texto de partida, o tradutor necessita retextualiz-lo na lngua de chegada por intermdio
de um processo que requer o monitoramento cognitivo consciente
das suas atividades. Os trabalhos recentes de Rothe-Neves (2002),
Gonalves (2003) e Dragsted (2004) corroboram experimentalmente
a noo de que a traduo um processo no automtico com alto
grau de monitoramento cognitivo consciente. Esta viso est de
acordo com Gile (1995) para processos de interpretao consecutiva e simultnea, atividades cognitivas de certa forma correlatas
quela da traduo escrita. No caso das pesquisas sobre o processo
de traduo, h evidncias de que, medida que tradutores se tornam mais experientes, cresce sua capacidade de monitorar de for-

194

Fabio Alves

ma consciente o processamento cognitivo de unidades maiores


(Jakobsen, 2003). Isto pode ser mais facilmente observado no caso
de tradutores que se especializam em determinadas reas do conhecimento. Rothe-Neves (2002) encontrou evidncias de que a
memria de trabalho no necessariamente uma condio cognitiva
para assegurar o bom desempenho do tradutor; antes, a experincia e especializao em traduo contribuem para o aperfeioamento desse tipo de memria. Conclui-se, portanto, que os padres
de segmentao do texto de partida de uma traduo em UTs maiores ou menores podem ser correlacionados a padres de
segmentao cognitiva envolvendo informaes de natureza geral.
Ericsson & Kintsch (1995) apontam que o desempenho de atividades complexas exige maior memria de trabalho. A fim de explicar o funcionamento da memria de trabalho em condies de
desempenho de alto nvel, os autores propem a expanso do conceito de memria de trabalho no conceito de memria de trabalho
de longo prazo (daqui em diante, MT-LP). Este tipo de memria
seria resultado de prtica deliberada, um conceito proposto por
Ericsson (2002) para explicar instncias de desempenho de alto
nvel entre atletas, artistas e outros profissionais, incluindo intrpretes e tradutores, com alto rendimento em suas atividades. Nesses casos, a memria de trabalho utilizada por esses indivduos
adquire status de memria de longo prazo em termos de capacidade de armazenamento e recuperao de informaes enquanto mantm caractersticas da memria de trabalho em termos do tempo
necessrio para sua implementao. Em outras palavras, as principais caractersticas da MT-LP so a armazenagem rpida e eficiente e a recuperao de informao seletiva relevante para a
tarefa que est sendo executada. No caso da traduo, isto significa a capacidade especializada por parte do tradutor de recuperar
de forma rpida e eficiente e a partir de determinadas pistas lingsticas e comunicativas segmentos armazenados na MT-LP que
sejam correlatos UT sendo processada em um determinado momento no decorrer do processo de traduo.

Traduo, cognio e tecnologia...

195

Os resultados dos experimentos de Dragsted (2004) fornecem


evidncias conclusivas em favor de uma MT-LP para tradutores
experientes. Trata-se de resultado de certa forma corroborado pelos dados de Rothe-Neves (2002) e Gonalves (2003). Estas concluses so relevantes porque: (1) explicitam que a memria de
trabalho tem uma capacidade limitada determinada pelo tamanho
da UT processada de forma idiossincrtica por tradutores; (2) revelam que a traduo, vista de uma perspectiva cognitiva, envolve
o processamento consecutivo de uma determinada UT nas lnguas
de partida e de chegada e exige esforos de compreenso e produo gerenciados pela capacidade da memria de trabalho; (3) indicam que essa natureza dual leva tradutores a desenvolver um tipo
especfico de memria especializada, qual seja, a MT-LP; (4) demonstram que esse tipo diferenciado de memria pode ser mapeado
atravs de pausas registradas no fluxo do processo de produo
textual; (5) evidenciam que a segmentao cognitiva natural em
traduo muda de acordo com o grau de especializao da memria do tradutor e gera UTs mais longas medida que aumentam a
eficincia e a rapidez da MT-LP.

Sistemas de memria de traduo


Uma vez constatadas as principais caractersticas da memria
de trabalho e um possvel desenvolvimento em direo a uma MTLP, parece-me pertinente avaliar as caractersticas da memria
existente nos SMT para, posteriormente, discutir implicaes para
os processos de segmentao cognitiva natural em traduo, tecer
analogias e fazer comparaes entre a segmentao cognitiva natural e aquela realizada em ambiente assistido por sistemas semiautomticos.
A partir da premissa, atualmente no hegemnica, que existe
uma linguagem universal baseada em princpios lgicos e smbolos
icnicos, as primeiras tentativas para mecanizar a traduo de textos

196

Fabio Alves

foram feiras na Frana e na Rssia nas dcadas de 1930 e 1940.


Pouco mais tarde, Shannon & Weaver (1949) propuseram a utilizao de computadores para executar tradues automticas. Esta
proposta resultou em uma srie de pesquisas que buscavam impulsionar a traduo automtica e implement-la de forma dissociada
do tradutor (cf. Hutchins & Somers, 1992). A partir de ento, como
prope Dragsted (2004), a histria da traduo automtica pode
ser dividida em trs geraes.
Os trabalhos da primeira gerao eram baseados em dicionrios e envolviam o desenvolvimento de sistemas de substituio completa por meio dos quais a traduo era executada palavra por palavra. O processo de traduo estava sujeito a alguns arranjos de
natureza morfolgica e manipulaes na ordem vocabular do texto
de partida, mas consistia, quase exclusivamente, na busca de equivalentes lexicais por meio de entradas dicionarizadas (cf. Somers,
1998). O objetivo era alcanar uma traduo automtica total de
alta qualidade, conhecida pela sigla inglesa FAHQT (fully automatic
high quality translation). Uma vez que a maioria dos pesquisadores
envolvidos nessas pesquisas no eram lingistas e/ou tradutores,
no de se admirar que os trabalhos prescindissem de uma anlise
da estrutura interna do texto de partida. A preocupao dos cientistas da computao, proponentes da maioria desses projetos da primeira gerao de sistemas de traduo automtica, era voltada
diretamente para a construo de algoritmos de base lgica. Como
conseqncia, os produtos das primeiras FAHQT apresentavam
limitaes que geravam inconsistncias de base lexical, sinttica e
semntica. Aspectos discursivo-pragmticos da traduo no chegavam sequer a ser considerados. Apesar de um otimismo inicial,
os trabalhos de pesquisa desta primeira gerao de sistemas de
traduo automtica ficaram severamente comprometidos com a
divulgao do relatrio Bar-Hillel em 1960. Esta publicao do
pesquisador do MIT recomendava que a FAHQT tivesse objetivos
menos ambiciosos e reconhecia suas limitaes de natureza semntica e implicitamente discursivas (cf. Hutchins & Somers,

Traduo, cognio e tecnologia...

197

1992). Esta primeira fase em busca de FAHQT terminou com a


publicao do relatrio ALPAC em 1966. Este trabalho concluiu
que a traduo automtica era mais lenta, menos precisa e muito
mais onerosa que a traduo executada por seres humanos. Foram
drsticas as repercusses deste relatrio. Em decorrncia da concluso que no havia um futuro imediato para a traduo automtica, os investimentos de pesquisa na rea de FAHQT foram congelados nos EUA.
A segunda gerao de pesquisas sobre traduo automtica foi
desenvolvida sobretudo no Canad e na Europa. A principal caracterstica desta segunda fase o reconhecimento por parte dos pesquisadores da necessidade de uma abordagem lingstica mais sofisticada. A idia bsica consistia na proposio de uma abordagem indireta atravs da qual o texto de partida era transformado
em um texto de chegada atravs de uma representao intermediria (cf. Somers, 1998; Lehrberger & Bourbeau, 1988). Os trabalhos de pesquisa pautavam-se, em sua grande maioria, por um
mtodo de transferncia por meio do qual estruturas sintticas da
lngua de partida eram transformadas em estruturas sintticas na
lngua de chegada. Apesar de se trabalhar com a idia de uma
representao intermediria, o foco continuava a recair no
processamento sinttico da linguagem. No decorrer da dcada de
1980, os pesquisadores no campo da traduo automtica comearam a perceber as limitaes desta segunda gerao de FAHQT.
Chegou-se ao consenso de que a traduo automtica teria que abordar outras questes alm daquelas meramente sintticas e semnticas. Deveria ser levado em conta que o processo de traduo
pressupe a compreenso do texto a ser traduzido e sua produo
no contexto diferenciado da lngua de chegada, sugestes feitas pelo
relatrio Bar-Hillel em 1960.
A terceira gerao de pesquisas sobre traduo automtica surge nos anos 1990 como o desenvolvimento de uma abordagem
emprica baseada em textos paralelos, na lingstica de corpus e no
tratamento estatstico dos dados. Segundo Somers (1998), esta abor-

198

Fabio Alves

dagem emprica pode ser dividida em dois sub-grupos: um grupo


baseado em exemplos e outro com base estatstica. No primeiro
caso, a traduo era feita atravs da comparao de um determinado insumo da lngua de partida com uma base bilnge em um
corpus com exemplos tpicos de traduo; as correspondncias mais
freqentes so utilizadas como modelo para a produo do texto
traduzido. Acreditava-se que este mtodo geraria tradues menos literais que aquelas baseadas na estrutura sinttica dos textos a
serem traduzidos. Crticos desta vertente argumentavam que os
corpora bilnges utilizados eram restritos e, conseqentemente,
no tinham validade em termos das possibilidades reais de se vir a
traduzir um determinado texto. No segundo caso, os sistemas estatsticos trabalhavam com base nas probabilidades de ocorrncia de
segmentos com base num conjunto de milhes de palavras armazenadas em um corpus de textos paralelos. Nesse caso, a escolha de
equivalentes lexicais e a estrutura sinttica do texto traduzido eram
feitas com base em combinaes probabilsticas. Apesar de reconhecer o potencial de generalizao desta segunda alternativa, seus
crticos argumentavam que a ela faltava a naturalidade da traduo
observada em sistemas mais fechados como aquele baseado em
exemplos.
Em decorrncia dessas discusses, chegou-se concluso que
sistemas automticos de traduo, pelo menos em sua presente
forma, necessitavam ser monitorados por seres humanos. Surgem,
assim, os primeiros textos paralelos em formato eletrnico preparados para serem trabalhados por tradutores, os primeiros SMT.
Inicialmente, em vez de se trabalhar com a proposta de uma
FAHQT, o enfoque passa a recair sobre uma traduo automtica
assistida por seres humanos, conhecida pela sigla inglesa HAMT
(human aided machine translation), na qual o computador executa a
traduo e auxiliado por seres humanos em diversos estgios,
tais como, pr-edio, intervenes durante a produo e/ou reviso. Contudo, com o desenvolvimento da proposta de uma interface
entre a mquina e o homem, observou-se que a traduo automti-

Traduo, cognio e tecnologia...

199

ca ainda apresentava problemas bsicos que exigiam a interveno


constante do tradutor. Verificou-se que a atividade do ser humano
tem proeminncia em relao atividade do computador. Em conseqncia, surgiu uma nova vertente denominada traduo humana
assistida por computador, conhecida pela sigla inglesa MAHT
(machine aided human translation). Nesta nova forma, cabe ao tradutor o papel central no processo de traduo e o computador aparece como ferramenta auxiliar para a recuperao de informaes
previamente armazenadas a serem disponibilizadas para um possvel uso pelo tradutor. Este artigo faz uma opo preferencial por
MAHT por acreditar que um corpus formado por tradues j existentes conter mais solues para problemas de traduo que outros recursos eletrnicos disponveis (cf. Isabelle et al, 1993).
Um SMT que trabalha dentro das bases propostas para uma
MAHT pode ser definido, segundo Freigang (1998), como um sistema que permite o processamento computacional de um texto de
partida em formato eletrnico para fins de produo de uma traduo tendo o tradutor como gerenciador de todos os estgios do processo e responsvel pela atividade intelectual de produo textual.
Este sistema tambm empregar o conceito de UT analisado anteriormente. Contudo, um SMT no pode prescindir de uma UT definida a priori. Neste sentido, a UT em um SMT conceitualmente
distinta daquela definida a partir de um enfoque cognitivo.
Um SMT pode ser alimentado de duas maneiras. Na primeira
delas o tradutor interage com o sistema e o insumo lingstico vai
sendo armazenado medida que o tradutor avana no trabalho de
traduo. Desta forma, assim que um determinado segmento
armazenado, este se torna disponvel para fins de recuperao caso
seja identificado como correspondente a um insumo lingstico subseqente. A segunda forma de armazenamento de um SMT consiste em aliment-lo com fontes textuais disponveis sobre um assunto especfico. Antes que tais recursos possam ser utilizados pelo
tradutor, necessrio alinh-los com os segmentos correspondentes de um dado texto de partida. possvel fazer um alinhamento

200

Fabio Alves

automtico por meio de ferramentas fornecidas pelo Translators


Workbench (cf. Trados, 2003). Contudo, este alinhamento automtico precisa ser verificado pelo usurio e importado para o SMT.
Para fins de pesquisas experimentais, este artigo defende o uso do
segundo procedimento. Esta deciso no descarta o uso da primeira modalidade quando da prtica de experimentao, mas procura
garantir que o usurio ter uma resposta do SMT quando estiver
desempenhando a tarefa de traduo. Isto se faz necessrio, pois
no caso de no encontrar uma correspondncia para determinado
segmento do texto de partida, o SMT registrar a informao NO
MATCH (sem correspondente) na janela utilizada pelo programa
para fornecer sugestes ao tradutor.
Em vista das similaridades operacionais entre o Translators
Workbench da Trados e outros SMTs (Dej Vue, ISDLX,
WordFast, Transit, etc.), assume-se que os resultados experimentais de um SMT possam ser generalizados em relao a outros
sistemas similares. Para que uma sentena (ou um outro segmento) possa ser recuperada por um SMT necessrio que ela tenha
uma semelhana de 30% a 100% com o insumo disponibilizado
como texto de partida. Cabe ao tradutor decidir o grau de similaridade com que deve operar. O Translators Workbench trabalha com
uma referncia padro de 70% de correspondncia entre sentenas (ou segmentos) e ocorrncias com similaridade inferior a 50%
so consideradas irrelevantes (cf. Trados, 2003).

Em busca de hipteses de trabalho


Considerando-se que um SMT opera a partir de um foco explcito na sentena, qual seja, sua UT padro, tem-se como conseqncia que o tradutor assistido por um SMT recebe em uma
janela na tela do computador uma sentena do texto de partida.
Isto, segundo afirma Dragsted (2004), pode levar o tradutor a
priorizar o processamento da UT no nvel da sentena quando, se

Traduo, cognio e tecnologia...

201

pudesse agir espontaneamente, o tradutor poderia segmentar o


mesmo trecho de forma distinta e, provavelmente, mais prxima
aos padres naturais de segmentao cognitiva. Este forte enfoque
na sentena por parte dos SMT pode ter efeitos no processo e no
produto da traduo.
luz dessas reflexes e a fim de investigar se, de fato e de que
maneira, os SMT afetam o processo de traduo, este artigo levanta as seguintes hipteses de trabalho:
1) A integrao de um SMT ao processo de traduo ter impacto no tempo de produo global bem como no tempo dedicado especificamente edio e reviso da traduo;
2) O processo de segmentao padro utilizado por um SMT
(com foco na sentena) levar tradutores a mudar o padro
de segmentao cognitiva observado em circunstncias naturais;
3) Dependendo do nvel de experincia, os tradutores sero mais
ou menos afetados pelo processo de segmentao imposto
por um SMT.
Uma vez que sejam mensurados os padres de segmentao
cognitiva natural e aqueles norteados por um foco em sentenas,
poder-se- avaliar qual o impacto de um SMT no processo de
segmentao cognitiva de tradutores e em que medida este impacto interfere nas decises do tradutor. Diante dessas constataes,
sero levantadas duas outras hipteses:
4) A modificao no processo de segmentao padro utilizado
por um SMT levar tradutores a trabalharem mais prximo
ao padro de segmentao cognitiva observado em circunstncias naturais;
5) A segmentao cognitiva de tradutores novatos ser mais
afetada que aquela de tradutores experientes devido presena e/ou ausncia de um SMT no processo de traduo.

202

Fabio Alves

Por uma metodologia exploratria


Nas cincias sociais existe uma tradio consolidada que defende o uso de mtodos quantitativos e qualitativos como formas complementares de se levantar dados a partir de pontos de observao
diferenciados. Chama-se esta opo metodolgica de triangulao.
Jakobsen (1999) explica que a metfora da triangulao tem sua
origem nas tcnicas de navegao e na estratgia militar. Ambas
utilizam pontos de referncia mltiplos para localizar a posio
exata de um determinado objeto no espao. Por analogia, investigar um mesmo objeto por meio de dados coletados e interpretados
atravs de mtodos diferentes aumenta as chances de sucesso do
pesquisador em sua tentativa de observao, compreenso e explicao de um determinado fenmeno.
O caso da traduo no diferente. Jakobsen (1999) comenta
que nos estudos da traduo, sobretudo dentro das universidades
europias, existe muito pouco espao para pesquisas experimentais de laboratrio que priorizem uma abordagem quantitativa.
Muitos pesquisadores tm receio de serem rotulados de
behavioristas e, por isso, evitam a incluso de metodologias quantitativas em seus trabalhos de pesquisa. Contudo, observa-se continuamente nas investigaes sobre a natureza do processo de traduo uma necessidade concreta de se tabular e sistematizar dados
atravs de anlises estatsticas.
A triangulao apresenta-se, pois, como uma alternativa
metodolgica para pesquisas emprico-experimentais em traduo
que almejam esclarecer com objetividade caractersticas processuais do processo de traduo sem, porm, desprezar sua natureza
subjetiva. Procura-se, desta forma, identificar convergncias e
divergncias nas investigaes de natureza quantitativa e qualitativa e, atravs do cruzamento dos dados obtidos por intermdio de
abordagens metodolgicas mltiplas, chegar a resultados mais
confiveis, mais generalizveis e, por conseguinte, mais capazes
de elucidar questes cruciais para os estudos da traduo.

Traduo, cognio e tecnologia...

203

Em Alves (2003) apresento uma proposta de triangular dados


processuais e criar um banco de dados que permita, a partir de
estudos de caso, um maior poder de generalizao para as pesquisas processuais em traduo. O CORPRAT Corpus Processual
para Anlises Tradutrias um sub-corpus do CORDIALL
Corpus Discursivo para Anlises Lingsticas e Literrias desenvolvido conjuntamente por pesquisadores do Ncleo de Estudos da
Traduo (NET) da Universidade Federal de Minas Gerais. A
metodologia utilizada no mbito do CORPRAT pauta-se pelo
paradigma da triangulao e busca maior rigor na sistematizao
de critrios para fins de desenho experimental, coleta e anlise de
dados. No cenrio internacional, esta metodologia atualmente
desenvolvida e utilizada conjuntamente por pesquisadores da Universidade Autnoma de Barcelona, da Copenhagen Business School
e da York University (cf. Alves (ed.), 2003 e Alves (org.), 2004).

Desenho experimental
Um dos maiores desafios em um desenho de natureza empricoexperimental o controle de variveis. Idealmente, devem ser controladas todas as variveis de um determinado estudo, mantendose como varivel independente o fator que se deseja investigar. Proponho, neste artigo, que o SMT deve configurar a varivel independente para pesquisas que tenham por objetivo investigar as implicaes desta tecnologia de traduo na segmentao cognitiva em ambiente natural em comparao com aquela realizada em ambiente
assistido por computador. As demais variveis, incluindo os sujeitos
tradutores, os textos, a tarefa e as condies de produo, devem
ser consideradas variveis dependentes afetadas pela presena da
varivel independente, qual seja, a utilizao de um SMT.
Os sujeitos de pesquisa devem ser tradutores de textos
especializados haja vista que a utilidade dos SMT se d majoritariamente em tradues de/para este tipo de texto. A traduo de

204

Fabio Alves

outros gneros textuais, tais como a traduo literria, por sua


especificidade, no consegue alimentar adequadamente um SMT
e, portanto, no deve ser priorizada. A experincia prvia com um
SMT deve configurar tambm pr-requisito para a seleo dos sujeitos, haja vista o fato que no haver treinamento deliberado para
esta modalidade cuja prtica tambm dever estar controlada. Os
tradutores devero traduzir textos em ambiente natural e em ambiente assistido por computador. Desta forma, poder-se- medir e
comparar entre sujeitos os padres de segmentao cognitiva observados em cada um dos ambientes.
No que se refere aos textos para os experimentos, observa-se
aqui um problema crucial com relao ao controle das variveis do
experimento. Se os tradutores traduzirem textos diferentes em cada
um dos ambientes, natural e assistido por computador, no ser possvel mensurar qual a influncia dos textos no processo de
segmentao. Em outras palavras, no ser possvel afirmar com
segurana se diferenas de processamento ocorrero devido aos
ambientes diferenciados ou a diferenas textuais. Por outro lado, se
forem mantidos os mesmos textos, no ser possvel afirmar com
segurana se diferenas observveis so resultado da segmentao
em ambientes diferenciados ou devido a efeitos da memria (natural
e virtual) no processo de traduo. Uma soluo para este impasse
pode ser encontrada na preparao dos textos para fins de experimentao. Proponho, portanto, que sejam utilizados pares de textos
de forma a que venham a constituir uma varivel dependente. Nesse
sentido, os textos utilizados na primeira fase de um desenho experimental que avalia a segmentao em ambiente natural devero ser
correlatos aos outros textos utilizados na segunda fase que avalia a
segmentao em ambiente assistido por um SMT.
A coleta de dados dever ser conduzida de acordo com os procedimentos metodolgicos especificados em Alves (2003) por meio
da triangulao de dados processuais. Para registrar padres de
segmentao cognitiva em ambiente natural ser utilizado o programa Translog, um programa de informtica que grava os movi-

Traduo, cognio e tecnologia...

205

mentos registrados no teclado do computador e permite ao pesquisador avali-los em termos de tempo de durao e de pausas e,
com base nessas anlises, verificar como tradutores com diferentes nveis de competncia tradutria segmentam textos semelhantes em ambiente natural. Para registro dos padres de segmentao
cognitiva em ambiente assistido por computador ser utilizado o
Translators Workbench, um SMT comercial desenvolvido pela
empresa Trados. Como explicitado anteriormente, o princpio bsico deste programa, assim como de qualquer outro SMT, consiste
no armazenamento em um banco de dados de pares de estruturas
lingsticas (preferencialmente sentenas) e na recuperao automtica de ocorrncias similares disponveis neste banco de dados.
Ainda de acordo com a metodologia proposta em Alves (2003),
logo aps a concluso da traduo nos dois ambientes (natural e
assistido por computador), sero coletados relatos retrospectivos,
gravados digitalmente, obtidos por intermdio da visualizao do
processo de traduo atravs da funo replay do Translog com
acelerao de 500% e/ou das gravaes feitas com o Translators
Workbench da Trados. As consultas feitas em tempo real pelos
tradutores sero monitoradas e gravadas atravs do programa
Camtasia e aquelas oriundas de fontes impressas identificadas quando dos relatos retrospectivos. Finalmente, em consonncia com a
proposta feita em Jakobsen (2002) e Alves (2005), os textos de chegada sero utilizados como parmetros de aferio das diferentes
etapas do processo de traduo e diferenciados entre textos concludos quando do trmino da fase de redao e textos modificados
durante a fase de reviso. Nesse sentido, de acordo com Lorenzo
(2004), a reviso considerada como uma fase diferenciada do
processo de traduo e analisada em separado.
Posteriormente, os dados coletados por intermdio do Translog e
do Translators Workbench sero tratados estatisticamente por meio
de anlises correlacionais para aferir parmetros de significncia e
varincia. As anlises qualitativas sero complementadas por anlises qualitativas com base nos relatos retrospectivas relacionados a
cada uma das tarefas de traduo.

206

Fabio Alves

Consideraes finais
Como mencionado no incio deste artigo, dada sua prtica ainda
incipiente, so poucos os estudos feitos at o momento sobre a influncia dos sistemas de memria de traduo sobre o comportamento
cognitivo de tradutores. Estudos preliminares revelam que existem
diferenas significativas entre a modalidade natural e aquela assistida por computador. Esses estudos parecem apontar para a necessidade de modificaes na forma como os atuais sistemas de memria segmentam o texto a ser traduzido a fim de que tradutores possam, de fato, se beneficiar da interface com a mquina. Ganham,
portanto, importncia pesquisas que visam a um melhor conhecimento dos processos de segmentao cognitiva observado entre tradutores e na comparao com formas de traduo assistida por computador. So perspectivas que este artigo aponta como promissoras
para fomentar o dilogo entre a teoria e a prtica e, de forma complementar, qualificar programas de formao de tradutores no pas.

Referncias

ALVES, F. Um modelo didtico do processo tradutrio: a integrao de estratgias


de traduo. In Alves, F., Magalhes, C., Pagano A. Traduzir com autonomia:
estratgias para o tradutor em formao. So Paulo: Contexto. 2000.
ALVES, F. Traduo, cognio e contextualizao: triangulando a interface processoproduto no desempenho de tradutores novatos. D.E.L.T.A., Campinas, v.19,
p.71-108, 2003.
ALVES, F. (ed.). Triangulating translation: perspectives in process oriented
research. (Benjamins Translation Library 45). Amsterdam: John Benjamins, 2003.

Traduo, cognio e tecnologia...

207

ALVES, F. (Org.) Cadernos de Traduo X/2: O processo de traduo.


Florianpolis: NUT. 2004. Volume especial sobre o processo de traduo organizado
por Fabio Alves.
ALVES, F. Ritmo cognitivo, meta-reflexo e experincia: parmetros de anlise
processual no desempenho de tradutores novatos e experientes. In Pagano, A.,
Magalhes, Alves, F. (Org.). Competncia em traduo: cognio e discurso.
Belo Horizonte: Editora UFMG. 2005.
ALVES, F. & GONALVES, J.L.V.R. A relevance theory approach to the
investigation of inferential processes in translation. In Alves, F. (Ed.). Triangulating translation: perspectives in process oriented research. Amsterdam: John
Benjamins, 2003.
BADDELEY, A. Working memory. Oxford: Clarendon Press. 1986.
DRAGSTED, B. Segmentation in translation and in translation memory systems.
An empirical investigation of cognitive segmentation and effects of integrating a TM
system into the translation process. (Tese, Doutorado em traduo). Copenhagen
Business School. Copenhague. 2004.
ERICSSON, K.A & KINTSCH, W. Long-term working memory. In Psychological Review 102/2. p.211-245. 1995.
ERICSSON, K.A. Expertise in interpreting. An expert-performance perspective.
In Interpreting 5/2. p.187-220. 2002.
FRASER, J. The translator investigated: Learning from translation process analysis. In The Translator 2/1. p.65-79. 1996.
FREIGANG, K.-H. Machine-aided translation. In Baker, M. (Ed.), Routledge
encyclopedia of translation studies. Londres: Routledge. p.134-136. 1998.
GILE, D. Basic concepts and models for interpreter and translator training.
Amsterdam: John Benjamins. 1995.

208

Fabio Alves

GONALVES, J.L.V.R. O desenvolvimento da competncia do tradutor:


investigando o processo atravs de um estudo exploratrio-experimental. Faculdade
de Letras da Universidade Federal de Minas Gerais. Belo Horizonte. 2003. (Tese,
Doutorado em Estudos Lingsticos). Indito.
HANSEN, G. Probing the process in translation: methods and results. Copenhagen:
Samfundslitteratur. 1999. (Copenhagen Studies in Language Series, 24).
HANSEN, G. (Ed.). Empirical translation studies: process and product.
Copenhague: Samfundslitteratur. 2002. (Copenhagen Studies in Language Series,
27).
HUTCHINGS, W.J. & SOMERS, H.L. An introduction to machine translation.
London: Academic Press. 1992.
ISABELLE, P. et al. Translation analysis and translation automation. In Proceedings of the fifth international conference on theoretical and methodological
issues in machine translation, Kioto. 1993.
JAKOBSEN, A.L. Logging target text production with Translog. In Hansen,
G. (Ed.) Probing the process in translation: methods and results. Copenhagen:
Samfundslitteratur. 1999. (Copenhagen Studies in Language Series, 24).
JAKOBSEN, A.L. Orientation, segmentation, and revision in translation. In
Hansen, G. (Ed.). Empirical translation studies: process and product. Copenhague:
Samfundslitteratur. 2002. (Copenhagen Studies in Language Series, 27).
JAKOBSEN, A.L. Effects of think-aloud on translation speed, revision, and
segmentation. In Alves, F. (Ed.) Triangulating translation: perspectives in process oriented research. Amsterdam: John Benjamins. 2003.
LAUFFER, S. The translation process. An analysis of observational methodology.In
Cadernos de Traduo X/2: O processo de Traduo, p.59-74, 2004.
LEHRBERGER, J. & BOURBEAU, L. Machine translation, linguistic characteristics of MT systems and general methodology of evaluation. Amsterdam: John
Benjamins. 1988.

Traduo, cognio e tecnologia...

209

LORENZO, M.P. Competencia revisora y traduccin inversa. In Cadernos de


Traduo X/2: O processo de Traduo, p.133-166, 2004.
LRSCHER, W. A model for the analysis of translation processes within the
framework of systemic linguistics. In Cadernos de Traduo X/2: O processo de
Traduo, p.97-112, 2004.
MILLER, G.A. The psychology of communication. Seven essays. New York/
London: Basic Books Inc. 1967.
PACTE. Building a translation competence model. In: Alves, F. (Ed.). Triangulating translation: perspectives in process oriented research. Amsterdam: John
Benjamins. 2003.
REINKE, U. Evaluierung der linguistischen Leistungsfhigkeit von Translation
Memory-Systemen. Ein Erfahrungsbericht. In: LDV-Forum 16, p.100-117. 1999.
ROTHE-NEVES, R. Caractersticas cognitivas e desempenho em traduo:
investigao em tempo real. Faculdade de Letras da Universidade Federal de Minas
Gerais. Belo Horizonte. 2002. (Tese, Doutorado em Estudos Lingsticos). Indito.
SHANNON, C. & WEAVER, W. The mathematical theory of communication.
Urbana: University of Illinois Press, 1949.
SOMERS, H. Machine translation. In Baker, M. (Ed.) Routledge encyclopedia of
translation studies. Londres: Routledge. p.136-139. 1998.
TIRKKONEN-CONDIT, S. & R. JSKELINEN, R. (eds.) Tapping and
mapping the process of translation: outlooks on empirical research, Amsterdam:
John Benjamins. 2000.
TRADOS. Translators Workbench user guide. Dublin: TRADOS. 2003.