Você está na página 1de 46

313

LINGSTICA DE CORPUS E TRADUO TCNICA RELATO DA MONTAGEM DE UM CORPUS MULTIVARIETAL DE CULINRIA


Stella E. O. Tagnin* Elisa Duarte Teixeira**
RESUMO: A Lingstica de Corpus, enquanto metodologia, tem se mostrado de extrema valia para a Traduo Tcnica, seja para a prtica tradutria em si, seja para o desenvolvimento de suas reas afins como, por exemplo, a Terminologia. No presente artigo, relatamos a construo de um corpus multivarietal comparvel de receitas em portugus brasileiro/europeu e ingls americano/britnico. A motivao para tal pesquisa foi a presena cada vez maior de obras da rea editadas em portugus europeu no mercado editorial brasileiro. A explorao do corpus coletado revelou que as diferenas lexicais, sintticas e culturais entre as variantes do portugus, comparadas s das variantes do ingls, so mais expressivas, justificando tradues na variante brasileira e obras terminolgicas que explicitem essas diferenas. UNITERMOS: Lingstica de Corpus; Traduo Tcnica; Critrios de construo de corpora; Estudos Contrastivos; Culinria ABSTRACT: Corpus Linguistics, as a methodology, has been shown to be extremely valuable for Technical Translation, both for translation practice and terminological research. This article reports on the construction of a multivariant corpus of cooking recipes in Brazilian and European Portuguese and American and British English. Our research was motivated by the ever-growing number of European

* Universidade de So Paulo, Brasil. ** Aluna de mestrado em Lngua Inglesa pela Universidade de So Paulo (elisadut@usp.br), bolsista Capes.

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

313

21/9/2010, 13:55

314
Portuguese cookbooks sold in the Brazilian market. The investigation of our corpus has revealed that the lexical, syntactic and cultural differences between the Portuguese variants are more expressive than those between the English variants. We claim that this would justify Brazilian translations of these books and terminological reference works which make these differences explicit.

KEYWORDS: Corpus Linguistics, technical translation, corpus building: criteria and organization, contrastive studies, Cooking.

I. Traduo tcnica e Terminologia a situao da Culinria no Brasil


A Culinria, alm de ser um saber que permeia vrias reas do conhecimento (como a literatura, a histria, a nutrio, a agricultura, a qumica e a fsica), carrega consigo marcas indelveis da cultura de um povo, regio, e/ou pas. No entanto, tanto o mercado editorial brasileiro quanto os terminlogos e estudiosos da rea parecem no ter se dado conta da ligao profunda entre a cultura de um pas e seu universo culinrio. Isso pode ser atestado, por exemplo, pela presena aparentemente grande de edies portuguesas de livros de receitas e obras de referncia (como glossrios e guias) nas livrarias brasileiras. At mesmo as publicaes terminolgicas brasileiras na rea, que so escassas, parecem no fazer distino entre as variantes brasileira e europia. Veja-se, por exemplo, o Dicionrio-Almanaque de Comes & Bebes, de Cludio Fornari (2001), que traz, pgina 27, estas duas definies, na seqncia: Alourar. Dar aos alimentos uma cor dourada, tostando-os no fogo ou no forno, inclusive pincelando-os previamente com uma gema (no caso de massa). Corar. Alperche. Tipo de damasco grande, com cheiro semelhante ao do pssego.

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

314

21/9/2010, 13:55

315
Embora tais definies possam estar corretas (diferentemente da definio que o autor d para Allspice.1 Mistura de cravo, gengibre, pimenta-do-reino, noz-moscada e canela, podendo receber outros temperos. V. tb. Cinq pices.), do ponto de vista da traduo tcnica, a presena desses termos seria inconcebvel, tanto numa traduo de receita brasileira quanto num glossrio tcnico da rea. Isso porque, ainda que esses termos faam parte do inventrio da lngua geral, no so comumente usados na linguagem tcnica corrente da variante brasileira. Como salientou Roman Jakobson em seu texto clssico Aspectos lingsticos da traduo (1979): As lnguas diferem essencialmente naquilo que devem expressar, e no naquilo que podem expressar. Essa uma preocupao central da traduo, especialmente da traduo tcnica a naturalidade: como as coisas, de fato, so ditas numa dada rea de uma dada lngua ou variante lingstica. Nesse sentido, a Lingstica de Corpus tem exercido um papel incontestvel na evoluo dos estudos tradutolgicos e terminolgicos, por insistir na noo de linguagem enquanto objeto de pesquisa cujos fenmenos s podem ser observados em textos autnticos, produzidos naturalmente, sejam eles escritos ou falados (Teubert, 2001). Dicionrios bilnges, de modo geral, costumam apresentar apenas uma lista de equivalentes, de pouca ou nenhuma ajuda ao tradutor, pois no fornecem informaes que permitam uma adequao dos termos a um contexto especfico (Vradi e Kiss, 2001). Alm disso, a terminologia tradicional costuma desprezar as ocorrncias multi-palavras ou lexias complexas, ou colocaes2 , via de regra, as que apresentam maior dificuldade na traduo. O primeiro dicionrio de lngua geral a dar um tratamento mais adequado a essas unidades multi-palavras fazendo uso de dados provenientes de corpora eletrnicos foi o Collins Cobuild English Dictionary, de lngua inglesa, editado em 1987, sob a su-

1 2

Pimenta-da-jamaica Em ingls, collocations. Termo introduzido por Firth, uma unidade lingstica que se caracteriza pela combinao consagrada de seus elementos (Tagnin, 1989, p. 81), por exemplo, pimenta-do-reino moda na hora ou claras em neve

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

315

21/9/2010, 13:55

316
perviso do lingista John Sinclair. O uso de corpora vem se difundindo de tal maneira desde ento que fazer lexicografia sem usar corpora eletrnicos algo praticamente impensvel nos dias de hoje,3 conforme afirma Willem Meijs (1996, p. 100). E isso se aplica tambm terminologia. De acordo com Baker (1995, p. 223), uma especialista na rea dos Estudos Tradutolgicos: a terminologia baseada em corpus, atualmente, no a exceo, mas sim a regra.4 A terminologia no Brasil, nesse sentido, ainda se encontra, aparentemente, mais voltada para a exceo do que para a regra. Contudo, alm dos dicionrios, o tradutor da rea tambm pode apoiar-se nas informaes dispostas em guias, os quais, muitas vezes, esto centrados em subreas especficas da culinria, tais como as tcnicas de cozinha (preparao de carnes, doces, licores; uso de microondas; etc.) ou os ingredientes (temperos; frutas; cereais; etc.). Esse tipo de material mais difcil de se encontrar, pois, muitas vezes, so anexos, separatas, brochuras que acompanham revistas ou produtos em supermercados, etc. Mas alguns, mais bem cuidados, chegam s livrarias, como veremos a seguir. O livro Ervas e especiarias na cozinha (Junqueira, 1980), por exemplo, traz uma minuciosa descrio de cerca de 70 variedades de ervas, especiarias e temperos, com: a) nome cientfico; b) ilustrao; c) termos equivalentes em espanhol, francs, italiano, ingls e alemo;5 d) um breve histrico do uso do tempero; e e) como comprar e como usar, entre outros. Em seguida h por volta de cem receitas em que esses so empregados como ingredientes. Seria uma obra muito til para consulta, caso seu ndice remissivo remetesse no s s informaes completas de cada tempero, mas tambm s receitas em que so empregados,
3

lexicography without computerized corpus data is practically unthinkable nowadays corpus-based terminology compilation is now the norm rather than the exception Maria Lcia Gomensoro, autora do Pequeno Dicionrio de Gastronomia (1999), baseou-se nesse livro de Junqueira para montar seus verbetes multilges de ervas e especiarias, muitas vezes copiando ipsis litteris a informao fornecida.

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

316

21/9/2010, 13:55

317
para que o tradutor verificasse o uso do termo no contexto culinrio e suas possveis colocaes (por exemplo, pimenta-doreino moda na hora ou canela em pau). Alm dos dicionrios, no poderamos deixar de mencionar e tambm comentar aquelas obras que, embora no sejam de referncia, podem trazer muitas informaes relevantes para o tradutor da rea. Uma delas a intitulada Ingredientes (Werle & Cox, 2000), no formato 21x28 cm, com 384 pginas e incontveis fotos, uma para cada ingrediente relacionado na obra. Ou seja, um osis para o tradutor ou especialista/pesquisador da rea! No entanto, a miragem logo se desfaz: apesar de um brasileiro assinar a traduo (conforme soubemos depois), o que se v na obra so pginas e mais pginas de termos em portugus... europeu! Lemon grass, da primeira pgina das Ervas, por exemplo, virou Ervade-limo, em vez do nosso capim-cidreira / capim-limo / capim-santo... Essa mesma erva foi o termmetro a avisar que O Guia das Especiarias. Guia do conhecedor (Craze, 1998), de capa dura, muitas ilustraes e 192 pginas, padecia do mesmo problema um certo hermetismo para o leitor brasileiro (aqui a erva mencionada acima recebe outro nome ainda: ch-do-prncipe; essa equivalncia s foi percebida pela foto e pelo nome cientfico coincidentes). A capa, a estante da livraria, a folha de catalogao da obra (no consta local de publicao), nada informa ao consumidor desavisado que a publicao em portugus europeu e que, muito provavelmente, em vez de adquirir um guia muito til para sua biblioteca, Essencial para usar na Culinria, Cosmtica e Medicina (dizeres da capa do livro), ele est comprando um guia de curiosidades, que lhe causar muito estranhamento: grosdo-paraso, galanga-de-java, aafroa, cravinho, nula-campana, murta, papoila-da-ndia, qussia, calicanto, cubeba e alforva so algumas das especiarias elencadas no livro. Para ilustrar melhor essa questo das escolhas lexicais feitas por culturas distintas, transcrevemos abaixo uma receita escrita originalmente em portugus europeu.6 Qual no seria o
6

Receita retirada do site portugus: www.gastronomia.oninet.net, em maio de 2003.

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

317

21/9/2010, 13:55

318
espanto do entusiasmado chef-de-fim-de-semana brasileiro ao se deparar com o seguinte texto?: Tarte de Sapateira com Sultanas Ingredientes: Uma sapateira 4 gemas 200 gr de massa folhada 50 gr de pickles 50 gr de sultanas 15 gr de queijo parmeso chvena de maionese Sal e pimenta q.b. chvena de natas Preparao: Coze-se a sapateira em gua temperada com sal. Depois de arrefecer abre-se e retira-se-lhe a cauda e a tripa, aproveitando o lquido, a carne e o coral. Com um garfo desfaz-se tudo e mistura-se a maionese, as natas, as gemas, as sultanas, os pickles picados. Tempera-se com sal e pimenta. Estende-se a massa folhada e forra-se com ela uma forma de tarte. Deita-se o recheio na forma, polvilha-se com queijo ralado. Leva-se a cozer 40 minutos, em forno mdio. Serve-se quente ou fria, acompanhada com salada.
Figura 1: Receita originalmente escrita em portugus europeu

Como possvel perceber, as diferenas lexicais podem, muitas vezes, impossibilitar a execuo da receita que , a princpio, a finalidade nica de se escrever e/ou ler uma receita. Assim, o que nos preocupa sobremaneira o fato, impercebido por muitos leitores e desconsiderado por muitas editoras, de essas obras no trazerem qualquer alerta quanto disparidade entre o pblico-alvo para o qual foram produzidas originalmente e aquele que as est consumindo aqui, em solo brasileiro fato esse capaz de destituir o texto de sua funo retrica original. Apesar de haver poucas iniciativas dentro dos Estudos Tradutolgicos quanto ao estudo contrastivo da retrica textual, autores como Kaplan (1966) e Hinds (1983) (apud Colina, 1997) demonstraram que as caractersticas textuais variam no s de lngua para lngua, mas tambm de cultura para cultura.
TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

318

21/9/2010, 13:55

319
Ora, o que feito, ento, do mercado brasileiro de traduo tcnica? Ser que o mercado editorial brasileiro, a exemplo do que acontece com os mercados americano e britnico, sentenciou que a existncia de uma lngua comum justifica a intercambialidade das obras dessa rea nas duas variantes do portugus? Ser que essa intercambialidade se d com a mesma facilidade nas variantes das duas lnguas? Como fica, por sua vez, a questo da aplicabilidade das informaes veiculadas nesses livros se o consumidor brasileiro, desprevenido, leva para casa um livro com receitas que ele no compreende sejam os ingredientes, sejam os processos e no pode portanto execut-las?

II. Estudos Lingsticos e Culinria Relato da construo do corpus multivarietal 1. Estudos contrastivos
O estudo comparativo das variantes britnica e norte-americana do ingls um tema que h dcadas vem merecendo a ateno de lingistas e tericos da traduo (Johansson, 1980, p. 85). O mesmo no ocorre, no entanto, com o portugus e suas variantes brasileira (PB) e europia (PE). Wittman, Pgo e Santos (1995) assim comentam:7
Dicionrios contrastivos como o de Mauro Vilar (1989),8 trabalho rico de informaes e elaborado com muito rigor, e at mesmo o dicionrio humorstico de Mrio Prata (1993),9 constituem os nicos registros voltados especificamente observao dos contrastes entre PE e PB, alm do trabalho de Tereza Biderman10 (...).
7

10

Alm dos trabalhos mencionados abaixo pelas autoras, existe tambm o Dicionrio lusitano-brasileiro , de Eno Teodoro Wanke, edio da Ediouro, com 176 pginas, esgotada no momento. VILAR, M. (1989) Dicionrio contrastivo luso-brasileiro. Rio de Janeiro: Ed. Guanabara. PRATA, M. (1993) Schifaizfavoire. Dicionrio de Portugus. So Paulo: Ed. Globo S.A. BIDERMAN, M.T. (1994) Vocabulrio fundamental: Cultura e sociedade. Araraquara: UNESP.

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

319

21/9/2010, 13:55

320
Segundo as autoras, no desmerecendo o inegvel mrito, o trabalho de Biderman por elas citado sofre de um problema: apoiar-se em corpora no comparveis. De qualquer forma, no que tange ao assunto que nos interessa a linguagem tcnica da culinria dois artigos de Biderman (1992 e 1996) apresentam evidncias da importncia e especificidade lingsticocultural dessa rea no lxico de uma lngua. No artigo de 1992, a autora lista exemplos de palavras que, conforme mostraram suas pesquisas, deveriam constar num ndice de vocabulrio fundamental do portugus brasileiro, por nomearem referentes especficos da realidade brasileira ou por usarem um significante diferente daquele usado em Portugal para o mesmo referente e/ou conceito. Das 120 palavras listadas, aproximadamente 35% tm relao direta com o universo de discurso da culinria. De modo semelhante, ao listar a contrapartida portuguesa, pelo menos 15% dos vocbulos pertence ao universo de discurso da culinria. Em seu artigo de 1996 (p. 41), ao discutir Um vocabulrio fundamental para o portugus do Brasil, Biderman destaca, mais uma vez, as diferenas entre as variantes brasileira e europia do portugus. possvel perceber, novamente, a presena significativa de vocbulos relacionados culinria, fato que merece o comentrio da autora: (...) em outros domnios culturais, como a culinria e a msica, por exemplo, encontraremos vocabulrio ligeiramente diferenciado em virtude das especificidades de cada uma das culturas de lngua portuguesa (p. 43). Ainda que representem um avano dos estudos contrastivos do portugus para a variante brasileira, no figura dentre as tentativas isoladas de autores como os mencionados acima qualquer trabalho voltado especificamente para reas tcnicas do conhecimento, estudos esses de grande valia para a teoria e a prtica da traduo.

2. Lingstica de Corpus
Estudos lingsticos baseados em corpora colees de textos, palavras, frases, trechos, dilogos, etc. so realizados desde o final de 1800, por autores como Pryer (1889) e Stern
TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

320

21/9/2010, 13:55

321
(1924), os quais estudaram a aquisio da linguagem em dirios, descrevendo cuidadosamente todas as locues da criana observada. Ou mesmo Kding (1987) que, com a ajuda de uma numerosa equipe, montou e analisou manualmente um corpus de 11 milhes de palavras para estudar o padro de distribuio de letras no alemo (McEnery e Wilson, 1997). No entanto, a Lingstica de Corpus (LC), atualmente, considerada uma metodologia de pesquisa especfica em que a explorao da linguagem feita por meio de evidncias, extradas por meio do uso de ferramentas computacionais, de um corpus de linguagem natural e autntica criteriosamente reunido e disponvel eletronicamente. A LC vem se destacando cada vez mais na lingstica moderna, apesar de ter sido relegada a segundo plano nos anos 60 e 70, quando as teorias da Gramtica Gerativa de Chomsky passaram a dominar os estudos lingsticos. Segundo Baker (1995, p. 225), a palavra corpus hoje usada para designar:
(...) a collection of texts held in machine-readable form and capable of be ing analysed automatically or se miautomatically in a variety of ways (...) it is put together for a particular purpose and according to explicit design criteria in order to ensure that it is representative of the given area or sample of language it aims to account for (...).

A montagem de um corpus, no entanto, no tarefa corriqueira. Os critrios empregados so, de fato, um fator crucial para o sucesso das pesquisas que o tomaro como base, pois o corpus oferece ao pesquisador apenas aquilo que nele foi inserido. Vrios autores, como Quirk (1992), Biber (1993), Baker (1995) e McEnery & Wilson (1997), tm se dedicado ao estudo desses critrios. Segundo afirmam Atkins et al. (1992), num dos primeiros estudos a tratar a fundo esse assunto sob a perspectiva da Lingstica de Corpus, o processo de criao de um corpus envolve cinco estgios principais:

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

321

21/9/2010, 13:55

322
A. Planejamento (specification and design): preciso estabelecer de antemo que tipo de corpus se pretende construir, levando-se em conta fatores como: quem usar o corpus e para que? qual o tamanho de cada texto e do corpus final e qual o tipo de texto a ser includo (amostras ou textos integrais?, falados ou escritos?); quais as variedades lingsticas representadas (quanto ao lugar: sintpico / diatpico?; data: sincrnico / diacrnico?; camada social: sistrtico / diastrtico?; aos atos de fala: sinfsico / diafsico?); qual o nvel aproximado de codificao (ser etiquetado? como?) B. Suporte tcnico (hardware and software): a partir do planejamento pode-se estimar a capacidade fsica necessria dos computadores que iro armazenar e processar o corpus, bem como criar ou selecionar os programas que sero usados para codific-lo e, posteriormente, explor-lo: concordanceadores, mecanismos de busca, programas estatsticos, etc. C. Coleta e preparao dos dados (data capture and mark-up): o prximo passo coletar os textos e organiz-los, de forma clara, em meio eletrnico. Nessa etapa so feitas tambm, conforme a escolha do pesquisador, as anotaes (tags) e a etiquetao de suporte ao cabealho (header). Esse processo ser mais bem detalhado quando da descrio da construo do nosso corpus (item 2.3). D. Processamento do corpus (corpus processing): a penltima fase da construo consiste na anlise quantitativa e qualitativa do corpus e dos resultados obtidos, fazendo uso de todas as ferramentas computacionais escolhidas. Nesse momento possvel verificar as lacunas, falhas e/ou incongruncias de todo o processo para ento proceder fase final da construo do corpus. E. Aumento e monitorao do corpus ( corpus growth and feedback): nessa fase corrigem-se as imperfeies detectadas na fase anterior, aumentando e/ou reorganizando o corpus. o momento tambm de coloc-lo disposio de um pblico especializado para que possa us-lo em suas pesquisas e, assim, oferecer comentrios ou sugestes de parmetros de alterao. Essa fase pode repetir-se indefinidamente, dependendo
TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

322

21/9/2010, 13:55

323
do propsito do corpus e das necessidades dos pesquisadores envolvidos. A seguir, descreveremos a primeira etapa de montagem do nosso Corpus de Culinria Quadricultural, utilizando-nos das etapas sugeridas pelos autores acima.

2.1 Planejamento do corpus Conforme j foi dito, nossa hiptese de trabalho constituise na verificao de que as diferenas entre o portugus do Brasil e de Portugal so lingstica e culturalmente mais expressivas do que entre o ingls americano e o britnico. Partindo, pois, dessa hiptese, o primeiro passo para o planejamento do corpus foi determinar o que seria um corpus minimamente representativo dessas lnguas em se tratando de receitas culinrias. Foram estabelecidos os seguintes critrios de coleta para orientar a construo do corpus:

2.1.1 Quanto ao tipo de corpus Nossa inteno era montar um corpus quadricultural comparvel, ou seja, para cada receita includa no corpus teramos um equivalente em cada uma das quatro variantes em discusso. Para tanto, a semelhana entre as receitas deveria basearse, sempre que possvel, no nome do prato, nos ingredientes que as compunham e no tipo de processo empregado. Por exemplo:
Portugus brasileiro: Torradinhas de alho Ingls americano: Garlic bread europeu: Po com alho britnico: Garlic bread

Isso, muitas vezes, foi problemtico (vide item 2.2.3), j que muitos ingredientes, tipos de prato e at mesmo processos no so empregados ou no so comuns nas quatro culturas.

2.1.2 Seleo de textos A seleo dos textos seguiu os seguintes critrios:


TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

323

21/9/2010, 13:55

324
somente receitas (glossrios e artigos de culinria, p. ex., no entraram); receitas em que ingredientes e modo de fazer constitussem sees distintas ; textos originais (no traduzidos) em cada uma das lnguas escolhidas. Criamos, assim, siglas de trs letras maisculas para representar as variantes: Portugus Original do Brasil = POB Portugus Original de Portugal = POP Ingls Original Americano = IOA Ingls Original Britnico = IOB; textos com boa qualidade gramatical e ortogrfica (textos com muitos erros gramaticais, sem acentos e cedilhas no caso do portugus , por exemplo, foram descartados). Procuramos, na medida do possvel, recolher receitas de fontes idneas sites mais reconhecidos, em que fosse previsvel um trabalho prvio de edio para publicao na rede. Muitas vezes, no entanto, no tivemos escolha e acabamos por incluir receitas de sites pessoais para poder garantir a comparabilidade almejada. Ainda assim, os critrios de boa qualidade do texto foram observados. textos cujo processo inclusse uso de forno microondas, mquina de po (breadmachine) ou churrasqueira, por exemplo, no foram includos, pois acreditamos que a presena desses aparatos simplificava a descrio dos processos e, no caso da churrasqueira, no fazia parte do dia-a-dia da culinria caseira; linguagem cotidiana (no coletamos receitas assinadas por grandes chefs, com ingredientes raros/exticos ou linguagem rebuscada/subjetiva. Receitas de culinaristas, no entanto, foram includas); linguagem geral (evitamos, dentro do possvel, qualquer receita de cunho marcadamente regional ou tnico, receitas de dietas especiais como receitas light, para diabticos ou pessoas com intolerncia ao leite ou vegan11);
11

Enquanto o vegetariano elimina a carne da sua dieta, seja ela branca ou vermelha, o vegan mais radical: alm da carne, no utiliza nenhum produto de origem animal - incluindo o leite e seus derivados, ovos,

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

324

21/9/2010, 13:55

325
textos disponveis eletronicamente (optamos por no escanear ou digitar receitas, por mais convenientes/adequadas que fossem. S coletamos textos de revistas e livros se os mesmos estivessem disponveis na Internet).

2.1.3 Quanto s categorias (subcorpora) Aps pesquisarmos vrios sites de receitas, percebemos que a forma como eles separam suas receitas variada. Muitas vezes, por exemplo, categorias diferentes de receitas so misturadas, como as etapas de uma refeio (entrada, prato principal, sobremesa etc.) junto de categorias que no se encaixam a (salgadinhos, bolos, sanduches, etc.). Isso levou-nos a criar uma categorizao tambm mista (vide Figura 2). Chegamos a essas 11 categorias, que convencionamos nomear com trs letras minsculas para futura identificao no corpus: Entradas = ent Sopas = sop Pratos Principais

carnes = ppc aves = ppa peixes e frutos do mar = ppp massas = ppm Acompanhamentos = aco Saladas = sal Sobremesas = sbr Tortas e Bolos = teb Pes = pao

A estrutura final de nosso corpus pode ser vista na Figura 2.

mel, l, seda e couro. (http://www.facom.ufba.br/prod/incomum/ vegan.html)

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

325

21/9/2010, 13:55

326
2.2 Suporte tcnico 2.2.1 Hardware Nosso corpus, por ser um projeto-piloto e por ser de rea tcnica, no de grandes propores, portanto no tivemos de nos preocupar com a aquisio de um computador especfico a primeira verso do corpus tem 73.372 bytes. Um ponto de grande importncia para ns foi ter disposio a Internet de banda larga, j que a coleta de dados e as pesquisas foram realizadas integralmente on-line.

Culinria

Receitas Portugus Brasil


aco01_POB... aco10_POB ent01_POB... ent10_POB pao01_POB... pao10_POB ppa01_POB... ppa10_POB ppc01_POB... ppc10_POB ppm01_POB.. ppm10_POB ppp01_POB... ppp10_POB sal01_POB... sal10_POB sbr01_POB... sbr10_POB sop01_POB... sop10_POB teb01_POB... teb10_POB

Ingls E.U.A.
aco01_IOA... aco10_IOA ent01_IOA... ent10_IOA pao01_IOA... pao10_IOA ppa01_IOA... ppa10_IOA ppc01_IOA... ppc10_IOA ppm01_IOA.. ppm10_IOA ppp01_IOA... ppp10_IOA sal01_IOA... sal10_IOA sbr01_IOA... sbr10_IOA sop01_IOA... sop10_IOA teb01_IOA... teb10_IOA

Portugal
aco01_POP... aco10_POP ent01_POP... ent10_POP pao01_POP... pao10_POP ppa01_POP... ppa10_POP ppc01_POP... ppc10_POP ppm01_POP.. ppm10_POP ppp01_POP... ppp10_POP sal01_POP... sal10_POP sbr01_POP... sbr10_POP sop01_POP... sop10_POP teb01_POP... teb10_POP

Gr-Bretanha
aco01_IOA... aco10_IOA ent01_IOA... ent10_IOA pao01_IOA... pao10_IOA ppa01_IOA... ppa10_IOA ppc01_IOA... ppc10_IOA ppm01_IOA.. ppm10_IOA ppp01_IOA... ppp10_IOA sal01_IOA... sal10_IOA sbr01_IOA... sbr10_IOA sop01_IOA... sop10_IOA teb01_IOA... teb10_IOA

Figura 2: Estrutura do corpus multivarietal de culinria portugus/ingls TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

326

21/9/2010, 13:55

327
2.2.2 Software Para as buscas na Internet, utilizamos com maior freqncia as ferramentas de busca Google12 e WebCorp.13 Para armazenar os textos, o Bloco de Notas do Windows, que grava os textos automaticamente em .txt, tipo de arquivo requerido pelo Wordsmith Tools14 o qual, por sua vez, foi nossa ferramenta de anlise do corpus. Para a fase de organizao dos dados obtidos, em tabelas, grficos, esquemas, etc., usamos o Excel e o Word for Windows, da Microsoft.

2.3 Coleta e armazenamento do corpus Os textos foram coletados na Internet com o recurso Copy/ Paste e alocados diretamente num arquivo .txt j nomeado (p. ex. aco01_POB) do Bloco de Notas. Finda essa etapa, o texto era editado, isto , dele retirvamos manualmente tudo o que no fosse estritamente parte da receita (por exemplo, endereo eletrnico, links, crditos de fotos, espaos em branco). Em seguida o texto recebia o cabealho, as etiquetas (vide a seguir) e era salvo em sua respectiva pasta (POB, POP, IOA ou IOB).

2.3.1 Cabealho O cabealho, cujo conjunto de informaes categoriza cada receita e pode servir para delimitar pesquisas, inclui os seguintes campos: <title> ttulo da receita </title> <filename> nome do arquivo, ex: aco01_POB </filename> <subcorpus> receitas (futuramente podemos acrescentar glossrio ou artigo, por exemplo) </subcorpus>
12 13 14

www.google.com www.webcorp.org.uk Scott, M. (1999) Wordsmith Tools version 3. Oxford: Oxford University Pre ss (ve rso demo disponvel no site http://www.le xically.ne t/ downloads/download.htm).

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

327

21/9/2010, 13:55

328
<collection> acompanhamentos, entradas, pes, pratos principais aves, pratos principais carnes, pratos principais massas, pratos principais peixes e frutos do mar, saladas, sobremesas, sopas ou tortas e bolos </ collection> <language> POB, POP, IOA ou IOB </language> <mode> Internet (futuramente podemos acrescentar revista, livro, etc.) </mode> <status> caseira (futuramente podemos acrescentar profissional) </status> <publisher> nome do site ou empresa que o mantm </ publisher> <editor> nome do editor do site (pessoa ou empresa), quando identificado </editor> <pubPlace> endereo da receita na Internet </pubPlace> <acessDate> data de coleta da receita </acessDate> <comments> rea reservada para comentrios nossos </ comments> <name> nome completo do autor da receita, quando mencionado </name> A seguir, um exemplo de cabealho preenchido:
<Header> <title> <tit> Bolo ingls de Natal </tit> <filename> teb02_POB </filename> <subcorpus> receitas </subcorpus> <collection> tortas e bolos </collection> </title> <sourceText> <language> POB </language> <mode> Internet </mode> <status> caseira </status> <publisher> Revista Gula </publisher> <editor> Editora Peixe </editor> <pubPlace> http://www2.uol.com.br/gula/reportagens/121_simbolos_receitas.shtml </pubPlace>

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

328

21/9/2010, 13:55

329
<accessDate> 12/fev/2003 </accessDate> <comments> a autora da receita viveu em Londres por muitos anos e, de volta ao Brasil, chegou a fabricar esse bolo para venda em parceria com o amigo e cozinheiro Charl Whately </comments> </sourceText> <author> <name> Maria Helena Guimares </name> </author> </Header>

2.3.2 Etiquetas Prevendo estudos futuros, ou mesmo uma anlise mais aprofundada das caractersticas textuais do corpus, decidimos acrescentar s receitas etiquetas pragmticas, ou discursivas, para identificar as principais partes das receitas. Desse modo, poderamos verificar, por exemplo, o nmero de ocorrncias de um determinado vocbulo, por exemplo, bolo, excluindo sua ocorrncia nos ttulos das receitas. Tambm poderamos contabilizar as ocorrncias de verbos que indicam processos apenas quando juntos lista de ingredientes, tais como fatia* (fatiado, fatiada, em fatias, etc.). Criamos, assim, as seguintes etiquetas: <titRec> ttulo da receita <titRec> <coment> comentrios do autor da receita, como tima para os dias quentes de vero <coment> <ingr> lista de ingredientes <ingr> <modFaz> descrio dos procedimentos da receita <modFaz> <class> informaes dadas pela receita quanto ao rendimento, tipo de prato, valor nutricional, tempo de preparo, custo, etc. <class>

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

329

21/9/2010, 13:55

330
A seguir, um exemplo de receita etiquetada: <titRec> Crispy Cod Balls </titRec> <class> 30mins plus chilling; Makes approx. 40; Hot; Party Food; Buffet; Appetizer </class> <ingr> Ingredients: 250g/9oz Cod Fillets, skinned 3 Spring Onions, chopped 2 teasp Soy Sauce 1 Egg White 1 teasp Cornflour 14 Slices White Bread Oil for deep frying </ingr> <modFaz> Instructions 1. Place the fish in a food processor and blend until finely chopped. 2. Transfer the fish to a mixing bowl, add the spring onions, Soy sauce, egg white and cornflour. Mix well. 3. Remove the crusts from the bread and cut the bread into 5mm/1/4inch cubes at the largest. 4. Using damp hands, roll teaspoons of the fish mixture into balls, toss in the bread cubes, pressing firmly on, then cover and refrigerate for at least 30 minutes. 5. Preheat the deep fat fryer to 180C/350F. Deep-fry the fish balls for a few minutes until golden brown. </modFaz> <coment> These can be prepared 1 day ahead. Make to stage 4, cover and refrigerate until required. </coment>
Figura 4: Exemplo de texto etiquetado

A certa altura da construo do corpus encontramos uma receita especificando quais os tipos de equipamentos necessrios para a sua execuo, o que ocorreu, no total, 3 ou 4 vezes. Como no havamos previsto essa categoria nas etiquetas, e j que sua ocorrncia no foi significativa de modo geral, optamos por incluir tais informaes no parmetro modo de fazer (<modFaz>).

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

330

21/9/2010, 13:55

331
2.3.3 Dificuldades encontradas A primeira dificuldade encontrada na coleta das receitas foi a existncia de uma quantidade desproporcional de sites nas quatro variantes das lnguas aqui consideradas. O nmero de sites disponveis em ingls americano supera, de longe, os encontrados em portugus do Brasil, ingls britnico e portugus de Portugal, nessa ordem. Por sua vez, os sites de receitas de Portugal, alm de serem em menor nmero, apresentam muitas receitas regionais e, com freqncia, receitas discursivas (em que no h separao entre os ingredientes e o modo de fazer um dos critrios seletivos que empregamos). Ora, por um lado, essa questo um fator a se considerar, j que pretendemos, justamente, destacar as diferenas e semelhanas entre as duas variantes do portugus. Por outro lado, para preservar a comparabilidade que desejvamos alcanar em nosso corpus, a coleta dessas receitas foi indesejvel, pois, muito provavelmente, causaria um desequilbrio na proporo ingredientes/processos na anlise final do corpus. Alm disso, o sistema de etiquetagem proposto teria de ser descartado. certo, enfim, que tais questes merecem um estudo futuro. Outra dificuldade foi distinguir as receitas britnicas das americanas, uma vez que muitos sites de receitas so mantidos e/ou alimentados por internautas, que muitas vezes no se identificam ao enviar sua colaborao. O uso de vocabulrio distintivo (como aubergine, courgette IOB, ou eggplant, zucchini - IOA) foi empregado, sempre que possvel, para fazer essa identificao. Outra dificuldade para a identificao da origem da receita provinha da ausncia da extenso, geralmente expressa no endereo do site (como .br para sites brasileiros, .pt para portugueses, .uk para britnicos e para americanos). H muitos sites, como os .org e .com, que no possuem essa terminao identificadora, o que significa dizer que esto excludos de uma pesquisa em que o domnio era predeterminado na pgina de busca. Encontramos tambm problemas de outras ordens. Um deles o fato de algumas receitas estarem em formato PDF (i.e., podem ser lidas apenas com o programa Acrobat Reader), que demoram muito para abrir e, sendo muitas vezes protegidas por
TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

331

21/9/2010, 13:55

332
senhas, tem-se impedida a cpia, embora seja permitida a sua impresso. Tambm se destaca o fato de que alguns sites mais elaborados usavam smbolos/figuras no corpo da receita (exs.: ***, para indicar o grau de dificuldade ou custo da receita; o desenho de uma panela para indicar o modo de fazer). Isso se revelou uma dificuldade a mais na etapa da cpia dos textos, pois em .txt todos esses smbolos se perdem e, por isso, tm de ser digitados manualmente j que fazem parte da classificao da receita , aumentando o tempo gasto na coleta. Inicialmente tnhamos optado por fazer uma coleta aleatria de todas as receitas do portugus brasileiro numa dada categoria (tal como pes), depois iniciar a busca no europeu, em seguida no ingls americano e, finalmente, no britnico. No entanto, percebemos que, ao mudar de lngua/variante, muitas vezes perdamos tempo valioso procurando um equivalente para uma dada receita, sem resultado. Isso obrigava-nos a descartar a receita j encontrada, trabalhada e etiquetada e substitu-la por outra, que pudesse ser encontrada nas outras variantes. Decidimos, ento, promover a seleo de todas as receitas em portugus e, em seguida, todas em ingls. Mas, ainda assim, o problema persistia ao mudarmos de lngua. Por isso, depois de muito esforo e pacincia para completar dois ou trs subcorpora, decidimos fazer um planejamento prvio das receitas que seriam includas, com base numa pesquisa rpida nos principais sites, evitando, assim, incluir receitas para as quais no seria possvel (ou fcil) encontrar equivalentes nas quatro variantes. Durante a coleta dos textos anotamos todas as dificuldades encontradas, listando o vocabulrio desconhecido, o qual, inclusive, poder servir de base para uma pesquisa futura. Todo o trabalho foi realizado entre 02/12/2002 e 07/02/2003. A seguir, faremos alguns comentrios sobre as dificuldades especficas de cada subcorpus, por ordem alfabtica das siglas empregadas (Vide ANEXO I para uma listagem das receitas coletadas).

2.3.3.1 Acompanhamentos Este subcorpus apresentou grande dificuldade, j que os acompanhamentos abrangem um leque muito amplo de receiTRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

332

21/9/2010, 13:55

333
tas. O problema maior ocorreu por conta das no-equivalncias culturais, por exemplo, a presena marcante de batatas na cultura de lngua inglesa, ou a presena do arroz/feijo na cultura brasileira. Alguns acompanhamentos clssicos numa cultura no existiam na outra, como o caso da farofa brasileira, das migas portuguesas ou dos baked beans americanos. Aparentemente, o correspondente mais prximo da farofa em Portugal so as migas, embora muitas vezes a receita d mais a impresso de um cuscuz paulista, ou um piro espesso, s que engrossado com po ralado (farinha de rosca). Como so servidas no somente com peixe, como o caso mais comum do piro no Brasil (as migas podem, inclusive, constituir uma refeio completa), resolvemos criar o paralelismo das migas com a farofa brasileira. No caso do ingls, as receitas de Brazilian style farofa so em grande nmero, mas por no sabermos se se tratavam de traduo ou no, escolhemos o cuscuz marroquino para seu equivalente. Apesar de o cuzcuz ser um prato estrangeiro, j est to ambientado na cultura dos pases de lngua inglesa que seria difcil deix-lo de fora da categoria acompanhamentos. Outros pratos que julgamos fundamental incluir, como mencionado acima, foram o arroz e o feijo brasileiros. Por sorte encontramos os dois numa nica receita, arroz com feijo, em um site de Dicas para noivas. Em Portugal foi fcil encontrar prato semelhante, j que h muitas receitas de Arroz de feijo, em que os dois so cozidos juntos. Mas no ingls foi complicado. Devido influncia mexicana, a busca foi mais rpida no ingls americano, mas no britnico, depois de longo tempo de pesquisa, tivemos de nos contentar com um Mexican rice and bean casserole, encontrado no site da BBC. Isso parece indicar que nem a cominao de arroz e feijo nem a verso mexicana do prato so comuns na cultura britnica.

2.3.3.2 Entradas Inicialmente havamos pensado em criar subcorpora em duas categorias: Petiscos e Entradas, por acreditarmos que os pratos que apareceriam em cada uma delas seriam muito
TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

333

21/9/2010, 13:55

334
distintos. No entanto, durante a pesquisa prvia para a elaborao do roteiro de receitas a serem coletadas, percebemos que h certa confuso em relao aos pratos dessas categorias. A situao mais complexa no ingls um site britnico distingue hors doeuvre de party food e de appetizer. Mas ao verificarmos as receitas, vimos que muitas delas se repetem nas diferentes categorias codfish balls, por exemplo, hors doeuvre, party food ou appetizer? Nossas pesquisas revelaram que vai do gosto do fregus. Por isso, resolvemos incluir todos esses petiscos, acepipes, abrideiras, appetizers, starters, hors doeuvre, party food, etc. na categoria entradas entenda-se, com isso, tudo o que salgado, no constitui refeio completa e no nem prato principal, nem sopa, nem salada. Como mencionado acima, as correspondncias nessa categoria no foram fceis de se encontrar, o que revelou uma grande diferena cultural entre os pases de lngua portuguesa (em que h muitas e variadas receitas do gnero, inclusive os salgadinhos, inexistentes como tais no ingls) e de lngua inglesa. No caso dos croquetes, por exemplo, observamos no ingls americano uma alta ocorrncia de Salmon croquettes, o que nos fez optar por essa receita em detrimento de uma ou duas ocorrncias de Meat croquette (as numerosas meat balls correspondem s nossas almndegas um tipo de prato principal). Outro caso interessante foi o do bolinho de bacalhau. Aps longo tempo de busca na Internet, e inconformados de no encontrar uma nica receita do famoso prato portugus, nos demos conta de que os bolinhos, em Portugal, so conhecidos tambm como pastis. Por fim, encontramos os Pastis de bacalhau Portuguesa. J no ingls proliferavam as receitas de internautas portugueses colaborando com sua verso particular da receita, mas preferimos no colet-las por no sabermos se eram tradues ou no de receitas portuguesas (uma delas, disponvel em vrios sites, era justamente a traduo literal daquela apresentada no site portugus de receitas e que havamos coletado. Essas receitas, no entanto, podem ser de interesse futuro para constituir um corpus de receitas traduzidas).

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

334

21/9/2010, 13:55

335
2.3.3.3 Pes Essa foi, sem sombra de dvida, a categoria mais difcil. Isso se deve a vrios motivos: praticamente no h na Internet receitas de pes em portugus de Portugal (notamos que o que chamam de broa e bolo muitas vezes algo parecido com nosso po, mas metade das poucas receitas encontradas: a) do tipo discursivo, ou seja, no separam os ingredientes do modo de fazer; e b) so muito regionais, isto , constam em sites de comidas tpicas de certas regies). Quando digitvamos po pes como palavra de busca, e .pt como restrio de domnio, o programa de busca retornava milhares de receitas. No entanto, em 99% delas o po era ingrediente (po ralado, po migado, etc.) e no a receita do po em si. Quanto aos americanos (e britnicos tambm), com o advento das breadmachines proliferaram receitas de pes que se limitam a uma lista de ingredientes a serem colocados na mquina de fazer po, e pronto! No que tenha sido difcil achar receitas de po tradicionais em ingls, o difcil foi distingu-las das outras no momento da busca. Isso nos tomou bastante tempo. Um terceiro motivo para a grande dificuldade com a categoria pes novamente de cunho cultural. Ao lermos as receitas de muffin, por exemplo, tnhamos a certeza de estarmos diante de um mini-bolo. Os americanos e ingleses, no entanto, tm outra opinio: para eles os muffins so um tipo de po e, de acordo com nossa categorizao de receitas, entrariam aqui, e no em bolos e tortas, como mandaria nosso julgamento. Tomamos uma atitude no muito cientfica, correndo o risco de comprometer a representatividade de nosso corpus (risco que assumimos por tratar-se de um projeto piloto): ignoramos os muffins, assim como as pizzas, por no termos chegado concluso ainda sobre qual categoria eles pertencem. O clssico Sourdough bread tambm ficou de fora, por no encontrarmos equivalente em portugus do Brasil. Enfim, de modo geral, em nossas buscas procuramos nos guiar mais pelos ingredientes e processos, e no tanto pelos nomes. Uma exceo foi a broa a portuguesa parece ser um tipo de po salgado feito com farinha de milho (que no sabeTRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

335

21/9/2010, 13:55

336
mos ainda se o nosso fub), ao passo que a nossa , em muitas regies do Brasil, considerada uma quitanda doce. O correspondente que encontramos em IOA, apesar de levar cornmeal e ter bread no nome, leva fermento qumico, de massa mole, mais parecido com um bolo. J em IOB, a receita leva fermento biolgico e fub, mas leva tambm 8 teasp molasses, o que talvez o torne um pouco doce. No foi fcil, tambm, encontrar uma receita de po com fermento qumico em POP, basta ver pelo nome da receita que por fim selecionamos, Po pequenino. Isso d uma idia do quanto as pistas eram difceis de rastrear O representante do IOA escolhido, Irish soda bread, a princpio no nos parecia correto se estamos falando de receitas americanas, como pode haver um Irish em seu ttulo? mas depois conclumos que, assim como o nosso bolo ingls, a nacionalidade do po referese muito mais aos ingredientes e a um processo especfico de execuo da receita (no caso do bolo ingls, frma em que assado) do que propriamente ao pas/cultura de origem. Assim, decidimos consider-los equivalentes. Por fim, gostaramos de registrar nosso espanto: parece inacreditvel, mas no encontramos uma receita sequer de po francs ou baguette em POP, embora eles sejam citados em vrias receitas como ingrediente, tal como mencionamos acima. Tentamos todas as palavras de busca que pudemos imaginar para chegar a essas receitas, mas no obtivemos resultado. Por fim, decidimos colocar como representante uma receita qualquer da categoria em POP escolhemos o Po de aveia e mel muito a contragosto...

2.3.3.4 Pratos Principais a) Aves O maior problema encontrado nessa categoria foi a diversidade de nomes dados aos diferentes tipos de frango, que podem variar conforme a idade, a alimentao, a forma de confinamento, o peso, se ele castrado ou no, entre outros (assunto que merece um estudo parte). Por ora achamos importante comentar que no conseguimos identificar o correspondente de
TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

336

21/9/2010, 13:55

337
galeto ou frango de leite no POP e, portanto, a receita que foi colocada lado a lado com a de galeto brasileira foi selecionada pela meno de 1 frango pequeno. Ao que tudo indica, h, no mnimo, dois correspondentes para o galeto/frango de leite em ingls: (a) (rock) cornish (game) hens (poussin em francs, presente apenas em receitas de chefs), que so semelhantes no tamanho e na textura da carne s (b) spring chickens, (que apareceram tambm como fryer, broiler-fryer chicken, ou ainda baby chicken). Os primeiros resultam de um cruzamento de duas raas de frango que, mesmo adultos, so pequenos seriam semelhantes ao nosso garnis? O dicionrio Houaiss parece confirmar a suspeita:
garnis. adjetivo e substantivo de dois gneros. 1 Rubrica: zootecnia. diz-se de ou galinceo de porte muito pequeno, pertencente a diversas raas, cujos primeiros casais trazidos para o Brasil vieram da ilha Guernsey, na GrBretanha

Mas essa equivalncia no ocorre com as receitas, ou seja, no foi encontrada nenhuma com essa variedade de ave em POB ou POP. No caso do frango / galinha caipira (free-range chicken), o mais prximo que achamos em POP foi galinha caseira. No conseguimos encontrar, tambm, o correspondente de chester em ingls (!). J o frango defumado no figura em nenhuma receita de prato principal em POP, IOA ou IOB, por isso foi descartado de nosso planejamento inicial. Interessante foi a constatao de que nas quatro variantes havia vrias receitas de capo frango capado e alimentado com dieta especial, muito usado nas festas de Natal antes da popularidade do peru. Assim, acrescentamos a receita ao corpus. Outra ave problemtica foi a codorna, pois parece haver dois ou trs tipos diferentes, sendo que o tipo mais comum no Brasil (Coturnix coturnix) diferente do que comum entre os americanos e britnicos (Nothura maculosa, que eles chamam de quail). O Aurlio d codorniz como sinnimo de codorna, mas cita outras duas aves: codorna-buraqueira e codorna-mineira nenhuma das duas com o nome cientfico igual ao de quail. J o Dicionrio Houaiss deixa o problema ainda mais
TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

337

21/9/2010, 13:55

338
complicado. Ele cita, alm da codorna: codorna-amarela, codorna-buraqueira, codorna-caseira, codorna-comum, codornadomstica, codorna-pintada, codorna-mineira, codorniz e codornizo. No verbete de codorniz l-se: Rubrica: ornitologia. 1 m.q. codorna (Coturnix japonica) 2 m.q. codorna-comum (Nothura maculosa) 3 m.q. codorna-mineira (Nothura minor) Complicaes parte, o que nos importa no momento que, em se tratando de receitas, no Brasil, conforme atesta sua freqncia na Internet, usa-se mais codorna que codorniz e, em ingls, quail mais usado do que bobwhite (dado como sinnimo pelo Dicionrio Webster). Com base nessas constataes culturais refletidas no uso dos termos, estabelecemos a equivalncia entre as receitas, mas essa uma questo que, por merecer maior ateno, ser objeto de outro estudo. b) Carnes A no-equivalncia entre os cortes de carne nas quatro variantes, e mais especificamente no Brasil em relao aos outros pases, foi o motivo de maior dificuldade no tratamento dessa categoria. O cabrito no foi includo, porque no encontramos nenhuma receita com o equivalente dicionarizado em ingls kid / baby goat. Optamos por substitu-lo pela vitela (veal), que aparece em muitas receitas na rede. c) Massas Os nomes italianos para as massas prevalecem nas quatro lnguas, embora a grafia muitas vezes sofra alteraes de uma lngua para a outra, ou mesmo dentro da mesma lngua: lasanha / lazanha / lasagna (portugus), lasagna / lasagne (ingls); cap(p)el(l)et(t)i e fet(t)uc(c)ini/e (ambas as lnguas), etc. Devido sua grande variedade, procuramos nos ater aos ingredientes e ao modo de fazer das receitas. As massas recheadas no parecem ser muito populares em Portugal. Para o cap(p)el(l)et(t)i encontramos apenas duas ou trs receitas na rede, em geral mal escritas. Um equivalente
TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

338

21/9/2010, 13:55

339
possvel o tortelloni, mas em receitas s foi encontrada uma ocorrncia com tortellini. No IOB havia uma receita de tortelloni cuja foto exibia o que chamamos de cap(p)el(l)et(t)i no Brasil (equivalncia confirmada no corpo da receita). Ressaltamos, novamente, que a pizza no foi includa aqui, j que no nos decidimos quanto a consider-la prato principal.15 d) Peixes e frutos do mar A quantidade de nomes de peixes parece quase infinita, razo pela qual optamos por nos ater aos mais populares, dando ateno especial ao modo de fazer. Os moluscos de concha e os diversos tipos de camaro so outro assunto, que merece ser estudado a fundo, posto que no foi possvel faz-lo no presente trabalho. Afora isso, os peixes e frutos do mar no apresentaram grande dificuldade para o estabelecimento das equivalncias.

2.3.3.5 Saladas Os textos envolvendo as saladas no apresentaram grande dificuldade. Preocupamo-nos, especialmente, em garantir ampla variedade de ingredientes, j que o processo no um ponto central nesse tipo de receita.

2.3.3.6 Sobremesas Essa foi outra categoria que apresentou grande dificuldade. O manjar branco (sbr01), o pudim de po (sbr02), o pudim de leite (sbr09) e o arroz doce (sbr03), em ingls, acabaram classificados numa mesma subcategoria a dos custards e puddings. Pelo que pudemos perceber, custard tem signi15

O conceito de prato principal pode no ser consensual nas quatro variantes. Neste trabalho consideramos prato principal aquele que o mais substancial da refeio e que, em geral, servido com acompanhamentos como legumes, arroz, batatas e/ou saladas.

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

339

21/9/2010, 13:55

340
ficados distintos em IOB (molho/creme de baunilha) e IOA (pudim). O bombocado, por exemplo, foi escolhido por ter um cognato Bom bocado em POP: as receitas mostram, no entanto, que so sobremesas totalmente distintas. No conseguimos para o prato um equivalente em ingls; os que mais se aproximavam dele eram alguns tipos de torta, alm dos cheesecakes (que entrariam na categoria tortas e bolos) e, novamente, os custards. Optamos por uma receita de Coconut cream cheese flan, em IOA, e Peggys pudding, que leva coco na composio, para IOB. Quanto ao doce feito de abbora, ao digitarmos, no ingls, as palavras de busca pumpkin squash sugar, recebamos uma infinidade de receitas em ingls, das quais 99,9% eram de Pumpkin pie, da categoria das tortas. O pav tambm foi difcil de se encontrar: no portugus europeu foi pela escassez de receitas de doces, mas em ingls no tnhamos nenhuma pista de como encontrar essas receitas, ou como realizar as buscas. Comeamos pelas palavras de busca cracker sugar cream, mas as muitas receitas exibidas pediam a bolacha/biscoito esfarelada/o (crushed), processo muito usado para fazer base de tortas (mais uma vez as tortas e bolos atravessavam nosso caminho!). Depois de vrias tentativas, a busca com layer sugar cream cracker crushed comeou a oferecer melhores resultados e, assim, encontramos Seven-layer icebox cake em IOA e Brandy mocha trifle em IOB. Curiosamente, no conseguimos uma nica receita de pudim de leite em POB que no levasse leite condensado; por isso optamos pelo Pudim de chocolate, que feito de leite e ovos, como nas receitas equivalentes encontradas para as outras variantes. Em IOA o processo tambm foi demorado, pois a busca com egg custard praticamente no retornou resultados. Acabamos encontrando uma receita com esse nome por meio da busca pelos ingredientes em um site cujos ttulos das receitas provavelmente no estavam indexados, de forma que as ferramentas de busca no conseguiam localiz-los com a palavra de busca egg custard, embora se tratasse justamente do ttulo dado receita.
TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

340

21/9/2010, 13:55

341
2.3.3.7 Sopas As sopas foram a primeira categoria que coletamos e somente por esse motivo houve um alto ndice de perdas (receitas sem correspondentes, que foram trocadas por outras), j que ainda no tnhamos comeado o planejamento prvio de coleta. No geral, no apresentou grandes dificuldades, mas a canja de galinha merece um comentrio: no conseguimos encontrar qualquer receita de sopa que levasse arroz, frango e legumes em IOB. Optamos pelo paralelismo com o ingrediente chicken, em detrimento de rice.

2.3.3.8 Tortas e Bolos Ao coletarmos as receitas dessa categoria ficamos na dvida se a incorporvamos s Sobremesas ou no, j que muitas tortas, e at mesmo bolos (especialmente nos Estados Unidos, at onde sabemos), so muitas vezes servidos como sobremesa. Mas dada a complexidade encontrada na coleta das receitas da categoria Sobremesas, decidimos manter as duas separadamente, tambm para que os doces ficassem mais bem representados no corpus (as outras 9 categorias so essencialmente de pratos salgados). Destacamos aqui o caso da torta doce de queijo. Seria fcil encontrar uma receita do tradicional cheese cake do IOA nas outras variantes (o que de fato chegou a ser feito no POP e no IOB), mas a escolha nos pareceu um tanto falsa para o POB, j que no Brasil a iguaria no chega a fazer parte da nossa cultura (ainda?). A opo foi, portanto, manter a equivalncia somente no ingrediente genrico queijo. Com isso encontramos em POB a conhecida Torta de ricota, uma Queijada serrana em POP (receita bastante comum nos sites POP) e a Yorkshire curd tart, tradicional no IOB. A coleta de textos por categoria deixou bem clara a necessidade de se fazer um levantamento das receitas mais comuns em todas as categorias para cada variante. Somente assim conseguiramos um corpus comparvel no nvel cultural, pois o que
TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

341

21/9/2010, 13:55

342
ora foi compilado acabou por focar mais os aspectos lxicos e sintticos, justamente os aspectos em que nossos questionamentos iniciais se concentravam.

2.4 Processamento do corpus Dentre as fases da elaborao de um corpus propostas por Atkins et al (1992), corpus processing refere-se etapa de preparao do corpus para que possam ser extradas dele as informaes de interesse. nessa fase que entram em cena as ferramentas de processamento de corpora. Os autores mencionam ainda, em seu texto,as ferramentas mais sofisticadas para a tarefa, tais como os etiquetadores gramaticais e sintticos, lematizadores, etc. Para os propsitos deste trabalho foi usado apenas o programa de anlise lingstica Wordsmith Tools para avaliar o corpus, conforme comentaremos a seguir.

2.4.1 Types, Tokens e Type/Token Ratio Token cada palavra do corpus, reconhecida pelo programa como aquilo que figura entre espaos em branco. Funciona como o Contar palavras do Word for Windows, sendo que o nico critrio empregado para contabiliz-las o recurso fsico mencionado acima (os espaos). J Type cada palavra distinta que pode se repetir 2, 10 ou 100 vezes at perfazer o total de Tokens. Assim, na frase a banana nanica mais saborosa que a banana ma temos 10 Tokens (palavras) e 8 Types (palavras distintas), pois banana e a aparecem duas vezes no exemplo. O Type/Token Ratio um clculo utilizado para determinar a riqueza lexical de um corpus. O Worsmith Tools calcula essa razo com uma regra de 3: x = (no. de Types) x 100 no. de Tokens

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

342

21/9/2010, 13:55

343
Por esse clculo, quanto maior o Type/Token ratio, maior a riqueza lexical.16 No exemplo acima a razo seria de 80% (8 x 100 10), ou seja, para cada 100 palavras, 80 so distintas e 20 repetidas. Se o exemplo fosse a banana nanica e a banana ma so inferiores banana ouro e banana prata em sabor e nutrientes teramos: Tokens: 20 Types: 12 Type/Token ratio: 60%

Elaboramos uma planilha em Excel com os valores de Type, Token e Type/Token Ratio para cada receita do site , cada subcorpus e para o corpus total. Os dados foram extrados do corpus com a ferramenta Wordlist do Wordsmith Tools, que apresenta trs listas diferentes: uma com os Types em ordem decrescente de freqncia, outra com os mesmos Types em ordem alfabtica, e uma terceira, com a estatstica dos arquivos examinados, de onde foram retirados os dados para a planilha. Uma breve anlise dos valores da tabela permite-nos fazer diversas constataes: IOA o corpus que tem maior nmero de palavras (Tokens), seguido pelo POB, IOB e, bem abaixo da mdia dos 25.000, pelo POP. No entanto, o mesmo no ocorre com os Types: POP apresenta o maior ndice de riqueza lexical (11% ), seguido por IOB, IOA e POB. Mas essa inverso no casual. Conforme demonstra Biber (1993), o aumento do Type/Token ratio inversamente proporcional ao aumento dos Types; isto , quanto mais palavras no corpus, maior a probabilidade de repetio. Isso est mais bem representado nos Grficos 1, 2 e 3 abaixo, em que o eixo x representa cada adio de uma nova categoria dos subcorpora ao corpus total, e o eixo y representa os valores para, respectivamente, Type, Token e Type/Token ratio a cada nova adio. Observa-se que, en-

16

Outra forma de calcular o Type/Token Ratio dividir o nmero de Tokens pelo nmero de Types. Nesse caso, quanto maior o nmero obtido, menor a riqueza lexical. Por isso, importante explicitar a frmula utilizada para que se possa interpretar os resultados corretamente.

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

343

21/9/2010, 13:55

344
quanto os Tokens (Grfico 1) tm uma trajetria constante e regular (com o acrscimo de cada categoria o corpus aumentava em cerca de 2.000 palavras), os Types ( Grfico 2 ) mostram uma ascenso brusca at ppa (momento em que os subcorpora somavam aproximadamente 9.000 palavras) e depois dessa categoria, um crescimento mais constante, que vai diminuindo conforme aumenta o nmero de Tokens e as palavras comeam a se repetir mais vezes dentro de cada subcorpus. O Grfico 3, que representa o Type/Token ratio, apresenta uma trajetria descendente, pelos motivos que salientamos acima. Por sua vez, o POP, com o menor nmero de palavras representadas no corpus, destaca-se dos outros, mantendo valores mais altos em todos os estgios da construo do corpus, justamente por ter menos Tokens.
30 .0 0 0 25 .0 0 0 20 .0 0 0 15 .0 0 0 10 .0 0 0 5 .0 0 0 0 a co +e n t +p a o +p p a PO B +p pc +p p m PO P +p pp IO A +sal +sb r IO B +sop +te b

Grfico 1: Tokens (evoluo)

2.5 00 2.0 00 1.5 00 1.0 00 5 00 0 ac o + ent + pa o +p pa PO B + pp c +p pm POP + pp p IO A +s al + sb r IO B +s op + teb

Grfico 2: Types (evoluo)

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

344

21/9/2010, 13:55

345
30 25 20 15 10 5 0 aco +ent +pao +ppa POB +ppc +ppm POP +ppp IOA +sal IOB +sbr +sop +teb

Grfico 3: Type/Token Ratio (involuo)

H certas receitas e categorias de receitas que apresentam um nmero de Tokens claramente diferenciado. o caso, por exemplo, da receita ent02. Uma consulta ao ANEXO I, nesse caso, desfaz o mistrio: na verdade, trata-se da receita do Pat de atum, que no apresenta nem um grande nmero de ingredientes nem complexidade no preparo, da os baixos valores. J a categoria Pes uma das que tm maior nmero de Tokens (com exceo de POP, para o qual, como mencionamos anteriormente, foi muito difcil encontrar receitas nessa categoria), e isso se justifica, provavelmente, pela complexidade do preparo de pes. Todos esses aspectos quanto s diferenas entre as diversas categorias podem ser observados, em detalhe, nos Grficos 4, 5 e 6 abaixo. O Grfico 4 mostra os valores representativos do nmero de Tokens em cada subcorpus. Por ele possvel observar a tendncia das quatro variantes em apresentar rece itas com po ucos To ke ns na categ oria Saladas, possivelmente pelos mesmos motivos apresentados acima para ent02. Observa-se tambm que, enquanto POP e IOB apresentam um maior valor de Tokens para ppm, se comparados a outras categorias nas mesmas variantes, IOA e POB mantm relativamente o mesmo nmero de Tokens de outras categorias. Seria esse um sinal de que a culinria italiana est bem mais enraizada nas culturas brasileira e americana do que na portuguesa e britnica, e da a necessidade maior de explicaes nas receitas desses pases? O Grfico 5 mosTRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

345

21/9/2010, 13:55

346
tra os Types por categoria. As colunas exibem, no geral, valores semelhantes aos apresentados no Grfico 4, com algumas excees interessantes: enquanto no grfico de Tokens a categoria ppp representada por uma ligeira diminuio em todas as variantes, neste tal categoria representada por uma ascenso expressiva em IOB. possvel que, apesar de terem poucos Tokens, as receitas de Peixes e frutos do mar contenham ingredientes muito variados, os quais nem sempre se repetem em outras categorias. Isso pode ser comprovado no Grfico 6, em que a relao Type/Token est representada nas diferentes categorias. H evidncias de que, tanto em Pratos principais (peixes e frutos do mar ( ppp)) quanto em Saladas (sal) e Entradas (ent), a riqueza lexical grande se comparada a categorias como pao ou ppa, que apresentaram altos valores de Token, mas porcentagens mais baixas para Type/Token Ratio.
4.000 3.000 2.000 1.000 0

aco

ent

pao

ppa

ppc
POB

ppm
POP IOA

ppp
IOB

sal

sbr

sop

teb

Grfico 4: Tokens (por categoria)

1000 800 600 400 200 0 aco ent pao ppa ppc POB ppm POP ppp IOA IOB sal sbr sop teb

Grfico 5: Types (por categoria)

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

346

21/9/2010, 13:55

347
40 30 20 10 0 aco ent pao ppa ppc POB ppm POP IOA ppp IOB sal sbr sop teb

Grfico 6: Type/Token Ratio por categoria

Os Grficos 7 e 8 permitem que, mais uma vez, sejam confirmadas tanto a diferena de resultados obtidos em POP com relao s outras trs variantes quanto a relao inversamente proporcional que h entre nmero de Tokens e riqueza lexical (Type/Token Ratio) nas receitas coletadas.
30.000 20.000 24.816 17.661 26.990 24.587

T/T Ratio 12,00 8,33 8,00 11,00 8,47 8,74

10.000 2.000 0 1.942 2.287 2.150

4,00 0,00 POB POP IOA IOB

POB

POP Token Type

IOA

IOB

Grfico 7: Tokens e Types (por Grfico 8: Type/Token Ratio (por variante) variante )

2.4.2 Wordlists e Keywords Conforme mencionado acima, Wordlist uma ferramenta do Wordsmith Tools que faz uma listagem de todas as palavras dos arquivos selecionados, agrupando as palavras repetidas para calcular sua freqncia conjunta nos textos. Outra ferramenta do mesmo programa a Keyword que, grosso modo, seleciona, por comparao com uma segunda Wordlist, as palavras cuja freqncia no corpus de estudo significativamente maior ou menor do que no corpus de referncia17 i.e., corpus usado para a comparao. Por exemplo, se comparamos a

17

O ideal que o corpus de comparao seja maior que o corpus de estudo.

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

347

21/9/2010, 13:55

348
Wordlist de um artigo de astronomia com a de um corpus de editoriais de jornal, a Keyword apresentar as palavras que s ocorrem, ou ocorrem com uma freqncia muito maior, no artigo de astronomia (Keywords positivas) e aquelas que, porventura, ocorram com maior freqncia ou exclusivamente no editorial (Keywords negativas). Isso pode ser usado, por exemplo, para se determinar o vocabulrio especfico de uma dada rea, ou seja, termos que ocorrem especificamente naquele contexto ou que, justamente, no ocorrem naquele contexto. Para esse estudo, foi necessrio elaborarmos as seguintes Wordlists: do total de cada uma das quatro variantes; das sees da receita, por exemplo modo de fazer (modfaz), ingredientes (ingr), etc. em cada uma das variantes; do total de cada variante menos a seo da receita a ser estudada,18 por exemplo, POBtotal menos o modo de fazer, POBtotal menos os ingredientes, etc., o que resultou em 20 Wordlists, 5 em cada variante; de cada categoria em cada uma das lnguas e variantes, o que resultou em 44 Wordlists; do total de cada variante menos a categoria a ser estudada, ou seja, POBtotal menos acoPOB, POBtotal menos entPOB, etc., totalizando mais 44 listas. O passo seguinte foi comparar essas listas (recurso Compare 2 Wordlists, do Wordlist, que faz a Keyword dos arquivos escolhidos). Para tanto, ajustamos os critrios de pesquisa de keywords da seguinte forma:19

18

19

Ao se extrair a lista de palavras-chave (keywords ), os textos do corpus de estudo no devem fazer parte do corpus de comparao. O nico valor alterado aqui (os outros so default) o de P, que uma medida estatstica usada para calcular a probabilidade de o evento em questo ter ocorrido por acaso. Considerando-se que em Cincias Humanas o maior P aceitvel 0,05, ou seja, 5 ocorrncias em 100, ou 1 em 20, aumentamos o valor de P para 0,001 uma chance em mil de ser casual a presena daquele item lexical na lista de palavras-chave do corpus analisado. Dessa forma, conseguimos contemplar itens importantes os quais, caso aplicssemos um P menor, seriam desprezados.

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

348

21/9/2010, 13:55

349

Procedemos ento s seguintes comparaes: A. cada categoria com o corpus total daquela variante, menos a categoria estudada. Ou seja, comparar, por exemplo aco...POB, ent...POB, ppm...POB, etc. com o POBtotal sem a categoria em questo, e assim sucessivamente com as 44 categorias, 11 de cada lngua. Disso resultaram pequenas listas de Keywords em que figurava o vocabulrio especfico se havia algum daquela categoria de receitas em relao ao conjunto delas numa mesma variante (vide ANEXO II para uma amostra das categorias massas e sobremesas). Destacamos, a seguir, alguns dos resultados que mais nos chamaram a ateno: No caso das massas, alguns itens esto presentes em todas as variantes, como queijo, lasanha, parmeso e ralado. Curiosamente, tomate(s) no aparece(m) nas keywords de POP. Seria esse um indcio de que largamente empregado em outros tipos de receitas em Portugal? Ou seria um problema da quantidade menor de types e tokens das receitas POP, o que interferiria nas estatsticas? As palavras-chave mais presentes nas listas para POB e IOA se referem a diferentes tipos de queijo, massas, molhos, bem como ingredientes que podem ser usados
TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

349

21/9/2010, 13:55

350
nesses molhos. Seria isso um indcio de que, nessas culturas, o macarro j est mais incorporado ao dia-adia, estimulando a criao de novas formas de apresentao e/ou modos de preparo? Seria isso um indcio de uma maior influncia da cultura dos imigrantes italianos nesses pases? A presena de flour nas Keywords negativas de IOA pode ser uma indicao de que, nessas receitas, a massa comprada pronta o que pode indicar um fator cultural americano: a presena do fast food, que privilegia os alimentos semiprontos; A ausncia de sugar nas keywords negativas do IOA pode ser justificada pela presena de Brown sugar (2 ocorrncias) no molho da receita de lasagna, conforme verificamos no corpus, com o uso da ferramenta Concordance; No caso das sobremesas, curioso observar a presena do leite + condensado nas Keywords positivas de POB e POP. O mesmo no ocorre, porm, com o correspondente nas variantes do ingls, o que pode ser uma indicao de que o ingrediente mais difundido entre os pases de lngua portuguesa. O mesmo pode ser dito da palavra que julgamos tratar-se do substantivo doce nessas mesmas listas. Em contrapartida, Portugal parece ser o nico a resistir ao chocolate (que nas receitas brasileiras representado pelo achocolatado). Observa-se tambm que os pases de lngua inglesa possuem vrias receitas de sobremesa em que o caf e as bebidas alcolicas so usados como ingredientes. No entanto, o tamanho reduzido do corpus no nos permite fazer tal afirmao sem ressalvas a presena ou ausncia de ingredientes nessas listas podem estar relacionadas coleta dos dados. Por isso, somente num corpus mais representativo elas poderiam ser apontadas, com certeza, como indcio de diferenas culturais; A metodologia empregada aqui permitiu-nos identificar vrios equivalentes de traduo. Permitiu tambm identificarmos a grafia diferenciada de alguns termos,

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

350

21/9/2010, 13:55

351
como por exemplo, a de lasanha em ingls (IOA lasagna, IOB lasagne), ou do brcolis brasileiro, que em portugus de Portugal brcolos. Essas distines so de grande importncia, tanto para a traduo quanto para a verso. B. as diferentes partes da receita em cada variante com o corpus total, menos a seo da receita analisada. O objetivo era verificar se havia diferena no vocabulrio especfico para cada seo da receita e, em caso afirmativo, contrastar os resultados obtidos entre as variantes de cada lngua, ou seja, POB x POP e IOA x IOB (vide ANEXO III para uma lista das palavras-chave dos ingredientes nas quatro variantes). A seguir, comentamos brevemente os resultados que mais nos chamaram a ateno: Portugus A lista de palavras-chave em POB (60 itens) cerca de 30% maior que a lista de POP (41 itens). Isso pode ter uma relao direta com o tamanho dos corpora (conforme salientado anteriormente neste artigo, o corpus de POP o menor de todos em nmero de palavras). Por outro lado, pode ser um indicativo de que o vocabulrio usado na descrio dos ingredientes em POB mais diversificado, se diferenciando mais claramente daquele usado nas outras sees da receita, se comparado ao vocabulrio usado nos ingredientes em POP; A lista de POB contm vrios particpios (que aqui funcionam como adjetivos), indicativos de um preparo prvio do ingrediente (picada, picado, picados, cortado, picadas, ralada, cortados, cortados, cortadas, amassados, moda, ralado, (em) cubos, cortada, socados). Esses itens no ocorrem em POP e, assim, poderamos concluir que: i) o POB muito mais especfico e detalhista na descrio dos ingredientes do que o POP; ii) POP, ao contrrio do que se observa em POB, indica o preparo dos ingredientes no modo de fazer; Outra diferena a ser notada a maior variedade de itens lexicais usados em POB para indicar unidades/medidas para os ingredientes: [colher de] ch, sopa, colheres,
TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

351

21/9/2010, 13:55

352
xcara, colher, xcaras, xc, caf / g, kg, l, ml, litro / copo, lata, pacote, tablete, uni(dades), pitada, ramos, p, a + gosto. Em POP temos: sopa, colheres, colher, ch, c, ch, chvena, sobremesa, colh / gr, g, dl, grs, kg / pacote, lata, clice / dentes / q[uanto] + b[aste]) Ingls as duas listas apresentaram um nmero de itens mais parecido entre si que no caso do portugus: 82 itens para IOA e 67 para IOB. Esses 20% , aproximadamente, de diferena no tamanho das listas pode ser decorrente do mesmo motivo apontado para o portugus: o corpus IOA tem mais palavras que o corpus IOB; Tambm no que diz respeito ao tipo de itens lexicais que comparecem aparecem nas duas listas de palavras-chave, o ingls apresenta mais semelhanas do que o portugus. IOA tem 22 particpios indicativos de preparo prvio dos ingredientes ao passo que IOA apresenta 16. No caso dos adjetivos qualificativos (como unsalted, whole, etc.), IOA tem 13 e IOB 14. A maior diferena observada foi quanto presena dos advrbios: IOA tem 4 ( finely, thinly, coarsely e freshly) contra apenas 2 (freshly e coarsely) em IOB, o que pode ser indicativo de maior preciso na variante americana; No que diz respeito aos itens lexicais indicativos de pesos, medidas e unidades, a semelhana tambm ficou evidente: IOA tem 9 itens de medida de preciso (ounces, lb, oz, pound, ml, pounds, ounce, lbs, fl[uid]) contra 8 de IOB (oz, g, pint, ml, lb, fl[uid], pints, kg). A diferena aparece no uso do sistema mtrico internacional, e da unidade de medida pint em IOB, ausentes em IOA. As unidades de medida caseira aparecem 11 vezes em IOA e 7 vezes em IOB, sendo possvel observar uma diferena tanto na abreviao das duas variantes quanto na presena mais significativa dessas unidades nas primeiras posies da lista IOA, em oposio presena mais marcante de medidas precisas nas mesmas posies da lista IOB. Os itens cloves, dash e clove ocorreram em IOA em oposio a cloves, sprigs e bunch, em IOB.
TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

352

21/9/2010, 13:55

353
C. o corpus total de cada variante com o total da variante correspondente: POBtotal com POPtotal e IOAtotal com IOBtotal (vide ANEXO IV (POB/POP) e ANEXO V (IOA/IOB)). Embora a comparao no seja indicada nos casos em que o corpus de referncia no pelo menos algumas vezes maior que o corpus de estudo, resolvemos testar a metodologia. Os resultados corroboraram a nossa hiptese inicial: a Keyword resultante da comparao de POB com POP contm muito mais itens do que aquela resultante da comparao entre IOA e IOB. Isso sugere, pois, que o lxico que distingue POB de POP contm mais itens que aquele que distingue IOA de IOB. A seguir comentamos alguns dos dados que nos chamaram mais a ateno: A lista de palavras-chave do portugus apresenta 80 ocorrncias para POP e 63 para POB. Desses itens, 55 (69% ) da lista POP tm ocorrncia = 0 no corpus de POB, e 22 (35% ) da lista de POB tem ocorrncia = 0 no corpus POP. J o ingls apresenta 46 palavras-chave para IOB e 60 para IOA, das quais 17 (37% ) s ocorrem em IOB e 27 (45% ) s em IOA. Esses nmeros mostram que a diferena entre as variantes do portugus mais expressiva do que entre as do ingls, especialmente se levamos em conta que o corpus de POP o menor de todos (17.661 types) e o IOA o maior (26.990); Das palavras-chave com ocorrncia 0 nas variantes do portugus destacamos: i) diferenas sintticas POP d preferncia pela forma verbal acompanhada da partcula apassivadora -se (deixa-se, junta-se, leva-se, deita-se, serve-se, tempera-se, faz-se, batem-se, coloca-se, mistura-se, retira-se) enquanto no POB vemos o predomnio do imperativo (abaixe, abra, doure, desligue). Neste caso, ainda que esteja presente, em POP percebe-se a preferncia por formas verbais pouco ou no usadas em portugus brasileiro (deite, tape, coza, aloure, rectifique); ii) diferenas lexicais alm das apontadas para os verbos acima, encontramos pares POP/POB como os seguintes: lume / fogo, q.b. / [a] gosto, sumo / suco, confeco / modo (de fazer), tacho caarola / panela, chvena / xcara, filetes / fils, aipo / salso, etc.;
TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

353

21/9/2010, 13:55

354
iii) diferenas culturais para designar a seo da receita em que se explica seu preparo, POP prefere usar Preparao (77 ocorrncias), ao passo que POB emprega, com mais freqncia, Modo de fazer (o que pode ser constatado nas 81 ocorrncias de modo). As 12 ocorrncias de entretanto em POP nos chamaram a ateno. Procurando verificar as linhas de concordncia, constatamos que o termo usado nos mesmos contextos em que usamos enquanto isso em POB:
N Concordance 1 cortado s rodelas finas, e deixe refogar suavemente. Entretanto, coza a massa em gua temperada com sa 2 cebola picada e o azeite e leva-se ao lume a alourar. Entretanto coze-se os dendns, assim que estiverem 3 e leve ao forno moderado durante duas horas e meia. Entretanto, deite num tachinho o caldo de aves e as n 4 Maria picada. Forrar a tarteira. Colocar no frigorifico. Entretanto fazer o recheio que s misturar os ingredi 5 atias finas e demolha-se em gua sem desfazer muito. Entretanto frita-se a linguia juntamente com o alho e 6 mal escorrido, e espalha-se por cima a broa migada. Entretanto leva-se o azeite ao lume com os alhos e de 7 +- 30 minutos, regando o peixe com o prprio molho. Entretanto leve ao lume num tachinho a manteiga a de 8 inteiros para enfeitar. Deixa-se ferver+- 10 minutos. Entretanto num almofariz, pisam-se os alhos, coentro 9 margarina. Cobrem-se com gua e deixam-se ferver. Entretanto pica-se a cebola muito finamente e leva-se 10 funda de tamanho mdio com o leo e deixe aquecer. Entretanto, pincele os rolos de frango com a manteiga 11 . Leve a cozer em forno bem quente (200C a 220C). Entretanto prepare a calda de acar: dissolva o ac 12 e regue o pato com a calda formada. Deixe cozinhar e entretanto prepare a calda: Leve o acar a dourar em . File \ppm06_~1.txt \ppa09_~1.txt \ppa10_~1.txt p\teb06_~1.txt \aco03_~1.txt \aco09_~1.txt \ppp04_~1.txt \ppp07_~1.txt p\ent08_~1.txt \ppa01_~1.txt p\teb08_~1.txt \ppa06_~1.txt

Nas variantes do ingls, nos chamaram a ateno (IOA/ IOB): i) diferenas de grafia: lasagne / lasagna, centre/ center; ii) a grande presena das medidas nas duas listas e suas formas variadas de abreviao, em especial as colheres: TS-TB-T / TBSP para tablespoon e TEASP para teaspoon em IOB; iii) os pares contrastivos, como cornstarch / cornflour, shrimp / prawn, broth / stock; iv) assim como nas variantes do portugus, em IOA o trecho da receita que descreve seu preparo predominantemente denominado de Directions (42 ocorrncias), ao passo que, em IOB, parece haver uma alternncia entre o uso de Method (61 oc.) e Instructions (29); v) a presena de gas (47 oc.) + mark (26 oc.) e ml (47 oc.) medida do sistema mtrico internacional na lista de palavras-chave de IOB poderia ser um indcio de que, diferentemente dos americanos, os britnicos tm uma preocupao em tornar a receita acessvel a um pblico maior, englobando outras

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

354

21/9/2010, 13:55

355
culturas que no utilizam o sistema mtrico anglosaxo. Interpretamos esse fato como um reflexo de sua condio geopoltica enquanto membro da Unio Europia e parte do continente Europeu. Por outro lado, a lista de palavras-chave do IOA ilustra uma tendncia cultural crescente nos Estados Unidos. Os itens carbohidrate, fiber, cholesterol, protein, sodium e calories so itens tpicos de tabelas de informaes nutricionais, mais comuns em receitas dietticas. No entanto, um dos critrios utilizados na coleta foi no incluir receitas desse tipo, o que mostra que tais informaes se tornaram corriqueiras e, acima de tudo, necessrias nesse pas, muito provavelmente pelo fato de sua populao apresentar srios problemas de obesidade.

2.5 Teste e ampliao do corpus Segundo Atkins et al, corpus growth and feedback a ltima etapa da construo de um corpus. Para saber se o resultado final do corpus serve aos propsitos imaginados quando de seu planejamento preciso que ele seja testado e, posteriormente, corrigido e aumentado com base nas observaes feitas por usurios capacitados. Nosso corpus foi utilizado recentemente num trabalho de nossa autoria apresentado no PALC 2003, em Lodz, na Polnia (Tagnin e Teixeira, 2003). O retorno que obtivemos foi de grande importncia para que pudssemos planejar a realizao dos ajustes e ampliao necessrios, conforme comentamos a seguir.

3. Consideraes finais
Buscamos mostrar, ao longo deste artigo, as etapas envolvidas no planejamento, coleta e avaliao de corpora tcnicos, usando, como exemplo, um corpus comparvel multicultural de culinria em ingls americano / britnico e portugus brasileiro / europeu. O corpus foi construdo com o intuito principal de
TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

355

21/9/2010, 13:55

356
verificar, por meio do estudo de corpora, as diferenas entre as variantes do portugus e do ingls (para uma anlise mais detalhada dos corpora, vide Tagnin & Teixeira, no prelo). Tais diferenas, a nosso ver, no geral so ignoradas pelas obras de referncia e de consulta na rea, as quais, inclusive, so tradicionalmente fontes de referncia para o tradutor tcnico de culinria. Durante a fase de teste do corpus observamos que, de modo a garantir a representatividade mnima nas quatro variantes, ser necessrio dobrar o nmero de receitas coletadas, alm de incluir a categoria Lanches com suas 20 receitas em cada variante. Ficou clara tambm a necessidade de tratarmos do aspecto da representatividade no que diz respeito importncia/ recorrncia especfica de cada tipo de receita no contexto gastronmico e cultural de cada variante. Para isso, faz-se necessrio adotarmos uma nova postura metodolgica e no mais trabalhar com corpora comparveis no nvel das receitas, mas sim no nvel cultural. Ou seja, se os pratos com peixes e frutos do mar so mais freqentes em Portugal e na Gr-Bretanha do que no Brasil ou nos Estados Unidos, nosso corpus dever respeitar e refletir essa discrepncia coletando receitas desse tipo mais naquelas variantes do que nessas. Da mesma forma, o alto nmero de receitas discursivas (que no separam ingredientes de modo de fazer) em POP seria levado em considerao, bem como a representao da diversidade regional de cada variante. Para dar conta dessas diferenas pretendemos coletar 4 sites integrais, um em cada variante, e fazer novas anlises. importante ressaltar, no entanto, que s pudemos chegar a essas concluses por meio da construo do corpus, o que evidencia ser a Lingstica de Corpus uma metodologia relevante para o tradutor, quer proporcionando-lhe, por meio da construo e anlise de um corpus, um processo de aprendizagem que lhe revela caractersticas culturais, pragmticas, sintticas e lexicais da rea em estudo, quer auxiliando-o, durante o processo tradutrio, a encontrar, no corpus construdo, os equivalentes mais adequados para os termos que procura.

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

356

21/9/2010, 13:55

357
Referncias bibliogrficas
ATKINS, S.; CLEAR, J.; OSTLER, N. (1992) Corpus Design Criteria. Literary and Linguistic Computing 7:1. Oxford: Oxford University Press, p. 1-16. AUBERT, F. H. (1996) Introduo metodologia da pesquisa terminolgica bilnge. So Paulo, Humanitas/FFLCH-USP. ________. (2001) Lngua como estrutura e como fato histrico-social: conseqncias para a terminologia. In: ALVES, I.M. (org.). A constituio da normalizao terminolgica no Brasil. Humanitas: So Paulo. BAKER, M. (1995) Corpora in Translation Studies: An Overview and Some Suggestions for Future Research. Target, 7:2. Amsterdam, p. 223-43. BIBER, D. (1993) Representativeness in Corpus Design. Literary and Linguistic Computing 8:4. Oxford, Oxford University Press, p. 24357. BIDERMAN, M.T. (1992) O lxico, testemunha de uma cultura. Actas do XIX Congreso Internacional de Lingustica e Fililoxia Romanicas. A Coruna: Fundacin Pedro Barri de la Maza, Conde de Ferrosa, p. 397-405. ______. (1996) Lxico e vocabulrio fundamental. ALFA 40. So Paulo, Unesp, p. 27-46. COLINA, S. (1997) Contrastive Rhe toric and Te xt-Typological Conventions in Translation Teaching. TARGET vol. 9. Amsterdam, John Benjamin, p. 335-53. CRAZE, R. (1998) O Guia das Especiarias. Guia do conhecedor. (sem local de publicao): Livros e Livros. [trad. Jorge Pinheiro Valente]. FORNARI, C. (2001) Dicionrio-Almanaque de Comes & Bebes. Rio de Janeiro, Editora Nova Fronteira. GOMENSORO, M.L. (1999) Pequeno Dicionrio de Gastronomia. Rio de Janeiro:,Editora Objetiva. JAKOBSON, R. (1974) Aspectos lingsticos da traduo. Lingstica e Comunicao. So Paulo, Cultrix. JOHANSSON, S. (1980) Corpus-based Studies of British and American English. Papers from the Scandinavian Symposium on Syntatic Variation. Stockholm: Almqvist & Wiksell International. JUNQUEIRA, L. (1980) Ervas e especiarias na cozinha. Rio de Janeiro, Tecnoprint/Ediouro. MASSAM, D. e ROBERGE, Y. (1989) Recipe Context Null Objects in English. Linguistic Inquiry 20:1, p. 134-9. TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

357

21/9/2010, 13:55

358
McENERY, T.; WILSON, A. (1997) Corpus Linguistics . Edinburgh: Edinburgh University Press. MEIJS, W. (1996) Linguistic Corpora and Lexicography. Annual Review of Applied Linguistics vol. 16, p. 99-114. NORD, C. (1983) Text Analysis in Translation. Amsterdam and Atlanta, GA, Rodopi. NORRICK, K. (1983) Recipes as Texts: Technical Language in the Kitchen. In: JUNGEN, R., S. DE KNOP, P.H. NELDE E M.P. QUIX (eds.) Sprache, Diskurs und Text. Tbingen: Niemayer, p. 173-82. QUIRK, R. (1992) On corpus principles and design. In: SVARTVIK, J. (ed.) Directions in Corpus Linguistics. The Hague, Mouton de Gruyten. SARDINHA, T.B. (2000) Lingstica de Corpus: Histrico de Problemtica. D.E.L.T.A., v. 16, n. 2, p. 323-67. TAGNIN, S.E.O. e TEIXEIRA, E.D. (no prelo) British vs. American English, Brazilian vs. European Portuguese - how close or how far apart? - a corpus-driven study. In: LEWANDOWSKA-TOMASZCZYK, B. (ed.) Proceedings of the 4th Conference on Practical Applications in Language Corpora PALC03, Hamburg, Peter Lang. TAGNIN, S.E.O. (1989) Expresses idiomticas convencionais. So Paulo, tica, Srie Princpios. TEIXEIRA, E.D. (2003) Em busca de um novo modelo tecno-formal para a construo de dicionrios tcnicos bilnges o exemplo da culinria. Intercmbio vol. XII. So Paulo, LAEL PUC/SP, p. 243-51. TEUBERT, W. (2001) Corpus Linguistics and Lexicography. International Journal of Corpus Linguistics vol. 6 - Special Issue, p. 125-53. VAN DEN BROECK, R. (1986) Contrastive Discourse Analysis as a Tool for Interpretation of Shifts in Translated Texts. In: HOUSE, J. e BLUMKULKA, S. (e ds). Interlingual and Intercultural Communication: Discourse and Cognition in Translation and Second Language Acquisition Studies. Tbingen, Gunter Narr, p. 37-47. VRADI, T. e KISS, G. (2001) Equivalence and Non-equivalence in Parallel Corpora. International Journal of Corpus Linguistics vol. 6 Special Issue, p. 167-77. WERLE, L. & J. COX. (2000) Ingredientes. Colnia: Knemann. [traduo de Israel Jelin] WITTMAN, L.H.; PGO, T.R. e SANTOS, D. (1995) Portugus Brasileiro e Portugus de Portugal: algumas observaes. XI Encontro Nacional da APL. Lisboa.

TRADTERM, 10, 2004, p. 313-358

10 TradTerm 14.pmd

358

21/9/2010, 13:55