Você está na página 1de 466

Letras & Letras

Lingustica de Corpus: abordagem


e metodologia em pesquisas
lingusticas de base emprica
Organizao:
Prof. Dr. Ariel Novodvorski
Profa. Dra. Maria Jos Bocorny Finatto

2 Semestre 2014
Volume 30, nmero 2

ISSN: 1981-5239

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Expediente
Universidade Federal de Uberlndia
Reitor
Prof. Elmiro Santos Resende
Vice-Reitor
Prof. Eduardo Nunes Guimares
Diretora da EDUFU
Profa. Joana Luiza Muylaert de Arajo
Diretora do Instituto de Letras e Lingustica
Profa. Maria Ins Vasconcelos Felice
EDUFU Editora e Livraria da Universidade Federal de Uberlndia
Av. Joo Naves de vila, 2121 - Bloco 1S - Trreo - Campus Santa Mnica - CEP:
38.408-144 - Uberlndia - MG
Telefax: (34) 3239-4293
Email : vendas@edufu.ufu.br | www.edufu.ufu.br
Editorao: Prof. Guilherme Fromm
Dados Internacionais de Catalogao na Publicao (CIP)
Sistema de Bibliotecas da UFU, MG, Brasil.

Letras & Letras, v. 30, n. 2, jul/dez 2014, Uberlndia,


Universidade Federal de Uberlndia, Instituto de Letras e Lingustica, 1985Semestral.
Modo de acesso: http://www.seer.ufu.br/index.php/letraseletras
Editorao: Guilherme Fromm.
Organizao: Ariel Novodvorski; Maria Jos Bocorny Finatto.
ISSN: 1981-5239
1. Lngua. 2. Literatura-Crtica, 3. Lingustica.
1. Universidade Federal de Uberlndia. Instituto de Letras e Lingustica.
CDU: 801(05)
Todos os artigos desta revista so de inteira responsabilidade de seus autores, no cabendo qualquer
responsabilidade legal sobre seu contedo Revista, ao Instituto de Letras e Lingustica e Lingustica ou
Edufu.

Letras & Letras 30 Expediente, p. 1-6

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Letras & Letras


Diretor
Guilherme Fromm (UFU)
Conselho Consultivo
Ariel Novodvorski (UFU)
Jos Sueli de Magalhes (UFU)
Conselho Editorial

Alceu Dias Lima (UNESP-CAr); Alice Cunha de Freitas (UFU); Angela Brambilha Cavenaghi Themudo Lessa
(PUC-SP); Antnio Fernandes Jnior (CAC-UFG); Betina Rodrigues da Cunha (UFU); Carla Nunes Vieira
Tavares (UFU); Carlos A. M. Gouveia (Universidade de Lisboa); Carlos Piovezani Filho (UNESP-CAr);
Carmen Lcia Hernandes Agustini (UFU); Cleudemar Alves Fernandes (UFU); Dilma Maria de Mello (UFU);
Douglas Altamiro Consolo (UNESP-IBILCE); Dulce do Carmo Franceschini (UFU); Dylia Lysardo Dias
(UFSJ); Eduardo de Faria Coutinho (UFRJ); Elaine Cristina Cintra (UFU); Eliana Dias (UFU); Eliane Mara
Silveira (UFU); Elisabeth Brait (PUC-SP); Elzimar Fernanda Nunes (UFU); Enivalda Nunes Freitas e Souza
(UFU); Ernesto Srgio Bertoldo (UFU); Emlia Mendes (UFMG); Flix Bugueo Miranda (UFRGS); Fernanda
Costas Ribas (UFU); Fernanda Mussalim G. L. Silveira (UFU); Flavio Benites (UFMS); Guilherme Fromm
(UFU); Ida Lucia Machado (UFMG); Ingedore V. Koch (UNICAMP); Irenilde Pereira dos Santos (USP UNICSUL); Ismael ngelo Cintra (UNESP-CAr); Iv Carlos Lopes (UNESP - IBILCE); Ivan Marcos Ribeiro
(UFU); Iza Quelhas (UERJ); Jacy Alves de Seixas (UFU); Jair Tadeu da Fonseca (UFSC); Jean-Jacques
Courtine (Universit de Paris III/Sorbonne Nouvelle); Joana Luza Muylaert de Arajo (UFU); Joo Antnio de
Moraes (UFRJ/SJRP); Joo Bsco Cabral dos Santos (UFU); Joaquim Alves de Aguiar (USP); John Milton
(USP); Jos Guillermo Milan Ramos (UNINCOR); Jos Luiz Meurer (UFSC); Jos Olimpio Magalhes
(UFMG); Jos Sueli de Magalhes (UFU); Juliana Santini (UFU); Knia Maria de Almeida Pereira (UFU); Leila
Brbara (PUC-SP); Leonardo Francisco Soares (UFU); Llia Maria Elosa Alphonse de Francis (UFU); Luciana
Borges (UFG); Luciana Moura Colucci de Camargo (UFTM); Luciene Almeida de Azevedo (UFBA);; Luiz
Carlos Travaglia (UFU); Luiz Gonzaga Marchezan (UNESP-CAr); Luiz Paulo da Moita Lopes (UFRJ); Luzmara
Curcino Ferreira (UNESP-CAr); Mrcio Roberto Soares Dias (UESB); Marco Antnio Villarta-Neder
(UNITAU); Margarita Correia (Universidade de Lisboa); Maria Aparecida Caltabiano M. B. da Silva (PUC-SP);
Maria Aparecida Resende Ottoni (UFU); Maria Bernadete Gonalves dos Santos (UFU); Maria Ceclia Camargo
Magalhes (PUC-SP); Maria Ceclia de Lima (UFU); Maria Cristina Damionovic (UFPE); Maria das Graas
Fonseca Andrade (UESB); Maria do Rosrio Valencise Gregolin (UNESP-CAr); Maria Francelina Silami
Ibrahim Drummond (UFU); Maria Helena de Paula (UFG-CAC); Maria Imaculada Cavalcanti (UFG-CAC);
Maria Ins de Almeida (UFMG); Maria Ins Vasconcelos Felice (UFU); Maria Ivonete Santos Silva (UFU);
Maria Jos Rodrigues Faria Coracini (UNICAMP); Maria Luiza Braga (UFRJ); Maria Suzana Moreira do Carmo
(UFU); Marisa Martins Gama- Khalil (UFU); Maura Alves de Freitas Rocha (UFU); Mike Scott (Universidade
de Liverpool); Moacir Lopes de Camargos (UNIPAMPA); Nlia Scott (Universidade de Liverpool); Nilton
Milanez (UESB); Orlando Nunes de Amorim (UNESP-IBILCE); Orlando Vian Jnior (UFRN); Oziris Borges
Filho (UFTM); Paulo Fonseca Andrade (UFU); Pedro Monteiro (UFU); Regma Santos (UFG/CA); Regina Igel
(University of Maryland College Park); Roberto Aczelo de Souza (UERJ); Roxane Helena Rodrigues Rojo
(UFRJ); Srgio Ifa (UFAL); Simone Azevedo Floripi (UFU); Simone Tiemi Hashiguti (UFU); Solange Fiuza
Cardoso Yokozawa (UFG-CAC); Sueli Salles Fidalgo (PUC-SP); Susana Borneo Funk (UFSC); Suzi Frankl
Sperber (UNICAMP); Valeska Souza (UFTM); Vera Follain de Figueiredo (PUC/RJ); Vera Lcia Carvalho
Casa Nova (UFMG); Waldenice Moreira Cano (UFU); Waldenor Barros Moraes Filho (UFU); William Augusto
de Menezes (UFOP); William Mineo Tagata (UFU).

Expediente; p. 1-6.

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Participaram dessa edio como pareceristas ad hoc:


Adriana Silvino Pagano (UFMG)
Alena Ciulla (UFRGS)
Cludio Mrcio do Carmo (UFSJ)
Cleci Regina Bevilacqua (UFRGS)
Dalia Maria Guerreiro (Univ. de vora)
Elizamari Rodrigues Becker (UFRGS)
Gabriel de Avila Othero (UFRGS)
Giacomo Figueiredo (UFOP)
Heberth Paulo Souza (IPTAN)
Helosa Orsi Koch Delgado (PUC/RS)
Luciane Leipnitz (UFPB)
Maria Filomena Candeias Gonalves (Univ. de vora)
Maria Mercedes Riveiro Quintans Sebold (UFRJ)
Patrcia Brtoli (UERJ)
Paulo Pinheiro-Correa (UFF)
Pedro Henrique Lima Praxedes Filho (UECE)
Roberta Rego Rodrigues (UFPel)
Valria Neto de Oliveira Monaretto (UFRGS)
Vera Lcia Santiago Arajo (UECE)
Vera Maria Araujo Pigozzi de Arajo (UFRGS)

Expediente; p. 1-6.

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Sumrio
Expediente..................................................................................................................... 2
Apresentao ................................................................................................................. 7
Lingustica de Corpus no Brasil: uma aventura mais do que adequada Ariel
Novodvorski (UFU), Maria Jos Bocorny Finatto (UFRGS) .......................................... 7
Artigos ........................................................................................................................ 17
Uma metodologia de perfilao gramatical sistmica baseada em corpus - Giacomo
Figueredo (UFOP) ....................................................................................................... 17
Os dizentes nos artigos cientficos de Lingustica um estudo baseado na Lingustica
Sistmico-Funcional e com o auxlio da Lingustica de Corpus - Fernanda Beatriz
Caricari de Morais (PUC/SP)....................................................................................... 46
As construes com SE na produo escrita de brasileiros aprendizes de espanhol como
lngua estrangeira: um estudo baseado em corpus - Benivaldo Jos de Arajo Jnior
(ESPM/SP) .................................................................................................................. 64
Reflexes sobre anotao sinttica e ferramentas de busca - Uso da linguagem XML
para anotao sinttica no corpus digital DOViC - Cristiane Namiuti Temponi (UESB),
Aline Silva Costa (UESB) ........................................................................................... 82
Epistemic modality through the use of adverbs: a corpus-based study on learners'
written discourse - Adriana Tenuta (UFMG), Ana Larissa A. M. Oliveira (UFMG),
Brbara Malveira Orfan (UFSJ) ............................................................................... 104
Do Portugus Clssico ao Portugus Europeu Moderno: o mapeamento do artigo Simone Floripi (UFU) ............................................................................................... 122
A funo pragmtica Tpico na legendagem brasileira de um filme argentino em um
estudo de corpus paralelo - Amanda Verdan Dib (UFF), Paulo Pinheiro-Correa (UFF) 139
A segmentao lingustica na legendagem para surdos e ensurdecidos (LSE) de Amor
Eterno Amor: uma anlise baseada em corpus - Vera Lcia Santiago Arajo (UECE),
talo Alves Pinto de Assis (UECE) ............................................................................ 156
Metforas e domnios narrativos numa perspectiva da Lingustica de Corpus - Heberth
Paulo de Souza (IPTAN) ........................................................................................... 185
A terminologia do futebol: um estudo direcionado pelo corpus - Sabrina Matuda (USP),
Stella E. O. Tagnin (USP).......................................................................................... 214
A msica e os rudos na legendagem francesa para surdos e ensurdecidos - Ana
Katarinna Pessoa do Nascimento (USP), Stella E. O. Tagnin (USP) .......................... 244
Contextos de ocorrncia das perfrases de gerndio e particpio no portugus do Brasil e
na variedade do espanhol do Mxico e sua significao aspectual - Anne Katheryne
Estebe Maggessy (UFRJ), Maria Mercedes Riveiro Quintans Sebold (UFRJ) ............ 261
O corpus combinado e a pesquisa nos Estudos da traduo baseados em corpora Silvana Maria de Jesus (UFU) ................................................................................... 291
A equivalncia tradutria de Partculas Modais: um estudo baseado em corpus - Adriana
Silvina Pagano (UFMG), Arthur de Melo S (UFMG), Kcila Ferreguetti (UFMG) ... 322

Expediente; p. 1-6.

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Lingustica de Corpus e ensino: a compilao de um corpus de especialidade para


preparao e implementao de um curso preparatrio rpido para exame de
proficincia - Danilo S. Murakami (USP), Stella E. O. Tagnin (USP) ........................ 349
A (in)existncia de neutralidade: um estudo de caso baseado em corpus com roteiros de
audiodescries francesas de filmes via Teoria da Avaliatividade - Cristiene Ferreira da
Silva (UECE), Pedro Henrique Lima Praxedes Filho (UECE).................................... 367
Convergncia lexical entre letras de msica e ingls geral: um estudo baseado em
corpus - Patrcia Brtoli (UERJ) ................................................................................ 401
Fotografia tcnica de documentos para formao de corpora digitais eletrnicos: o
mtodo desenvolvido no Lapelinc - Jorge Viana Santos (UESB), Giovane Santos Brito
(UESB) ..................................................................................................................... 421
Centro e margem dos discursos sobre sustentabilidade: da ecologia lingustica ao
ecossistema social - Cludio Mrcio do Carmo (UFSJ) .............................................. 431
Entrevista .................................................................................................................. 452
Conversaciones con un lingista de corpus: Profesor Dr. Giovanni Parodi - Ariel
Novodvorski (UFU), Ana Fritz Herrera (UFU) .......................................................... 452

Expediente; p. 1-6.

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Apresentao
Lingustica de Corpus no Brasil: uma aventura mais do que adequada
Giovanni Parodi (2010, p. 167), nas reflexes finais de seu livro Lingustica de
Corpus: da teoria empiria, trazia, quatro anos atrs, esta impresso: parecem tempos em
que ser linguista de corpus uma aventura adequada. Considerando o percurso da
Lingustica de Corpus (doravante LC) no nosso pas desde 2004, poca do lanamento do
livro de Tony Berber Sardinha, nosso primeiro manual brasileiro de LC, cabe aqui refletir um
pouco sobre essa combinao de palavras dirigida Lingustica de Corpus.
Aventuras podem ser mais ou menos adequadas? O que ser adequado em termos de
uma aventura no terreno dos Estudos da Linguagem no nosso pas? Ao apresentar este volume
da revista Letras & Letras, queremos tambm tratar dessas questes.
Neste ano de 2014, comemoramos tambm os cinquenta anos do Corpus Brown
(1964), um ponto de referncia inevitvel em qualquer retrospectiva sobre a LC em nvel
mundial. Ainda que de modo bastante mais restrito, em termos de repercusso local, podemos
destacar que, exatamente h um ms, em novembro de 2014, conseguimos completar mais
uma aventura, realizamos o XII Encontro de Lingustica de Corpus (ELC) e a VII Escola
Brasileira de Lingustica Computacional (EBRALC), na Universidade Federal de Uberlndia
(UFU), interior de Minas Gerais, que tambm recebe a organizao deste nmero da Letras &
Letras especialmente dedicado LC.
A partir dessas trajetrias e de outras, desenhadas por toda uma comunidade de
pesquisadores em LC do Brasil, as palavras do professor Parodi renovam-se em significncia
e no poderiam definir melhor o momento atual. Se, por um lado, essas efemrides trazem
memria alguns marcos histricos importantes e nos fazem pensar em nossos prprios
percursos at aqui, conduzem tambm a uma reconstruo do prprio processo, na
constituio da rea que hoje reconhecemos como LC.
Ainda cabe repetir que a LC se coloca como uma nova perspectiva para a Lingustica
(BERBER SARDINHA, 2004, p. 35), mas no como um novo tipo de Lingustica. Mostra-se,
para aqueles que se aproximam da LC, tanto como uma metodologia quanto como uma
abordagem terica diferenciada dos Estudos da Linguagem. De quem queira se aproximar da
LC, apenas por se interessar por seu instrumental ou por seus procedimentos, nada ser

Ariel Novodvorski, Maria Jos Bocorny Finatto; p. 7-16.

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

cobrado em termos de uma filiao terica ou epistemolgica ainda que insistamos que
LC tambm um modo de compreender a lngua, que temos nosso modo de defini-la como
objeto de estudo: a lngua um sistema probabilstico de combinatrias, no qual uma unidade
se define pelas associaes que mantm com outras unidades.
Ao ocupar-se da explorao de grandes extenses de corpora textuais em formato
digital, criteriosamente reunidos para representar um dado estado de uso de lngua e
minerados com apoio informatizado, com destaque para as exploraes estatsticas de
elementos lexicais e observao das frequncias de combinatrias de palavras, vemos toda
uma trajetria de estudos realizados no Brasil. Esses estudos, considerados em uma
perspectiva muito ampla, podem ser bastante aproveitados em diferentes tipos de pesquisas e
servem hoje, no mnimo, para caracterizao de gneros textuais 1. Ao longo do seu percurso
investigativo entre ns, quase todos os gneros textuais escritos foram objeto de algum estudo
em LC, do literrio ao jornalstico, manuais tcnicos e textos de culinria, entre vrios outros,
sem esquecermos dos corpora especialmente dedicados aos registros orais. A esse respeito,
Mello (2012, p. 34) destaca que
Apesar de os corpora escritos ainda dominarem a produo na rea, a
compilao de corpora orais e multimodais tem se ampliado rapidamente.
Os corpora orais tm encontrado crescente aplicabilidade no apenas nos
estudos cannicos da Lingustica (Sociolingustica, Dialetologia,
Lexicografia, Morfossintaxe etc.), mas tambm no desenvolvimento de
tecnologias da fala, tais como o reconhecimento e sntese da fala.

O questionamento sobre a importncia da coleta de dados dos usos lingusticos para as


pesquisas, recorrente nos incios da dcada dos sessenta, em pleno contexto histrico de
dominncia de uma lingustica gerativista, contrasta radicalmente com o panorama atual. Se
considerada a perspectiva de uma poca em que se presumia que os dados j estariam na
mente do linguista, o surgimento do Corpus Brown exatamente nesse contexto teve um valor
pioneiro incalculvel e um efeito dinamizador dos estudos baseados em corpora, j apontados
por diversos autores. Essa mudana de paradigma se traduz num caminho percorrido entre a
idealizao e a sistematizao da observao de evidncias.
Atualmente, a expanso do uso dos termos corpus e corpora, alm da meno a muitas
das ferramentas e princpios caros LC, alcana reas que poderiam parecer, num primeiro
1

As concepes de gnero textual presentes em trabalhos sob a tica de Lingustica de Corpus so em geral
derivaes das ideias de SWALES (1990) e HALLIDAY (1991).

Ariel Novodvorski, Maria Jos Bocorny Finatto; p. 7-16.

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

momento, incompatveis ou inimaginveis. Assim, a aluso s terminologias tpicas de LC


(como types, tokens e concordncias) vem se tornando cada vez mais recorrente. Em eventos
cientficos, em publicaes, em nomes de disciplinas, teses e dissertaes, a recorrncia com
que aparecem referncias ou vestgios da LC denotam j uma presena marcada no plano
acadmico e servem como um bom termmetro do estado da arte.
J amplamente conhecida a afirmao de que todo corpus sempre traz questes
novas ou questes que no se imaginava encontrar, ainda que de acordo com o prprio
Fillmore (1992) nenhum corpus nos d resposta para tudo. De tal modo, tanto as
observaes como os experimentos e hipteses formuladas no mbito de toda investigao
nos conduzem a uma reviso luz das comprovaes e dos resultados. Um mdico espanhol,
Ramn y Cajal, j assinalava em 1899 a importncia do exame direto dos fatos da natureza e
o uso de mtodos, na tentativa de reduzir o mximo possvel fatores subjetivos. Com isso,
toda observao de dados para sua posterior descrio demandaria, necessariamente,
fundamentaes tericas e princpios metodolgicos; mas, acima de tudo, exigiria o traado
de caminhos de ida e de volta para a prpria revisitao dos dados e ajustes dos pressupostos
iniciais.
Dessa maneira, a sistematizao de dados e de observaes chega a ser crucial, talvez
ainda mais importante do que a simples aplicao e contraste de teorias. A descoberta e
identificao de padres a partir da observao so, para Hanson (1958), os problemas
fundamentais. Assim, toda teoria deriva do resultado de um trabalho consciente sobre os
dados, uma vez que a tarefa das teorias seria colocar fenmenos em sistemas. Todas essas
observaes conduzem nosso olhar para a compreenso da relevncia dada aos processos de
observao, etapa indispensvel nas pesquisas com corpora e nas diferentes fases de
descoberta.
As concepes da LC, conforme vemos, com base nas ideias de Stubbs (1996, p. 46;
2001) e de Sinclair (1991, p. xviii), so as seguintes:
a) Um corpus no mera ferramenta de anlise. E, sim, um importante conceito terico;
b) A linguagem se mostra diferente quando examinada extensivamente.
Assim, a aventura adequada citada no incio deste texto envolve toda uma trajetria
e todo um empreendimento coletivo de uma comunidade de pesquisadores. Nela se colocam
um conceito terico diferenciado e um empreendimento que convida o linguista interessado a

Ariel Novodvorski, Maria Jos Bocorny Finatto; p. 7-16.

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

apreciar o seu objeto de estudo sob um ngulo tambm diferenciado. Aqui, frisamos,
diferenciado no deve ser compreendido como algo melhor ou contrrio aos diferentes
convites Lingustica da nossa atualidade.
Esta apresentao busca contextualizar o momento particular em que surge este
nmero temtico da revista Letras & Letras, j definido como um marco histrico em que se
constitui uma nova rea de pesquisa, com abordagens e mtodos prprios. Por outro lado, este
texto introdutrio tambm procura enxergar o corpus como essa espcie de caminho de ida e
volta, amarrado importncia da observao emprica dos fatos lingusticos. Nessa
perspectiva, os corpora se tornam um territrio vasto o suficiente e propcio para a descoberta
de evidncias.
Este nmero da revista Letras & Letras, dedicado LC, est composto por 19 artigos e
uma entrevista com o linguista chileno Giovanni Parodi, realizada no mbito do XII ELC e da
VII EBRALC. A diversidade de assuntos que compe os artigos aqui presentes vai desde
aspectos metodolgicos a estudos de caso muito especficos, passando por diferentes
correntes e afiliaes tericas, dentre as quais destacamos a Lingustica Sistmico-Funcional,
a Lingustica Histrica, a Documentao e a Lingustica Cognitiva.
Giacomo Figueredo, da Universidade Federal de Ouro Preto (UFOP), no artigo
intitulado Uma metodologia de perfilao gramatical sistmica baseada em corpus,
apresenta uma metodologia de investigao de funes gramaticais, embasado em princpios
da LC. O autor prope uma metodologia que possibilita a identificao e descrio de
padres, na anlise do modo como a gramtica empregada na organizao do texto. Com
base na teoria sistmico-funcional e utilizando um corpus composto por dez minibiografias
escritas em portugus brasileiro, o pesquisador estabelece um mapeamento das funes
gramaticais, da distncia topolgica entre as funes e do movimento do emprego dessas
funes no espao gramatical.
Cristiane Namiuti-Temponi e Aline Silva Costa, da Universidade Estadual do
Sudoeste da Bahia (UESB), tambm abordam aspectos metodolgicos em seu texto
Reflexes sobre anotao sinttica e ferramentas de busca - Uso da linguagem XML para
anotao sinttica no corpus digital DOViC. No artigo discutido o uso da linguagem XML
como alternativa ao formato Penn TreeBank para anotao sinttica no corpus digital
denominado Documentos Oitocentistas de Vitria da Conquista (DOViC). Dentre as
justificativas apresentadas, as autoras destacam a utilizao da linguagem XML na anotao

Ariel Novodvorski, Maria Jos Bocorny Finatto; p. 7-16.

10

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

de edies e de informaes morfolgicas do corpus, por favorecer a criao de recursos


padronizados reutilizveis que facilitam a extrao de dados dos corpora.
Da Universidade de So Paulo (USP), com o texto Lingustica de Corpus e ensino: a
compilao de um corpus de especialidade para preparao e implementao de um curso
preparatrio rpido para exame de proficincia, a professora Stella Esther Ortweiler Tagnin e
Danilo Suzuki Murakami apresentam o processo de compilao de um corpus de
especialidade na rea de Relaes Exteriores. Os autores buscam definir tanto o contedo
programtico como a preparao de material didtico para candidatos a um exame de
proficincia em ingls, pensando em interessados no preenchimento de um cargo pblico no
mbito do governo federal.
Tambm no mbito do ensino, mas voltado para a escrita em lngua espanhola de
aprendizes brasileiros, Benivaldo Jos de Arajo Jnior, da Escola Superior de Propaganda e
Marketing (ESPM), apresenta o artigo As construes com SE na produo escrita de
brasileiros aprendizes de espanhol como lngua estrangeira: um estudo baseado em corpus.
Com base na Gramtica Cognitiva, o autor trata especificamente das construes reflexivas,
mdias, impessoais e passivas e estabelece uma comparao com dados observados em dois
corpora de falantes nativos: um de espanhol na variedade peninsular e outro de portugus
brasileiro.
Ainda no limiar dos pressupostos tericos da Lingustica Cognitiva, Heberth Paulo
Souza, do Instituto de Ensino Superior Presidente Tancredo de Almeida Neves (IPTAN),
aborda a metfora no escopo da cognio humana, no mbito das representaes mentais, com
aplicaes para a descrio da articulao textual. No artigo intitulado Metforas e domnios
narrativos numa perspectiva da Lingustica de Corpus, o autor recorre Teoria dos Espaos
Mentais e Teoria da Mesclagem Conceitual, para descrever o papel exercido pela metfora
na articulao textual, num corpus de redaes de vestibulandos, observando uma forma de
organizao de elementos tpica dos processos de narrao.
Para este nmero da revista Letras & Letras, os trabalhos desenvolvidos em trs
artigos tomam como corpus de estudo a legendagem. Desse modo, Vera Lcia Santiago
Arajo e talo Alves Pinto de Assis, da Universidade Estadual do Cear (UECE), no texto A
segmentao na legendagem para surdos e ensurdecidos (LSE) de Amor Eterno Amor: uma
anlise baseada em corpus, analisam problemas na diviso lingustica em dilogos de uma
produo audiovisual legendada. Segundo os autores, os problemas mais recorrentes de

Ariel Novodvorski, Maria Jos Bocorny Finatto; p. 7-16.

11

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

segmentao foram detectados na ordem de sintagmas verbal e nominal, em legendas de trs


linhas e com alta velocidade.
Tambm Ana Katarinna Pessoa do Nascimento e Stella Tagnin, da USP, recorrem ao
estudo das legendas, considerando a tradio francesa na LSE. No texto Efeitos sonoros na
legendagem francesa para surdos e ensurdecidos, as autoras analisam a traduo dos efeitos
sonoros de trs filmes franceses, com subsdios do programa WordSmith Tools 5.0. Por sua
vez, Amanda Verdan Dib e Paulo Pinheiro-Correa, da Universidade Federal Fluminense
(UFF), analisam A funo pragmtica Tpico na legendagem brasileira de um filme
argentino em um estudo de corpus paralelo, na legendagem brasileira do filme argentino O
Segredo dos seus olhos, com a fundamentao terica da Gramtica Discursivo-Funcional
(GDF) e funes do programa para alinhamento de corpora paralelos YouAlign (Terminotix
Inc.). Os autores analisaram dois tipos de construes de tpicos: as topicalizaes e os
deslocamentos esquerda.
Mudando o foco para o mbito musical, Patrcia Bertoli, da Universidade Estadual do
Rio de Janeiro (UERJ), apresenta o artigo Convergncia Lexical entre Letras de msica e
Ingls Geral: Um estudo baseado em Corpus. A partir de um corpus de aproximadamente 1
milho de palavras, resultante de 5.962 letras de msicas diferentes, a autora contrastou listas
de palavras individuais e de trigramas do corpus de estudo com outras listas extradas de dois
corpora de referncia do ingls geral. Os resultados da pesquisa apontam semelhanas entre a
linguagem usada nas letras das msicas analisadas e o ingls coloquial.
Por sua vez, o trabalho de Fernanda Beatriz Caricari de Morais, da Instituio
Nacional de Educao de Surdos (INES), toma como objeto de estudo artigos cientficos de
Lingustica um estudo baseado na Lingustica Sistmico-Funcional, com o auxlio da
Lingustica de Corpus. Nele, a autora analisa os participantes agentes dos verbos do dizer
mais utilizados em artigos de Lingustica, coletados atravs da plataforma de
peridicos Scielo. A LC possibilitou-lhe o tratamento computacional e dados quantitativos e
contextos de ocorrncia de determinadas palavras. Cludio Mrcio do Carmo, da
Universidade Federal de So Joo del Rei (UFSJ), tambm na linha da Lingustica SistmicoFuncional, combinada Anlise Crtica do Discurso, examina os discursos sobre
sustentabilidade e nos traz a ecologia lingustica uma rea de trabalho em Lingustica
de Corpus que se ocupa da anlise de padres lexicais de que um determinado item faa parte,
visando descrever sentidos a que esse item se associe.

Ariel Novodvorski, Maria Jos Bocorny Finatto; p. 7-16.

12

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Demonstrando a afinidade metodolgica da LC com estudos de Lingustica Histrica,


o trabalho de Simone Floripi (UFU) trata de mapear o artigo do portugus clssico ao
portugus europeu moderno. Sua investigao diacrnica, por meio da quantificao,
mobiliza pressupostos tericos de vertente gerativista e o Modelo de Princpios e Parmetros.
O trabalho de Maria Mercedes Riveiro Sebold e Anne Katheryne Estebe Maggessy, ambos da
Universidade Federal do Rio de Janeiro (UFRJ), explora o contexto de produtividade das
perfrases de gerndio e de particpio no portugus do Brasil e na variedade do espanhol do
Mxico. O aspecto verbal o ponto para contrastar essas duas lnguas ricas
morfologicamente.
Silvana Maria de Jesus, da Universidade Federal de Uberlndia (UFU), percorrendo
outra direo, nos traz um trabalho sobre corpus combinado e estudos de Traduo baseados
em corpora. No seu artigo, a autora aborda as relaes de traduo de say/dizer em textos
ficcionais no par lingustico ingls-portugus. O corpus combinado apresentado composto
de trs romances originais em ingls e suas tradues para o portugus e trs romances
originais em portugus e suas tradues para o ingls, sendo parte do CORDIALL (Corpus
Discursivo para Anlises Lingusticas e Literrias) desenvolvido pelos pesquisadores do
LETRA (Laboratrio Experimental de Traduo) da Faculdade de Letras da UFMG.
Na perspectiva do ensino de lngua estrangeira, especificamente no que se refere a
padres de escrita de aprendizes brasileiros de lngua inglesa, coloca-se o trabalho de Barbara
Malveira Orfano (UFSJ), Ana Larissa Adorno (UFMG) e Adriana Tenuta (UFMG), intitulado
Epistemic modality through the use of adverbs: a corpus-based study on learners written
discourse que trata da modalidade epistmica concretizada pelo uso de advrbios. Esse artigo
discute a forma como os falantes nativos e os aprendizes brasileiros diferem em sua produo
escrita e as possveis implicaes pedaggicas dessas diferenas.
Voltando ao tema de estudos em corpora de Traduo, o trabalho de Adriana Silvina
Pagano, Arthur de Melo S e Kcila Ferreguetti, todos da UFMG, aborda a equivalncia
tradutria de partculas modais, trazendo um dos trabalhos do grupo de pesquisa Modelagem
sistmico-funcional da traduo e da produo textual multilngue, do Laboratrio
Experimental de Traduo da UFMG. Os autores compilaram um corpus paralelo bilngue
portugus brasileiro ingls, formado por histrias seriadas da Turma da Mnica e suas
respectivas tradues para o ingls. O objetivo foi identificar quais partculas eram utilizadas

Ariel Novodvorski, Maria Jos Bocorny Finatto; p. 7-16.

13

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

com mais frequncia no corpus, como elas foram traduzidas para o ingls, e seria possvel
verificar um padro para as opes tradutrias.
Pedro Henrique Lima Praxedes Filho e Cristiene Ferreira da Silva, ambos da
Universidade Estadual do Cear (UECE), por sua vez, nos trazem um estudo de caso baseado
em um corpus de roteiros de audiodescries francesas de filmes, abordando uma das
modalidades da Traduo Audiovisual a que diz respeito acessibilidade sociocultural de
pessoas com deficincia visual. Ao abordarem o parmetro da neutralidade em
Audiodescrio, os autores buscaram

investigar,

com o

auxlio

da Lingustica

de Corpus (LC), a presena ou ausncia de interpretao por parte do tradutor/audiodescritor,


segundo os fundamentos da Teoria da Avaliatividade, no escopo da Lingustica SistmicoFuncional (LSF).
Sabrina Matuda e Stella Tagnin, ambas da USP, nos trazem um artigo sobre a
terminologia do futebol em um estudo direcionado pelo corpus. estudada a terminologia do
futebol em ingls e portugus, mobilizando-se a Lingustica de Corpus, a Terminologia
Textual e a concepo da traduo tcnica culturalmente condicionada.
Jorge Viana Santos e Giovane Santos Brito, ambos da Universidade Estadual do
Sudoeste da Bahia (UESB), brindam-nos com um trabalho bastante diferenciado, pois tratam
da fotografia tcnica de documentos para formao de corpora digitais eletrnicos. Nele, os
autores apresentam as etapas do mtodo fotogrfico que vem sendo desenvolvido e utilizado,
desde 2008, no Lapelinc (Laboratrio de Pesquisa em Lingustica de Corpus UESB).
Apresenta-se o processo de transposio de documentos manuscritos histricos do tipo
jurdico para formao de corpora lingusticos.
Enfeixando o volume, temos o relato de uma entrevista feita por Ariel Novodvorski e
Ana Fritz Herrera, ambos da UFU, com o linguista de corpus citado no incio desta
apresentao: o Prof. Dr. Giovanni Parodi, diretor de Ps-Graduao em Lingustica da
Pontifcia Universidade Catlica de Valpararso no Chile. Nessa entrevista, em novembro de
2014, durante o XII Encontro de Lingustica de Corpus (ELC) e a VII Escola Brasileira de
Lingustica Computacional (EBRALC), Parodi nos apresenta a plataforma de corpora do
espanhol El Grial, mas tambm mostra-nos suas reflexes sobre o passado e o futuro da LC
em seu pas e em uma perspectiva global.
Em todos esses artigos, em especial na entrevista do nosso convidado, ecoam as bases
terico-metodolgicas da LC, as quais remontam aos trabalhos do britnico J. R. Firth

Ariel Novodvorski, Maria Jos Bocorny Finatto; p. 7-16.

14

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

(escritos de 1960 a 1980). Firth, lidando com um enorme computador dos anos 50, j
pesquisava em textos autnticos a distribuio de palavras scio-culturalmente relevantes e
acreditava que o significado de uma palavra se configurava no contexto de uso. Sua to
repetida citao You shall know a word by the company it keeps desde ento chama a
ateno para a imensa rede de relaes sintagmticas e paradigmticas que envolve lxico e
gramtica, apontando para o fenmeno que ele chamava de colocao. Observava Firth, como
bem temos estudado em LC, que as palavras que um falante escolhe utilizar em meio a um
todo de opes sua disposio exibem um padro de associao regular. Isto , as palavras
privilegiam um tipo de combinao ou, melhor dito, elas preferem determinadas
associaes e, ainda, rejeitam outras.
Assim inspirada, ao longo de sua trajetria brasileira, para finalizar este texto, cabe
uma analogia com a clebre citao de Firth e com as colocaes, situando a LC no nosso
cenrio de estudos lingusticos. Conforme acreditamos, a LC associou-se a diferentes
aventuras de investigao e praticamente nada rejeitou em termos de parcerias de trabalho o
dilogo tem sido uma marca constante, mesmo com aqueles que encaram a LC apenas como
um modus operandi computacional e quantitativo. A despeito dessa impresso, claro deve ter
ficado nesses, pelo menos, primeiros 10 anos de percurso no Brasil, que vamos muito alm de
contar palavras e que j prestamos uma contribuio muito importante para toda uma
comunidade de pesquisa nacional e globalmente conectada. Assim, a aventura tem sido, sim,
adequada e, mais do que isso, j muito bem-sucedida.
Desejamos a todos uma tima leitura dos trabalhos deste volume e agradecemos ao
nosso colega Prof. Dr. Guilherme Fromm, pelo suporte sempre atento a tudo que precisamos
durante a organizao deste nmero da Letras & Letras.

Ariel Novodvorski*
Maria Jos Bocorny Finatto **
Editores
*

Doutor em Estudos Lingusticos pela Universidade Federal de Minas Gerais (UFMG). Professor Adjunto no
Curso de Graduao em Letras e no Programa de Ps-Graduao em Estudos Lingusticos (PPGEL) do Instituto
de Letras e Lingustica (ILEEL) da Universidade Federal de Uberlndia (UFU).
**
Doutora em Letras (UFRGS, 2001). Docente do Departamento de Lingustica, Filologia e Teoria Literria da
UFRGS, orientadora de mestrado e de doutorado junto ao PPG-Letras da UFRGS na linha de pesquisa
Lexicografia e Terminologia: Relaes textuais, Especialidade: Teorias do Lxico. Coordenadora do
GELCORP-SUL, Grupo de estudos em Lingustica de Corpus do Sul, certificado pela UFRGS, pesquisadora do
grupo TERMISUL, bolsista PQ-CNPq.

Ariel Novodvorski, Maria Jos Bocorny Finatto; p. 7-16.

15

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Referncias Bibliogrficas
BERBER SARDINHA, A. Lingstica de Corpus. Barueri, SP: Manole, 2004.
FILLMORE, C. J. Corpus linguistics or computer corpus linguistics. In: SVARTVIK, J. (org).
Directions in corpus linguistics. Proceedings of Nobel Symposium 82, Stockholm.
Berlim/Nova York, De Gruyter, 1992.
HALLIDAY, M. A. K. Corpus studies and probabilistic grammar. In: AIJMER, K. ;
ALTENBERG, B. (Org.). English corpus linguistics: studies in honour of Jan Svartvik.
London: Longman, 1991.
HANSON, N. Patrones de descubrimiento: observacin y explicacin. Madrid: Alianza
Editorial, 1977 [1958].
PARODI, G. Lingstica de Corpus: de la teora a la empiria. Madrid: Iberoamericana /
Vervuert, 2010.
RAMN Y CAJAL, S. Reglas y consejos sobre investigacin biolgica. Segunda edio do
seu discurso lido perante a R.A.C.E.F. e N. Madrid: Imprenta de Fortanet, 1899.
RASO, T.; MELLO, H. (org.). C-ORAL-BRASIL I: Corpus de referncia do portugus
brasileiro falado informal. Belo Horizonte: UFMG, 2012.
SNCHEZ, A. (org.). Cumbre Corpus Lingstico del espaol contemporneo:
fundamentos, metodologa y aplicaciones. Madrid: SGEL, 1996.
SINCLAIR, J. M. Corpus, Concordance, Collocation. Oxford: Oxford University Press,
1991.
STUBBS, M. Text and corpus analysis: Computer-assisted studies of language and culture.
Oxford: Blackwell, 1996.
SWALES, J. M. Genre analysis: English in academic and research settings. Cambridge:
Cambridge University Press, 1990.

Ariel Novodvorski, Maria Jos Bocorny Finatto; p. 7-16.

16

Artigos
Uma metodologia de perfilao gramatical sistmica baseada em
corpus
Towards a corpus-based methodology for grammatical systemic profiling
Giacomo Figueredo *
RESUMO: Embasado nos pressupostos da
Lingustica de corpus (LC), este artigo
apresenta uma metodologia de investigao
de funes gramaticais, a qual inclui as
etapas de compilao, extrao e anlise de
dados da gramtica. Denominada perfilao
gramatical, a metodologia apresentada neste
artigo possibilita a identificao de padres e
subsequente descrio, principalmente da
forma como a gramtica empregada na
organizao do texto a dinmica textual. A
perfilao gramatical lana mo da teoria
sistmico-funcional devido ao fato de essa
teoria abranger as relaes entre a gramtica,
sua expresso e a organizao do texto. Para
a perfilao gramatical deste artigo, foi
utilizado como Exemplo de Pesquisa um
corpus composto por dez minibiografias
produzidas em portugus brasileiro. Os
passos
da
perfilao
incluem
um
mapeamento das funes gramaticais, o
estabelecimento da distncia topolgica entre
as funes e, por fim, o movimento do
emprego das funes no espao gramatical
constituindo assim a perfilao. Como
resultado, este artigo apresenta a forma pela
qual a metodologia da perfilao gramatical
pode contribuir para o desenvolvimento das
pesquisas de corpus, em particular quando o
foco a gramtica. Especificamente, a
perfilao gramatical se mostra efetiva na
compilao e anlise de corpora para alm
da
relao
item
lexical/token,
compreendendo
igualmente
categorias
tericas/funes gramaticais. Demonstra
ainda como possvel compilar e extrair
dados de corpora inclusive para a forma
como so empregados na dinmica textual, o
*

ABSTRACT: This paper develops a


methodology to investigate grammar
functions based on corpus Linguistics. The
methodology is grammar profiling and
includes compiling, retrieving and analyzing
data from the grammar. Grammar profiling is
shown to be a useful methodology for
handling grammar patterning, especially
when dealing with such pattering in the
development of text. Grammar profiling is
grounded on systemic functional theory for it
needs a theory comprehensive enough to deal
with grammar metaredundancy in relation to
both text organization and expression. The
grammar profiling of this paper is applied to
investigate a corpus of ten mini-biographies
in Brazilian Portuguese as a Research
Example. The steps taken during profiling
identify grammar functions, establish their
topological distances and places them within
the grammar space. Results show that
grammar profiling is a useful methodology
for corpus research, especially when the need
is for a non-lexical corpus one made up of
functions is investigated. It is also useful
for compiling corpora and retrieving data
from text development, capturing not only
corpus synopsis, but also text dynamics.

Doutor em Lingustica Aplicada. Universidade Federal de Ouro Preto.

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

que, de outra forma, no seria possvel.


PALAVRAS-CHAVE:
Perfilao
gramatical. Metodologia baseada em corpus.
Dinmica de sistemas. Espao gramatical.

KEYWORDS:
Grammatical
corpus-based
methodology.
dynamics. Grammar space.

profiling.
Systems

1. Introduo
Este artigo focaliza as relaes entre a metodologia advinda da Lingustica de Corpus
(LC) e a anlise dos sistemas gramaticais. Motivado pela investigao dos fenmenos
lingusticos, em particular de sua organizao paradigmtica (ou sistmica) de forma objetiva
e replicvel, este artigo pauta-se pelos pressupostos da Lingustica de Corpus (LC) para
apresentar uma metodologia de investigao de funes gramaticais. Toma-se aqui como base
a constante preocupao da LC de investigar a lngua para alm da intuio do falante/analista
(VIANA, 2011), bem como o estabelecimento de metodologias confiveis de compilao,
extrao e anlise de dados que busquem garantir resultados uniformizados. A metodologia
apresentada neste artigo, denominada perfilao gramatical, possibilita a compilao de
corpora de funes gramaticais que, posteriormente, podem ser analisadas para a busca de
padres e subsequente descrio da lngua.
A necessidade da perfilao gramatical para os estudos afiliados LC surge do fato de
que a maior parte das funes gramaticais, diferentemente dos itens lexicais, no realizada
de forma aparente pela expresso (i.e., tpica, aberta), mas sim pela relao entre itens
lingusticos (i.e., criptotpica, encoberta) (WHORF, 1987). Diferentemente dos itens lexicais,
que so identificados e recuperados com facilidade uma vez que so realizados por palavras,
codificadas como tokens as funes gramaticais, por comparao, raramente so realizadas
por palavras, especialmente quando estas cumprem o papel de organizar o texto (CONRAD,
2010). Por tal motivo, essas ltimas requerem a anotao manual do analista e dificultam a
tarefa do computador na extrao de dados.
Na perfilao gramatical, a anotao do corpus para funes gramaticais torna-se um
passo metodolgico, a qual abre a possibilidade para a compilao de corpora de funes
gramaticais (cf. PAGANO et al., 2014). Dessa forma, a perfilao gramatical contribui para o
reconhecimento de padres que, de outra forma, no seriam reconhecidos, o que tornaria a
anlise assim suscetvel variao conforme o analista (BIBER et al., 2004). Igualmente, a
perfilao gramatical auxilia a busca automtica pelo computador, convertendo as funes
gramaticais em tokens gramaticais.

Giacomo Figueredo; p. 17-45.

18

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Como aporte terico, a perfilao gramatical baseia-se na Lingustica SistmicoFuncional (doravante LSF) (cf. HALLIDAY e MATTHIESSEN, 2004). Na qualidade de
teoria abrangente, a LSF proporciona um arcabouo de descrio e anlise do sistema
lingustico como um todo, em seus diferentes estratos, de forma que a gramtica pode ser
examinada tanto em relao aos elementos que a expressam quanto ao texto que organiza.
Alm disso, a LSF privilegia a organizao paradigmtica da lngua, dando nfase
disposio sistmica das funes gramaticais, as quais so o foco do presente artigo.
Para a perfilao gramatical deste artigo, como Exemplo de Pesquisa, ser utilizado
um corpus composto por dez minibiografias de matemticos importantes, extradas de livros
didticos de matemtica publicados em portugus brasileiro (PB). A metodologia de anlise
inclui um mapeamento das funes gramaticais, o estabelecimento da distncia topolgica
entre as funes e, por fim, o movimento do emprego das funes no espao gramatical
relativamente dinmica textual (LEMKE, 1991).
Com isso, este artigo espera demostrar como a metodologia da perfilao gramatical
pode contribuir para o desenvolvimento das pesquisas de corpus, em particular quando o foco
a gramtica. Especificamente, a perfilao gramatical permite a compilao e anlise de
corpora para alm da relao item lexical/token, compreendendo igualmente categorias
tericas/funes gramaticais.
2. Anlise lingustica e anlise de dados lingusticos pelo computador
As metodologias advindas da LC possibilitam a compilao de amostras
representativas da lngua i.e., corpora bem como a identificao de padres dos itens
lingusticos (cf. VIANA, 2011). As metodologias da LC se relacionam ao uso do computador
devido ao fato de os corpora serem armazenados em formato eletrnico e os procedimentos
de investigao envolverem o uso de softwares (TOGNINI-BONELLI, 2001).
Nesse processo, contudo, cabe distinguir a anlise lingustica, por um lado, da anlise
de dados lingusticos pelo computador, por outro. Isso se faz necessrio para evitar o emprego
de tokens, concordncias e frequncia de itens computacionais como explicao para os
fenmenos lingusticos (PAGANO et al., 2014).
O computador consegue acessar o corpus apenas indiretamente, por meio de uma
verso dos itens da linguagem natural codificada em uma forma que possa ser lida por
softwares. Por exemplo, a palavra (unidade gramatical constituda por morfemas)

Giacomo Figueredo; p. 17-45.

19

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

traduzida como um token (conjunto de caracteres que o software consegue ler). Por
conseguinte, os itens da lngua natural so etiquetados; e as etiquetas, juntamente com os
padres que formam, que so analisadas. Uma vez que o computador processa dados
lingusticos indiretamente, tokens, linhas de concordncia e frequncias de ocorrncia, por si
s, no explicam fenmenos lingusticos (cf. KE, 2012). Nesse ponto, a LC proporciona os
meios pelos quais as etiquetas do computador podem ser retraduzidas para a linguagem
natural.
Do ponto de vista dos estudos de corpora, Tognini-Bonelli (2001) detalha a distino
entre as pesquisas baseadas em corpus (corpus-based) e aquelas direcionadas pelo corpus
(corpus-driven). Os estudos baseados em corpus servem como forma de validar/refutar
princpios da teoria, ao passo que os estudos direcionados pelo corpus generalizam os
resultados, contribuindo para a construo gradual da teoria. A busca pelos padres
lingusticos que no so tpicos ou abertos, na forma de itens isolados ou estruturas, faz com
que a teoria reflita mais de perto os dados (cf. HALLIDAY e JAMES, 1993).
A trajetria desde uma abordagem baseada em corpus para outra direcionada pelo
corpus na qual os resultados extrados pelo software so reinterpretados em termos
lingusticos abre a possibilidade da construo de uma microteoria do corpus que permite
sua anlise. Nesse processo, os dados extrados pelo software linhas de concordncia, listas
de palavras, colocaes, etc. so reinterpretadas em termos lingusticos. Os types e tokens
revelam padres da classe gramatical palavra; a colocao revela padres da classe
semntica colocao lexical; as linhas de concordncia revelam padres da gramtica
criptotpica; e assim por diante.
Do ponto de vista da LSF, Halliday (1992) faz a distino entre o estrato da
organizao e o estrato da expresso no sistema lingustico. Os padres extrados pelo
software so relativos ao estrato da expresso da linguagem natural em particular na forma
grafolgica. Com isso, o estrato da expresso , por sua vez, a manifestao da organizao
lingustica, a qual pode ser modelada desde os padres sistmicos mais gerais a gramtica
at itens especficos o lxico. A investigao do corpus, por meio da perfilao gramatical
revela a organizao lingustica codificada nos dados extrados pelo software.
Com isso, (i) o intercmbio entre teoria e dados (estudos baseados em corpus/estudos
direcionados pelo corpus) e (ii) a mudana do estrato da expresso (conjunto grafolgico
arbitrrio) para o estrato da organizao (a gramtica e o lxico) se tornam os passos adotados

Giacomo Figueredo; p. 17-45.

20

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

para se extrarem dados lingusticos do corpus por meio do computador. Quando o interesse
da anlise se concentra na gramtica, inclui-se um novo passo, (iii) passar das ocorrncias de
itens especficos, o lxico, para os padres mais gerais de organizao.
Em certo sentido, a investigao mais fcil (HALLIDAY, 1992, p. 64) quando (i)
parte da abordagem baseada em corpus para a direcionada pelo corpus; (ii) concentra-se no
estrato da expresso; e (iii) limita-se ao lxico. Por outro lado, quando a investigao tem
como objeto a gramtica, outros aspectos devem ser levados em conta.
Os itens lexicais constituem a regio mais delicada (i.e., detalhada, especfica) dos
sistemas gramaticais, e por isso abarcam os itens mais distintos. Como tal, podem ser, em
geral, considerados itens nicos. Um item lexical , portanto, um item especfico da
gramtica, em geral realizado por um elemento da ordem da palavra (ou, com menor
frequncia, da ordem do grupo). Consequentemente, sua expresso tambm nica. Esta ,
via de regra, a definio do item lexical: a sobreposio de um significado em um item
gramatical em uma expresso (HALLIDAY, 2002).
Na investigao do corpus, o computador consegue identificar com maior facilidade
os itens lexicais justamente por causa de sua forma particular. Por exemplo, uma lista de
palavras demanda uma quantidade menor de etapas na anlise lexical (tokenizao) do que
uma lista de Sujeito Indeterminado, ou de Tipo de Processo na anlise sinttica/gramatical
(parsing) (cf. CNDIDO-JR, 2013).
Os itens gramaticais so generalizveis, uma vez que constituem recursos empregados
em uma quantidade maior de situaes na produo de significado. Com a exceo de funes
gramaticais especficas como, por exemplo, a Pluralidade e o Tempo Verbal os itens
gramaticais no possuem forma ou expresso nicas. Ao contrrio, as funes gramaticais
tendem a ser realizadas por um agrupamento de formas, tais como estruturas, partculas,
prosdias ou pela recorrncia de itens em conjunto (HALLIDAY, 2002).
Diante dessas consideraes, uma abordagem mais efetiva deve selecionar os
sistemas fundamentais para uma teoria gramatical probabilstica 1 (HALLIDAY, 1992, p.
64). De determinada maneira, a anlise gramatical pode ser tomada como um processo guia
para a LC, tanto na etapa de compilao do corpus, como tambm na etapa de anlise dos
dados. A noo de corpus ento se amplia, abrangendo a expresso e os itens lexicais

Todas as tradues apresentadas so de autoria prpria.


[] select systems that could be critical for a probabilistic grammatical theory.

Giacomo Figueredo; p. 17-45.

21

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

(conjuntos de caracteres no computador), bem como as funes gramaticais realizadas pela


expresso (as etiquetas dos conjuntos de caracteres).
Com o objetivo de aplicar a perfilao gramatical ao corpus de pesquisa, passa-se aos
pressupostos tericos desta, a partir da LSF.
3. Organizao do sistema lingustico e funes gramaticais
A arquitetura sistmica da lngua (HALLIDAY, 2002) uma proposta abrangente na
qual a descrio de cada fenmeno contribui para a descrio do sistema como um todo. A
justificativa de um modelo sistmico dada por HALLIDAY e MATTHIESSEN (2004, p.
20):
So muitas as razes para a adoo de uma perspectiva sistmica. Uma delas
que as lnguas no so projetadas, mas evoluem. Ademais, os sistemas
evolutivos no podem ser explicados simplesmente como uma soma de
partes. Nosso pensamento tradicional sobre a linguagem, que
composicional, deve ser, se no substitudo, pelo menos complementado por
um pensamento sistmico, por meio do qual buscamos compreender a
natureza e a dinmica do sistema semitico como um todo.2

Nesses moldes, a LSF prope que o sistema seja concebido a partir das dimenses
necessrias para que o mesmo seja explicado, bem como os princpios pelos quais se
organiza. Dentre as dimenses, destacam-se pela relevncia para o presente trabalho:
estratificao, metafuno e eixo.
3.1 Dimenses do sistema lingustico
Estratificao: na condio de sistema semitico, a lngua possui dois estratos o
contedo e a expresso. No entanto, a diviso do estrato do contedo em dois um
gramtico-organizacional e outro semntico-discursivo possibilitou ao sistema no apenas
transmitir, mas tambm criar significado. Pelo fato de o contedo possuir um estrato
responsvel pela organizao (i.e., a gramtica, que realiza os itens semnticos e o texto),
qualquer escolha gramatical cria, necessariamente, uma mudana na produo do significado

There are many reasons for adopting this systemic perspective; one is that languages evolve they are not
designed, and evolved systems cannot be explained simply as the sum of parts. Our traditional compositional
thinking about language needs to be, if not replaced by, at least complemented by a systems thinking whereby
we seek to understand the nature and the dynamic of a semiotic system as a whole.

Giacomo Figueredo; p. 17-45.

22

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

e no desenvolvimento do texto. Contudo, ressalta-se que essa criao no pode acontecer


independente do contexto (retrico).
Halliday (2002) afirma que o fato de o sistema ser estratificado permite que a
gramtica comporte ao mesmo tempo mais de um modelo de realidade, podendo, com isso,
equilibrar os recursos de cada modelo dependendo da experincia a ser concebida, o que se
faz em ocasies diferentes de formas diferentes entre os estratos.
Com isso, possvel encontrar padres na utilizao dos recursos; isso porque os
eventos do mundo que so concebidos pelos falantes como fenmenos similares tendem a ser
categorizados de forma similar e, consequentemente, seu significado ser formalmente
produzido na gramtica de forma similar. Esses padres se formam pela presso exercida pelo
contexto e a necessidade de se produzirem novos significados para novas situaes.
Por conseguinte, alm de criar os significados, a lngua cria tambm as variveis contextuais
relevantes a partir das quais deve ser interpretada. As variveis compreendem (i) o
estabelecimento e manuteno das relaes entre os falantes, (ii) a organizao da realidade e
do conhecimento e (iii) a constituio de cada significado individual como parte da unidade
bsica da lngua o texto (discurso em contexto). A variao contextual promove uma
diversificao dos recursos gramaticais, de forma que os sistemas se agrupem em conjuntos
de funes distintos, denominados metafunes.
Metafuno: a dimenso da lngua responsvel por agrupar os sistemas segundo a
sua codependncia para a produo de determinado tipo de significado, que pode ser (i)
estabelecer e manter as relaes entre os falantes, (ii) organizar a realidade e o conhecimento,
e (iii) variar a frequncia de itens segundo a situao para assim criar o discurso em contexto.
A metafuno interpessoal responsvel pelo tipo de relao ou interao que o falante (ou
escritor) estabelece com seu ouvinte (ou leitor). Assim, relaes de poder entre emissor e
receptor, bem como as de polidez, subservincia, exigncia, pedido, entre outras, so
codificadas pelos sistemas desta metafuno. A metafuno ideacional representa nossa
percepo das coisas que existem no mundo. responsvel pela transitividade, ou o tipo de
interao existente entre as coisas (participantes) e os eventos (processos). Assim, os
processos, isto , o conjunto de realizao dos eventos, os participantes e as circunstncias nas
quais estes processos acontecem compreendem esta metafuno. A organizao das
informaes na construo do texto de responsabilidade da metafuno textual. Segundo
Halliday (1976), o texto uma unidade operacional da lngua, que pode ser falado ou

Giacomo Figueredo; p. 17-45.

23

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

expresso atravs da escrita, independente de seu tamanho. na composio do texto que o


falante escolher quais partes de seu texto so mais importantes e merecem destaque, quais
ideias mantm relao com outras, e assim por diante.
Eixo paradigmtico: segundo a dimenso do eixo paradigmtico, a lngua examinada
como o conjunto de opes sistmicas. Por um lado, isto implica em dar proeminncia
escolha como forma principal de se produzirem significados; por outro lado, o valor de cada
opo s pode ser conhecido na oposio s outras opes (i.e., na relao de agnao). O
princpio que ordena o sistema lingustico do ponto de vista do eixo paradigmtico a
delicadeza, segundo o qual a escolha de uma opo se d em nveis cada vez mais refinados
desde a condio de entrada mais geral (indelicada) at a escolha, no final do sistema, por um
item lexical, que seria a opo mais delicada.
Os sistemas so organizados em redes e cada item de uma classe constitui um termo a
ser selecionado. Dentre os itens de uma classe, os sistemas determinam a propriedade que
permite a seleo de um item possvel, e no de outro, igualmente possvel. Como forma de
notao do sistema, utilizam-se as redes dos sistemas. A ttulo de ilustrao, apresenta-se a
seguir a rede do sistema de QUANTIFICAO do PB (Figura 1).

FIGURA 1 O sistema de QUANTIFICAO em portugus brasileiro.

A unidade da condio de entrada para a QUANTIFICAO sistema o grupo


nominal, aberta para trs subsistemas: ORDEM, PRECISO e MODO. Em cada subsistema,
h duas opes e apenas uma delas deve ser selecionada. Por exemplo, se for selecionada uma
opo da seguinte maneira: ORDEM ordenao; PRECISO particularizao; MODO
indicativo, ento a opo em PB realizada pelos numerais ordinais, como em terceiro
ou dcimo.

Giacomo Figueredo; p. 17-45.

24

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Um passo importante da investigao gramatical, relacionar as funes s outras


opes que a ela so opostas, dispondo os dados da pesquisa formalmente. Logo, faz parte da
metodologia desta pesquisa dispor formalmente os dados, apresentando-os como redes de
sistemas.
Especificamente no caso deste trabalho, o foco sero os principais sistemas da orao,
interpessoal,

ideacional

textual

(respectivamente,

os

sistemas

de

MODO,

TRANSITIVIDADE e TEMA).
3.2 Dinmica textual
A produo de significado caracterizada como a atividade de selees sucessivas de
funes dos sistemas, de forma que, cumulativamente, gerem um texto. O acmulo de
significado no texto pode ser observado segundo dois pontos de vista (LEMKE, 1991, p. 25):
(i) Sinptico: o sistema visto como o conjunto geral de todas as funes, disposto de
forma organizada pelo valeur e pela delicadeza. O sistema so todas as funes disposio
para selecionar dentre elas os inmeros significados, conjuntos de significados e redes de
relaes diferentes. O termo sinptico implica em uma descrio geral de todas as
possibilidades do sistema.
(ii) Dinmico: o sistema visto como o conjunto de relaes entre as funes
selecionadas durante a produo de um texto. O termo dinmico implica em observar, dentre
todas as possibilidades, apenas aquelas que de fato foram selecionadas para produzir
determinado texto.
Lemke (1991) caracteriza a relao entre os sistemas e as perspectivas afirmando que
uma rede sistmica sempre sinptica. Com isso, ela no consegue apreender o processo de
produo de significado. Esse autor introduz a noo de sistema dinmico, o qual descreve,
para cada escolha no sistema, conjuntamente a opo prxima escolha. Lemke (1991, p. 2526) conclui:
[...] fundamental compreender como e por que se d a variao. Dado
que a descrio dos sistemas dinmicos , basicamente, uma questo de
pesar a probabilidade de cada escolha, ento cabe entender como as escolhas
at este ponto condicionam as probabilidades para prxima escolha.3

[] it is very important for us to be able to say something about how and why it varies as it does. if we
imagine the description of dynamic systems to be mainly a matter of the dynamic weightings of selection

Giacomo Figueredo; p. 17-45.

25

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

A perspectiva da produo dinmica altera o conceito de significado, que pode variar


dependendo de quais outras funes se opem em uma mesma rede, formando assim um
fluxo de significados. Igualmente, a produo dinmica cria uma histria da rede. Na
perspectiva dinmica, a histria da rede armazena o acmulo de informao nos sistemas.
justamente essa histria da rede que a perfilao gramatical captura e, a partir da,
possibilita a compilao de corpora das histrias das redes. Esse processo tem incio na
dimenso do eixo e, subsequentemente, integra as outras dimenses segundo a relao entre
as disposies tipolgica e topolgica da gramtica.
3.3 Tipologia e Topologia
A tipologia pode ser definida como o conjunto das relaes de oposio nos sistemas
de acordo com as categorias que os diferenciam. Na descrio gramatical, a tipologia se
associa organizao paradigmtica, uma vez que captura o aspecto da escolha das funes,
dividindo-as, assim, em tipos (i.e., classes).
A topologia, por sua vez, se define como a representao multiaxial que estabelece um
espao no qual as categorias so dispostas de forma gradual e em posio relativa (SOUZA,
2013). Na descrio gramatical, a topologia busca depreender as relaes entre as funes que
no so definidas pela oposio ou pela a escolha, mas que, de outra forma se associam por
outras formas, tais como a coocorrncia nos textos, a frequncia, ou a proximidade semntica
(MARTIN e MATTHIESSEN, 1991).
O modelo de organizao sistmica, construdo a partir das relaes paradigmticas,
d nfase ao aspecto tipolgico do sistema. Contudo, o modelo tipolgico no consegue
apreender algumas relaes entre as funes, por elas no se relacionarem como oposio em
um determinado paradigma, mas por serem produzidas a partir de relaes dinmicas que
variam com os textos. Com isso, possvel perceber que a organizao tipolgica se associa
viso sinptica do sistema.
Dessa maneira, uma forma de complementar o modelo tentar apreender tais relaes.
Se a necessidade se relaciona viso dinmica do sistema, faz sentido empregar um modelo
topolgico. isto que a perfilao gramatical apresentada neste artigo busca fazer.

probabilities, then we wish to know how the selections up to now condition the probabilities for selections
now.

Giacomo Figueredo; p. 17-45.

26

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

4. Perfilao gramatical: uma metodologia baseada em corpus


Dado que o significado produzido pela gramtica est no contraste das opes
paradigmticas, o trabalho realizado pela dimenso do eixo alterar a organizao dos
sistemas para produzir variao e, assim, gerar textos para as diferentes situaes
(HALLIDAY, 1996). Nessas condies, faz-se necessria uma abordagem multidimensional,
que integre estratificao, metafuno e eixo, segundo a modelagem das redes sistmicas
(MARTIN, 2013; QUIROZ, 2013). Alm disso, igualmente necessrio explicar o
funcionamento da dinmica textual (LEMKE, 1991) ou a seleo sucessiva de opes nos
sistemas para a produo de um texto.
Tendo como base a LC e o aporte terico da LSF, apresenta-se, a seguir, a forma como
a metodologia para a perfilao gramatical se desenvolve. A perfilao parte da organizao
sistmica e das redes para a construo de mapas topolgicos e do espao gramatical do qual
sero extrados os perfis gramaticais do corpus.
4.1 Mapas topolgicos
O mapa topolgico da gramtica consiste em converter as oposies sistmicas em
espaos entre as funes (MARTIN e MATTHIESSEN, 1991). Como dito anteriormente, o
mapa topolgico abrange as seguintes etapas da perfilao gramatical: (a) o mapeamento das
funes gramaticais, (b) o estabelecimento da distncia topolgica entre as funes e, por fim,
(c) o movimento do emprego das funes no espao gramatical.
Como ilustrao do desenho dos mapas, ser apresentado o sistema de MODO
IMPERATIVO em PB, o qual possui quatro opes.
1) A primeira opo mais delicada do imperativo se refere ao Sujeito das oraes imperativas.
Este sempre o ouvinte no Modo imperativo jussivo, mas pode tambm incluir o falante nas
oraes sugestivas. Por exemplo: Tomemos como exemplo o segmento de frase.
2) Uma outra opo mais delicada o recurso para aumentar a chance de se obter uma
resposta esperada ao comando. Esta realizada pela possibilidade de se expressar uma cpia
do Predicador, igualmente com forma verbal imperativa, ao fim da proposta, funcionando
como o Ecopredicador. Por exemplo: Conta seu sonho pra ele, conta. Ressalta-se que a
utilizao do Ecopredicador se restringe s opes sugestivo ou jussivo: neutro no sistema de
tipo de imperativo.

Giacomo Figueredo; p. 17-45.

27

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

3a) Imperativo: singularizado: Ocorre quando o falante determina exatamente a quem ser
atribudo o comando. Nesse caso, a especificidade do comando realizada pela posio na
estrutura dos elementos do Negociador: Sujeito seguido pelo Predicador.
3b) Imperativo: negociado: este ocorre quando a responsabilidade por se obedecer a um
comando negociada entre os interlocutores. Nesse caso, o Sujeito segue o Predicador na
estrutura Predicador^Sujeito. Por exemplo: Voc abre a porta. Eu no, abre voc.
Alm do TIPO DE IMPERATIVO, o PB apresenta ainda um outro subsistema,
denominado FORA. Em PB a FORA realizada fonologicamente pelos movimentos
tnicos 1, 1+ e 5. Uma orao imperativa pode codificar um comando (demanda de bens-eservios), que seria a opo no-marcada, opo esta realizada pelo Movimento Tnico
1(queda). Pode ainda codificar uma opo marcada: (i) codificando um pedido, realizada pelo
Movimento Tnico 5 (subida; queda); ou (ii) codificando uma ordem, realizada pelo
Movimento Tnico 1+ (queda forte).

TIPO DE
IMPERATIVO

sugestivo
1pl morf.
imp.

+ eco
Ecopredicador
neutro

eco

jussivo
2sg morf.
imp.

imperativo

insistente

singularizado
Sujeito ^ Predicador
negociado
Predicador ^ Sujeito

no-marcada
Mov. Tn. 1
FORA
marcada

pedido
Mov. Tn. 5
ordem
Mov. Tn. 1+

FIGURA 2 A rede do sistema de MODO IMPERATIVO em PB.

A partir da rede, dividem-se as escolhas conforme seu nvel de delicadeza, e cada uma
delas numerada. Cabe ressaltar que os nmeros representam valores categricos e, com isso,
iro revelar a posio relativa das funes no mapa topolgico (Figura 3).

Giacomo Figueredo; p. 17-45.

28

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

FIGURA 3 Categorizao por nvel de delicadeza do IMPERATIVO.

A partir da, possvel conferir a cada cosseleo uma etiqueta que representa o seu
lugar no sistema, conforme um conjunto de escolhas. O Quadro 1 mostra as etiquetas de cada
funo, bem como a escolha feita para cada nvel de delicadeza. Por exemplo, a funo 1124
mostra que, no primeiro nvel de delicadeza (N1), seleciona-se 1 para a funo Imperativo. No
segundo nvel de delicaza (N2), seleciona-se 1 para a funo Jussivo & No-Marcado. J no
terceiro nvel de delicaza (N3), seleciona-se 2 para a funo Insistente. Por fim, para o nvel
mais delicado (N4), seleciona-se 4, a funo Negociado. Por exemplo, Assiste o filme voc.

N
1
1

funo
jussivo&
nomarcado
jussivo&
marcado

sugestivo&
nomarcado
sugestivo&
marcado

QUADRO 1 Etiquetamento das cosselees do MODO IMPERATIVO.


N
Funo
N
funo
N
#
exemplo
2
3
4
1
neutro
1
no-eco
1 1111
Assiste o filme.
insistente
2
eco
2 1112
Assiste o filme, assiste.
1123
Voc assiste o filme.
1124
Assiste o filme voc.
ordem&neutro
3 singularizado
3 1231
Assiste o filme. (+1)
2
pedido&neutro
4
negociado
4 1232
Assiste o filme, assiste. (+1)
ordem&insistente 5
1241
Assiste o filme. (+5)
pedido&insistente 6
1242
Assiste o filme, assiste. (+5)
1253
Vc assite o filme (+1)
1254
Assiste o filme vc (+1)
sugestivo&ordem 7
1263
Vc assiste o filme (+5)
3 sugestivo&pedido 8
1264
Assiste o filme vc (+5)
1311
Vamos ver o filme.
1312
Vamos ver o filme, vamos.
1471
Vamos ver o filme (+1)
4
1472
Vamos ver o filme, vamos
1481
(+1)
1482
Vamos ver o filme (+5)
Vamos ver o filme, vamos
(+5)

Giacomo Figueredo; p. 17-45.

29

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

O etiquetamento das funes um recurso analtico importante por conseguir capturar


as cosselees entre os subsistemas, bem como o seu desenvolvimento na delicadeza. Ele
permite desenhar um mapa topolgico com as distncias relativas entre as funes.
Para a perfilao, os mapas topolgicos servem como uma descrio dinmica da
gramtica, seguindo Lemke (1991), uma vez que permitem a visualizao do panorama
gramatical para um determinado fenmeno. A Figura 4 mostra o mapa topolgico do MODO
em PB. No caso da Figura 4, tem-se um panorama da gramtica interpessoal da orao em
PB. O mapa compreende o sistema de MODO e seus subsistemas, MODO INDICATIVO e
MODO IMPERATIVO, incluindo todos os seus subnveis de delicadeza.

FIGURA 4 Mapa topolgico do MODO em PB.

Giacomo Figueredo; p. 17-45.

30

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

4.2 Corpora gramaticais


Os mapas topolgicos permitem que cada categoria i.e., funes, ou cosselees de
funes, para qualquer nvel de delicadeza seja anotada por um cdigo simples de apenas
alguns dgitos (no caso do MODO, quatro ou cinco). Torna-se possvel converter a anotao
gramatical em um conjunto de tokens, sendo que cada etiqueta do cdigo se torna um token.
Por conseguinte, os mapas topolgicos possibilitam a compilao de corpora gramaticais que,
por sua vez, podem ser investigados pelas etiquetas, as quais representam tokens
gramaticais.
A Figura 5 traz um exemplo de um corpus de tokens gramaticais elaborado a partir do
corpus da pesquisa. O nmero entre parnteses indica a sequncia das oraes e cada ponto
final indica o incio de uma nova orao. Cada cdigo de seis dgitos indica as funes
gramaticais da orao. Na primeira clula, as funes se apresentam na forma como foram
empregadas no texto; na segunda clula, apresentam-se em um exemplo de busca por linhas
de concordncia.

(1)$11$21$10.$(2)$14$21$41.$(3)$57$21$10.$(4)$11$21$41.$(5)$14$21$10.$(6)$39$21$10.$(7)$16$21$41.$(8)$14$21$
10.$(9)$21$41.$(10)$14$21$41.$(11)$11$21$45.$(12)$16$21$41.$(13)$14$21$10.$(14)$11$21$41.$(15)$14$21$10.$
(16)$11$21$10.$(17)$14$21$10.$(18)$16$21$41.$(19)$59$21$10.$(20)$31$21$41.$(21)$33$21$10.$(22)$14$21$41.$
(23)$33$21$10.$(24)$39$21$41.$(25)$14$21$10.$(26)$19$21$10.$(27)$14$21$41.$(28)$19$21$41.""

"

FIGURA 5 Exemplo de um corpus de tokens gramaticais.

Quando o movimento do emprego das funes gramaticais acrescentado perfilao,


faz-se necessrio acompanhar a forma pela qual a dinmica textual se desenvolve. Assim, no

Giacomo Figueredo; p. 17-45.

31

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

basta apenas entender as distncias topolgicas entre as funes em um texto, mas,


igualmente, cabe levar em conta a varivel tempo ou a sequncia em que ocorrem as
mudanas, dinamicamente. Isso feito estabelecendo a distncia entre as funes gramaticais
das oraes, na ordem em que aparecem no texto.
Tomando como exemplo o TEXTO 10 do corpus da presente pesquisa, as quatro
primeiras oraes so classificadas conforme suas funes gramaticais para os sistemas de
TRANSITIVIDADE, MODO e TEMA e recebem os seguintes cdigos de acordo com sua
localizao nos mapas topolgicos:

orao
1
2
3

QUADRO 2 Anlise na perfilao gramatical


FUNO
variste Galois nasceu nas proximidades
TRANS.: Material: Intrasitivo (11)
de Paris, na aldeia de Bourg la-Reine, onde
MODO: Declarativo (21)
seu pai era prefeito.
TEMA: Default (10)
Aos 12 anos mostrava pouco interesse por
TRANS.: Material: Transitivo (14)
Latim, Grego e lgebra mas a Geometria
MODO: Declarativo (21)
de Legendre o fascinava.
TEMA: Perspectiva (41)
Aos 16 anos, julgando-se em condies,
TRANS.: Mental: Cognitivo (57)
procurou entrar na Escola Politcnica mas
MODO: Declarativo (21)
foi recusado por falta de preparo e isto
TEMA: Perspectiva (41)
marcou seu primeiro fracasso.
Aos 17 anos escreveu um artigo onde
TRANS.: Material: Transitivo (14)
expunha suas descobertas fundamentais
MODO: Declarativo (21)
entregando-o a Cauchy para que o
TEMA: Perspectiva (41)
apresentasse na Academia.

CDIGO
112110
142141
572141

142141

Relativamente a essas quatro oraes, pode-se perceber que 1, 2 e 4 so prximas


entre si e distantes de 3 na TRANSITIVIDADE; as quatro esto no mesmo ponto com relao
ao MODO; e 1est distante de 2, 3 e 4 com relao ao TEMA. Quando esse tipo de medida
feito para o texto completo, possvel desenhar um grfico que represente essas distncias no
espao gramatical (Figura 6).

Giacomo Figueredo; p. 17-45.

32

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

FIGURA 6 Dinmica no espao topolgico da gramtica para o TEXTO 10

Como mostra a Figura 6, cada ponto representa uma orao e, com isso, um conjunto
de coordenadas das funes oracionais relativas TRANSITIVIDADE (eixo x), ao MODO
(eixo y) e ao TEMA (eixo z). Esse tipo de grfico que representa o espao topolgico da
gramtica consegue contribuir para a anlise do texto por permitir que ela seja visualizada,
por completo, de uma s vez. Alm disso, consegue tambm estabelecer as distncias, do
ponto de vista gramatical, entre as oraes e suas posies relativas. Por fim, as linhas que
ligam as oraes convertem-se, na verdade, em vetores. Consequentemente, depreendem
movimento em funo da varivel tempo e, assim, capturam a dinmica do desenvolvimento
do texto por completo.
A coleo de espaos gramaticais de diversos textos tambm funciona como a
compilao de corpora. Neste caso especfico, no so corpora de tokens lexicais, ou
gramaticais, mas sim de tokens textuais.
Somado compilao de corpora de tokens textuais est o movimento entre as
oraes e, por conseguinte, entre suas funes, extraindo dados relativos apenas dinmica
do desenvolvimento do texto. A partir do grfico, ainda tomando o TEXTO 10 como
exemplo, cada vetor permite calcular a mudana gramatical entre as oraes ao longo do
tempo. Com isso, elabora-se uma lista da sequncia de equaes vetoriais em outras
palavras, compila-se um corpus de tokens discursivos (Quadro 3).

Giacomo Figueredo; p. 17-45.

33

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

QUADRO 3 corpus da dinmica textual: equaes vetoriais do desenvolvimento do texto.


amostra do corpus de
linhas de concordncia do
Orao trans.(x) modo (y)
tema (z)
equaes vetoriais
corpus de equaes vetoriais
01
11
21
10
r = <11, 21, 10> + t<3, 0, 31>
r = <11, 21, 10> +
r = <57, 21, 10> + t<-46, 0, 31>
t<3, 0, 31>
02
14
21
41
r = <39, 21, 10> + t<23, 0, 31>
r = <14, 21, 41> +
t<43, 0, -31>
r = <14, 21, 10> + t<7, 0, 31>
03
57
21
10
r = <57, 21, 10> + t<46, 0, 31>
04
11
21
41
r = <11, 21, 41> +
t<3, 0, -31>
05
14
21
10
r = <14, 21, 10> +
t<15, 0, 0>
06
39
21
10
r = <39, 21, 10> +
t<23, 0, 31>
07
16
21
41
r = <16, 21, 41> + t<2, 0, -31>
08
14
21
10
r = <14, 21, 10> +
t<7, 0, 31>
09
21
21
41
r = <21, 21, 41> + t<7, 0, 0>
10
14
21
41

O conjunto das anlises e dos dados gerados a partir delas nessa seo compe a
perfilao gramatical. A prxima seo apresenta um Exemplo de Pesquisa da perfilao em
um corpus de minibiografias.
4.3 Perfilao gramatical das minibiografias Exemplo de Pesquisa
Esta seo tem por objetivo apresentar um exemplo de Pesquisa da perfilao.
Especificamente, esta traz o perfil gramatical de um corpus de minibiografias em PB e,
devido ao escopo reduzido, ir se concentrar apenas na funo de maior nmero absoluto de
ocorrncias.
Para o desenho do perfil gramatical, fazem-se necessrias as seguintes etapas: (a)
compilao do corpus; (b) anlise sistmica do estrato gramatical; (c) distribuio topolgica
das funes gramaticais; (d) constituio do corpus gramatical; (e) busca de padres no
espao gramatical e no desenvolvimento do texto (LEMKE, 1991).

Giacomo Figueredo; p. 17-45.

34

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

(a) Compilao do corpus: o corpus da pesquisa foi compilado a partir da seleo de


dez minibiografias de matemticos importantes, apresentadas no incio dos captulos de livros
didticos de matemtica. Conforme a tipologia da lngua no contexto de cultura (HALLIDAY
e

MATTHIESSEN,

2004),

os

textos

do

corpus

so

classificados

como:

Relatar/Escrito/Monlogo. Especificamente, foram retirados dos livros da coleo


Fundamentos de Matemtica Elementar, de Gelson Iezzi (IEZZI et al., 1977/78). A descrio
do corpus pode ser vista no Quadro 4.

TEXTO
GAUSS 01
ABEL 02
FERMAT 03
EULER 04
LEIBNIZ 05
FOURIER 06
LAPLACE 07
V.NEUMANN
08
NEWTON 09
GALOIS 10

QUADRO 4 O corpus da pesquisa.


NOME
TIPOLOGIA
De Plebeu a Prncipe
Relatar/Escrito/Monlogo
Jovem Luta para Ser Ouvido
Relatar/Escrito/Monlogo
As Margens dos Livros Falam
Relatar/Escrito/Monlogo
Cego Enxerga Longe
Relatar/Escrito/Monlogo
Autodidata Cria a Anlise
Relatar/Escrito/Monlogo
Conduo do Calor: Nova Teoria
Relatar/Escrito/Monlogo
Napoleo Demite Ministro do Interior
Relatar/Escrito/Monlogo
Computadores As Mquinas com
Relatar/Escrito/Monlogo
Memria
Nem s de Fsica Vive um Gnio
Relatar/Escrito/Monlogo
Intelectual Morre em Duelo
Relatar/Escrito/Monlogo
TOTAL

VOL.
1
1
2
2
3
4
5

TOKENS
391
335
320
454
403
227
335
279

5
6

477
366
3.587

(b) Anlise sistmica do estrato gramatical: A anlise gramatical do presente estudo


focalizou a orao como unidade de investigao, especificando seus trs principais sistemas,
a partir da diversificao metafuncional. Assim, analisaram-se as funes ideacionais do
sistema de TRANSITIVIDADE; interpessoais do sistema de MODO; e textuais do sistema de
TEMA. Para esta anlise, foram contemplados os dois primeiros nveis de delicadeza. Por
exemplo:

TRANS.
MODO
TEMA

QUADRO 5 Exemplo de anlise sistmica.


variste Galois
nasceu
nas proximidades de Paris,
na aldeia de Bourg la-Reine
Ator
Material: Intransitivo e Criativo
Circ. Localizao
Sujeito
Finito
Adj. Circunstancial
Modo: Indicativo: Declarativo
Resto
Tema: Default
Rema

(c) Distribuio topolgica das funes gramaticais: De posse de todas as funes dos
sistemas principais da orao, estas foram localizadas nos mapas topolgicos. Com isso, foi

Giacomo Figueredo; p. 17-45.

35

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

possvel obter do corpus sua distribuio topolgica. Como exemplo, apresentam-se os


valores nos dois primeiros nveis de delicadeza para as funes do texto GAUSS 01.

orao
GAUSS 01
GAUSS 02
GAUSS 03
GAUSS 04
GAUSS 05
GAUSS 06
GAUSS 07
GAUSS 08
GAUSS 09
GAUSS 10
GAUSS 11
GAUSS 12
GAUSS 13
GAUSS 14
GAUSS 15
GAUSS 16
GAUSS 17
GAUSS 18

QUADRO 6 Distribuio topolgica do texto GAUSS 01


Trans. (X)
modo (y)
Material:
Indicativo: Declarativo Temporal
19
Intransitivo e Criativo
Material:
Indicativo: Declarativo Temporal
14
Transitivo e Transformativo
Material:
Indicativo: Declarativo Temporal
14
Transitivo e Transformativo
Mental:
Indicativo: Declarativo Temporal
59
Fenmeno e Cognitivo
Material:
Indicativo: Declarativo Temporal
14
Transitivo e Transformativo
Material:
Indicativo: Declarativo Temporal
11
Intransitivo e Transformativo
Material:
Indicativo: Declarativo Temporal
11
Intransitivo e Transformativo
Relacional:
Indicativo: Declarativo Temporal
39
Identificativo e Intensivo
Relacional:
Indicativo: Declarativo Temporal
32
Atributivo e Possessivo
Relacional:
Indicativo: Declarativo Temporal
39
Identificativo e Intensivo
Material:
Indicativo: Declarativo Temporal
14
Transitivo e Transformativo
Verbal:
Indicativo: Declarativo Temporal
41
Semiose e No-Recepo
Material:
Indicativo: Declarativo Temporal
14
Transitivo e Transformativo
Material:
Indicativo: Declarativo Temporal
14
Transitivo e Transformativo
Material:
Indicativo: Declarativo Temporal
11
Intransitivo e Transformativo
Material:
Indicativo: Declarativo Temporal
16
Transitivo e Criativo
Material:
Indicativo: Declarativo Temporal
16
Transitivo e Criativo
Relacional:
Indicativo: Declarativo Temporal
39
Identificativo e Intensivo

21
21
21
21
21
21
21
21
21
21
21
21
21
21
21
21
21
21

tema (z)
Default
Proeminente:
Intensivo
Proeminente:
Perspectiva
Default
Proeminente:
Perspectiva
Default
Default

10
45
41
10
41
10
10

Default

10

Proeminente:
Intensivo
Default
Proeminente:
Intensivo
Default
Proeminente:
Perspectiva
Default
Default

45
10
45
10
41
10
10

Proeminente:
Perspectiva
Proeminente:
Perspectiva
Default

41
41
10

(d) Constituio do corpus gramatical: A partir dos mapas topolgicos, so realizadas


as distribuies tais como aquela apresentada no Quadro 6. A partir desse trabalho feito para
todos os textos do corpus, apresenta-se a seguir o corpus gramatical do presente estudo
(Quadro 7).

Giacomo Figueredo; p. 17-45.

36

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

TEXTO
GAUSS
01
ABEL 02

FERMAT
03
EULER
04
LEIBNIZ
05

FOURIER
06
LAPLAC
E 07
V.
NEUM.
08
NEWTO
N 09
GALOIS
10

QUADRO 7 corpus gramatical da pesquisa


Posies topolgicas
(1) 19 21 10. (2) 14 21 45. (3) 14 21 41. (4) 59 21 10. (5) 14 21 41. (6) 11 21 10. (7) 11 21
10. (8) 39 21 10. (9) 32 21 45. (10) 39 21 10. (11) 14 21 45. (12) 41 21 10. (13) 14 21 41.
(14) 14 21 10. (15) 11 21 10. (16) 16 21 41. (17) 16 21 41. (18) 39 21 10.
(1) 33 21 10. (2) 41 21 41. (3) 14 21 10. (4) 14 21 41. (5) 14 21 41. (6) 33 21 10. (7) 11 21
10. (8) 14 21 41. (9) 33 21 10. (10) 14 21 10. (11) 33 21 10. (12) 59 21 41. (13) 33 21 10.
(14) 11 21 10. (15) 14 21 41. (16) 11 21 10. (17) 42 21 41. (18) 32 21 10. (19) 14 21 10.
(20) 58 21 10. (21) 58 21 10. (22) 14 21 10. (23) 14 21 10. (24) 33 21 10. (25) 11 21 41.
(26) 21 41. (27) 14 21 41.
(1) 19 21 10. (2) 14 21 10. (3) 16 21 41. (4) 16 21 41. (5) 16 21 41. (6) 33 21 41. (7) 14 21
41. (8) 16 21 45. (9) 33 21 10. (10) 39 21 10. (11) 16 21 45. (12) 39 21 41. (13) 33 21 10.
(14) 16 21 41. (15) 14 21 41. (16) 33 21 10. (17) 59 21 10. (18) 16 21 41.
(1) 19 21 10. (2) 33 21 10. (3) 11 21 10. (4) 11 21 45. (5) 14 21 41. (6) 33 21 10. (7) 14 21
10. (8) 14 21 10. (9) 31 21 10. (10) 11 21 41. (11) 14 21 10. (12) 32 21 10. (13) 14 21 10.
(14) 14 21 10. (15) 39 21 10. (16) 16 21 41. (17) 16 21 10. (18) 11 21 45. (19) 14 21 10.
(20) 11 21 10. (21) 14 21 10. (22) 49 21 45.
(1) 19 21 10. (2) 11 21 41. (3) 33 21 41. (4) 11 21 41. (5) 14 21 10. (6) 11 21 10. (7)
39 21 41. (8) 16 21 10. (9) 16 21 10. (10) 39 21 10. (11) 39 21 41. (12) 16 21 10.
(13) 14 21 45. (14) 33 21 10. (15) 39 21 10. (16) 14 21 10. (17) 16 21 10. (18) 14
21 41. (19) 16 21 10. (20) 39 21 10. (21) 14 21 10. (22) 14 21 41. (23) 14 21 45.
(24) 59 21 45.
(1) 19 21 10. (2) 14 21 45. (3) 14 21 41. (4) 14 21 45. (5) 42 21 45. (6) 21 21 41.
(7) 11 21 10. (8) 14 21 41. (9) 31 21 45. (10) 14 21 41. (11) 31 21 10. (12) 14 21
41. (13) 14 21 41. (14) 21 21 41.
(1) 11 21 10. (2) 11 21 45. (3) 14 21 41. (4) 14 21 41. (5) 33 21 10. (6) 39 21 10. (7) 41 21
41. (8) 16 21 41. (9) 16 21 41. (10) 39 21 10. (11) 14 21 10. (12) 39 21 32.
(1) 19 21 10. (2) 31 21 10. (3) 33 21 41. (4) 16 21 41. (5) 16 21 41. (6) 16 21 10. (7) 16 21
41. (8) 21 21 41. (9) 33 21 10. (10) 39 21 10. (11) 11 21 45. (12) 11 21 10. (13) 16 21 10.
(14) 14 21 41.
(1) 16 21 10. (2) 52 21 10. (3) 14 21 41. (4) 11 21 41. (5) 14 21 10. (6) 14 21 41. (7) 42 21
10. (8) 14 21 10. (9) 14 21 41. (10) 16 21 41. (11) 14 21 41. (12) 16 21 41. (13) 59 21 41.
(14) 14 21 41. (15) 11 21 10. (16) 14 21 41. (17) 41 21 41. (18) 39 21 10. (19) 14 21 45.
(20) 41 21 10. (21) 16 21 41. (22) 41 21 10. (23) 14 21 10. (24) 33 21 41.
(1) 11 21 10. (2) 14 21 41. (3) 57 21 10. (4) 11 21 41. (5) 14 21 10. (6) 39 21 10. (7) 16 21
41. (8) 14 21 10. (9) 21 41. (10) 14 21 41. (11) 11 21 45. (12) 16 21 41. (13) 14 21 10. (14)
11 21 41. (15) 14 21 10. (16) 11 21 10. (17) 14 21 10. (18) 16 21 41. (19) 59 21 10. (20)
31 21 41. (21) 33 21 10. (22) 14 21 41. (23) 33 21 10. (24) 39 21 41. (25) 14 21 10. (26)
19 21 10. (27) 14 21 41. (28) 19 21 41.

1(e) Busca de padres a construo de uma microteoria do corpus: Tendo como


origem os pressuposto de investigao apresentados anteriormente (TOGNINI-BONELLI,
2001; HALLIDAY, 1992), as pesquisas gramaticais realizas seguindo uma metodologia de
corpus partem da abordagem baseada para a direcionada pelo corpus, construindo a partir dos
dados uma microteoria da lngua. Com isso, a pesquisa tem incio no estrato da expresso e se
move para o estrato da organizao, e das ocorrncias de itens especficos para os padres
mais gerais de organizao.
A metodologia da perfilao gramatical permite a conduo desse tipo de pesquisa
porque extrai da expresso um corpus gramatical e outro do desenvolvimento do texto. Tendo

Giacomo Figueredo; p. 17-45.

37

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

em mos o corpus gramatical, torna-se possvel realizar anlises do funcionamento gramatical


em conjunto com sua frequncia e padres de ocorrncia. Dentro do escopo da LC, busca-se
por linhas de concordncia, listas de palavras, colocaes, disperso e agrupamento, de
forma anloga s pesquisas lexicais e da expresso.
Neste Exemplo de Pesquisa, comeando a anlise pela lista de concordncias, esta
mostra que a maior variao de funes no corpus se d nos sistemas da TRANSITIVIDADE
(11, 14, 57, 39, 16, 21, etc.), enquanto o sistema de MODO emprega sempre a mesma funo
(21), e o sistema de TEMA varia menos (10, 41 ou 45) (Figura 7).

TRANS. MODO TEMA

FIGURA 7 Lista de concordncias gramaticais.

A lista de concordncias tambm mostra que o maior nmero de ocorrncias dos


subtipos de Processo Material. Esse fato corroborado por outros tipos de padro que podem
ser buscados.
A disperso, efetuada pelo plot com o auxlio da ferramenta Concord do software
WordSmith Tools (SCOTT, 2007) mostra que, no sistema de TRANSITIVIDADE, os
Processos Materiais (Material: Transitivo e Transformativo [14]; Material: Transitivo e
Criativo [16] e Material: Intransitivo e Transformativo [11]) apresentam maior disperso,
contribuindo assim para todas as fases do texto. De outra forma, os outros tipos de Processo,
em particular os Relacionais (Relacional: Atributivo e Possessivo [32]; Relacional: atributivo
e Intensivo [33] e Relacional: Identificativo e Intensivo [39]) ocorrem pontualmente,
sugerindo a realizao de um trabalho distinto no texto. Por exemplo:

Giacomo Figueredo; p. 17-45.

38

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

(1) NEWTON 09 (4) 11 21 41. Por ocasio da peste, Newton voltou


<MATERIAL> para casa
(2) VON NEUMANN 08 (2) 31 21 10. Foi <RELACIONAL> professor em
Berlim e Hamburgo
(3) NEWTON 09 VERBAL (20) 41 21 10. Wallis lhe comunica <VERBAL>
que, na Holanda, o Clculo considerado descoberta de Leibniz
(4) LEIBNIZ 05 (24) 59 21 45. Otimista ao extremo, sempre acreditou
<MENTAL> numa universalizao da linguagem
A Figura 8 mostra a disperso das funes de TRANSITIVIDADE (Material: 11, 14, 16
e 19; Relacional: 33 e 39; Verbal: 42; e Mental: 52 e 59) no texto NEWTON 09.

FIGURA 8 Disperso (plot) dos Tipos de Processo no texto NEWTON 09.

Dentre os subtipos de Processo Material, o mais frequente o Transitivo e


Transformativo [14]. A essa funo cabe realizar uma mudana na Meta do Processo. Por
exemplo:
(5) FOURIER 06 (2) 14 21 45. rfo aos 8 anos, Fourier foi colocado
<MATERIAL> no Colgio Militar
(6) GALOIS 10 (8) 14 21 10. Cauchy perdeu <MATERIAL> seu trabalho
Quando se observa o trabalho dessa funo ao longo do corpus, encontra-se, de
maneira semelhante, o trabalho importante desempenhado por ela nos textos. A seguir, a
Figura 9 mostra como a funo est dispersa.

Giacomo Figueredo; p. 17-45.

39

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

FIGURA 9 Disperso (plot) Material: Transitivo e Transformativo no corpus.

A busca pelos agrupamentos do corpus revela ainda um outro aspecto importante dessa
funo, a saber, a maneira como ela forma padres oracionais. Em primeiro lugar, os dois
padres oracionais mais frequentes empregam o Processo Material: Transitivo e
Transformativo. O padro 142141 o mais frequente, com 106 ocorrncias. Em seguida,
142110 aparece com 74 ocorrncias (Figura 10).

FIGURA 10 Agrupamentos (clusters) mais frequentes no corpus.

Na primeira linha (maior ocorrncia) o cdigo 142141 significa oraes Materiais


Transitivas e Transformativas [14] Indicativas Declarativas Temporais [21] Tema
Proeminente: Perspectiva [41].
O Modo Indicativo Declarativo, que ocorre em todas as oraes do corpus,
empregado na biografia para estabelecer uma relao de especialista/leigo entre o produtor e o

Giacomo Figueredo; p. 17-45.

40

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

leitor do texto, uma vez que no abre espao para negociao. Soma-se a isso o fato de todas
serem Temporais, no havendo modalizao/possibilidade/dvida. Alm disso, O tempo
empregado sempre o passado (ou s vezes o presente histrico, ou o presente simples em
oraes materiais tipicamente realizadas pelo presente-no-presente), o que contribui para a
construo da narrativa, fundamental para o tipo de texto da biografia.
O Tema Proeminente: Perspectiva realizado por Circunstncias de Intensificao:
Localizao Espao-Temporal, Modo, Causa e Contingncia. Na biografia, as Circunstncias
fazem com que o texto tenha sempre como ponto de partida os lugares onde os matemticos
nasceram, estudaram, trabalharam, etc., bem como as datas. Do ponto de vista do discurso,
criam uma linha do tempo para os eventos da vida dos matemticos, que passa pelos lugares
onde viveram.
O agrupamento com os Processos do tipo 14 mostra como as atividades dos
matemticos formam um padro com a linha do tempo da biografia quando em conjunto com
Modo 21 e Tema 41. Por exemplo:
(7) GAUSS 01 (5) 14 21 41. Ainda nesta obra <TEMA> Gauss apresenta
<MATERIAL> a lei da reciprocidade quadrtica <META>
(8) GAUSS 01 (13) 14 21 41. No comeo do sc. XIX <TEMA> abandonou
<MATERIAL> a Aritmtica <META>
(9) ABEL 02 (4) 14 21 41. Nesta poca <TEMA>, Abel conseguiu generalizar
<MATERIAL> o teorema binomial <META>
Retomando a ideia da construo de uma microteoria sobre o corpus, possvel, com
este pequeno Exemplo de Pesquisa apresentar uma descrio de como as funes gramaticais
operam. Devido ao seu nmero maior de ocorrncias, o foco se deu sobre a funo Processo
Material: Transitivo e Transformativo [14]. Foi possvel mostrar a sua frequncia, a
distribuio nos textos, a disperso ao longo dos textos, bem como os agrupamentos que
forma, nos padres oracionais, com outras funes.
Apesar de limitada a esta funo, determinada pelo escopo deste Exemplo de Pesquisa,
a anlise consegue revelar o potencial da perfilao gramatical. Ela aponta, assim, para a
possibilidade desse tipo de anlise ser feita para quaisquer funes gramaticais de interesse.

Giacomo Figueredo; p. 17-45.

41

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

5. Concluses
Demonstrando como as metodologias de corpus podem contribuir para o
desenvolvimento das pesquisas do estrato da gramtica, este artigo ofereceu uma metodologia
de perfilao gramatical, a qual possibilita compilar e analisar corpora gramaticais para alm
do que podem oferecer as buscas e contagens computacionais, restritas s realizaes por
palavras, compreendendo igualmente funes encobertas, realizadas de forma criptotpica.
A justificativa para uma metodologia prpria para os estudos de corpora gramaticais
se deve ao fato de que a maior parte das funes gramaticais, diferentemente dos itens
lexicais, no realizada de forma aparente pela expresso, mas de forma encoberta a partir de
um conjunto de reactncias. Isto fica visvel no caso das funes oracionais, como, por
exemplo as funes dos sistemas de TRANSITIVIDADE, MODO e TEMA, objetos da
presente pesquisa.
A perfilao gramatical aqui apresentada se mostrou eficaz ao atender as necessidades
principais apontadas pelas pesquisas de corpus e gramtica (cf. HALLIDAY, 1992;
TOGNINI-BONELLI, 2001; CONRAD, 2010), a saber, a mudana de foco do lxico para a
gramtica; da expresso para o contedo; e da instncia para o sistema.
No que diz respeito mudana do lxico para a gramtica, a perfilao no considera
os itens lexicais e suas relaes, mas, de outra forma, busca generalizar as funes desses
itens para uma unidade determinada e, segundo essas generalizaes, constitui o corpus.
Neste trabalho a unidade selecionada foi a orao e as generalizaes foram os sistemas de
TRANSITIVIDADE, MODO e TEMA.
Quanto mudana da expresso para o contedo, a perfilao se liberta da
obrigatoriedade de a palavra grfica/token ser a unidade de anlise. Ao partir da distncia
topolgica entre as funes e o emprego das distncias como valores categricos, estes se
emparelham aos tokens, gerando um novo tipo de unidade de investigao de corpora, aqui
denominada token gramatical.
Por fim, ao tratar da relao entre instncia e sistema, a perfilao gera resultados que
podem alimentar a prpria descrio gramatical, advindos da busca por padres de ocorrncia,
coocorrncia e agrupamentos de funes gramaticais que, sem as frequncias no seria
possvel observar. No que diz respeito a esse tipo de frequncia, Biber et al. (2004, p. 376)
afirmam:

Giacomo Figueredo; p. 17-45.

42

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

A frequncia, por si s, no possui qualquer poder explanatrio. Na verdade,


acontece o contrrio: a frequncia mostra padres que, esses sim, precisam
ser explicados. O valor da frequncia, e da pesquisa em corpus como um
todo, est no fato de ela identificar padres que, de outra forma, escapariam
ao analista.4

A perfilao gramatical segue exatamente o que afirmam Biber et al. (2004), por
assim dizer, fazendo o caminho inverso. Ela mostra como a explicao j existente para as
funes gramaticais pode ser vista na frequncia. nesse sentido que ela alimenta a
descrio.
Ao realizar essas mudanas, a perfilao gramatical apresentada neste artigo aponta
como, a partir da expresso, do lxico e da instncia ou o formato em que o corpus
coletado possvel extrair os dados para compilar e anotar um corpus para funes
gramaticais. A partir deste, retomando a ideia da construo de uma microteoria sobre o
corpus, realizam-se descries de como as funes gramaticais operam. Neste artigo foi
possvel oferecer um Exemplo de Pesquisa realizado com a metodologia em questo.
Focando-se na funo com nmero maior de ocorrncias, o artigo mostrou um
conjunto de possibilidades de anlise advindas da perfilao gramatical, tais como a
frequncia da funo, a distribuio nos textos, a disperso ao longo dos textos, bem como os
agrupamentos que forma, nos padres oracionais, com outras funes. Para as pesquisas de
corpus de base gramatical, a perfilao gramatical mostrou como possvel compilar e extrair
dados de corpora, inclusive para a forma como so empregados na dinmica textual.
Referncias:
BIBER, D.; CONRAD, S.; CORTES, V. If You Look at... : Lexical Bundles in University
Teaching and Textbooks. Applied Linguistics, Oxford, n. 25(3), p. 371405, 2004.
CNDIDO-JR, A. Anlise bidirecional da lngua na simplificao sinttica em textos do
portugus voltada acessibilidade digital. 2013. 225f. Tese (Doutorado em Cincias de
Computao e Matemtica Computacional). Instituto de Cincias Matemticas e da
Computao, Universidade de So Paulo, So Carlos, 2013.

We do not regard frequency data as explanatory. In fact we would argue for the opposite: frequency data
identifies patterns that must be explained. The usefulness of frequency data (and corpus analysis generally) is
that it identifies patterns of use that otherwise often go unnoticed by researchers.

Giacomo Figueredo; p. 17-45.

43

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

CONRAD, S. What can a corpus tell us about grammar? In: OKEEFFE, A.; McCARTHY,
M. (Eds.). The Routledge Handbook of corpus Linguistics. Londres e Nova Iorque:
Routledge, 2010, p. 227-240.
HALLIDAY, M. A. K. System and function in language. London: Oxford University Press,
1976.
HALLIDAY, M. A. K. Language as System and Language as Instance: the corpus as a
Theoretical Construct. In: SVARTVIK, J. (Ed.) Directions in corpus Linguistics: Berlim e
New
York:
Mouton
de
Gruyter,
1992,
p.61-77.
http://dx.doi.org/10.1515/9783110867275.61
HALLIDAY, M.A.K. On Grammar and Grammatics. In: HASAN, R.; CLORAN, C.; BUTT,
D. (Eds.) Functional Descriptions: Theory in Practice. Amsterdam/ Philadelphia: John
Benjamins, 1996, p.1-38.
http://dx.doi.org/10.1075/cilt.121.03hal
HALLIDAY, M. A. K. On grammar. London: Continuum, 2002. (The collected works of M.
A. K. Halliday, v. 1).
HALLIDAY, M. A. K.; JAMES, Z. A Quantitative study of polarity and primary tense in the
English finite clause. In: SINCLAIR, J.; HOEY, M.; FOX, J. (Eds.). Techniques of
description: spoken and written discourse. London: Routledge, 1993.
HALLIDAY, M. A. K.; MATTHIESSEN, C. An introduction to functional grammar. 3a
ed. London: Edward Arnold, 2004.
IEZZI, G.; MURAKAMI, C.; DOLCE, O.; HAZZAN, S. Fundamentos de Matemtica
Elementar. So Paulo: Atual Editora, vol. 1-10, 1977/78.
KE, S-W. Clustering a translational corpus. In: OAKES, M.; MENG J. (Eds.). Quantitative
Methods in corpus-Based Translation Studies: A Practical Guide to Descriptive Translation
Research. Amsterdam: John Benjamins, 2012.
http://dx.doi.org/10.1075/scl.51.06ke
LEMKE, J. Text Production and Dynamic Text Semantics. In: VENTOLA, E. (Ed.).
Functional and systemic linguistics: approaches and uses. Berlim: Mouton de Gruyter.
1991.
http://dx.doi.org/10.1515/9783110883527.23
MARTIN, J. R.; MATTHIESSEN, C. Systemic typology and topology. In: CHRISTIE, F.
(Ed.). Literacy in Social Processes: papers from the inaugural Australian Systemic
Linguistics Conference, held at Deakin University, January 1990. Darwin: Centre for Studies
in Language in Education, Northern Territory University. 1991.
MARTIN, J. R. Systemic functional grammar: a next step into the theory axial relations.
Pequim: Higher Education Press, 2013.
PAGANO, A.; FIGUEREDO, G.; LUKIN, A. Modelling proximity in a corpus of literary
retranslations: a methodological proposal for clustering texts based on systemic-functional

Giacomo Figueredo; p. 17-45.

44

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

annotation of lexicogrammatical features. In: International Quantitative Linguistics


Conference. Olomouc: Univerzita Palackho v Olomouci, 2014, no prelo.
QUIROZ, B. The interpersonal and experiential grammar of Chilean Spanish: towards a
principled systemic-functional description based on axial argumentation. 2013. 403f. Tese
(Doutorado em Lingustica). Universidade de Sydney, Sydney, 2013.
SCOTT, M. 2007. WordSmith Tools. Oxford: Oxford University Press.
SOUZA, A. Topologia geral de vrios ngulos. 2013. Disponvel em <http://topologiageral.ourproject.org>. Acesso em: 10 set. 2014.
TOGNINI-BONELLI, E. corpus linguistics at work. Amsterdam e Philadelphia: John
Benjamins, 2001.
http://dx.doi.org/10.1075/scl.6
VIANA, V. Lingustica de corpus: conceitos, tcnicas e anlises. In: VIANA, V.; TAGNIN,
S. (Orgs.). Corpora no ensino de lnguas estrangeiras. So Paulo: HUB Editorial, 2011.
WHORF, B. L. Language, thought, and reality. Cambridge: MIT, 1987.

Artigo recebido em: 15.09.2014


Artigo aprovado em: 27.11.2014

Giacomo Figueredo; p. 17-45.

45

Os dizentes nos artigos cientficos de Lingustica um estudo baseado


na Lingustica Sistmico-Funcional e com o auxlio da Lingustica de
Corpus
The Sayers in linguistics scientific articles a study based on Systemic functional
grammar and Corpus Linguistics
Fernanda Beatriz Caricari de Morais *
RESUMO: Este artigo analisa os tipos de
dizentes, participantes agentes dos verbos do
dizer, mais utilizados em artigos da rea de
Lingustica, coletados atravs da plataforma
digitar Scielo. Como fundamentao terica e
metodologia qualitativa de anlise, utilizouse a Lingustica Sistmico-Funcional,
formulada por Halliday (1985, 1994) e
Halliday e Matthiessen (2004). A Lingustica
de corpus possibilitou o tratamento
computacional por meio do programa
WordSmith Tools (Scott, 2008), que fornece
dados quantitativos e contextos de ocorrncia
de determinadas palavras. Ele foi utilizado na
anlise para o auxlio na busca dos dizentes
mais usados nos artigos cientficos da rea
estudada. Os resultados mostram que os
dizentes so utilizados para expressar
conhecimento de pesquisas anteriores ou de
pressupostos da rea de pesquisa e o uso de
construes com o cltico se promove o
afastamento do autor/pesquisador do artigo.
Pretende-se contribuir para a elaborao de
materiais didticos e cursos instrumentais
que visem compreenso e produo escrita
de artigos cientficos.

ABSTRACT: This article presents an


analysis of the types of sayer, partipants
agent of sayer verbs, used in linguistic
scientific articles, collected in the digital
plataform Scielo. As theory and qualitative
methodology, we use the systemic functional
linguistics, formulated by Halliday (1985,
1994) and Halliday e Matthiessen (2004).
The corpus Linguistics enabled the
computational treatment, through the
WordSmith Tools (Scott, 2008) program, that
provides quantitative data and the context of
certain words. It was used in the analysis for
helping the search of types of sayer in area
studied. The results show that the sayers were
used for expressing knowledge about
preview researches or knowledge area and
the use of constructions with clitic se
promotes the dismissal of author/researcher
of the scientific article. We intend to
contribute for subsidizing the elaboration of
course books and courses with emphasis on
comprehension and production of scientific
articles.

PALAVRAS-CHAVE:
Linguagem
Acadmica. Lingustica Sistmico-Funcional.
Lingustica de Corpus.

KEYWORDS:

Academic
language.
Systemic functional Linguistics. Corpus
Linguistics.

1. Introduo
Este artigo visa analisar os tipos de dizentes, isto , os agentes dos verbos do dizer, em
termos tradicionais, mais utilizados em artigos cientficos da rea de Lingustica. Segundo a

Doutora em Lingustica Aplicada e Estudos da Linguagem (PUC-SP). Realizou estgio ps-doutoral


(PNPD/Capes) na Universidade Federal de Uberlndia no perodo de dezembro de 2013 a Maio de 2014.

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

abordagem sistmico-funcional, dizente o participante (agente) principal do processo verbal


que representado pelos verbos do dizer.
Os processos verbais so verbos de ao verbal, tem relao com fatos da ordem do
dizer. Para Halliday (1994, p.143), esses processos no precisam necessariamente pressupor
um participante humano, porm devido a sua alta frequncia de uso, no gnero selecionado,
julgou-se pertinente investigar suas ocorrncias para compreender quem so os dizentes dos
processos verbais mais utilizados em artigos cientficos de Lingustica, buscando seus padres
de usos e verificando se h uma tendncia por construes com primeira pessoa do singular e
do plural nessa rea.
Como hiptese inicial, pensou-se que a maioria das ocorrncias estariam ligadas ao
uso de ns como dizentes dos processos, pois, embora os artigos sejam escritos, muitas
vezes, por um nico autor, comum, na rea de Lingustica, o uso da primeira pessoa do
plural indicando falsa modstia, um recurso para o distanciamento do autor no texto.
Porm, muitas das ocorrncias encontradas mostram o uso da terceira pessoa e de
construes com o cltico se que permitem o afastamento do autor no texto, deixando o texto
mais impessoal.
Esses usos impessoais so bastante utilizados em gneros que exigem uma linguagem
mais elaborada, termos de Bernstein (1971), como o artigo cientfico. A impessoalidade pode
ser explicada como um fenmeno caracterstico da linguagem cientfica, que prima em ser
sinttica e com foco nas aes, nos processos que envolvem as pesquisas e no em quem as
fizeram. Isso explica a relao de modstia em que o autor se coloca no texto, exigncia do
gnero e da linguagem. O desfocamento tambm ocorre quando no importante mencionar
pesquisadores da rea, o que no prejudica a compreenso do texto.
O artigo cientfico, um importante meio de divulgao do trabalho de cientistas,
escrito por membros altamente letrados da comunidade, usando sua variante mais elaborada
da linguagem, escrito e revisado com cuidado, para ser avaliado por pares e aceito ou no
para uma revista considerada de alto nvel. um gnero que exige clareza, objetividade e
sntese e se caracteriza ainda pelo uso de passiva e de outros recursos para omisso de
participantes. Esses aspectos so discutidos por ampla gama de pesquisa sobre esse gnero
alguns expoentes no exterior so Swales (1989, 1990), Swales e Feak (1999), Bazerman
(1984), Bhatia (1993), Atkinson (1996) e no Brasil: Aranha (1996, 2002, 2004, 2007), Motta
Roth (1995, 2006), entre outros.

Fernanda Beatriz Caricari de Morais; p. 46-63.

47

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Para analisar os dizentes dos artigos cientficos de Lingustica, foram coletados


aleatoriamente 1001 artigos cientficos, retirados de duas revistas cientficas que esto
disponveis no Scielo: Documentao de Estudos em Lingustica Terica e Aplicada
(D.E.L.T.A.) e Trabalhos em Lingustica Aplicada, ambas com Qualis A1.
Os artigos foram submetidos a um tratamento computacional possibilitado pela
Lingustica de Corpus (LC), que se faz presente metodologicamente, nesta pesquisa, atravs
de ferramentas do programa WordSmith Tools (Scott, 2008).
Por meio da ferramenta concord do referido programa, foram obtidas listas de
concordncia com os processos verbais mais frequentes (explicar, discutir e afirmar),
buscando observar seus contextos de ocorrncia para analis-las com a base tericometodolgica da Lingustica Sistmico-Funcional de Halliday (1985, 1994) e Halliday e
Matthiessen (2004).
A abordagem semntico-funcional se preocupa em explorar como a lngua
estruturada para o uso em diferentes contextos. Uma das premissas bsicas desta teoria que
o uso da lngua motivado pelas relaes sociais e que as escolhas lxico-gramaticais
realizadas pelos falantes no so aleatrias e esto condicionadas pelo contexto.
Assim como o gnero artigo cientfico, os gneros do discurso so formas de como a
linguagem organizada para alcanar propsitos sociais. As situaes especficas que
envolvem os gneros podem ser definidas como cadeias semiticas que esto ligadas aos trs
tipos de funes da linguagem chamadas por Halliday de metafunes (ideacional,
interpessoal e textual), base de anlise desta pesquisa, detalhada no item seguinte.
2. A abordagem Sistmico-Funcional
Esta pesquisa tem como fundamentao terica a Lingustica Sistmico-Funcional
(doravante LSF) de Halliday (1985, 1994) e Halliday e Matthiessen (2004). A LSF tem como
foco a linguagem em uso, por isso sua preocupao explorar como a lngua estruturada
para o uso em diferentes contextos. Halliday (1994) define que uma das premissas bsicas da
abordagem sistmico-funcional que o uso da lngua motivado pelas relaes sociais e que
as escolhas lxico-gramaticais realizadas pelos falantes/escritores no so aleatrias e esto
condicionadas pelo contexto.
1

Acredita-se que este nmero de artigos representativo e possibilita encontrar padres de usos do dizentes na
rea pesquisada.

Fernanda Beatriz Caricari de Morais; p. 46-63.

48

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Para a LSF, a anlise do discurso compreende dois nveis de alcance: contribuir para a
compreenso do texto, visando mostrar como e por que o texto transmite significado da
maneira como o faz e relaciona-se com a avaliao do texto, procurando mostrar por que o
texto ou no efetivo para os seus propsitos.
Halliday (1994, p.16) argumenta que uma anlise do discurso no baseada em
gramtica no uma anlise completa, mas um simples comentrio sobre o texto. A
realizao de um texto acontece atravs das relaes semnticas e gramaticais. A gramtica
requerida por fornecer uma compreenso clara do sentido e da efetividade de um texto, por
isso precisa ter esta orientao semntica e funcional.
Na LSF, funcionalidade significa ser baseada no significado e o fato de ser gramtica
entendido como a interpretao das formas lingusticas. Por isso, a gramtica separa as
possveis variveis e aponta suas possveis funes para podermos dar a nossa interpretao
de um texto tanto pela sua descrio semntica, como pelas caractersticas lingusticas.
A linguagem vista como prtica social, cujo uso motiva-se por uma finalidade. Nessa
perspectiva, a LSF estuda as maneiras pelas quais as pessoas utilizam a linguagem para
atingir determinados objetivos em situaes especficas dentro de uma sociedade
(HALLIDAY, 1985, p. 4). A linguagem vista como um recurso usado pelos seres humanos
para criar significados.
De acordo com essa perspectiva terica, quando produzimos um texto (oral ou
escrito), estamos realizando trs tipos de significado simultaneamente. Significados relativos
representao da experincia atravs da lngua; significados relativos s representaes de
poder e solidariedade, atitudes em relao ao outro e aos papis sociais assumidos e
significados relativos organizao do contedo da mensagem, relacionando o que se diz ao
que foi dito. Na LSF, cada um desses significados est relacionado a uma metafuno da
linguagem, chamadas por Halliday (1985, 1994) de ideacional, interpessoal e textual.
Como o interesse desta pesquisa investigar os dizentes em artigos cientficos de
Lingustica, concentrou-se na metafuno ideacional da linguagem, tambm chamada
experiencial, que expressa o que est acontecendo no mundo externo (eventos) ou interno
(pensamentos). Esta metafuno estuda a orao como representao, ou seja, estuda seu
aspecto como um meio de representar padres de experincia e reflete como o usurio fala
sobre as aes, a situao, estados, crenas e circunstncias (HALLIDAY, 1994, p.107).

Fernanda Beatriz Caricari de Morais; p. 46-63.

49

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

A orao tem um papel central, pois nela que se incorpora um princpio geral de
modelagem da experincia, que o princpio de que a realidade construda atravs dos
processos, dos participantes e das circunstncias.
Thompson (1996, p.76), com base em Halliday (1985, 1994), discute que a linguagem,
na perspectiva experiencial, forma uma srie de recursos para se referir s entidades no
mundo de forma que essas entidades atuem ou se relacionem umas com as outras. O autor
simplifica dizendo que a linguagem reflete a nossa viso de mundo, constituda por:
processos, participantes e circunstncias.
Na viso sistemicista, a impresso mais poderosa que temos da experincia de que
ela consiste de eventos (acontecer, fazer, sentir, significar, ser e tornar-se). Todos esses
eventos esto organizados na gramtica da orao e o sistema gramatical pelo qual isso
alcanado o da transitividade. De acordo com Halliday (1994), o sistema da transitividade
que constri o mundo da experincia em um conjunto manipulvel de tipos de processo. O
processo, os participantes e as circunstncias constituem o sistema da transitividade. A
orao, nesta perspectiva, possibilita ao falante, atravs das escolhas dos processos (aes),
dos participantes (pessoas ou coisas) e das circunstncias (advrbios), expressar-se perante o
mundo. Os processos so divididos em: materiais (fazer), mentais (pensamento), verbais
(dizer), comportamentais (comportamentos fsicos e psicolgicos), relacionais (ser) e
existenciais (haver).
Como esta pesquisa analisa os dizentes utilizados com os processos verbais mais
frequentes (explicar, discutir e afirmar), apresentado, no item seguinte, as particularidades
desses processos, segundo a abordagem Sistmico-Funcional da Linguagem.
2.1 Processos verbais
Os processos verbais so os de dizer. Halliday e Matthiessen (2004, p. 252) apontam
que seu uso importante em vrios tipos de discurso como nas narrativas e no discurso
acadmico, por exemplo. Eles permitem projeo atravs de (1) citao (discurso direto) ou
(2) reportagem (discurso indireto) de pesquisadores antecessores e tericos. Tambm so
usados para mostrar o posicionamento do autor por meio de verbos como: explicar, discutir e
afirmar, por exemplo.

Fernanda Beatriz Caricari de Morais; p. 46-63.

50

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Ao contrrio dos processos mentais (ligados representao do pensamento), os


verbais no requerem um participante consciente. O participante, chamado de Dizente, pode
ser qualquer coisa.
Ao projetar uma orao, pode-se ter uma proposio (troca de informaes) como em:
Ele me disse que teria jogo noite ou uma proposta (troca de bens e servios): Ele me disse
que ir me buscar para ir ao jogo noite.
Alm de serem processos que podem projetar, os verbais possuem outros trs tipos de
participantes alm do Dizente, so eles:

Recebedor: representa o participante a quem dirigida a mensagem, como em: No


me disseram que voc viria2.

Verbiagem: a funo que corresponde quilo que dito, pode ser o contedo do que
dito, como suas sugestes em: Ela explicou suas sugestes para o trabalho, ou,
ainda, o nome do dito, como palavra em: No diga mais uma palavra.

Alvo: a entidade que focalizada pelo processo de dizer. Nesse caso, como se o
Dizente estivesse agindo verbalmente sobre o outro, como Maria em: Ele criticou
Maria durante a reunio3.
Estes trs ltimos participantes tm papel importante na orao, porm, como o foco

deste trabalho compreender os tipos de participantes que tm papel de agente nas oraes
verbais, analisou-se apenas os dizentes.
3. O uso da Lingustica de Corpus
A Lingustica de Corpus (LC) se encontra presente metodologicamente, neste artigo,
atravs das ferramentas computacionais utilizadas para analisar as escolhas lingusticas dos
artigos cientficos da rea Lingustica. A LC trabalha dentro de um quadro conceitual formado
por uma abordagem empirista e uma viso da linguagem enquanto sistema probabilstico, no
qual alguns traos lingusticos so mais frequentes que os outros, conforme discute BerberSardinha (2000, p. 349).

2
3

Exemplo criado para fins explicativos.


Exemplo criado para fins explicativos.

Fernanda Beatriz Caricari de Morais; p. 46-63.

51

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

A LC fornece um mapeamento regular entre a frequncia maior ou menor de um trao


e o contexto de ocorrncia, h uma relao entre as caractersticas lingusticas e as
situacionais (os contextos de uso).
Para Biber et al. (1998, p. 9), a abordagem baseada em corpus bastante til, uma vez
que [...] quase todas as reas da lingustica podem ser estudadas a partir da perspectiva do
uso, e a abordagem baseada em corpus fornece um conjunto de instrumentos particularmente
eficaz para tais investigaes.
Segundo Berber-Sardinha (2004, p. 34), a Lingustica de Corpus fornece um suporte
metodolgico adequado s pesquisas que utilizam a Lingustica Sistmico-Funcional, por
tambm trabalhar dentro de uma viso de linguagem enquanto sistema probabilstico.
A LC possibilita o estudo das regularidades lexicais, possibilitando estudos
sistemticos, a partir de corpus, descrevendo os tipos de associao frequentes encontrados na
lngua em uso.
3.1 O corpus
Para realizar esta anlise, utilizamos 100 artigos de Lingustica que fazem parte do
Projeto SAL4 coletados no perodo de 2000 a 2007. Os artigos foram coletados atravs da
internet pelo site Scielo e gravados em arquivos individuais no formato txt, formato que
permite seu uso no programa WordSmith Tools (SCOTT, 2008).
A seguir, apresentamos uma tabela com as principais caractersticas do corpus:
Tabela 1: Resultados estatsticos dos corpora

Estatsticas
Total de palavras
Palavras diferentes5
Nmero de palavras do menor artigo
Nmero de palavras do maior artigo

Total
873.523
35.841
2.086
15.454

O corpus foi submetido a um tratamento computacional possibilitado pela LC, que se


faz presente metodologicamente, nesta pesquisa, atravs de ferramentas do programa
WordSmith Tools (SCOTT, 2008).
4

O projeto SAL - Systemics Across Language, desenvolvido em parceria com pesquisadores da China,
Argentina, Mxico e Tailndia que procuram entender as caractersticas especficas e universais que partilham as
lnguas. No Brasil, o foco do projeto estudar a linguagem acadmica.
5
Nmero de itens lexicais sem suas repeties.

Fernanda Beatriz Caricari de Morais; p. 46-63.

52

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Foram utilizadas duas das suas principais ferramentas para a anlise: a lista de
palavras (wordlist) e o concordanciador (concord). A primeira foi utilizada para organizar o
corpus em listas das palavras. Elas podem ser ordenadas alfabeticamente ou pela frequncia
com que aparecem, comeando pela palavra de maior frequncia. Por meio dessa mesma
ferramenta, foram obtidos dados estatsticos dos textos, como os dados da tabela acima. Ela
ajudou tanto na organizao dos dados estatsticos como na anlise dos processos verbais
mais frequentes utilizados nos artigos cientficos.
Foram procurados, nas listas de palavras, os processos verbais mais utilizados nos
artigos e observados os contextos em que eles ocorrem atravs do concordanciador. Nas
concordncias, a palavra de busca aparece destacada e no centro do cotexto em que ocorre chamado de horizonte. Concentrou-se em um horizonte de cinco palavras direita e cinco
palavras esquerda, mas, sempre que necessrio, foi visto um contexto maior incluindo todo
um pargrafo ou o texto como um todo.
Atravs das listas de concordncia foi possvel estudar o contexto de ocorrncia das
palavras de busca simultaneamente em todo o corpus. A anlise, apresentada no item
seguinte, est baseada na Lingustica Sistmico-Funcional, que uma teoria de linguagem e
um mtodo de anlise de textos em seus contextos de uso permitindo-nos entender como os
indivduos usam a linguagem e como a linguagem estruturada em seus diferentes usos
(HALLIDAY, 1994).
4. Anlise dos dizentes utilizados em artigos cientficos de Lingustica
Para entender como os dizentes so utilizados nos artigos de Lingustica, foi
necessrio analisar os participantes das ocorrncias com os processos verbais mais frequentes
explicar, discutir e afirmar6.
A tabela abaixo apresenta o nmero de ocorrncias de cada processo, o nmero total
de ocorrncias analisadas e sua porcentagem no corpus:

Outros processos verbais frequentes: apontar, mostrar, referir, falar, explicitar, ressaltar, citar, entre outros
que no so o foco deste estudo.

Fernanda Beatriz Caricari de Morais; p. 46-63.

53

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Tabela 2: Dados dos processos verbais analisados.

Processo
Afirmar
Explicar
Discutir
Total

No. de
ocorrncias
267
257
212
736

% no
corpus
0,05%
0,05%
0,04%
0,14%

Listas de concordncias foram feitas e as ocorrncias foram agrupadas de acordo com


o tipo de dizente. Ao contabiliz-las, foi possvel organizar os usos mais frequentes na figura
abaixo:

Figura 1: Formas verbais mais utilizadas com os processos explicar, discutir e afirmar.

As letras correspondem a: H: participante humano; N: participante no-humano; A:


apagamento do agente (em construes passivas analticas); e S: uso do cltico se. Como se
pode notar, as formas que representam o autor no artigo, 1 pessoa do singular e do plural, so
menos usadas do que a 3 pessoa, o que demonstra que, neste gnero acadmico, as
representaes esto relacionadas busca pela neutralidade, caracterstica dos discursos
cientficos.

Fernanda Beatriz Caricari de Morais; p. 46-63.

54

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Como hiptese inicial, pensou-se que haveria muitas representaes do eu (autor do


artigo) ou ns, conforme mencionado na introduo deste artigo, porm foram encontradas
muitas ocorrncias que representavam pesquisadores antecessores que so mencionados nos
artigos para dar maior credibilidade ao trabalho ou serem contestados na argumentao.
Na seo reviso da literatura/fundamentao terica, esperado que o pesquisador
faa menes aos pesquisadores/tericos de sua rea de estudo, situando sua pesquisa na rea,
ao mesmo tempo que a diferencia das j realizadas. A representao, segundo Rajagopalan
(2003), no algo que se d automaticamente, ela passa por certas escolhas conscientes. A
questo da escolha uma questo-chave quando se discute poltica de representao. Dessa
maneira, importante analisar as representaes feitas no gnero artigo cientfico,
compreendendo-as como questo lingustica e tambm poltica, questes estas consideradas
indissociveis para o autor citado.
Nesta anlise, prope-se a discutir as escolhas lingusticas feitas pelos autores dos
artigos atravs dos dizentes, mostrando quais so as tendncias de escrita da rea.
Abaixo, algumas das ocorrncias encontradas com 1 pessoa do singular e do plural
que mostram que parece haver um movimento na rea que utiliza formas mais pessoais para a
construo da identidade do pesquisador:

1) As alteraes sugeridas no nvel pragmtico-discursivo implicam em


algumas modificaes na materialidade textual, pois, como afirmei
anteriormente, as categorias caracterizadoras de gneros so
semiotizadas via funes da linguagem no sistema lingustico. (Ling003).
2) Na segunda [parte], discuto os mecanismos alternativos de negao
oracional no portugus do Brasil. (Ling054).
3) Na primeira parte, na medida em que explico os principais referenciais
tericos utilizados neste texto, analiso o jornal escolar enquanto um
gnero hbrido. (Ling006).
Ao contrrio de algumas reas da cincia (cincias duras) que repudiam a construo
da identidade social do autor no discurso, na rea da Linguagem h claramente uma tendncia
de mudana em que permitido ao autor se representar no texto.
Muitas das ocorrncias de 1 pessoa do plural indicam o uso da modalidade, conforme
sublinhado nas ocorrncias abaixo:

Fernanda Beatriz Caricari de Morais; p. 46-63.

55

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

1) Apesar do destaque dado ao contexto, conforme se verifica no trecho


acima, podemos afirmar que um limite da pragmtica griceana
exatamente o no tratamento desta noo. (Ling032).
2) Podemos tambm afirmar que o uso das regras para implementao
rtmica no ocorre no incio do processo de aquisio. (Ling007).
3) Tambm podemos explicar a diferena entre as sentenas abaixo.
(Ling049).
4) Desta maneira, podemos explicar o motivo de no haver violao do
princpio Minimizar. (Ling006).
5) Assim como no caso das crianas em fase de construo de sua identidade
social, podemos discutir as questes identitrias inerentes, por exemplo,
carta do guarda municipal: em que medida a incorporao total ou
parcial do ethos interfere na identidade social do guarda municipal?
(Ling012).
As ocorrncias acima so acompanhadas do adjunto modal de baixo grau pode,
utilizado para indicar possibilidade, atenuando afirmaes no discurso. Para Fairclough
(2001, p. 180), a modalidade trata da relao entre os produtores e as proposies, de
comprometimento ou, inversamente, do distanciamento entre produtores e proposies.
O sistema de modalidade, ligado aos significados interpessoais, revela o grau de
engajamento, envolvimento e responsabilidade que um indivduo assume diante de uma
declarao, ou grau de polidez em propostas ou declaraes em um evento de comunicao
(HALLIDAY, 1994, p. 85-105). A modalidade pode ser representada de diversas formas tais
como: adjuntos conjuntivos, adjuntos modais e operadores modais (HALLIDAY, 1994, p.
49).
Os usos das ocorrncias acima indicam possibilidade, atribuindo baixo grau de
responsabilidade aos sujeitos representados nas oraes, evitando comprometimento das
afirmaes dos autores nos artigos.
Fairclough (2001, p. 203) discute o discurso acadmico que possui tradio em evitar
a modalidade categrica (X Y), por motivos retricos, motivados pelas projees de uma
subjetividade e um ethos cautelosos e circunspectos aprovados para acadmicos e no por
baixa afinidade com as proposies.
As ocorrncias de 3 pessoa so maioria (com os processos explicar e afirmar),
conforme Tabela 2, no entanto, a escolha de seus participantes permite separar as ocorrncias

Fernanda Beatriz Caricari de Morais; p. 46-63.

56

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

em dois grupos. O primeiro deles o de participantes humanos - autores/pesquisadores


antecessores. Ao reportar o discurso/pesquisas de outros, o autor do artigo embasa sua
pesquisa:
1) Berber Sardinha (2004:42) explica que a colocao uma "associao
entre itens lexicais, ou entre o lxico e campos semnticos". (Ling029).
2) Ainda sobre a flexibilidade da pontuao em relao ao gnero, Halliday
(1989:37-38) explica que h registros em que a pontuao reduzida ao
mnimo, como na linguagem legal. (Ling075).
3) Scarpa (1997, 2001) a nica que conhecemos que discute a aquisio de
processos fonolgicos que tm consequncias para a estrutura rtmica.
(Ling007).
4) O autor afirma que no h polmica a respeito da existncia destes
mecanismos: a questo a anlise deste "conhecimento". (Ling032).
O segundo grupo formado por ocorrncias em que o participante representado no
humano, mas sim uma teoria ou a prpria pesquisa sendo referenciada:
1) Ao contrrio, a ADC afirma que o lingustico social (Kress 1989).
(Ling104).
2) No entanto, a lingustica cognitiva afirma que as metforas so de textura
aberta (open-ended), no estando esse mapeamento sujeito a restries.
(Ling091).
3) Cabe, ento, teoria explicar como tais gramticas so construdas e
operadas pela prpria mente humana (Ling018).
4) Este trabalho pretende discutir uma possvel abordagem marxista da
linguagem apresentando sumariamente a concepo de linguagem de
alguns autores confessadamente marxistas(Ling061).
5) Este trabalho discute a legitimao do funcionamento do literrio nesse
tipo de ensino porque considera que os prprios conceitos genricos
tradicionais de literatura com que ainda se opera no so consistentes
com o que exige a prtica pedaggica. (Ling030).
As escolhas feitas nas ocorrncias acima, ao representar a teoria e no o terico e ao
representar o trabalho/a pesquisa ao invs do pesquisador mostram a caracterstica do discurso

Fernanda Beatriz Caricari de Morais; p. 46-63.

57

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

acadmico em no enfatizar a representao humana por ser desnecessria, podendo ser


retomada no contexto do artigo, ou, podendo ser inferida pelo leitor.
No discurso da cincia, importante representar o mundo em forma de coisas,
incluindo entidades virtuais que podem ser trazidas se requeridas ao discurso. Algumas dessas
entidades so construtos tericos, enquanto outras funcionam como localizadas no argumento
e depois desaparecem. Simbolicamente, o discurso da cincia representa o mundo em nomes,
em

coisas

estveis

enquanto

so

observados

em

experimentos

medidos

pensados/compreendidos (HALLIDAY, 2004, p. 21).


Chama-se ateno no discurso acadmico, o frequente uso do cltico se, utilizado para
desfocar ou apagar os participantes do discurso. Em pesquisas anteriores, Morais (2013a,
2013b), artigos de diversas reas da cincia foram analisados e constatou-se que h trs
categorias de usos do cltico se em artigos cientficos: se em construes agnatas; se em
construes com desfocamento de participante e se em construes mdias7. As ocorrncias
encontradas nos artigos de Lingustica se referem segunda categoria, de desfocamento de
participantes. O termo desfocamento foi mencionado pela primeira vez por Shibatani (1985)
que, embora no tenha estudado a lngua portuguesa, estudou as formas de desfocamento de
Agente em muitas lnguas como: ainu, chamorro, turco, quchua, espanhol, francs e japons,
e discutiu a falta de ateno com as funes do desfocamento.
Para Shibatani (1985, p. 832), o desfocamento a funo primria e no uma mera
consequncia da promoo do objeto/paciente. Nas ocorrncias encontradas nos artigos de
Lingustica, no temos o agente explcito, isto , no se sabe ao certo quem o dizente, mas
as circunstncias grifadas permitem pensar que o participante da ao o autor/pesquisador
do artigo:
1) Na seo 1, apresenta-se a delimitao dos dados analisados; na seo 2,
explica-se o status prosdico do prefixo.... (Ling057).
2) Com esta anlise, discute-se a questo da (no) codificao gramatical do
imperativo no portugus brasileiro por meio da sintaxe da negao e dos
clticos... (Ling 01).
3) O portugus tem sido considerado uma lngua SVO, como j se afirmou
no incio deste trabalho. (Ling089).

Para maiores detalhes vide trabalho de Morais (2013a e 2013b).

Fernanda Beatriz Caricari de Morais; p. 46-63.

58

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

4) Neste artigo, discute-se a percepo de alguns estudiosos de que a


pontuao demarca aspectos rtmicos da linguagem. (Ling84).
Estes tipos de circunstncias na seo 1, com esta anlise, no incio deste trabalho e
neste artigo restringem a participao apenas ao autor que, nestes casos, o Dizente dos
verbos explicar, afirmar e discutir.
Apesar do dizente estar apagado na orao, as circunstncias, destas ocorrncias,
indicam que a participao pode ser pressuposta com base na anlise do contexto.
Sabe-se que muitos dos estudos sobre o cltico se em lngua portuguesa esto ligados
s discusses sobre a diferenciao entre ndice de indeterminao do sujeito e partcula
apassivadora.
Segundo as gramticas tradicionais da lngua portuguesa, o se deve ser classificado
como partcula apassivadora, quando acompanhado de verbo transitivo direto, podendo ter
sujeito definido simples, que deve concordar com o verbo que se encontra na voz passiva
sinttica, ou ndice de indeterminao do sujeito, quando acompanhado de verbos
intransitivos, transitivos indiretos ou de ligao, que devem ser empregados na terceira pessoa
do singular.
Por se tratar de uma anlise puramente formal, no possui explicaes funcionais que
levem em considerao questes semnticas. Construes como Vende/compra-se casas so
consideradas incorretas gramaticalmente, segundo livros didticos e gramticas tradicionais.
Estudiosos como Nunes (1991), Monteiro (1994), Bagno (2000) e Camacho (2002, 2003)
constataram que elas ocorrem com frequncia tanto em linguagem popular como culta.
Em outras lnguas, espanhol, italiano e francs, h muitas discusses sobre
impessoalidade e passividade. No espanhol, Suer (2002, p. 211) discute que as construes
com se impessoal acarretam a interpretao de um predicado como se aplicando a um
conjunto no especfico de seres humanos, representado pelo se. No italiano, Cinque (1988)
analisa o papel do si impessoal, propondo variantes ligadas a seu uso como um sujeito
genrico. Ruwet (1972) estudou a lngua francesa, classificando alguns tipos de oraes sem
Agente como neutras.
Essa compreenso no pode ser baseada na anlise do verbo principal, se transitivo
direto (partcula apassivadora) ou intransitivo, transitivo indireto ou de ligao (ndice de
indeterminao do sujeito). preciso se atentar para as escolhas lxico-gramaticais e,
principalmente para o contexto em que ocorrem, para assim compreender o significado do se

Fernanda Beatriz Caricari de Morais; p. 46-63.

59

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

que pode permitir diferentes desfocamentos de participante do autor/pesquisador ou de


pesquisadores da rea ou, ainda, de pessoas de modo geral. Os estudos citados, bem como
outros, so discutidos em Morais (2013a e 2013b) que prope uma nova reclassificao
levando em conta os contextos das ocorrncias.
5. Consideraes Finais
Os dados analisados permitem dizer que as construes verbais, mais especificamente,
as escolhas dos dizentes dos processos explicar, discutir e afirmar so utilizados para
expressar conhecimento de pesquisas anteriores ou de pressupostos da rea de pesquisa,
dando maior credibilidade ao estudo.
A escolha dos dizentes tambm acompanhada do uso da modalidade, atravs do uso
de adjuntos modais, indicando possibilidade, atenuando afirmaes no discurso. Muitas das
ocorrncias de 1 pessoa do plural indicam o uso da modalidade, como discutido na seo de
anlise deste artigo, com ocorrncias do adjunto modal de baixo grau pode.
O uso de construes com o cltico se favorece o desfocamento do autor, porm as
circunstncias e, principalmente, o contexto de ocorrncia permitem pressupor o
envolvimento do autor do artigo, revelando resqucios de sua participao.
Acredita-se que ficou demonstrado, neste artigo, que a funo primria das
construes chamadas indeterminadas e passivas no a promoo do objeto a sujeito, mas
sim a desfocalizao do Agente (participante, em termos sistmico-funcionais) que permite
diferentes graus de desfocamento, conforme proposta de Morais (2013a). Como j propunha
Said Ali (1908), essas construes com se so formas destinadas a calar o Agente.
importante dizer que os dados tambm apontam uma tendncia de mudana em que
permitido ao autor se representar no texto, permitindo a construo da identidade social do
autor no discurso. Como estudo futuro, pretende-se analisar se esta tendncia tambm ocorre
em outras reas da cincia ou se est presente apenas na rea de humanas e/ou Lingustica.
Referncias
ARANHA, S. A argumentao nas introdues de trabalhos cientficos na rea de
Qumica. Dissertao de Mestrado. PUCSP, 1996.
ARANHA, S. A otimizao da escrita acadmica atravs da conscientizao textual. Estudos
Lingusticos (So Paulo), So Paulo. v. 1, 2002.

Fernanda Beatriz Caricari de Morais; p. 46-63.

60

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

ARANHA, S. A importncia do domnio da lngua inglesa e da linguagem acadmica para a


leitura e escrita de textos cientficos. Intercincia (Catanduva), Catanduva - SP, v. 1, p. 7784, 2004.
ARANHA, S. A busca de modelos retricos mais apropriados para o ensino da escrita
acadmica. Revista do GEL (Araraquara), v. 4, p. 97-114, 2007.
ATKINSON, D. The Philosophical Transactions of the Royal Society of London, 1675-1975:
A sociohistorical discourse analysis. Language in Society, v.25, pp. 333-371, 1996.
http://dx.doi.org/10.1017/S0047404500019205
BAGNO, M. A subverso hertica do ensino de lngua. In: Bagno, M. Dramtica da
Lngua Portuguesa: tradio gramatical, mdia e excluso social. So Paulo: Loyola, 2000.
BAZERMAN, C. Modern evolution of the experimental report in Physics: spectroscopy
articles in Physical Review, 1893-1980. Social Studies in Science, 14:163-196, 1984.
http://dx.doi.org/10.1177/030631284014002001
BERBER SARDINHA, T. Semantic prosodies in English and Portuguese: A contrastive
study. Cuadernos de Filologa Inglesa. V.9, 1:93-100. Murcia, Spain. 2000.
BERBER SARDINHA, T. Lingustica de Corpus. Barueri-SP: Manole, 2004.
BERNSTEIN, B. Class, code and control. v.1. Londres: Routledge e Kegan Paul, 1971.
http://dx.doi.org/10.4324/9780203014035
BHATIA, V. K. Analysing genre: language use in professional settings. Longman, 1993.
BIBER, D. et al. corpus Linguistics: investigating language structure and use. Cambridge:
Cambridge University Press, 1998.
http://dx.doi.org/10.1017/CBO9780511804489
CAMACHO, R. G. Construes de voz. In: Abarirre, M. B. e Rodrigues, S. C. A. (org).
Gramtica do portugus falado. v. 8, pp. 227-316. Campinas: Editora Unicamp, 2002.
CAMACHO, R. G. Em defesa da categoria de voz mdia no Portugus. D.E.L.T.A., v. 19.1,
pp. 91-122, 2003.
CINQUE, G. On si constructions and the theory of Arb. Linguistics inquiry. V. 19, 4.pp.
521-581, 1988.
FAIRCLOGH, N. Discurso e mudana social. Braslia: Editora Universidade de Braslia,
2001.
HALLIDAY, M.A.K. An Introduction to Functional Grammar. London: Edward Arnold,
1985.

Fernanda Beatriz Caricari de Morais; p. 46-63.

61

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

HALLIDAY, M. A. K. An introduction to Functional Grammar. London: Edward Arnold,


1994.
HALLIDAY, M. A. K. The language of science. New York: Continuum, 2004.
HALLIDAY, M. A. K.; MATTHIESSEN, C. An introduction to Functional Grammar.
London: Edward Arnold, 2004.
MONTEIRO, J. L. A questo do se. In: Monteiro, J. L. Pronomes pessoais: subsdios para
uma gramtica do portugus do Brasil. Fortaleza: EUFC, 1994.
MORAIS, F. B. C. Entre alhos e bugalhos: os diferentes usos do cltico SE na escrita
acadmica. Doutorado em Lingustica Aplicada e Estudos da Linguagem. PUC-SP, 2013a.
MORAIS, F. B. C. As construes mdias nos artigos cientficos de lingustica. Cadernos de
Linguagem e Sociedade, v.14, n.2, 2013b.
MOTTA-ROTH, D. Rethorical features and disciplinary cultures. A genre based study of
academic book reviews in linguistics, chemistry and economics. Tese de Doutorado.
UFSC, 1995.
MOTTA-ROTH, D. Escrevendo no contexto: contribuies da Lingustica SistmicoFuncional para o ensino de redao acadmica. Paper presented at the 33rd International
Systemic Functional Congress. PUC-SP, 2006.
NUNES, J. Se apassivador e se indeterminador: o percurso diacrnico no portugus brasileiro.
Caderno de Estudos Lingusticos, V. 20, pp. 33-59, 1991.
RAJAGOPALAN, K. Por uma lingustica crtica linguagem, identidade e a questo
tica. So Paulo: Parbola Editorial, 2003.
RUWET, N. Les constructions pronominales neutres et moyennes. Thorie syntaxique et
syntaxe du franais. Paris: Seuil, 1972.
SAID ALI, M. Gramtica histrica da lngua portuguesa. So Paulo: Melhoramentos,
1908.
SCOTT, M. R. Wordsmith Tools v. 5. Software for text analysis. Oxford: Oxford University
Press, 2008.
SHIBATANI, M. Passives and related constructions: a prototype analysis. Language 61:4.
pp. 821-848, 1985.
SUER, M. Las passives con se impessoal y la legitimacin de las categorias vacas. In:
Lopes, C. S. Las construciones com se. Madri: Visor libros, 2002.
SWALES, J. M. Language and scientific communication: The case of the reprint request.
Scientometrics, v.13, pp. 93-101, 1989.
http://dx.doi.org/10.1007/BF02017177

Fernanda Beatriz Caricari de Morais; p. 46-63.

62

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

SWALES, J. M. Genre analysis English in academic and research settings. Cambridge


University Press, 1990.
SWALES, J. M. e FEAK, C. B. Academic writing for graduate students. Michigan: The
University of Michigan Press, 1999.
THOMPSON, G. Introducing functional grammar. London: Arnold, 1996.

Artigo recebido em: 15.09.2014


Artigo aprovado em: 27.11.2014

Fernanda Beatriz Caricari de Morais; p. 46-63.

63

As construes com SE na produo escrita de brasileiros aprendizes


de espanhol como lngua estrangeira: um estudo baseado em corpus1
Constructions with SE in the written production of Brazilian learners of Spanish as a
foreign language: a corpus-based study
Benivaldo Jos de Arajo Jnior*
RESUMO: Este trabalho tem por objetivo
analisar a produo de construes com o
cltico SE (doravante construes-SE) em
lngua espanhola por aprendizes brasileiros
de Espanhol como lngua estrangeira (ELE).
Nessa anlise, cujo referencial terico a
Gramtica Cognitiva, sero tratadas em
especial as construes reflexivas, mdias,
impessoais e passivas. Aps breve introduo
terica, apresentamos nosso corpus de
estudo, exibimos e discutimos os resultados
do levantamento das construes-SE nesse
corpus. Na discusso, comparamos os dados
que obtivemos com aqueles observados em
outros dois corpora de falantes nativos, um
para o Espanhol na variedade peninsular e
outro para o Portugus Brasileiro (doravante
PB).
Finalmente,
com
base
nessa
comparao, fazemos algumas consideraes
sobre a produo das construes-SE em
nosso corpus de estudo e os fatores que
possivelmente tm influncia nesse processo.

ABSTRACT: This work aims to analyze the


production of SE-constructions in Spanish by
Brazilian learners of Spanish as a Foreign
Language (SFL). In this analysis, which uses
Cognitive
Grammar
as
theoretical
framework, reflexive, middle, impersonal
and passive constructions will be specially
examined. After a brief theoretical
introduction, we present our corpus of study;
then, we demonstrate and discuss the results
of SE-constructions survey in this corpus. In
the discussion, our data are compared with
those observed in two native speakers
corpora, one for Iberian Spanish and other for
Brazilian Portuguese (hereinafter PB).
Finally, based on that comparison, we make
some considerations on the production of SEconstructions in our corpus of study and the
factors that possibly influence this process.

PALAVRAS-CHAVE:
Construes-SE.
ELE.
Gramtica
Cognitiva.
Estudos
comparados. Lingustica de Corpus.

KEYWORDS:
SE-constructions.
SFL.
Cognitive Grammar. Comparative studies.
Corpus Linguistics.

1. O modelo de conceitualizao adotado


Na classificao e interpretao dos nossos dados, adotaremos o modelo cognitivo do
evento cannico (LANGACKER, 1991, p. 285). Este, por sua vez, a combinao de dois
outros: o modelo da bola de bilhar e o modelo do palco. De acordo com o primeiro (bola de
bilhar), tendemos a conceitualizar os eventos do mundo como uma cadeia de ao, na qual um
*Doutor em Lngua Espanhola pela FFLCH-USP e professor da Escola Superior de Propaganda e Marketing
(ESPM-SP).
1
Este trabalho uma verso ampliada e modificada de outro apresentado no II Congresso Internacional de
Professores de Lnguas Oficiais do MERCOSUL (Buenos Aires, 2013), intitulado As construes com SE na
produo escrita de brasileiros aprendizes de espanhol como lngua estrangeira.

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

elemento energtico transfere energia e provoca efeitos em outro elemento tipicamente no


energtico. Quanto ao segundo (palco), relaciona-se experincia perceptual e foi assim
chamado porque nele o papel do conceitualizador similar ao de um espectador assistindo a
uma pea; ou seja, algum que se encontra fora de cena, mas que constitui parte do evento
global. No modelo do evento cannico (fig. 1), segundo a terminologia de Langacker (1991,
p. 283), o iniciador da cadeia de ao (fonte de energia) chama-se trajetor e tambm o
sujeito/agente prototpico; o participante final (ralo por onde escoa a energia) chama-se marco
e tambm o objeto/paciente prototpico; o conceitualizador/observador est indicado na
figura pela letra O. Conforme o modelo, no enunciado Ernesto rompi la estatuilla [PB:
Ernesto quebrou a estatueta], Ernesto o iniciador (fonte)/trajetor/sujeito/agente e estatuilla
o participante afetado (ralo)/marco/objeto/paciente.

O modelo de evento cannico representa a observao usual de uma ao prototpica


nas lnguas do sistema nominativo-acusativo, como o PB e o espanhol, sendo, portanto, o
modelo mais produtivo para nossa anlise. Portanto, no modelo que adotamos, um evento
cannico transitivo por definio e nele temos dois participantes claramente distintos numa
relao assimtrica, no qual o participante agente animado e volitivo e afeta direta e
totalmente o participante paciente por meio de uma fora ou transferncia de energia
(GIVN, 1984, apud KEMMER, 1994).

2. As construes reflexivas e mdias segundo Kemmer (1994)


Conforme j apontado por Hopper & Thompson (1980, p. 277), nos eventos em cuja
codificao morfossinttica aparece o pronome SE/SE2, a assimetria entre os participantes
problemtica, acarretando uma baixa na transitividade. Por exemplo, na sentena Clara se vio

A notao SE (itlico) refere-se ocorrncia de construes com cltico em espanhol ou na produo no nativa
nessa lngua. A notao SE (normal) se aplica incidncia de construes com cltico no PB.

Benivaldo Jos de Arajo Jnior; p. 64-81.

65

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

en el espejo (PB: Clara se viu no espelho), os papis de trajetor/agente e marco/paciente so


preenchidos pela mesma entidade referencial, de modo que a distinguibilidade entre esses
dois participantes esmaece. Contudo, para Kemmer (1994, p. 207), possvel operar uma
separao conceitual entre Clara como iniciadora da atividade (o participante que v) e seu
reflexo no espelho (o que visto), de modo a poder distinguir dois participantes no evento. O
mesmo ocorre com o enunciado La presidenta se imagin descansando en una playa desierta
[PB: A presidenta se imaginou descansando numa praia deserta]. Neste caso, o sujeito
interage com uma representao de si mesmo situada em algum espao mental distinto do
discurso (MALDONADO, 2006, p. 270). A esse tipo de eventos, Kemmer (1994, p. 207)
classifica como reflexivos. Ainda segundo a autora (1994), nos eventos reflexivos o iniciador
(trajetor) atua sobre si mesmo como o faria sobre qualquer outra entidade.
H ainda eventos nos quais a distino conceitual entre os participantes mnima. No
exemplo Felipe solo se afeita los domingos [PB: Felipe s se barbeia/faz a barba aos
domingos], o paciente em questo no unicamente afetado: barbear o prprio rosto implica a
atividade da parte diretamente envolvida (a cabea), alm de outras partes do corpo (o
pescoo). Em eventos dessa natureza, ambos os participantes tm como referente uma nica
entidade cujos aspectos so conceitualmente indistinguveis. Kemmer (1994) classifica esses
eventos como mdios, fundamentando-se no conceito de voz mdia (originalmente
empregado para designar uma categoria inflexional das lnguas clssicas indoeuropeias), cuja
funo, em termos semnticos, expressar eventos nos quais a ao ou estado afeta o sujeito
do verbo ou seus interesses (LYONS, 1970, p. 286). Aps minucioso estudo translingustico,
Kemmer enumera dez situaes que configuram um domnio semntico no qual a voz mdia
apresenta algum tipo de marcao morfolgica. Por motivos de conciso, daremos apenas
exemplos do espanhol e do PB, nos quais o SE/SE funciona como marcador mdio: (1)
cuidados corporais (peinarse; frotarse [PB: pentear-se; esfregar-se]); (2) movimento no
translacional (inclinarse [PB: inclinar-se]); (3) mudana na postura corporal (levantarse;
sentarse [PB: levantar-se; sentar-se]); (4) movimento translacional (irse [PB: ir-se]); (5)
eventos naturalmente recprocos (abrazarse; besarse [PB: abraar-se; beijar-se]); (6) mdia
indireta (preguntarse [PB: perguntar-se], referente a uma atividade mental); (7) mdia de
emoo (enfadarse [PB: irritar-se]); (8) discurso emotivo (quejarse [PB: queixar-se]); (9)
mdia de cognio (acordarse [PB: lembrar-se)]; (10) eventos espontneos (originarse [PB:
originar-se]). No PB, em muitas dessas situaes, coexistem as formas com realizao do

Benivaldo Jos de Arajo Jnior; p. 64-81.

66

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

cltico ou seu apagamento, como nos enunciados Meu pai (se) levanta cedo e Os fieis (se)
sentaram.
Kemmer (1994) esquematiza os eventos reflexivos e mdios conforme as figuras 2 e 3.

Em sua anlise sobre transitividade, Hopper & Thompson (1980, p. 277) propem as
construes reflexivas como intermedirias entre as transitivas e as intransitivas. Kemmer
(1994, p. 209) amplia essa proposta, incluindo no conjunto as construes mdias e utilizando
o grau de distinguibilidade dos participantes como parmetro semntico para diferenciar uma
construo da outra. Dessa forma, a autora constri um diagrama no qual num dos extremos
esto os eventos intransitivos (1 participante), e no outro os transitivos (2 participantes). Entre
esses dois extremos, esto os eventos nos quais a distino entre os participantes baixa, caso
dos reflexivos e mdios.

Segundo o diagrama, nas construes reflexivas/ recprocas, pelo fato de


conceitualmente podermos distinguir dois participantes (embora se refiram mesma
entidade), temos maior proximidade a um evento transitivo. J nas construes mdias, a
baixa distinguibilidade entre os participantes aproxima-as das intransitivas. Kemmer (1994)
relaciona a maior ou menor distinguibilidade dos participantes com uma propriedade
semntica a qual denomina elaborao relativa de eventos.
A marcao morfolgica das reflexivas/recprocas e mdias no PB e no espanhol,
quando ocorre, normalmente se d com o mesmo marcador SE/SE, conforme j mostrado em

Benivaldo Jos de Arajo Jnior; p. 64-81.

67

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

exemplos anteriores. Nas referidas lnguas, portanto, a distino entre essas construes no
imediata e requer uma anlise acurada do verbo em termos semnticos. No caso do PB,
salientamos a existncia de um fator que complica ainda mais essa classificao: a perda dos
clticos (inclusive o SE) que vem acontecendo nessa lngua3.
3. As construes passivas e impessoais segundo Maldonado (2006)
Para Maldonado (2006, p. 273), que se concentra fundamentalmente na anlise dessa
questo na lngua espanhola, a presena do SE nas construes mdias, passivas e impessoais
se relaciona com a fora indutiva envolvida no evento.
Com base nessa hiptese, o autor prope a seguinte escala de classificao (figura 5):
num dos extremos da escala estariam as construes transitivas, com mxima proeminncia
de transferncia de energia; no outro extremo, estariam as construes absolutas, sem energia
envolvida; na zona intermediria, as mdias, passivas e impessoais 4.
Nessa classificao, alm dos graus de manifestao da fora indutiva, so levados em
conta o requisito de agentividade humana do verbo, o aspecto (lxico e morfolgico), a
concordncia e a ordem. Com base nesses critrios, Maldonado (2006) classifica como
mdias algumas construes consideradas passivas por muitos gramticos e linguistas, como
o caso de D; para esse autor, tal passividade aparente, uma vez que resulta mais da perda de
proeminncia da fora indutora que da escolha do tema como figura do evento.

Esse fenmeno foi analisado em diversos estudos. Gonzlez (1994) leva em conta a perda dos clticos no PB,
ao falar das assimetrias entre o espanhol e o PB na descrio do preenchimento vs. no preenchimento das
posies argumentais de sujeito e objeto nessas lnguas. No trataremos dos casos de perda, visto que o foco do
nosso trabalho so as construes nas quais aparece o SE; porm, colocaremos o cltico entre parnteses toda vez
que a construo puder aparecer sem ele.
4
As impessoais intransitivas (Se vive bien aqu [PB: Vive-se bem aqui]) no apresentam ambiguidades quanto
classificao no E e no PB; portanto, neste trabalho, recebero mais ateno as impessoais com objeto direto (Se
alquila(n) casas [PB: Aluga(m)-se casas]).

Benivaldo Jos de Arajo Jnior; p. 64-81.

68

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

A seguir, definimos sucintamente as construes da figura 5:


(a) Absoluta: sem energia em perfil. Ex.: El rudo disminuy [PB: O rudo diminuiu].
(b) Mdia apresentacional: nvel quase nulo de energia; simplesmente mostra um evento
num domnio qualquer a partir do ponto de vista de um conceitualizador. Ex.: Las Islas Fiji se
encuentran en el Pacfico [PB: As Ilhas Fiji se encontram no Pacfico].
(c) Mdia de atributo interno: a mudana de estado sofrida pelo tema depende mais de sua
configurao interna que de uma fora externa. Ex.: Estos juegos no se venden bien [PB:
Estes jogos no (se) vendem bem].
(d) Mdia prototpica de proeminncia terminal (Passiva): focaliza a poro terminal do
evento (a mudana de estado devido a uma fora externa esquemtica) e no sua fase
indutiva. Em nossa anlise, utilizaremos a forma abreviada MPT para referir-nos a essa
construo; igualmente, manteremos entre parnteses a denominao passiva, por ser a mais
frequente na literatura. Ex.: La pared se manch [PB: A parede (se) manchou].
(e) Impessoal perfectiva: a induo da fora to importante quanto a mudana de estado, e
tem que ser humana, embora seu agente no seja especfico. Ex.: Se pag la deuda [PB:
Pagou-se a dvida/ A dvida foi paga5].

Conforme mostrado em Arajo Jnior (2006), os enunciados com SE ocorrem no PB, porm a preferncia dos
falantes nativos dessa lngua pela passiva perifrstica.

Benivaldo Jos de Arajo Jnior; p. 64-81.

69

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

(f) Impessoal: os marcadores imperfectivos reduzem a proeminncia da mudana de estado e


favorecem o que de homogneo possa haver no evento; portanto, o que se perfila so as
tendncias naturais de mudana sofridas pelo tema. Ex.: Estos productos se fabrican con
materiales sintticos [PB: Estes produtos se fabricam/ so fabricados com materiais
sintticos].
(g) Transitiva: prototipicamente, so as construes nas quais um agente animado e volitivo
transfere energia a um paciente, provocando neste uma mudana de estado. Ex.: Miguel pint
la casa [PB: Miguel pintou a casa].
4. Os corpora
Nosso corpus de estudo o Dados EEC (doravante DEEC), que possui 178.066
palavras e est constitudo por 1.172 produes escritas de alunos do curso Espaol en el
Campus6. O DEEC foi construdo para integrar um corpus maior, o COMET (Corpus
Multilngue para Ensino e Traduo), desenvolvido pelo CITRAT7 com o objetivo de servir
de suporte a pesquisas lingusticas, principalmente nas reas de traduo, terminologia e
ensino de lnguas. O objetivo especfico do DEEC era coletar e organizar dados longitudinais,
que possibilitassem acompanhar um grupo de informantes do primeiro ao ltimo estgio do
EEC. A coleta de produes ocorreu entre os meses de agosto de 2003 e junho de 2006, e
abarcou os nveis Bsico, Intermedirio e Avanado. Na tabela a seguir, mostramos uma
sntese do perfil dos informantes do DEEC.

Curso de ELE oferecido pela rea de Lngua Espanhola e Literaturas Espanhola e Hispano-americana DLM
e mantido pelo Servio de Cultura e Extenso da FFLCH/USP entre 1996 e 2010. A grade completa
compreendia os nveis Bsico I (B1), Bsico II (B2), Intermedirio I (I1), Intermedirio II (I2), Avanado I (A1)
e Avanado II (A2).
7
Centro Interdepartamental de Traduo e Terminologia da Faculdade de Filosofia, Letras e Cincias Humanas
da Universidade de So Paulo.

Benivaldo Jos de Arajo Jnior; p. 64-81.

70

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Tabela 1 DEEC: Perfil dos informantes.

INFORMANTES
POR SEXO

Masculino
Feminino
TOTAL

INFORMANTES
POR FAIXA
ETRIA

At 20 anos
De 21 a 34 anos
De 35 a 49 anos
De 50 a 69 anos
TOTAL

QUANTIDADE
50
136
186

%
27
73
100

22
98
45
21
186

11,8
52,7
24,2
11,3
100

Quanto escolaridade, 94,6% do total de informantes chegou universidade. No


geral, esses colaboradores pertenciam comunidade USP: eram estudantes (graduandos ou
ps-graduandos), professores ou funcionrios da instituio. Do total, apenas 4% afirmavam
ter tido algum tipo de contato com a lngua espanhola antes de ingressar no EEC.
As produes do corpus pertencem a diversos gneros discursivos 8, tais como
anncios pessoais, cartas formais e informais, dirios, resenhas, crnicas, artigos de opinio,
notcias, sinopses, crticas de filmes, etc. Na tabela a seguir, disponibilizamos a quantidade de
produes do DEEC segundo o nvel dos informantes.
Tabela 2 DEEC: Produes por nvel.

NVEL
B1
B2
I1
I2
A1
A2
TOTAL

QUANTIDADE
545
251
147
121
60
48
1.172

%
46,5
21,4
12,5
10,3
5,1
4,1
100

N DE PALAVRAS
62.376
47.627
22.514
20.268
14.420
10.861
178.066

Convm esclarecer que os gneros presentes no corpus no so autnticos, mas sim projees: no se trata, por
exemplo, de jornalistas redatando crnicas, crticas ou notcias para um pblico leitor; o que se tem o exerccio
de escrita em lngua estrangeira (no caso, em espanhol) feito por alunos, mediante instruo formal e tendo como
nico destinatrio o professor. Portanto, embora se tenha buscado a diversidade nas prticas textuais pedidas aos
alunos, buscando aproxim-las dos gneros correntes no cotidiano, essas produes so inevitavelmente
atravessadas pela prtica pedaggica.

Benivaldo Jos de Arajo Jnior; p. 64-81.

71

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Os resultados da anlise das construes-SE no DEEC sero cotejados com aqueles


observados em outros dois corpora de falantes nativos, um para o espanhol e o outro para o
PB. Ambos so corpora j constitudos e na modalidade oral. No caso do espanhol, trata-se
do PRESEEA-ALCAL, que por sua vez parte integrante do PRESEEA (Proyecto para el
Estudio Sociolingstico del Espaol de Espaa y de Amrica)9. As 36 entrevistas que
compem esse corpus foram realizadas em 1998, na cidade de Alcal de Henares 10. Na tabela
3 aparecem informaes detalhadas sobre o corpus PRESEEA-ALCAL, ao qual nos
referiremos doravante como CPA.
Tabela 3 Corpus PRESEEA-ALCAL: Resumo das principais caractersticas.

Corpus PRESEEA-ALCAL (CPA)


Nvel de escolaridade
Faixa etria
Sexo
Superior
(N
de
Mdio (N de
palavras)24.730
palavras)
masculino
24.257
Faixa 1
feminino
24.442
26.471
20-34 anos
Total da faixa1
49.172
50.728
masculino
30.932
26.311
Faixa 2
feminino
22.882
25.443
35-54 anos
Total da faixa 2
53.814
51.754
masculino
29.695
29.860
Faixa 3
feminino
33.940
30.398
Acima de 55 anos
Total da faixa 3
63.635
60.258
Total por nvel de escolaridade
166.621
162.740
Total geral
329.361

Para o PB, utilizamos a Amostra SP2010 (Piloto), que parte do corpus que est
sendo desenvolvido pelo GESOL-USP (Grupo de Estudos e Pesquisa em Sociolingustica da
USP) com o objetivo de subsidiar pesquisas na rea de sociolingustica variacionista em
especial, na descrio e anlise dos fenmenos variveis e processos de mudana em curso na
variedade paulistana do PB (MENDES, 2011). As 36 entrevistas que constituem esse corpus

Projeto surgido em 1993 e que conta com equipes de pesquisa e documentao na Espanha, nos Estados Unidos
e em alguns pases americanos (Argentina, Colmbia, Cuba, Chile, Equador, Guatemala, Mxico, Paraguai,
Peru, Porto Rico, Uruguai e Venezuela). Fonte: http://linguas.net/portalpreseea/Inicio/tabid/441/language/esES/Default.aspx , consultado em 20/05/13.
10
A informao completa acerca da metodologia de coleta desses materiais est em Moreno Fernndez et alii
(2002, 2004).

Benivaldo Jos de Arajo Jnior; p. 64-81.

72

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

foram realizadas na cidade de So Paulo, entre 2008 e 2011. A tabela 4 mostra em detalhe as
principais caractersticas da Amostra SP2010, qual nos referiremos doravante como ASP 11.
Tabela 4 Amostra SP2010 (Piloto) (GESOL-USP): Resumo das principais caractersticas.

Amostra SP2010 (Piloto)(GESOL-USP)


Nvel de escolaridade
Faixa etria
Sexo
Superior (N de
Mdio (N de
palavras)
palavras)
masculino
28.145
30.414
Faixa 1
feminino
35.411
37.170
20-34 anos
Total da faixa1
63.556
67.584
masculino
36.330
33.977
Faixa 2
feminino
32.627
29.416
35-49 anos
Total da faixa 2
68.957
63.393
masculino
31.884
32.730
Faixa 3
feminino
27.737
33.357
50-69 anos
Total da faixa 3
59.621
66.087
Total por nvel de escolaridade
192.134
197.064
Total geral
389.198

Escolhemos o CPA e a ASP para este estudo, primeiramente, porque foram


constitudos a partir dos mesmos critrios metodolgicos. Em segundo lugar, ambos os
corpora so recentes e, portanto, refletem o estado atual do espanhol e do PB com maior
probabilidade de incorporar fenmenos emergentes nessas lnguas. Por ltimo, os dois
corpora apresentam pouca disparidade no quesito extenso: a ASP (389.198 palavras) supera
o CPA (329.361 palavras) em apenas 18%; ambos so corpora mdios, conforme a
classificao proposta por Berber Sardinha (2004, p. 26)12.
Embora as tabelas 3 e 4 ofeream dados acerca da faixa etria, sexo e escolaridade
dos informantes, tais variveis no sero levadas em conta em nossa anlise. O que aqui
faremos uma primeira aproximao a alguns aspectos referentes produo de construesSE em lngua espanhola por aprendizes brasileiros de ELE; neste nvel, portanto, nos
limitaremos a analisar a incidncia global e os percentuais dessas construes no corpus de
estudo e compar-los com os resultados obtidos no CPA e na ASP.

11
12

As tabelas 3 e 4 so uma verso simplificada daquelas presentes em Arajo Jnior (2013, p. 131-2).
Segundo esse autor, esto nesse grupo os corpora que possuem entre 250.000 e 1 milho de palavras.

Benivaldo Jos de Arajo Jnior; p. 64-81.

73

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

5. Metodologia e anlise do corpus de estudo


O levantamento das construes-SE no corpus DEEC foi feito em trs etapas,
conforme o procedimento que se descreve a seguir. A etapa inicial constou de trs passos,
sendo o primeiro dividir o corpus em seis subcorpora B1, B2, I1, I2, A1, A2 ,
considerando os nveis da grade (ver tabela 2). A seguir, processamos cada subcorpus no
programa Kitconc13, obtendo, assim, as concordncias por meio da lematizao *SE. O
Kitconc est escrito totalmente em portugus e rene algumas funcionalidades usadas em
Lingustica de Corpus, tais como a listagem de palavras, frequncias, concordncias,
colocados e a extrao de palavras-chave; no caso, usamos o programa apenas como
concordanciador. A lematizao *SE nos permitiu acessar todas as combinaes do cltico no
corpus, tanto as proclticas (SE levanta, SE haca, SE ha comprado, etc.) quanto as enclticas
(marcharSE, verSE, realizndoSE, etc.). O terceiro passo foi transferir as concordncias para
uma planilha Excel, a fim de facilitar sua leitura e triagem.
A segunda etapa, executada manualmente, consistiu em ler as concordncias e
eliminar aquelas sem interesse para o trabalho. Portanto, foram desprezadas as ocorrncias do
SE como variante de LE/LES (objeto direto em construes do tipo SE la dio, SE lo entreg,
etc.) e outros casos (faSE, eSE, informaSE, etc.).
A etapa final consistiu em classificar as incidncias do SE nas concordncias
remanescentes. Embasando-nos em Kemmer (1994) e Maldonado (2006), reunimos essas
ocorrncias em reflexivas, mdias, passivas (MPT) e impessoais. O resultado final est na
tabela a seguir:
Tab. 5 DEEC: Totais por construo.

Subcorpus

Reflexivas

Mdias

B1
B2
I1
I2
A1
A2
TOTAL
%

6
39
1
6
5
2
59
3,65

644
371
158
95
68
61
1.397
86,45

Passivas
(MPT)
0
0
0
0
1
3
5
0,31

Impessoais

TOTAL

21
20
21
49
26
19
155
9,59

671
430
180
150
100
85
1.616
100

13

Desenvolvido por Jos Lopes Moreira Filho e disponvel como freeware na Internet. Neste trabalho,
utilizamos a verso 3.0 do programa.

Benivaldo Jos de Arajo Jnior; p. 64-81.

74

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Observando os resultados de modo global, notria a supremacia das mdias


(86,45%) com relao s demais construes-SE no corpus. Em segundo lugar vm as
impessoais (9,65%), seguidas das reflexivas (3,65%) e, finalmente as passivas (0,25%). No
grfico a seguir, esses percentuais podem ser melhor visualizados:

Grfico 1 - Percentuais das construes-SE no DEEC

100

86,45

80
60
40
20

3,65

0,25

0
Reflexivas

Mdias

Passivas

9,65
Impessoais

A alta incidncia das mdias pode ser explicada em funo dos critrios de
classificao adotados. Ou seja, delimitamos as construes reflexivas e mdias a partir da
proposta de Kemmer (1994), fundamentada na elaborao relativa de eventos e no grau de
distinguibilidade de seus participantes (ou dos subeventos componentes); dessa forma, em
nossa anlise, classificamos como mdias algumas construes que normalmente so
consideradas reflexivas (sobretudo nas abordagens prescritivas) ou recebem outra
denominao. A seguir, citamos exemplos do corpus14 para algumas das situaes mediais
listadas por Kemmer (1994):
(1)Hay que dejarlos se ducharen todos los das (ED400494) [cuidados corporais]
(2)Entonces se levant en un rato, par un poco porque estaba fatigado
(EC300013) [mudana na postura corporal]
(3)A los 23 aos, l se fu a vivir en Salvador (EC300353) [movimento
translacional]
(4)En ese momento, ella se alarm: Pero, estar ms tiempo sola, sin un
novio? (EC300071) [mdia de emoo]
As reflexivas totalizaram pouco menos de 4% do total. Considerando-se apenas o
conjunto dessas construes no corpus, houve incidncia de reflexivas recprocas (maioria,

14

A informao entre parnteses, aps cada exemplo, representa o cdigo da produo escrita no DEEC.

Benivaldo Jos de Arajo Jnior; p. 64-81.

75

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

com 83%), reflexivas diretas (15%) e reflexivas indiretas (2%), representadas,


respectivamente, nos exemplos (5), (6) e (7).
(5)Se quieren y se respetan (ED101572)
(6)A ella le gusta olharse en el espejo (EA100384)
(7)(...) se estn preparando unos pasteles para comrselos (EC300074)
No levantamento das impessoais e passivas, utilizamos a proposta de Maldonado
(2006), embasada na fora indutiva presente nos eventos. Embora fatores como a
concordncia e o aspecto sejam importantes na diferenciao dessas construes, o requisito
de agentividade humana preponderante: se a induo no evento humana, embora
esquemtica, h maior probabilidade de termos uma construo impessoal (esquemas E e F na
fig. 5); se a fora indutiva tem menos proeminncia no evento, a salincia passa a ser do tema
e estamos no mbito das mdias e passivas (esquemas B, C e D na fig. 5).
As impessoais totalizaram cerca de 10% do total de incidncias. Levando-se em conta
apenas o conjunto dessas construes, obteve-se no corpus a seguinte distribuio: as
impessoais intransitivas correspondem a 22% (exemplo 8); as impessoais com complemento
direto, que foram maioria, totalizam 78%. Destas, 75% so imperfectivas (exemplo 9) e 3%
so perfectivas (exemplo 10), segundo o aspecto verbal.
(8)(...) se produce ms y mejor en casa (...) (ED400271)
(9)(...) slo se requiere buena capacidad de comunicacin (ED400171)
(10)
(...) es una cosa que nunca se ofreci (EF600024)
As passivas constituem apenas 0,25% do total. Para essas construes, citamos os
exemplos a seguir.
(11) (...) no la compre [la mermelada] si ya se rompi el lacre (EE500021)
(12) (...) se extraviaron mis maletas desde hace una semana (EF600021)
Nessas ocorrncias, destacamos a pouca salincia da fora indutiva, cuja fonte
especfica no identificvel: a ruptura do lacre ou o extravio das maletas podem no ter sido
provocados por agentes humanos; os agentes humanos ou no so inespecficos na
codificao do evento, de modo que o elemento proeminente em cada construo o tema (el

Benivaldo Jos de Arajo Jnior; p. 64-81.

76

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

lacre, las maletas). Enfim, o que se focaliza nas passivas a mudana de estado sofrida pelo
tema e no o processo em si; da o aspecto perfectivo presente nessas construes.
Cotejando os dados do DEEC com os do CPA (falantes nativos do espanhol
peninsular) e da ASP (falantes nativos do PB), chegamos seguinte tabela:
Tab. 6 CPA/ DEEC/ ASP: Totais por construo.

CPA

total
%

98
3,31

1.651
55,68

Passivas
(MPT)
12
0,4

DEEC

total
%

59
3,65

1.397
86,45

5
0,31

155
9,59

1.616
100

ASP

total
%

96
10,67

626
69,56

2
0,22

176
19,56

900
100

CORPORA

Reflexivas

Mdias

Impessoais

TOTAL

1.204
40,61

2.965
100

Comparando-se o total das construes-SE nos 3 corpora, o maior nmero de


incidncias ocorreu no CPA: o total nesse corpus supera em mais de 3 vezes o observado na
ASP e, em quase o dobro, o total levantado no DEEC (grfico 2). Tal resultado est dentro do
esperado para a ASP, conforme os estudos comparativos de Arajo Jnior (2006) e Gonzlez
(1994), segundo os quais a perda ou apagamento dos clticos (SE e os demais) no PB
favoreceria a menor incidncia de construes-SE nessa lngua e na produo no nativa de
lusoparlantes em espanhol.

Grfico 2 - Total de construes-SE nos corpora

4000
3000

2965
1616

2000

900

1000

0
CPA

DEEC

ASP

Os resultados no DEEC, tomados globalmente, esto a meio caminho entre o CPA e a


ASP: se por um lado a instruo formal em LE influenciaria a presena significativa de
construes-SE no corpus de aprendizes (quase o dobro da que aparece no corpus de falantes

Benivaldo Jos de Arajo Jnior; p. 64-81.

77

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

nativos do PB), por outro lado, o apagamento do cltico implicaria uma frequncia ainda
aqum da observada no corpus do espanhol.
Ao comparar os percentuais por construo (grfico 3), os resultados se mostram
difusos o CPA lidera na quantificao percentual das impessoais e passivas; a ASP tem a
maior porcentagem de reflexivas e o DEEC est frente no percentual das mdias e no
sinalizam propriamente uma tendncia.

Grfico 3 - Percentuais de construes-SE nos corpora por tipo

100
80
60

CPA

40

DEEC

20

ASP

0
Reflexivas

Mdias

Passivas

Impessoais

Se a perda do cltico pode estar ocasionando os baixos percentuais das passivas no


DEEC15 (0,31%) e na ASP (0,22%), nas mdias parece ocorrer o contrrio: a alta incidncia
dessas construes no DEEC (86,45%) e na ASP (69,56%) sinaliza menor ndice de
apagamento do cltico na variedade em questo.
Sobre outros fenmenos observados no corpus, destacamos o baixo ndice de
construes sem concordncia (0,43%). Citamos duas delas na sequncia:
(13) Existe el sitio donde se fabrica las piezas (ED400701)
(14) () havia formaciones minerales como aquellas que se ve en cavernas de la
Tierra (EB200302)
No caso, nossa expectativa era de que o enfraquecimento da concordncia no PB
(GALVES, 1993, apud GONZLEZ, 1994) resultasse na produo de mais construes
discordantes no corpus de aprendizes, porm tal no ocorreu; no se pode atribuir o fato
influncia da instruo formal em LE unicamente, uma vez que no prprio corpus do PB esse
ndice tambm foi baixo (0,8%).

Outro fenmeno verificado no corpus de aprendizes,

15

Em Arajo Jnior (2006), ao analisarmos o corpus DEEC, constatamos que a perda do cltico tambm
favoreceria a predominncia das passivas perifrsticas nesse corpus.

Benivaldo Jos de Arajo Jnior; p. 64-81.

78

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

tambm apontado por Gonzlez (1994), foi a supergeneralizao dos clticos (exemplos 15 e
16), que consiste na presena destes onde no deveriam aparecer. No caso especfico do SE,
computamos 2,1% dessas construes no corpus.
(15) Pero no fue eso que se sucedi (EF600744)
(16)Para el beb, todo no se pasa de un juguete (EC300283)
Conforme Gonzlez (1994, p. 411), tais formas so incorporadas produo no
nativa muito mais pelo efeito sonoro do que propriamente pela importncia na construo do
sentido e na referencialidade. Tambm observamos ocorrncias no DEEC nas quais o SE no
desempenha funo argumental (exemplos 17 e 18), mas cuja presena pode ser creditada
influncia da lngua materna, uma vez que o fenmeno ocorre com relativa frequncia no PB.
(17)sta es una pregunta dificil de se contestar (EF501114)
(18) Slo haba piedras y ms piedras para se estudiar (EC201152)
Nesses casos que totalizaram 0,8% no DEEC e 2,3% na ASP o SE/SE
acompanha infinitivos em construes impessoais e parece ter como finalidade reforar o
carter humano do sujeito esquemtico na estrutura.
5. Consideraes finais
A anlise do corpus de aprendizes que aqui procedemos, embora sucinta, permite-nos
tecer algumas consideraes.
De incio, ressaltamos que a Gramtica Cognitiva foi uma abordagem produtiva na
anlise do nosso corpus de estudo, uma vez que nos ofereceu critrios (especialmente
semnticos) que nos auxiliaram a melhor delimitar e classificar as construes-SE levantadas.
De acordo com os dados, a incidncia global das construes-SE no corpus de aprendizes
ainda est distante do observado no espanhol, possivelmente influenciada pela perda do
cltico no PB. Entretanto, a anlise das ocorrncias por construo revelou baixo ndice de
passivas e alto percentual das mdias no corpus de aprendizes; consideramos esses resultados
um indcio de que o apagamento do cltico no PB ocorreria de maneira diferenciada nas
diferentes construes-SE, e que uma investigao especfica desse fenmeno ofereceria mais
respostas sobre a produo das referidas construes, em espanhol, por aprendizes brasileiros.

Benivaldo Jos de Arajo Jnior; p. 64-81.

79

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

O contraponto ao apagamento do cltico seria a sua supergeneralizao no corpus de


aprendizes, cujo ndice ficou em 2,1% do total e, conforme Gonzlez (1994), seria produto da
aprendizagem formal (por um efeito mimtico) e no da aquisio espontnea.
Por fim, a presena no DEEC de construes impessoais com SE no argumental (no
observada no corpus do espanhol) pode ser atribuda influncia da lngua materna, nas quais
so atestadas com relativa frequncia. O cltico SE nessas construes, tal qual parece ocorrer
no PB, enfatizaria o carter humano do sujeito/agente selecionado pelo verbo, embora esse
participante no esteja codificado na sentena.
Referncias bibliogrficas
ARAJO JNIOR, B. J. As passivas na produo escrita de brasileiros aprendizes de
Espanhol como lngua estrangeira. 2006. 111f. Dissertao (Mestrado em Lngua
Espanhola). Faculdade de Filosofia, Letras e Cincias Humanas, Universidade de So Paulo,
So Paulo, 2006.
______. Limites precisos ou fronteiras que desaparecem? As construes impessoais e
passivas com o cltico SE/SE no portugus brasileiro e no espanhol. 2013. 203 f. Tese
(Doutorado em Lngua Espanhola). Faculdade de Filosofia, Letras e Cincias Humanas,
Universidade de So Paulo, So Paulo, 2013.
BERBER SARDINHA, T. Lingustica de Corpus. Barueri, Manole, 2004. 410 p.
GONZLEZ, N. T. M. Cad o pronome? O gato comeu. Os pronomes pessoais na
aquisio/aprendizagem do espanhol por brasileiros adultos. 1994. 451f. Tese (Doutorado em
Lingustica). Faculdade de Filosofia, Letras e Cincias Humanas, Universidade de So Paulo,
So Paulo, 1994.
HOPPER, P. J.; THOMPSON, S. Transitivity in grammar and discourse. Language, v. 56,
n.2, p. 251-99, 1980.
http://dx.doi.org/10.1353/lan.1980.0017
KEMMER, S. Middle voice, Transitivity, and the Elaboration of Events. In: FOX, B.;
HOPPER, P. J. (eds.) Voice: Form and Function. John Benjamins: Amsterdam/Philadelphia,
1994, p. 179-229.
http://dx.doi.org/10.1075/tsl.27.09kem
LANGACKER, R. W. Foundations of Cognitive Grammar: Descriptive Application.
Stanford: Stanford University Press, 1991, v.2. 590 p.
LYONS, J. Linguistique gnrale. Paris: Larousse, 1970. 384 p.
MALDONADO, R. A media voz: Problemas conceptuales del cltico se. Mxico:
Universidad Nacional Autnoma de Mxico, 2006. 482 p.

Benivaldo Jos de Arajo Jnior; p. 64-81.

80

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

MENDES, R. SP2010 - Construo de uma amostra da fala paulistana. Projeto de Pesquisa


apresentado FAPESP (Proc. no. 2011/09278-6), 2011.
MORENO FERNNDEZ, F. et al. La lengua hablada en Alcal de Henares. Corpus
PRESEEA-ALCAL. I. Hablantes de Instruccin Superior. Alcal de Henares:
Universidad de Alcal, 2002. CD-ROM.
______. La lengua hablada en Alcal de Henares. Corpus PRESEEA-ALCAL. II.
Hablantes de Instruccin Media. Alcal de Henares: Universidad de Alcal, 2004. CDROM.

Artigo recebido em: 28.09.2014


Artigo aprovado em: 15.12.2014

Benivaldo Jos de Arajo Jnior; p. 64-81.

81

Reflexes sobre anotao sinttica e ferramentas de busca - Uso da


linguagem XML para anotao sinttica no corpus digital DOViC
Reflections on syntactic annotation and search tools - Using the XML for syntactic
annotation in digital corpus DOViC
Cristiane Namiuti Temponi*
Aline Silva Costa**
RESUMO: Penn TreeBank para anotao
sinttica no corpus digital DOViC, uma vez
que esta linguagem j utilizada para a
anotao de edies e de informaes
morfolgicas neste corpus. Assim, uma nica
tecnologia pode ser usada para os diversos
tipos de buscas automticas. Para uma
experimentao da anotao sinttica com
XML, implementamos um programa que faz
a converso do formato Penn TreeBank para
a linguagem alvo, e foram realizadas algumas
pesquisas sintticas com a linguagem XPath,
uma linguagem de consulta para a tecnologia
XML. As buscas realizadas foram
comparadas com as mesmas buscas feitas na
ferramenta corpus Search, uma ferramenta
especfica para o formato Penn TreeBank. O
uso de XML para todas as representaes
favorece a criao de recursos padronizados,
que podem ser reutilizados, facilitando a
extrao de dados de corpora.
A
disponibilidade de anotao usando um
padro como XML tambm oferece
independncia tecnolgica a outros grupos
pesquisadores interessados no corpus.

ABSTRACT: This paper makes reflections


on the use of XML as an alternative format
for Penn TreeBank syntactic annotation in
digital corpus DOViC, since this language is
already used for the annotation of editions
and morphological information in this
corpus. Thus, a single technology can be
used for various types of automatic searches.
For a trial of syntactic annotation with XML,
we implemented a program that does the
conversion of the Penn TreeBank format for
the target language, and some syntactic
research with the XPath language, a query
language for XML technology were
performed. The queries were compared with
the same search queries made in tool corpus
Search, a tool for the specific format
TreeBank Penn. The use of XML for any
representations favors the creation of
standard features, which can be re-used,
facilitating the extraction of data from
corpora. The availability of annotation using
XML as a standard also offers technological
independence to other researchers interested
groups in the corpus.

PALAVRAS-CHAVE:
XPath. Penn TreeBank.

KEYWORDS: Corpus. XML. XPath. Penn


TreeBank.

Corpus.

XML.

1. Introduo
Nos ltimos anos, corpora cada vez maiores de recursos lingusticos foram
desenvolvidos e anotados pelos estudiosos da linguagem. Certos princpios de representao
*

Doutora em Lingustica pela Universidade Estadual de Campinas (UNICAMP) e professora do Departamento


de Estudos Lingsticos e Literrios e do Programa de Ps-Graduao em Lingustica da Universidade Estadual
do Sudoeste da Bahia (UESB).
**
Bacharel em Cincias da Computao pela Universidade Estadual do Sudoeste da Bahia (UESB) e Mestranda
do Programa de Ps-Graduao em Lingustica da UESB.

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

tm sido amplamente adotados, como o uso de anotao stand-off1 ou o uso da linguagem


XML, e foram feitas vrias tentativas para proporcionar mecanismos e formatos de anotao
genricos. Apesar de tais esforos, os formatos de anotao variam consideravelmente para
cada recurso lingustico, projeto ou corpus, muitas vezes para satisfazer as restries impostas
por determinado software de processamento. Tratando-se especificamente dos recursos
sintticos, existem diversos formatos para representar a estrutura de sentenas em corpora
lingusticos digitais. Essa variedade de formatos, no entanto, dificulta o acesso aos dados
sintticos, uma vez que cada formato exige tecnologias de processamento especficas. Na
anlise de lnguas naturais, os dados lingusticos podem ser reutilizados, servindo a diversas
pesquisas. Mas pela variedade de representaes existentes, as ferramentas e aplicaes
computacionais desenvolvidas so raramente reutilizadas. A comunidade de processamento
de linguagem reconhece que a uniformizao e interoperabilidade so cada vez mais
prementes para permitir o compartilhamento, fuso e comparao de recursos lingusticos
(IDE; ROMARY; DE CLERGERIE, 2004).
O corpus de Documentos Oitocentistas de Vitria da Conquista DOViC utiliza a
linguagem XML para anotao de edies e representao da morfologia dos textos que o
compem. O esquema de anotao e ferramenta utilizados so os mesmos utilizados pelo
Corpus Histrico do Portugus Tycho Brahe. No entanto, a representao da estrutura
sinttica no Tycho Brahe no feita utilizando essa mesma linguagem, mas sim um outro
formato, o Penn TreeBank. Dessa maneira, a extrao dos dados sintticos demanda o uso de
uma tecnologia diversa, uma ferramenta que faa buscas em arquivos nesse formato
especfico. A ferramenta utilizada para este propsito no Tycho Brahe o programa Corpus
Search.
Este trabalho discute o uso da mesma tecnologia j utilizada na representao da
morfologia, a linguagem XML, como uma alternativa ao formato Penn TreeBank para
anotao sinttica. XML uma linguagem que permite descrever qualquer tipo de dado e
um padro aberto para interoperabilidade e intercmbio de informaes. A existncia de uma
ampla variedade de tecnologias para esse padro permite a criao de recursos padronizados,
favorecendo a reutilizao tecnolgica e facilitando a extrao de dados de corpora.

Anotao stand- off uma estratgia de anotao em que se mantm os dados anotados em documentos
separados dos documentos com os dados originais (IDE; ROMARY; DE CLERGERIE, 2004).

Cristiane Namiuti-Temponi, Aline Silva Costa; p. 82-103.

83

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Para experimentao de uma representao de estrutura sinttica usand XML foi


implementado um programa que realiza a converso do formato Penn TreeBank para a
linguagem alvo. Buscas automticas nesse formato foram realizadas com a linguagem de
consulta XPath. As buscas realizadas foram ento comparadas com as mesmas buscas feitas
na ferramenta Corpus Search. Finalmente, foi feita uma anlise qualitativa de custo/benefcio
para uso da linguagem em questo no corpus DOViC.
Na seo dois, a linguagem XML ser abordada brevemente. A seo trs apresenta o
corpus digital DOViC e sua metodologia de anotao. As sees quatro a sete tratam de
padres de anotao para corpora, do formato Penn TreeBank

e do uso de XML em

anotaes sintticas. A seo oito apresenta sucintamente uma linguagem para consultas em
XML, a Xpath. As sees seguintes apresentam a proposta do trabalho, mostrando o resultado
do programa implementado para a converso de formatos e as buscas realizadas em XPath.
Por fim, a seo onze faz uma anlise qualitativa do custo/benefcio para uso da proposta,
seguida das consideraes finais.
2. A linguagem XML
XML (Extensible Markup Language) uma linguagem de editorao que oferece um
formato universal para estruturao de documentos e dados na Web. Proposta pelo W3C 2
(World Wide Web Consortium) como uma nova alternativa linguagem HTML (Hiper Text
Markup Language), linguagem dominante na Web, a XML combina extensibilidade, poder e
flexibilidade com a simplicidade exigida pela Web (SILVA FILHO, 2004; DEITEL;
DEITEL; NIETO; LIN; SADU, 2005).
Documentos XML so documentos de texto que representam dados de maneira
estruturada utilizando um conjunto de tags3 ou elementos. Tal conjunto no fixo nem
limitado, podendo ser estendido. Assim, os autores dos documentos podem criar suas prprias
tags para atender a necessidades especficas, o que torna a linguagem poderosa para
representar qualquer tipo de dado conferindo-lhe a classificao como uma metalinguagem
(SILVA FILHO, 2004; DEITEL; DEITEL; NIETO; LIN; SADU, 2005).

O W3C uma organizao, fundada em 1994, destinada a desenvolver tecnologias interoperantes e de domnio
pblico para a World Wide Web (DEITEL et al, 2005).
3
Os termos marca, elemento ou etiqueta podem ser usados como sinnimo de tag.

Cristiane Namiuti-Temponi, Aline Silva Costa; p. 82-103.

84

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Ainda que baseie-se em texto, a XML no se limita a descrever somente dados


textuais, mas tambm pode descrever imagens, grficos vetoriais, animaes ou qualquer
outro tipo de dado para o qual seja estendida (DEITEL; DEITEL; NIETO; LIN; SADU,
2005).
Dados representados por XML so estruturados de forma arbrea, e cada tag ou marca
representa um n ou elemento na rvore. A sintaxe de XML requer um nico elemento
como n raiz, uma marca de abertura e de finalizao para cada elemento, marcas
corretamente aninhadas e valores de atributos entre aspas. (DEITEL; DEITEL; NIETO; LIN;
SADU, 2005).
O quadro 1 mostra um exemplo de um documento XML representando os dados de
um livro, com as informaes de autor, ttulo e ISBN. O n raiz <livro> e este possui como
filhos trs ns <autor> e um n <titulo>. A informao de ISBN foi representada como
atributo do n <livro> e seu valor no exemplo 978-85-7244-800-0.
Quadro 1: Exemplo de um documento XML
<livro ISBN=978-85-7244-800-0>
<autor> Carlos Mioto </autor>
<autor> Ruth Lopes </autor>
<autor> Maria Cristina Figueiredo Silva </autor>
<titulo> Novo Manual de Sintaxe</titulo>
</livro>

Os documentos XML so legveis para as pessoas e tambm manipulveis por


computadores. A ausncia de instrues de formatao facilita a realizao do processamento
sinttico de sua estrutura, o que a torna uma referncia que pode ser usada para o intercmbio
de dados. Para obter funcionalidade e interoperabilidade na Web, desenvolvedores de
software em todo o mundo esto integrando XML a seus aplicativos. Contudo, a XML no
est limitada a aplicaes Web (DEITEL; DEITEL; NIETO; LIN; SADU, 2005).
Atualmente, a linguagem XML um dos formatos mais utilizados para
compartilhamento de informao estruturada entre aplicativos, independente de plataforma.
Como um padro aberto, existe uma grande quantidade de opes relacionadas s
ferramentas para implement-la, permitindo que o usurio escolha o que melhor se ajuste s
suas necessidades (W3C, 2010; DEITEL; DEITEL; NIETO; LIN; SADU, 2005)
3. O corpus DOViC

Cristiane Namiuti-Temponi, Aline Silva Costa; p. 82-103.

85

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

O corpus DOViC (corpus de Documentos Oitocentistas de Vitria da Conquista) um


corpus digital de documentos manuscritos do sculo XIX, desenvolvido no mbito do projeto
Memria conquistense: implementao de um corpus digital4 (NAMIUTI, 2013) em
parceria com o projeto de pesquisa Sintaxe diacrnica em corpus eletrnico: do portugus
pr-clssico s variantes modernas (NAMIUTI; SANTOS, 2010). Os documentos
manuscritos que compem o corpus esto guardados nos arquivos do Frum de Vitria da
Conquista-Bahia.
Os textos do corpus DOViC so transcritos, editados e anotados nos mesmos moldes
do Corpus Histrico do Portugus Tycho Brahe, utilizando a mesma ferramenta e mesmo
esquema de anotao. O Corpus Tycho Brahe um corpus digital composto de textos em
portugus escritos por autores nascidos entre 1380 e 1845, desenvolvido na Universidade
Estadual de Campinas (UNICAMP). O desenvolvimento deste corpus se deu a partir de 1998,
no mbito do Projeto Padres Rtmicos, Fixao de Parmetros e Mudana Lingustica
(UNICAMP, 1998).
A transcrio e edio dos textos do corpus DOViC so feitos com o auxlio da
ferramenta E-Dictor (KEPLER; PAIXO DE SOUSA; FARIA, 2010). O texto transcrito
salvo em um arquivo no formato texto simples. Edies como modernizao, juno,
segmentao e modernizao de grafia so feitas por meio da interface grfica da ferramenta,
produzindo como resultado um arquivo anotado na linguagem XML. O software realiza
anotao das informaes morfolgicas dos textos, tambm no formato XML e ambas as
anotaes so feitas num nico arquivo. Esse esquema de anotao suportado pelo E-Dictor,
utilizado tanto no corpus Tycho Brahe quanto no DOViC, foi concebido dentro do projeto
Memria dos Texto (PAIXO DE SOUSA, 2006). Como esse processo feito por meio
da interface grfica, o uso da linguagem XML transparente para o usurio, ou seja, ele no
lida diretamente com essa estrutura.
A anotao de edio realizada identificando todos os itens acrescentados ao texto
pelo editor como elementos <e>, e os itens originais correspondentes como elementos <o>. O
tipo de edio identificado atravs da propriedade "t" dos elementos <e> e os tipos possveis
so listados na tabela 1. A numerao dos elementos, identificados pela propriedade "id" so
atribudas automaticamente pela ferramenta (UNICAMP, 2007).

Projeto financiado pelo CNPq (CNPq 485098/2013-0).

Cristiane Namiuti-Temponi, Aline Silva Costa; p. 82-103.

86

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

As anotaes de informaes morfolgicas dos textos tambm so feitas em XML e


mantidas no mesmo arquivo com as edies. A identificao de informao morfolgica d-se
pela marcao do item lexical com o elemento <m>. A propriedade "v" marca o valor da
categoria lexical. A figura 1 mostra um trecho da anotao gerada pelo E-Dictor para um
texto do corpus DoVic.

Tabela 1: Tipos de edio possveis para o corpus Tycho Brahe e representao na anotao XML.

Tipo de edio
uniformizao grafemtica e de mdulo
separao ou juno de vocbulos
expanso de abreviatura
uniformizao de pontuao
modernizao de grafia
Correes

Atributo
<e>

de Exemplo

t="gra"

<e t="gra">servio</e><o>eruio</o>

t="seg"

<e t="seg">que e</e><o>quee</o>

t="exp"

<e t="exp">Vossa Merc</e><o>V.M.</o>


<e t="punc"> >> </e><or> " </or>

t="punc"
t="mod"

<e t="mod">nclita</e><o>inclita</o>

t="cor"

<e t="cor">depois</e><o>deqois</o>

Fonte: Unicamp (2007).

Figura 1 - Arquivo XML gerado pelo E-Dictor para um documento do corpus DOViC.

A verso atual do programa E-Dictor (verso 1.0 beta 10) no realiza anotao da
estrutura sinttica. Tal informao gerada separadamente utilizando um parser que recebe
como entrada um arquivo anotado no formato POS (Part of Speech), e gera como sada um
arquivo texto no formato Penn TreeBank, que ser detalhado na seo 5. O treinamento do
parser foi feito para o portugus clssico na Universidade da Pensilvnia. Para obteno da

Cristiane Namiuti-Temponi, Aline Silva Costa; p. 82-103.

87

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

representao sinttica nos textos do corpus DOViC, os textos devero ainda passar pelo
mesmo processo de etiquetagem.
4. Padres para anotaes de corpora
O aumento das pesquisas em Lingustica de Corpus e o crescimento na disponibilidade
de corpora eletrnico fizeram com que diversos formatos de codificao e anotao de textos
surgissem. Cada projeto de compilao de corpus pode criar e/ou definir um formato, com o
objetivo de atender requisitos das ferramentas de anotao e explorao de corpus especficas.
A diversidade de formatos aumentou a importncia e a necessidade de estabelecimento de
padres que facilitassem o compartilhamento, a combinao e o intercmbio desses recursos.
Entre os principais projetos e iniciativas com o propsito de definir um padro de codificao
e anotao de textos, podemos destacar: MuchMore, Tiger- XML5, Text Encoding Initiative
(TEI)6, Corpus Encoding Standard (CES), Corpus Encoding Standard for XML (XCES) e
padro ISO TC37/SC4.
O XCES a verso do padro CES (Corpus Encoding Standard) baseado em XML.
O CES um padro de codificao para corpora destinado a atender a necessidade do
desenvolvimento de prticas de codificao padronizados para corpora lingusticos. O CES
identifica um nvel de codificao mnima que corpora devem alcanar para ser considerado
padronizado em termos de representao descritiva (marcao de informao estrutural e
lingustica) (IDE, 1998; IDE; BONHOMME; ROMARY, 2000).
O Padro ISO TC37/SC4 um framework para anotao de informao lingustica
desenvolvido pela Organizao Internacional de Padronizao (International Organization for
Standardization). A ISO formou um subcomit (SC4) no mbito da Comisso Tcnica 37
(TC37, Terminology and Other Languages Resources) com o objetivo de estabelecer padres
internacionais e recomendaes para a modelagem de dados, anotao, intercmbio de dados
e avaliao de recursos lingusticos. Dentre os diversos grupos de trabalho do TC37/SC4, um
grupo foi criado para prover um framework para anotao lingustica. A inteno no definir
um esquema ou formato nico e definitivo de anotao, mas fornecer uma arquitetura p que
possa servir de referncia para diferentes esquemas de anotao, permitindo a fuso ou
comparao entre eles. A estrutura do framework tem como finalidade prover o mximo de
5
6

http://www.ims.uni-stuttgart.de/projekte/TIGER/TIGERSearch/doc/html/TigerXML.html
http://www.tei-c.org/index.xml

Cristiane Namiuti-Temponi, Aline Silva Costa; p. 82-103.

88

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

flexibilidade para codificadores e anotadores, e ao mesmo tempo permitir e estimular o


intercmbio e reutilizao de recursos lingusticos anotados (IDE; ROMARY; DE LA
CLERGERIE, 2004).
O projeto MuchMore (Multilingual Concept Hierarchies for Medical Information
Organization and Retrieval) prope um formato de anotao lingustica capaz de integrar
mltiplos nveis de informao: anotao morfolgica, sinttica e semntica. O formato
baseado em XML e os nveis de informao podem ser organizados separadamente, sendo
integrados atravs de referncia a identificadores (BUITELAAR et al., 2003).
5. O formato Penn TreeBank
Assim como h vrios formatos para representao e armazenamento de corpora
lingusticos, h tambm um variado nmero de formatos para representao e anotao da
estrutura sinttica dos textos que os compem, como Tipster, Penn TreeBank, Susanne e
NeGra (LEZIUS; MENGEL, 2000).
O Penn TreeBank Format (Formato Penn TreeBank) um esquema de anotao
sinttica de corpora desenvolvido pela Universidade da Pensilvnia. O esquema utiliza uma
representao arbrea delimitada por parnteses etiquetados. Todos os parnteses abertos tm
uma etiqueta associada, sendo uma etiqueta phrase (NP, ADJP, etc), associada a projees
mximas da teoria X-Barra, ou uma etiqueta word (N, ADJ , etc), associadas a ncleos da
mesma teoria, representando os ns de uma rvore (SANTORINI, 2010; MARCUS;
TAYLOR, 2002).
A cada palavra est associada uma etiqueta word, mas nem sempre uma etiqueta
phrase ser associada a cada n correspondente em uma rvore da teoria sinttica. As
projees intermedirias da teoria X-Barra (N', ADJ', etc) no so incudas nessa
representao. Outras categorias tambm so omitidas nesse esquema de anotao, como por
exemplo, VP e DP (SANTORINI, 2010).
A representao parcial da estrutura sinttica se d por razes prticas, e por esse
motivo no se mantm a mesma estrutura correspondente rvore terica. A categoria DP,
por exemplo, omitida porque o custo de inclu-la supera sua utilidade. Outra diferena para
as rvores da teoria sinttica que nesse esquema de representao as rvores no so
obrigatoriamente binrias, ou seja, cada n pode ter mais de duas ramificaes (SANTORINI,
2010).

Cristiane Namiuti-Temponi, Aline Silva Costa; p. 82-103.

89

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Uma estrutura tpica de anlise sinttica com anotao nesse formato dada como
exemplo no quadro 2. A figura 2 mostra a representao grfica correspondente a esta mesma
estrutura de anlise.
Quadro 2 - Estrutura de anlise de uma sentena na anotao Penn TreeBank
((IP-MAT (NP-SBJ (NPR Mary))
(HVP has)
(BEN been)
(VAG meaning)
(IP-INF (TO to)
(VB go))
(PP (P for)
(NP (D a) (N week)))))
Fonte: Santorini (2010).

Figura 2 - Representao grfica de estrutura de anlise de uma sentena na anotao Penn TreeBank

6. A Ferramenta Corpus Search


Assim como h vrios formatos para anotao sinttica de corpora, h tambm vrias
ferramentas para extrair informao destes dados anotados, dentre as quais podemos citar:
Tgrep2, TIGERsearch, Emu, Corpus Search, NiteQL, Lpath (IMS, 2013).
O Corpus Search um programa que realiza pesquisas sintticas em corpora anotados
no formato Penn TreeBank. Asssim como o esquema de anotao, o software tambm foi
desenvolvido na Universidade da Pensilvnia (CORPUS SEARCH, 2009).
Corpus Search implementado na linguagem de programao Java, e portanto,
multiplataforma7 e requer que o programa JRE8 (Java Runtime Environment) esteja instalado
no computador do usurio.

Um programa multiplataforma pode ser executado em qualquer sistema operacional, desde que haja uma
mquina virtual apropriada instalada.
8
JRE (Java Runtime Environment) um software desenvolvido para executar programas feitos na linguagem
Java. O JRE possui como componente a mquina virtual Java (JVM- Java Virtual Machine) (ORACLE, 2010).

Cristiane Namiuti-Temponi, Aline Silva Costa; p. 82-103.

90

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

A execuo do Corpus Search para realizar buscas sintticas requer duas entradas: o
arquivo do corpus, anotado no formato Penn TreeBank; e o arquivo com a especificao da
consulta a ser realizada, tambm chamado de command file, em formato texto simples.
A especificao das buscas no arquivo de entrada deve estar de acordo com a sintaxe
exigida pela linguagem de consulta do Corpus Search, que compreende chamadas a funes
de busca e uso de operaes lgicas. As funes de busca pesquisam relaes existentes na
estrutura sinttica como dominncia, c-comando, irmandade, entre outras.
Os resultados de uma busca realizada pelo Corpus Search podem ser vistos no arquivo
de sada gerado pelo programa. O arquivo produzido no formato texto simples e rene
informaes sobre as sentenas contendo as restries especificadas pela busca (CORPUS
SEARCH, 2009).
7. Utilizao da linguagem XML na anotao sinttica
Este trabalho discute a utilizao da linguagem XML como alternativa para anotao
sinttica de textos do corpus DOViC. Existem numerosos exemplos da implementao de
XML em anotaes de corpora. Entre eles esto os projetos Alpino Dependency TreeBank,
Europarl Parallel Corpus, Wikipedia XML corpora, PDTB XML, e outros. H ainda outros
estudos que visam converter dados de corpora em XML ou desenvolver representaes XML
para unir os dados de corpora de mltiplas fontes. O Expert Advisory Group on Language
Engineering Standards lanou uma codificao XML padro para corpus, o XCES (XML
Corpus Encoding Standard) (YAO; BORISOVA; ALAM, 2010).
Lezius e Mengel (2000) propem um esquema de anotao sinttica baseado em
XML. Nessa abordagem, proposta a utilizao de basicamente quatro elementos XMLpara
descrever a estrutura arbrea: elementos sentena <s> , elementos no-terminais <n>,
elementos terminais ou palavras <w> e elementos de aresta <edge> , usado para ns de
ligao. As categorias dos ns, como categoria sinttica ou rtulo POS so representados
como atributos das tags XML. Um exemplo da anotao proposta mostrado na figura 3.
O padro XCES (seo 4) descreve um padro de codificao em XML para anotaes
lingusticas com informaes morfossintticas. Assim, informaes sobre estrutura de
sentenas e informaes morfolgicas so mantidas numa nica estrutura. As informaes
morfossintticas so anotadas utilizando-se dos elementos <tok>. A integrao com os dados
primrios feita atravs do atributo "xlink". Elementos <s> marcam sentenas e etiquetas

Cristiane Namiuti-Temponi, Aline Silva Costa; p. 82-103.

91

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

<par> marcam pargrafos. A figura 4 mostra um fragmento de um texto contendo anotaes


de informao morfossinttica neste padro.

Figura 3 - Exemplo de anotao sinttica usando XML proposta por Lezius e Mengel (2000).
Fonte: Lezius; Mengel (2000).

O projeto MuchMore (seo 4) prope um formato de anotao baseado em XML


onde diversos nveis de informao podem ser mantidos separadamente mas integrados
atravs de identificadores. A figura 5 exemplifica um trecho de texto anotado no formato do
MuchMore. O texto representado pelo elemento <text>, que por sua vez, composto de um
ou mais elementos <token>, que identificam as palavras, os quais marcam atravs de atributos
as informaes morfossintticas, alm da forma cannica de cada palavra. As estruturas
sintticas so representadas pelos elementos <chunk> , cujos atributos "from" e "to" marcam
onde comea e onde termina a estrutura. O atributo "type" classifica a estrutura como NP, PP,
etc. Os atributos "id" dos elementos permitem a referncia para a integrao de mltiplos
nveis de informao lingustica.
Yao, Alam e Borisova (2010) apresentam o projeto PDTB XML, um projeto que
converte os textos do corpus Penn Discourse TreeBank 2.0 para o formato XML. O PDTB
um grande corpus construdo na Universidade da Pensilvnia, anotado com informaes
sintticas e relaes de discurso, argumentos, atribuies e sentido. O esquema de anotao
utilizado possui o mesmo nome do corpus, Penn Discourse TreeBank.

Cristiane Namiuti-Temponi, Aline Silva Costa; p. 82-103.

92

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Figura 4 - Fragmento de texto com anotao no padro XCES.


Fonte: Ide; Bonhomme; Romary (2000).

Figura 5 Exemplo de anotaes lingusticas no MUCHMORE.


Fonte: Buitelaar et al. (2003).

8. XPath

Cristiane Namiuti-Temponi, Aline Silva Costa; p. 82-103.

93

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

A linguagem XML descreve dados de forma flexvel e eficiente atravs da marcao


dos dados com tags descritivas. No entanto, ela no fornece uma maneira de localizar dados
especficos dentro de um documento (DEITEL et al, 2005).
A linguagem XPath (XML Path), recomendada pelo W3C, fornece uma sintaxe para
localizar dados especficos em um documento XML de forma efetiva e eficiente. XPath
modela um documento XML como uma rvore de ns. uma linguagem de expresses,
baseada em strings, para localizar contedo dentro da rvore que representa o documento
XML (W3C, 1999; DEITEL et al, 2005).
Exemplos de expresses XPath so dados nos quadros 3 a 5. Todos os exemplos
podem ser aplicados ao documento XML dado como exemplo na figura 1. A expresso na
figura 8 localiza todos os ns <titulo>, que sejam filhos de <livro>. A expresso na figura 9
localiza o n <livro> que possua um atributo ISBN cujo valor seja 978-85-7244-800-0. E
por fim, a expresso na figura 10 localiza o terceiro n filho <autor> do n <livro>.
Quadro 3 - Exemplo de expresso XPath para localizar ns <titulo> filhos de <livro>

/livro/titulo
Quadro 4 - Exemplo de expresso XPath para localizar ns <livro> com atributo ISBN com valor 978-857244-800-0

/livro[@ISBN="978-85-7244-800-0"]

Quadro 5 - Exemplo de expresso XPath para localizar o terceiro n <autor> filho de ns <titulo>

/livro/autor[3]
9. Conversor do formato Penn TreeBank para XML
Para a transformao do formato Penn TreeBank para XML, foi desenvolvido neste
trabalho um programa na linguagem Java, que recebe como entrada um arquivo no primeiro
formato e gera um arquivo de sada XML correspondente. O programa no implementa ainda
a funo de parser, e portanto, o arquivo de entrada deve ser um documento Penn TreeBank
bem formado. Para uso futuro, o programa deve implementar a funo de parser a fim de
evitar entradas errneas. O programa no possui interface grfica, exibindo apenas uma janela
de dilogo para fornecimento do arquivo de entrada pelo usurio.
Para o arquivo de sada, foram usados os mesmos nomes de rtulos para nomear as
tags, com exceo do n raiz e de rtulos com caracteres no aceitos pela linguagem XML.

Cristiane Namiuti-Temponi, Aline Silva Costa; p. 82-103.

94

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Como o arquivo de entrada no possui um elemento raiz, foi inserido no arquivo de sada a
tag <DOCUMENT> como raiz do documento. Ns com o sinal de pontuao . no formato
Penn TreeBank foram mapeados para tags <POINT>. Ns com o smbolo , foram
mapeados para tags <COMMA>. Houve a necessidade de substituir o caracter $ pelo
caracter S. Assim, rtulos como PRO$ foram mapeados para etiquetas PROS. Os
demais nomes das tags para o documento XML permaneceram os mesmos utilizados no
formato Penn Tree Bank. Assim, cada n do arquivo de entrada mapeado numa tag XML
com mesmo nome. Cada n folha (n sem filho) gerado na sada como texto puro entre as
tags.
O quadro 6 mostra um trecho de um arquivo do corpus Tycho Brahe com anotao
sinttica Penn TreeBank e o quadro 7 mostra o arquivo sada correspondente em XML gerado
pelo programa.
Quadro 6 - Trecho de arquivo do corpus Tycho Brahe com anotao Penn TreeBank
( (IP-MAT (NP-SBJ *pro*)
(VB-R Darei)
(NP-ACC (N princpio))
(PP (P a)
(NP (D-F-P estas) (PRO$-F-P minhas) (N-P memrias)))
(RRC (P por)
(NP (D-F a) (PRO$-F minha) (N genealogia)))
(. .)) (ID A_003_PSD,03.1))
Quadro 7 - Trecho de arquivo com anotao sinttica em XML gerado pelo programa conversor
<IP-MAT>
<NP-SBJ>
*pro*
</NP-SBJ>
<VB-R>
Darei
</VB-R>
<NP-ACC>
<N>
princpio
</N>
</NP-ACC>
<PP>
<P>
a

Cristiane Namiuti-Temponi, Aline Silva Costa; p. 82-103.

95

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

</P>
<NP>
<D-F-P>
estas
</D-F-P>
<PROS-F-P>
minhas
</PROS-F-P>
<N-P>
memrias
</N-P>
</NP>
</PP>
<RRC>
<P>
por
</P>
<NP>
<D-F>
a
</D-F>
<PROS-F>
minha
</PROS-F>
<N>
genealogia
</N>
</NP>
</RRC>
<POINT>
.
</POINT>
</IP-MAT>
<ID>
A_003_PSD,03.1
</ID>

Cristiane Namiuti-Temponi, Aline Silva Costa; p. 82-103.

96

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

A hierarquia na estrutura gerada pode ser melhor visualizada usando qualquer


ferramenta que represente as relaes hierrquicas inserindo tabulaes, como navegadores e
outros. A figura 6 mostra a visualizao do documento no navegador Firefox.
10. Buscas sintticas utilizando anotao XML
As buscas nos arquivos de anotao sinttica com XML podem ser feitas utilizando
uma linguagem de consulta para esta linguagem. Neste trabalho, a linguagem XPath foi
utilizada. Como exemplo, foram realizadas duas buscas em um arquivo com anotao
sinttica Penn TreeBank do corpus Tycho Brahe, envolvendo relaes de dominncia ou
maternidade e irmandade. Depois de convertido o arquivo para a anotao XML proposta,
buscas equivalentes foram realizadas dentro deste arquivo XML com a linguagem XPath.

Figura 6 - Visualizao da estrutura hierrquica de anotao com XML no navegador Firefox

Para as buscas com XPath, foi implementado um segundo programa na linguagem


Java, utilizando a API 9 (Application Programming Interface) para XPath. Alm da
implementao e utilizao deste programa, as mesmas buscas tambm foram feitas no
navegador FireFox, atravs da instalao do plugin XPath Checker, disponvel gratuitamente

API (Application Programming Interface) um conjunto de funes e padres estabelecidos por


um software para a utilizao das suas funcionalidades por aplicativos que no pretendem conhecer detalhes
da implementao do software, mas apenas em usar seus servios.

Cristiane Namiuti-Temponi, Aline Silva Costa; p. 82-103.

97

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

na pgina de complementos para este navegador. Outros programas editores de XML com
processadores XML integrados tambm esto disponveis na Internet.
A busca para relao de dominncia no Corpus Search utiliza a funo dominates.
Para realizar uma busca de ns NP que dominam ns PP utilizando essa ferramenta, a
seguinte expresso foi utilizada no arquivo de consulta:
(NP dominates PP)

(10.1)

Para realizar a busca equivalente em XPath, a expresso de consulta utilizada foi:


(//NP[PP])

(10.2)

Para pesquisas com relao de irmandade, o Corpus Search utiliza a funo hasSister.
Para realizar uma busca de ns P que possuem ns irmos NP utilizando esta ferramenta, a
seguinte expresso foi utilizada no arquivo de consulta:
(P hasSister NP)

(10.3)

A busca equivalente na linguagem XPath foi feita da seguinte maneira:


//P/following-sibling::NP|NP/following-sibling::P

(10.4)

11. Anlise do uso de XML/XPath para anotao e buscas sintticas


Um esquema de anotao sinttica utilizando XML traz a vantagem de utilizar um
padro aberto para interoperabilidade e intercmbio de dados. Utilizando formatos especficos
para o esquema de anotao sinttica, as tecnologias para recuperao da informao
dificilmente so reutilizadas. Para cada tipo de anotao, so necessrias ferramentas de
busca restritas quela anotao em questo.
Para avaliar o uso do Corpus Search e da linguagem XPath como ferramentas de
busca, a anlise pode ser feita sob diversas perspectivas, tanto nos aspectos tecnolgicos,
quanto na utilizao por usurios finais.

Cristiane Namiuti-Temponi, Aline Silva Costa; p. 82-103.

98

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Considerando linguistas como usurios finais de tais ferramentas 10, o Corpus Search
possui uma linguagem mais simples e mais fcil de aprender que XPath. Como o Corpus
Search especfico para buscas sintticas, os comandos foram projetados para este fim,
trazendo assim mais simplicidade se comparado XPath. Para pesquisar uma relao de Ccomando, por exemplo, o Corpus Search possui a funo ccomands. Na linguagem XPath
seria necessria a combinao de vrias expresses utilizando-se de operadores para realizar a
busca equivalente. A linguagem XPath no destinada ao uso por usurios leigos em
programao de computadores. Ainda assim, o uso do Corpus Search tambm requer
aprendizado de sua linguagem especfica, alm de requerer que o usurio final saiba trabalhar
com linhas de comando, instalao e configurao da mquina virtual Java (JVM), no
podendo ser um usurio totalmente leigo.
Se considerarmos a existncia de uma aplicao intermediria que fornea uma
interface para realizao das buscas, a tecnologia utilizada para o usurio torna-se
transparente, uma vez que no ter conhecimento do que est realmente sendo utilizado na
busca, se Corpus Search, XPath ou qualquer outra tecnologia. A comparao neste caso,
dever ser feita apenas tratando aspectos tecnolgicos sob o ponto de vista do desenvolvedor
da aplicao, como facilidade de implementao e esforo exigido de programao.
Em se tratando dos aspectos tecnolgicos, o uso do Corpus Search traz a vantagem de
trazer no arquivo de sada os resultados das buscas, com os trechos encontrados e as
estatsticas. Para buscas em XPath, os conjunto dos ns encontrados tambm retornado,
mas preciso que o desenvolvedor da aplicao implemente um tratamento deste resultado
para exibi-lo para o usurio final. De qualquer sorte, isto pode ser feito sem um exagerado
esforo de programao uma vez que as APIs para XML e XPath da linguagem Java
fornecem vrias funes para isso. Se for desejvel no mostrar para os usurios finais o
arquivo de sada do Corpus Search tal como exibido, tambm ser exigido um esforo de
programao para trat-lo a fim de apresentar as informaes de outra maneira. Se as buscas
so feitas em XML, haver maior flexibilidade ao desenvolvimento da aplicao para
exibio dos resultados da consulta. No Corpus Search, os resultados so restritos ao que
trazido no arquivo de sada.

10

Usurios finais usam a ferramenta diretamente, sem a existncia de um outro programa que disponibilize uma
interface para facilitar o uso

Cristiane Namiuti-Temponi, Aline Silva Costa; p. 82-103.

99

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Com o uso de XML em corpora digitais, as buscas sintticas tornam-se independentes


de tecnologia especfica, passando a utilizar tecnologias padro. Em se tratando do corpus
DOViC, a vantagem a reaplicao da mesma tecnologia que ser utilizada para as pesquisas
morfolgicas. Como a anotao morfolgica e de edies dos textos do corpus j feita em
XML, as buscas nestes arquivos tero que ser feitas obrigatoriamente utilizando tecnologias
para XML. Assim, a mesma tecnologia pode ento ser reutilizada, dispensando o uso do
Corpus Search.
A disponibilidade de uma vasta gama de implementaes para XML torna o acesso a
este formalismo mais fcil. Alm de XPath, existem outras linguagens de busca, como
XQuery, com mais poder e flexibilidade. Muitos SGBDs (Sistemas Gerenciadores de Bancos
de Dados) j implementam o suporte a XML e fornecem um mecanismo de processamento
das linguagens de consulta, como o banco de dados PostgreSQL.
As linguagens de consulta no so o nico mecanismo de recuperao de dados num
documento XML. As buscas podem ser realizadas utilizando-se apenas das APIs para XML,
que esto disponveis em diversas linguagens de programao, com variadas funes para
navegao na estrutura arbrea do arquivo XML. H tambm ferramentas de visualizao que
proporcionam uma viso geral da estrutura. O suporte a XML implementado pelos
navegadores em combinao com folhas de estilo podero ser utilizados para uma exibio
customizada da estrutura sinttica.
Outra vantagem importante de XML como formalismo de codificao para anotao
sinttica que a marcao XML altamente expansvel. Isto significa que diferentes nveis de
anotao podem ser combinados, como por exemplo o discurso e a sintaxe. O uso de XML
na anotao sinttica atravs da converso Penn TreeBank para XML pode dispensar o uso do
Corpus Search, mas ainda mantm a dependncia do parser que gera o arquivo PTB. Como a
XML j tem sido usada por diversos corpora, projetos futuros podem considerar o
desenvolvimento de um parser que j produza a estrutura sinttica em XML. De qualquer
sorte, o uso de XML para todas as representaes favorece a criao de recursos
padronizados, que podem ser reutilizados, facilitando assim a extrao de dados de corpora.
A disponibilidade de anotao usando um padro como XML se faz importante porque
tambm oferece independncia tecnolgica a outros grupos pesquisadores interessados no
corpus DOViC.

Cristiane Namiuti-Temponi, Aline Silva Costa; p. 82-103.

100

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

12. Concluso
O uso de XML para anotao sinttica evidenciou a vantagem de reutilizar a mesma
tecnologia j utilizada para anotaes morfolgica e de edies no corpus DOViC. Como
XML um padro, us-lo para todas as representaes nos textos do corpus favorece a
criao de recursos padronizados, permitindo reuso de tecnologia, oferecendo mais
flexibilidade para as buscas e exibio dos resultados, e independncia tecnolgica para
grupos de pesquisa interessados em estudo neste corpus.
Trabalhos futuros podero considerar o desenvolvimento ou emprego de um parser
que faa anotao da estrutura sinttica em XML, sem a necessidade de converso. Este
trabalho no considerou um novo esquema de anotao, como novos nomes de etiquetas,
definio de atributos, etc. Assim, um esquema completo de anotao tambm pode ser
desenvolvido, prevendo a sistematizao das anotaes de edies, morfologia, sintaxe e
discurso, baseando-se em padres existentes mas no deixando de atender s necessidades
especficas do corpus em questo.

Referncias
BUITELAAR, P.; DECLERCK, T.; SACALEANU, B.; VINTAR, S.; RAILEANU, D.;
CRISPI, C. A multilayered, XML-based approach to the integration of linguistic and semantic
annotations. In: EACL 2003 Workshop on language technology and the semantic web
(NLPXML03), 2003, Budapeste. Proceedings of EACL 2003 Workshop on Language
Technology and the Semantic Web (NLPXML03). Cunningham: EACL, 2003. Disponivel
em: <http://www.dfki.de/dfkibib/publications/docs/eacl03-xmlnlp.ps>. Acesso em: 23 set
2014.
CORPUS SEARCH. Corpus Search Users Guide. 2009. Disponvel em:
<http://corpussearch.sourceforge.net/CS-manual/Contents.html>. Acesso em: 25 jul 2013.
DEITEL, H.M.; DEITEL, P.J.; NIETO, T.M.; LIN, T.M.; SHADU, P.V. XML: Como
programar. Porto Alegre: Bookman, 2005.
IDE, N. Encoding Linguistic Corpora. In Proceedings of the Sixth Workshop on Very
Large Corpora, 1998.
IDE, N.; BONHOMME, P.; ROMARY, L. XCES: An XML-based Encoding Standard for
Linguistic Corpora. In: International language resources and evaluation conference, 2.,
2000, Atenas. Proceedings of the Second International Language Resources and Evaluation
Conference. Paris: European Language Resources Association, 2000.

Cristiane Namiuti-Temponi, Aline Silva Costa; p. 82-103.

101

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

IDE, N.; ROMARY, L.; DE LA CLERGERIE, E.. International standard for a linguistic
annotation framework. Journal of Natural Language Engineering, Cambridge, v. 10 n. 3-4,
pp. 307-326, Sept. 2004.
IMS (Institut fr Maschinelle Sprachverarbeitung). The TIGER-XML treebank encoding
format.
Disponvel
em:
<http://www.ims.unistuttgart.de/forschung/ressourcen/werkzeuge/TIGERSearch/doc/html/TigerXML.html>. [ca.
2002]. Acesso em: 08 out 2013.
LEZIUS, W.; MENGEL, A. An XML-based representation format for syntactically
annotated
corpora.
Disponvel
em:
<http://citeseerx.ist.psu.edu/viewdoc/download;jsessionid=14E13F7984717A2C1EB5E6CB0
39C4C92?doi=10.1.1.26.6389&rep=rep1&type=pdf>. 2000. Acesso em: 08 out 2013.
MARCUS, M.; TAYLOR, A.. The Penn TreeBank Project.
<http://www.cis.uPenn.edu/~TreeBank/> 2002. Acesso em: 14 out 2013.

Disponvel

em:

NAMIUTTI, C. (Coord.) Novos meios para antigas fontes: Sintaxe Diacrnica em corpus
eletrnico do portugus. Projeto de Pesquisa. UESB, Vitria da Conquista, 2010.
NAMIUTI, C. (Coord.); SANTOS, J. V. (Co-coordenador) Memria Conquistense:
implementao de um corpus digital. CNPq 485098/2013-0. UESB, Vitria da Conquista,
2013. (Projeto de Pesquisa).
ORACLE. JDK 1.1 for Solaris Developer's Guide. Java Programming Environment and the
Java Runtime Environment (JRE). 2010. Disponvel em: <http://docs.oracle.com/cd/E1945501/806-3461/6jck06gqd/index.html>.Acesso em: 14 out. 2013.
PAIXO DE SOUSA, M. C.; KEPLER, F. N.; FARIA, P. P. E-Dictor: Novas perspectivas na
codificao e edio de corpora de textos histricos. In: Tania Shepherd; Tony Berber
Sardinha; Marcia Veirano Pinto. (Org.). Caminhos da Lingustica de Corpus. Campinas:
Mercado de Letras, 2010.
PAIXO DE SOUSA, M.C. Memrias do Texto. Revista Texto Digital, n.2., 2006.
Disponvel em: <http://www.textodigital.ufsc.br/num02/paixao.htm>. Acesso em: 01 out
2012.
SANTORINI, B. Annotation manual for the Penn Historical Corpora and the PCEEC.
Disponvel em: <http://www.ling.uPenn.edu/hist-corpora/annotation/index.html>. 2010.
Acesso em: 08 out 2013.
SILVA FILHO, A. M. Programando com XML. Rio de Janeiro: Elsevier, 2004.
UNICAMP. Padres Rtmicos, Fixao de Parmetros & Mudana Lingustica. 1998.
Disponvel em:<http://www.tycho.iel.unicamp.br/~tycho/prfpml/fase2/index.html> Acesso
em: 31 jul. 2014.

Cristiane Namiuti-Temponi, Aline Silva Costa; p. 82-103.

102

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

______. Corpus do Portugus Histrico Tycho Brahe. Manual de Preparao dos Textos.
Sistema de Edies Eletrnicas do corpus Tycho Brahe. Campinas, 2007. Disponvel em: <
http://www.tycho.iel.unicamp.br/~tycho/corpus/manual/prep/manual_frameset.html>. Acesso
em: 5 ago 2014.
W3C. XML Technology. 2010. Disponvel em: < http://www.w3.org/standards/xml/>
Acesso em 08 de outubro de 2013.
W3C.
XML
Path
Language
(XPath).
1999.
<http://www.w3.org/TR/XPath/>. Acesso em 08 de outubro de 2013.

Disponvel

em:

YAO, X.; BORISOVA, I.; ALAM, M. PDTB XML: the XMLization of the Penn
Discourse
TreeBank
2.0.
2010.
Disponvel
em:
<http://www.lrecconf.org/proceedings/lrec2010/summaries/336.html>. Acesso em: 12 out 2013.

Artigo recebido em: 30.09.2014


Artigo aprovado em: 23.11.2014

Cristiane Namiuti-Temponi, Aline Silva Costa; p. 82-103.

103

Epistemic modality through the use of adverbs: a corpus-based study


on learners' written discourse
Modalidade epistmica por meio do uso de advrbios: um estudo baseado em corpora
sobre o discurso escrito de aprendizes
Adriana Tenuta*
Ana Larissa A. M. Oliveira**
Brbara Malveira Orfan ***
ABSTRACT: This paper discusses the
grammatical category of modality and the
variety of linguistic resources available for
the expression of it, and presents a research
that aimed at analyzing the expression of
modality through the use of adverbs in
academic writing. More specifically, the
study presented investigated how Brazilian
learners of English express modality through
adverbs in their academic essays. Two
corpora were used: a sub-corpus taken from
the corpus of Brazilian Learners of English
(CABrI) and another sub-corpus taken from
the Louvain corpus of Native English Essays
(LOCNESS). The prevalent adverbial items
found in both corpora were identified and
described, using corpus Linguistics tools.
The analysis conducted revealed the rigidity
of the expression of modality through
adverbs in the learners written discourse as
opposed to a more varied way of this
expression in the native speakers data. This
paper also discusses the way native speakers
and learners differ in their written production
and the possible pedagogical implications of
these findings.

RESUMO: Este artigo discute a categoria


gramatical da modalidade e a variedade de
recursos lingusticos disponveis para a
expresso desta. O artigo apresenta uma
pesquisa que teve como objetivo analisar a
expresso da modalidade por meio do uso de
advrbios na escrita de aprendizes. Mais
especificamente, o estudo apresentado
investigou como aprendizes brasileiros de
Ingls expressam modalidade por meio de
advrbios em redaes produzidas em
ambiente acadmico. Foram utilizados dois
corpora: um sub-corpus, retirado do corpus
de Aprendizes Brasileiros de Ingls (Cabri) e
outro sub-corpus, retirado do corpus Louvain
de Redaes em Ingls escritas por nativos
(LOCNESS). Os itens adverbiais prevalentes
em ambos os corpora foram identificados e
descritos, usando ferramentas de Lingustica
de corpus. A anlise realizada revelou a
rigidez da expresso da modalidade por meio
de advrbios na escrita dos aprendizes, bem
como uma forma mais variada desta
expresso nos dados de falantes nativos. Este
artigo discute, ainda, a forma como os
falantes nativos e os aprendizes diferem em
sua produo escrita e as possveis
implicaes pedaggicas desses resultados.

KEYWORDS: Corpora. Modality. Adverbs.


Syntax. Learners writing.

PALAVRAS-CHAVE:
Corpora.
Modalidade. Advrbios. Sintaxe. Escrita de
aprendizes.

Universidade Federal de Minas Gerais.


Universidade Federal de Minas Gerais.
***
Universidade Federal de So Joo del Rei.
**

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

1. Introduction
This paper reports on a study that investigated, using corpora, how Brazilian learners
of English express modality through adverbs in the production of essays. Corpus-based
studies on learners production of written discourse have caught the attention of many
researchers from different domains. Despite the difficulties in compiling and analyzing
students production, recent findings have contributed to the understanding of these students'
interlanguage by identifying linguistic features that are prevalent in their discourse
(BERBER-SARDINHA; SHEPERD, 2008; DUTRA, 2009).
Following the Hallidayan model (HALLIDAY, 2004), modality conveys stance and
attitude of the sender of a message. In this study, then, we use a learners corpus, aiming at
identifying how Brazilian learners of English express stance and attitude by employing
modality elements containing an adverb in their academic writing. We shall compare their
production to that of native speakers of English in the same setting, that is, in the academic
writing scenario. By identifying the most used adverbs in the expression of modality in
learners essays, we may have a better account of these speakers' expressions of stance and
attitude. For that purpose, two corpora were investigated: our reference corpus, CABrI
(Corpus of Brazilian English Learners, in construction BERBER-SARDINHA, 2001;
DUTRA, 2009), and LOCNESS (Louvain Corpus of Native English Essays - GRANGER;
DAGNEAUX; MEUNIER; PAQUOT, 2009). We believe that such an approach to the study
of modality in English can contribute to the emerging area of corpora as well as to the study
of syntax.
The structure of this paper is the following: introduction, literature review and
theoretical framework, analysis, and conclusion.
2. Theoretical framework
For a better understanding of how modality is conceptualized, we have structured the
theoretical framework as follows: (1) outlining the main characteristics of modality, (2)
describing the realization of modality in English and (3) discussing the interface between
corpora and grammar in academic writing by reviewing previous research in the area.

Barbara Malveira Orfano, Ana Larissa Adorno, Adriana Tenuta; p. 104-121.

105

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

2.1 The Expression of modal values in English


Mood and other modality resources are means for the expression of the speakers
attitude or commitment regarding the content of a proposition (PALMER, 1974). According
to Palmer, mood is realized by verbal morphology, whereas modality is a feature related to a
variety of linguistic phenomena, as described by Downing and Locke (2006), among which
modal verbs play a central role. Modality is to be understood as a grammatical category that
covers notions such as possibility, probability, necessity, volition, obligation and permission.
Modality, therefore, can be connected to basic logical meanings, categorized under a
few types: (a) epistemic, (b) deontic and (c) dynamic (DOWNING; LOCKE, 2006), of which
the first two (epistemic and deontic) are the central ones.
Epistemic modality is the expression of the various degrees of certainty/uncertainty
about facts, events, situations, and, thus, it is related to limitations on the speakers knowledge
about these same facts, events, situations. Consequently, epistemic modality refers to
meanings related to inference, prediction, expectation, and probability (BIBER: 1999;
DOWNING; LOCKE, 2006). Epistemic modality expressed through different means is
illustrated below:
1. It might rain tomorrow. (modality realized by a modal verb)
I expect that he be happy. (modality realized by expect + an embedded clause in
the subjunctive)
Its very unlikely that they will accept our offer. (modality realized by an adverb)
Deontic modality, on the other hand, refers to meanings such as permission and
obligation of various kinds, ranging from very strong to a milder obligation. Thus, deontic
modality, differently from epistemic, is, associated with authority and judgment, rather than
with knowledge or prediction. For this reason, deontic modality comprises language resources
used to influence people to do (or not to do) things, whereas epistemic modality is used to
express what speakers think is likely to happen.
In spite of the fact that epistemic and deontic meanings are different, the same modal
verbs can be used in the expression of one or the other, depending on the context given.
2. It must have been him. (epistemic)
You must leave now. (deontic)

Barbara Malveira Orfano, Ana Larissa Adorno, Adriana Tenuta; p. 104-121.

106

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Additionally, on many occasions, it is necessary to consider the context of use for the
precise interpretation of modality meanings. This is the case of the example below, in which
must can express either the epistemic meaning of prediction or possibility (contextualized as:
I assume you are patient, given certain evidences) or the deontic meaning of obligation or
necessity (contextualized as: there is a need for you to be very patient, according to my
understanding of the situation).
3. You must be very patient.
Although modality is centrally related to epistemic or deontic meanings, as we have
stated, there are also other kinds of meanings associated with modality, all of them, however,
play a more peripheral role in syntax and are grouped under the label dynamic.
These dynamic meanings are described as ability and courage (DOWNING; LOCKE,
2006) and ability, volition and courage (HUDDLESTON; PULLUM, 2005). They are often
expressed by modal verbs, like can and will, and by semi-modals, like dare.
Some examples of dynamic modality are displayed below:
4. I can speak Spanish. (ability)
I daren' t say this. (courage)
In certain cases, we can interpret the same occurrence as dynamic and as epistemic,
since both types of meanings can be identified in the occurrence:
5. You can 't be right. (probability and/or ability)
She can play the piano. (possibility and/or ability)
I can speak four languages. (possibility and/or ability)
Modality also conveys meanings related to the concept of remoteness, illustrated in the
examples below by Huddleston and Pullum (2005).
6. If she liked the place, she would have stayed. (remote)
There are authors that group modality meanings differently. Biber (1999), in this
corpus-based reference grammar, identifies three categories of modal verbs: (a)
permission/possibility/ability - can, could, may, might; (b) obligation/necessity - must, should,
(had) better, have (got) to, need to, ought to, be supposed to; and (c) volition/prediction - will,

Barbara Malveira Orfano, Ana Larissa Adorno, Adriana Tenuta; p. 104-121.

107

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

would, shall, be going to. This categorization does not correspond exactly to the distinction
deontic/epistemic adopted in this work.
From the perspective of Biber (1999), modals are divided into three groups, namely,
modals, marginal auxiliary verbs and semi-modals. The first group encompasses can, could,
may, might, shall, should, will, would and must. These modals have a number of specific
features, such as (a) being invariant forms, (b) preceding the subject in yes-no questions and
(c) being followed by a verb in the bare infinitive. Marginal auxiliary verbs correspond to
need (to), ought to, dare (to) and used to. According to Biber (1999), these marginal auxiliary
verbs are rare and occur almost only in British English. Fixed idiomatic phrases, such as (had)
better, have to, (have) got to, be supposed to and be going to, are called semi-modals by Biber
(1999). Semi-modals differ from central modals because they can be marked for both tense
and person. Besides, they can also occur as non-finite forms.
Taking a multi-dimensional feature of modality into account, Carter and McCarthy
(2006) state that the best candidates for modality meanings is the closed class of modal verbs,
but the 'list' contains others, which are very high in frequency and carry related meanings.
These include lexical modals, such as the verbs look, seem and sound; the adjectives possible
and certain, and the adverbs maybe, probably, definitely, apparently, and possibly. The
authors also suggest that the domain of modality needs to be expanded beyond the closed
class of modal verbs, which is not a new idea, and they provide compelling evidence of the
ubiquity of modality items in everyday spoken and written discourse.
The varied expression of modality is presented below, based on Downing and Locke
(2006), considering two basic situations: modality expressed in the verb group and expressed
elsewhere in the clause
When expressed in the VG, modality can be realized by:

The modal verbs may, might, should, must, can, would, will, ought to, shall,
could, need; the semi-modals (modals in certain uses): need, dare, wish

The lexical auxiliaries (chain-like structures with primary verbs be and have):
be able to, be apt to, be due to, be going to, be liable to, be likely to, be certain
to, be sure to, be to, be unlikely to, be supposed to, have to, have got to, had
better, would rather, would sooner.

The phased structures composed of: need, want, regret, try, manage, hesitate,
happen, chance, tend, seem, appear, pretend (in any tense) + a V in -ing or

Barbara Malveira Orfano, Ana Larissa Adorno, Adriana Tenuta; p. 104-121.

108

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

infinitive; subjunctive forms in embedded clauses, introduced by verbs such as:


expect, suppose, recommend, require, request, suspect, intend, think, guess,
assume.

The lexical verbs such as allow, beg, command, forbid, guarantee, guess,
promise, suggest, warn..

The imperative forms.

The past tense to indicate remoteness from reality, as in I thought Id go along


with you, if you dont mind; and conditional structures, as in If you went, I
would go too.

Modality expressed elsewhere in the clause, may be found in adverbs and sentence
modifiers: maybe, supposedly, perhaps, possibly; predicate adjectives: possible, impossible,
likely, conceivable, doubtful, certain, sure, positive and nouns such as possibility, probability,
chance, likelihood.
In contrast with modal verbs, adverbs, which are the focus of this study, are numerous
in the area of certainty expression. According to Chafe (1986), all adverbs can be considered
evidential1 and can be classified along dimensions such as reliability and degree of
expectation. Certainly, for example, indicates that the speaker expresses his or her assessment
of the proposition. Obviously and clearly could be classified as markers of induction and of
courses expresses that something is in line with expectations.
Modality can also be expressed in different points of the clause, concomitantly.
Downing and Locke (2006) refer to this realization as modal harmony. According to them,
modal harmony can be illustrated by the following example:
7. I doubt she could possibly have said that.
2.2 Corpora and grammar
The study of grammar is relatively recent in Corpus Linguistics, since the lexicon used
to be the unit of investigation by excellence in early corpora studies. However, advances in
1

In a broad definition of evidentiality, epistemic modality is a subcategory of evidentiality, which is


neither marked for the mode of knowing nor for the source of knowledge and therefore is distinct from
evidentiality in a narrow sense. In English, all evidential adverbs are modal.

Barbara Malveira Orfano, Ana Larissa Adorno, Adriana Tenuta; p. 104-121.

109

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

automatic tagging and parsing, as well as the appearance of reasonably sized corpora
containing detailed grammatical annotation have progressively enabled corpus linguists to
shift their attention towards genuinely grammatical issues.
Fulfilling the main objective of this paper, we shall discuss relevant corpus based
research in academic writing.
2.3 Empiric research on academic writing and modality from a Corpus Linguistics
perspective
In the past few years, research on academic discourse has flourished promoting an
interesting debate on the language of higher education. Many studies have concentrated on
different aspects of how both native speakers and non-native speakers organize their essays.
Following a topic-oriented approach to academic writing, Hinkel (1995) showed how
topics could influence the use and distribution of certain modal expressions in learners
production. In essays written in the discipline of Education, Chinese, Japanese and
Vietnamese learners overused must and should. Native speakers, on the other hand, did not
employ must when talking about political and educational issues. Hoye (1997) conducted an
experiment with Spanish learners of English and native speakers of English on how modal
values are expressed in English. The author designed a series of tests in which the participants
were required to fill in gaps in a text with modals and/or adverbs. He observed that learners
had trouble combining modal and adverbs to express attitude. Learners did not perceive the
combinatory potential of modal expressions, which in turn hindered their performance in
academic writing.
Biber (1999, 2001, and 2004) has contributed immensely to our understanding of
academic discourse. Following a frequency-driven approach, Biber and his colleagues
identified the most frequent bundles in academic discourse mainly describing their
grammatical characteristics.
Hyland (2008) explores the structure and function of four word-bundles in a corpus of
academic discourse. The data for his study consists of three corpora (research articles,
doctoral thesis and masters dissertations) comprising 3.5 million words. The author suggests
that the presence of certain bundles, for example, as a result of can help identify different text
genres. The results indicated that students draw on different resources to develop their
arguments. There were fewer lexical bundles in doctoral thesis, while in masters

Barbara Malveira Orfano, Ana Larissa Adorno, Adriana Tenuta; p. 104-121.

110

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

dissertations, a greater number of bundles were found. This might be an indication that less
proficient students rely more on formulaic expressions due to restrict vocabulary.
In another study, focusing on the field of second language academic writing, Hyland
and Milton (2010) show how L2 writers differ significantly from native speakers in that the
former group relies on a more limited range of items, offering stronger commitments, and
exhibiting greater problems in conveying a precise degree of certainty. The authors also found
that, in comparison to the L1 writers, the L2 writers rely on a more limited range of
grammatical resources, including particular modal verbs and the expression I think. The
authors posit that this distinction may be a consequence of non-native speakers limited
language repertoire, which does not enable them to adjust different levels of stance when
building up their writing.
In a similar direction and adopting a frequency-driven approach, Chen and Baker
(2010) identify the most frequent lexical bundles in three corpora: a) a sub-corpus from FLOB
(academic prose section), b) BAWE-CH (Chinese students of English), and c) BAWE- EN
(English students). Their comparative study showed that there are differences and similarities
between native speaker and learner academic writing. The use of lexical bundles in non-native
and native student essays, for example, is very similar: from a structural point of view, they
both have more verb phrase based bundles and discourse organizers than native expert writing
whereas native professional writers exhibit a wider range of noun phrase based bundles and
referential markers.
Following a pragmatic-functional approach, Simpson-Vlach and Ellis (2010) also
looked at the most common lexical bundles in academic discourse, focusing on both oral and
written corpora. They used the Michigan Corpus of Academic Spoken English (MICASE)
and the oral academic part of the British National Corpus (BNC) also including in their
research the Hyland Corpus (2004) and the written BNC files of various academic subjects.
They extracted three and four word n-grams and had ESP instructors judge if the lexical
bundles were chunks, if they had a function or if they were expressions that were worth
teaching. As a result, they proposed the Academic Formulas List (AFL) with 435 lexical
bundles distributed in 18 subcategories. However, research on the expression of modality in
academic writing is scarce: the next paragraphs will outline previous studies in the area that
prove to be significant to our analysis.

Barbara Malveira Orfano, Ana Larissa Adorno, Adriana Tenuta; p. 104-121.

111

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

3. Data and Methodology


As we have already mentioned, this study uses two corpora: a sub-corpus taken from
the corpus of Brazilian Learners of English (CABrI) and another sub-corpus taken from the
Louvain Corpus of Native English Essays (LOCNESS). To CABrI is composed of academic
essays written by advanced undergraduate students (B1 to C1 according to the Common
European Framework) from the Language Course at Universidade Federal de Minas Gerais.
Students from the Liberal Arts course are asked to write argumentative essays ranging from
300 to 500 hundred words. Students have to choose from 13 different titles such as Crime
does not pay and Feminists have done more harm to the cause of women than good to write
their essays. Learners writings are converted to text files and stored, so corpus
methodological tools can be employed for analysis. The texts chosen to compose the subcorpus belong to the American argumentative section. In total, the LOCNESS sub-corpus
used in this study contains 60,241 words. Now, CABrI contains around 36,187 words. The
Louvain Corpus of Native English Essays (LOCNESS) presents essays written by American
and British speakers, ranging from academic to literary texts.
For this analysis, first, word lists (frequency lists) were generated and adverbs with the
potential to function as modal items were isolated. This procedure, according to O'Keeffe,
McCarthy and Carter (2007), proves to be essential in identifying the core vocabulary of
English, and it is considered a good resource for pedagogical purposes, which is one of the
aims of this study. Comparing frequency lists is, then, an appropriate starting point; however,
relying only on frequency lists would not be sufficient. For that reason, in order to get a better
notion of the pragmatic function of the adverbs involved in the construction of modality in the
essays under investigation, the next step was to compile lexical bundle lists containing an
adverb with a modal function. After identifying the most common items in this list,
concordance lines were analyzed so that the bundles containing modality adverb could be
observed in their particular contexts through manual search of the data.
4. Analysis
We started analyzing the most frequent adverbs found in the learner corpus in order to
verify their function in the data. These results are presented in the table below.

Barbara Malveira Orfano, Ana Larissa Adorno, Adriana Tenuta; p. 104-121.

112

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Table 1- Most frequent adverbs found in CABrI

Item
probably
certainly
maybe
likely
simply
unfortunately
actually
Total

Raw Freq.
13
9
9
9
7
5
5
44

Freq. per million words


472
326
326
326
254
181
181
1,594

As the main aim of this paper is to compare learners' data with native speakers'
production, we shall analyze LOCNESS for corresponding results. In table 2, then, we present
the most frequent adverbs found in LOCNESS.
Table 2- Most frequent adverbs found in LOCNESS

Items
likely
certainly
probably
perhaps
surely
possibly
maybe
unlikely
Total

Raw Freq.
27
19
17
16
13
12
11
7
122

Freq. per million words


448
315
282
265
215
199
182
116
1,952

Confronting tables 1 and 2, we observe that native speakers seem to use more adverbs
than non-native speakers do. In addition, when analyzing the frequency of adverbs in each
group, we can observe that the native speakers' use of adverbs is more evenly distributed than
that of learners. This first finding is in line with Holmes (1998), is that it provides evidence of
a more balanced use of linguistic resources by native speakers to express modality.
Throughout this paper, we will make the case that learners tend to use a more fixed set of
expressions to convey modality. In table 3, we contrast the adverbs found in both corpora,
aiming to determine differences and/or similarities in them.

Barbara Malveira Orfano, Ana Larissa Adorno, Adriana Tenuta; p. 104-121.

113

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Table 3- Distribution of adverbs in the two corpora (raw results)

Items
Likely
Certainly
Probably
Perhaps
Surely
Possibly
Maybe
Unlikely

LOCNESS
27
19
17
16
13
12
11
7

CABrI
9
9
13
4
1
0
9
0

Complementing the quantitative analysis, we also submitted the data to statistic tests,
believing that they would strengthen the argument that there is a striking difference between
native speaker and learner corpora in the use of adverbs expressing modality. This difference
is outlined in table 4.
Table 4 - Expected contingency table between both corpora

Adverbs
Likely
Certainly
Probably
Perhaps
Surely
Possibly
Maybe
Unlikely

NS
26.3
20.5
21.9
14.6
10.2
8.77
14.6
5.11

NNS
9.70
7.54
8.08
5.39
3.77
3.23
5.39
1.89

Chi-square = 18.1
degrees of freedom = 7
probability = 0.011

Based on the results of the statistical test, we can affirm that the difference in the use
of adverbs in the corpora analyzed is significant. The fact that the p value is zero reinforces
the claim that there is a striking difference between the corpora analyzed, as the results of the
chi square (chi square = 18.1) have proved. From this preliminary analysis, one can speculate
that the use of adverbs to express modality is underrepresented in learners academic essays,
as stated in a research carried out by Tenuta, Oliveira, Orfan (in press), which has shown
that Brazilian learners rely on a rigid set of verbs to express modal values. However, the
analysis proposed here intends to go beyond stating statistical differences. In fact, it aims at
understanding the linguistic features that make up for these differences and their implications

Barbara Malveira Orfano, Ana Larissa Adorno, Adriana Tenuta; p. 104-121.

114

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

for the learners written discourse production. In order to do so, at this point of the analysis,
we shall concentrate on the most common bundles containing an adverb in CABrI and
LOCNESS. The following table shows this distribution in both corpora.
Table 5- Distribution of bundles containing an adverb in the data

Bundles

CABrIfreq
likely to
9
Almost certainly 0
certainly not
0
will probably 9
would probably 0

raw Freq. per m words LOCNESS-raw


frequency
33
16
0
4
0
4
32
0
0
6

Freq.
words
265
66
66
0
99

per

Submitting the data to a chi-square test, we found that the difference between the
corpora is significant, as illustrated below. Observing the p value from the results from table
6, one can verify that when looking, in particular, at bundles containing an adverb, the
difference between the two corpora is significant. The items were analyzed and compared
with results from LOCNESS as follows:
Table 6 - Expected contingency table

Bundles
Likely to
almost certainly
certainly not
will probably
Would probably

CABrI
9.38
1.50
1.50
3.38
2.25

LOCNESS
15.6
2.50
2.50
5.62
3.75

Chi-square = 23.4
degrees of freedom = 4
probability = 0.000

After identifying the most common bundles in both corpora, we focused on the
analysis of each bundle independently. In CABrI, there are only two bundles being used,
whereas in LOCNESS, we found four bundles. This fact reinforces the claim that native
speakers express modality not only by using different adverbs, but also by combining them in
different bundles. The only two bundles used by learners in the corpus analyzed were likely to
and will probably.

Barbara Malveira Orfano, Ana Larissa Adorno, Adriana Tenuta; p. 104-121.

115

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

4.1 Likely to
There are 33 occurrences of the bundle in CABrI and 265 in LOCNESS. This
difference was expected since, as previously mentioned, there is lower frequency of adverbs
expressing modality in the learners productions. We considered important to speculate on
this situation focusing on the learners written discourse, bearing in mind that frequency
differences between two datasets can indicate either overuse or underuse of linguistic features,
which poses interesting pedagogical issues involving the teaching and learning of English.
Extract 1 - Example of likely to from LOCNESS2
Now that rail privatisation has gone ahead, many people are likely to lose faith in
trains, due to the percieved inefficiency of the operators (for example the timetable book full of errors or the recent survey in Which? magazine about
overcharging). Fares are likely to increase, and many rural lines that used to be
subsidised by the government face closure.
Fig. 1 shows concordance lines for the bundle likely to in CABrI. In all examples, it is
possible to see that the epistemic use is prevalent, which might be due to the text genre in
focus. In texts of this genre, the writer, very frequently, has to commit him/herself, in
different degrees, to the certainty of occurrence of a fact.

N
1
2
3
4
5
6
7
8
9
10

ished severely and consequently they are more


country side towns around Brazil we are very
by creating artificial dreams, graduates are
This kind of proficiency is more
This kind of proficiency is more
arget our limited resources for programs most
Not
y and dreams be profitable, but they are also
ot prepare graduate students to what they are
nt agencies show that such tragedies are more

likely
likely
likely
likely
likely
likely
likely
likely
likely
likely

to
to
to
to
to
to
to
to
to
to

commit crimes again.


find a huge number of
be shocked or unsure in
be developed if one
be developed if one
reduce recidivism and
happen.
be crucial ways to make
face in real life.
occur to young adults

Fig. 1- Concordance lines for the bundle likely to in CABrI.

The function of this bundle is similar in both corpora; however, the frequency is
significantly higher in the native speaker corpus. Likely to is the bundle containing an adverb
preferred by native speakers to express possibility/probability, while English learners
expressed possibility/probability by using the bundle will probably.

2 All extracts from the learner corpus have been preserved as written by students. Hence, corrections by any type
are not included in this study.

Barbara Malveira Orfano, Ana Larissa Adorno, Adriana Tenuta; p. 104-121.

116

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

The low frequency of modal adverbs in the learners academic writing was previously
acknowledged by Tenuta, Orfan, Oliveira (in press). The authors showed that learners
seemed to rely on modal verbs to express epistemic modality. However, in the corpus
investigated, learners used a very narrow range of modal verbs with epistemic meaning, for
example, mainly can and will. In this regard, the findings revealed that the distribution of
modals in the native corpus was more varied, since native speakers employed, for example,
should, could and would.
4.2 Will probably
This bundle follows the pattern will probably + verb.3 We tend to conclude that the
bundle will probably might be more easily accessed by learners, becoming active in discourse
through less mental effort (CHAFE: 1994), mainly because will probably is lexically and
structurally closer to the Portuguese language. In this study, learners used will probably three
times more than native speakers did.
Extract 2- Example from CABrI
There will probably be many reasons for dreaming and three possible - and
believable ones could be its profitability (for the enterprises which provide
entertainment, for example), its help in making us stand and try to change our
stressful reality, and the health benefits it provides us. Oddly enough, imagining
can make a big profit from generating and selling brilliant ideas.
N
1
2
3
4
5
6
7
8
9

Concordance
is. All you have to do is read and read. In fact, you
e she does not recognize. As for Dees sister, she
he references (authors, books, concepts, etc) that
e way she could free herself from her family. They
no chance to see in loco how things really work, it
e inhabit a modern and industrialised world. There
ity degrees, such as philosophy and anthropology,
ity degrees, such as philosophy and anthropology,
er mother, Dee is not the same anymore and they

will
will
will
will
will
will
will
will
will

probably
probably
probably
probably
probably
probably
probably
probably
probably

get all
feel
help
go along
be very
be many
have
have
be apart

Fig. 2- Concordance lines for the bundle will probably in CABrI

In the next sections, we analyzed the bundles found in LOCNESS.

We also observed that there was a high frequency in the use of will probably + a linking verb, since a third of
the occurrences with the bundle will probably followed this pattern. This finding will be further investigated.

Barbara Malveira Orfano, Ana Larissa Adorno, Adriana Tenuta; p. 104-121.

117

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

4.3 Would probably


The use of the bundle would probably in LOCNESS might reflect a feature more
closely related to formal register, considered adequate to the essay genre. We might speculate
that learners do not use it because they might not be very proficient in the use of linguistic
features that would enable them to express a degree of both certainty and formality in written
discourse, as seen in the concordance lines below. We could argue that the bundle has a
twofold discursive function, which was employed by native speakers and ignored by learners
in the corpora analyzed.
Extract 3- Example of would probably from LOCNESS
If boxing was made illegal, then the sport would still take place, but it would not
be under the control of doctors or referees and there would be no proper
association to represent rules and regulations. It would probably become even
more dangerous. Of course there are advantages banning the sport but they are
very small compared to the disadvantages.
1
2
3
4
5
6

By banning fox hunting the law


ulations showed that charities
primary school and her mother
It
everal thousands of pounds and
were the highest bider as they

would
would
would
would
would
would

probably
probably
probably
probably
probably
probably

drive the spor


lose out, coll
die while the
become even mo
have to sell u
hide it as it

Fig. 3- Concordance lines for the bundle would probably in LOCNESS.

5. Conclusion
In this study, we analyzed epistemic modality, which was a major feature in academic
essays of both native speakers and learners of English. The choice for epistemic modality is
justified by to the fact that this text genre favors this kind of modal expression, used to
mitigate the level of commitment of the speaker to the certainty of the facts being stated.
Our findings indicate that the expression of epistemic modality in the native speakers
written production of academic essays, referring to, specifically, the use of adverbs, seems to
be more varied than in the learners production. This can be evidenced, for example, by the
non-use, from the part of learners, of expressions such as like likely to, which proved to be
widely used by native speakers. On the same token, the data analyzed show that the learners'
preferred expression, including adverb to express epistemic modality was will probably.
These findings strengthen the argument that teachers and material developers should
introduce students to a more varied set of vocabulary as well as structural choices, so that

Barbara Malveira Orfano, Ana Larissa Adorno, Adriana Tenuta; p. 104-121.

118

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

their writing skills can be improved towards the production of texts which are better
elaborated and more responsive to the grammatical and semantic, but also to the pragmatic
demands of genre.
Another important remark about the learners written production concerns the fact
that, in this study, learners seemed to ignore the form would probably, which is highly used
by native speakers as a way to express remoteness and little commitment to the certainty of
facts. This finding also supports the claim that learners tend to rely on a very rigid set of
structures to realize modality. It also poses the issue of the role of language instruction and
material design to raise students' awareness of how they can structure their discourse in order
to comply successfully with the requirements of academic writing.
We would also like to comment on the importance of analyzing empirical language
data for a broader understanding of how native speakers and learners can differ in their
production and, if that is the case, decide on the best teaching strategies to help learners write
more fluently and effectively.
Also, from a pedagogical perspective, research studies like the one conducted by
Holmes (1998) have shown that, in general, the use of modality in English has been
underrepresented in teaching materials, since this grammatical category is often dealt with
through the restricted use of modal verbs. The present study argues along the same lines, as it
also shows that students seem to rely on modal verbs instead of using a variety of modal
forms, which is present in the native speakers production.
Finally, we consider it is important that instructors provide students with opportunities
to engage in reflection on their own stance, using strategies while writing, as it has also been
postulated by Silver (2013), from a critical perspective.

References
BERBER SARDINHA, A.P. O corpus de aprendizes Br-ICLE. Intercmbio, v.10, 2001, p.
227-239.
BERBER SARDINHA, A. P. Lingustica de Corpus. Barueri: Manole, 004.
BERBER SARDINHA, A. P.; SHEPERD, T. An online system for error identification in
Brazilian learner English. Anais do 8th Teaching and Language Corpora Conference.
Lisboa: Associao de Estudos e de Investigao Cientfica do ISLA-Lisboa, 2008, p. 257262.

Barbara Malveira Orfano, Ana Larissa Adorno, Adriana Tenuta; p. 104-121.

119

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

BIBER, D. et al. Longman Grammar of Spoken and Written English, 1999.


BIBER, D. Stance in spoken and written university registers. Journal of English for
Academic Purposes, 5, 2006, 97116.
http://dx.doi.org/10.1016/j.jeap.2006.05.001
BIBER, D.; CONRAD, S.; LEECH, G. Longman Student Grammar of Spoken and
Written English. Essex: Longman, 2002.
CHAFE, W. The nature of consciousness. In: Discourse, consciousness and time. Chicago &
London: The University of Chicago Press, 1994, pp. 26-40.
DOWNING, A.; LOCKE, P. English Grammar: a University Course. New York: Routledge,
2006, second edition
DUTRA, D. P. Conscientizao lingustica atravs de corpora online. Caderno de resumos
do 17 INPLA. So Paulo: PUC-SP, 2009, p. 62.
DUTRA S.; DAGNEAUX, E.; MEUNIER, F.; PAQUOT, M. International corpus of
Learner English-Version2. Louvain-La-Neuve: UCL Presses Universitaires de Louvain,
2009.
HALLIDAY, M. A. K.; HASAN, R. Cohesion in English. London: Longman, 1976.
HALLIDAY, M. A. K. An Introduction To Functional Grammar. London: Hodder Arnold
Publication, Revised Edition, 2004.
HOLMES, R. Genre analysis, and the social sciences: An investigation of the structure of
research article discussion sections in three disciplines. In English for Specific Purposes,
2007, 16: 321-3.
http://dx.doi.org/10.1016/S0889-4906(96)00038-5
HOYE, L. Adverbs and Modality in English. London & New York: Longman, 1997.
HYLAND, K.; MILTON, J. Qualifications and certainty in L1 and L2 students writing.
Journal of Second Language Writing, 6(2), 1997, pp. 183-205.
http://dx.doi.org/10.1016/S1060-3743(97)90033-3
OKEEFFE, A.; MCCARTHY, M.; CARTER, R. From corpus to classroom: Language use
and language teaching. Randi Reppen, Northern Arizona University, 2007.
http://dx.doi.org/10.1017/CBO9780511497650
PALMER, F. R. The English verb. London: Longman, 1974.
SILVER, M. The stance of stance: a critical look at ways stance is expressed and modeled in
academic discourse. Journal of English for Academic Purposes, 2003, vol. 2, issue 4: 359374.
http://dx.doi.org/10.1016/S1475-1585(03)00051-1
TENUTA, A. M. Tempo, modo e aspecto verbal na estruturao do discurso narrativo.
Dissertao (Mestrado em Lingustica). Belo Horizonte: UFMG, 1992.

Barbara Malveira Orfano, Ana Larissa Adorno, Adriana Tenuta; p. 104-121.

120

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

TENUTA, A. M. A., OLIVEIRA, A. L. A. M., ORFAN B. M.


How Brazilian learners express modality in their writing: a corpus-based study on lexical
bundles. So Paulo: Revista Intercmbio, no prelo.

Artigo recebido em: 07.10.2014


Artigo aprovado em: 11.12.2014

Barbara Malveira Orfano, Ana Larissa Adorno, Adriana Tenuta; p. 104-121.

121

Do Portugus Clssico ao Portugus Europeu Moderno: o mapeamento


do artigo
From Classic Portuguese to Modern European Portuguese: definite article description
Simone Floripi *
RESUMO: No decorrer dos sculos os
padres de aplicao do artigo na lngua
portuguesa foram sendo modificados,
demonstrando ter havido uma mudana na
gramtica dessa lngua. Tal mudana culmina
na obrigatoriedade de utilizao do artigo
frente a sintagmas nominais possessivos,
como observado atualmente no portugus
europeu moderno. Diante deste panorama,
buscamos investigar o uso do determinante
em DPs possessivos desde o sculo 16 ao
sculo 19 (Portugus Clssico) e demonstrar
sua evoluo no tempo. Foi realizado um
estudo abrangente que considera fatores
sintticos e estruturais capazes de indicar o
incio da variao na colocao de
determinantes e quando esta deixou de
existir, momento no qual, o uso do artigo
diante de possessivo passou a ser obrigatrio
no portugus europeu (cf. Floripi, 2008 e
Castro, 2000). Apresentaremos os resultados
do mapeamento geral dos contextos capazes
de evidenciar a mudana sinttica ocorrida e
os fatores estruturais responsveis pelo
desencadeamento
dessa
mudana
na
gramtica da lngua portuguesa. Para tanto,
foi realizada uma investigao diacrnica dos
dados, por meio da quantificao destes,
analisando-os
sob
uma
abordagem
minimalista (Chomsky (1995) e Kayne
(1994)), tendo como pressupostos tericos o
Modelo de Princpios e Parmetros.

ABSTRACT: Throughout the centuries, the


use of definite article in Portuguese has been
changed, indicating a linguistic change on its
grammar. This grammar changed to a pattern
that obligate the employ of the article in
possessive nominal phrases as we can note in
Modern European Portuguese. Considering
this, we propose to investigate the employ of
the article since century 16 to 19 in order to
show it development during the centuries.
We made a robust investigation which
considers syntactic and structural factors that
can determine the beginning of the process of
variation and the final pattern with the
requirement of definite article on the referred
structure (cf. Floripi, 2008 e Castro, 2000).
We will discuss the results, showing the
contexts in which occurs the syntactic
change. We made a diachronically view
considering the Minimalist assumptions
(Chomsky (1995) e Kayne (1994)) of
Principles and Parameters Theory.

PALAVRAS-CHAVE: Mudana lingustica.


Lngua portuguesa. Artigo definido. Pronome
possessivo. Corpus lingustico eletrnico.

KEYWORDS:
Linguistic
change.
Portuguese. Definite article. Possessive
pronoun. Eletronic linguistic corpus.

Fez mestrado e doutorado em Lingustica pela Universidade Estadual de Campinas UNICAMP e psdoutorado pela Universidade Estadual Paulista Jlio de Mesquita Filho UNESP. Atualmente professora em
dedicao exclusiva da Universidade Federal de Uberlndia UFU. Dentre seus interesses de pesquisa esto:
sintaxe das lnguas naturais, lingustica histrica, estudos das tradies discursivas, estudos do texto e formao
de professores de lngua portuguesa. E-mail: simone.floripi@gmail.com

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

1. A estrutura do sintagma nominal possessivo


Em diversas lnguas afirma-se que os pronomes possessivos esto localizados dentro
do sintagma nominal (DP), em posio de ncleo de determinante (D) ou em especificador
(Spec,DP) (cf. OLSEN, 1989; DEMSKE, 1995, entre outros). Tal posio comprova que em
certas lnguas como Ingls, Holands e Francs o possessivo no co-ocorre com o
determinante, conforme apresentado nos exemplos em (1).
(1)
a. (*The) my book
b. (*Het) mijn boek
c. (*Le) mon livre
d. O meu livro
o meu livro

Ingls
Holands
Francs
Portugus

Contudo, como vemos em (1d) h lnguas, como o portugus, em que possvel esta
ocorrncia. A explicao para tal fenmeno que os possessivos no so equivalentes a
determinantes definidos mesmo quando eles parecem ocupar a posio de um determinante;
Fato que nos mostraria que existem posies especficas na estrutura do DP, uma para o
determinante e outra diferente para o possessivo.
Outro caso, apresentado em (2) abaixo, trata da co-ocorrncia de um artigo e um
possessivo numa elipse de um DP. Como vemos em (2), em algumas lnguas h diferentes
formas para o possessivo, a depender de sua posio na estrutura, dada a necessidade da
concordncia da morfologia do possuidor.
(2)
a. my book
b. mon livre
c. mein Buck
meu livro

a. Your book, not mine


b. Ton livre toi, pas le mien
c. Dein Buch, nicht meins / das meinige
seu livro, no meu

Ingls
Francs
Alemo

Os exemplos acima tambm nos levariam a pensar que existem posies especficas
para a realizao de cada tipo de possessivo a depender de sua posio no DP. Dessa maneira,
para indicarmos o posicionamento de cada um dos elementos tratados (determinante e
possessivo) abordaremos a estrutura interna do DP que pode ser comparada estrutura de
uma sentena (CP), pois, do mesmo modo que ocorre nos CPs, o elemento possuidor carrega

Simone Floripi; p. 122-138.

123

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

certos traos que precisam ser checados fora do constituinte onde ele foi gerado como
possuidor. Isso requer a existncia de projees funcionais dentro do DP para que os traos de
Concordncia e Caso possam ser checados.
Vejamos a seguir dados do portugus contemporneo, utilizando a estrutura do DP (cf.
Shoorlehmer (1998), Szabolcsi (1994), entre outros).
(3)
os meus dois cadernos
DP
r
u
os
PossP
r
u
meus
NumP
r
u
dois
NP
5
cadernos
Os pronomes possessivos, por exemplo, podem ser inseridos em posio de ncleo,
como Poss0. Essa arquitetura captura para o portugus, a instanciao do pronome possessivo
entre D e Num e em seus domnios de checagem que um dado constituinte vai ser
interpretado como o possuidor de N.
Uma vez apresentada a estrutura do DP, vale dizer que a linha na qual que
pretendemos trabalhar enfoca as caractersticas do pronome possessivo para explicarmos a
possibilidade da variao no uso do determinante nesse contexto. No intuito de introduzirmos
a proposta de anlise, imaginemos que no portugus clssico, assim como no francs
atualmente, o pronome meu exercia dois papis semnticos, mas que no portugus clssico
sua realizao fontica era homfona, i.e., com apenas uma forma fonolgica.
Assim, conforme assumido por Giorgi & Longobardi (1991) haveria uma distino
entre dois tipos de pronomes possessivos daquela poca; sendo que estes poderiam se
comportar como determinantes (por exemplo, como ocorre em mon livre do francs) ou como
adjetivos, em que ele caracterizava-se como um predicado (por exemplo, como ocorre em le
mien do francs). Apresentamos a ilustrao destas duas estruturas, utilizando como exemplo
o pronome meu do francs, mas que na verdade este pronome representaria as duas formas
semanticamente distintas do pronome meu no portugus clssico.

Simone Floripi; p. 122-138.

124

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

(4)

(a)
DP
r
u
monm
PossP
r
u
tm
NP
6
livre

(b)
r
lek

DP
u
r
tk

PossP
u
6

NP
mien

Segundo as estruturas acima, o pronome possessivo meu no portugus clssico


ocuparia uma posio especfica a depender a interpretao semntica que ele fosse exercer.
Em (4a) ele receberia um papel de determinante, ao ser alado para a posio de D e em (4b)
permaneceria no NP, exercendo a funo de predicado da estrutura.
A hiptese de haver duas estruturas para o pronome meu ainda pode ser
fundamentada teoricamente pelo trabalho de Shoorlemmer (1998). A autora assume que os
argumentos nominais so gerados na base dentro do NP e podem ser alados ao Spec,PosP
para seu licenciamento formal na busca de checar um trao de definitude, assim como ocorre
para o licenciamento formal dos sujeitos, mas sem a necessidade de respeitar o Princpio de
Projeo Extendida (EPP).
Shoorlemmer (1998) ainda argumenta que o alamento leva em considerao um
conjunto de diferenas entre lnguas que apresentam a propriedade de checar o trao mais
definido de construes possessivas em oposio a lnguas que no operam desta forma,
evidenciando o licenciamento de estruturas em que h a co-ocorrncia de pronomes e artigos.
2. Apresentao do corpus
Este trabalho consiste no estudo do uso do artigo diante dos sintagmas nominais
possessivo do portugus clssico, utilizando 23 textos de autores portugueses nascidos entre o
sculo XVI e XIX. Baseamo-nos no trabalho de Silva (1982) e Magalhes (2002) sobre o uso
de artigo frente a possessivos no portugus clssico com o intuito de determinar a evoluo do
uso do determinante no decorrer dos sculos.
Os respectivos autores de cada texto utilizado para a realizao deste estudo esto
abaixo elencados.

Simone Floripi; p. 122-138.

125

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Sculo 16
Ferno Mendes Pinto (1510-1583) Perigrinao (52.555 palavras).
Francisco de Holanda (1517-1584) Da Pintura Antiga (52.538 palavras).
Diogo do Couto (1542 - 1606) Dcadas (seleco, prefcio e notas de Antnio
Baio) (47.448 palavras).
Luis de Sousa (1556 - 1632) A Vida de Frei Bertolameu dos Mrtires (52.928
palavras).
F. Rodrigues Lobo (1579 - 1621) Crte na Aldeia e Noites de Inverno (52.429
palavras).
Sculo 17
Manuel da Costa (1601 - 1667) Arte de Furtar (52.867 palavras).
Antnio Vieira (1608 - 1697) Sermes (53.855 palavras).
Antnio Vieira (1608 1697) Cartas (57.088 palavras).
F. Manuel de Melo (1608 - 1666) Cartas (58.070 palavras).
Antnio das Chagas (1631-1682) Cartas Espirituais (54.445 palavras).
Manuel Bernardes (1644 - 1710) Nova Floresta (52.374 palavras).
J. Cunha Brochado (1651 - 1735) Cartas (35.058 palavras).
Maria do Cu (1658-1753) Rellacao da Vida e Morte da Serva de Deos a
Veneravel Madre Elenna da Crus (27.410 palavras).
Andr de Barros (1675-1754) A Vida do Padre Antnio Vieira (52.055 palavras).
Alexandre de Gusmo (1675-?) Cartas (32.433 palavras).
Sculo 18
Cavaleiro de Oliveira (1702 1783) Cartas (51.080 palavras).
Matias Aires (1705 - 1763) Reflexo sobre a Vaidade dos Homens e Cartas sobre
a Fortuna (56.479 palavras).
Lus Antnio Verney (1713-1792) Verdadeiro Mtodo de Estudar (49.335
palavras).
Antonio da Costa (1714-?) Cartas do Abade Antnio da Costa
(27.096 palavras).
Correia Garo (1724 - 1772) Obras Completas (24.924 palavras).
Marquesa D'Alorna (1750-1839) Cartas e outros Escritos (49.512 palavras).
Almeida Garrett (1799-1854) Viagens na minha terra (51.784 palavras).
Sculo 19
Ramalho Ortigo (1836 - 1915) Cartas a Emlia (32.441 palavras).
Como ferramenta de estudo, para a busca dos contextos a serem investigados,
contamos com a etiquetao morfolgica dos 23 textos, estando estes alocados no Corpus
Anotado do Portugus Histrico Tycho Brahe, disponibilizado na rede internacional de
computadores no seguinte endereo www.ime.usp.br/~tycho.1
A busca dos contextos estudados resultou em dez tipos de contextos que dependiam:
1

Esta uma ferramenta que permite termos uma recuperao rpida e confivel dos dados, alm de ser acessvel
a qualquer pesquisador interessado no estudo de textos do portugus mdio.

Simone Floripi; p. 122-138.

126

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

(i) da presena ou ausncia do artigo,


(ii) da sua posio na orao, e
(ii) da presena da preposio
Apresentamos a seguir os contextos observados:
i) Possessivo em posio inicial (0 poss);
Seu corpo foi enterrado o mais solenemente que pde ser, com grande dor, e
sentimento de todos, de que era muito amado, como era razo o fosse um Rei.
(Couto, 1542)
ii) Possessivo em posio inicial mais o Determinante (0 D poss);
O seu pintar trapos, maonerias, verduras de campos, sombras de rvores, e
rios e pontes, a que chamam paisagens, e muitas feguras para c e muitas para
acol.
(Holanda, 1517)
iii) Possessivo em posio inicial mais a preposio (0 P poss);
De sua dificultosa conquista, a reduo F, empresa digna do grande corao
de VIEIRA, e uma de suas maiores faanhas, demos j em separada obra
completa relao.
(Barros, 1675)
iv) Possessivo em posio inicial antecedido pela preposio + Determinante
(0PD-poss)
Contra o nosso parecer, nunca achamos dvida bastante, contra o dos outros
sim. (Aires, 1705)
v) Possessivo em posio inicial antecedido pela contrao da preposio com o
Determinante (0 PD poss);
No nosso Evangelho diz o mesmo Senhor: Tunc videbunt: ento vero: E aquelle
ento agora: aquelle tunc nunc: Tunc videbunt, et nunc est.
(Sermes, Vieira, 1608)
vi) Possessivo precedido por um Determinante (D poss);
So Paulo descrevendo este mundo, para nos desaffeioar de suas vaidades, diz
que como um theatro, em que as figuras cada uma entra a representar o seu
papel, e passa: Prterit enim figura hujus mundi.
(Sermes, Vieira, 1608)
vii) Possessivo precedido por uma preposio (P- poss);
Nem cuideis, que vos conheo, quem quer que sois, nem que ponho o dedo em
vossas couzas em particular: o meu zelo bate s no commum.
(Manuel Antnio da Costa, 1601)
viii) Possessivo precedido por uma preposio e um Determinante (P D -poss);
Porm, quanto a mi, o que da teno dstes autores convm mais com o nosso

Simone Floripi; p. 122-138.

127

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

modo de fala, sal quer dizer graa, que o contrrio da frieza e sensaboria.
(Lobo, 1579)
ix) Possessivo precedido pela contrao da preposio e Determinante (PD
poss) e;
No ms de Maio dos anos do Senhor de mil e quinhentos e catorze, reinando em
Portugal el-Rei Dom Manuel, nico deste nome, e presidindo na Igreja de Deus o
Papa Leo X, pariu Maria Correa um filho, que bautizaram na sua igreja e
freguesia e chamaram Bertolameu.
(Souza, 1556)
x) Possessivo precedido por outro elemento qualquer que no um Determinante
ou uma preposio (X poss).
Agora encomendo eu muito a Vossa Merc me sofra como seu despertador e que
se acorde do prometido a Deus.
(Chagas, 1631)
Conforme podemos notar, o procedimento de busca dos contextos de sintagmas
possessivos resultou em diversas possibilidades estruturais a depender das variveis em
observao. Para a investigao desta configurao, preocupamo-nos em observar as
caractersticas intrnsecas dos sintagmas nominais possessivos com o intuito de compreender
os mecanismos engatilhados na mudana sinttica observada.
Os resultados obtidos por meio da busca, classificao e quantificao dos dados de
sintagmas possessivos evidenciam o comportamento na aplicao do artigo no decorrer dos
sculos, conforme discutido a seguir.
3. Delineando os contextos de mudana no portugus clssico
Ao lidar com os dados observados, trabalhamos com a presena e ausncia do
determinante em sintagmas possessivos considerando os contextos sintticos em que foi
realizado na sentena. Vale salientar que trabalhamos com um montante de cerca de 10.000
dados no total2, considerando-se os 10 contextos estruturais apresentados anteriormente o que
traz a este trabalho uma segurana na procura de identificar o comportamento da aplicao do
determinante nos sintagmas possessivos sob uma perspectiva diacrnica.
Conforme apresentado na forma de grfico, agrupando os dados em perodos de 50
anos, notamos que o uso do artigo em DPs possessivos revela um comportamento distinto de

Os dados foram quantificados utilizando-se do pacote estatstico GoldVarb 2001 uma vez que lidvamos com
um montante alto de ocorrncias e com vrios fatores estruturais envolvidos.

Simone Floripi; p. 122-138.

128

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

acordo com o contexto sinttico em que realizado. Vejamos os resultados em posio de


sujeito, objeto direto, objeto indireto e adjuntos, apresentados nos grficos abaixo elencados 3.

Presena de determinante em sujeito


1
0,88

0,81

0,82

0,88

0,95

1,00
0,89

0,5

0
1500-1550

1550-1600

1600-1650

1650-1700

1700-1750

1750-1800

1800-1850

Grfico 1 Percentagem do uso de determinantes em DPs possessivos sujeitos

Presena de determinante em Objeto Direto


1

0,96
0,85

0,98

0,98

0,97

0,84
0,69

0,5

0
1500-1550

1550-1600

1600-1650

1650-1700

1700-1750

1750-1800

1800-1850

Grfico 2 - Percentagem do uso de determinantes em DPs possessivos objetos diretos

Presena de determinante em Objeto Indireto


1

1,00
0,81

0,81

0,71
0,5

0,52
0,37

0,41

0
1500-1550

1550-1600

1600-1650

1650-1700

1700-1750

1750-1800

1800-1850

Grfico 3 - Percentagem do uso de determinantes em DPs possessivos objetos indiretos

Vale ressaltar que os valores de 0 a 1, apresentados em todos os grficos, equivalem a uma escala de 0 a 100,
configurando-se, portanto, como porcentagens e no como valores de pesos relativos, pois fizemos a opo de
utilizar o GoldVarb apenas como uma ferramenta de auxlio para a contagem dos dados.

Simone Floripi; p. 122-138.

129

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Presena de determinante em Adjunto


1
0,89

0,91

1750-1800

1800-1850

0,82
0,66
0,5

0,44

0,43
0,33

0
1500-1550

1550-1600

1600-1650

1650-1700

1700-1750

Grfico 4 - Percentagem do uso de determinantes em DPs possessivos adjuntos

Conforme observamos por meio dos grficos acima, possvel agrupar os casos de
DPs em sujeitos e objetos diretos de um lado e os objetos indiretos e os adjuntos de outro.
Com relao ao primeiro grupo, seu comportamento mostra casos em que o nmero de
emprego de artigos era mais elevado desde o incio do sculo 16 com uma pequena variao.
J para o segundo grupo, o nmero de ocorrncias era mais baixo no incio do sculo 16
havendo um posterior crescimento no decorrer dos sculos at uma quantidade elevada de uso
do artigo no sculo 18. Essas diferenas no parecem ser aleatrias, pois justamente os
contextos em que percebemos melhor a mudana na gramtica do PC so aqueles em que se
requer uma preposio, como nos objetos indiretos e nos adjuntos.
Ao fazermos as quantificaes dos dados obtidos, averiguamos que as realizaes dos
DPs possessivos de acordo com o contexto sinttico mostraram uma disparidade grande
quanto ao emprego dos adjuntos em oposio aos demais contextos. Nota-se que a quantidade
de aplicao de adjuntos sobressai-se dos demais contextos, pois em termos absolutos, o
nmero de adjuntos bastante superior aos outros, conforme visualizado no grfico a seguir.

Contexto sinttico - uso dos DPs possessivos


1,00

0,63

0,61

0,69

0,68

0,72

0,66

0,50

0,110,140,12

0,120,130,13

0,120,10
0,08

0,120,15
0,06

0,120,15
0,07

0,15
0,10
0,03

0,00
1500-1550

1600-1650

Sujeito

1650-1700

Objeto Direto

1700-1750

Objeto Indireto

1750-1800

1800-1850

Adjunto

Gfico 5 Percentagem do uso do DP possessivo de acordo com o contexto sinttico.

Simone Floripi; p. 122-138.

130

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Como percebemos em nmeros de realizao de DPs possessivos, o contexto sinttico


mais utilizado sempre o de adjunto, agrupado em dois tipos (adnominais e verbais). Em
consequncia do elevado nmero de ocorrncias deste contexto nos adjuntos que a lngua
visualizou a mudana sinttica por meio dos nossos dados histricos. E nos adjuntos que o
licenciamento da preposio pode trazer influncias acarretando em mudana. Isto quer dizer
que a preposio nestes contextos desempenha um papel importante para a gramtica da
lngua.
Quando agrupamos todos os contextos sintticos, o nmero de ocorrncias de adjunto
grande, mas o nmero elevado de adjuntos em relao aos demais contextos no tem
significao para a anlise, pois na verdade no o adjunto em si que influencia na mudana,
mas os contextos em que ocorrem uma preposio so aqueles que nos trazem uma melhor
visualizao da mudana. Portanto, no a funo sinttica que est em jogo para evidenciar
a mudana, mas sim o emprego de uma preposio. Se fosse a funo sinttica, esperaramos
que houvesse diferenas nos resultados de uso de artigo entre sujeito e objeto, por exemplo,
mas como vemos, no h. Alm disso, verificamos que os casos de objetos indiretos ocorrem
em nmeros bem menores que os de adjuntos, comparando-se queles de sujeito e objeto
direto, mas mesmo assim o comportamento deste contexto assemelha-se ao de adjuntos. Isso
quer dizer que o fato de haver menos casos de objetos indiretos no invalida o comportamento
diferente deste contexto em relao aos demais, pois mesmo em menor nmero, funcionam
nos mesmos moldes dos adjuntos devido a presena da preposio.
Compreende-se, dessa maneira, que a preposio desempenha um papel importante
para a mudana. Passemos, ento, aos resultados de DPs possessivos com relao ao uso ou
no de uma preposio.
Ocorrncia de Determ inante em frases COM Preposio
1,00
0,78
0,64
0,58

0,54
0,43

0,40
0,30
0,22

0,00
1500

0,470,450,49

1550

1,00

0,95
0,90
0,85
0,82
0,80
0,57

0,91
0,81

0,56

0,30
0,27

1600

1650

1700

1750

1800

1850

1900

% presena D considerando apenas as sentenas COM Preposio

Grfico 6 Percentagem do uso de determinante em DPs possessivos preposicionados

Simone Floripi; p. 122-138.

131

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

De acordo com as realizaes de artigo, verifica-se que at o sculo 17, nos casos de
DPs possessivos acompanhados de uma preposio, o nmero de artigos era bastante
reduzido, situando-se num patamar inferior aos 50% de ocorrncia e que posteriormente
sofreu um aumento devido a mudana na lngua, chegando at a 100% de aplicao no DP.
E nos casos em que a preposio no era realizada, mesmo notando haver um perodo
de variao, o nmero de artigos sempre foi maior, como representado no grfico a seguir.

Ocorrncia de Determinantes em frases SEM Preposio


1,00
0,89
0,87

0,88

0,88

0,00
1500

1550

0,94

0,93

0,98

0,82

0,78
0,70
0,64

1,00
0,99
0,98
0,98
0,98
0,91

0,99
0,930,91
0,90

0,60
0,52

1600

1650

1700

1750

1800

1850

1900

% presena D considerando apenas as sentenas SEM Preposio

Grfico 7 Percentagem do uso de determinante em DPs possessivos no preposicionados

Mesmo sendo em nmeros mais elevados com relao ao contexto sem preposio e
com uma variao mais sutil, tambm verificamos uma mudana nos padres de realizao do
artigo neste contexto a partir do sculo 17.
Verificamos que at os anos de 1650-1700, aproximadamente, h variao no uso do
artigo, mas ainda no temos em questo um contexto de mudana estabelecido.
Ao atentarmos para os dois ltimos grficos, nota-se que at 1700 temos dois
panoramas de mudana, o que remete a distintos sistemas possessivos sendo realizados.
Vamos assumir que nessa poca duas mudanas estavam em jogo.
Consideremos os resultados em um contexto que est mais livre de influncia, como
os casos sem a preposio com cerca de 80% de realizao do determinante
aproximadamente. Estes dados comprovam que no sculo 16 e 17 a mdia de 20% a 30% das
realizaes sem artigo correspondem a uma gramtica como a do Francs em que o
possessivo ao possuir os traos [+definido] e [+ possessivo] alado para D, inibindo o uso
do artigo. Nesse pequeno nmero de ocorrncias (cerca de 20%) serve como evidncia clara
de um pronome possessivo que no utiliza o determinante.

Simone Floripi; p. 122-138.

132

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Ainda no mesmo contexto sem preposio, os 80 % restantes dos resultados em que o


artigo realizado correspondem a uma outra gramtica com obrigatoriedade do uso do artigo.
Mesmo assim, os casos que englobam estes 80% de ocorrncias de artigo no so
suficientemente evidentes para afirmar que correspondam todos a uma mesma gramtica.
Apresentamos na prxima seo as caractersticas estruturais dos sistemas possessivos
encontrados no perodo de 1500 at 1700 do portugus clssico.

4. Proposta de anlise: Duas gramticas para o sistema possessivo do portugus clssico


Primeiramente, consideremos os casos em que a preposio realizada. No incio do
sculo 16, no portugus clssico, quando ocorria uma estrutura em que o possessivo detinha
os traos [+posse] e [+definitude] este era capaz de ser alojado na posio de D e selecionado
pela preposio.
Seria equivalente a uma estrutura semelhante a do Francs para o pronome mon, em
uma configurao seguindo os mesmos moldes propostos por Brito (2001, 2003, 2007), mas
que o artigo no era realizado como afirma a autora para o portugus europeu, conforme
exemplificado em (5).
(5)
Gramtica 1 tipo Francs
r

DP
u
r
D
meui

D
u

r
livroj

AgrP
g
Agr
u

u
NP
g
N
g
[livro ]

No entanto, se esta fosse a nica estrutura em vigor, o que dizer quando era licenciado
um artigo como percebemos nos grficos acima? Desse modo, podemos afirmar que havia um
outro sistema possessivo.

Simone Floripi; p. 122-138.

133

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Assumimos, portanto, uma outra estrutura possessiva baseada nos moldes de Brito
(2007) semelhantemente estrutura do Italiano em que o possessivo estaria em uma posio
mais baixa dotado do trao [+posse] alojado em Spec,AgrP ou em PossP e o artigo dotado do
trao [+definido] alojado em D.
(6)
Gramtica 2 - tipo Italiano
r

DP
u
r
Do
os

D
u
AgrP
r
u
XP
Agr
g
r
u
meus Agr
PossP
g
r
u
livros [meus]

Poss
r
u
Poso
NumP
g
Num
r
u
Num
NP
[meus]
g
N
g
[livros ]

Apresentamos abaixo, na forma de quadro, o esboo dos sistemas possessivos em coocorrncia no portugus clssico que foram modificados na passagem para o portugus
europeu, conforme nossa proposta de anlise para a mudana em questo.
Quadro 1. Possessivos no portugus clssico.

Gramtica 1
(Francs)

Portugus Clssico

Portugus Europeu

[D meu]
[+definido, +possessivo]
Elemento X

Extinguiu-se
Dialeto no padro

Gramtica 2
(Italiano)

[D o ]
[AgrP meu ]
[+definido] [+possessivo]
Elemento XP

[D o ]
[AgrP meu ]
[+definido] [+possessivo]
Elemento XP
Reanlise da gramtica tipo Italiano
[D o meu]

Simone Floripi; p. 122-138.

134

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

[+definido, +possessivo]
Elemento X

Resumidamente, podemos dizer que no portugus clssico havia duas gramticas em


co-ocorrncia: a gramtica 1 em que o possessivo era dotado dos traos [+definido,
+possessivo] realizado em ncleo de D, assemelhando-se gramtica do Francs, assim como
uma outra, a gramtica 2, em que o possessivo no era alado para D, assemelhando-se
gramtica do Italiano. Nessa ltima gramtica os traos de definitude e posse eram checados
por itens lexicais diferentes, alojados em seus respectivos ncleos funcionais.
A explicao para a mudana no sistema possessivo que ocorreu no PC deve-se a dois
fatores: ao aumento no uso do determinante e a uma reanlise na categoria do pronome
possessivo do Italiano. No sabemos qual dos dois fatores ocorreu primeiro, mas estes podem
ser recuperados nos nossos dados.
A gramtica 1 (tipo do Francs) em que o possessivo localiza-se ora em PossP ou
AgrP (como o mien) ora em D (como o mon) j era minoritria no perodo investigado. Como
verificamos nos dados sem preposio, apenas 20% a 30% de ocorrncias de possessivo prnominal sem determinante era realizado (estrutura que corresponderia a do pronome mon).
Esta estrutura no decorrer dos sculos foi perdendo fora at desaparecer totalmente no
portugus europeu moderno. Com o aumento no uso do artigo, ocorreu uma reanlise da
gramtica 2 do possessivo (tipo do Italiano), acirrando ainda mais a competio com esta
gramtica 1 (tipo do Francs) em que o artigo e possessivo eram realizados em ncleo D.
Assumimos que a gramtica 2 (do tipo Italiano), que correspondia a cerca de 70% a
80% de uso do artigo nos dados sem preposio, sofreu um processo de reanlise do seu
pronome possessivo, sendo este anteriormente confirgurado como um elemento XP, passou a
a ser licenciado pela gramtica vencedora em posio de ncleo D juntamente com um artigo
para o dialeto padro4.

Em outros termos essa nova gramtica derivada do Italiano, mas que se assemelha de certa forma ao Francs
pelo fato de o possessivo passar a ser realizado em D, em outras palavras, a configurao estrutural da gramtica
que corresponde ao sistema do Italiano em que o possessivo se localiza em uma posio mais abaixo de D foi
reanalisada passando a ocorrer em ncleo D.

Simone Floripi; p. 122-138.

135

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

5. Concluso
Nesta pesquisa, procuramos investigar a respeito do emprego dos artigos definidos em
contextos de sintagmas nominais possessivos ao longo dos sculos XVI ao XIX. Constatamos
ter havido uma mudana nos padres de aplicao do artigo nesse perodo, sendo possvel
delinearmos por meio de grficos o perfil dessa mudana sinttica no Portugus Clssico.
Ao considerarmos alguns trabalhos anteriores que revelaram a importncia de maiores
estudos a respeito do artigo frente aos DPs possessivos, tais como Silva (1982), Magalhes
(2002) e Castro (2006), entre outros, percebemos que a preposio evidencia um papel
importante para a visualizao da mudana. Alm disso, procuramos estabelecer uma hiptese
que considerasse os padres estruturais da sintaxe da poca, culminando no que sabemos
existir no portugus europeu moderno, fase final da mudana. Portanto, nossa proposta central
para a anlise dos dados assume que o pronome [meu] do portugus clssico passou a ser
reanalizado como [o meu] em um mesmo ncleo, passando a possuir os traos [+definido, +
possessivo] e modificando sua categoria antes XP para X. Com tais consideraes, buscamos
trazer um panorama a respeito do contexto em estudo para que novas pesquisas a respeito
possam ser embasadas com relao aos padres de mudana ocorridos no portugus europeu.
Referncias
ABNEY, S. P. The English noun phrase in sentential aspects, Ph.D. dissertation,
Massachusetts: MIT, 1987.
BRITO, A. Presena / ausncia de artigo antes de possessivo no Portugus do Brasil. In.
Actas do XVI Encontro da Associao Portuguesa de Lingustica. Faculdade de Letras do
Porto. Centro e Lingustica da Universidade do Porto, 551-575, 2001.
BRITO, A. Os possessivos em Portugus numa perspectiva de Sintaxe Comparada. Revista da
Faculdade de Letras Lnguas e Literaturas XX:495-522, 2003.
BRITO, A. European Portuguese possessives and the structures of DP. Cuadernos de
Lingustica del I.U.I Ortega y Gasset, vol. 14, PP.27-50, 2007.
CASTRO, A. O Sistema dos Possessivos em Francs e em Portugus. In Revista da
Faculdade de Cincias Sociais e Humanas (nmero especial em homenagem a Henriqueta
Costa Campos), 1999.
CASTRO, A. Os Possessivos em Portugus Europeu e Portugus Brasileiro: Unidade e
Diversidade. Actas do XVI Encontro Nacional da Associao Portuguesa de Lingustica
de Coimbra, Lisboa, APL, 599-613, 2000.

Simone Floripi; p. 122-138.

136

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

CASTRO, A. On Possessives in Portuguese. Ph.D. Diss, Universidade Nova de Lisboa FCSH and Universit Paris 8 CLI, 2006.
CHOMSKY, N. The minimalist Program. Cambridge: MIT Press, 1995.
CORREIA, C. N. Estudos de Determinao: A Operao de quantificao-qualificao em
sintagmas nominais. Lisboa: Fundao Calouste Gulbenkian, 2002.
COSTA, I. O uso do artigo definido diante de nome prprio de pessoa e de possessivo do
sculo XIII ao sculo XVI. In Mattos e Silva & Machado Filho, A. V. L. (ed.) O Portugus
Quinhentista Estudos Lingusticos. EDUFBA/UEFS, 2002. p. 285-306,
FLORIPI, S. O determinante em sintagmas nominais possessivos na histria do
portugus. Universidade Estadual de Campinas. Tese de doutorado, 2008.
GARY-PRIEUR, M. N. Gramaire du Nom Propre. Paris: PUF, 1994.
LONGOBARDI, G. Reference and Proper Names: A Theory of N-Movement in Syntax and
Logical Form. Linguistic Inquiry 25,4 : 609-665, 1994.
LOPES, O. Gramtica Simblica do Portugus. Lisboa: Fundao Calouste Gulbenkian,
1972.
MAGALHES, T. O Uso de Artigo Definido diante de Pronome Possessivo em Textos
Portugueses do Sculo XVI a XIX. DELTA, 2004.
SCHOORLEMMER, M. Possessors, Articles and Definiteness In: Possessors, Predicates
and Movement in The Determiner Phrase , Artemis Alexiadou & Chris Wilder (eds), 5686,
John
Benjamins
Publishing
Company,
1998.
http://dx.doi.org/10.1075/la.22.04sch
MIGUEL SARMENTO, M. O estatuto categorial dos possessivos: possessivos e adjetivos.
In: Actas do Encontro comemorativo dos 25 anos do CLUP, 191-202. Porto, 2002a.
MIGUEL SARMENTO, M. Para uma tipologia dos possessivos. In: Actas do XVII
Encontro Nacional da Associao Portuguesa de Lingustica, Lisboa: Associao
Portuguesa de Lingustica. 287-299, 2002b.
MIGUEL SARMENTO, M. Possessive pronouns in European Portuguese and Old French.
Journal of Portuguese Linguistics 1:215-240, 2002c.
MIGUEL SARMENTO, M. O Sintagma Nominal em Portugus Europeu: posies de
sujeito. Tese de doutorado. Faculdade de Letras da Universidade de Lisboa, 2004.
SILVA, G. M. O. Estudo da Regularidade na Variao dos Possessivos no Portugus do
Rio de Janeiro. UFRJ. Tese de Doutorado, 1982.

Simone Floripi; p. 122-138.

137

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

SILVA, G. M. O. Variao no sistema de Possessivo de Terceira Pessoa. Tempo Brasileiro


(78/79): 54-72, 1994.
SILVA, G. M. de O.; CALLOU, D. O uso do artigo definido diante de possessivo. In:
DUARTE, I. & LEIRIA, I. (orgs.) Congresso Internacional sobre o Portugus,
Colibri/APL, Lisboa, Vol. III. p. 115-125, 1996.
SZABOLSCI, A. The Noun Phrase. In: KIEFER, N. F.; KISS, K. (eds) Syntax and Semantics
27 The Syntactic Structure of Hungarian. Academic Press, pp. 179-274, 1994.

Artigo recebido em: 10.10.2014


Artigo aprovado em: 04.12.2014

Simone Floripi; p. 122-138.

138

A funo pragmtica Tpico na legendagem brasileira de um filme


argentino em um estudo de corpus paralelo
The pragmatic function Topic in Brazilian Portuguese subtitles of an Argentine movie:
a parallel corpus study
Amanda Verdan Dib*
Paulo Pinheiro-Correa**
RESUMO: Neste estudo de corpus paralelo,
analisamos a funo pragmtica Tpico na
legendagem brasileira do filme argentino O
Segredo dos seus olhos/El secreto de sus ojos
(Espanha/Argentina,
2009),
com
o
instrumental
terico
da
Gramtica
Discursivo-Funcional (GDF). Para levantar
as ocorrncias, utilizamos o programa
YouAlign (Terminotix Inc.), de alinhamento
de corpora paralelos. Foram analisados dois
tipos de construes de tpicos: as
topicalizaes e os deslocamentos
esquerda. Os resultados indicaram um
expressivo apagamento das construes de
tpico dos dilogos originais em espanhol
nas legendas brasileiras, o que pode dever-se
natureza do procedimento de legendagem,
que tende simplificao da sintaxe, mas
tambm resistncia ao emprego dessas
construes no portugus brasileiro escrito.

ABSTRACT: In this parallel corpus study


we have analyzed the pragmatic function
Topic in Brazilian subtitles of the Argentine
movie The secret in their eyes/El secreto de
sus ojos (Spain/Argentine, 2009) within the
theoretical
framework
of
Functional
Discourse Grammar (FDG). We used the
software YouAlign (Terminotix Inc.) for
alignment of parallel corpora. Two types of
topic
constructions
were
studied:
topicalizations and left dislocations. Results
indicate an erasing process of topic
constructions from the original Spanish
dialogues in Brazilian Portuguese subtitles.
This could be due to the syntactic
simplification typical of the subtitling
process, but also to a trend of avoiding these
constructions in written Brazilian Portuguese.

PALAVRAS-CHAVE:
Lingustica
de
Corpus. Espanhol. Traduo. Legendagem.
Tpico.

KEYWORDS: Corpus Linguistics. Spanish.


Translation. Subtitles. Topic.

1. Introduo
Este artigo analisa as ocorrncias da funo informativa tpico no espanhol argentino
(doravante EA) e portugus brasileiro (doravante PB), com o objetivo de descrever o uso
dessa funo pragmtica em uma variedade e na outra por meio da anlise de um corpus
paralelo, tomando por base os pressupostos da Gramtica Discursivo-Funcional (doravante,
GDF), tal como propostos por Hengeveld e Mackenzie (2008).
Os dados analisados provm de dilogos roteirizados em EA e a correspondente
legendagem eletrnica em PB do filme El secreto de sus ojos (2009).
*

Mestranda em Estudos de Linguagem. Instituto de Letras, Universidade Federal Fluminense (UFF).


Ps-Doutor em Lingustica. Instituto de Letras, Universidade Federal Fluminense (UFF)/CAPES.

**

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

No restante desta seo, apresentamos o problema e os pressupostos tericos, bem


como os objetivos do trabalho. Na seo (2), apresentaremos a metodologia utilizada, o
software empregado e a progresso dos passos metodolgicos. Na seo (3) apresentamos os
resultados e a discusso, qual se segue a concluso (seo [4]).
1.1. Definindo tpico
Dentro dos pressupostos da GDF (HENGEVELD; MACKENZIE, 2008), as funes
pragmticas, tais como tpico, foco ou contraste, tm uma funo primordial e constituem
primitivos gramaticais, de maneira que se considera que todo o enunciado montado em sua
ordenao lgica partindo-se das relaes pragmticas. Como observa Pezatti (2012, p.363):
A pragmtica, na GDF, refere-se ao modo como o falante modela as suas
mensagens em relao s expectativas que tem do estado mental do ouvinte.
Isso determina as partes de uma unidade lingustica que sero apresentadas
como particularmente salientes, as que sero escolhidas como ponto de
partida do falante e as que sero consideradas compartilhadas pelo falante e
pelo ouvinte.

Assim, o tpico, considerado tradicionalmente como um elemento do plano


discursivo, neste modelo, um componente estruturante do enunciado no que diz respeito
sua formalizao lgica.
Dik (1997), dentro do modelo da Gramtica Funcional que serve de base para a GDF
caracteriza o tpico como: "a entidade sobre a qual a predicao predica alguma coisa em
uma dada situao; em outras palavras, na predicao ns dizemos alguma coisa sobre o
Tpico (traduo de Pezatti [1998]). Assim, tal como em Lambrecht (1994), o tpico, para
Dik (1997) um elemento do plano pragmtico claramente estabelecido, mas com um lugar
que no fica claro dentro de um modelo de estruturao gramatical. No modelo da GDF,
Hengeveld e Mackenzie (2008) estabelecem formalmente que a dicotomia tpico-comentrio,
bem como as demais funes pragmticas, so primitivos gramaticais e os localizam no
denominado nvel interpessoal, na estruturao do enunciado, considerado o nvel primordial
da codificao gramatical. Nesse nvel, mais primordial que o sinttico e o semntico, que
so estruturados os participantes do acontecimento, a relao entre eles, o contexto e as
funes informativas.

Amanda Verdan Dib, Paulo Pinheiro-Correa; p. 139-155.

140

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Desta maneira, dentro dos pressupostos da GDF, o tpico se define como uma funo
que pode vir a ser atribuda a certo elemento do enunciado e que vai assinalar a maneira como
o contedo comunicado se relaciona ao registro que vai sendo construdo gradualmente no
componente contextual (HENGEVELD; MACKENZIE, 2008). Em outras palavras, uma
funo operante na representao lgica do enunciado e da qual vai depender a maneira como
o contedo comunicado vai ser apresentado ao interlocutor. Esta funo pode fazer com que o
elemento a ela associado venha a ser construdo como ponto de partida do enunciado, o que
vai determinar formalmente que este seja interpretado pelo interlocutor como tpico.
1.2. Traduo e funes informativas
No que tange aos Estudos da Traduo, com foco na sua modalidade audiovisual,
especificamente, a legendagem, h questes tericas e prticas que envolvem a passagem do
texto oral (udio original em EA) para o escrito em outra lngua (legenda em PB). Em Lerma
Sanchs (2012), h uma citao de Mayoral Ascencio (1999) sobre as mudanas que ocorrem
nessas transposies: este se refere forma como a expresso lingustica de significados
potencialmente similares pode variar, dependendo das estratgias diferentes que do lugar a
segmentos textuais distintos. (MAYORAL, apud LERMA SANCHS, 2012, p.72).
Duro (2001), por sua vez, aponta trs princpios da prtica da traduo audiovisual,
aos quais so atribudas razes cognitivas cujo fundamento psicolingustico no explicitado
no texto, mas que fazem parte da prtica tradutria e que no podem deixar de ser
considerados nesta pesquisa. So eles: a) sintetizar, b) sincronizar e c) tornar claro. O fator
(a), a necessidade de sintetizar, pode acarretar perda de informao que poderia ser importante
para a compreenso do sentido original, o que um ponto crucial no que se refere ao status
das funes pragmticas. Em termos da GDF, nossa hiptese a de que, ante a necessidade de
sintetizar, passem a ser privilegiados elementos do chamado nvel representacional, que
centrado no objeto da enunciao em si, em detrimento de elementos do nvel interpessoal,
relacionado ao contexto e aos participantes da enunciao. O fator (b) trata da sincronizao
entre a imagem (cena) e texto (legenda correspondente) uma vez que no havendo
concordncia na entrada e sada das legendas com base nos seus pares orais, a compreenso
do sentido original pode ser afetada. Cada legenda deve surgir exatamente quando o
personagem fala, de acordo com a dinmica da cena. O fator (c), deixar claro, por sua vez,
implica facilitar o entendimento do espectador. Isto se concretiza atravs do emprego dos

Amanda Verdan Dib, Paulo Pinheiro-Correa; p. 139-155.

141

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

sinais de pontuao considerados adequados, por exemplo, alm da escolha de estruturas


sintticas porventura mais simplificadas que outras que poderiam eventualmente ter uma
correspondncia maior com o texto original. Acreditamos que pelo menos os fatores (a) e (c)
podem interferir no texto da legenda e por isso devem ser considerados nos resultados.
1.3. O tpico no PB e no EA
Para a anlise do tpico nos dados referentes ao Portugus do Brasil (PB), utilizamos a
classificao clssica de Ross (1967), relida por Pontes (1987), que diferencia dois tipos de
construes de tpico: topicalizao (TOP) e deslocamento esquerda (DE). Assim, as
topicalizaes so identificadas como aquelas que ocorrem sem retomada do componente
inicial atravs de um termo anafrico, como no exemplo (1) abaixo, de Pontes (1987, p.66):
(1)TOP: Feijo, eu no gosto.
No exemplo acima (1), verificamos que o complemento verbal feijo encontra-se na
posio inicial, cumprindo o papel da funo pragmtica tpico, pois resultou da inverso de
ordem de palavras cannica (SVO) em favor do contexto situacional. Neste caso o SN tpico
incontvel e no pode ser recuperado por um pronome elidido no comentrio. A autora
comenta que para o PB essa distino no categrica, uma vez que h casos em que a
topicalizao envolve objetos definidos que no so retomados por nenhum sintagma no
comentrio, mas que poderia ser um caso de deslocamento esquerda com pronome elidido.
Como em (2) e (2), abaixo, ambos retirado de Pontes (idem):
(2) Meu cabelo desta vez eu no gostei nem um pouco.
(2)Meu cabelo desta vez eu no gostei nem um pouco dele.
Para a autora, no exemplo (2) o emprego do pronome dele ao final da sentena no
promoveria nenhuma mudana semntica, razo pela qual em casos que envolvem um
pronome elidido, ela postula ser difcil fazer a distino entre TOPs e DEs.
Os DEs, apesar desta particularidade, se caracterizam fundamentalmente pela
retomada do referente em posio inicial por um elemento anafrico, que pode ser o mesmo
SN, outro SN ou um pronome, entre outros elementos, como no exemplo (3), abaixo, de
Pontes (1987, p.12):

Amanda Verdan Dib, Paulo Pinheiro-Correa; p. 139-155.

142

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

(3) DE: Os livros, eles esto em cima da mesa.


Diferentemente do que ocorre nos exemplos (1) e (2), em que o complemento
deslocado sem a retomada de um elemento anafrico correspondente, em (3) o pronome eles
tem funo sinttica de sujeito, retomando o tpico os livros, e concordando com o mesmo
em gnero e nmero.
Em ambos os casos (DE e TOP), para a GDF, a colocao do referente em primeira
posio determinada na estruturao lgica do enunciado no nvel interpessoal e organiza
pragmaticamente a sentena a partir deste ponto de partida, apresentando a informao na
forma da dicotomia tpico-comentrio, por razes discursivas.
Seguindo autores como Padilla (2005) e Sedano (2012) para o espanhol, de maneira
geral e Kovacci (1992) para o EA, de maneira especfica, observamos que a TOP envolve
sujeitos ou outras funes sintticas diferentes de objeto1. J a DE envolve apenas objetos,
segundo Padilla (2005) e tambm poderia incluir sujeitos, como prope Sedano (2012), que,
no entanto, no encontrou nenhum caso em seu estudo. Assim, se um objeto definido ocupar a
posio de tpico, trata-se de um caso de DE, pelo fato de que o espanhol, por ser uma lngua
de sujeitos nulos, apresenta um inventrio rico de clticos de caso oblquo, que
prototipicamente esto presentes. Desta maneira, no que diz respeito presena de objetos no
tpico, a diferena entre a presena e a ausncia do elemento anafrico no comentrio em
espanhol termina por distinguir os casos de tpico de outra estratgia informativa: o contraste
(tambm chamado foco contrastivo, em verses anteriores do funcionalismo holands). Nos
exemplos (4) e (5) se estabelece a comparao entre tpico e contraste. O exemplo (4) de
um caso de tpico no espanhol argentino, retirado de Kovacci (1992, p.248):
(4) La escuela primaria la hice en casa.
Neste exemplo, o objeto la escuela primaria, por imposies do contexto um tpico,
(retomado por um cltico resumitivo) concordante em gnero e nmero com o objeto. Nos
casos de contraste, o objeto definido aparece em posio anteposta e no recuperado pelo
cltico dentro da orao como em (5), tambm analisado por Kovacci (idem):
1

No nosso entender, seguindo Kovacci (1992) que ser discutida mais adiante, um objeto em posio de tpico
sem pronome resumitivo no comentrio associado a uma estratgia de foco, e no, de topicalizao.

Amanda Verdan Dib, Paulo Pinheiro-Correa; p. 139-155.

143

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

(5) La escuela primaria hice en casa (no la secundaria).


Kovacci chama a ateno, neste exemplo, como viemos discutindo, de que no toda
anteposio que serve para topicalizar. Neste caso, a anteposio do objeto um rema
contrastivo e vai acompanhada de reforo acentual (KOVACCI, 1992, p.248). Desta
maneira, a autora define claramente a construo de anteposio de objeto do exemplo como
foco contrastivo (relido pela GDF como contraste) e a associa a uma proeminncia acentual
tpica dessas construes2.
Dessa maneira observa-se que EA e PB se comportam de maneira contrria quanto
retomada de referentes em funo de tpico no comentrio: a TOP, que envolve a noretomada de referentes no comentrio, em EA est associada aos sujeitos e os objetos esto
diretamente associados ao DE. Em PB, a TOP envolve objetos e o DE envolve sujeitos que
so recuperados no comentrio.
1.4. Hiptese
Partimos da hiptese de que os resultados em PB apresentem indcios de uma
tendncia manuteno da marcao de tpico na legendagem. Para isso, nos baseamos em
Pontes (1987), que argumenta que o PB uma lngua de proeminncia de sujeito e de tpico.
Igualmente, seguimos Pezatti (2012) que, numa anlise das diferentes construes do PB,
conclui que esta uma lngua categorial tpico-orientada, o que significa que as construes
categricas da lngua (em oposio s tticas e s apresentativas) se constroem orientadas para
o tpico.
Assim, esperamos que a orientao para o tpico, caracterstica que os estudos
contemporneos vm revelando ser cada vez mais clara no PB, se manifeste na legendagem,
apesar das especificidades da traduo audiovisual, comentadas na seo (1.2) acima.
1.5. Objetivo
O objetivo deste trabalho , com base na anlise de um corpus com os dilogos de um
produto audiovisual, detectar construes marcadas no espanhol que apresentam a funo

O itlico corresponde ao sublinhado do original e faz referncia proeminncia acentual.

Amanda Verdan Dib, Paulo Pinheiro-Correa; p. 139-155.

144

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

informativa tpico e verificar, no seu processo de traduo ao portugus na elaborao das


legendas as seguintes possibilidades: i. se os tpicos permanecem como funo marcada; ii. se
a construo permanece marcada na legendagem com outro recurso diferente do tpico; ou iii.
se a construo deixa de ser marcada.
2. Metodologia
A fim de alcanar os objetivos acima descritos, escolhemos o filme El secreto de sus
ojos (2009), para anlise. A escolha de tal filme se deve a estudos preliminares por ns
conduzidos que o revelaram como uma boa fonte de dados para o estudo das funes tpico e
foco na variedade argentina do espanhol em legendas de filmes. Quisemos dar continuidade
aos estudos preliminares acerca do tema das funes informativas e, consequentemente,
analisar o filme com mais profundidade, uma vez que o projeto relaciona duas grandes reas:
a Lingustica Funcional e a Traduo Audiovisual. Para tanto, escolhemos trabalhar com o
estudo comparado de corpora, pelo qual este trabalho se insere no campo da Lingustica de
Corpus, campo sobre o qual discorreremos brevemente nesta seo, com o objetivo de situar a
pesquisa de que se ocupa este artigo no referido campo de pesquisa.
Baker (1995, p. 225) ao analisar o uso de corpora nos estudos de traduo, d uma
definio contempornea de corpus, em oposio a definies que vigoravam anteriormente.
Assim, segundo a autora:
(i)Um corpus hoje em dia significa basicamente uma coletnea de textos
legveis em computador e capazes de serem analisados de forma automtica
ou semi-automtica de vrias maneiras; (ii) j no restrito a escritos mas
inclui a linguagem falada, bem como textos escritos, e (iii) pode exibir
grande quantidade de texto proveniente de uma variedade de fontes, de
muitos autores e falantes e com diversidade de assuntos.3

Entre os tipos de corpora adequados aos estudos de traduo, ela menciona trs tipos:
corpora paralelos, multilngues e comparveis.
Nosso estudo utiliza um corpus paralelo, devido especificidade dos dados. Um
corpus paralelo pode ser definido como aquele que contm textos-fonte e suas tradues,
3

Traduo dos autores, do original em ingls: (i) corpus now means primarily a collection of texts held in
machine-readable form and capable of being analyzed automatically or semi-automatically in a variety of ways;
(ii) a corpus is no longer restricted to writings but includes spoken as well as written text, and (iii) a corpus
may include a large number of text from a variety of sources, by many writers and speakers and on a multitude
of topics.

Amanda Verdan Dib, Paulo Pinheiro-Correa; p. 139-155.

145

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

podendo ser bilngues ou multilngues, uni-, bi- ou multidirecionais (MC ENERY; XIAO,
2007, entre outros). Neste sentido, o corpus que constitumos, contendo o texto original em
EA e a legendagem desse texto em PB pode ser considerado bilngue e unidirecional, por
envolver apenas duas lnguas e por no possuir a contraparte de textos originais em outra
lngua que no o EA.
Para o objetivo desta anlise, era necessrio analisar enunciado por enunciado em cada
lngua e a sua relao entre eles. Com a finalidade de obter um paralelismo semi-automtico
entre as falas originais e as legendas, utilizamos o software gratuito de alinhamento on-line
YouAlign (Terminotix Inc., 2009-2014), o qual nos permitiu ordenar lado a lado os dilogos
roteirizados em espanhol e suas legendas correspondentes em portugus, em um nico
arquivo.
Uma caracterstica deste software que o alinhamento todo realizado on-line, ou
seja, depois que o pesquisador se cadastra no site: www.youalign.com, deve alimentar o
programa com os arquivos correspondentes. O procedimento passa a ser descrito a seguir:
(i.) deve-se manter apenas a legenda nos arquivos, no nosso caso, retirando a marcao
de tempo e nmeros de falas do arquivo de legendas original;
(ii.) deve-se ter um arquivo separado para os dados de cada lngua (o programa admite
arquivos de Word ou mesmo PDF);
(iii.) inserir os dois arquivos, separadamente, no site, para o alinhamento, na pgina
Alignment Settings;
(iiii.) solicitar o alinhamento, que realizado automaticamente, e o programa oferece
duas opes de salvamento do arquivo alinhado, com as extenses HTML ou TMX. Optamos
por salv-lo em arquivo HTML. Ainda que quase todo o alinhamento seja realizado
automaticamente, algumas correes devem ser feitas pelo pesquisador.
O programa revelou-se sensvel inclusive aos casos em que no houve legendagem
para algum segmento falado, deixando o espao correspondente em branco e, para os casos
em que a legendagem no corresponde ao enunciado original, o programa reconhece o espao
e o completa com a legenda correspondente, ainda que esta no apresente marcas lxicas ou
morfolgicas comuns com o enunciado original.
A etiquetagem das funes informativas se deu de maneira manual no arquivo j
alinhado.

Amanda Verdan Dib, Paulo Pinheiro-Correa; p. 139-155.

146

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

A obteno do arquivo com as legendas em PB do filme analisado foi feita por


adaptao

de

um

arquivo

baixado

atravs

do

endereo

eletrnico

http://www.opensubtitles.com. O arquivo inicialmente obtido correspondia a uma legenda


amadora do filme, do tipo elaborado majoritariamente por internautas ou aficionados
indstria cinematogrfica, e no correspondia diretamente legenda comercial, publicada no
filme lanado em DVD. Como o projeto consiste em analisar a legenda comercial do filme,
por uma questo de credibilidade, sobretudo, adaptamos cada legenda transmitida no filme em
PB para o arquivo que j possuamos. Por outro lado, o arquivo com a transcrio dos
dilogos oralizados originais do filme foi obtido no site Data base of movie dialogs
(http://movie.subtitle.com). Estes tambm foram cotejados com os dilogos que efetivamente
foram empregados no filme e revisados, quando necessrio.
Uma ltima questo metodolgica se refere ao tipo de anlise do corpus desenvolvida.
Esta partiu do levantamento das construes com tpicos marcados nos dados do EA para, a
partir delas, se observar com se comportavam as legendas correspondentes em PB,
observando-se as trs possibilidades de resoluo delineadas em (1.5), ou seja, se o tpico em
PB permanecia marcado, se a construo permanecia marcada de outra maneira sem que o
tpico fosse o marcado ou se a construo equivalente deixava de ser marcada. Dessa
maneira, fica clara nossa deciso metodolgica, de partir dos dados no idioma original. Ainda,
a pequena quantidade de dados no justificou a realizao de uma anlise estatstica e
conduziu a uma anlise de carter mais qualitativo que quantitativo.
3. Resultados e discusso
3.1. Resultados
O resultado referente ao nmero total de construes de tpico no EA e PB foi
discrepante entre uma lngua e outra. Das 53 ocorrncias de tpicos marcados, 42 foram casos
de tpicos marcados no Espanhol Argentino (EA) e 11 casos de tpicos marcados no
Portugus Brasileiro (PB), equivalente a 79% e 21% das ocorrncias totais, respectivamente,
como aponta a tabela 1:

Amanda Verdan Dib, Paulo Pinheiro-Correa; p. 139-155.

147

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Tabela 1: Tpicos marcados totais e por cada idioma (EA e PB).

Tpicos Marcados Totais

Tpicos Marcados no EA

Tpicos Marcados no PB

53
100%

42
79%

11
21%

Quanto aos processos de traduo ao portugus das construes em espanhol


envolvendo a funo tpico, feita a partir dos dilogos com base em roteiros no EA para a sua
legendagem correspondente no PB, observamos 11 ocorrncias (26%) em que a tpicos
marcados no dilogo original correspondiam tambm tpicos marcados na legendagem (este
resultado corresponde tambm aos nmeros totais de construes de tpicos marcados).
Houve 28 ocorrncias (67% dos casos) de tpicos marcados no original em espanhol que
corresponderam a construes no-marcadas na legendagem brasileira. Em 3 ocorrncias
(7%) os tpicos marcados no original em EA se resolveram com estruturas diferentes, como
outra funo informativa marcada ou uma legenda no correspondente nocionalmente ao
enunciado original. A tabela (2) abaixo elenca estes resultados:
Tabela 2: Tipos de resoluo das construes de tpico do EA na legendagem no PB.

Tpico Marcado EA>


Tpico Marcado no PB

Tpico Marcado EA>


Construo equivalente nomarcada no PB

Tpico Marcado EA>


Outras construes no PB

11
26%

28
67%

3
7%

A primeira coluna aponta os resultados totais, a segunda, a quantidade de construes


que foram traduzidas como marcadas e a terceira, aquelas que foram traduzidas como nomarcadas.
Por uma deciso metodolgica, foi importante destacar, separadamente, as
subclassificaes das construes de tpico e suas manifestaes em ambas as lnguas
analisadas. A tabela 3, abaixo, aponta as ocorrncias de topicalizao (TOP) marcadas no EA
e as resolues obtidas na legendagem em PB.
Tabela 3: Topicalizaes marcadas no EA e suas resolues ao PB.

TOPs
Marcadas em
EA (total)

TOPs Marcadas EA>


Tpico Marcado no
PB

TOPs Marcadas EA>


Construo equivalente
no-marcada no PB

TOPs Marcadas EA>


Outras construes no
PB

33 (100%)

8 (24%)

22 (67%)

3 (9%)

Amanda Verdan Dib, Paulo Pinheiro-Correa; p. 139-155.

148

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Na tabela, a primeira coluna indica os resultados totais de topicalizaes no dilogo


original, a segunda coluna, aquelas construes que permaneceram marcadas, a terceira,
aquelas que foram traduzidas de maneira no-marcada e a quarta, as construes com um
contedo nocionalmente diferente dos dilogos originais.
A tabela 4, abaixo, apresenta os resultados encontrados para os casos de deslocamento
esquerda marcados no EA e, logo, como foram resolvidos na verso ao PB. Verifica-se que
h uma discrepncia entre resultados comparados de TOP e DE entre as duas lnguas.
Tabela 4: Deslocamentos Esquerda marcados no EA e suas resolues ao PB.

DEs Marcados
EA(Total)

DEs Marcados EA>


Tpico Marcado no PB

DEs Marcados EA>


Construo equivalente
no-marcada no PB

DEs Marcados EA>


Outras construes
no PB

9 (100%)

3 (33%)

6 (67%)

Como na tabela 3, a primeira coluna indica os resultados totais, desta vez, dos
deslocamentos esquerda dos dilogos originais, a segunda coluna, aquelas construes que
permaneceram marcadas na legendagem, a terceira, aquelas que foram traduzidas de maneira
no-marcada e a quarta, as construes que trariam um contedo nocionalmente diferente dos
dilogos originais, para a qual no foi identificado nenhum caso.
Esta tabela demonstra como ser comentado com detalhe na prxima seo que
todos os casos de DE do corpus em espanhol que foram resolvidos como construo marcada
no PB se resolveram como topicalizaes.
3.2 Discusso
Como apontado na seo anterior, observamos que entre as variedades das lnguas
estudadas neste trabalho (EA e PB) no h somente semelhanas que devem ser analisadas,
mas tambm suas diferenas e as estratgias lingusticas que foram empregadas nas solues
deste procedimento tradutrio. O resultado obtido demonstra a disparidade entre as
construes com tpico marcado no EA e no PB.
3.2.1. TOP
As ocorrncias de TOP, uma das subclassificaes das construes de tpicos, como
vimos anteriormente, se manifestam de maneira similar em EA e PB quando desempenham
construes marcadas, de acordo com o corpus analisado. Houve 8 casos de TOP marcada no

Amanda Verdan Dib, Paulo Pinheiro-Correa; p. 139-155.

149

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

EA (24%), de um total de 33 casos de tpicos marcados no original, como nos exemplos (6) e
(6):
(6) (EA) No, para m la crcel toda la vida hubiera estado bien.
(6) (PB) No. Para mim, a priso perptua para ele estaria bem.
Por outro lado, dois teros das ocorrncias (n=22, 67%) foram de casos de TOP
silenciados na passagem ao PB, convertendo-se em construes no-marcadas. Nos exemplos
a seguir, as construes de tpico, com sua ordenao invertida dos constituintes no original,
foram resolvidas em PB com a manuteno da ordem SVO, considerada cannica e nomarcada. Entretanto, no possvel especular se h perda de informao semntica ou
pragmtica para o espectador, diante da especificidade da transmisso audiovisual, em que a
informao chega ao espectador por meio de vrios canais sensoriais. Seguem os exemplos
(7) e (7) e (8) e (8):
(7) (EA) Mire, ya bastante problema me trajo su quijotada con Romano.
(7) (PB) Voc j me causou muitos problemas. A sua briga com o coitado do
Romano.
(8) (EA) Ac el jefe soy yo y el subordinado es usted.
(8) (PB) Voc tem que entender que eu sou o chefe e voc, meu subordinado.
No exemplo (7), o objeto pr-verbal em EA em uma configurao OVS e em (7), do
PB, este ps-verbal, aparecendo em uma construo SVO. De maneira semelhante, os
predicativos em EA (8) aparecem antes da cpula e em (8) aparecem sistematicamente
depois da cpula e do sujeito, em PB.
3.2.2. DE
importante destacar que todos os casos de DE encontrados em EA deram resultados
em PB que no correspondiam ao recurso sinttico de marcao do enunciado original. De
acordo com os dados analisados, dos 9 casos de DE encontrados, todos os que foram
traduzidos ao PB como construes marcadas (n=3, 33%) se converteram em TOP marcada,
como em (9), (9),(10) e (10), abaixo:
(9) (EA) Los presos te los mando maana.

Amanda Verdan Dib, Paulo Pinheiro-Correa; p. 139-155.

150

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

(9) (PB) Os presos eu mando amanh.


(10) (EA) A Irene la quiero matar.
(10) (PB) A Irene, tenho vontade de matar!
Nos exemplos (11) e (11), abaixo, houve o emprego do quantificador todo em lugar
do pronome resumitivo, cumprindo estratgia sinttico-semntica referente ao SN tpico El
del mes pasado/O do ms passado, (referente ao seu salrio) que terminou por aproximar o
contedo da legenda do contedo do dilogo em udio original.
(11) (EA) El del mes pasado ya se lo chup.
(11) (PB) O do ms passado, ele j bebeu todo.
Nestes exemplos, o emprego do marcador de telicidade 4 se em se lo chup foi
traduzido por todo, que mantm a semntica tlica do evento.
Dois teros dos casos de DE obtidos no corpus em EA (n=6, 67%), no entanto, foram
resolvidos em PB como construes no-marcadas, ou seja, aquelas formadas,
principalmente, pela ordem SVO de constituintes, a chamada ordem cannica e que apresenta
maior frequncia. Os exemplos (12), (12), (13) e (13) demonstram a perda da funo
pragmtica em questo:
(12) (EA) () porque este juzgado no lo pisas ms en tu puta vida!
(12) (PB) Voc nunca mais vai voltar a pisar neste tribunal.
(13) (EA) Pero este muchacho no puede haber sido de ninguna manera.
(13) (PB) Mas no pode ter sido este garoto, de jeito nenhum.
Comparando as ocorrncias de TOP e de DE, as construes de TOP foram mais
numerosas tanto em EA quanto em PB, mantidas as propores, j que as construes
marcadas em PB foram aproximadamente um tero das construes marcadas do EA.
Curiosamente, dois teros das construes tanto de TOP quanto de DE originais deixaram de
ser marcadas na legendagem brasileira, sendo construdas na ordem SVO.

A telicidade uma noo semntica que se refere realizao de um evento em sua completude. No exemplo
em questo, dizer se lo chup atribui ao evento de beber um trao semntico indicador que este se deu
inteiramente, que no sobrou nada da bebida consumida. Em sentido figurado, faz referncia ao fato de o
personagem, por ser alcolatra, ter gasto integralmente o salrio com bebida.

Amanda Verdan Dib, Paulo Pinheiro-Correa; p. 139-155.

151

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Com relao s ocorrncias de DE, o corpus em EA apresentou uma maior quantidade


de casos de DE sem comparao com o PB. Das 9 ocorrncias encontradas em EA, apenas 1
caso em PB apontou proximidade com tal subclassificao nos nveis semntico-pragmtico,
atravs do uso de um quantificador que se relacionava com o SN tpico, que foram os
exemplos (13) e (13).
Nossa hiptese inicial era a de encontrar uma grande quantidade de casos de tpicos
marcados que refletisse as observaes de Pontes (1987) e de Pezatti (2012). Os resultados
evidenciam construes de tpicos-sujeitos, mas no necessariamente, marcados, o que no
corroborou nossa hiptese. A pouca quantidade percentual de ocorrncias de tpicos
marcados nos dados das legendas em PB pode estar ligada de maneira bvia especificidade
do processo de legendagem, tal como discutido na seo 1.2, mas convm aportar outros
elementos discusso.
Pontes (1987, pp.60-63), ao analisar a traduo da obra Caminho da Perfeio, de
Teresa de vila, compara as verses elaboradas pelas monjas carmelitas portuguesas e
brasileiras e mostra uma discrepncia entre as duas verses na traduo das construes de
tpico. Enquanto na traduo portuguesa se conservam as numerosas construes de tpico
marcado da edio espanhola na qual se basearam as tradutoras, a traduo brasileira exibe
um sistemtico apagamento dos tpicos e uma reformulao das construes na estrutura
SVO. Esta observao de Pontes demonstra uma tendncia ao apagamento de construes de
tpicos marcados na lngua escrita.
Assim, alm das especificidades da legendagem, outro fator em jogo na determinao
dos resultados encontrados pode ser a tendncia ao apagamento dos tpicos marcados na
lngua escrita, uma vez que o procedimento tradutrio analisado implica a passagem da
modalidade oral para a escrita.
4. Concluso
Com base no corpus analisado, que corresponde aos dilogos originais em espanhol do
roteiro do filme O segredo dos seus olhos/El secreto de sus ojos (EA) e sua legendagem
eletrnica em PB, pudemos analisar manifestaes da funo pragmtica tpico e as sutilezas
de sua traduo nos dois idiomas relacionados.
O resultado assinalou maior frequncia de construes de tpicos marcados em EA
que em PB, o que significa que a maioria das construes originalmente marcadas no EA

Amanda Verdan Dib, Paulo Pinheiro-Correa; p. 139-155.

152

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

passaram a no-marcadas no PB, precisamente dois teros delas. Entre as construes


marcadas, o EA apresentou trs vezes mais topicalizaes que o PB e os casos de
deslocamento esquerda em espanhol se converteram em topicalizaes no PB, que no
apresentou nenhuma ocorrncia deste tipo.
Os resultados corroboraram apenas em parte a hiptese de partida, de que na
legendagem transpareceria a propriedade sinttica do PB de ser uma lngua com
caractersticas de orientao para o tpico, segundo Pontes (1987) e Pezatti (2012). Com isso,
espervamos uma grande quantidade de tpicos marcados, e o que obtivemos foi uma grande
quantidade de tpicos-sujeitos, no marcados, consoantes com as observaes de Pontes
(1987) e Pezatti (2012), mas no necessariamente com nossa expectativa de tpicos marcados.
Tal resultado poderia dever-se especificidade do procedimento de legendagem, que
determina que seja empregada uma ordem direta e construes simplificadas, mas tambm
pode estar relacionado a uma tendncia ao apagamento das construes de tpico marcado na
lngua escrita, demonstrada por Pontes (1987).
Outra hiptese, que espervamos que fosse corroborada, se confirmou. Era a de que
diante da necessidade de simplificao, a legendagem se concentrasse no nvel conceitual, da
expresso do contedo, segundo a GDF, e abandonasse a expresso de elementos do nvel
representacional que codifica informaes pragmticas, tais como as funes informativas e
ponto de vista, e a escolha que aparentemente foi feita, j que em prol da simplificao
estrutural, foram as funes informativas as que foram cortadas em dois teros dos dados da
legendagem.
Por fim, o emprego da metodologia adequada, que foi a escolha da constituio de um
corpus paralelo unidirecional que pode vir a expandir-se com incorporaes futuras foi
fundamental para a visualizao dos recursos empregados nos casos analisados. Possibilitou,
por um lado, a observao de comportamentos sistemticos, e, por outro, diferentes recursos
tradutrios empregados diante de situaes contextuais aparentemente idnticas, que no
seriam possveis de visualizar sem a utilizao deste recurso.
Referncias
BAKER, M. Corpora in Translation Studies. An Overview and Suggestions for Future
Research.
Target,
Amsterdam,
7
(2),
p.
223-243,
1995.
http://dx.doi.org/10.1075/target.7.2.03bak

Amanda Verdan Dib, Paulo Pinheiro-Correa; p. 139-155.

153

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

DIK, S. The Theory of Functional Grammar. Part 2: Complex and Derived Constructions.
Berlim e Nova York: Mouton de Gruyter, 1997. 2nd. Edition.
DURO, M. (Coord.). La traduccin para el doblaje y la subtitulacin. Madrid: Ediciones
Ctedra, 2001.
HENGEVELD, K.; J. L. MACKENZIE. Functional Discourse Grammar: A TypologicallyBased Theory of Language Structure. Oxford: Oxford University Press, 2008.
http://dx.doi.org/10.1093/acprof:oso/9780199278107.001.0001
LAMBRECHT, K. 1994. Information Structure and Sentence Form. Topic, Focus and the
Mental Representation of Discourse Referents. Cambridge, Cambridge University Press.
http://dx.doi.org/10.1017/CBO9780511620607
LERMA SANCHS, M. D. Recepo do cinema espanhol em Portugal: uma experincia
partilhada. In: DIAZ FOUCES, O. (Org.). Olhares & Miradas. Granada: Atrio, 2012.
KOVACCI, O. El comentario gramatical. Teora y prctica II. Madrid: Arco Libros, 1992.
MC ENERY, A; XIAO Z. Parallel and comparable corpora: what are they up to?. In: G. M.
ANDERMAN; M. ROGERS (Eds.). Incorporating Corpora: Translation and the
Linguist.Translating Europe. Clevedon: MultilingualMatters, 2007.
PADILLA GARCA, X.A. Pragmtica del orden de palabras. Alicante: Universidad de
Alicante, 2005.
PEZATTI, E. G. Constituintes pragmticos em posio inicial: distino entre tema, tpico e
foco. Alfa, So Paulo, 42, p.133-150, 1998.
_______. Ordenao de constituintes em construes categorial, ttica e apresentativa.
D.E.L.T.A., So Paulo, 28 vol 2, p. 353-385, 2012.
PONTES, E. O tpico no portugus do Brasil. Campinas: Pontes, 1987.
ROSS, J. Constraints on variables in Syntax. Tese (Doutorado em Lingustica),
Massachusetts Institute of Technology, Cambridge, MA, EUA, 1967.
SEDANO, M. La dislocacin a la izquierda en el discurso escrito. Estudios de Lingustica,
Alicante, 26, p. 319-341, 2012.
Programa utilizado
YouAlign. Desenvolvido por Terminotix Inc. 2009-2014. (Disponvel em www.youalign.com.
Acesso em setembro de 2014).
Filme analisado
O segredo dos seus olhos. Direo: Juan Jos Campanella. Tornasol Films, 2009.1 DVD (127
min), NTSC, color. Ttulo original: El secreto de sus ojos. Distribuidora no Brasil: Europa
Filmes.

Amanda Verdan Dib, Paulo Pinheiro-Correa; p. 139-155.

154

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Artigo recebido em: 13.10.2014


Artigo aprobado em: 25.11.2014

Amanda Verdan Dib, Paulo Pinheiro-Correa; p. 139-155.

155

A segmentao lingustica na legendagem para surdos e ensurdecidos


(LSE) de Amor Eterno Amor: uma anlise baseada em corpus1
Linguistic segmentation in the subtitling for the deaf and hard-of-hearing (SDH) of the
Brazilian TV soap opera Amor Eterno Amor: a corpus-based analysis
Vera Lcia Santiago Arajo *
talo Alves Pinto de Assis**
RESUMO: A segmentao na legendagem
relaciona-se diviso dos dilogos de uma
produo audiovisual em legendas, a qual
pode ser realizada a partir de trs critrios: a)
visual pelo corte; b) retrico pelo fluxo
da fala; c) lingustico pela sintaxe. Os
resultados de uma pesquisa realizada pelo
grupo
LEAD
(Legendagem
e
Audiodescrio) da UECE (ARAJO;
NASCIMENTO, 2011) sugeriram que uma
segmentao lingustica adequada pode
garantir uma
leitura confortvel
comunidade surda mesmo quando a legenda
possui velocidades de 160 e 180 palavras por
minuto. O presente trabalho teve por objetivo
analisar e descrever como acontecem os
problemas de segmentao lingustica na
LSE de um captulo da telenovela Amor
Eterno Amor. A metodologia envolveu uma
anlise descritiva baseada em corpus. Os
problemas
de
segmentao
foram
identificados a partir de etiquetas criadas com
base no trabalho de Chaves (CHAVES, 2012;
CHAVES; ARAJO, 2014). Aps o
processo de anotao, o corpus foi analisado
com o auxlio do programa Wordsmith Tools
5.0. Os resultados apontaram para uma
grande quantidade de problemas de
segmentao lingustica, em cerca de 25,5%
do total de legendas. Os problemas
apareceram com mais frequncia na ordem
dos sintagmas verbal e nominal em legendas
de 3 linhas e com velocidade alta.

ABSTRACT: Segmentation in subtitling is


related to the division of the dialogues on
films and TV programs into subtitles, which
can be carried out according to three criteria:
a) visual based on the cuts; b) rhetorical
based on the flow of speech; c) linguistic
on syntax. The results of a piece of research
(ARAJO;
NASCIMENTO,
2011)
conducted by the research group called
LEAD (Subtitling and Audiodescription in
Portuguese) at State University of Cear
(UECE) suggested that an appropriate
linguistic
segmentation
can
ensure
comfortable reading to the deaf community
even when the subtitle rate is 160 and 180
words per minute. This study aimed to
analyze and describe how linguistic-related
segmentation problems occur in the SDH of a
Brazilian TV soap opera called Amor Eterno
Amor. The methodology involved a corpusbased descriptive analysis. The segmentation
problems were identified through a tag
setting created by Chaves (CHAVES, 2012;
CHAVES; ARAJO, 2014). After the
annotation process, the corpus was analyzed
by Wordsmith Tools 5.0. The results showed
a large amount of linguistic-related
segmentation problems, in about 25,5% of
the subtitles. The problems were more
frequent in noun and verb phrases in threeline and fast subtitles.

Este trabalho apresenta resultados parciais do Projeto Segmentao na Legendagem para Surdos e
Ensurdecidos (LSE): Uma anlise baseada em corpus (Projeto CORSEL), financiado pelo CNPq. Ele tambm
traz os resultados parciais da dissertao em andamento do coautor, oriundos de uma pesquisa de TCC (trabalho
de Concluso de Curso) desenvolvida no ano de 2013 como requisito parcial para obteno do Grau de Bacharel
em Letras/Ingls da Universidade Estadual do Cear (ASSIS, 2013).
*
Universidade Estadual do Cear (UECE)
**
Mestrando Programa de Ps-Graduao em Lingustica Aplicada da Universidade Estadual do Cear (UECE).

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

PALAVRAS-CHAVE:
Traduo
Audiovisual. Legendagem para Surdos e
Ensurdecidos (LSE). Lingustica de Corpus.
Segmentao Lingustica.

KEYWORDS: Audiovisual Translation.


Subtitling for the Deaf and Heard-of-Hearing
(SDH). Corpus Linguistics. Linguistic
Segmentation.

1. Introduo
A Traduo Audiovisual (doravante tambm TAV) tem se tornado um campo fecundo
quanto elaborao de recursos para o acesso a produtos audiovisuais por parte de surdos
ensurdecidos e pessoas com deficincia visual-PcDV. No caso da comunidade surda, a
Legendagem para Surdos e Ensurdecidos (LSE) um dos meios pelos quais seus membros
podem desfrutar de novelas, peas de teatro, telejornais, programas de TV, filmes etc.
Contudo, pesquisas de recepo realizadas pelo grupo de pesquisa LEAD (Legendagem e
Audiodescrio) da Universidade Estadual do Cear (UECE) (FRANCO; ARAJO, 2003;
ARAJO, 2004, 2007, 2008) com surdos2 de todo o Brasil tm demonstrado que as legendas
do tipo closed caption oferecidas pelas emissoras de TV brasileiras precisam de ajustes,
sugerindo que os parmetros utilizados na confeco dessas legendas no atendem s
necessidades da comunidade surda brasileira.
Os resultados obtidos nessas pesquisas (ARAJO; NASCIMENTO, 2011; ARAJO,
2012), conduzidas com 34 surdos de 4 regies brasileiras, sugerem que legendas bem
segmentadas promovem uma recepo eficaz do programa televisivo legendado mesmo que
sejam rpidas (entre 160 e 180 palavras por minuto), o que nos surpreendeu, pois
acreditvamos, com base em pesquisas anteriores (FRANCO; ARAJO, 2003; ARAJO,
2004, 2007, 2008), que o principal entrave para uma recepo eficiente de filmes e programas
legendados por parte de surdos estaria na velocidade da legenda. Uma boa segmentao
acontece, segundo a literatura da rea (DIAZ-CINTAS; REMAEL, 2007; REID, 1990;
GOTTLIEB, 1994; KARAMITROGLOU,1998; IVARSSON; CARROL, 1998), quando as
falas de uma produo audiovisual so transformadas em legendas a partir de critrios que
levam em conta o corte ou mudana de cena 3 (segmentao visual), o fluxo da fala
(segmentao retrica) e a sintaxe, a semntica, a lexicogramtica, a fonologia-fontica
(segmentao lingustica).

Os ensurdecidos no foram contemplados na pesquisa, porque acreditamos que uma legenda adequada para
surdos contemplaria bastante suas necessidades, j que os surdos teriam menos acesso lngua portuguesa do
que os ensurdecidos, os quais, diferentemente dos surdos, tem o portugus como primeira lngua.
3
Para fins desse trabalho, os dois termos esto sendo usados como intercambiveis.

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

157

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Tendo em vista essas questes, temos como objetivo do trabalho aqui relatado
identificar os problemas de segmentao lingustica da LSE de um captulo da telenovela
'Amor Eterno Amor' e analis-los para descrev-los, classificando-os. Os outros tipos de
segmentao no foram analisados, dado que no se apresentaram como problemticos em
pesquisas anteriores (CHAVES, 2012; CHAVES; ARAJO, 2012) envolvendo filmes e
telenovelas. Alm da identificao e descrio-classificao, pretendemos sugerir possveis
ressegmentaes dos problemas encontrados no corpus a partir de parmetros preconizados
por pesquisadores da rea. A metodologia utilizada foi, em grande parte, uma replicao
daquela adotada na pesquisa de Chaves (CHAVES, 2012; CHAVES; ARAJO, 2014) sobre
os problemas de segmentao na LSE do filme brasileiro 'Nosso Lar'. Assim como na referida
pesquisa, a identificao, anlise e descrio-classificao dos problemas na segmentao
lingustica de 'Amor Eterno Amor' foi realizada com o auxlio de anotao por etiquetas
criadas pela autora. Aps a etiquetagem, o corpus anotado foi submetido ao Wordsmith Tools
5.0.
Este artigo est dividido nas seguintes sees alm desta introduo: na Seo 2,
apresentamos uma breve reviso de trabalhos relacionados legendagem e sua segmentao e
legendagem em interface com a Lingustica de Corpus; na Seo 3, dedicada metodologia,
discorremos sobre os processos de extrao do corpus e sua anotao, dentre outras etapas; na
Seo 4, apresentamos e discutimos os resultados da anlise do corpus e, por fim, na Seo 5,
traamos algumas consideraes finais acerca deles.
2. Legendagem
2.1 A Legendagem Closed Caption
O sistema norte-americano de legendagem, mais conhecido como closed caption, um
tipo de LSE, no qual a linha de legenda, para ser visualizada pelo espectador, necessita ser
transformada em cdigos eletrnicos e inserida na linha 21 do intervalo vertical em branco da
TV, que uma barra horizontal posta entre as imagens (ARAJO, 2008, p. 62). O sistema
brasileiro, na maioria das vezes, no edita a fala, constituindo-se quase numa transcrio e,
portanto, no atendendo maioria das especificaes tcnicas esperadas numa legendagem
voltada tanto para surdos e ensurdecidos como para ouvintes (ARAJO, 2008; ARAJO;
NASCIMENTO, 2011). Esta abordagem difere-se da europeia no que diz respeito confeco
das legendas para surdos e ensurdecidos. Os europeus adotam os mesmos parmetros para

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

158

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

ambos os tipos de legendagem, com exceo da incluso de informaes adicionais que no


podem ser recuperadas pela audio como a identificao de falantes e de efeitos sonoros.
Aqui no Brasil, os procedimentos so diferentes dependendo do tipo de legendagem.
Para os ouvintes, nos quais so legendadas produes audiovisuais estrangeiras, a legenda
segue os padres europeus, ou seja, tem no mximo duas linhas e velocidades de 145, 160 e
180 palavras por minuto (DIAZ CINTAS; REMAEL, 2007:96). Quando a velocidade da fala
maior do que 180 palavras por minuto, necessrio uma edio dessa fala por meio da
condensao, reduo (uso de palavras mais curtas) ou omisso de palavras quando seu
sentido pode ser apreendido pelas imagens. Para os surdos e ensurdecidos, produz-se uma tipo
de legendagem semelhante ao norte-americano utilizado somente para tradues
intralingusticas, j que o sistema foi criado exclusivamente para atender comunidade surda
dos Estados Unidos. A LSE produzida para os canais de TV brasileiros so tambm
intralingusticas, visto que so produzidas a partir das verses dubladas de filmes e programas
de TV em lngua estrangeira. A pesquisa realizada na UECE no concorda com essa diferena
de procedimentos, aproximando-se mais da concepo europeia de legendagem.
A LSE do tipo Closed Caption pode aparecer em dois formatos: como pop-on ou
como roll-up. A legendagem roll-up destinada a programas ao vivo, podendo ser
desenvolvida por estenotipia ou por refalamento (respeaking).

No primeiro caso, por

estenotipia, produzida por meio de um teclado de digitao rpida chamado de estentipo.


No segundo caso, por refalamento, produzida a partir de um software de reconhecimento de
voz, no qual o legendista repete o que est sendo dito na tela para que as legendas possam ser
visualizadas. As legendas do tipo roll-up aparecem na tela palavra por palavra da esquerda
para a direita. Quando a linha de legenda se completa ela desloca-se para cima e permanece
na tela at que a linha de baixo esteja tambm completa. A legendagem pop-on, por sua vez,
tambm feita por meio do estentipo, aparece na tela em bloco e sai em bloco. semelhante
s legendas exibidas tanto na TV quanto no cinema, as quais j estamos acostumados.
reservada para programas pr-gravados, como novelas e filmes. Este foi o formato analisado
no presente trabalho, j que, supostamente, por ser editvel, possibilitaria ao legendista a
elaborao de LSE de acordo com os preceitos da literatura da rea, especialmente no caso do
parmetro da segmentao, que, como j dito, foi o foco deste trabalho.

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

159

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

2.2 A Segmentao em Legendagem


A segmentao em legendagem diz respeito diviso da fala traduzida em pores de
texto escrito na parte inferior da tela. A segmentao, tal como indicamos anteriormente, pode
ocorrer de trs formas: pautada pela lingustica (sintaxe, semntica, lexicogramtica e
fonologia-fontica), pela retrica (fluxo da fala) e pelo visual (corte ou mudana de cena)
(DIAZ-CINTAS;

REMAEL,

2007;

REID,

1990;

GOTTLIEB,

1994;

KARAMITROGLOU,1998; IVARSSON; CARROL, 1998). A segmentao lingustica 4 pode


acontecer de duas formas: 1) segmentao entre linhas, a qual ocorre na diviso das falas de
uma produo audiovisual em diferentes legendas; ou 2) segmentao quebra de linha (line
break), a qual ocorre dentro da mesma legenda, envolvendo a diviso da informao entre as
duas linhas dessa legenda (DIAZ CINTAS; REMAEL, 2007, p. 173). O foco aqui recair
sobre o segundo tipo de segmentao lingustica.
Muitos tericos da TAV enfatizam a importncia de uma segmentao lingustica
dentro dos critrios supracitados para a recepo eficaz de um filme ou programa legendado.
Diaz Cintas e Remael (ibidem, p. 172) alertam que uma segmentao cuidadosa da
informao pode ajudar a reforar a coerncia e a coeso na legendagem 5. Do ponto de vista
da segmentao quebra de linha, o foco deste estudo, as legendas devem ser divididas de uma
forma que sejam autossuficientes sinttica e semanticamente, j que quando segmentamos
uma sentena, foramos o crebro a pausar o seu processamento lingustico por um momento
at que os olhos captem a prxima informao6 (KARAMITROGLOU, 1998, p. 10), sendo,
assim, necessrio que essa segmentao siga determinadas diretrizes lingusticas.
Karamitroglou (1998) considera que o processo deve se dar no mais alto nvel sinttico
possvel. Para tal, o mesmo faz uso de ndulos sintticos oriundos de uma descrio sinttica
em rvore de base gerativista, que apresentamos na Figura 1.

Reid (1990) utilizou o termo 'gramatical' ao invs de 'lingustica'. Para alm da questo terica problematizada
por Chaves (2012, p; 45), a qual sugeriu que a escolha por "lingustica" deveu-se ao fato de que a palavra
gramatical est arraigada de preconceito e por isso acaba conduzindo discusso por um vis normativo da
lngua, preferimos o termo 'lingustica' por o mesmo ser mais abrangente, porque a segmentao no envolve
somente a gramtica, ou seja o lxico e a sintaxe, mas tambm a semntica e fonologia-fontica.
5
Traduo dos autores. Original: "A careful segmentation of the information can help reinforce coherence and
cohesion in subtitling".
6
Traduo dos autores. Original: "When we segment a sentence, we force the brain to pause its linguistic
processing for a while, until the eyes trace the next piece of linguistic information."

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

160

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Figura 1 rvore sinttica usada por Karamitroglou (1998) para explicar a segmentao lingustica.
Fonte: Karamitroglou (1998, p. 9).

O autor divide a orao the destruction of the city was inevitable em seis ndulos: no
primeiro, N1, est a orao em si, constituda de sujeito e predicado (N2), os quais so
formados de sintagmas nominais e verbais respectivamente (N3). O sujeito the destruction of
the city constitudo de dois sintagmas, um nominal (the destruction) e o outro preposicional
(of the city), enquanto o predicado tem um complemento (N4). O sintagma preposicional
tambm tem entre seus constituintes um sintagma nominal (the city, N5). Por fim, temos o
lxico e a funo dentro da estrutura gramatical (N6). Para o autor, se a orao em questo
estivesse em uma legenda, ela deveria ser segmentada, idealmente, privilegiando as unidades
The destruction of the city (sujeito) na linha de cima e was inevitable (predicado) na linha de
baixo. Dessa maneira, a quebra aconteceria no mais alto ndulo sinttico a partir do qual a
segmentao de uma orao possvel, o N2, e, quando isso ocorre, [...] maior o
agrupamento de carga semntica e mais completa a informao a ser apresentada ao
crebro (ibidem, p. 9)7, facilitando, assim, a compreenso da legenda como um todo.
Um pequeno adendo a fazer a respeito da distribuio das legendas na segmentao
quebra de linha. Ao invs de utilizar os critrios de segmentao pelos critrios discutidos
anteriormente, alguns legendistas preferem segmentar pelo nmero de caracteres, produzindo
trs formatos de legendagem. No primeiro, aparece quase o mesmo nmero de caracteres
para as duas linhas, tendo um formato semelhante ao de um retngulo. No segundo e no

Traduo dos autores. Original: "This occurs because the higher the node, the greater the grouping of the
semantic load and the more complete the piece of information presented to the brain."

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

161

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

terceiro, aparecem mais caracteres na linha de cima ou na de baixo, respectivamente,


lembrando um tringulo. O Quadro 1 mostra os trs formatos:
Quadro 1: Formato das legendas na tela.

Formato
Em forma de retngulo
Em forma de tringulo com a linha de cima
maior
Em forma de tringulo com a linha de cima
menor

Legendas
O guardinha me parou por causa
de uma bobagem da placa que caiu!
Um tutuzinho de feijo,
um lombinho.
[Deolinda] j imaginava,
por isso fiz o tutuzinho logo hoje.

Fonte: Os autores.

Karamitroglou (ibidem, p. 10) acredita que o ideal seria que a legenda de duas linhas,
a qual pode ter at 39 caracteres em cada linha, tivesse um formato retangular, ao invs do
triangular, por ser aquele ao qual os telespectadores esto mais acostumados. Contudo,
quando as questes lingusticas no permitirem esse formato, os triangulares podem ser
acessados. No que diz respeito ao captulo de 'Amor Eterno Amor' em foco, quando foram
propostas novas legendas conforme as diretrizes dos pesquisadores da rea para a
segmentao quebra de linha (DIAZ-CINTAS; REMAEL, 2007; REID, 1990; GOTTLIEB,
1994; KARAMITROGLOU,1998; IVARSSON; CARROL, 1998), o formato em forma de
tringulo prevaleceu.
Por questes de espao e, como foi dito anteriormente, dado que os outros tipos de
segmentao no se apresentaram como problemticos em pesquisas anteriores (CHAVES,
2012; CHAVES; ARAJO, 2014) envolvendo filmes e telenovelas, decidimos analisar neste
trabalho apenas a segmentao quebra de linha, a qual ser chamada aqui tambm de
segmentao lingustica.
2.3 Legendagem e Lingustica de Corpus
O uso da Lingustica de Corpus como metodologia nos Estudos da Traduo comeou
a ser preconizado por Baker (1993). Na Traduo Audiovisual, por sua vez, a anlise baseada
em corpus vem ganhando cada vez mais espao entre os pesquisadores, sem ser ainda,
contudo, grande o arcabouo terico formado pela interface entre essas duas reas
disciplinares. A partir dos objetivos do presente trabalho, iremos detalhar, a seguir, as duas

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

162

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

pesquisas que

embasaram nosso estudo. So, a saber: Perego (2008) e Chaves (2012;

CHAVES; ARAJO, 2014).


Por meio da anlise manual de um corpus de filmes, Perego (2008) examinou casos de
m segmentao na legendagem interlingustica para ouvintes. Em seu trabalho, a autora
investigou a segmentao lingustica de um corpus heterogneo de legendas de filmes para
DVD e para cinema. A autora definiu categorias para a anlise dessa m segmentao como
quebra do sintagma nominal, quebra do sintagma preposicionado, quebra do sintagma verbal
e quebra da orao complexa em seus constituintes, as oraes coordenadas e subordinadas.
Mesmo sem a utilizao de uma anlise baseada em corpus, como nos propusemos a fazer em
nosso estudo, foi o trabalho de Perego que motivou e serviu como ponto de partida para a
produo de etiquetas de Chaves (2012; CHAVES; ARAJO, 2014) para a anlise de
aspectos tcnicos (nmero de linhas e caracteres, velocidade, tempo inicial e final da legenda)
e, principalmente, de problemas de segmentao na LSE do filme brasileiro 'Nosso Lar'.
Na questo relativa anlise da segmentao lingustica, Chaves (ibidem) utilizou os
pressupostos de Karamitroglou (1998) sobre a importncia de ela ocorrer no mais alto nvel
sinttico possvel. Para as definies de orao e dos vrios tipos de sintagmas na sintaxe do
portugus brasileiro, necessrias para a anlise dos problemas de segmentao lingustica, a
autora fez uso da abordagem descritiva de orientao formalista de Perini (2010). Chaves
(2012; CHAVES; ARAJO, 2014) formulou 3 etiquetas indicativas de problemas de
segmentao (lingustica, retrica e visual) e 8 para anlise de parmetros tcnicos da LSE
(nmero de linhas e caracteres, velocidade, tempo inicial e final da legenda). A partir dos
conceitos, nomenclaturas e observaes de Perini (2010) sobre a gramtica do portugus
brasileiro, a autora elencou um nmero de 19 subetiquetas referentes a categorias de
problemas de segmentao lingustica. Os resultados apontaram para uma maior quantidade
de problemas de segmentao lingustica no nvel do sintagma verbal e nominal (41 e 26%,
respectivamente), majoritariamente na quebra verbo+verbo, e em legendas com velocidade
considerada alta (160 e 180 palavras por minuto). Abaixo, o Quadro 2 referente aos
problemas de segmentao identificados por Chaves.

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

163

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Quadro 28 Quadro de etiquetas de problemas de segmentao de Chaves.

Fonte: Chaves (2012, p. 58)

Usando como ponto de partida as etiquetas da autora e valendo-se do pressuposto


terico de que

[...] mesmo a ao mais simples imaginvel, a de contar palavras ou

identificar

pontuao

pressupe

uma

teoria

lingustica

(GREFENSTETTE;

TAPANAINEN, 1994; NUNBERG, 1990, apud SANTOS, p. 58) o mais coerente possvel
com o objetivo e o desenho metodolgico no mbito do Projeto CORSEL este ser mais
detalhado na seo 3.1 como um todo, passamos a embasar a anlise da segmentao
lingustica a partir de um vis funcionalista, j que essa vertente dos estudos lingusticos
possui uma maior aproximao epistemolgica com a metodologia baseada em corpus. Para
tal, a Nova Gramtica do Portugus Brasileiro(CASTILHO, 2012) pela grande riqueza de

Para mais detalhes sobre as diferenas entre as nossas etiquetas e as de Chaves, ver Assis (2013).

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

164

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

detalhes desta no que se refere descrio dos sintagmas e das sentenas 9 complexas10 da
lngua portuguesa brasileira, sendo menos sinttica11 que a descrio de Perini (2010) foi
adotada. Para Castilho (p. 249), a estrutura sinttica da sentena fundamenta-se nos arranjos
lexicais de que ela formada, os sintagmas, bem como nas funes que decorrem do
relacionamento desses sintagmas, sendo estes um somatrio de constituintes que apresentam
um lugar previsvel dentro na estrutura da sentena. Ainda segundo o autor, o sintagma tem
uma estrutura composta por um NCLEO, uma margem esquerda, preenchida ou no pelos
chamados ESPECIFICADORES do sintagma, e por uma margem direita, preenchida ou no
pelos ditos COMPLEMENTADORES. No Quadro 3, mostramos os vrios tipos de sintagma
reconhecidos por Castilho e a estrutura geral de cada um bem como a estrutura geral dos dois
tipos de sentena.

Quadro 3: Estrutura geral dos sintagmas e sentenas complexas (CASTILHO, 2012).

Sintagma
Verbal (SV)
Sintagma
Nominal
(SN)
Sintagma
Adjetival
(SAdj)

O SV a construo que tem como ncleo o verbo. Como a sentena um


verbo que articula seus argumentos, a nica diferena entre ele e uma sentena
que no SV no figura o sujeito.
O SN uma construo cuja estrutura tem por ncleo um substantivo ou um
pronome, tendo por Especificador o artigo e os pronomes e por
Complementadores os SAdjs e os SPs.
O SAdj tem por Ncleo o adjetivo, que uma classe basicamente predicadora,
funcionando como adjunto adnominal, enquanto constituinte do sintagma
nominal, ou como predicativo, enquanto constituinte do sintagma verbal
(CASTILHO, 2012, p. 516). O SAdj tem como Especificador advrbios
predicativos qualificadores e como Complementador SPs e sentenas
substantivas objetivas.

Segundo o autor, a designao da sentena no pacfica na literatura (p. 58), ao passo que podemos
encontrar [...] termos tais como orao, frase, perodo (conjunto de oraes) etc. (ibidem). No Glossrio de sua
obra, Castilho, define o vocbulo sentena da seguinte forma: 1. Sentena ou orao a unidade da sintaxe
estruturada por um verbo que seleciona o seu sujeito e seus complementos. Os adjuntos tambm integram uma
sentena, mas no so selecionados pelo verbo [...] (p. 691). Ao que nos parece, o autor considera os dois
termos intercambiveis, apesar de preferncia pela utilizao de sentena. Esta pressuposio confirma-se pelo
fato de que no vocbulo orao, h uma remisso ao vocbulo sentena expressa por Veja Sentena (p.
686). Em nossa anlise preferimos utilizar o termo orao, pois, se sentena e orao so intercambiveis, a
utilizao deste ltimo se torna menos obscura. Inclusive, o termo sentena nem mesmo consta Nomenclatura
Gramatical Brasileira, ao contrrio de orao.
10
No captulo intitulado A Sentena Complexa e sua Tipologia, Castilho (2012) afirma que o termo sentena
complexa preferido no lugar de perodo, dado que este no apresenta uma unidade sinttica diferente da
sentena simples, ou seja, tudo o que ocorre numa sentena simples ocorre numa sentena complexa(p. 336).
Dado que no h uma diferena alm de terminolgica em relao a esses dois termos, iremos utilizar em nossa
anlise os termos orao coordenada e orao subordinadas (perodos compostos) pelos mesmo motivo
supracitado.
11
Por ser menos sinttica, ela nos permitiu compreender de forma mais substancial os problemas de
segmentao lingustica.

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

165

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Sintagma
O SP tem por ncleo a preposio, por Especificador o advrbio, enquanto que
Preposicional o Complementador em um SP tambm pode ser: (i) um verbo, como em para
(SP)
comer, (ii) um pronome, como em para mim, para quem; (iii) um
quantificador definido, como em para dois; (iv) um quantificador indefinido,
como em para muitos, dentre outras possibilidades de realizao.
Sintagma
O SAdv tem como ncleo o advrbio e como Especificador e Complementador
Adverbial
outros advrbios. Sintaticamente, Castilho (2012) diz que os advrbios mantm
(SAdv)
relao entre si, com e com os adjetivos verbos, adjetivos.
Sentenas
Enunciados que possuem mais de um verbo, ou seja, contm mais de uma
Complexas
sentena, podendo estabelecer relao de coordenao, subordinao e
correlao entre si.
A partir dessa releitura, algumas etiquetas formuladas por Chaves (2012)
permaneceram intactas, sendo outras mudadas em relao nomenclatura, tendo acontecido,
tambm, alguns casos de aglutinao de diferentes etiquetas em apenas uma. Outras surgiram
ainda pelos casos inditos encontrados no corpus do presente estudo. Nossa anotao fez uso,
em relao aos tipos de problema de segmentao, de apenas u etiqueta, que foi para o
problema do tipo lingustico <PROSEGL>, pois no mais etiquetamos os problemas de
segmentao dos tipos retrico e visual. Quanto aos problemas de segmentao lingustica,
fizemos uso de 12 subetiquetas, contra as 19 de Chaves. No que diz respeito aos parmetros
tcnicos, optamos por replicar as etiquetas presentes no trabalho de Chaves, acrescentando a
etiqueta <3L>, que no apareceu em seu corpus. Apresentaremos todas as etiquetas nas
Subsees 3.2.1 e 3.2.2.
Na prxima seo, iremos tratar das etapas do percurso metodolgico, embasado,
principalmente, em ferramentas oriundas da Lingustica de Corpus.
3. Metodologia
A pesquisa teve suporte terico-metodolgico, como j mencionado, nos Estudos da
Traduo, nos estudos em TAV-LSE e na Lingustica de Corpus. A metodologia envolveu
uma dimenso descritiva pautada por anlises quanti-qualitativas baseadas em corpus.
3.1 O Corpus
O corpus do tipo especializado, composto da LSE do tipo closed caption pop-on de
um episdio da telenovela Amor Eterno Amor, produzida e exibida pela Rede Globo
entre 5 de maro e 7 de setembro de 2012, em 161 captulos, escrita por Elizabeth Jhin e com

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

166

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

direo geral de Pedro Vasconcelos. Essa LSE faz parte do Projeto CORSEL (Corpus,
Segmentao e Legendagem), que tem como objetivo a identificao e descrio-classificao
dos problemas de segmentao na LSE da TV brasileira e vinculado ao grupo de pesquisa
LEAD-UECE. Para o projeto CORSEL, foram gravadas duas semanas de programao dos
canais de TV do Brasil que oferecessem LSE do tipo closed caption pop-on. A partir da
nossa pesquisa sobre quais itens de programao da TV brasileira possuam legenda com os
requisitos acima descritos, chegamos a quatro principais tipos de programa: novelas;
seriados e programas de humor. Optamos por utilizar como corpus para o nosso recorte a LSE
de um episdio da novela Amor Eterno Amor. Escolhemos apenas um episdio da
novela em questo, em um universo de 5 que sero analisados no mbito do projeto, por
questes de espao e de no haver tempo hbil de anlise de todos os episdios para essa
publicao.
Consideramos a LSE de um episdio da novela em questo, com um total de 294
legendas e 5.181 palavras corridas 12 (tokens), como sendo representativa para a anlise feita,
mesmo constituindo-se em um corpus pequeno13. Esse nosso posicionamento se justifica pelo
fato de que, como um corpus uma amostra de um fenmeno lingustico cuja extenso no se
conhece, no se pode estabelecer o tamanho ideal representativo do fenmeno a ser descrito,
no existindo critrios objetivos para a determinao dessa representatividade, a no ser
aqueles estipuladas pelo prprio analista. Ou seja, como pontua Leech (1991, p. 27 apud
BERBER SARDINHA, 2004, p. 25), os usurios de um corpus atribuem a ele a funo de
ser representativo de certa variedade.
Para a extrao das legendas do tipo closed caption, o software CCExctractor 0.6114
foi o escolhido. Apresentamos sua interface na Figura 2.

12

Sendo computados os nmeros presentes no corpus relativos insero da legenda e aos tempos iniciais e
finais, que, se no contabilizados, somariam 2.534 palavras corridas.
13
Ao observar corpora realmente utilizados pela comunidade, Berber Sardinha (2002 apud BERBER
SARDINHA, 2004, p. 26), descreve um corpus com menos de 80 mil palavras como pequeno, por exemplo. Mas
claro que, quo mais especializado o corpus, como o nosso caso, menores so as propores do que seria
considerado como um corpus pequeno ou grande.
14
Programa freeware que pode ser baixado no domnio http://ccextractor.sourceforge.net/

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

167

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Figura 2: Interface CCExtractor.


Fonte: Os autores.

As vantagens do CCExtractor so inmeras. Alm de ter uma interface simples, sendo


fcil de operar, o programa gera um arquivo de legendagem srt. com o nmero de insero
das legendas, assim como a marcao e sincronizao das mesmas. Por vezes, contudo, o
arquivo gerado apresenta pequenas falhas que precisam ser corrigidas manualmente, como no
caso das legendas 1, 3, 6 e 715 na Figura 3.

Figura 3: Arquivo de legenda em formato srt. aberto no Bloco de Notas.


Fonte: Os autores.
15

A nossa experincia nos sugere que as legendas 1, 3, 6 e 7 apresentaram problemas, provavelmente, devido a
instabilidade do sinal em que veiculado a legendagem closed caption. Contudo, h a possibilidade de o erro ter
ocorrido na prpria confeco das legendas por parte da emissora, sendo difcil detectar com absoluta certeza em
que instncia desse processo o erro aconteceu.

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

168

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Utilizando como exemplo a primeira insero de legenda, podemos observar a


primeira linha composta do nmero 1, indicando a posio daquela legenda na sequncia de
inseres. Logo abaixo, vemos a indicao do tempo de entrada daquela insero 00:00:08,
841 e o tempo de sada 00:00:26,525, definindo assim a marcao e sincronizao daquela
legenda, ou seja, o tempo em que ela permanecer na tela.
3.2 Etiquetagem
As etiquetas16 foram feitas a partir do padro SGML (Standard Generalized Markup
Language),

que

fornece

cdigos

escritos

no

formato

<etiquetas

de

abertura>informao</etiqueta de fechamento/>, caracterizando-as e delimitando o contedo


a ser analisado. Ainda com o intuito de replicar a metodologia formulada por Chaves (2012;
CHAVES; ARAJO, 2014), utilizamos, na confeco das etiquetas, o sinal de (+) de modo a
indicar a quebra indevida da estrutura sintagmtica, caso em que ocorrem os problemas de
segmentao lingustica na maioria das vezes.
Aps o processo de anotao do corpus, feita manualmente no arquivo txt aberto no
programa Bloco de Notas17, as etiquetas puderam ser tratadas de forma adequada pelo
programa Wordsmith Tools 5.0. e analisadas com o auxlio ferramenta Concord18, que, de
acordo com Berber Sardinha (2009, p. 9), pode ser utilizada para realizar concordncias no
texto, listando palavras especficas (ndulos) juntamente com parte do texto ou cotexto em
que a mesma ocorreu.
Agora, passamos a apresentar as etiquetas.

16

Segundo a descrio de Tagnin (2010) sobre os tipos de etiquetagem, o tipo em que a nossa etiquetagem
pode ser encaixado no campo da discursiva, processo pelo qual o contedo do corpus recebe
etiquetas demarcando uma determinada parte do texto. Contudo, pela especificidade do projeto, podemos
situar nossas etiquetas como etiquetas de segmentao.
17
Editor de texto disponvel no sistema operacional Windows, da Microsoft.
18
Em Assis (2013) foi utilizada tambm a Wordlist, que produz listas de palavras dos arquivos selecionados,
contendo tanto suas frequncias absolutas, quanto percentuais, de modo a fazer uma descrio geral das
caractersticas quantitativas do corpus per se. Mas como esses resultados no apresentaram influncia direta na
anlise da segmentao, optamos por deix-los fora do estudo ora relatado.

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

169

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

3.2.1 Para os Parmetros Tcnicos


As etiquetas criadas para os parmetros tcnicos serviram, como j dito, para uma
compreenso mais abrangente dos problemas de segmentao lingustica. O Quadro 2 traz
essas etiquetas.
Quadro 4: Etiquetas para parmetros tcnicos em legendagem.

ETIQUETAS DE ANLISE DE PARMETROS TCNICOS DA


LEGENDAGEM
Nmero da legenda
<sub119>legenda1</sub1>
Linhas por legenda
<1L>, <2L> e <3L>
Tempos inicial e final de cada legenda
<t>incio --> final</t>
Nmero de caracteres por linha
(aplicada em legendas de 2 e 3 linhas)
Velocidade da legenda baixa (145ppm21)

<cpl20>

Velocidade de legenda mdia (160ppm)

<velocidade da legenda_mdia>

Velocidade de legenda alta (180ppm)

<velocidade da legenda_alta>

<velocidade da legenda_baixa>

Fonte: Os autores.

As etiquetas relativas ao nmero de linhas de cada insero de legenda foram as


seguintes: <1L>, <2L> e <3L>. Vale lembrar que a terceira no foi utilizada por Chaves
(2012; CHAVES; ARAJO, 2014) por ausncia de legendas de 3 linhas em seu corpus22,
caracterstica esta comum na legendagem do tipo closed caption pop-on analisada aqui23.
3.2.2 Para os Parmetros Lingusticos
A base de sustentao para a formulao das etiquetas relacionadas segmentao
lingustica, como j mencionado, so as consideraes de Castilho (2012) acerca dos
sintagmas e das oraes coordenadas e subordinadas, as quais seguem a vertente lingustica
funcionalista-cognitivista do autor (ibidem, p. 32). As consideraes do Castilho (ibidem), por
sua vez, so respaldadas por exemplos a partir de excertos da norma culta da lngua oral do

19

Abreviatura de subtitle, legenda em ingls.


Acrnimo de caracteres por linha.
21
Acrnimo de palavras por minuto.
22
A LSE do filme Nosso Lar seguiu os padres da legendagem comercial, que permite no mximo duas linhas
de legenda.
23
A quantidade de 3 linhas por legenda no recomendada por estudiosos de TAV por ser, segundo pesquisas
(D'YDEWALLE et al., 1987), um fator que dificulta uma boa recepo.
20

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

170

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

portugus brasileiro, sendo, assim, ideais para o nosso propsito de identificar e analisar
problemas de segmentao lingustica na legendagem closed caption pop-on de uma novela
da TV brasileira: so ideais porque, no Brasil, via de regra, as telenovelas mostram a norma
culta oral e a LSE se constitui de traduo, no meio escrito, de textos produzidos o meio oral.
O Quadro 5 traz as etiquetas.
Quadro 524: Etiquetas para problemas de segmentao lingustica em legendagem.

ETIQUETA INDICATIVA DE PROBLEMA DE SEGMENTAO


LINGUSTICA
<PROSEGL>
SUBETIQUETAS PARA O SINTAGMA VERBAL (SV)
<SV_verbo+verbo>
<SV_verbo+adv> adv=advrbio
<SV_(verbo)+oblquo+verbo>
<SV_negao+verbo>
SUBETIQUETA PARA O SINTAGMA NOMINAL (SN)
<SN_nominal_composto>
<SN_especificador+subst> subst=substantivo
<SN_conj+subst> conj=conjuno
<SN_subst+adj> adj=adjetivo
SUBETIQUETA PARA O SINTAGMA ADVERBIAL (SAdv)
<SAdv>
SUBETIQUETA PARA O SINTAGMA PREPOSICIONAL (SP)
<SP_prep+subst> prep=preposio
SUBETIQUETA PARA A ORAO COORDENADA (COORD)
<COORD_conj+orao>
SUBETIQUETA PARA A ORAO SUBORDINADA (SUBORD)
<SUBORD_conj/pronome_rel+orao> rel=pronome relativo
Fonte: Os autores.

Essas etiquetas foram elaboradas com o intuito de contemplarem aquela recomendao


de Karamitroglou (1998) ao defender que, quando uma mesma legenda tiver que ser dividida
em duas pores de texto em linhas distintas, essa quebra deve ocorrer no mais alto nvel
sinttico. As etiquetas baseadas em Castilho (2012) viabilizam a operacionalizao analtica
da recomendao porque o que ela significa que no devem ocorrer quebras entre os
sintagmas constituintes de uma dada linha de legenda, como os verbais (SVs), nominais
24

No houve ocorrncias de quebra do SAdj no corpus, sendo assim, a etiqueta correspondente a esse sintagma
foi retirada do quadro de etiquetas.

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

171

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

(SNs), adjetivais (SAdj), adverbiais (SAdvs) e preposicionais (SPs), alm das oraes
coordenadas e subordinadas, e que no seja quebrada a estrutura interna destes.
4. Problemas de Segmentao Lingustica
4.1 Resultados da Etiquetagem
Nas subsees a seguir, sero apresentados os problemas de segmentao lingustica
identificados a partir das ocorrncias de quebra de linha nas legendas em que ou as estruturas
completas de sintagmas e/ou de oraes foram indevidamente separadas ou a estrutura interna
de sintagmas e/ou de oraes foi desconsiderada. As pores de texto que deveriam aparecer
preferivelmente na mesma linha de legenda foram sublinhadas. Sero apresentados, ainda, os
resultados da anlise descritivo-classificatria dos problemas identificados, o que ser feito
pela alocao dos problemas por tipo de sintagma e de orao em subsees distintas. Pela
impossibilidade de se colocarem todas as ocorrncias encontradas no corpus dada a restrio
de espao, optamos por trazer exemplos que mostrem apenas uma s categoria de problema
por tipo de sintagma e orao. Para cada exemplo, mostramos tambm nossa proposta de
ressegmentao. H ainda duas subsees dedicadas anlise da inter-relao dos
parmetros tcnicos de velocidade e nmero de linhas da legenda com os problemas de
segmentao.
4.1.1 Sintagma Verbal (SV)
Sobre as categorias de quebra problemtica existentes no sintagma verbal, estas
geralmente acontecem dentro de um sintagma verbal composto, normalmente composto de
seu ncleo preenchido por verbo pleno numa forma nominal infinitivo, particpio ou
gerndio e especificado, ou seja, antecedido por um verbo auxiliar, como nos casos da
quebra verbo+oblquo+verbo, verbo+verbo etc. Outro caso considerado o da quebra
verbo+advrbio porque, apesar de no levar em conta constituintes que estejam relacionados
dentro de uma estrutura verbal complexa, eles so to inter-relacionados semanticamente (o
segundo modifica o primeiro) que, quando os mesmos no ocorrem vizinhos um do outro em
uma linha de legenda, o sentido imediato da linha pode ser comprometido. Na Figura 4,
mostramos um fragmento da tela da ferramenta Concord com as ocorrncias de problemas de
segmentao no SV.

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

172

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Figura 4: Fragmento de tela do Concord com ocorrncias de problemas de segmentao lingustica no SV.
Fonte: Os autores.

Ao todo, houve 41 problemas de segmentao na ordem do sintagma verbal, o que


significa 50,6% dos problemas de segmentao na LSE de Amor Estranho Amor. O Quadro
6

traz

um

exemplo

da

ocorrncia

da

categoria

representada

pela

etiqueta25

<SV_verbo+verbo>, a mais presente em todo o corpus com 16 ocorrncias ou 19,7%:


Quadro 6: Problema de segmentao lingustica - quebra no sintagma verbal.

No da
Legend
a
Sub247

Nmero
de
Linhas
2

Velocidade
da
Legenda
Baixa

Etiqueta
<SV_verbo+verb
o>

Legenda
[GRACINHA]
J
VALE
FICAR
TRABALHANDO
COM FEBRE, ?

Fonte: Os autores.

Para exemplo dos casos de quebra da estrutura verbo+verbo, observemos a legenda


247, que possui um sintagma verbal complexo vale ficar trabalhando e um advrbio
anteposto j, os quais deveriam permanecer juntos para que o legendista tivesse seguido a
recomendao de Karamitoglou (1998). Se considerarmos o parmetro da sintaxe na
segmentao lingustica, esta legenda deveria ficar assim:
[GRACINHA] J VALE FICAR TRABALHANDO
COM FEBRE, ?

25

Nos casos em que a legenda contm mais de um problema de segmentao lingustica, apenas o problema do
sintagma discutido na subseo correspondente ressaltado com o sublinhado.

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

173

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

interessante notar que, nessa ressegmentao, a segmentao lingustica prevalece,


como defende Karamitroglou (1998), em relao ao formato considerado ideal pelo terico:
linha de cima e de baixo quase do mesmo tamanho, conforme os tipos de formato descritos no
Quadro 1. Como dissemos anteriormente, esse no foi o padro observado na legendagem de
'Amor Eterno Amor' como um todo.
4.1.2 Sintagma Nominal (SN)
Quanto s categorias

de quebra problemtica no mbito do sintagma nominal,

identificamos quebras entre o i) Especificador e o ncleo do SN, ii) o ncleo do SN e o


adjetivo que o modifica, iii) conjunes e os substantivos a eles relacionados, iv) alm dos
casos que denominamos nominais compostos26. As quebras problemticas na ordem do
sintagma nominal aconteceram 26 vezes, isto representando cerca de 32,1% do total de m
segmentao lingustica na LSE de Amor Estranho Amor. O Quadro 7 apresenta um
exemplo da categoria anotada pela etiqueta <SN_nominal_composto>, que, com 13
ocorrncias ou 16%, ranqueou em segundo lugar:
Quadro 7: Problema de segmentao lingustica - quebra no sintagma nominal.
o

N
da Nmero
Legenda de
Linhas
Sub121
2

Velocidade

Etiqueta

Legenda

Alta

<SN_nominal_comp
osto>

NO VAI TER EQUIPAMENTO


DE SEGURANA PRA TODO
MUNDO.

Fonte: Os autores.

Nesse exemplo, relativo legenda 121, a estrutura sublinhada que deveria estar unida
em uma mesma linha corresponde ao sintagma nominal equipamento de segurana.
Defendemos a ideia de que o exemplo em questo se configura como uma quebra na ordem
do SN se considerado o seguinte: no momento da leitura da legenda, o telespectador se depara
com o substantivo equipamento e se pergunta que equipamento?. A resposta s surge na
26

Essa etiqueta serviu de guarda-chuva, digamos, por ter aglutinado as seguintes etiquetas de Chaves:
<SN_superlativo+adj> <SN_nominal+modif/modif+nominal >, <SN_nomeprprio>,<SN_ttulo+nome prprio>,
de modo que pudesse abarcar tambm a terminologia de Castilho (2012). Alm disso, ela serviu para nomear os
casos em que o SP, enquanto Complementador do sintagma nominal, que cumpre funo adjetiva separado do
ncleo do SN. Contudo, em reunies do nosso grupo de pesquisadores, essa etiqueta tem se demonstrado
problemtica, dado, que com um nome mais geral, tenta abarcar muitas situaes especficas. certo que em
futuros trabalhos essa etiqueta ser remodelada e diluda em outras.

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

174

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

linha seguinte, onde est o sintagma preposicional de segurana, que, na verdade, funciona
como sintagma adjetival por conferir uma qualidade/caracterstica ao substantivo. Uma
possibilidade de quebra que conciliaria melhor a questo da sintaxe e a facilitao do processo
de compreenso da poro de legenda em questo est logo abaixo:
NO VAI TER
EQUIPAMENTO DE SEGURANA PARA TODOS.
Neste caso, o formato no o retangular preconizado por Karamitroglou como o que
melhor representa uma boa segmentao. Porm, esse formato triangular permite uma boa
visualizao para uma legenda com a linha superior mais curta, conforme o Quadro 1.
4.1.3 Sintagma Preposicional (SP)
Utilizando a etiqueta <SP_prep+subst>, identificamos a categoria de quebra
problemtica do sintagma preposicional que diz respeito separao entre o seu ncleo e o
seu Complementador, que, no caso do corpus do estudo ora relatado, s se realizou por
substantivo. Essa categoria ocorreu 6 vezes ou cerca de 7,4% do total de m segmentao
lingustica na LSE de Amor Estranho Amor. A categoria em apreo est exemplificada no
Quadro 8.
Quadro 8: Problema de segmentao lingustica - quebra no sintagma preposicional.
o

N
da Nmero
Legenda de
Linhas
Sub4
3

Velocidade

Etiqueta

Legenda

Alta

<SP_prep+su
bst>

O GUARDINHA
ME PAROU POR CAUSA DE
UMA BOBAGEM DA PLACA QUE
CAIU!

Fonte: Os autores.

Podemos observar na legenda 4 que h a separao, indevida a nosso ver, da


preposio de e do sintagma nominal uma bobagem. A seguir, fazemos uma proposta de
como a legenda poderia ficar se considerado o parmetro lingustico:
O GUARDINHA ME PAROU POR CAUSA
DE UMA BOBAGEM DA PLACA QUE CAIU!

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

175

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

4.1.4 Sintagma Adverbial (SAdv)


Aqui, consideramos como quebra problemtica relacionada ao sintagma adverbial a
segmentao de estruturas adverbiais compostas, isto , sempre que houve a separao entre
dado advrbio e outro lhe acrescenta informao. Essa categoria foi anotada pela etiqueta
<SAdv> e houve apenas 1 ocorrncia, representando 1,2% dos problemas de segmentao
lingustica na LSE de Amor Estranho Amor. A nica ocorrncia encontra-se no Quadro 9.
Quadro 9: Problema de segmentao lingustica - quebra no sintagma adverbial.

No
da Nmero
Legenda de
Linhas
Sub131
3

Velocidade

Etiqueta

Legenda

Alta

<SAdv>

ENTROU COM UM PROCESSO


L NA
EMPRESA
EM
QUE
ELE
TRABALHAVA,
GANHOU
UMA
GRANA
FERRADA.

Fonte: Os autores.

A legenda 131 contm um advrbio de lugar l e um sintagma preposicional com


funo de SAdv igualmente de lugar na empresa que, juntos, formam uma s estrutura
adverbial complexa. Como os dois segmentos esto em linhas distintas, houve a separao
entre um advrbio e aquele que o modifica. A nosso ver, portanto, o SAdv complexo l na
empresa deveria permanecer inseparvel em uma nica linha. Por se tratar de uma legenda
com densidade lexical alta (compe-se de 83 caracteres quando o mximo deveria ter 78
caracteres ou 39 caracteres por linha como informamos na Subseo 2.2), propor uma
ressegmentao sem considerar o tempo disponvel para a marcao uma tarefa complicada.
A legenda 131, provavelmente, teria que ou ser bem condensada ou ser ressegmentada em
duas pores de legenda. Como nossas ressegmentaes so apenas a ttulo de
exemplificao, podemos propor uma que seja condensada e respeite a segmentao
lingustica sem dividir a mesma em mais legendas. Contudo, para isso, achamos necessrio
retirar o advrbio l, redundante no contexto:
ENTROU COM UM PROCESSO NA EMPRESA
EM QUE TRABALHAVA E GANHOU BOA GRANA.

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

176

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

4.1.5 Oraes Subordinadas (SUBORD) e Coordenadas (COORD)


A identificao de quebras problemticas em oraes coordenadas e subordinadas foi
um dos aspectos analticos mais complicados, pois h uma instruo clara nos manuais de
legendagem de, sempre que possvel, deixar cada uma das oraes que formam um perodo
composto em uma linha da legenda, de forma a colocar o sentido completo de uma orao em
cada linha (IVARSSON; CAROLL, 1998). Conciliar essa instruo com uma boa
segmentao lingustica foi um desafio.
Interpretando o trabalho de Chaves (2012; CHAVES; ARAJO, 2014) e de Perego
(2008) sobre a segmentao em oraes coordenadas e subordinadas e utilizando as
perspectivas gramtico-funcionais de Castilho (2012) sobre as mesmas, definimos como
problemas de segmentao apenas os casos em que as conjunes coordenativas e
subordinativas incluindo nestas os pronomes relativos aparecem desconectadas da orao
coordenada ou subordinada que iniciam. Quebras problemticas na ordem da orao
complexa relativamente orao subordinada ocorreram 6 vezes, representando 7,4% das
ocorrncias totais na LSE de Amor Estranho Amor. O mesmo tipo de quebra, mas
relacionada orao coordenada, aconteceu apenas 1 vez ou cerca de 1,2% das ocorrncias
totais de quebras problemticas no corpus. O Quadro 10 traz um exemplo da categoria
representada pela etiqueta <SUBORD_conj/pronome_rel+orao>.
Quadro 10: Problema de segmentao lingustica - quebra em orao subordinada.

No da
Legenda
Sub21

Nmero
de
Linhas
3

Velocidade

Etiqueta

Legenda

Alta

<SUBORD_conj/pron
ome_
rel+orao>

NO TEM NADA
NESSE MUNDO QUE
SUBSTITUA CARINHO DE ME,
N?

Fonte: Os autores.

Nesse exemplo, ocorre separao entre o pronome relativo que e o restante da orao
subordinada por ele introduzida: que substitua carinho de me, n?. Uma sugesto para a
ressegmentao da legenda 21 seria:
NO TEM NADA NESSE MUNDO
QUE SUBSTITUA CARINHO DE ME, N?

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

177

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

4.1.627 Quebras Problemticas por Nmero de Linhas das Legendas


A anlise mostrou que 72 inseres tiveram 1 linha de legenda ou 24,5% do total. A
maior parte do corpus composta de legendas de 2 linhas, num total de 137 ocorrncias ou
46,6 % do total. As legendas de 3 linhas somaram 85 ocorrncias ou 28,9% do total de
inseres. A Tabela 1 mostra a relao entre os problemas de segmentao e o nmero de
linhas das legendas.
Tabela 1: Ocorrncias de problemas de segmentao por nmero de linhas das legendas.

Percentual de
problemticas
33,3%
66,7%

Nmero de linhas das legendas


2L
3L

ocorrncia

de

quebras

Fonte: Os autores.

Os problemas de segmentao lingustica s apareceram em legendas de 2 e 3 linhas,


j que a segmentao aqui analisada a de quebra de linha, que s ocorre em legendas com
mais de 1 linha. 54 ocorrncias de problemas de segmentao de foram em legendas de 3
linhas, o que significa 66,7% do total. Os outros 27 problemas apareceram em legendas de 2
linhas, o que representa 33,3% das ocorrncias.
4.1.7 Quebras Problemticas por Nvel de Velocidade das Legendas
Quanto velocidade, em um universo de 294 legendas, a maior frequncia de
ocorrncia no corpus foi de legendas com velocidade alta, em um total de 169 ou 57,5% do
total. A segunda maior foi a de legendas com velocidade baixa, perfazendo 95 inseres ou
32,3% do total. Por ltimo, as legendas com velocidade mdia foram em nmero de 30, ou
10,2% do total. Abaixo, apresentamos a Tabela 2 com os percentuais de problemas de
segmentao por nvel de velocidade.

27

Para efeitos de anlise, apenas alguns dos parmetros tcnicos foram levadas em conta, como caracteres por
linha, nmero de linhas e velocidade da legenda, por apresentarem relaes mais intrnsecas com o parmetro da
segmentao lingustica. Os outros parmetros etiquetados foram importantes para a localizao da legenda no
corpus, como a etiqueta que indica o nmero da legenda e a que delimita os tempos inicial e final da legenda.
Apesar de ter sido importante para o clculo da velocidade da legenda, o parmetro tcnico de caracteres por
linha (<cpl>), por no ter apresentado uma relao to forte com a segmentao como os parmetros de
velocidade e nmero de linhas, decidimos, pelo espao limitado no inclu-lo nas subsees de inter-relao
entre parmetros tcnicos e problemas de segmentao.

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

178

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Tabela 2: Ocorrncias de problemas de segmentao por nvel de velocidade.

Nvel de velocidade das legendas


Alto
Mdio
Baixo

Percentual de
problemticas
76,5%
12,4%
11,1%

ocorrncia

de

quebras

Fonte: Os autores.

A tabela mostra que, no que concerne relao entre as velocidades das legendas e os
problemas de segmentao encontrados, foi nas legendas com velocidade alta que os
problemas predominaram: 62 ou 76,5% das ocorrncias. O segundo lugar foi ocupado pelas
legendas com velocidade mdia, com 10 problemas ou 12,4% das ocorrncias. Em ltimo
lugar, ficaram a legendas com velocidade mdia, com 9 problemas ou 11,1% das ocorrncias.
4.2 Sistematizao e Discusso Geral dos Resultados
Sistematizando os resultados quantitativos decorrentes dos dados provenientes da
anlise baseada em corpus que viabilizou a identificao e a descrio classificatria dos
problemas de segmentao lingustica na LSE da novela Amor Eterno Amor, temos o
Grfico 1:
Grfico 1: Sistematizao dos resultados dos problemas de segmentao lingustica na LSE da novela Amor
Eterno Amor.
SUBORD
SP COORD
7,40%
7,40% 1,20%
SAdv
1,30%

SV
50,60%
SN
32,10%

Fonte: Os autores.

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

179

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Como possvel observar no Grfico 1, o maior nmero de problemas ocorre nas


ordens do SV, com contribuio de 50,6%, e do SN, com participao de 32,1%, o que
corrobora os resultados de Chaves (CHAVES, 2012; CHAVES; ARAJO, 2014). Alm
disso, assim como no trabalho de Chaves, a estrutura em que houve mais ocorrncias de
quebras problemticas foi em verbo+verbo, assim como a maior parte dos problemas de
segmentao lingustica encontrados aconteceram em legendas com velocidade considerada
alta (cf. Subseo 2.3).
Os resultados semelhantes de que obtivemos em relao Chaves sugerem, mesmo
em gneros ficcionais audiovisuais diferentes (telenovela e filme em DVD), o que pode se
apresentar como uma tendncia para a segmentao lingustica em gneros ficcionais. Porm,
ainda cedo para apontar de forma substancial padres caractersticos da segmentao
lingustica no Brasil, o que ser possvel com o aumento de corpus analisado em tamanho e
variedade de gnero.
Contudo, apesar das similaridades entre os resultados de Chaves e o presente
trabalho, inegvel, se examinados os nmeros provenientes da anlise da LSE no captulo da
novela Amor Eterno Amor, a grande relevncia que os problemas de segmentao
lingustica tm no corpus. Ao todo, identificamos 81 problemas, todos anotados pela etiqueta
<PROSEGL>. Estes, de uma forma geral, aparecem em 75 legendas em um universo de 294,
representando 25,5% do corpus. Ou seja, a cada quatro legendas, um pouco mais de uma
possui problema de segmentao, teoricamente dificultando bastante a compreenso do texto
traduzido. Nas legendas de 2 linhas, cerca de 19,7% delas (27 casos em 27 legendas
diferentes) possuem algum tipo de problema de segmentao, seja na ordem do sintagma ou
da orao complexa. Nas legendas de 3 linhas, a porcentagem foi ainda maior, com 56,4%
destas (54 casos em 48 legendas diferentes) apresentando uma ou mais ocorrncias de algum
tipo de problema de segmentao lingustica, j que algumas legendas de 3 linhas
apresentaram mais de um caso.
O grande nmero de legendas com uma velocidade considerada alta e de 3 linhas no
foi algo de inteiro surpreendente, j que isso s refora a noo equivocada da
legendagem para surdos da TV brasileira, em desacordo com os parmetros estabelecidos
pelos pesquisadores da rea. A alta velocidade das legendas resultado previsvel, se
considerado que a legenda closed caption no Brasil muito mais uma transcrio da fala do

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

180

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

que um processo tradutrio que siga os preceitos dos estudiosos da Traduo


Audiovisual, especificamente a LSE
Com todos esses resultados, pudemos identificar, de uma forma mais geral, o padro
de m segmentao lingustica no corpus: na maioria das vezes, nos sintagmas verbal e
nominal em legendas de 3 linhas e com velocidade alta. O fato de a segmentao ter sido
problemtica nas legendas mais longas as de 3 linhas e de velocidade alta se impe como
fator complicador para a recepo de produtos legendados, de acordo com o que estipula a
literatura da rea em relao LSE. A partir dos resultados obtidos, podemos caracterizar a
LSE no captulo de Amor Eterno Amor em questo como fora dos padres de uma
legendagem confortvel de ser consumida pelos telespectadores surdos e ensurdecidos.
5. Consideraes Finais
Nossas concluses sobre a segmentao lingustica estudada na telenovela Amor
Eterno Amor s foram possveis graas metodologia baseada em corpus proposta por
Chaves (2012; CHAVES; ARAJO, 2014) para a anlise do parmetro lingustico em
questo, mesmo com os poucos dados analisados aqui. Isso foi motivado, contudo, pelo
tamanho e tempo restritos da prpria pesquisa. A partir disso, nos foi mais interessante
estudar uma pequena quantidade de legendas, que nos possibilitou empreender uma anlise
que desse mais vazo interpretao qualitativa de nossos dados. Isso seria difcil de fazer
com um grande corpus em to pouco tempo, sendo, portanto, prefervel fazer um simples
empilhamento de dados quantitativos.
A metodologia baseada em corpus tambm nos permitiu

observar, de forma

concomitante anlise da segmentao lingustica em Amor Eterno Amor, uma amostra


das caractersticas tcnicas da LSE da TV Brasileira, contribuindo, assim, com nossos
resultados, para a pesquisa em LSE realizada na UECE desde 2002, a qual visa estudar como
esse tipo de Legendagem caracteriza-se e como ela recebida pelo seu pblico alvo, os surdos
e ensurdecidos. O Projeto CORSEL, ao qual os resultados desta pesquisa esto atrelados, est
filiado nessa perspectiva. Este, ao seu fim, permitir uma caracterizao mais conclusiva a
respeito das caractersticas tcnicas e de como acontece a segmentao lingustica na LSE do
Brasil a partir da abrangncia em quantidade e diversidade genrica de narrativas audiovisuais
que o projeto pretende abarcar.

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

181

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

A anlise dos parmetros tcnicos da legendagem closed caption no corpus foi


bastante importante para a compreenso dos problemas de segmentao lingustica
encontrados, tendo embasado nossas consideraes acerca destes e possibilitado uma
correlao entre ambos. Para alm disso, essa anlise propiciou o que parece ser as
caractersticas tcnico-lingusticas da LSE na TV brasileira: legendas em sua maioria de
velocidade alta, de 3 linhas e com uma grande quantidade de problemas de segmentao de
ordem lingustica. Do ponto de vista dos parmetros lingusticos, os resultados apontaram o
sintagma verbal e o nominal como os mais problemticos em relao aos casos de m
segmentao no corpus, tal como aconteceu em Chaves (2012; CHAVES; ARAJO, 2014).
Os dados resultantes do estudo que acabamos de relatar e dos demais no mbito do
CORSEL podero, no futuro, possibilitar novas pesquisas dentro da interface Lingustica de
Corpus/LSE. Entre estas, por exemplo, est a elaborao e compilao de um corpus
eletrnico de LSE acessvel por computador, visando a consulta por legendistas e/ou seu
treinamento atravs da plataforma do Projeto CoMET Corpus Multilngue para o Ensino e
Traduo28, um corpus monolngue e paralelo voltado para pesquisadores e profissionais de
legendagem, com o qual j mantemos link acadmico. Outra possibilidade de utilizao dos
dados do Projeto CORSEL, assim como da presente pesquisa, na investigao experimental
com o auxlio de rastreamento ocular para o estudo da real influncia do parmetro da
segmentao na recepo de legendas por pessoas surdas-ensurdecidas e ouvintes. Essa
pesquisa se faz necessria, pois, apesar de ser um parmetro considerado como essencial para
a confeco de uma boa legendagem, o mesmo ainda carece de pesquisas experimentais que
possam mensurar, de fato, a sua contribuio no processo de compreenso do produto
legendado, sendo este um dos prximos passos da pesquisa em LSE pelo grupo LEAD na
UECE, com auxlio da metodologia fornecida pela Lingustica de Corpus.

Referncias Bibliogrficas
AMOR ETERNO AMOR. Direo: Pedro Vasconcelos. Brasil: TV Globo, 2012, 161
captulos. sonor. color. Legenda CC disponvel.
ARAJO, V. L. S. Closed subtitling in Brazil In: ORERO, P. (org.). Topics in Audiovisual
translation. Amsterd: John Benjamins Publishing Company, v. 1, p. 199 - 212, 2004.
http://dx.doi.org/10.1075/btl.56.20san
28

http://www.fflch.usp.br/dlm/comet/

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

182

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

ARAJO, V.L.S. Subtitling for the deaf and hard- of - hearing in Brazil In: ORERO, P.;
REMAEL, A. (orgs.). Media for All: Subtitling for the Deaf, Audio Description and Sign
Language. Kenilworth: Nova Jersey, EUA: Rodopi, v. 30, p. 99- 107, 2007.
ARAJO, V. L. S. Por um modelo de legendagem para Surdos no Brasil. In VERAS, V.
(org.). Traduo e Comunicao, Revista Brasileira de Tradutores, So Paulo: UNIBERO,
n. 17, p. 5976, 2008.
ARAJO, V. L. S.; NASCIMENTO, A. K. P. Investigando parmetros de legendas para
Surdos e Ensurdecidos no Brasil. In: FROTA, M. P.; MARTINS, M. A. P. (orgs.). Traduo
em Revista, v. 2, p. 1- 18, 2011.
ARAJO, V. L. S. Legendagem para surdos: em busca de um modelo para o Brasil.
Relatrio Tcnico n. 306948/2008-7. Fortaleza: CNPq. Fev/2012.
ASSIS, . A. P. A segmentao na LSE de Amor eterno Amor: uma anlise baseada
em corpus. (Bacharelado em Letras Ingls). Universidade Estadual do Cear, FortalezaCE, 2013.
BAKER, M. Corpus Linguistics and Translation Studies: Implications and Applications. In:
Baker, M.; Francis, G.; Tognini - Bonelli, E. (orgs.). Text and technology: In honour of
John Sinclair. Philadelphia, Amsterdam: John Benjamins, p. 233- 250, 1993.
http://dx.doi.org/10.1075/z.64.15bak
BERBER SARDINHA, T. Lingustica de Corpus. Barueri, So Paulo: Manole, 2004, 410 p.
BERBER SARDINHA, T. Pesquisa em Lingustica de Corpus com WordSmith Tools.
Campinas: Mercado de Letras, 2009, 299 p.
CASTILHO, A. de. Nova Gramtica do Portugus Brasileiro. So Paulo: Contexto, 2012,
768p.
CHAVES, E. G. Legendagem para Surdos e Ensurdecidos: um Estudo Baseado em corpus
da segmentao nas legendas de filmes brasileiros em DVD. 126f. Dissertao (Mestrado em
Lingustica Aplicada). Universidade Estadual do Cear, Fortaleza- CE, 2012.
CHAVES, E. G.; ARAJO, V. L. S. Segmentation tags: a proposal for the analysis of
subtitles. In: ALUSIO, S. M.; TAGNIN, S E. O. (orgs.) New language, technologies and
linguistic research: a two way road. Newcastle upon Thyne: Cambridge Scholars
Publishing, 2014, p. 62-75.
DIAZ- CINTAS, J.; REMAEL, A. Audiovisual Translation: Subtitling. Manchester, UK,
Kinderhook, N Y, UK : St. Jerome Publishing, 2007, 272 p.
DINIZ, N. S. L. A Segmentao em Legendagem para Surdos e Ensurdecidos: um Estudo
Baseado em Corpus. 149f. Dissertao (Mestrado em Lingustica). Universidade Federal de
Minas Gerais, Belo Horizonte-MG, 2012.

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

183

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

FRANCO, E.; ARAUJO, V. L. S. Reading Television: Checking deaf people's Reactions to


Closed Subtitling in Fortaleza, Brazil. In: GAMBIER, Y. (org.). The Translator, v. 9, n. 2,
p.249- 267, 2003.
GOTTLIEB, H. Subttling: Diagonal Translation. In: Perspective in Translatology, v.2, n.1,
p.101-121, 1994.
IVARSSON, J.; CARROLL, M.; Subtitling. Simrishamm, Sucia: TransEditHB, 1998,184 p.
KARAMITROGLOU, F. A Proposed Set of Subtitling Standards in Europe. In: Translation
Journal,
v.
2,
n.
2,
p.
115,
1998.
Disponvel
em:
<http://translationjournal.net/journal//04stndrd.htm > Acesso em: 15 de Maro de 2011.
PEREGO, E. What Would We Read Best? Hypotheses and Suggestions for the Location of
Line Breaks in Film Subtitles. In: The Sign Language Translator and Interpreter.
Manchester, UK : St. Jerome Publishing, p. 35- 63, 2008.
PERINI, M. A. Gramtica do portugus brasileiro. So Paulo: Parbola Editorial, 2010,
366 p.
REID, H. Literature on the screen: subtitle translation for public broadcasting. In: BART, W.;
DHAEN, T. (Eds.). Something understood. Studies in Anglo- Dutch literary
translation.Amsterdam: Rodopi, p. 97- 107, 1990.
SANTOS, D. Corporizando algumas questes. In: TAGNIN, S.E.O.; ARAJO, O. V. (orgs.).
Avanos da Lingustica de Corpus no Brasil. So Paulo: Humanitas, p. 41-55, 2008.
TAGNIN, S. E. O. Glossrio de Lingustica de Corpus. In: VIANA, V.; TAGNIN, S. E. O.
(orgs.). Corpora no ensino de lnguas estrangeiras. So Paulo: Hub Editorial, p. 357- 361,
2010.
WORDSMITH Tools 5.0: stio do programa disponvel em:
<http://www.lexically.net/wordsmith/index.html>. Acesso em: 17 de maro de 2013.

Artigo recebido em: 13.10.2014


Artigo aprovado em: 14.12.2014

Vera Lcia Santiago Arajo, talo Alves Pinto de Assis; p. 156-184.

184

Metforas e domnios narrativos numa perspectiva da Lingustica de


Corpus1
Metaphors and narrative domains on an approach of Corpus Linguistics
Heberth Paulo de Souza*
RESUMO: Neste artigo, desenvolve-se uma
abordagem da metfora no escopo da
cognio humana, utilizando os pressupostos
tericos da Lingustica Cognitiva no mbito
das representaes mentais e aplicando-os
descrio da articulao textual. Para
alcanar esse intento, centramo-nos em
alguns postulados do final do sculo XX que
a consideram como um recurso de facilitao
do raciocnio, atravs do qual conceitos mais
complexos so elaborados na forma de
conceitos mais simples. Considera-se
tambm que a metfora um fenmeno
presente em todos os nveis da comunicao,
no se restringindo a algumas reas e
atividades do conhecimento humano.
Baseando-se especialmente na Teoria dos
Espaos Mentais, de Fauconnier (1994), e na
Teoria da Mesclagem Conceitual, de
Fauconnier e Turner (1994), a pesquisa
desenvolveu-se sobre um corpus pequenomdio, descrevendo o papel que a metfora
exerce na articulao textual. Com o suporte
dos recursos eletrnicos do programa
WordSmith
Tools,
obteve-se
uma
sistematizao de dados quantitativos para se
proceder pesquisa qualitativa, a partir de
onde foi possvel alcanar os resultados
apresentados na tese de doutorado que deu
origem a este artigo. Entre estes, destaca-se a
constatao de que, subjacente estruturao
textual dos exemplares do nosso corpus, bem
como em outros tipos textuais que tambm
foram submetidos anlise, existe uma
forma de organizao de elementos tpica do
processo de narrao, com a identificao de
1

ABSTRACT: In this paper an approach to


metaphor, in the scope of human cognition, is
developed, taking into account theoretical
assumptions of Cognitive Linguistics within
the ambit of mental representations, and
having them applied to a description of
textual articulation. In order to achieve this
goal, we focused on a few late twentiethcentury postulates. Metaphor is thus assumed
to be a resource used to facilitate reasoning
by means of which more complex concepts
are elaborated in terms of more simple ones.
Metaphor is also considered as a
phenomenon present in all levels of
communication, not being restricted to
specific areas and activities of human
knowledge. Based especially on both Mental
Spaces Theory, by Fauconnier (1994), and on
Conceptual Blending Theory, by Fauconnier
and Turner (1994), the research was
developed with the use of a small-mediumsize corpus, describing the role that metaphor
plays in textual articulation. With the aid of
the electronic tool WordSmith Tools it was
possible to obtain a systematization of
quantitative data in order to proceed to the
qualitative research, from where the results in
the original doctoral thesis were made
available. It thus becomes clear that,
underlying the textual structuring of the
samples of our corpus, as well as in other
textual types that were also submitted to
analysis, there is a pattern of organization
considered as typical of the narrative process
that includes the identification of information
relating to time, space and characters,

Artigo-sntese de tese de doutorado defendida pelo POSLIN Programa de Ps-graduao em Estudos


Lingusticos da UFMG, em 27/08/2010, intitulada A metfora e a formao de esquemas narrativos em textos
escritos de lngua portuguesa.
*
Doutor em Lingustica pela UFMG Universidade Federal de Minas Gerais. Professor de Lngua Portuguesa e
Metodologia Cientfica no IPTAN Instituto de Ensino Superior Presidente Tancredo de Almeida Neves (So
Joo del-Rei MG).

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

informaes relacionadas a tempo, espao e


personagens, considerando-se a inter-relao
do nvel metafrico e do no metafrico.

considering the interrelationship between


metaphorical and nonmetaphorical levels.

PALAVRAS-CHAVE: Metfora. Narrativa.


Espaos Mentais. Mesclagem Conceitual.
Corpus lingustico.

KEYWORDS: Metaphor. Narrative. Mental


Spaces. Conceptual Blending. Linguistic
corpus.

1. Introduo
Desde que foi evidenciada no campo dos estudos da Filosofia e da linguagem, a
metfora vem intrigando vrios pesquisadores em virtude de algumas caractersticas que a
vinculam a fenmenos diversos, tais como: a importncia da metfora na determinao de
aspectos estilsticos do discurso, o papel da metfora na oratria e na retrica, o papel das
construes metafricas na determinao do carter literrio ou no literrio de um texto, a
relao entre metfora e o modo de pensar do ser humano, a inteligibilidade das ideias
contidas num texto em funo do seu nvel metafrico, entre outros. No foi por outro motivo
que, a partir mesmo dos filsofos da Antiguidade clssica, a metfora vem sendo abordada, ao
longo de mais de vinte sculos, sob as mais variadas perspectivas, revelando-se sempre novas
facetas desse fenmeno da linguagem, as quais se complementam, alternam-se e geram novas
pesquisas sobre o tema.
Na segunda metade do sculo XX, os estudos da linguagem assistiram ao advento de
uma rea que finalmente se consolidou como distinta de outros ramos da Lingustica e que
tem como preceito bsico o estudo do funcionamento da mente humana: a Lingustica
Cognitiva, que, embora tambm apresente diferentes modos de tratar os processos mentais
que subjazem comunicao humana, alcanou um desejvel nvel de solidez atravs da
gramtica cognitiva de Langacker (1987 e 1991). Nesses dois volumes, o autor descreve
sistematicamente a relao existente entre a linguagem verbal e o modo como processamos as
noes expressas pelo signo lingustico, proporcionando entendimentos e anlises que at
ento ficavam circunscritas nossa intuio como usurios e analistas da linguagem.
Paralelamente aos postulados da gramtica cognitiva de Langacker, num outro
contexto de estudos, Gilles Fauconnier desenvolvia importantes pesquisas sobre os espaos
mentais, categorias de ordem cognitiva que tambm viriam a proporcionar entendimento mais
conciso sobre a metfora e outros fenmenos da linguagem, consolidando-se com a

Heberth Paulo de Souza; p. 185-213.

186

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

publicao de 19942. A identificao desses domnios cognitivos (espaos mentais), cujas


caractersticas sero descritas neste trabalho, acrescentou Lingustica Cognitiva mais
especificamente Semntica Cognitiva um arcabouo terico e um modelo de anlise que
adiantaram demasiadamente nossa compreenso da inter-relao entre linguagem e cognio
humana.
Alm da metfora, vrios outros fenmenos e elementos lingusticos puderam ser
descritos com a fidedignidade de quem pretende conferir linguagem verbal um status no
fragmentado e no desvinculado de outras habilidades humanas. Nesse contexto,
beneficiaram-se tambm sobremaneira da teoria dos espaos mentais as pesquisas que vinham
sendo empreendidas em torno da narrativa no em sua clssica abordagem dentro de
gneros textuais, mas tambm enquanto um fenmeno da cognio humana. Nesse sentido,
Turner (1996) realizou um empreendimento de fundamental importncia, demonstrando que a
mente do ser humano literria (entenda-se narrativa) por excelncia; em outras palavras,
mesmo quando no estamos lidando diretamente com uma narrativa clssica, nosso modo de
pensar tipicamente narrativo.
No por outro motivo que Fauconnier e Turner estabeleceram uma parceria em suas
pesquisas que vem rendendo, at recentemente, muitas publicaes conjuntas 3. A partir de
Fauconnier e Turner (1994), a Semntica Cognitiva se viu enriquecida com o estabelecimento
da teoria da mesclagem conceitual, um modelo de anlise que discrimina a inter-relao de
diferentes espaos mentais na produo do sentido, que se aplica especialmente no caso de
sentidos emergentes, ou seja, ausentes nos espaos de origem, que se revelam numa sequncia
enunciativa em funo principalmente de condies contextuais.
At este ponto, vimos en passant o surgimento de duas importantes teorias que no
foram criadas propriamente no bojo dos estudos de corpora, mas a nossa pesquisa tenciona
justamente empreender uma anlise no esteio da Semntica Cognitiva utilizando-se dos
benefcios proporcionados por um segmento que nos capacita a lidar com um grande nmero
de textos, cruzar dados quantitativos que proporcionem importantes questionamentos e
hipteses de cunho qualitativo e cujos resultados sejam atinentes a enunciados autnticos.

Trata-se da publicao de Fauconnier (1994), obra que, na verdade, tinha sido publicada dez anos antes em
lngua francesa (FAUCONNIER, 1984), mas que atingiu patamares acadmicos mais amplos a partir da
publicao mais recente em ingls.
3
Entre elas, Turner e Fauconnier (1995), Fauconnier e Turner (1996, 1998, 2000 e 2002).

Heberth Paulo de Souza; p. 185-213.

187

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Para atingir esse objetivo, ser feita uma sucinta explanao sobre essas teorias
semntico-cognitivas para, posteriormente, apresentarmos a abordagem realizada via anlise
de corpus.
2. A teoria dos espaos mentais e da mesclagem conceitual
Fauconnier (1994) caracteriza os espaos mentais como domnios cognitivos que so
ativados por certas expresses lingusticas e por alguns mecanismos de reconhecimento de
elementos em diferentes campos (psicolgico, cultural, histrico, ficcional etc.). A dinmica
que envolve os espaos mentais se resume no seguinte: a referncia a um determinado
elemento a situa-o num domnio cognitivo especfico, chamado domnio-fonte. Atravs de
um conector, que pode ser uma expresso lingustica ou um outro mecanismo construtor de
espao, as caractersticas desse elemento a so projetadas para um elemento b pertencente
a outro domnio cognitivo, chamado domnio-alvo. Esquematicamente, temos o seguinte:

Figura 1 Esquema de projeo de elementos entre espaos mentais diferentes

O modelo acima o princpio de uma complexa rede de relaes entre domnios


cognitivos que se processa na linguagem. Durante uma prtica comunicativa qualquer,
ativamos vrios espaos mentais e inter-relacionamos elementos de vrios desses espaos,
estabelecendo uma rede de projees tal que a linguagem se configura como um intrincado
emaranhado de elementos, domnios e projees. Esse modelo nos permite entender que a
linguagem humana um jogo de projees por excelncia. Fazemos analogias o tempo todo,
sendo tais o fundamento do nosso raciocnio em vrias situaes, desde a comunicao
corriqueira mais elementar at as construes consideradas mais complexas.

Heberth Paulo de Souza; p. 185-213.

188

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Vejamos uma aplicao desse modelo de Fauconnier sequncia lingustica que


destacamos no pequeno texto abaixo:
(1) Dois carregadores esto conversando e um diz: Se eu fosse Presidente da
Repblica, eu s acordava l pelo meio-dia, depois ia almoar l pelas trs, quatro
horas. S ento que eu ia fazer o primeiro carreto.4
Nesse caso, o domnio-fonte engloba as informaes referentes ao mundo do
carregador (pobreza, necessidade de trabalhar, dificuldades de sobrevivncia etc.), enquanto o
domnio-alvo abarca os dados relativos vida do Presidente da Repblica (marcada pelo
poder, regalias etc.). Para a compreenso do sentido do trecho, as informaes do domnio do
carregador so transpostas para o domnio do Presidente da Repblica, e funciona como
conector, nesse caso, a expresso introdutora da contrafactualidade, se eu fosse. Nesse
processo, toda a noo relativa aos comportamentos e estilo de vida do carregador
compreendida no mbito de outro domnio, o do Presidente da Repblica. Esquematicamente:

Figura 2 Esquema de projeo de informaes entre domnios diferentes

O modelo descritivo de Fauconnier capaz de explicar como funciona a mente


humana diante de situaes em que operamos vrios tipos de analogias, mas ele no
suficiente para explicar a seletividade que envolve o processo, ou seja, a imagem de um
carregador que possui certas regalias de um Presidente da Repblica, ou a imagem de um
4

Transcrito de prova de Lngua Portuguesa de Vestibular da Unicamp SP. Grifo nosso.

Heberth Paulo de Souza; p. 185-213.

189

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Presidente da Repblica que precisa fazer carreto. Isso vai concretizar-se mais tarde com a
teoria da mesclagem conceitual, como veremos adiante. De toda forma, a teoria dos espaos
mentais veio esclarecer como somos capazes de lidar com elementos de diferentes domnios
cognitivos, projetando informaes de um espao para outro.
Esse modelo de projeo de informaes de um domnio-fonte para um domnio-alvo
atende a um princpio mais geral, o Princpio de Identificao, tambm chamado por
Fauconnier (1997, p. 41) de Princpio de Acesso, segundo o qual se afirma o seguinte:

Se dois objetos a e b se ligam por uma funo pragmtica F (b = F(a)), ento uma descrio de a (da)
pode ser usada para identificar sua contraparte b.

Por funo pragmtica entende-se o estabelecimento de ligaes entre objetos de


natureza diferente por razes psicolgicas, culturais ou localizadamente pragmticas 5, noo
bem desenvolvida por Nunberg (1978). Em outras palavras, existem razes de natureza
extralingustica que justificam o fenmeno da projeo, e esse um ponto crucial para o
nosso estudo sobre metforas. No caso acima, no por acaso que o carregador estabelece a
analogia com o Presidente da Repblica; existe uma srie de caractersticas sobre esta
entidade que motivam o processo de analogia.
O modelo de representao da mesclagem conceitual uma evoluo dos estudos
realizados sobre os espaos mentais, tanto que o suporte daquela so os mesmos domnios
cognitivos descritos anteriormente. A mesclagem conceitual surge como uma teoria que
explica a dinmica funcional dos espaos, com a vantagem de incluir outros domnios indo
alm da simples relao entre domnios fonte e alvo , o que enriquece sobremaneira a
compreenso sobre o processamento do sentido.
Fauconnier e Turner (2002), fazendo uso de exemplos bem prticos, apresentam
muitos detalhes sobre o processo de mesclagem, enfatizando especialmente os elementos que
compem essa rede de integrao conceitual. E especialmente em Fauconnier e Turner
(1996)6 apresentada a ideia de que os padres gramaticais de uma lngua refletem, em
grande parte, as mesclagens conceituais e o processo de integrao de eventos. Da a noo de

No original: links between objects of a different nature for psychological, cultural, or locally pragmatic
reasons (FAUCONNIER, 1994, p. 3).
6
Uma
verso
expandida
desse
trabalho
se
encontra
em:
<http://markturner.org/centralprocess.WWW/centralprocess.html>. Acesso em: 12 set. 2014.

Heberth Paulo de Souza; p. 185-213.

190

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

que o estudo da linguagem verbal a chave para se alcanar o entendimento dos processos da
cognio humana.
Outra inovao no modelo da mesclagem conceitual a identificao do espao da
mescla como uma estrutura emergente, sinalizado com um quadriculado. Nos estudos
cognitivos em geral, a noo desse tipo de estrutura de fundamental importncia para a
compreenso de vrios fenmenos. Nesse aspecto, vale ressaltar a importncia de trabalhos
como o de Grady, Oakley e Coulson (1997), que mostram como uma sentena do tipo aquele
cirurgio um aougueiro apresenta uma srie de significados emergentes, provando que o
espao da mescla no um espao de mera composicionalidade semntica.
Com essas modificaes, o modelo utilizado para representar o processo de
mesclagem o que se mostra abaixo, no qual figuram o espao de entrada 1 e o espao de
entrada 2 como domnios que apresentam elementos mapeados entre si, alm do espao
genrico e o espao emergente da mescla:

Figura 3 Modelo de representao do processo de mesclagem conceitual

Observe-se que, pelo esquema apresentado acima, os espaos de entrada podem


encerrar elementos que no so projetados para o espao da mescla, bem como elementos
projetados podem no apresentar uma contraparte no outro espao de entrada. E, ainda, h

Heberth Paulo de Souza; p. 185-213.

191

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

informaes que emergem no espao da mescla sem que tenham provindo de qualquer espao
de entrada (sentido emergente).
3. A metfora no contexto da Lingustica Cognitiva
Na segunda metade do sculo XX, vrios estudos so empreendidos com foco no
aspecto cognitivo. Essa caracterstica se faz sentir em vrias reas do conhecimento humano,
e no ocorre diferente em relao aos estudos da linguagem. Essa preocupao com o aspecto
mentalista da linguagem vem desembocar nos estudos cognitivos, e com o advento da
Gramtica Cognitiva de Langacker esse espao se consolida, desenvolvendo-se cada vez mais
nos ltimos decnios.
Em 1979, amplamente difundida uma noo explicativa sobre o funcionamento da
linguagem humana atravs de um clssico artigo de Michael Reddy. Segundo o autor, as
palavras so concebidas como contineres das ideias, e estas so transmitidas como que
passando por um tubo de indivduo para indivduo. Dessa forma, as palavras podem ser
entendidas como vazias de sentido ou plenas de significado, e o processo de transmisso de
ideias pode ser entendido como susceptvel a quaisquer vicissitudes tpicas da passagem de
objetos por um canal. sobre essa noo que Reddy desenvolve o que ele denomina
metfora do tubo (conduit metaphor)7.
Em 1980, foi publicada uma obra que revolucionou o pensamento acerca da metfora,
inclusive alargando a sua concepo e relacionando-a experincia corporal, cultura, usos e
costumes dos indivduos. Lakoff e Johnson (1980) defendem a ideia de que as metforas no
so recursos especiais de linguagem, como era costume supor, especficos da linguagem
literria ou retrica, mas fazem parte da linguagem corriqueira. E, mais do que isso, a
metfora tambm est presente no pensamento e nas aes humanas, no sendo to somente
um aspecto da linguagem verbal; nosso sistema conceitual metafrico por natureza. O
homem pensa, age e comunica atravs de metforas.
Os autores apresentam metforas fundamentais, a partir das quais muitos elementos
comunicativos como expresses lingusticas, gestos e posturas so criados, como para cima
bom; para baixo ruim, argumentar lutar, tempo dinheiro, ideias so objetos,
palavras so contineres, abstrato concreto, seres abstratos so entidades fsicas,

Cf. Reddy (1979).

Heberth Paulo de Souza; p. 185-213.

192

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

comunicar enviar etc. A ttulo de exemplo, a primeira metfora orientacional desta lista se
manifesta atravs de uma srie de expresses lingusticas (A bolsa de valores fechou em alta,
Fulano est no fundo do poo, Beltrano est em alto astral, Ela se encontra deprimida (= em
depresso), Subir na vida, Chegar ao topo da carreira, Fazer parte do alto escalo, Hoje
estou meio down, Os planos caram por terra), de gestos (polegar apontado para cima para
indicar estado bom, polegar apontado para baixo para indicar estado ruim; referncia ao cu
para indicar o paraso religioso, referncia ao subterrneo para indicar o inferno) e de posturas
(ficar de cabea erguida bom, ficar cabisbaixo ruim). Uma importante ideia defendida por
Lakoff e Johnson que no existe, a rigor, nenhum tipo de necessidade humana para se
operarem tais conceitualizaes; o que existe, e que justifica a concepo de uma ideia em
termos de outra, o apego cultura da sociedade em que o indivduo se encontra, alm das
suas experincias corporais. A metfora orientacional que foi explicada acima, por exemplo,
pode ser justificada pela prpria experincia do ser humano, em seu primeiro ano de vida, ao
tentar vencer a fora gravitacional e manter-se de p, em postura ereta.
importante ressaltar que esses esquemas metafricos no so propriamente
universais semnticos, como poderia supor algum radical dentro dessa teoria. Trata-se, na
verdade, de tendncias de conceitualizao manifestadas pelo ser humano de acordo com
fatores ligados sua vivncia, cultura, constituio biolgica. Portanto, apresentam um grau
de uniformidade bastante considervel na espcie humana.
O advento da teoria sobre a metfora conceitual impulsionou os estudos desse
fenmeno sob a tica da cognio humana e constituiu um grande impacto provocado sobre
uma tradio de muitos sculos que encarava a metfora como uma relao de simples-troca
de expresses com ressalva, obviamente, para importantes estudos empreendidos por
filsofos desde alguns sculos passados que adiantam essa postura que veio consolidar-se ao
final do sculo passado.
4. A metfora analisada sob o prisma da Lingustica de Corpus
Nas ltimas dcadas, tm crescido em larga escala os estudos lingusticos baseados em
dados autnticos de linguagem, seja na modalidade oral ou escrita. Os avanos na rea de
Informtica vm proporcionando ganhos incomensurveis nesse aspecto, fazendo com que a
Lingustica de Corpus enriquea-se cada vez mais em termos de consistncia tcnica, terica
e metodolgica, impulsionando o nvel das pesquisas em todas as reas da linguagem.

Heberth Paulo de Souza; p. 185-213.

193

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

No Brasil, pesquisas nesse campo tm alcanado muito xito, principalmente com a


criao de programas especficos para anlises lingusticas, como os etiquetadores,
concordanciadores etc. Juntamente a isso, a montagem e o incremento de extensos bancos de
textos disponveis para anlise os corpora tm proporcionado s nossas pesquisas
enormes vantagens.
Berber Sardinha (2004) oferece uma boa viso desse tipo de pesquisa, reunindo os
aspectos fundamentais para os estudos baseados em corpora, desde o histrico sobre essa
rea, a descrio de bancos de textos, at os detalhes de ordem tcnica para utilizao de
ferramentas eletrnicas. Nas palavras do prprio autor:
H um debate na definio do status da rea: a Lingustica de Corpus
disciplina ou metodologia? Claramente, a Lingustica de Corpus no uma
disciplina tal qual psicolingustica, sociolingustica ou semntica, pois seu
objeto de pesquisa no delimitado como em outras reas. A Lingustica de
Corpus no se dedica a um assunto definido (...). Ao contrrio, ocupa-se de
vrios fenmenos comumente enfocados em outras reas (lxico, sintaxe,
textura). ento uma metodologia da qual outras reas podem se fazer
valer? A princpio, sim. (...)
Se a Lingustica de Corpus metodologia ou no, depende da definio de
metodologia que est sendo usada. Entendendo metodologia como
instrumental, ento possvel aplicar o instrumental da Lingustica de
Corpus livremente e manter a orientao terica da disciplina original.
(BERBER SARDINHA, 2004, p. 35-36)

Uma clara contribuio dessa chamada metodologia para a Lingustica o fato de o


pesquisador lidar com dados reais da linguagem, e no chegar a concluses baseadas em
exemplos construdos artificialmente, ainda que correspondendo intuio dos falantes. E
mais: com esse procedimento, o nmero de informaes com que o linguista capaz de lidar
inmeras vezes maior, alcanando enorme fidedignidade entre as concluses alcanadas em
relao a um corpus e as concluses que podem ser imputadas lngua como um todo. Enfim,
quase todos os estudos quer da linha diacrnica, quer da sincrnica encontram na Lingustica
de Corpus um suporte jamais alcanado na histria da pesquisa em linguagem.
Como os demais temas de pesquisa, os estudos sobre a metfora tambm voltam os
olhares para as tcnicas e mtodos proporcionados pela Lingustica de Corpus, especialmente
quando se pretende investigar as ocorrncias dessa modalidade de linguagem no cotidiano dos
usurios da lngua. Berber Sardinha (2009, p. 1) destaca, na introduo de um texto ainda no
publicado, que

Heberth Paulo de Souza; p. 185-213.

194

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Tem existido um crescente interesse na utilizao de corpora na pesquisa


sobre metfora nos ltimos anos, e como resultado disso um certo nmero de
ferramentas e tcnicas tem sido proposto e utilizado para identificao de
metforas. No entanto, muito pouco se sabe a respeito de suas habilidades
para recuperar todas e somente metforas a partir dos corpora.8

Apesar dessa dificuldade, inegvel a contribuio que modernas tecnologias vm


dando cincia no mbito do estudo da metfora. Questes jamais imaginadas at ento
passam a ser investigadas, como: qual a relao entre a metfora e o processamento cognitivo
humano? Quais so os limites entre o sentido literal e no literal na linguagem? Em que
situaes os falantes fazem uso de construes metafricas em vez das correspondentes
construes no metafricas? Qual o grau de ocorrncia de construes metafricas numa
dada lngua?
Muita contribuio no sentido de possveis respostas a esses questionamentos vem
sendo dada por dois grandes estudiosos do assunto: Anatol Stefanowitsch e Stefan Gries.
Stefanowitsch (2005), por exemplo, realiza um estudo de extrema relevncia com vistas a
explicar se o uso da linguagem metafrica motivado por questes estilsticas ou por
princpios cognitivos. O autor desenvolve essa questo analisando as ocorrncias de algumas
expresses metafricas da lngua inglesa, comparando as situaes de uso das mesmas em
contraposio situao de uso das respectivas expresses no metafricas.
Nesse artigo, o autor defende a hiptese cognitiva sobre a metfora, segundo a qual ela
um elemento sistemtico e pervasivo na linguagem cotidiana, um fenmeno
conceitual/mental que nos possibilita a compreenso de uma ideia (mais abstrata) em termos
de outra ideia (mais concreta), em oposio hiptese estilstica, cujos adeptos defendem que
a metfora um recurso extraordinrio de linguagem, uma figura de linguagem empregada
para obter efeitos estticos, largamente empregada na literatura, retrica e outros registros que
utilizam a linguagem como ornamento das ideias (STEFANOWITSCH, 2005, p. 163).
Como argumentos em favor da hiptese cognitiva, so apresentados os seguintes:
i) se a metfora fosse um fenmeno estilstico simples, ela no apresentaria to alto grau de
sistematicidade e ocorrncia;

No original: There has been growing interest in using corpora in metaphor research in recent years, and as a
result a number of tools and techniques have been proposed and used for metaphor identification. However, very
little is known about their ability to retrieve all and only metaphors from corpora.

Heberth Paulo de Souza; p. 185-213.

195

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

ii) se a metfora fosse um recurso ornamental da linguagem, existiria sempre uma expresso
literal correspondente a cada expresso metafrica;
iii) nas metforas, o mapeamento sempre unidirecional, acontecendo do domnio mais
concreto para o mais abstrato, e no vice-versa. Se a metfora fosse um recurso puramente
estilstico, a unidirecionalidade seria acidental, e no sistemtica.
A ideia central sobre a linguagem metafrica na hiptese cognitiva que o seu uso
pode reduzir dificuldades de processamento do sentido. Assim, a metfora pode ser descrita
como um elemento que oferece suporte conceitual para a nossa apreenso de conceitos
complexos. Da o fato de concebermos os conceitos mais abstratos dentro de um domnio
mais concreto.9
Estudos desse porte desmistificam a ideia de que o modo bsico de utilizao da
linguagem humana o uso do sentido literal e que o sentido metafrico um mero
correspondente opcional daquele. Tais estudos vm demonstrando que a linguagem
metafrica e, por extenso, o raciocnio metafrico um elemento essencial da cognio
humana. Gibbs Jr. (2002) j expusera em seu artigo que no faz sentido simplesmente
contrapor o sentido literal ao sentido no literal, uma vez que no existe uma linha divisria
entre essas duas formas de processamento do sentido, alm de que no existe uma nica
forma de sentido literal nem tampouco uma nica forma de sentido no literal. No bojo deste,
existem, por exemplo, o sentido metafrico, o idiomtico, o irnico, o metonmico etc. No
processamento de uma sentena no literal, diferentes tipos de sentido so ativados em
diferentes pontos da sentena.
Stefanowitsch utiliza, em vrias de suas pesquisas, um procedimento bastante comum
na Lingustica de Corpus, que a anlise dos colocados, isto , as palavras que ocorrem com
frequncia considervel na vizinhana de alguns ndulos (palavras e expresses) escolhidos
para anlise. Com esse procedimento, numa extenso da anlise colocacional, Stefanowitsch e
Gries desenvolveram um mtodo atravs do qual investigada a interao de lexemas e as
estruturas gramaticais a eles associadas, com aplicao no estudo de expresses lingusticas

Um bom exemplo disso o fato de conceitualizarmos o tempo (abstrato) em termos de dinheiro (concreto), no
emprego de vrias expresses verbais: gastar tempo, ganhar tempo, economizar tempo, perder tempo, ceder
tempo, tomar tempo etc. O contrrio no ocorre, ou seja, no conceitualizamos dinheiro em termos de tempo,
medindo-o em segundos, minutos, horas etc.

Heberth Paulo de Souza; p. 185-213.

196

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

de vrios nveis (palavras, expresses fixas, estruturas de argumento etc.). A esse


procedimento os autores chamam de anlise colostrucional (collostructional analysis)10.
Stefanowitsch e Gries (2003, p. 210) afirmam que recentemente (...) o foco dentro da
lingustica de corpus mudou para uma viso mais holstica da lngua 11, chamando a ateno
para o fato de que gramtica e lxico no so elementos fundamentalmente diferentes, da
maneira como essa antiga dicotomia tem sido vista nos estudos da linguagem, existindo
muitas expresses ignoradas ao longo dos tempos que servem de importantes elos entre esses
dois polos. Trata-se de um estudo que toma por base preceitos da chamada Gramtica de
Construes, aplicando-se de forma muito pertinente ao estudo de collocations, chunks12 e
outras expresses lingusticas. No se trata especificamente de uma metodologia para estudo
da metfora, mas como a lngua plena de expresses metafricas entrincheiradas 13, esse tipo
de estudo tambm nos de grande valia.
5. Descrio e anlise lingustica do corpus
5.1. Descrio do banco de textos
Procederemos anlise de textos escritos em lngua portuguesa, extrados do corpus
organizado para esse fim, de forma que os resultados alcanados possam mostrar-se
aplicveis a uma ampla variedade de textos dentro da lngua.
Para a composio do nosso corpus de anlise, optou-se pelo gnero textual redao de
vestibular. Trata-se de um tipo de produo textual muito difundido no meio escolar, cujo
propsito autorrecursivo, ou seja, o objetivo principal treinar ou demonstrar habilidades de
comunicao escrita dentro da norma padro da lngua. As redaes de vestibular, sejam do
estilo tradicional (realizado ao final do Ensino Mdio) ou seriado (realizado ao longo dos anos
que compem o Ensino Mdio), so produzidas num contexto especfico de avaliao de
desempenho de escrita e concatenao de ideias em torno de um tema. Elas no atendem a um
propsito comunicativo externo instituio de ensino e correspondem a um tipo de produo

10

Cf. Stefanowitsch e Gries (2003).


No original: recently (...) the focus within corpus linguistics has shifted to a more holistic view of language.
12
Mantivemos aqui os originais em ingls por no existirem adequadas tradues para esses termos em
portugus.
13
O entrincheiramento (do ingls entrenchment) corresponde ao fenmeno normalmente associado
cristalizao com que certas palavras e expresses so utilizadas no sistema lingustico, como que se
apresentando na forma de blocos imutveis, diferentemente do uso de palavras livres nos enunciados sujeitas a
modificaes tanto no que diz respeito forma quanto ao significado.
11

Heberth Paulo de Souza; p. 185-213.

197

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

induzida, no espontnea. Essas caractersticas, no entanto, no invalidam estudos sobre esse


tipo de produo. Nas palavras de Bezerra (2008, p. 138),
Embora defendamos a utilizao de situaes efetivas de escrita em sala de
aula, no estamos eliminando o fato de que o texto, ao chegar a, perde parte
da carga comunicativa que tem, j que se torna objeto de
ensino/aprendizagem. Com isso, observamos que o trabalho com a redao
(entendida como um texto inerte), com a produo textual (concebida como
um texto produzido em uma situao comunicativa) e com o gnero textual
(entendido como um enunciado produzido em uma situao comunicativa
especfica, de acordo com um tema, uma composio e um registro
lingustico) tem um ponto comum, que ser objeto de ensino. Por isso, no
se deve desfazer-se dessa caracterstica (...) sob o pretexto de que o
importante respeitar as prticas sociais da escrita e seus usos.

Em outras palavras, ressalvado o fato de que redaes escolares e a inclumos as


redaes de vestibular no atendem a um propsito comunicativo espontneo, trata-se de
um tipo textual muito difundido na prtica escolar, capaz de revelar muitos fatos no mbito do
raciocnio com a linguagem.
O nosso corpus foi composto por um total de 500 (quinhentas) redaes produzidas
entre os anos de 2005 e 2007 em diferentes processos seletivos para ingresso no ensino
superior da Universidade Presidente Antnio Carlos, instituio multicampi da rede particular
cuja sede se localiza na cidade de Barbacena (MG) e que possui unidades de ensino em vrias
outras cidades, incluindo uma unidade no estado de Tocantins (Instituto Tocantinense
Presidente Antnio Carlos).
A escolha desses textos foi aleatria. Esse procedimento faz parte do mtodo
estatstico da pesquisa cientfica, aplicando-se a seleo de amostragem casual simples, em
que todos os conjuntos de textos disponveis tinham igual probabilidade de serem escolhidos.
Com isso, pretendemos detectar construes de uso metafrico no corpus e sobre elas realizar
nossa anlise qualitativa, de forma que tais construes tenham a probabilidade de serem
representativas de todo o montante de textos nossa disposio.
A proposta de analisar textos escritos autnticos justifica-se pelo objetivo de lidar com
elementos da lngua em uso real e efetivo (ainda que a produo dos textos seja induzida,
conforme comentamos), e no criados para satisfazer a alguma hiptese de pesquisa. Na
composio do corpus, mantivemos a escrita original dos textos, a fim de evitar qualquer tipo

Heberth Paulo de Souza; p. 185-213.

198

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

de interferncia que pudesse prejudicar os nossos resultados, ferindo a autenticidade dos


mesmos.14
Para se ter uma noo da dimenso do nosso corpus, ele possui um total de 84.450
palavras, conforme se pode levantar atravs do listador de palavras do WordSmith Tools ,
programa muito utilizado como suporte para vrios tipos de anlises lingusticas. Desse total
de ocorrncias (tokens), so identificadas 8.734 palavras diferentes, ou tipos (types). Vejam-se
os dados na figura abaixo, em que est destacado o total de palavras ocorrentes no corpus:

Figura 4 Descrio geral do corpus pelo listador de palavras do WordSmith Tools

14

A escolha dos textos para a composio do corpus foi anterior ao trabalho de correo que a equipe do
processo seletivo realiza para a classificao dos candidatos. Foram includas, assim, redaes de nveis muito
diferenciados, de candidatos que tanto foram aprovados quanto reprovados nos concursos. Portanto, a nota
obtida pelos candidatos nas redaes em nenhum momento influenciou a nossa escolha.

Heberth Paulo de Souza; p. 185-213.

199

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

De acordo com Berber Sardinha (2004, p. 26), um corpus dessa natureza classificado
como pequeno-mdio, em classificao baseada na observao dos corpora normalmente
utilizados em pesquisas (um corpus pequeno-mdio, segundo o autor, possui de 80.000 a
250.000 palavras).
Na montagem desse banco de textos, eles foram numerados de 001 a 500. A tabela a
seguir apresenta uma descrio geral dos subconjuntos de redaes que compem o corpus,
compreendendo a quantidade produzida em cada local, as cidades em que as mesmas foram
produzidas e o tema que serviu de motivao para a produo de cada subconjunto:
Tabela 1 Dados gerais dos textos do corpus, separados por grupos

REDAES
001 a 181
182 a 229
230 a 246
247 a 256
257 a 466
467 a 500

QUANTIDADE
181
48
17
10
210
34

LOCAL
Araguana (TO)
Araguana (TO)
Medina (MG)
Tefilo Otoni (MG)
Araguana (TO)
Barbacena (MG)

TEMA (RESUMIDO)
Crimes virtuais
A pirataria no Brasil
A felicidade
Sonhos de simplicidade
A internet
A destruio da natureza

5.2. Procedimentos de tratamento dos textos


Como se trata da composio de um corpus de pesquisa que futuramente pode servir
tambm a outros tipos de investigao, e com o intuito de no incorrermos em falhas
metodolgicas, seguimos os procedimentos gerais para tratamento do corpus, que
normalmente integram esse tipo de abordagem, a saber:
i) Uma vez que as redaes so manuscritas, aps selecionadas elas foram transcritas ao
computador utilizando-se o programa Microsoft Word for Windows, em espao simples,
fonte Times New Roman tamanho 12, alinhamento de margem esquerda. Seguimos um
procedimento corriqueiro desse tipo de montagem de corpus: deixar um espao em branco
entre os pargrafos, apesar de no interessar diretamente para a nossa pesquisa a identificao
de tais. Entre o ttulo da redao quando existente e o primeiro pargrafo, deixaram-se
dois espaos em branco para a identificao daquele.
ii) Aps organizados em pastas no computador, os textos foram salvos tambm como texto
sem formatao (com a extenso .txt), procedimento fundamental para que a aplicao de
ferramentas eletrnicas como o WordSmith Tools no seja prejudicada com a identificao
de caracteres estranhos ao programa.

Heberth Paulo de Souza; p. 185-213.

200

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

iii) A partir da, levantamos as informaes gerais sobre o corpus, a exemplo dos dados da
Figura 4, para se ter uma noo geral do ambiente de pesquisa com que estamos lidando. O
software utilizado serviu como ponto de partida para a identificao das caractersticas gerais
do banco de textos e tambm para realizar buscas de palavras e expresses no corpus
medida que fomos realizando leituras e anlises de cunho qualitativo.
As buscas de palavras e expresses no corpus com o apoio de recurso eletrnico so
de fundamental importncia num trabalho desse porte, uma vez que proporcionam
levantamentos que seriam impossveis de serem feitos somente atravs da chamada leitura
manual. O grau de preciso dessas buscas altssimo, alm da capacidade de obteno de
dados importantes para a anlise em tempo imediato.
5.3. O uso da ferramenta eletrnica para anlise
A ferramenta eletrnica escolhida para anlise do nosso corpus, o WordSmith Tools ,
possui trs componentes bsicos: o concordanciador (Concord), o listador de palavras
(WordList) e o listador de palavras-chave (KeyWords).
O recurso do concordanciador permite que o analista visualize os colocados, que so
os itens lexicais que ocorrem com um ndulo de uma busca. Essa busca pode ser realizada
com alcances diferenciados, chamados de janelas ou horizontes, que consiste em
quantidades de palavras esquerda e direita escolhidas pelo pesquisador. O concordanciador
tambm fornece a frequncia, que o nmero de ocorrncias tanto do ndulo quanto de
seus colocados.
Atravs do listador de palavras, outro recurso da ferramenta eletrnica, possvel
obter informaes do corpus analisado em trs segmentos diferentes: um relativo s
informaes gerais do banco de textos (nmero de palavras, tipos e ocorrncias; nmero de
pargrafos; razo entre tipos e ocorrncias; extenso mdia das palavras e dos pargrafos
etc.); outro relativo frequncia de ocorrncia de cada palavra do corpus, medida em
porcentagem em relao s demais palavras do texto, da mais frequente at a menos frequente
do corpus; e o ltimo relativo listagem de todas as palavras do corpus em ordem alfabtica,
acompanhadas da frequncia em que ocorrem.
Por fim, o listador de palavras-chave estabelece uma comparao entre as palavras de
um texto ou conjunto de textos selecionados em relao a um corpus que serve como
referncia. No caso de nossa pesquisa, no utilizamos esse recurso.

Heberth Paulo de Souza; p. 185-213.

201

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

5.4. Anlise do corpus


O grande desafio para os estudos sobre metfora baseados em corpora a
identificao de ndulos que podem ser considerados metafricos, j que os mapeamentos
entre domnios cognitivos no esto ligados a formas lingusticas especficas. Na tentativa de
dar um rumo nossa anlise tendo em vista essa dificuldade, buscamos suporte em
Stefanowitsch (2006). O autor apresenta algumas estratgias para contornar esse problema,
que se resumem no seguinte15:
i) Busca manual Muitos estudos se baseiam na coleta manual das ocorrncias de
construes metafricas, o que limita muito o trabalho do pesquisador, evidentemente, no
caso de trabalhos baseados em corpora extensos.
ii) Busca por vocabulrio de domnio-fonte Algumas expresses metafricas baseiam-se em
itens lexicais especficos do domnio-fonte. Constitui, portanto, uma estratgia de pesquisa
realizar a busca comeando por elementos do lxico ou conjuntos de elementos que so
potencialmente formadores de metforas.
iii) Busca por vocabulrio de domnio-alvo Muitos estudos sobre a metfora so realizados
tendo-se em vista domnios-alvo especficos, bem como os mapeamentos conceituais que os
estruturam; assim, esse tipo de busca pode ser bastante producente. Existem algumas
restries quanto a esse aspecto, especialmente o fato de que esse mtodo se aplica muito bem
quando se trata de um corpus muito representativo de textos que lidem com um domnio-alvo
especfico, alm de funcionar bem, obviamente, quando se trata de construes cujo domniofonte apresente uma associao sistemtica e previsvel com o domnio-alvo em questo.
iv) Busca por sentenas que contenham itens lexicais tanto do domnio-fonte quanto do
domnio-alvo Os dois tipos de busca apresentados anteriormente podem combinar-se no
mesmo processo. E, assim como os dois procedimentos anteriores no so completos, este
tambm pode apresentar problemas. Trata-se de um processo que funciona muito bem em se
tratando de expresses cujo mapeamento conceitual conhecido de antemo ou, para
utilizar uma expresso do prprio Stefanowitsch, no caso de padres metafricos
(metaphorical patterns).

15

Cf. Stefanowitsch (2006, p. 2-6). O autor confere especial importncia s trs primeiras estratgias

apresentadas.

Heberth Paulo de Souza; p. 185-213.

202

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

v) Busca de metforas baseada nos marcadores de metfora (markers of metaphors)


Existe um certo nmero de expresses na lngua, muitas vezes de natureza metalingustica,
que sinalizam explicitamente a presena de metforas, tais como metaforicamente falando,
figurativamente falando, literalmente etc., bem como o recurso grfico das aspas.
vi) Extrao a partir de um corpus etiquetado por campos/domnios semnticos A primeira
estratgia descrita acima pode ser estendida da seguinte forma: pode-se especificar um
domnio-fonte e operar a busca por todos os itens lexicais pertencentes a esse domnio, em
vez de trabalhar com conjuntos de lexemas, que ficam sempre incompletos. Stefanowitsch
qualifica esse mtodo como bastante promissor.
vii) Extrao a partir de um corpus etiquetado por mapeamentos conceituais Esse tipo de
busca seria grandemente valioso para os estudos da metfora, mas o grande problema em
relao a ele justamente realizar as marcaes que discriminem os mapeamentos
conceituais.
A etiquetagem muito produtiva em anlises textuais, mas, no caso de pesquisas
envolvendo metforas, ainda se constitui um procedimento muito complexo. A identificao
de metforas realizada por recursos eletrnicos feita, atualmente, em termos de
probabilidade de emprego metafrico de uma determinada expresso com base na
comparao com a co-ocorrncia desse mesmo ndulo em outros corpora pr-analisados16.
Levando-se em considerao todos os aspectos levantados, e tendo em vista o foco da
nossa pesquisa voltado para uma anlise qualitativa envolvendo metforas e organizao
textual, diante dos recursos colocados disposio para a pesquisa e que nos levem a um grau
de total confiabilidade em relao aos resultados alcanados, estabelecemos os seguintes
procedimentos metodolgicos para anlise dos textos:
i) Busca manual de metforas mais relevantes em textos escolhidos aleatoriamente nos seis
subgrupos de redaes apresentados na Tabela 1, de maneira a contemplar uma anlise
preliminar em textos elaborados sob diferentes propostas de tema. Como os subgrupos de
redaes variam muito entre si, em relao ao nmero de textos que os compem,

16

So muito raros os programas de identificao de metforas, sendo o nico disponvel na Internet poca
desta pesquisa o do CEPRIL Centro de Pesquisa, Recursos e Informao em Linguagem, da PUC-SP
(disponvel em: http://www.corpuslg.org/tools/), que realiza buscas em lngua portuguesa e lngua inglesa. Esse
identificador funciona como um etiquetador, apresentando, para cada palavra do corpus a que o usurio pode
submeter, uma informao correspondente probabilidade de ela ser metafrica. Essa probabilidade varia de
0,01% (zero vrgula zero um por cento, ou seja, praticamente nenhuma probabilidade) a 100% (cem por cento,
isto , certeza de uso metafrico), que o programa oferece atravs da indicao Avg.Prob.

Heberth Paulo de Souza; p. 185-213.

203

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

estabelecemos a proporo de escolha de um texto para cada conjunto de no mximo setenta


redaes dentro de cada tema. Assim, foram selecionados: 3 textos no subgrupo I; 1 texto no
subgrupo II; 1 texto no subgrupo III; 1 texto no subgrupo IV; 3 textos no subgrupo V; e 1
texto no subgrupo VI. Totalizam, assim 10 (dez) textos para esse procedimento inicial.
ii) Identificao de possveis vocabulrios de domnio-fonte e domnio-alvo a partir da busca
manual nos dez textos mencionados acima. Embora esse procedimento no garanta o alcance
de grande nmero de ocorrncias metafricas no corpus como um todo, pode constituir-se um
ponto de partida para buscas mais minuciosas em etapas posteriores.
iii) Levantamento de construes metafricas em outros textos do corpus, alm dos dez textos
iniciais, num processo que mescla a busca manual e a busca realizada atravs da ferramenta
eletrnica com base nos possveis vocabulrios de domnio-fonte e domnio-alvo
mencionados acima.
iv) Anlise qualitativa de variados textos do corpus, de acordo com a relevncia dos
levantamentos feitos at ento, com vistas ao comportamento da metfora dentro desses
textos.
5.4.1. Concluses preliminares da busca manual
Procedendo-se ao levantamento inicial dos padres metafricos nas redaes
selecionadas em cada subgrupo do nosso corpus de anlise, observa-se a recorrncia de alguns
esquemas metafricos j salientados por vrios estudiosos da Lingustica Cognitiva como
padres de processamento mental existentes na espcie humana. O reconhecimento desses
padres se d no s pelo grande nmero de ocorrncias nos textos analisados, como tambm
pela sistematicidade com que ocorrem. Isso nos leva a acreditar na existncia de um modo de
processamento de sentidos, no mbito da cognio humana, que segue uma certa tendncia na
conceitualizao de ideias.
A tendncia identificada na nossa amostragem resume-se no seguinte:
i) elementos de natureza diversa, quer concretos, quer abstratos, so concebidos como lugares,
espaos onde acontece alguma coisa;
ii) elementos abstratos que, portanto, dizem respeito a aes e sentimentos so concebidos
como elementos concretos, que possuem uma corporeidade fsica;
iii) elementos inanimados, quer concretos, quer abstratos, so concebidos em termos de seres
animados, que possuem vida prpria, que praticam aes.

Heberth Paulo de Souza; p. 185-213.

204

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Outros esquemas metafricos foram encontrados no corpus, mas esses trs tm uma
presena to marcante nos textos a ponto de todo o contedo girar em torno deles. No se
trata de ocorrncias isoladas; muitas vezes, so at interpenetrantes, ou seja, seres inanimados
podem ser metaforizados como seres animados que ao mesmo tempo praticam aes em
espaos tambm metafricos.
A essas alturas, cremos j ter ficado bastante claro que a metfora no mero recurso
estilstico, sendo um elemento intrnseco do modo de raciocinar humano. Dando continuidade
a esse ponto de vista, atravs do levantamento que ora fizemos no nosso corpus, mais do que
corroborar esse pensamento, fica visvel que a metfora participa sistematicamente da
organizao do texto como um todo, estabelecendo parmetros de insero de contedos no
mesmo.
Porm, a metfora no atua sozinha nessa funo. Na verdade, informaes de ordem
metafrica e no metafrica se juntam no decorrer do texto e atuam concomitantemente na
apresentao dos contedos. Aes so praticadas em espaos tanto metafricos quanto no
metafricos, os elementos que possuem corporeidade fsica so apresentados no texto tambm
de forma metafrica ou no metafrica, e assim por diante. No se quer exaltar a importncia
do processo de metaforizao em detrimento de outros recursos de organizao textual, assaz
importantes para a manuteno da coeso e da coerncia textuais, mas fica claro que, sem as
metforas, esse quadro no seria instaurado ou seria de forma incompleta, s no mbito no
metafrico.
Uma importante concluso que vai nortear todo o rumo desta pesquisa a seguinte:
manifesta-se ntida a ideia de que a metfora se situa num domnio cognitivo da organizao
textual capaz de nos fazer vislumbrar esses textos escritos maneira de narrativas tpicas, j
que afloram, na tessitura do texto, os seguintes elementos:
i) espao ou lugar, apresentado de maneira geral no texto, onde ocorrem todas as aes
descritas, ou de forma localizada, existindo pequenos espaos para um grupo circunscrito de
aes;
ii) personagens, elementos metaforizados ou no, que atuam ao longo do texto. A existncia
deles vital para a compreenso dos textos como narrativas;
iii) tempo, informao nem sempre explcita nas redaes, frequentemente no metafrica.
Muitas vezes ele se manifesta na sequenciao das aes, sendo um importante recurso da
coerncia textual;

Heberth Paulo de Souza; p. 185-213.

205

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

iv) aes, apresentadas explicitamente nos textos em relao a personagens metafricos ou


no, atravs de formas verbais que tambm podem ser metafricas.
Dentro da tipologia textual clssica, rarssimos textos ou passagens de textos do nosso
banco de redaes poderiam ser categorizados como essencialmente narrativos, que
normalmente so marcados com a existncia dos elementos listados acima na prpria
superfcie textual. Em outras palavras, para que um texto seja considerado narrativo,
necessrio que apresente explicitamente os elementos espao, personagem, tempo e ao, ou
pelo menos a maioria deles, na nossa tradio de gneros textuais. No caso do objetivo da
produo de redaes em processos seletivos, essa estrutura at desaconselhvel, uma vez
que o comando para a elaborao dos textos direciona para a produo de ideias ou
apresentao do ponto de vista dos candidatos sobre um determinado tema, ou seja, recai-se
no esquema tradicional das dissertaes, e no das narraes.
Na tentativa de esclarecer melhor essas questes e aprofundar um pouco mais o estudo
da relao entre narrao e metfora, propomos, com base nos postulados da Gramtica
Cognitiva, a existncia de um domnio no qual todas as informaes narrativas so
processadas, isto , no qual convergem elementos como espao, personagem, tempo e ao,
cujo reflexo se manifesta no texto escrito. A esse domnio, que corresponde ao espao da
mescla no modelo de Fauconnier e Turner, estamos denominando Domnio Cognitivo da
Narrativa, o qual descreveremos com mais detalhes a seguir.
5.4.2. O modelo dos Domnios Cognitivos da Narrativa
O Domnio Cognitivo da Narrativa (doravante DCN) , pois, um espao cognitivo no
qual vislumbramos a conjugao de elementos metafricos e no metafricos na realizao
das aes e na apresentao do contedo narrativo. Os limites do DCN coincidem
basicamente com os limites do texto, entendido este em sua acepo mais ampla, alm da
mera sequncia de elementos da superfcie (palavras, frases, pargrafos etc.), atingindo os
fatores cognitivos envolvidos na sua organizao. Esse domnio engloba, claro, informaes
de ordem pragmtica, cultural, contextual etc., envolvidas no processo de composio textual.
O espao da mescla insuficiente para abarcar todas essas informaes. Ele explica
muito bem a ocorrncia de metforas e outros fenmenos, mas muitas informaes contidas
num texto esto fora da mescla, incluindo informaes no metafricas. O espao da mescla
o espao da compresso, e o texto no s compresso. Em virtude disso, propomos situar o

Heberth Paulo de Souza; p. 185-213.

206

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

DCN de forma a englobar o espao-mescla e, ao mesmo tempo, abrigar as informaes no


metafricas do texto e quaisquer outras informaes que sejam pertinentes para a
compreenso do mesmo em termos narrativos.
Assim, chegamos ao seguinte modelo de apresentao do DCN em relao ao modelo
da mesclagem conceitual:

Figura 5 Estrutura do DCN em relao ao modelo da mesclagem conceitual

Vejamos um exemplo de representao de um texto do nosso corpus de pesquisa nos


parmetros de representao do modelo aqui proposto, a saber, a redao de n 187, que segue
transcrita abaixo:
(2) Pirataria, uma necessidade.
Como se sobressair dos problemas que atingem hoje a maioria da sociedade
brasileira? A misria est presente em muitas famlias no nosso pas, e isso faz
com que elas procurem vrios tipos de emprego, instantneos, para que possam ir
sobrevivendo. Devido grande carncia do povo brasileiro, a pirataria tornou-se
um negcio to lucrativo, e o nico para alguns.
notvel a situao em que vive a maioria do povo brasileiro, salrios baixos,
endividados devido ao grande consumo, e sem mo de obra qualificada. Tudo isso
deixa a prpria sociedade numa saia justa, e para no entrarem no mundo da

Heberth Paulo de Souza; p. 185-213.

207

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

criminalidade, as pessoas vem como soluo trabalhar com produtos pirateados.


A pirataria ilegal sim, porm, para alguns a nica base de sobrevivncia.
No Brasil a pirataria tornou-se muito comum, e por ser um comrcio que tanto
cresceu beneficiando os mais pobres, e por ser tambm de baixo custo, causou
abalo no mercado dos produtos originais, que por possurem um alto custo para
compra no so viveis comunidade mais pobre.
certo que em todo o mundo a pirataria ilegal, um crime. Porm, dentro dos
padres de criminalidade do Brasil, esse um crime suave, e por uma boa causa.
Comparado com outros crimes atuais, a pirataria deve ser classificada como um
bem, pois est dando comida e dignidade s famlias brasileiras que necessitam de
apoio.
No texto acima, podemos apontar os seguintes elementos componentes da narrativa:
- Tempo (no metafrico): hoje.
- Personagens no metafricos: a maioria da sociedade brasileira; o povo brasileiro; famlias
brasileiras.
- Personagens metafricos: misria (ela est presente no espao metafrico muitas
famlias); famlias (elas procuram vrios tipos de emprego para sua sobrevivncia); a
sociedade (fica numa saia justa); pirataria (est dando comida e dignidade s famlias
brasileiras).
- Espaos no metafricos: no nosso pas; Brasil; todo o mundo.
- Espaos metafricos: muitas famlias (local onde se encontra a misria); mundo da
criminalidade (onde as pessoas tentam no entrar); mercado dos produtos originais (sofreu
abalo causado pela pirataria); saia justa (onde fica a sociedade).
Na redao de nmero 187 transcrita acima, da mesma maneira como acontece em
outros textos, o tempo marcado no metaforicamente, atravs do introdutor de espao
hoje. Em relao a esse tempo, personagens e espaos so apresentados, no mbito da
metfora e da no metfora, conforme a listagem apresentada acima.
Em relao aos espaos metafricos estabelecidos no texto, percebe-se que eles se
ligam exclusivamente a alguns personagens, no funcionando como locais de ao de vrios
deles. Por isso, uma representao mais detalhada no modelo do DCN capaz de representar
melhor essa situao.
Os personagens e os espaos no metafricos aparecem, em alguma proporo,
repetidas vezes, atravs de expresses lingusticas bem similares, podendo ser resumidos no
seguinte:
- Personagens no metafricos: brasileiros.

Heberth Paulo de Souza; p. 185-213.

208

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

- Espaos no metafricos: Brasil; mundo.


J em relao aos personagens e espaos metafricos, nota-se uma variedade muito
maior, no sendo possvel resumi-los, como fizemos com os no metafricos.
Diante desse quadro, podemos traar a seguinte representao do DCN do texto
transcrito em (2):

Figura 6 Representao detalhada do DCN da redao n 187

Nem todas as relaes de sentido esto representadas na figura acima; portanto, a


narrativa no se esgota com as relaes que foram apresentadas. Essa uma maneira de
exemplificarmos como se do tais relaes, envolvendo diferentes elementos metafricos e
no metafricos, para a constituio narrativa do texto no mbito de sua representao
semntico-cognitiva.

Heberth Paulo de Souza; p. 185-213.

209

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

6. Consideraes finais
Considerar que, no processo de produo de textos, a mente humana apresenta o
funcionamento prprio da estruturao narrativa , em outras palavras, apresentar a narrao
como o principal procedimento lingustico-textual, o princpio organizador das ideias, mesmo
que, na estrutura superficial, o texto resulte numa no narrativa de acordo com a clssica
tipologia textual.
O que se mostra como novidade no contexto da nossa pesquisa a forma como esse
processo se desenvolve, envolvendo metfora (que se situa no espao da mesclagem
conceitual) e no metfora.
A partir dessa constatao, o esquema dos DCNs pode ser incorporado pela
Lingustica Textual, que a rea por excelncia que deu impulso s descobertas dos aspectos
de coeso e coerncia textuais aplicados a textos de natureza diversa; pode ser aproveitado
tambm para os diversos tipos de estudo realizados no bojo da Semntica, rea que trata dos
processos de produo do sentido e sua correlao com aspectos que vo alm do texto,
interagindo com a Pragmtica; o modelo se constitui tambm como um bom subsdio para os
estudos empreendidos nas diversas vertentes da Anlise do Discurso, uma vez que as
informaes sobre tempo, espao e personagens so claramente relacionadas a fatores de
ordem pragmtica, histrica e lingustica a que essa rea comumente recorre; e, apesar de
apresentar embasamentos tericos e formas de abordagem diferentes das teorias lingusticas, o
modelo tambm pode ser utilizado em estudos literrios, uma vez que seja feita a necessria
equalizao dos conceitos de metfora e narrativa. Mais do que uma contribuio terica para
a Literatura, pensa-se na possibilidade de aproveitamento do modelo de anlise para
esclarecer aspectos que no so exclusivos da teoria lingustica.
Sendo mais especfico em nossa abordagem, o trabalho apresenta tambm ampla
abertura para a aplicabilidade de ferramentas eletrnicas da Lingustica de Corpus, no s
empreendendo pesquisas em direo ao grau de eficcia das mesmas quando o tema a
metfora, mas contribuindo para mostrar tambm o nvel de dificuldade e o alcance de
procedimentos quando do seu uso efetivo. Na tese que deu origem a este artigo, no
desenvolvemos um aparato dentro dessa vertente, mas lidamos com elementos de um corpus
organizado, e cada trabalho que feito com a utilizao de corpora especficos constitui um
ganho tanto no mbito da anlise lingustica em si, quanto em relao avaliao dos
procedimentos tcnicos capazes de serem empreendidos nessa anlise.

Heberth Paulo de Souza; p. 185-213.

210

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Ademais, outras reas do conhecimento humano podem ser beneficiadas de alguma


maneira com a adoo do modelo proposto, desde que estejam interessadas na descrio das
representaes mentais envolvidas na articulao textual. Referimo-nos aqui superficialmente
a algumas reas mais ligadas cognio humana, tais como a Psicologia, a Psicanlise,
algumas vertentes da Pedagogia, a Cincia da Informao etc. Enfim, so muitas as
possibilidades que se abrem a partir da adoo desse modelo, dentro e fora dos estudos
lingusticos na mesma proporo em que cada descoberta cientfica numa determinada rea
acarreta, no mnimo, muitas responsabilidades de investigao na prpria rea e nas suas
correlatas. No vamos nos enveredar aqui nessas possibilidades de aplicao do modelo em
outras reas, pois isso requereria conhecimentos especficos dentro das mesmas, mas
lembramos que os termos cognio e, por extenso, domnio cognitivo aplicam-se muito
bem a praticamente todo tipo de estudo que envolve processamento de sentido, raciocnio
lgico, processos mentais, redes neurais, estados psicolgicos etc. E, conforme mostramos,
sendo a narrao um processo inerente espcie humana, a adoo de um modelo que
considere a existncia de um domnio cognitivo em que se processa a narrao certamente
capaz de trazer muitos benefcios em termos de uma melhor compreenso de como funciona a
mente humana.
Referncias
BERBER SARDINHA, T. An assessment of metaphor retrieval methods. 2009. 25 p.
Draft.
______. Lingustica de corpus. Barueri: Manole, 2004.
BEZERRA, M. A. Da redao ao gnero textual: a didatizao da escrita na sala de aula. In:
MOURA, D. (Org.). Os desafios da lngua: pesquisas em lngua falada e escrita. Macei:
EDUFAL, 2008. p. 135-138.
FAUCONNIER, G. Espaces mentaux: aspects de la construction du sens dans les langues
naturelles. Paris: Minuit, 1984.
_______________. Mappings in thought and language. Cambridge: Cambridge University
Press, 1997.
http://dx.doi.org/10.1017/CBO9781139174220
_______________. Mental spaces: aspects of meaning construction in natural language.
Cambridge:
Cambridge
University
Press,
1994.
http://dx.doi.org/10.1017/CBO9780511624582

Heberth Paulo de Souza; p. 185-213.

211

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

FAUCONNIER, G.; TURNER, M. Blending as a central process of grammar. In:


GOLDBERG, A. (Ed.). Conceptual structure, discourse, and language. Stanford: Center
for the Study of Language and Information (CSLI) / Cambridge University Press, 1996. p.
113-129.
______. Conceptual integration networks. In: Cognitive science, vol. 22 (2), p. 133-187,
1998.
http://dx.doi.org/10.1207/s15516709cog2202_1
______. Conceptual projection and middle spaces (1994). Report 9401. University of
California,
San
Diego.
Disponvel
em
<http://www.cogsci.ucsd.edu/research/files/technical/9401.pdf>. Acesso em: 08 fev. 2008.
______. Compression and global insight. In: Cognitive Linguistics 11 3/4, p. 283-304,
2000.
______. The way we think: conceptual blending and the minds hidden complexities. New
York: Basic Books, 2002.
GIBBS JR., R. W. A new look at literal meaning in understanding what is said and
implicated.
Journal of pragmatics, 34, p. 457-486, 2002.
http://dx.doi.org/10.1016/S0378-2166(01)00046-7
GRADY, J. E.; OAKLEY, T.; COULSON, S. Blending and metaphor. In: GIBBS JR., R.
W.; STEEN, G. J. (Eds.). Metaphor in cognitive linguistics; selected papers from the Fifth
International Cognitive Linguistics Conference. Amsterdam / Philadelphia: John Benjamins
Publishing Company, 1997. p. 101-124.
LAKOFF, G.; JOHNSON, M. Metaphors we live by. Chicago/London: The University of
Chicago Press, 1980.
LANGACKER, R. W. Foundations of cognitive grammar, volume I Theoretical
Prerequisites. Stanford: Stanford University Press, 1987.
______. Foundations of cognitive grammar, volume II Descriptive Application.
Stanford: Stanford University Press, 1991.
NUNBERG, G. The pragmatics of reference. Bloomington: Indiana University Linguistics
Club, 1978.
REDDY, M. J. The conduit metaphor: a case of frame conflict in our language about
language. In: ORTONY, A. (Org.). Metaphor and thought. Cambridge: Cambridge
University Press, 1979. p. 284-324.
STEFANOWITSCH, A. Corpus-based approaches to metaphor and metonymy. In:
STEFANOWITSCH, A.; GRIES, S. T. (Eds.). Corpus-based approaches to metaphor and
metonymy. Berlin/New York: Mouton de Gruyter, 2006. p. 1-16 (Trends in Linguistics 171).
http://dx.doi.org/10.1515/9783110199895

Heberth Paulo de Souza; p. 185-213.

212

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

______. The function of metaphor. International Journal of Corpus Linguistics, 10:2, p.


161-198, 2005.
http://dx.doi.org/10.1075/ijcl.10.2.03ste
______; GRIES, S. T. Collostructions: investigating the interaction of words and
constructions. International Journal of Corpus Linguistics, 8:2, p. 209-243, 2003.
http://dx.doi.org/10.1075/ijcl.8.2.03ste
TURNER, M. The literary mind: the origins of thought and language. New York / Oxford:
Oxford University Press, 1996.
TURNER, M.; FAUCONNIER, G. Conceptual integration and formal expression. In:
JOHNSON, M. (Ed.). Journal of metaphor and symbolic activity, vol. 10, n. 3, p. 183-203,
1995.
Artigo recebido em: 14.10.2014
Artigo aprovado em: 21.11.2014

Heberth Paulo de Souza; p. 185-213.

213

A terminologia do futebol: um estudo direcionado pelo corpus


Football terminology: a corpus-driven study
Sabrina Matuda*
Stella E. O. Tagnin**
RESUMO: Este artigo tem como objetivo
estudar a terminologia do futebol em ingls e
portugus. Para tanto, a fundamentao
terica embasa-se na Lingustica de Corpus,
na Terminologia Textual, na traduo tcnica
como condicionante cultural e no conceito
forma-representao. O corpus de estudo
possui aproximadamente um milho de
palavras em cada lngua. Para etiquetar o
corpus, utilizamos o etiquetador Tree
Tagger, desenvolvido por Helmut Schmid, e,
para explor-lo, o WordSmith Tools, de Mike
Scott.

ABSTRACT: This article aims at


investigating football terminology in English
and Portuguese. To that aim, the study is
based on the notions of Corpus Linguistics
and Textual Terminology. To explain cultural
differences, technical translation is viewed as
a communicative act subject to cultural
restraints and the concept of formrepresentation is called upon to elucidate
such differences. Our corpus consists of
approximately two million words. To tag the
corpus we used Helmut Schmids TreeTagger and to explore the corpus we used
Mike Scotts WordSmith Tools.

PALAVRAS-CHAVE:
Linguistca de Corpus.
Futebol e cultura.

KEYWORDS:
Translation.
Corpus
Linguistics. Terminology. Football and
Culture.

Traduo.
Terminologia.

1. Por que estudar a terminologia do futebol


O futebol o esporte mais praticado no Brasil e no mundo. reconhecido
mundialmente como competio, manifestao cultural e at mesmo como um mercado na
ordem econmica. A FIFA (Federao Internacional de Futebol Associado) congrega mais de
140 milhes de jogadores de 300 mil clubes, em 207 pases afiliados.
O Brasil, conhecido mundialmente como o Pas do Futebol, tem aproximadamente
40 milhes de praticantes, entre atletas profissionais e amadores, cerca de 11 mil jogadores
federados, 800 clubes, mais de dois mil atletas atuando em outros pases e 580 estdios. Alm
de, pelo menos, 20 mil campinhos de pelada, nos bairros de classe mais baixa , escolinhas
de futebol e milhares de torcedores.

Doutoranda da Faculdade de Filosofia, Letras e Cincias Humanas (FFLCH) da Universidade de So Paulo


(USP).
** Livre Docente pela Faculdade de Filosofia, Letras e Cincias Humanas (FFLCH) da Universidade de So
Paulo (USP).
*

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

O esporte praticado em todo o pas por camadas sociais distintas e em diferentes


espaos: campos de vrzea, quadras, praias, ruas, escolas, clubes etc. Enfim, parte do
cotidiano de muitos brasileiros. DaMatta (1982) destaca que o futebol praticado, vivido e
discutido no Brasil um dos modos pelo qual a sociedade brasileira fala, se apresenta e se
deixa descobrir. Nessa mesma linha, tambm notrio o reconhecimento do futebol, no
Brasil, como objeto das cincias humanas ao longo dos ltimos anos. Sobretudo a partir da
dcada de 1990, ampliaram-se as pesquisas acadmicas e publicaes editoriais acerca do
futebol (GIGLIO; SPAGGIARI, 2010).
Essa popularidade, tanto no Brasil quanto em outros pases, tem aumentado a
participao da indstria do futebol na economia mundial, movimentando cerca de 250
bilhes de dlares anuais (LEONCINI; SILVA, 2005).
fato que as relaes futebolsticas entre o Brasil e os pases da Europa crescem cada
vez mais (CRUZ, 2005), seja pelo intercmbio de contratos de jogadores e tcnicos, pelos
direitos de transmisso de campeonatos, pelo patrocnio de jogadores por grandes marcas ou
por qualquer outra negociao que envolva um produto relacionado ao futebol.
Para que todas essas relaes se materializem, estabelece-se uma comunicao que, na
grande maioria das vezes, se d em lngua inglesa. No entanto, cada nao tem a sua maneira
de jogar, torcer e narrar, maneira, essa, expressa por meio de sua lngua materna. O problema
surge quando se quer expressar essas particularidades em uma lngua estrangeira.
Embora seja, muitas vezes, relacionado somente ao lazer, o futebol no deixa de ser
uma rea de especialidade tanto no Brasil quanto em outros pases. Sendo assim, possui uma
linguagem prpria utilizada para descrever o universo a ele relacionado. Essa linguagem
padronizada e, justamente por esse motivo, no pode ser utilizada de qualquer forma. Ao falar
em padronizao, no pretendemos, de forma alguma, tentar normatizar o lxico do futebol
para favorecer a eficcia das comunicaes especializadas em torno dessa temtica. Ao
contrrio, pretendemos favorecer as peculiaridades de cada texto dentro de seu discurso
(KRIEGER; FINATTO, 2004) levando em conta os aspectos histricos e socioculturais
presentes em cada cultura.
A fim de melhor entender como essas particularidades histricas e socioculturais se
manifestam na lngua, utilizamos o conceito forma-representao proposto por Toledo (2002).
Segundo o antroplogo, o conjunto de regras que define a atividade como esporte no
delimita as maneiras de jogar. Na verdade, a apropriao e a interpretao cultural que cada

Sabrina Matuda, Stella Tagnin; p. 214-243.

215

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

regio faz das regras que determinam as formas de jogo. Justapostas, as regras e as formas
de jogo do origem s representaes, ou seja, o ajustamento da observao emprica das
formas de jogo em um plano simblico que, por sua vez, consolida as conhecidas escolas,
jeitos e estilos de se jogar.
2. Objetivos
O principal objetivo deste artigo, recorte de nossa pesquisa de doutorado que est
sendo desenvolvida no programa de Estudos da Traduo da Universidade de So Paulo,
demonstrar como a extrao terminolgica e a identificao de equivalentes tradutrios em
corpora comparveis contribui para uma investigao terminolgica que transpe a esfera
lingustica e que considera fatores culturais e histricos no processo de entendimento do
lxico especializado. Para tanto, estabelecemos dois princpios, a saber:
1) a pesquisa foi feita do portugus para o ingls;
2) como se trata de um estudo exploratrio, ilustramos os passos seguidos para a extrao
terminolgica e a identificao de equivalentes tradutrios por meio de um estudo de
caso com gol, segundo termo mais frequente no corpus, e a unidade fraseolgica 1
mais frequente que comporta o termo: fazer um/o gol.
3. Traduo tcnica como condicionante cultural
Entendemos traduo tcnica como um ramo da traduo que se ocupa da traduo de
textos de lnguas de especialidade. Os tradutores, assim como os intrpretes, os redatores
tcnicos, os jornalistas e os documentalistas so usurios indiretos das terminologias, pois a
eles interessa o uso adequado dos termos, das fraseologias e de expresses idiomticas para
que o texto esteja de acordo com as normas de convencionalidade que regem a produo do
tipo e do gnero textual em questo na cultura em que produzido.
Muito comum a ideia de que a traduo tcnica, diferente da literria, constitui um
universo parte, pois, para alguns, sua terminologia no se deixa contaminar por relaes
contextuais e pragmticas, possuindo certa estabilidade que favorece e facilita o processo
tradutrio. Com base nesses preceitos, a traduo tcnica , muitas vezes, definida como uma
1

Em nosso trabalho, consideramos unidades fraseolgicas associaes de, no mnimo, duas palavras, sendo uma
delas obrigatoriamente uma palavra-chave no corpus e que apresentem frequncia maior ou igual a trs.

Sabrina Matuda, Stella Tagnin; p. 214-243.

216

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

operao de transcodificao em que os conceitos constituem uma [sic] amlgama


indissolvel e imune aos efeitos do tempo e do espao, a fim de poderem resistir a uma srie
de condicionantes a que esto expostos. (AZENHA, 1999, p. 10).
Adotamos a proposta de Azenha (1999, p. 60), a de uma traduo tcnica que vai alm
dos limites do texto, uma traduo que define o ato tradutrio tendo como ponto de partida o
ato de comunicao. Em virtude disso, o texto tcnico, assim como qualquer outra forma de
comunicao, est atrelado a uma realidade scio-histrico-cultural.
Para o autor, no podemos deixar de lado as relaes que o texto tcnico trava com o
contexto em que produzido. Ao contrrio, os termos, as fraseologias, as definies, os
equivalentes e as expresses devem ser empregados de maneira convencional2 no texto de
chegada, respeitando as variveis ligadas ao emissor, receptor, situao e objetivo de
comunicao.
Neste estudo, consideramos equivalente uma unidade fraseolgica que funcione no
texto de chegada como funciona no texto de partida (TAGNIN, 2007, p. 1). O conceito,
bastante amplo, nos permite identificar equivalentes no s no nvel da palavra, do texto ou da
frase, mas tambm equivalentes pragmticos, ou seja, equivalentes que, embora no reflitam
uma traduo direta para a lngua de chegada, so utilizados no mesmo contexto e com o
mesmo objetivo comunicativo.
Ao considerarmos que os termos so empregados em dado cenrio histrico-cultural e,
portanto, condicionados por normas sociais e lingusticas sempre sujeitas a alteraes
(AZENHA, 1999, p. 22), no vemos outra possibilidade seno o uso de corpora comparveis
para a identificao dos equivalentes tradutrios.
4. Terminologia Textual
Neste estudo, adotamos a Terminologia Textual como aporte terico para nossa
pesquisa.
Seria invivel falar de Terminologia Textual sem discutir, ainda que brevemente, seu
objeto de estudo: o texto especializado que, segundo Hoffmann (1998 apud KRIEGER;
FINATTO, 2004, p. 113) , possui dois eixos bsicos: um horizontal, relacionado ao critrio
temtico, englobando diferentes disciplinas e suas eventuais subdivises, e um vertical,
2

Adotamos a definio de convencionalidade proposta por Tagnin (2005): forma peculiar de expresso de uma
dada lngua ou comunidade lingstica p.14.

Sabrina Matuda, Stella Tagnin; p. 214-243.

217

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

relacionado ao grau de especializao do texto, ou seja, densidade terminolgica. A


classificao de Hoffmann ressalta o fator pragmtico no mbito das comunicaes
especializadas e enfatiza o papel que as unidades lexicais assumem em diferentes contextos
especializados de comunicao.
Alguns tipos de texto possuem maior densidade terminolgica do que outros: em
nosso caso, as notcias de resultados de partidas possuem densidade terminolgica bem menor
do que os relatos de partida minuto a minuto. Por outro lado, seria ingenuidade de nossa parte
analisar a densidade terminolgica de nosso corpus somente pela diviso de gneros textuais.
Por esse motivo, optamos por adotar um carter gradual para observar a densidade
terminolgica dos textos, pois, por exemplo, um texto sobre resultado de partida publicado
por um tabloide ingls pode apresentar uma terminologia bem distinta daquela expressa em
um texto do mesmo gnero publicado por um jornal mais tradicional. Essa variao
terminolgica no se refere apenas densidade terminolgica de um texto, mas tambm s
diferentes terminologias encontradas em peridicos distintos. Por esse motivo, mais do que o
tema, o grau de densidade informativa, a forma de se comunicar, a situao em que se
comunica e para quem se comunica constituem fatores determinantes do grau de
especializao de um texto.
Krieger e Finatto (2004) propem que a variao tipolgica no mbito da
comunicao especializada se reflete, por exemplo, na distino entre uma tese, um artigo de
peridico altamente especializado em determinada rea do conhecimento e um texto de jornal
ou de revista informativa redigido com a finalidade de divulgar ao grande pblico um
acontecimento cientfico. Essa distino no pode ser aplicada ao nosso caso por vrios
motivos. Primeiramente, devido grande repercusso que o futebol tem na sociedade
moderna, a delimitao de grande pblico e de especialistas se torna um pouco controversa.
Em um primeiro momento, tenderamos a caracterizar os jornalistas esportivos, jogadores,
tcnicos e membros da comisso tcnica como especialistas e os leitores e fs de futebol em
geral como grande pblico. No entanto, o que acontece que, em se tratando de futebol,
todo torcedor pode ser considerado um especialista na rea.
Devido a essa grande dificuldade de delimitao de grande pblico e de
especialistas, adotamos, aqui, a classificao de atores sociais do futebol proposta por Toledo
(2002, p. 15):

Sabrina Matuda, Stella Tagnin; p. 214-243.

218

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Parto de trs [atores sociais] dentro do campo esportivo: os profissionais


(jogadores, tcnicos, dirigentes, juzes, preparadores, mdicos, etc.), os
especialistas (a crnica esportiva) e o conjunto genrico de torcedores,
comuns ou nomeados e reunidos em certas coletividades especficas.

Essa classificao utilizada por Toledo para uma anlise das lgicas do futebol, com
o propsito de caracterizar os grupos sociais que se expressam por meio do futebols. Dentro
dessa ordem, os profissionais so todos aqueles que interferem diretamente no jogo, quer
dentro do campo, como os jogadores, quer fora do campo, como os dirigentes e instituies
como federaes. Os especialistas so representados pela crnica esportiva e pelo jornalismo
esportivo e, segundo Toledo, ocupam um lugar simblico equidistante entre os profissionais e
os torcedores, pois no participam efetivamente da partida, mas tambm no se comprometem
em um nvel de emoo partidria, pelo menos em teoria. Por fim, o grande pblico
caracterizado pelos torcedores.
a classe dos especialistas que mais nos interessa neste trabalho, pois atravs do
produto do fazer jornalstico que observamos o futebol fora de seu locus de ritualizao
mxima, que a partida. Ademais, tambm por meio dos textos jornalsticos que o futebol
alcana o grande pblico. Contudo, no podemos deixar de enfatizar a importncia que o
terceiro grupo, o conjunto genrico de torcedores, desempenha em nossa pesquisa, pois
frequentemente recorremos a torcedores e amantes do esporte para melhor entender uma
jogada ou drible.
Deve-se somar, ainda, classificao de Toledo, o grau de densidade informativa da
notcia, a forma de se comunicar, os traos de impessoalidade do jornalista, o contexto em que
a notcia foi produzida3, o propsito da comunicao, que pode ser mais informativo, mais
descritivo, mais tcnico, para que, assim, seja possvel caracterizar o texto tcnico
propriamente.
Nessa concepo de texto especializado, a presena de termos deixa de ser o elemento
primordial que configura o carter de uma comunicao especializada (KRIEGER;
FINATTO, 2004). Ao contrrio, os mecanismos lingusticos, textuais e pragmticos dos quais
um texto especializado faz uso tambm constituem elementos caracterizadores de dada lngua

Uma notcia sobre o resultado de partida de um jogo do campeonato brasileiro provavelmente produzida em
um contexto mais especfico e, portanto, voltada para um pblico mais especfico do que uma notcia sobre uma
partida de Copa do Mundo, pois durante esse acontecimento mais pessoas torcem, inclusive torcedores no
habituais.

Sabrina Matuda, Stella Tagnin; p. 214-243.

219

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

de especialidade. O uso de todos esses elementos em conjunto nos permite enxergar a


complexidade do texto especializado.
Uma vez caracterizado seu principal objeto de estudo, passemos, agora, a uma breve
discusso sobre as caractersticas da Terminologia Textual.
Para Krieger e Finatto (2004,), essa Terminologia, na qual o objeto termo d lugar
ao objeto texto, possui duas caractersticas principais. A primeira refere-se ao
reconhecimento do papel do cenrio comunicativo e, consequentemente, do texto
especializado para a descrio de uma terminologia. A segunda est relacionada ao estudo e
caracterizao do texto especializado.
Ao reconhecer o papel do cenrio comunicativo, a Terminologia textual parte do
pressuposto de que os termos so utilizados em situao de comunicao e que, portanto, no
devem, ou melhor, no podem ser estudados parte do contexto sociocultural em que
ocorrem.
Os termos passaram a ser analisados em uso, ou seja, em textos especializados,
permitindo, assim, a verificao de fenmenos at ento ignorados, ou deixados em segundo
plano pelos terminlogos. O contexto discursivo, antes considerado insignificante, passa a
representar uma das principais caractersticas da Terminologia, contribuindo para um novo
tratamento das Unidades Terminolgicas (UTs), deixando de lado a ideia de que os termos
constituem construtos tericos idealizados em um sistema lingustico independente.
5. A Lingustica de Corpus neste estudo
So inmeras as definies para Lingustica de Corpus (LC) e no nos cabe aqui, por
questes de tempo e prposito de pesquisa, apresentar um panorama com todas as definies,
que diferem consideralvelmente umas das outras.
Os tericos da LC frequentemente discordam quanto sua caracterizao. Autores
como Berber Sardinha (2000), consideram a LC uma abordagem, outros, como o caso de
Rocha (2001), uma metodologia. Existem ainda os estudiosos que preferem ser mais neutros
em suas definies e no tomam nenhum partido como, por exemplo, Aijmer e Altenberg
(1991, p. 2), que definem a LC como o estudo da lngua por meio de corpora. H ainda os
que adotam as duas definies como Bowker e Pearson (2002, p. 20): uma abordagem ou
metodologia para o estudo da lngua em uso.
Berber Sardinha chama ateno para o fato de que a LC no constitui somente um

Sabrina Matuda, Stella Tagnin; p. 214-243.

220

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

metodologia, um instrumental, do qual outras reas podem se valer para o estudo da


linguagem. Para o autor, a LC apresenta tambm uma nova perspectiva de se chegar
linguagem possibilitando aos seus seguidores produzir conhecimento novo que muitas vezes
coloca teorias lingusticas tradicionais em questo.
Neste trabalho, adotamos duas definies de LC que, at o presente momento, nos
pareceram as mais abrangentes. Primeiramente, assim como Berber Sardinha (2004 p.32),
acreditamos que a LC constitui uma abordagem empirista que toma a lngua como sistema
probabilstico, refletindo uma nova maneira de enxergar a linguagem que, consequente e
futuramente, poder dar origem a uma nova teoria lingustica. Adotamos, tambm, a viso de
McEnery e Hardie (2012:1), que definem LC como [...] rea que foca em um conjunto de
procedimentos, ou mtodos, para o estudo da lngua [...]4.
As duas definies acima se enquadrariam perfeitamente nos propsitos de nossa
pesquisa se utilizssemos a LC unicamente para explorar um fenmeno lingustico. No
entanto, o escopo de nossa pesquisa vai alm da esfera lingustica; estabelecemos, sempre que
possvel, um paralelo entre lngua, cultura e histria. Ademais, acreditamos que a LC pode e
deve ser utilizada como metodologia, e, sim, unicamente como metodologia para pesquisas de
outras reas como, por exemplo, histria, antropologia e jornalismo. Por esse motivo,
acreditamos que as vises de Berber Sardinha e de McEnery e Hardie se mostram limitadas s
reas de estudos da linguagem. fato que existe uma tendncia mais atual de utilizar a LC em
reas afins; um bom exemplo dessa tendncia foram os trs cursos de vero oferecidos pela
Lancaster University em julho de 2013: UCREL Summer School in Corpus linguistics, ESRC
Summer School in GIS in Corpus Approaches for Social Sciences e ERC Summer School in
GIS for the Digital Humanities. Como podemos observar, somente um dos cursos foi
direcionado a linguistas.
Enfim, no nos cabe, aqui, criar uma nova definio de LC, apenas atentamos para o
fato de que, embora utilizemos essas duas definies, acreditamos que a LC pode ser utilizada
para outros fins, que no se restrinjam a pesquisas lingusticas.
Um corpus pode ser utilizado de diferentes maneiras para validar, exemplificar,
contestar ou formular teorias lingusticas. Tognini-Bonelli (2001) distingue duas abordagens
principais de pesquisa realizadas em corpora: abordagem baseada em corpus (corpus-based)
e abordagem direcionada pelo corpus (corpus-driven).
4

[] area which focuses upon a set of procedures, or methods, for studying language []

Sabrina Matuda, Stella Tagnin; p. 214-243.

221

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Na abordagem baseada em corpus, o linguista utiliza o corpus para explicitar, testar e


exemplificar teorias e hipteses pr-existentes e, principalmente, para extrair exemplos.
A vantagem dessa abordagem que a extrao de exemplos autnticos, seja para fins
lexicogrficos ou para a validao de hipteses, confere mais autoridade pesquisa. Por outro
lado, utilizar o corpus somente para verificar dados limita a viso do linguista, que ignora
novos fenmenos deixando de fazer novas descobertas e de desafiar teorias j existentes.
Na abordagem direcionada pelo corpus, o linguista analisa o corpus sem hipteses
pr-concebidas. O corpus mostra-lhe o caminho a ser percorrido. As descries so feitas
sempre com base nas evidncias do corpus, possibilitando, assim, novas descobertas. Por isso,
dizemos que nessa abordagem o linguista no busca evidncias para classific-las dentro de
categorias pr-definidas. Ao contrrio, se no decorrer da pesquisa no forem encontrados
padres lingusticos ou se os padres encontrados no puderem ser classificados em alguma
categoria, os achados constituiro argumentos de extrema relevncia para a descrio da
linguagem ou para a descoberta de novos fenmenos.
Nessa abordagem, o caminho metodolgico percorrido pelo linguista claro: a
observao dos dados conduz formulao de hipteses que, consequentemente, leva
generalizao dos resultados possibilitando, assim, a formulao de novas teorias (TOGNINIBONELLI, 2001).
Apesar de as duas abordagens apresentarem caractersticas bem distintas, acreditamos
que podem ser utilizadas em conjunto. Neste trabalho, utilizamos a abordagem direcionada
pelo corpus para extrair os termos a serem estudados por meio das palavras-chave e de seus
agrupamentos (clusters). Por outro lado, lanamos mo da abordagem baseada em corpus
quando partimos de uma traduo prima facie para a busca dos equivalentes nas linhas de
concordncia.
6. O corpus de estudo
O design e a qualidade do corpus de estudo constituem o pilar de qualquer pesquisa
em corpus. O quadro que segue mostra o design do corpus utilizado neste estudo5:

Chamamos ateno para o fato de que o corpus de estudo utilizado na presente pesquisa foi compilado para
atender os objetivos de nossa pesquisa de doutorado, a saber: 1) verificar como os diferentes jeitos de jogar, a
histria do futebol em cada cultura, a apropriao cultural das regras na Inglaterra e no Brasil e outros fatores de
ordem histrico-social contriburam para a criao do lxico do futebol em portugus e ingls; 2) criar um
glossrio de futebol composto por verbetes que evidenciem diferenas culturais entre o Brasil e a Inglaterra.

Sabrina Matuda, Stella Tagnin; p. 214-243.

222

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Quadro 1: composio do corpus de estudo.

Contedo
Assunto
Autoria
Lngua
Finalidade
Meio
Modo
tipo de texto
Perodo
Seleo
Tamanho

especializado
futebol
de lngua nativa
portugus (BR) e ingls (ING); comparvel
de estudo
eletrnico
escrito
resultados de partidas, narraes minuto a minuto e narraes minuto a
minuto com comentrios de internautas.
2013 2014
de amostragem; balanceado
aproximadamente 500 mil palavras em cada lngua
Ingls
No. palavras
600.079

No. textos
612

Portugus
No. Palavras
469.765

No. textos
864

O corpus utilizado na pesquisa composto por textos de trs peridicos ingleses sobre
resultados de partidas da primeira diviso do campeonato ingls de 2013/2014 6 e por textos de
trs peridicos brasileiros sobre resultados de partidas da primeira diviso do campeonato
brasileiro de 20137.
O corpus caracterizado como corpus especializado, uma vez que composto por
textos de uma nica rea de especialidade: futebol. Coletamos somente textos escritos
originalmente em portugus brasileiro e em ingls britnico.
No que se refere ao modo, nosso corpus escrito, pois no trabalhos com textos orais.
Optamos por coletar trs tipos de textos: resultados de partidas, narraes minuto a minuto,
que so escritas durante a partida por um narrador on-line; e narraes minuto a minuto com
comentrios de internautas, tambm escritas durante a partida por um narrador e com
contribuies de internautas que compartilham suas opinies sobre os lances do jogo.
7. O corpus de referncia
O corpus de referncia utilizado para contrastar com o corpus de estudo a fim de
evidenciar as formas mais frequentes nesse ltimo, filtrando os elementos mais genricos. Em

Os peridicos selecionados foram: o jornal The Guardian, o tabloide Daily Mail e o site sobre futebol
Football.com.
7
Os peridicos selecionados foram: o jornal O Estado de So Paulo, o jornal esportivo Gazeta Esportiva e a
revista sobre futebol Placar.

Sabrina Matuda, Stella Tagnin; p. 214-243.

223

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

geral, deve-se incluir vrios gneros textuais em um corpus de referncia, de modo que
proporcione uma escolha no-marcada das palavras-chave, pois suas caractersticas
influenciam de forma direta os tipos de palavra que podem se tornar chave (BERBER
SARDINHA, 2004).
O tamanho do corpus de referncia pode influenciar o nmero de palavras-chave
obtidas. Berber Sardinha (2004, p. 102) recomenda que o corpus de referncia seja entre trs e
cinco vezes maior que o corpus de estudo.
Compilar um corpus muito maior do que o recomendado no retornar,
necessariamente, maior nmero de palavras-chave (BERBER SARDINHA, 2004). No
entanto, no existem restries que limitem o tamanho do corpus de referncia.
Em nossa pesquisa utilizamos dois corpora de referncia: o BNC (British National
Corpus) 8 e o Banco de Portugus9. O BNC, corpus fechado (1990-1994), possui 100 milhes
de palavras e foi desenvolvido com o objetivo de ser representativo das variantes escrita e
falada do ingls britnico. O Banco de Portugus um corpus monitor do portugus do
Brasil, ou seja, est aberto e constantemente atualizado. Conta com aproximadamente um
bilho de palavras.
8. Metodologia
Para nossa pesquisa, utilizamos o software WordSmith Tools verso 5.0, desenvolvido
por Mike Scott e publicado pela Oxford University Press. O programa possui trs ferramentas
principais WordList, KeyWords e Concord e uma srie de aplicativos extremamente teis para
a anlise lingustica. Ressaltamos que o WordSmith Tools 5 um software riqussimo para a
anlise lingustica, sendo que cada uma de suas ferramentas possui vrios instrumentos de
anlise. Contudo, descreveremos aqui somente as ferramentas e aplicativos que esto sendo
utilizados em nossa pesquisa.
Para extrair os candidatos a termo, geramos uma lista de palavras-chave para o corpus
de portugus, j que a extrao terminolgica foi realizada na direo portugus-ingls. Para
tanto, comparamos a wordlist do nosso corpus com a wordlist do corpus de referncia para
obter as keywords.

8
9

Disponvel em: < http://corpus.byu.edu/bnc/ > Acesso em: 15 ago 2014.


Disponvel em: http://www2.lael.pucsp.br/corpora/bp/conc/ Acesso em: 15 ago 2014.

Sabrina Matuda, Stella Tagnin; p. 214-243.

224

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Figura 1: 1: lista de palavras do corpus de estudo; 2: lista de palavras do corpus de referncia; 3: lista de
palavras-chave.

Aps obter as palavras-chave, geramos linhas de concordncia para as palavras-chave


e examinamos seus agrupamentos (clusters) a fim de encontrar colocaes e unidades
fraseolgicas. Para tanto, utilizamos a ferramenta Concord, que gera listas das ocorrncias de
um item especfico, chamado de palavra de busca ou ndulo. Esse item pode ser formado
por uma ou mais palavras e apresentado com o contexto ao seu redor (Figura 2).

Figura 2: linhas de concordncia para a palavra goal.

A figura 2 mostra as linhas de concordncia de goal ordenadas alfabeticamente pela


primeira palavra esquerda.
O prximo passo foi examinar as linhas de concordncia e, quando necessrio, gerar

Sabrina Matuda, Stella Tagnin; p. 214-243.

225

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

clusters para essas linhas. A figura 3 mostra os clusters de gol:


N
1
2
3
4
5
6
7
8
9
10

CLUSTER
GOL FEITO POR
NO GOL FEITO
DIREITA NO GOL
DE DIREITA NO
PARA O GOL
POR CIMA DO
CIMA DO GOL
DO GOL DE
O PRIMEIRO GOL
O GOL DE

FREQ.
561
561
391
391
318
230
221
196
173
173

N
11
12
13
14
15
16
17
18
19
20

CLUSTER
ESQUERDA NO GOL
DE ESQUERDA NO
DO GOL E
O SEGUNDO GOL
DEPOIS DO GOL
O GOL DA
SADA DEPOIS DO
COM GOL DE
LONGE DO GOL
SAI DO GOL

FREQ.
169
169
165
149
146
126
123
109
108
106

Figura 3: primeiros 20 clusters de gol


No ajuste realizado acima para gol, o programa foi preparado para encontrar clusters
de trs palavras, com frequncia mnima de trs e em uma janela de cinco palavras direita e
cinco esquerda.
O ltimo passo para extrair os candidatos a termo foi expandir as linhas de
concordncia das palavras-chave e acessar o texto integral da ocorrncia, sempre que
necessrio, para melhor entender seu funcionamento e valid-las como termos.
Utilizamos procedimentos diferentes para o estabelecimento de equivalentes
tradutrios de cada termo. A no padronizao de uma metodologia deu-se pelo fato de que
alguns termos apresentam um equivalente prima-facie em ingls, sempre mais simples de ser
encontrado, ao passo que outros no apresentam esse tipo de equivalente e alguns sequer
possuem equivalente. Em suma, geramos linhas de concordncias para os termos e unidades
fraseolgicas especializadas (UFEs) em portugus, para melhor entender seu funcionamento,
ou seja, o tipo de texto, a situao em campo e o contexto em que ocorrem. Aps entender o
funcionamento dos termos e UFEs em portugus, geramos linhas de concordncia para suas
tradues prima facie em ingls. Por exemplo, para chegar ao equivalente de gol, geramos
linhas de concordncia para goal. A figura 4 mostra as linhas de concordncia do termo goal:

Sabrina Matuda, Stella Tagnin; p. 214-243.

226

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Figura 4: linhas de concordncia de goal

Esse tipo de pesquisa nos permitiu validar goal como equivalente de gol uma vez
que observamos que o contexto em que as duas palavras ocorrem o mesmo. No entanto, no
se mostrou eficiente para a validao de alguns equivalentes como, por exemplo, o
equivalente da unidade fraseolgica fazer um gol, j que no encontramos um verbo que coocorre com goal com frequncia relativamente alta. Por esse motivo, resolvemos gerar linhas
de concordncia para scored, traduo prima facie de marcar) a fim de verificar se o
termo co-ocorre com gol. Observemos a figura 5:

Figura 5: parte das linhas de concordncia de scored ordenadas pela duas primeiras palavras esquerda.

Em um primeiro momento, fomos levados a validar score ou score a goal como

Sabrina Matuda, Stella Tagnin; p. 214-243.

227

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

equivalente de fazer/marcar um gol, o que no est errado. Entretanto, a diferena entre a


frequncia da UFE em portugus marcar/fazer um gol e da UFE em ingls score a goal
era muito grande.

Decidimos, ento, conduzir buscas para todos os verbos do corpus

utilizando as seguintes etiquetas morfossintticas: VV (verbo no infinitivo), VVD (verbo no


passado simples), VVG (verbo no gerndio), VVN (verbo no particpio passado) e VVZ
(verbo no presente 3a pessoa do singular) a fim de encontrar outros verbos que
descrevessem o ato de fazer um gol.
A etiquetagem morfossinttica, ou part of speech tagging (POS), consiste em colocar
em cada palavra do corpus uma etiqueta que indique sua classe gramatical. A etiquetagem foi
realizada com o etiquetador Tree-Tagger, disponibilizado pelo professor Tony Berber
Sardinha, da Pontfica Universidade Catlica de So Paulo (PUC), no site do LAEL
(Programa de Lingustica Aplicada e Estudos da Linguagem) 10.
Os resultados dessas buscas sero detalhados mais adiante no estudo de caso.
Ressaltamos que priorizamos os corpora para a extrao e validao dos termos e UFEs, bem
como para a busca de equivalentes. No entanto, sempre que necessrio, recorremos internet
quando no encontramos o equivalente no corpus ou quando precisamos esclarecer a origem
ou o significado de algum termo.
9. Estudo de caso: FAZER 11 um gol
Ao analisar as linhas de concordncia de gol em nosso corpus de portugus,
encontramos, ao total, 920 ocorrncias de FAZER|MARCAR [o|um] gol / MARCAR o
tento / FINALIZAR / EMPATAR, termos e unidades fraseolgicas utilizados para
descrever um gol.
Ao buscar pelos possveis equivalentes em ingls, encontramos 259 ocorrncias de:
- SCORE({a | the} goal)
- SNATCH [a goal]
- DELIVER a goal
- ADD {a|the} ORDINAL (goal)
- BLAST in ([a goal])
A primeira pergunta que nos ocorreu foi: por que temos mais ocorrncias de gol em
10
11

disponvel em: <http://corpuslg.org/tools/etiquetagem/>


utilizamos letras maisculas para indicar a forma lematizada dos verbos

Sabrina Matuda, Stella Tagnin; p. 214-243.

228

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

portugus do que de goal em ingls, j que o nmero de gols da Srie A do Campeonato


Brasileiro quase o mesmo da Premier League? A figura 6 mostra o nmero de gols do
Campeonato Brasileiro de 2006 a 2013 e o nmero de gols das temporada 2011/2012,
2012/2013 e 2013/2014 da Premier League:

Figura 6: nmero de gols do Campeonato Brasileiro de 2006 a 201312 e nmero de gols da Premier League das
temporadas de 2011/2012, 2012/2013 e 2013/201413

Como podemos observar, o Campeonato Brasileiro de 2013 teve 936 gols e a Premier
League de 2013/2014 teve 1052 gols. Nosso segundo questionamento foi: se goal no
descreve os gols marcados, como esses gols esto sendo narrados? Nesse momento, nos
demos conta de que o verbo score, presente na unidade fraseolgica SCORE [{a | the} goal],
muitas vezes ocorria sozinho, observemos os exemplos que seguem:
a) The United States got out to an early lead as Clint Dempsey scored just 32
seconds into the game for the fastest goal in World Cup history for the U.S.
b) Striker Asamoah Gyan also scored right before the first half ended.
Mais adiante, ao ler os textos que coletvamos para compilar o corpus, nos demos
conta de que a lngua inglesa utiliza outros verbos que, muito frequentemente, no coocorrem com o termo gol, ou seja, so usados como sinnimos de SCORE [{a | the} goal].
Sendo assim, geramos linhas de concordncia para as etiquetas de verbo do corpus em ingls
12

Disponvel em: < http://www.srgoool.com.br/Noticia/Brasileirao-2013-teve-o-menor-numero-de-gols-e-apior-media-de-tentos-dos-pontos-corridos> Acesso: 16 jun 2014.


13
Disponvel em: <http://www.worldfootball.net/stats/eng-premier-league/1/ > Acesso: 16 jun 2014.

Sabrina Matuda, Stella Tagnin; p. 214-243.

229

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

e analisamos todas as ocorrncias procura de verbos que descrevessem um gol. A tabela 1


mostra o nmero de linhas de concordncia para cada etiqueta do corpus:
Tabela 1: Nmero de linhas de concordncia para cada etiqueta gramatical

etiqueta

nmero de ocorrncias

VB - Verb, base form

25.283

VBD - Verb, past tense

28.778

VBG - Verb, gerund or present participle

19.406

VBN verb, past particple

20.457

VBZ - Verb, 3rd person singular present

13.853

Aplicamos o dispositivo Re-sort, que permite ordenar as linhas de concordncia pelo


ndulo de busca, e ajustamos as configuraes para que as linhas fossem ordenadas pela
etiqueta gramatical e pela primeira palavra direita (forma cannica do verbo) e esquerda.
Observamos todas as linhas de concordncia e identificamos 43 verbos que poderiam
fazer parte de UFEs utilizadas para relatar um gol. Depois, geramos concordncias no corpus
sem etiquetas gramaticais para esses verbos a fim verificar como ocorrem nos textos, ou seja,
os padres em que ocorrem.
O passo seguinte foi validar essas unidades fraseolgicas por meio da anlise das
concordncias e do contexto expandido. Ainda no caso de fire, ampliamos os contextos das
linhas em que fire home era um possvel equivalente de fazer um gol. Observemos, por
exemplo, a ocorrncia nmero 153:

Figura 7: Parte do contexto expandido da linha de concordncia 153 de fire*

Aps a validao das unidades fraseolgicas, agrupamos as UFEs por categoria


semntica tendo como base o Roget`s International Thesaurus. Optamos por esse tipo de

Sabrina Matuda, Stella Tagnin; p. 214-243.

230

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

classificao porque, durante a anlise, notamos que o significado de algumas UFEs


bastante similar e que o sentido que carregam est relacionado ao sentido do verbo na
linguagem geral..
Apresentaremos, nos pargrafos que seguem, os equivalentes por categoria semntica.
Embora intercambiveis, todos apresentam caractersticas particulares que denotam categoria
semntica, prosdia semntica e lexical priming14 distintos, causando, dessa forma, reaes
diferentes no leitor.
9.1 Pontuao
As

unidades

fraseolgicas

SCORE

({a|the}

goal)

NOTCH

{his

ORDINAL|CARDINAL}(goal) compem a categoria semntica de pontuao. Ambas so


utilizadas para pontuar os gols e seus significados recaem sobre o ato de adicionar gols ao
placar de uma partida.
Os exemplos abaixo ilustram o uso de notch e score seguido do nmero de gols,
enfatizando a ideia de soma de pontos:
Rooney notched his fifth goal of the season and showed that United are serious
contenders to retain their Premier League crown despite the loss of Cristiano
Ronaldo during the summer.
But Eduardo still had time to score the sixth, netting from close in after Andrey
Arshavin's shot had come back off a post with two minutes to go.

9.2 Ao violenta
Durante o agrupamento semntico, identificamos 13 UFEs que transmitem a ideia de
uma ao violenta. So elas:
a) FIRE {home | in (a goal) | (the ball) past [goalkeeper]| into the net} 15
b) HAMMER {in | home}

14

Teoria lingustica desenvolvida por Michael Hoey (2005) que parte do princpio de que medida que temos
contato com uma nova unidade lexical, seja verbo, substantivo, adjetivo etc., essa nova unidade adquirida
juntamente com os contextos lingusticos, sociais, culturais em que frequentemente ocorre. Dessa forma, ao
reproduzir a unidade lexical tendemos a utiliz-la nos mesmos contextos em que a encontramos. Toda a
informao adquirida por meio da unidade lexical em questo considerada o lexical priming da palavra.
15
{} elenco de opes; | combinaes possveis; () uso opcional; [] hipernimo.

Sabrina Matuda, Stella Tagnin; p. 214-243.

231

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

c) SLAM {(the ball) past [goalkeeper] | in | into the roof of the net}
d) BLAST IN (a goal)
e) LASH home {(a goal) | into an empty net}
f) SMASH home
g) STAB the ball {home | past [goalkeeper]}
h) POKE{theballhome|homepast[goalkeeper]}
i) KNOCK {the ball {into the net | in | home}} / NUMBER goals
j) THUMP {home | past [goalkeeper]}
k) CLIP the ball into the net
l) SNATCH [a goal]
m) THUNDER a goal home
A alta ocorrncia de verbos que transmitem a ideia de ao violenta em ingls nos
levou seguinte pergunta: ser que o uso de verbos dessa categoria semntica tambm
comum em portugus?
Para responder a pergunta, geramos linhas de concordncia para a etiqueta gramatical
V16, que indica um verbo, no corpus de portugus e observamos as ocorrncias.
As concordncias nos mostram que em portugus no utilizamos verbos de ao
violenta com a mesma frequncia que em ingls. Encontramos 222 ocorrncias do verbo
empurrar, sendo 87 sinnimas de fazer um gol. No entanto, em grande parte das
ocorrncias, o verbo empurrar estava relacionado facilidade com que o gol foi feito, e no
intensidade do chute dado. Observemos o exemplo abaixo:
Em desvantagem o Corinthians tentou pressionar, enquanto o Santos tentava
concluir os bons contra-ataques que estava conseguindo. Mas aos 34 minutos Bill
aproveitou bola rebatida na trave e empurrou para o gol, empatando o jogo no
Pacaembu.
Tambm encontramos 6.000 ocorrncias do verbo bater, das quais apenas 28
utilizadas para descrever um gol. Ao analisar as linhas de concordncia, constatamos que das
28 UFEs com o verbo bater, somente 16 narram um gol feito. As outras representam
tentativas que no deram certo:
Jorge Wagner domina e bate para o gol. Mas a bola vai fraca e sem direo.
MUCHA SALVA!! Robben faz bela jogada pela esquerda e cruza rasteiro.
Mathijsen bate para o gol e bola explode no rosto de Mucha.

16

As etiquetas gramaticais em portugus no fazem distino entre os tempos verbais.

Sabrina Matuda, Stella Tagnin; p. 214-243.

232

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Aps analisar cuidadosamente as linhas de concordncia, expandindo o contexto e


visitando o texto integral, conclumos que a diferena na frequncia dos verbos de ao
violenta resultado da prpria forma de jogar futebol no Brasil e na Inglaterra. Em outras
palavras, se os corpora so realmente representativos, eles devem refletir, por meio do lxico,
a forma como o futebol jogado em diferentes culturas.
Se perguntarmos para qualquer pessoa que goste, acompanhe ou entenda, pelo menos
um pouco, de futebol, sobre as diferenas entre o futebol brasileiro e o futebol ingls, as
respostas sero muito parecidas: o futebol ingls mais rpido e mais pegado, mais forte.
Observemos o depoimentos de Ramirez, volante do Chelsea, em entrevista ao site da FIFA
em outubro de 2010 sobre o futebol ingls:
O futebol ingls muito fsico e rpido. Aqui voc no tem muito tempo para
ficar com a bola no p e tem que definir logo a jogada. Alm de procurar as
jogadas quando tenho a bola, eu sempre marquei forte. Por isso, no estou
encontrando muitas dificuldades. J estou me acostumando ao ritmo das partidas
aqui. 17
Se tomarmos o depoimento acima, podemos caracterizar o futebol ingls como um
futebol que tem a fora como um de seus elementos centrais. Por esse motivo, tratamos a
discrepncia da frequncia de verbos de ao violenta em ingls e portugus por meio do
conceito forma-representao de Toledo (2002).
Retomando Toledo (2002), o conjunto de regras no determina nem influncia as
maneiras de jogar. Na verdade, a interpretao e apropriao cultural que cada regio faz das
regras que revelam as formas de jogo. Justapostas, as regras e as formas de jogo do
origem s representaes, ou seja, o ajustamento da observao emprica das formas de
jogo em um plano simblico que, por sua vez, consolidam as escolas, jeitos ou estilos
prprios que se traduzem no cdigo lingustico.
Investigar a apropriao cultural das regras no Brasil e na Inglaterra foge ao escopo
deste artigo estudo. Contudo, reconhecer que essa interpretao influencia o estilo de jogo
e, por conseguinte, a terminologia utilizada nas duas culturas essencial para entendermos
algumas discrepncias lingusticas. Assim, o fato de o futebol ingls ser mais pegado
transparece na grande quantidade de verbos de ao violenta.
17

Disponvel em: <http://www.guiame.com.br/v4/70368-1663-Destaque-no-site-da-Fifa-Ramires-diz- estaradaptado-ao-futebol-ingl-s.html>. Acesso em: 12 abr. 2011.

Sabrina Matuda, Stella Tagnin; p. 214-243.

233

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Para comprovar nossa hiptese, compilamos um mini-corpus de, aproximadamente,


1000 palavras em cada lngua, composto por 15 textos sobre o estilo do futebol brasileiro e 15
textos sobre o estilo do futebol ingls. Utilizamos football, Brazil, style e school como
palavras de busca no Google para encontrar textos sobre o estilo do futebol brasileiro e
football, England, UK, school e style para encontrar textos sore o estilo do futebol ingls.
Esse mini-corpus monolngue, coletamos textos somente em ingls uma vez que o corpus
foi compilado para comprovar a hiptese que seria apresentada em um congresso na
Inglaterra.
A anlise foi feita de forma bastante simples. Primeiramente, geramos listas de
palavras dos mini-corpora. Em seguida, comparamos essas listas com listas de palavras de
corpora de referncia a fim de obter as palavras-chave. Como corpus de referncia,
utilizamos um corpus jornalstico, com aproximadamente de 100.000 palavras. Em seguida,
analisamos as palavras-chave e selecionamos aquelas utilizadas para descrever as
caractersticas dos dois futebis. O quadro 2 mostra as keywords associadas s duas escolas:

Quadro 2: palavras-chave associadas ao estilo brasileiro e ao estilo ingls

Palavras-chave associadas ao estilo


brasileiro
- [good] dribblers
- creative
- spontaneous
- improvisational
- free-flowing
- possession
- samba [beat]
- control [of the ball]
- [highly] skilled
- [flowing] passing [game]
- beautiful
- flair
- invention

Palavras-chave associadas ao estilo ingls


-

physical [prowess/strength]
fast
athleticism
rough
[long] shoots
quick
[direct] passes
[no] risk
courageous
hard
[break-neck] speed

Ao fim da anlise, nos questionamos se a frequncia de verbos que denotam ao


violenta tende a aumentar em portugus, uma vez que a prtica e o aprendizado do futebol
mudou bastante no Brasil. Antigamente as crianas jogavam futebol na rua, no ptio da escola
e em campinhos. Hoje em dia, as crianas frequentam, desde muito cedo, escolinhas de
futebol, ambientes em que meninos e meninas so treinados, por meio de acompanhamento

Sabrina Matuda, Stella Tagnin; p. 214-243.

234

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

ttico, prtica de jogadas e, muitas vezes, condicionamento fsico. comum ouvir de


comentaristas e jornalistas esportivos que o estilo do futebol brasileiro, sempre
caracterizado por jogadas de habilidade, est passando por um processo de transformao: a
troca do futebol arte pelo futebol fora ou, at mesmo, a juno desses dois futebis. De
qualquer forma, cremos que essas mudanas, futuramente, tero reflexo na constituio do
lxico do futebol em portugus, incorporando neologismos. No entanto, embora as mudanas
venham acontecendo h um tempo, seu reflexo no sistema lingustico, muito provavelmente,
ocorrer de forma mais lenta e, at o momento, o futebol fora no a forma de jogo que
temos em nosso plano simblico ao pensar no futebol brasileiro e, por esse motivo, no
traduzido em nosso cdigo lingustico.
9.3 Facilidade
Outro campo semntico bastante comum em ingls, e que no foi encontrado em
portugus, pelo menos no com frequncia significativa, o de facilidade. Observemos as
seguintes unidades fraseolgicas

a)
b)
c)
d)
e)

SLIDE {home his ORDINAL (goal) | the ball home};


SWEEP {home | the ball into the net};
DINK in [a goal];
TUCK home (a goal);
STROKE a shot past [goalkeeper].

Nelas, o sentido principal recai sobre a facilidade com que o gol foi feito. Na
realidade, a facilidade no caracteriza o gol, mas sim a trajetria da bola, a posio do jogador
ou o toque que o jogador d na bola.
9.4 Velocidade
As UFEs TAP {in|home} e FIZZ {the ball past goalkeeper|a sidefooter at goal}
compem a categoria semntica de velocidade. Ambas enfatizam a velocidade do gol, no
somente a velocidade com que o jogador recebe e chuta ao gol, mas tambm a rapidez dos
toques at o momento do gol:
Scott Carson, oh Scott Carson. Drogba lines up the shot, fizzes a sidefooter at

Sabrina Matuda, Stella Tagnin; p. 214-243.

235

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

goal, but it's straight at the keeper. Who proceeds to let the ball squirm from his
grasp, drop to Mikel who dinks it square for Malouda to tap in.
Novamente, se tomarmos os depoimentos dos jogadores, jornalistas e tcnicos sobre o
futebol ingls, veremos que a alta ocorrncia desses verbos de velocidade nos peridicos
ingleses reflete o estilo do futebol ingls. Retomemos o depoimento de Ramirez: O futebol
ingls muito fsico e rpido. Aqui voc no tem muito tempo para ficar com a bola no p e
tem que definir logo a jogada....
Sabemos que o portugus, assim como o ingls, utiliza palavras de outras categorias
gramaticais para indicar a rapidez e velocidade de uma jogada como, por exemplo, os termos
rpido e de primeira. No entanto, chamamos ateno para o fato de que, pelo menos em
nosso corpus, o jogo rpido se mostra to caracterstico no futebol ingls que existe uma
necessidade de express-lo por meio de verbos especficos.
Algumas UFEs, no descrevem nenhuma particularidade do estilo do futebol ingls,
mas refletem, de certa forma, uma caracterstica da cultura e, consequentemente, da lngua
inglesa: um alto grau de detalhamento nas informaes.
Para entender essa particularidade cultural, recorremos aos conceitos de high-context
culture e low-context culture do antroplogo Edward Hall (1976). A teoria de Hall parte do
pressuposto de que a quantidade de informao lingustica e contextual necessria para
transmitir o significado varia de acordo com a cultura e, para descrever as culturas, o autor
cria dois grupos: high-context culture, formado por pases como Brasil, Itlia, Grcia e pases
da frica, Asia e Amrica Latina; e low-context culture, formado por pases como Estados
Unidos, Alemanha, Sua e outros pases da Europa ocidental e do Reino Unido.
As culturas que pertencem ao primeiro grupo, as high-context cultures, so
caracterizadas por recorrerem a uma grande quantidade de elementos contextuais, os quais
auxiliam seus integrantes a entenderem as regras, ou seja, o modo como a cultura funciona.
Por esse motivo, parte da informao aparece de forma implcita, o dito pelo no dito,
informaes que esto subentendidas na fala ou, em nosso caso, em um texto, e podem
contribuir muito mais para a transmisso do significado do que aparentam. Essas culturas
possuem um forte senso de comunidade, fator que implica em diferentes estilos
comportamentais (MANCA, 2010, p. 373), que so dados como subentendidos e, raramente,
aparecem de forma explcita.
As culturas que se enquadram no segundo grupo, low-context, so caracterizadas por

Sabrina Matuda, Stella Tagnin; p. 214-243.

236

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

explicitar os elementos contextuais. Quase nada subentendido, os assuntos so debatidos


exaustivamente de modo que no restem dvidas ou margem para uma interpretao
equivocada. A comunicao feita da forma mais explcita possvel e realizada por meio da
transmisso de fatos, sem a expresso de sentimentos.
A teoria de Hall bastante complexa e detalhada. Contudo, pode ser utilizada para
entender o processo de produo de textos sobre futebol nas duas culturas.
9.5 Detalhamento
As UFEs que apresentaremos nos prximos pargrafos transmitem um detalhamento
que no encontramos nos verbos e UFEs utilizados para descrever um gol em portugus. As
UFEs do primeiro grupo expressam o movimento que a bola faz para dentro do gol:
a) SLOT {home([agoal)]|(theball)into{an|the}emptynet|past[goalkeeper]| in}
Robinho, who was the game's outstanding player, then provided one of the assists
of the championship so far as he threaded a delightful ball to Elano in the 72nd
minute before the midfielder slotted home a second.
b) DRILL home
The defender, 25 yesterday, settled a tight game and embarked on a celebration
that would have looked more at home on Strictly Come Dancing than Match of
the Day. He drilled home Swansea's 69th-minute winner after Leon Britton had
rattled the home side's bar with a stunning overhead kick.
c) BURY the ball past [goalkeeper]
For good measure, Fabregas popped in a peach for his second and Arsenal's fifth
as he ran up field, picked his spot and buried the ball past Howard.
No caso desses verbos, s entendemos o funcionamento das UFEs, que utilizam drill,
bury e slot de forma figurativa, pelos seus significados na lngua geral.
9.6 Realizao
As UFEs FINISH (off) e DELIVER a goal expressam o sentido de completar,
realizar uma tarefa, assim como o verbo finalizar em portugus:
a) And 43 minutes into his full debut, Stanislas finished off a great end-to-end
move by tapping in Luis Boa Mortes cross.

Sabrina Matuda, Stella Tagnin; p. 214-243.

237

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

b) It's been 25 years since a match between these two teams delivered a goal and
it doesn't look like we're going to get one tonight.
c) O goleiro Felipe nem se mexeu. Novamente impaciente com o atacante Souza,
a torcida do Corinthians passou a pedir a entrada de Dentinho. S parou quando
Elias, aos 42, finalizou de fora da rea no ngulo: 2 a 1.
9.7 Movimento da bola
Tambm detectamos a presena de duas UFEs que descrevem o movimento da bola ou
seu controle por um jogador:

a) HOOK in ([a goal])


When defender Marius Zaliukas hooked in the second shortly after the break,
belief they were capable of a sensational result coursed through the home ranks.
b) STEER the ball past [goalkeeper]
His pass picks out the run of Osman who steers the ball past Schwarzer.
Analisamos as ocorrncias de HOOK in ([a goal]) no corpus e chegamos a duas
possibilidades do uso. Primeiramente, pensamos que a UFE poderia descrever o tipo de
jogada realizada para fazer o gol, j que hook in descreve uma jogada feita com o p no ar, a
meia altura, conhecida como voleio em portugus, fato que foi confirmado aps a
observao de outras ocorrncias no Google.uk. Nossa segunda hiptese era que a UFE seria
utilizada como o termo hook de uso corrente no cricket e no golfe, cujo significado indica um
modo de bater na bola que faz com que ela desenhe uma curva em vez de ir reto. Confirmar
essa segunda hiptese foi um pouco mais complicado do que a primeira, pois se o verbo hook
designa, em seu significado, o movimento da bola, o texto, muito provavelmente, no usa
nenhum outro recurso lingustico que possamos analisar para validar nossa hiptese. O
detalhamento das notcias em ingls foi de grande valia para confirmar nossa ideia.
Acessamos o site Football.co.uk, do qual um dos textos que contm a UFE foi coletado,
vimos as fotos dos gols do jogo e clicamos em um link do YouTube que direcionava para um
vdeo que mostrava os gols da partida.
A ltima UFE, STEER the ball past [goalkeeper], no descreve o movimento da bola,
como a anterior. Seu significado recai sobre o controle da direo que a bola toma, como no
exemplo em que o jogador direciona a bola e chuta para o gol:

Sabrina Matuda, Stella Tagnin; p. 214-243.

238

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

His pass picks out the run of Osman who steers the ball past Schwarzer.
9.8 Gols de cabea
Identificamos trs UFEs utilizadas para narrar gols de cabea:
a) NOD {home (into an empty goal) | in | into the net};
b) HEAD (the ball) {home|past (goalkeeper)|into the (roof of the) net};
c) {HAMMER | POUND} a header into the net.
A alta frequncia dos verbos que narram gols de cabea em ingls nos chamou a
ateno quando comparada frequncia de cabecear, bater de cabea e tentar de
cabea, 1037 e 387 ocorrncias em cada lngua, respectivamente.
Recorremos novamente ao conceito forma-representao de Toledo para entender essa
discrepncia. Tomemos o depoimento de Robinho, em sua apresentao ao Milan, sobre o
futebol ingls:
No tive nenhum problema com o Roberto Mancini. O que acontece que o
futebol ingls no muito bom para jogador brasileiro, muita bola alta e a gente
gosta de jogar com ela no cho 18.
Jogadas areas, principalmente de bola na rea, definem um estilo bem ingls, uma
vez que exigem a fora, a impulso e a altura caractersticas dos jogadores ingleses. Desse
estilo, e tambm das condies climticas da Inglaterra -- devido chuva constante as equipes
eram foradas a mandar a bola para o alto, j que era quase impossvel faz-la correr na grama
encharcada -- surgiu a expresso chuveirinho, para designar a grande quantidade de jogadas
areas na rea, que caracterizou, por muitos anos, a escola inglesa.
O cabeceio, que definia o estilo ingls, era considerado como a melhor forma de
atacar e de concluir uma jogada, levando a seleo da Inglaterra conquista da Copa do
Mundo de 1966, mas perdendo sua fora nos anos seguintes.
No nos cabe, aqui, discutir a origem e a eficcia do estilo ingls, mas sim
reconhecer que o papel das jogadas areas no futebol ingls fundamental para entender a

18

Disponvel em: http://opiodopovo.wordpress.com.tab/chuveirinho/ Acesso em: 21 mai. 2011.

Sabrina Matuda, Stella Tagnin; p. 214-243.

239

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

divergncia entre a frequncia de UFEs que narram gols de cabea em ingls e em portugus.
9.9 Adio
A estrutura de ADD {a|the} ORDINAL (goal) pode ser enquadrada na categoria
semntica de adio, pois a referncia ao nmero do gol que foi marcado parte integrante da
UFE.
a) Rumblings of discontent were just beginning to emerge as Arsenal took the
lead through Abou Diaby in the 18th minute and the midfielder added a second
three minutes later, prompting Wenger to compare his midfielder with a Highbury
great.

9.10 Empate
Identificamos os verbos EQUALISE, DRAW e TIE como equivalentes de
EMPATAR. Entretanto, cada um apresenta suas particularidades. O verbo EQUALISE o
mais comum para narrar um gol de empate. Os trechos que seguem exemplificam seus
principais usos:
Martinez`s lads were 13 minutes from victory until Clint Dempsey equalised with
a diving header and Zamora had the last word with his bonce on 81 minutes in this
gripping fifth-round replay.
Os verbos TIE e DRAW, outros possveis equivalentes do verbo empatar em
portugus, tambm ocorrem no corpus. Entretanto, o primeiro ocorre majoritariamente em
jornais e revistas americanos e o segundo ocorre para narrar um jogo que empatou, e no um
gol de empate.
The Cottagers beat Arsenal 1-0 in August, drew 2-2 with Chelsea over Christmas
and stunned United 2-0 last month.
9.11 Posicionamento
A UFE NESTLE {in | into} the (back of the) net nos d a idia de acomodar a bola no
gol:

Sabrina Matuda, Stella Tagnin; p. 214-243.

240

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Not a brilliant penalty-struck low and only a few feet to the left of the centre of
the goal, but Julio Cesar went the other way and the ball nestled in the back of
the net.
Como podemos observar, o exemplo ilustra a posio da bola aps o gol.
9.12 Realizao
Identificamos trs UFEs que pertencem categoria de realizao, entendida aqui como
consecuo, ou seja, o ato de alcanar um objetivo. Observemos os exemplos:

a) NET [a goal]
Liverpool's season is firmly back on track after Yossi Benayoun netted a hat-trick
in Saturday's 4-0 Premier League home win over Burnley.Substitute Stefan
Maierhofer netted a late consolation for Wolves.
b) BAG [a goal]
Dave Kitson is finally beginning to find his feet at Stoke as he bagged the winner
in a 1-0 victory over Sunderland at the Britannia Stadium.Drogba was a real
menace throughout, heading just over from a Jose Bosingwa cross before bagging
the all-important goal.
c) NICK [a goal]
Birmingham City had the early Premier League leaders begging for the final
whistle before Aaron Lennon nicked a winner for Tottenham deep into stoppage
time.Lions fans were already leaving the Den when Paul Shaw nicked a
consolation goal on 79 minutes but the roar that went up when Tim Cahill (right)
made it 3-2 within seconds brought many back.
Independentemente do significado de seus verbos na linguagem geral, as trs UFEs
descrevem um ato de realizao. Quando utilizadas, enfatizam a conquista de um gol que
necessrio ou importante. Se tomarmos como exemplos os colocados da UFE nos exemplos
acima, hat-trick (trs gols marcados por um jogador na mesma partida), consolation (gol de
honra), the winner (gol da vitria) e the-all-important goal (gol importante, que pode ser
decisivo para a vitria ou para a permanncia de um time em um campeonato), veremos que
alm de descrever um gol feito, a UFE reala a importncia do gol, tanto pelos seus colocados
como pelo seu uso em detrimento de algum outro equivalente.

Sabrina Matuda, Stella Tagnin; p. 214-243.

241

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

10. Consideraes Finais


Ao final de nosso estudo de caso, verificamos que a LC fundamental para expandir o
escopo de pesquisas terminolgicas e contribui, de forma significativa, para a identificao de
aspectos culturais de uma rea de especialidade.
A existncia de UFEs que expressam o sentido de violncia, exploso, rapidez,
facilidade e gols de cabea em ingls e a ausncia do mesmo tipo de UFE em portugus pode
ser explicada pelo conceito forma-representao, do mesmo modo que a maior variao de
UFEs que descrevem a trajetria da bola, tanto em um gol quanto em uma tentativa, pode ser
explicada pelo conceito de high e low-context culture. O torcedor brasileiro (high-context)
espera um relato mais breve da partida e nfase no produto final, o gol. J o torcedor ingls
(low-context) espera que os lances sejam narrados de forma precisa, com nfase nos meios, ou
seja, nas jogadas, que levaram ao gol.
Dessa forma, acreditamos que a Terminologia no uma atividade prescritiva, na qual
os termos devem ser normatizados a fim de garantir a eficcia de uma comunicao
especializada. Ao contrrio, os fatores culturais, o contexto e a situao e a finalidade de uso
influenciam de forma direta o funcionamento das terminologias; por esse motivo, o fazer
terminolgico, principalmente o bilngue, deve considerar todos esses elementos na
compilao de obras terminogrficas.
Referncias bibliogrficas
AIJMER, K.; BENGT, A. English Corpus Linguistics. New York: Longman, 1991.
AZENHA JR., J. Traduo tcnica e condicionantes culturais: primeiros passos para um
estudo integrado. So Paulo: Humanitas/FFLCH-USP, 1999.
BERBER SARDINHA, A. Lingstica de Corpus: Histrico e problemtica. Revista
D.E.L.T.A., So Paulo, v. 16, n. 2, p. 323-367, 2000.
_____. Lingstica de Corpus. Barueri: Manole, 2004.
BOWKER, L.; PEARSON, J. Working with Specialized Language. A Practical Guide to
Using
Corpora.
London/New
York:
Routledge,
2002.
http://dx.doi.org/10.4324/9780203469255
CRUZ, A. H. O. A Nova Economia do Futebol: Uma anlise do processo de modernizao
de alguns estdios brasileiros. Dissertao (Mestrado em Antropologia Social) Universidade
Federal do Rio de Janeiro, Rio de Janeiro, 2005.

Sabrina Matuda, Stella Tagnin; p. 214-243.

242

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

DAMATTA, R. (Org.). Esporte na sociedade: Um ensaio sobre o futebol brasileiro. IN:


DAMATTA, R. Universo do Futebol. Rio de Janeiro: Pinakotheke, 1982.
GIGLIO, S. S.; SPAGGIARI, E. A produo das cincias humanas sobre futebol no Brasil:
um panorama (19980 2009). Revista de Histria (USP), v. 163, p. 293-350, 2010.
http://dx.doi.org/10.11606/issn.2316-9141.v0i163p293-350
GIL, G. A copa da cultura no futebol. Jornal O Globo, ed. 5 set. 2004.
<http://www.suapesquisa.com/futebol/> Acesso em 16 nov. 2008.
KRIEGER, M. da G.; FINATTO, M. J. B. Introduo Terminologia. Teoria & prtica.
So Paulo: Contexto, 2004.
LEONINCE, M. P. ; SILVA, M. T. Entendendo o futebol como negcio: um estudo
exploratrio. Gesto e Produo, v.12, n.1, p.11-23, jan./abr. 2005.
http://dx.doi.org/10.1590/S0104-530X2005000100003
MANCA, E. From phraseology to culture: Qualifying adjectives in the language of tourism.
In: RMER, U.; RAINER, S. Patterns, Meaningful Units and Specialized Discourses,
105122, 2010.
MCENERY, T and HARDIE, A. Corpus Linguistics: Method, Theory and Practice.
Cambridge: Cambridge University Press, 2012.
ROCHA, M. A. E. O uso de corpora computadorizados no ensino de lngua portuguesa:
metodologia e avaliao. In. GRIMM CABRAL, L. et all (orgs). Lingstica e ensino: novas
tecnologias, Blumenau: Nova Letra, p.137-55, 2001.
TAGNIN, S. E. O. A identificao de equivalentes tradutrios em corpora comparveis. In: I
Congresso Internacional da ABRAPUI, Minas Gerais, 2007.
TOGNINI-BONELLI, E. Corpus Linguistics at Work. Amsterdam/Philadelphia: John
Benjamins, 2001.
http://dx.doi.org/10.1075/scl.6
TOLEDO, L. H. de. Lgicas no Futebol. So Paulo: Hucitec/Fapesp, 2002.

Artigo recebido em: 15.10.2014


Artigo aprovado em: 30.11.2014

Sabrina Matuda, Stella Tagnin; p. 214-243.

243

A msica e os rudos na legendagem francesa para surdos e


ensurdecidos
Songs and noises in the French subtitling for the deaf and hard of hearing
Ana Katarinna Pessoa do Nascimento
Stella E. O. Tagnin
RESUMO: Alm das imagens, o udio
exerce um papel fundamental na criao do
significado do enredo de um filme. O
universo sonoro de um filme composto por
trs elementos bsicos: a fala, a msica e os
rudos. Sem o auxlio de legendas que
traduzam tambm os efeitos sonoros para
alm da fala, o espectador surdo ou
ensurdecido no tem acesso a esses aspectos
das produes audiovisuais. Por isso, a
legendagem para surdos e ensurdecidos
(LSE) precisa indicar o falante e os efeitos
sonoros. A acessibilidade audiovisual tem
sido discutida na Frana desde 1986 atravs
da lei sobre a liberdade de comunicao.
Tendo em vista a tradio francesa na LSE,
esta pesquisa buscou analisar a traduo dos
efeitos sonoros de trs filmes franceses
comercializados em DVD: Nos jours heureux
(2006), Les femmes du sixime tage (2010) e
Lcume des jours (2013). Para isso, as
msicas e rudos desses filmes foram
anotados com etiquetas discursivas nas
seguintes categorias: msica de fosso, msica
de tela, msica qualificada, msica no
qualificada, sons causados pelo homem, sons
causados por objetos, sons da natureza, sons
de animais, sons ficcionais e silncio. Os
arquivos anotados foram analisados pela
ferramenta Concord do WordSmith Tools 5.0.
Os dados revelaram que os efeitos sonoros na
LSE francesa nos filmes estudados foram
traduzidos levando em conta a funo de
cada som dentro do filme, o que produz uma
traduo de maior qualidade. A observao
dessas funes pode ajudar os legendistas
aprendizes na produo de legendas que
sejam de fcil compreenso pelo pblico

ABSTRACT: In addition to images, audio


plays a key role in creating meaning in a
movie plot. The sound universe of a movie
consists of three basic elements: speech,
music, and noise. Without the aid of subtitles
that also translate sound effects besides
speech, deaf or hard-of-hearing audiences do
not have access to those features on
audiovisual productions. Therefore, the
subtitling for the deaf and hard of hearing
(SDH) must inform the speaker and the
sound effects. Audiovisual accessibility has
been discussed in France since 1986 through
the Freedom of Communication Bill. Given
the French tradition in SDH, this study
sought to examine the translation of sound
effects in three French films on DVD: Nos
jours heureux (2006), Les femmes du sixime
tage (2010), and L'cume des jours (2013).
For the analysis, their sound effects were
annotated with discursive tags for the
following categories: gap music, screen
music, qualified music, non-qualified music,
sounds made by men, sounds made by
objects, nature sounds, sounds made by
animals, and fictional sounds and silence.
The annotated files were analyzed with the
Concord tool on WordSmith Tools 5.0. The
data revealed that the sound effects in the
French SDH on the studied films were
translated taking into account the function of
each sound within the movie, which means a
higher quality translation. Not leaving these
functions aside may help subtitles-in-training
to produce easily understandable subtitles for
the deaf and hard-of-hearing audience.

Doutoranda do Programa de Ps-Graduao em Estudos da Traduo da Universidade de So Paulo.


Professora Associada da Universidade de So Paulo.

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

surdo e ensurdecido.
PALAVRAS-CHAVE:
Traduo
Audiovisual. Legendagem para surdos e
ensurdecidos. Msica e rudos. Lingustica de
Corpus.

KEYWORDS: Audiovisual Translation.


Subtitling for the deaf and hard of hearing.
Songs and noises. Corpus Linguistics.

1. Introduo
As normas que tratam da acessibilidade audiovisual no Brasil ainda so muito
incipientes. Em 2006, o Ministrio das Comunicaes publicou a Portaria 310, que torna
oficial a Norma Complementar n 1/2006. Essa Norma regula a implantao da grade de TV
aberta para pessoas com surdos e ensurdecidos, tendo estabelecido os requisitos tcnicos para
torn-la acessvel a esse pblico atravs da chamada legendagem para surdos e ensurdecidos
ou LSE, que, nesta situao, sempre intralingustica. Em cumprimento Norma
Complementar, as emissoras de televiso utilizam, para a LSE, o sistema de legenda fechada
norte-americano, o closed caption, que acessado apenas por quem possui um televisor capaz
de acionar o sistema. Quanto ao cinema, os surdos e ensurdecidos brasileiros s podem
assistir s produes estrangeiras por meio de uma legendagem que no lhes a mais
adequada (a legendagem para ouvintes, que no possui identificador dos efeitos sonoros para
alm das falas; nesse caso, o que eles necessitam de uma LSE interlingustica). No tocante
s produes nacionais, essas lhes ficam quase sempre alheias, pela ausncia ainda muito
frequente de LSE intralingustica. A luta para mudar essa realidade bastante antiga, mas
apenas em 2012, a partir de uma ao civil pblica da Procuradoria da Repblica do Estado de
So Paulo, passou a haver obrigatoriedade do uso de legendas em lngua portuguesa nos
filmes brasileiros produzidos com recursos e financiamentos pblicos. No entanto, essas
regulamentaes tm em vista as legendas confeccionadas para televiso e cinema, ficando os
DVDs de filmes nacionais merc das produtoras e distribuidoras.
Na Frana, porm, a realidade diferente. J em 1986, a lei sobre a liberdade de
comunicao, previa a LSE na grade de programao das emissoras de TV como meio de
acessibilidade surdos e ensurdecidos. Posteriormente, em 2005, a lei pela igualdade de
direitos e oportunidades, participao e cidadania das pessoas com deficincia, previa a
ampliao de programas de televiso acessvel a pessoas surdas ou ensurdecidas, com exceo
de publicidade, trailers, vdeos sob demanda (VOD), entre outros. Com a lei de 2005, as
emissoras precisam apresentar uma poro considervel da programao de forma acessvel.

Ana Katarinna Pessoa do Nascimento, Stella Esther Ortweiler Tagnin; p. 244-260.

245

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Essa poro depende da audincia da emissora: quanto maior a audincia, maior o percentual
de programao legendada. Em relao aos DVDs, estima-se que, em 2007, 7% dos DVDs de
filmes franceses apresentavam LSE.
Tendo em vista a j longa preocupao francesa com a acessibilidade em narrativas
audiovisuais (programas televisivos e filmes), este trabalho tem como objetivo descrever a
traduo de msicas e rudos na LSE de filmes franceses em DVD (Nos jours heureux, 2006;
Les femmes du sixime tage, 2009; Lcume des jours, 2013) para examinar se leva em conta
a funo de cada som na trama flmica. Para atingir o objetivo, utilizou-se a metodologia
aplicada em Nascimento (2013). Nele, as msicas e os rudos dos filmes foram anotados com
etiquetas discursivas denotativas das seguintes categorias: msica de fosso, msica de tela,
msica qualificada, msica no qualificada, sons causados pelo homem, sons causados por
objetos, sons da natureza, sons de animais, sons ficcionais e silncio. Os arquivos de legendas
etiquetadas foram, em seguida, rodados no WordSmith Tools 5.0 e as legendas por ele
analisadas. Os resultados obtidos mostraram que a legendagem da trilha sonora somente pode
contribuir para a reconstruo do significado da trama dos filmes quando o legendista leva em
considerao a funo de cada som legendado (NASCIMENTO, 2013). A maioria das
msicas e dos rudos encontrados na LSE nos trs filmes brasileiros estudados (Irmos de
f, 2005; O Signo da Cidade, 2008; Nosso Lar, 2010) foram aparentemente traduzidos
sem preocupao de explicitar a relao entre o som e sua significao no enredo, pois a
traduo no foi feita levando em considerao o papel da msica e dos rudos em todo o
filme, mas apenas em cenas isoladas, o que pode ocasionar perda na compreenso da trama do
filme como um todo (NASCIMENTO, 2013).
Este artigo, para alm desta seo introdutria, tem ainda tantas outras sees. Na
Seo 2, so apresentadas as principais caractersticas da LSE e um breve apanhado sobre o
som no cinema. A seo 3, trata dos procedimentos metodolgicos para a realizao da
pesquisa, descrevendo o corpus e os procedimentos metodolgicos. A quarta seo dedicada
s anlises das tradues das msicas e rudos do corpus. Por fim, na quinta parte, so
apresentadas as consideraes finais com pontos conclusivos pertinentes ao tema da pesquisa
e consideraes acerca de futuras pesquisas.

Ana Katarinna Pessoa do Nascimento, Stella Esther Ortweiler Tagnin; p. 244-260.

246

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

2. Pressupostos tericos
2.1 Legendagem para surdos e ensurdecidos (LSE)
A partir do advento de falas no cinema, surgiu a necessidade de legendas para aqueles
que no ouvem, pois, at ento, com o cinema mudo, surdos, ensurdecidos e ouvintes tinham
o mesmo acesso s produes flmicas. Com a introduo da fala normalmente em forma de
dilogos e demais efeitos sonoros, o pblico surdo ficava impossibilitado de assistir a filmes
independentemente (DE LINDE; KAY, 1999). Alguns produtores buscaram inserir
interttulos1 durante toda a extenso do filme em busca de torn-los acessveis, mas o
procedimento, alm de prolongar os filmes, era bastante caro. Outro problema era a
dificuldade do pblico alvo em identificar o falante e em compreender os inputs do filme
proporcionados pelas msicas e rudos (CHAUME, 2004). Essa situao comeou a mudar
com o advento da televiso e da tcnica da legenda fechada (closed caption), que passou a
permitir o acesso LSE, atravs do controle remoto, por parte de quem dela necessitasse
(FRANCO; ARAJO, 2003).
Quanto forma de apario em tela, a legendagem pode ser de dois tipos: roll-up e
pop-on. Na legendagem roll-up, as palavras so digitadas da esquerda para a direita e
deslizam de baixo para cima na parte inferior da tela da televiso; na legendagem pop-on,
cada legenda aparece e desaparece da tela em sincronismo com fala e imagem. Enquanto nas
televises brasileiras as duas formas so utilizadas, sendo que a roll-up mais comum em
programas ao vivo e a pop-on normalmente utilizada em programas pr-gravados
(FRANCO; ARAJO, 2003), na Frana, utiliza-se predominantemente a pop-on, sendo a
roll-up mais popular em pases anglfonos e no Canad (DIU, 2009).
A condensao, a marcao e a segmentao so os principais fatores para uma
legendagem de qualidade (DAZ CINTAS; REMAEL, 2007). A condensao ocorre quando
preciso reduzir o texto oral, de partida, para que as legendas no fiquem rpidas demais,
impedindo o espectador de l-las confortavelmente, e nem sejam demasiadamente demoradas,
fazendo com que o espectador leia uma mesma legenda repetidamente (AUBERT; MARTI,
[s.d]). A marcao determina os tempos de entrada e sada da legenda na tela, e a
segmentao fragmenta o texto oral em duas ou mais legendas e/ou uma legenda em mais de
uma linha. Essa segmentao pode ser feita seguindo trs critrios: o visual, o retrico e o
1

Textos em cartazes utilizados nos filmes mudos para comentar a ao ou inserir dilogos. As imagens dos
cartazes intercalavam-se com as cenas do filme.

Ana Katarinna Pessoa do Nascimento, Stella Esther Ortweiler Tagnin; p. 244-260.

247

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

lingustico (REID, 1996). O visual diz respeito a mudanas de tomada no filme ou programa:
a cada nova cena, uma nova legenda dever ser inserida. O critrio retrico aquele pelo qual
o fluxo da fala deve ser seguido, ou seja, quando houver pausas no discurso, deve-se inserir
uma nova legenda. E por fim, o critrio lingustico aquele determinado pelas regras da
sintaxe para que seja facilitada a leitura da legenda por parte do espectador, devendo o
legendista evitar separar determinante e determinado, sujeito e predicado etc. bem como
quebrar sintagmas de qualquer tipo.
Os parmetros descritos acima so caractersticos de qualquer tipo de legendagem. A
LSE, no entanto, exige a presena de dois parmetros exclusivos: a identificao do falante e
os efeitos sonoros. A identificao dos falantes importante, pois muitas vezes os surdos no
conseguem inferir a troca de turno de fala somente pela imagem. Alm disso, a presena de
dois ou mais personagens ao mesmo tempo em cena pode dificultar a identificao de quem
est falando. Nesses casos, a compreenso da narrativa audiovisual pelos surdos e
ensurdecidos pode ficar comprometida (ARAJO, 2008; NASCIMENTO; ARAJO, 2011).
A identificao de falantes no Brasil e na Frana se d de maneiras diferentes.
Enquanto no Brasil o falante identificado atravs do nome do personagem entre colchetes,
na Frana, alm de a identificao ser posicionada sob o falante, a legenda muda de cor para
diferentes personagens e situaes.
A ateno traduo dos efeitos sonoros de uma narrativa audiovisual faz-se
necessria na medida em que os componentes acsticos no verbais colaboram para a
construo de sentido, pois, sem eles, a construo da narrativa audiovisual perde um dos seus
elementos significadores (NEVES, 2005). No h regras explcitas para esse tipo de traduo
em nenhum dos dois pases; na Frana, porm, segundo Diu (2009, p. 18), os tradutores
buscam a maior preciso ao traduzir rudos e msica, especialmente porque esses participam
de fato da trama. Contudo, a autora alerta, ainda, que a legendagem de msicas muitas vezes
se d atravs da indicao do estilo musical. No Brasil, segundo Nascimento (2013), no h
nenhuma conveno de como os efeitos sonoros devem ser legendados; e por isso, as
tradues so feitas sem preocupao com a trama, o que pode acarretar dificuldade de
compreenso por parte do espectador surdo e ensurdecido. Tambm no h consenso no
formato na apresentao das legendas de rudos e de msica, mas no Brasil a maioria delas
so postas entre colchetes, enquanto na Frana, no apresenta nenhuma caracterstica
especfica.

Ana Katarinna Pessoa do Nascimento, Stella Esther Ortweiler Tagnin; p. 244-260.

248

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

2.2 O som no cinema


O som no cinema causa efeitos que, muitas vezes, passam despercebidos. Mas ele o
responsvel por alterar e direcionar o modo de se receber as imagens (CHION, 2008). Som e
imagem devem interagir com o pblico, sem que esse possa diferenciar os dois elementos
(HUNTER, 2008). Para uma cena ser considerada verossmil, o espectador deve ouvir rudos
provenientes dos inmeros objetos percebidos dentro daquela cena (JULLIER, 2006), j que a
ausncia total de efeitos sonoros pode acarretar expectativa acerca do silncio, que deve
sempre ser significativo nas cenas em que ocorre (JULLIER, 2006).
Chion (2008) chama a ateno para o conceito de acusmtica, que definido como
[rudo] que ouvimos sem ver a causa. Segundo o autor, no decorrer de um filme, o [rudo]
pode aparecer de duas formas: 1) quando h a visualizao de um objeto e, s em seguida, seu
respectivo rudo ouvido; 2) quando o rudo produzido por dado objeto ouvido inicialmente
e ele apresentado posteriormente. Essa ltima forma muito utilizada em filmes de mistrio
para causar suspense sobre algum aspecto de determinado objeto/fenmeno/personagem,
criando uma expectativa em torno dele.
Outro conceito importante o de rudos de ambientao (JULLIER, 2006). Eles so
utilizados para tornar os ambientes mais reais, como j referido acima, mas podem, tambm,
informar aos espectadores onde exatamente determinada cena est se passando (HUNTER,
2008). Portanto, os rudos no cinema no passam despercebidos pelo espectador, pois
acrescentam informaes.
O termo trilha sonora representa todo o conjunto sonoro de um filme, ou seja, as
falas, geralmente em forma de dilogos, msicas e rudos (BERCHAMPS, 2006). Quando
uma composio criada para um filme, chamada de msica original do filme. A msica
original pode criar temas especficos e prprios personalidade dos personagens e
mensagem do filme, muitas vezes tornando-se algo to conhecido quanto o prprio enredo, e
caracterizando-o.
A msica de um filme pode ser dividida em duas categorias: msica de fosso e msica
de tela. A msica de fosso 2 afastada do local, do tempo e da ao em cena e apenas os
espectadores podem escut-la; j a msica de tela aquela que provm do local da ao, e
pode ser escutada tambm pelos personagens (CHION, 2008). Essa distino bastante
2

Msica de fosso um termo inspirado nas orquestras que ficavam localizadas em um fosso sob o palco nas
peras e cinemas antigos.

Ana Katarinna Pessoa do Nascimento, Stella Esther Ortweiler Tagnin; p. 244-260.

249

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

fluida, podendo a msica de fosso passar a ser de tela e vice-versa (CHION, 2008). Neste
trabalho, a msica foi classificada como qualificada quando apresentou adjetivos ou outros
elementos que indicassem sua funo na trama, como, por exemplo, Musique Flamenco, e
no qualificada quando no definiu sua funo dentro do enredo (Musique la radio).
As cues so inseres de msica no filme e so utilizadas para salientar passagens
importantes, interligar cenas, e rotular acontecimentos. Bordwell (2008) entende que a
escolha e a combinao dos sons podem criar padres dentro da obra flmica. O ritmo, a
melodia e harmonia das msicas afetam a reao emocional do espectador. Dessa forma, uma
melodia ou trecho de msica pode ser associado com determinado personagem, situao ou
ideia, criando motifs musicais. O uso da msica pode ajudar a montar uma histria cujo
enredo acompanhe inmeros personagens e localizaes, permitindo criar uma unidade para o
filme e garantir a fluidez da narrativa.
3. Metodologia
3.1 Corpus
O corpus utilizado no presente trabalho do tipo especializado, pois a legenda no
mbito da LSE de filmes em DVD o nico gnero textual que o compe. Alm disso, de
lngua nativa, com textos escritos em francs europeu. Em termos de extenso, composto
por tantas legendas que contm tantas palavras.
A escolha dos trs filmes franceses de onde a LSE foi extrada Nos jours heureux
(NJH) (NAKACHE, 2006), Les femmes du 6me tage (F6E) (LE GUAY, 2010) e Lcume
des jours (LDJ) (GONDRY, 2013), como j mencionados se deu por terem sido sucesso de
bilheteria na Frana (estando entre os filmes franceses mais assistidos dos ltimos 50 anos
segundo o site Linternaute3), e pertencerem a gneros similares. Alm disso, englobam uma
passagem de tempo abrangente, que poderia revelar modificaes temporais nas escolhas de
traduo. Os dois primeiros so classificados como comdia e o terceiro como comdia
dramtica pelo site IMDb4.

3
4

http://www.linternaute.com/cinema/business/films-francais-les-plus-vus-des-50-dernieres-annees/
http://www.imdb.com/

Ana Katarinna Pessoa do Nascimento, Stella Esther Ortweiler Tagnin; p. 244-260.

250

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

3.2 Procedimentos
O processo de anlise de tradues de efeitos sonoros em LSE por meio da Lingustica
de Corpus pressupe que os textos compilados estejam em formato eletrnico. As legendas
dos filmes a serem analisados foram retiradas dos seus respectivos DVDs atravs do software
SubRip 1.50. Este software reconhece apenas arquivos em extenso VOB, ou seja, no formato
de DVD. Aps escolhido o arquivo, o programa d incio extrao das legendas. Algumas
vezes alguns caracteres no so reconhecidos pelo programa e devem ser inseridos
manualmente pelo operador do software, da em diante o programa passa a sempre reconhecer
determinado caractere pelo que foi inserido manualmente. O processo todo de extrao de
legendas dura apenas alguns minutos.

Figura 1: Interface do extrator de legendas SubRip.


Fonte: as autoras.

Os arquivos de legenda extrados possuem extenso .srt; porm, o software WordSmith


Tools (WST) l apenas arquivos cuja extenso .txt. Para transform-los, bastou abrir os
arquivos e salv-los com a nova extenso no software Bloco de Notas. As legendas foram
salvas em trs arquivos diferentes: NJH, F6E e LDJ. Posteriormente a esse procedimento,
deu-se incio anotao do corpus, o que foi feito com as categorias propostas por
Nascimento (2013) e representadas pelas etiquetas tambm propostas pela mesma autora. As
categorias e respectivas etiquetas so apresentadas no Quadro 1.

Ana Katarinna Pessoa do Nascimento, Stella Esther Ortweiler Tagnin; p. 244-260.

251

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Quadro 1 Categorias e respectivas etiquetas.

Categoria
msica de fosso
msica de tela
msica qualificada
msica no qualificada
sons causados pelo homem
sons causados por objetos
sons da natureza
sons de animais
sons ficcionais
Silncio

Etiqueta
<mus_fosso>
<mus_tela>
<mus_qualif>
<mus_nqualif>
<som_hom>
<som_obj>
<som_nat>
<som_anim>
<som_ficc>
<sil>
Fonte: as autoras.

importante ressaltar algumas consideraes sobre as etiquetas: 1) as legendas


relativas s msicas recebiam dupla etiquetao: Fosso ou tela se combinava com qualificada
ou no qualificada. Por exemplo, a legenda Musique douce recebeu as etiquetas <mus_fosso>
e <mus_qualif>; 2) As etiquetas para som de animais e silncio, apesar de previstas, no
foram utilizadas, j que no houve legendas que correspondessem a elas no corpus de estudo;
3) As etiquetas para sons ficcionais so aplicadas aos sons que no poderiam ser produzidos
no mundo real. Os filmes foram assistidos em computador e, a cada legenda de msica ou
rudo, o filme era parado, a legenda era classificada segundo a categoria pertinente e era
inserida a respectiva etiqueta no arquivo .txt. Esse processo de anotao foi manual. Um
trecho do corpus etiquetado, pronto para anlise pelo WST, apresentado na Figura 2:

Figura 2 Trecho do corpus etiquetado.


Fonte: as autoras.

Ana Katarinna Pessoa do Nascimento, Stella Esther Ortweiler Tagnin; p. 244-260.

252

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Na Figura 2, h trs etiquetas de sons produzidos pelo homem <som_hom>, como o


prprio nome sugere, essa etiqueta utilizada quando o rudo produzido pelo homem no
verbal, ou no foi transcrito para a legenda. No exemplo acima, os personagens falam em
espanhol; isso foi indicado pela legenda, mas no transcrito. J as etiquetas msica de fosso
<mus_fosso> e msica qualificada <mus_qualif>, foram utilizadas na legenda Musique
Flamenco, pois msica de fosso, ou seja, que apenas os espectadores podem ouvir e foi
qualificada, uma vez que h o adjetivo Flamenco que a caracteriza na trama.
Para auxiliar a busca das etiquetas por arquivo/filme pela ferramenta Concord do
WST, as linhas de concordncia foram reorganizadas por ordem alfabtica da primeira palavra
direita das etiquetas, que o ndulo de busca (Figura 3). Dessa forma, as legendas iguais
apareceram em sequncia, tendo sido possvel, assim, analisar qualitativamente a maneira
pela qual os efeitos sonoros foram traduzidos na LSE dos filmes, se no considerando sua
funo nas tramas tal como foi feito na LSE dos filmes Irmos de f, O signo da cidade e
Nosso lar (NASCIMENTO, 2013).

Figura 3 Fragmento de tela de concordncia com ndulos em ordem alfabtica.


Fonte: as autoras.

Alm da anlise das linhas de concordncia produzidas pelo WST, recorreu-se ao filme
para comparar as legendas de efeitos sonoros com os sons do filme. Somando-se as noes

Ana Katarinna Pessoa do Nascimento, Stella Esther Ortweiler Tagnin; p. 244-260.

253

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

sobre o som no cinema revisadas na Subseo 2.2 a esses procedimentos analticos, foi
possvel atingir o objetivo do trabalho.
Com a ferramenta Concord, foi feita tambm uma anlise quantitativa, tendo-se
contabilizado as etiquetas em nmeros absolutos (o nmero de ocorrncias de dada etiqueta
mostrado no canto esquerdo inferior da tela, como pode ser visto na Figura 3). Os dados
quantitativos foram includos na discusso da anlise qualitativa, permitindo a tomada de
concluses e obteno dos resultados. Na seo a seguir, apresentamos os resultados da
anlise dos dados extrados do WordSmith Tools.
4. Resultados da anlise dos dados e discusso
Quanto anlise quantitativa geral, ela resultou nos seguintes dados: foram
encontradas 283 inseres de traduo de msica e rudos na LSE de NJH, F6E e LDJ, sendo
que dessas, 97 correspondem traduo de msica, 138 de sons causados pelo homem, 44 de
sons causados por objetos, 3 de sons ficcionais e apenas 1 de som da natureza. No foram
encontradas legendas com traduo de sons de animais ou silncio Estas etiquetas, apesar de
terem sido criada.
O filme com mais efeitos sonoros legendados LDJ, com um total de 126, seguido por
F6E com 95 e, por fim, NJH com apenas 62. A presena de um grande nmero de tradues
de efeitos sonoros em LDJ parece decorrer do fato de seu enredo dar bastante destaque sua
trilha sonora, repleta de msicas de artistas famosos, como Duke Ellington, e interpretadas
pelo baixo de Paul McCartney. O mesmo ocorre com F6E, que possui uma msica original
composta por Jorge Arriagada.
Em quase todas as inseres de traduo de msicas nos trs filmes, de um total de 97,
as msicas foram qualificadas nas legendas, o que pode ser explicado por uma possvel
inteno de permitir que o espectador surdo ou ensurdecido possa fazer inferncia acerca da
funo delas no enredo (Musique douce, Musique entranante). Apenas uma msica foi
traduzida sem qualificao em todo o corpus (Musique la radio) e, ainda assim, supriu a
necessidade em questo no enredo: fazer saber ao espectador que o rdio estava funcionando,
no importando o gnero musical.
Uma tendncia na legendagem francesa do efeito sonoro msica notada no corpus
a incluso do nome da msica, do cantor e/ou gnero musical ("Never even thought", slow par
Murray Head); isso pode favorecer, principalmente os ensurdecidos, que ficam capazes de

Ana Katarinna Pessoa do Nascimento, Stella Esther Ortweiler Tagnin; p. 244-260.

254

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

depreender mais facilmente qual teor a msica imprime cena. preciso salientar, porm,
que esse tipo de traduo no a preferida por surdos brasileiros. Isso acontece porque eles
no conseguem depreender a relao entre msica e filme a partir do cantor e/ou nome da
msica e/ou seu gnero, pois eles raramente sabem de quem se trata ou o que o gnero
significa (NASCIMENTO, ARAJO, 2011).
Outra questo acerca da traduo de msica encontrada no corpus foi a diferena do
emprego da palavra Musique e Chanson. Quando a msica foi traduzida como Chanson, ela
apresentava letra; porm, quando foi traduzida como Musique, tratava-se apenas de msica
instrumental.
Quanto aos rudos apenas de ambientao, ou seja, aqueles que apenas ajudam o
espectador a identificar o espao da ao (como o caso de sirenes em hospitais, ou rudos de
animais em fazendas), possvel afirmar que no foram traduzidos. Apesar de estarem
presentes nos filmes, a legenda no os contemplou.
Isso pode indicar uma preocupao maior na legendagem francesa em traduzir apenas
sons que participem ativamente na trama, ou seja, que causem reao nos personagens. O
excesso de traduo de rudos pode prejudicar a compreenso do espectador, criando
expectativas que no se concretizam no enredo. Alm disso, os dados do projeto MOLES 5
(NASCIMENTO; ARAJO, 2011) mostraram que o excesso de legendas entre colchetes
cansou o espectador, que passou a ignorar as informaes nelas contidas.
O rudo mais traduzido no corpus foi o som causado pelo homem (<som_hom>). Esse
tipo de som apareceu com frequncia na LSE dos trs filmes do corpus: 49 vezes em F6E e
em LDJ e 40 vezes em NJH. Os principais sons traduzidos nessa categoria foram risos (rires,
elle rit), gritos (cris, cris de protestation), alm de burburinho (brouhaha). Isso deve ter
ocorrido porque frequentemente esses sons expressam reaes emotivas dos personagens e, se
no fossem legendados, os surdos e ensurdecidos perderiam pelos menos parte da emoo da
cena. Uma ocorrncia frequente relativa aos sons causados pelo homem diz respeito a quando
os personagens falavam em lngua estrangeira. Esse ponto importante, j que nos filmes em
questo, nem mesmo o espectador ouvinte tem acesso traduo durante o filme; ento, os
legendistas apenas apontaram que os personagens falavam uma lngua estrangeira (Elle parle

O ttulo da pesquisa Traduo para surdos: em busca de um modelo de legendagem fechada para o Brasil
(NASCIMENTO; ARAJO, 2011)

Ana Katarinna Pessoa do Nascimento, Stella Esther Ortweiler Tagnin; p. 244-260.

255

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

en espagnol; Elle parle amricain), o que bastou para que os surdos e ensurdecidos
compreendessem a obra de acordo com a pretenso do diretor.
No tocante traduo dos rudos relativos aos sons causados por objetos (<som_obj>),
tem-se apenas 4 em NJH, 14 em F6E e 26 em LDJ. Os nmeros baixos podem demonstrar a
preocupao em legendar apenas os rudos que fazem parte efetiva do enredo flmico; logo os
sons que no contribuem para a significao flmica foram pouco ou no legendados. O som
mais traduzido na categoria foi campainha (sonnette, sonnerie), pois ele causa reao dos
personagens, que frequentemente viram-se em direo porta ou a abrem aps ouvir o rudo.
Sem a legenda o espectador surdo no saberia o porqu da reao dos personagens. Um outro
frequentemente legendado foi o rudo de quando algum bate em uma porta ou a abre (On
frappe, On tape la porte), pois tambm suscita resposta dos personagens.
A nica traduo de som da natureza no corpus (Coup de tonnerre) ocorre em LDJ,
em razo de um trovo que anuncia a chuva que ir ocasionar a doena da personagem
principal. Apesar de ser um rudo causado pela natureza, no se configura como um simples
som de ambientao, j que este serve apenas para tornar verossmil a cena (JULLIER, 2006),
mas configura um marco importante na histria do filme. A legenda, portanto, cumpre o papel
do som ao salientar, em conjunto com a imagem, o acontecimento relevante. Uma possvel
causa da reduzida quantidade de tradues nesta categoria a relevncia ao enredo. Como,
em todo o corpus, esse foi o nico rudo da natureza relevante para a trama, ele foi o nico
contemplado com a legenda.
H apenas trs ocorrncias de sons ficcionais legendados, todas no filme LDJ.
Grognements (Figura 4) ficcional nesse filme, pois se trata de um sapato soltando
grunhidos como de cachorro. A traduo se faz indispensvel, visto que, sem a legenda, o
espectador surdo-ensurdecido precisaria apoiar-se apenas na imagem para compreender que o
sapato se comporta como um cachorro. A baixa ocorrncia desse som j era esperada, pois os
filmes do corpus so do gnero comdia e/ou comdia dramtica, que no costumam
apresentar sons ficcionais. LDJ, porm, passa-se num universo absurdo, no qual possvel
passear de telefrico sem fios de sustentao, cultivar armas de fogo e sapatos com
comportamento canino. Mais uma vez, a baixa ocorrncia dessa etiqueta pode apontar para
uma legendagem mais voltada aos sons que efetivamente suscitam reaes dos personagens.

Ana Katarinna Pessoa do Nascimento, Stella Esther Ortweiler Tagnin; p. 244-260.

256

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Figura 4 Legenda de som ficcional


Fonte: as autoras.

Diferentemente do que ocorreu em Nascimento (2013), no qual as msicas e rudos


nos filmes brasileiros estudados no foram legendados levando em conta as suas funes na
trama, os dados obtidos no presente trabalho indicaram que a legendagem de msica e rudos
em NJH, F6E e LDJ procurou traduzir apenas aquilo que relevante ao enredo. Isso pde ser
percebido tanto pela quase totalidade de msicas qualificadas, quanto pelos baixa incidncia
de rudos traduzidos que no suscitavam reao dos personagens. Analisando o corpus,
especula-se a existncia de dois parmetros para a legenda de msicas e rudos: 1) a legenda
de msica deve apresentar uma qualificao que indique sua funo na trama, sempre que
essa funo for relevante; 2) deve-se buscar traduzir principalmente os rudos que participam
efetivamente da trama.
Nesta seo, foi observado como as diferentes categorias de efeitos sonoros foram
traduzidas nos trs filmes que compem o corpus da presente pesquisa. A seo seguinte
apresentar as consideraes finais.

5. Consideraes finais
Este trabalho se props a analisar a traduo de efeitos sonoros na LSE de trs filmes
franceses comercializados em DVD (Nos jours heureux, Les femmes du sixime tage,
Lcume des jours), para examinar se os efeitos sonoros so traduzidos levando-se em conta a
funo de cada som na trama flmica. Para responder essa questo, as legendas de efeitos
sonoros dos filmes que compem o corpus foram etiquetadas a partir de uma categorizao de
sons. Esse procedimento possibilitou a anlise eletrnica das legendas pelo software
WordSmith Tools com a ferramenta Concord. Aliados a essa metodologia, alm dos

Ana Katarinna Pessoa do Nascimento, Stella Esther Ortweiler Tagnin; p. 244-260.

257

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

conhecimentos sobre o som no cinema, sempre que necessrio se recorreu aos filmes (que so
os textos originais) para sanar eventuais dvidas acerca dos sons traduzidos.
A traduo de efeitos sonoros na LSE francesa, no mbito do corpus analisado no
estudo aqui relatado, procura incluir sons que suscitam reaes dos personagens em tela, ou
seja, que so relevantes para a compreenso da trama, sendo que no foram encontradas
legendas de rudos que servissem apenas para ambientar cenas no corpus de estudo. No que
concerne s msicas presentes nos filmes, a maioria delas foi traduzida apresentando um
elemento qualificador que ajuda o espectador a depreender sua funo no enredo. Isso
importante, j que, sem esse elemento qualificador, a informao seria irrelevante ao
espectador surdo-ensurdecido, podendo, inclusive, prejudicar sua compreenso da trama
(NASCIMENTO, 2013).
Levando em considerao os resultados obtidos, possvel afirmar que os efeitos
sonoros presentes no corpus de estudo foram traduzidos procurando respeitar suas funes
dentro da trama flmica. Dessa forma, conclui-se que a traduo de msica e rudos no corpus
estudado possui boa qualidade, e pode servir como base para o treinamento e
desenvolvimento de legendistas brasileiros iniciantes, alm de contribuir para o
aperfeioamento dos parmetros de LSE investigados pelo projeto CORSEL 6, da
Universidade Estadual do Cear.
A metodologia baseada em corpus usada a partir dos pressupostos da Lingustica de
Corpus foi bastante eficaz para este trabalho, pois viabilizou a consecuo do objetivo.
legtimo dizer isso porque houve a possibilidade de analisar cada categoria de som
separadamente, tornando-a mais dinmica e permitindo a observao de cada legenda em
contexto. No entanto, alm da observao do arquivo de texto da legenda, foi necessrio
sempre recorrer ao filme, por se tratar de um texto multimodal, e comparar cada som com sua
traduo, observando, assim, a sua relevncia na trama e como ocorreu a respectiva traduo.
Dessa forma, cada legenda foi comparada no s com as outras legendas da mesma categoria,
mas com seu respectivo som. Assim, foi possvel verificar se cada legenda traduzia ou no a
significao do filme.
No se pretende encerrar o assunto com este trabalho, mas, ao contrrio, incentivar
mais pesquisas na rea para aprimorar o conhecimento sobre a LSE e, assim, desenvolver uma
traduo de qualidade no Brasil que atenda satisfatoriamente o pblico alvo de surdos e
6

Corpus de segmentao em LSE

Ana Katarinna Pessoa do Nascimento, Stella Esther Ortweiler Tagnin; p. 244-260.

258

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

ensurdecidos, proporcionando-lhe acessibilidade cultural cada vez mais efetiva. Sugere-se,


portanto, uma pesquisa de recepo com espectadores surdos-ensurdecidos para testar os
resultados aqui encontrados.
preciso ressaltar que as questes tcnicas da LSE, tais como tempo de permanncia
em tela e quantidade de caracteres por minuto, no foram abordadas no presente trabalho por
questes de restrio de espao, mas podem ser contempladas em pesquisas futuras de carter
terico-descritivo, promovendo a interface com as questes de legendagem dos efeitos
sonoros via os pressupostos metodolgicos propiciados pela Lingustica de Corpus.

Referncias
ARAJO, V. L. S.; NASCIMENTO, A. K. P. Investigando parmetros de legendas para
surdos e Ensurdecidos no Brasil. In: FROTA, M. P.; MARTINS, M. A. P. (orgs.). Traduo
em Revista, v. 2, p. 1-18, 2011.
ARAJO, V. L. S. Por um modelo de legendagem para Surdos no Brasil. In VERAS, V.
(org.). Traduo e Comunicao, Revista Brasileira de Tradutores, So Paulo: UNBERO, n.
17, p. 5976, 2008.
AUBERT, J. P.; MARTI, M. Quelques conseils pour le sous-titrage. Disponvel em : <
http://lingalog.net/dokuwiki/_media/cours/sg/trad/methodest.pdf>. Acesso em: 14 de outubro
de 2013.
BERCHAMPS, T. A msica do filme: tudo o que voc gostaria de saber sobre a msica do
cinema. So Paulo: Escrituras Editora, 2006.
BORDWELL, D.; THOMPSON, K. Film art: an introduction. New York: McGraw Hills,
2008.
CHAUME, F. Cine y traduccin. Madri: Ctedra, 2004.
CHION, M. A audioviso: som e imagem no cinema. Lisboa: Edies texto & grafia, 2008.
De LINDE, Z.; KAY, N. The semiotics of subtitling. Manchester: St. Jerome Publishing,
1999.
DAZ CINTAS, J.; REMAEL, A. Audiovisual Translation: Subtitling. Manchester: St.
Jerome Publishing, 2007.

Ana Katarinna Pessoa do Nascimento, Stella Esther Ortweiler Tagnin; p. 244-260.

259

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

DIU, N. Un mtier dcouvir : adaptateur de programmes tlviss pour les sourds et


malentendants.
Disponvel
em :
<http://www.semainedusoustitrage.org/IMG/pdf/Un_metiers_a_decouvrir.pdf>.
Acessado
em: 14 de outubro de 2013.
FRANCO, E; ARAJO, V. L. S. Reading Television: Checking Deaf Peoples Reactions to
Closed Subtitling in Fortaleza, Brazil. In: GAMBIER, Y. (org.). The Translator, v. 09, n. 2,
pp. 249-267, 2003.
HUNTER, C. The use of sound effects and stylised ambiences in filmmaking, 2008.
Disponvel em <http://freedownload.is/pdf/cinema-sound-effects>. Acesso em: 15 de maro
de 2012.
IRMOS de f. Direo: Moacyr Ges. Brasil: Columbia, 2004. 1DVD (105 min), regio 4,
NTSC, color., legendas (para surdos em portugus), janela de LIBRAS, audiodescrio e
audionavegao.
JULLIER, L. Le son au cinma. Paris : Cahiers cinma, SCEREN (CNPD), 2006.
NASCIMENTO, A. K. P. Lingustica de corpus e legendagem para surdos e ensurdecidos
(LSE): uma anlise baseada em corpus da traduo de efeitos sonoros na legendagem de
filmes brasileiros em DVD. 2013. 109p. Dissertao (Mestrado em Lingustica Aplicada). Ps
Graduao em Lingustica Aplicada, Universidade Estadual do Cear, Fortaleza-CE. 2013.
NEVES, J. Audiovisual translation: subtitling for the deaf and hard of hearing. Tese
(Doutorado). Universidade de Surrey Roehampton, Inglaterra, 2005. Disponvel em: <http://
rrp.roehampton.ac.uk/artstheses/1>. Acesso em 15 de janeiro de 2012.
NOSSO Lar. Direo: Wagner de Assis. Brasil: Fox do Brasil, 2010. 1DVD (102 min), regio
4, color., legendas (para surdos em portugus) e audiodescrio.
O SIGNO da cidade. Direo: Carlos Alberto Riccelli. Europa Filmes, 2008. 1DVD (95 min),
regio 4, color., legendas (para surdos em portugus) e audiodescrio.
REID, H. Literature on the screen: subtitle translation for public broadcasting. In: BART, W.;
DHAEN, T. (Eds.). Something understood. Studies in Anglo-Dutch literary translation.
Amsterdam: Rodopi, p. 97-107, 1990.

Artigo recebido em: 15.10.2014


Artigo aprovado em: 11.12.2014

Ana Katarinna Pessoa do Nascimento, Stella Esther Ortweiler Tagnin; p. 244-260.

260

Contextos de ocorrncia das perfrases de gerndio e particpio no


portugus do Brasil e na variedade do espanhol do Mxico e sua
significao aspectual
Contexts of occurrence of the gerund and participle periphrases in Brazilian portuguese
and Mexican Spanish and its aspectual meaning
Anne Katheryne Estebe Maggessy*
Maria Mercedes Riveiro Quintans Sebold**
RESUMO: Neste artigo, centramos nossa
anlise na noo aspectual para contrastar
duas lnguas ricas morfologicamente.
Trataremos das perfrases de gerndio e
particpio e seus contextos de ocorrncia no
Portugus do Brasil (doravante PB) e na
variedade do espanhol do Mxico (doravante
EM) a partir da metodologia da Lingustica
de Corpus. Na primeira seo deste artigo,
trataremos da noo de aspecto. Na segunda
seo, trataremos da noo de perfrase e dos
traos que caracterizam as perfrases de
gerndio e de particpio. Na terceira seo,
trataremos dos contextos de ocorrncia das
perfrases de gerndio e particpio no PB e no
EM e, finalmente, na quarta seo,
trataremos das noes aspectuais veiculadas
por tais perfrases. Compartilhamos com
Wachowicz (2006) que nas perfrases pode
haver uma diferena de acordo com a forma
nominal que compe a mesma. Nessa
perspectiva, a terminao da forma nominal
ndo, do gerndio se combinaria com eventos
atlicos, ao passo que a terminao do, do
particpio, se combinaria com eventos tlicos.
E compartilhamos com Bertinetto (2001) que
as lnguas combinam diferentemente
telicidade/atelicidade
e
perfectividade/imperfectividade,
podendo
haver uma convergncia entre atelicidade e
imperfectivo e telicidade e perfectivo. O
objetivo verificar como essas relaes entre
formas nominais, telicidade e aspecto se do
nessas duas lnguas.

ABSTRACT: In this paper, we focus our


analysis on the aspectual notion to contrast
two morphologically rich languages. We will
tackle the periphrases of gerund and
participle, and their contexts of occurrence in
Brazilian Portuguese (PB) and variety of
Mexican
Spanish
(MS)
using
the
methodology of Corpus Linguistics. In the
first section of this paper will deal with the
notion of aspect. In the second section will
address the notion of periphrasis and the
traces that characterize the periphrases of
gerund and participle. The third section will
deal with the contexts of occurrence of the
gerund and participle periphrases in PB and
MS and finally, in the fourth section, we
discuss the aspectual notions conveyed by
such
circumlocutions.
Sharing
with
Wachowicz (2006) that the circumlocutions
can be a difference according to the nominal
form that composes it. In this perspective, the
termination of the nominal form -ndo, the
gerund would combine with atelic events,
while -do termination of the participle, would
combine with telic events. And we share with
Bertinetto (2001) that the languages combine
differently
telicity/atelicity
and
perfective/imperfective, and there may be a
convergence
between
atelicity
and
imperfective and telicity and perfective. The
goal is to see how these relationships
between nominal forms, telicity and
appearance are given in both languages.

PALAVRAS-CHAVE: Aspecto. Perfrase.


Formas nominais. Lingustica de Corpus.

KEYWORDS: Aspect. Periphrase. Nominal


forms. Corpus Linguistics.

Mestre em Lngua Espanhola pela UFRJ.


Professora Doutora do Departamento de Letras Neolatinas e do Programa de Ps Graduao em Letras
Neolatinas da Faculdade de Letras da UFRJ.
**

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

1. Introduo
Estudos sobre lnguas tipologicamente prximas como o Portugus do Brasil
(doravante PB) e o espanhol tm mostrado um maior ou menor distanciamento com relao a
determinados fenmenos.
O objetivo deste artigo o de contrastar duas lnguas tipologicamente prximas a
partir da informao aspectual. Trataremos das perfrases de gerndio e particpio e sua
produtividade no Portugus do Brasil (doravante PB) e na variedade do espanhol do Mxico
(doravante EM). Na primeira seo, trataremos da noo de aspecto. Na segunda seo,
trataremos da noo de perfrase e dos traos que caracterizam as perfrases de gerndio e de
particpio. Na terceira seo, trataremos dos contextos referentes ao tipo de verbo e ao tipo de
evento em que se encontram essas perfrases e finalmente da sua leitura aspectual veiculada
composicionalmente.
Nossa motivao para tal estudo tem origem em Wachowicz (2006) que prope que a
forma nominal impe restries aos demais elementos da sentena. Nessa perspectiva, a
terminao da forma nominal ndo, do gerndio se combinaria com eventos atlicos, ao passo
que a terminao do, do particpio, se combinaria com eventos tlicos.
Central a essa ideia a noo de telicidade. A origem do termo telicidade est na
palavra grega telos, entendida como fim. Sendo assim, um evento tlico aquele que tem
um fim ou uma meta previsvel a ser atingida e que, portanto, pode ser considerado terminado
quando este fim ou meta alcanado, como no exemplo correr uma maratona. Um evento
atlico no ter um fim ou meta previsvel e, por isso, pode continuar indefinidamente, como
no exemplo correr maratonas, no qual no possvel visualizar o fim do evento..
Neste artigo, vamos trabalhar com a noo de telicidade relacionada tambm aos tipos
de verbo a partir da classificao proposta por Vendler (1957) estado, atividade,
accomplishments (processo culminado) e achievements (culminao); e da diviso em traos
aspectuais proposta por Smith (1991): estado (atlicos, durativos e pontual), atividades
(atlicos, durativos e no-pontual), processo culminado (tlicos, durativos e no-pontual) e
culminao (tlicos, no-durativos e no-pontual).
Com relao s categorias de telicidade/atelicidade e perfectividade/imperfectividade,
Bertinetto (2001) afirma que no co-variam, mas se comportam geralmente de forma
independente, justamente por pertencerem a noes diferentes, sendo a primeira relativa

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

262

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Acionalidade (Aktionsart ou aspecto lexical) e a segunda relativa ao aspecto (ou aspecto


gramatical).
2. Sobre o aspecto lexical e o aspecto gramatical
Comrie (1976) define tempo como uma categoria ditica, isto , que faz referncia a
outro tempo, o momento da enunciao. Em contrapartida, o aspecto definido por este
mesmo autor como uma categoria no ditica porque se refere situao em si.
O termo aspecto pode se referir a traos de naturezas bastante diversas. As
propriedades inerentes s razes verbais bem como a outros itens lexicais dizem respeito ao
aspecto lexical. O aspecto lexical tambm est relacionado s classes aspectuais, ou seja, os
verbos podem sugerir uma forma particular de conceber a noo de tempo (time). Seguimos a
diviso proposta por Vendler (1957) acrescida dos traos aspectuais propostos por Smith
(1991). Tal classificao est centrada em uma diviso em quatro classes: estados - saber,
atividades - correr, processo culminado - comeu dois doces e culminaes - perdeu o livro.
A proposta de Smith (1991) se centra em dois eixos. No primeiro eixo, o foco est no ponto
final natural do evento (ponto tlico). O segundo eixo mostra se o evento dinmico ou se
apresenta em estgios.
Nessa perspectiva, eventos com verbos do tipo estado, como, por exemplo, ver, ou
atividade, como, por exemplo, correr so [- tlicos] (menos tlicos) ou atlicos. Por outro
lado, os verbos do tipo processo culminado, como, por exemplo, construir, e culminao,
como, por exemplo, cair, tm um ponto final natural e, por isso, so considerados [+ tlicos]
(mais tlicos) ou tlicos.
No que diz respeito ao aspecto gramatical, as marcaes so feitas na morfologia (seja
por auxiliares e/ou morfemas flexionais e derivacionais), como, por exemplo, estou
comendo indicando um evento contnuo e comi, indicando um evento fechado.
Em seu estudo sobre o aspecto, Comrie (1976) prope que as lnguas humanas
apresentam diferentes tipos de oposies aspectuais e busca comprovar sua hiptese atravs
da anlise dos tempos verbais de passado em lnguas como ingls e portugus, por exemplo.
Sua categorizao postula a existncia de dois aspectos bsicos: o perfectivo e o imperfectivo.
O autor, entretanto, prope um diagrama em que somente o aspecto imperfectivo se
subdividiria em diferentes categorias, tais como: habitual e contnuo (progressivo e no
progressivo).

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

263

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Entendemos que a bipartio proposta por Comrie (1976) est pensada para o aspecto
gramatical e diz respeito a uma viso global do evento centrada na pontualidade ou no do
evento.
Na sentena vista sob uma perspectiva composicional, temos, portanto, informao
antes da flexo, no domnio lexical, sobre a pontualidade ou no pontualidade do evento,
como, por exemplo, morrer [+ pontual] e morar [- pontual]. E na flexo, no domnio
gramatical, temos a informao sobre a completude ou no completude do evento, como, por
exemplo, morou [+ completude] e morava [- completude].
Lnguas de morfologia flexional mais rica como o PB e o espanhol dispem para
expresso da imperfectividade da terminao ia/-va; a/aba e da terminao ndo / iendo de
gerndio.
Para a expresso da perfectividade, o PB dispe do tempo pretrito perfeito simples
cujas desinncias do ao evento uma leitura tlica, e a morfologia de particpio ado/-ido. O
espanhol tambm dispe do pretrito perfecto simple ou pretrito indefinido e tambm do
particpio ado/-ido.
Uma lngua menos rica morfologicamente como o ingls, por exemplo, no distingue
morfologicamente o perfectivo e o imperfectivo e isso somente pode ser feito com o
acrscimo de termos adjacentes na estrutura.
Bertinetto (2011) ao explorar a relao entre o lxico e a flexo ou entre as leituras
[tlico] e [perfectivo] prope uma provvel convergncia em muitas lnguas naturais entre
atelicidade e imperfectivo e telicidade e perfectivo. Entretanto, o autor prope que as lnguas
combinam diferentemente telicidade/atelicidade e perfectividade/imperfectividade e esse pode
ser um elemento que as aproxima ou as distancia.
interessante notar, que para Bertinetto (idem), a imperfectividade, em contextos
progressivos, com a perfrase estar + gerndio, suspende o valor tlico do verbo como os do
tipo processo culminado e culminao. O que no significa dizer, segundo o autor, que a
imperfectividade e a atelicidade necessariamente convirjam. Quando essas duas categorias
interagem, o produto dessa interao passvel de um conjunto bastante restrito de
possibilidades. Com relao telicidade e imperfectividade, o autor aponta para a
manuteno do carter tlico do evento em sentenas que expressam o imperfectivo habitual.
Alm disso, Bertinetto (idem), tambm acha necessrio diferenciar perfectividade de
telicidade, por serem categorias comumente confundidas devido ao fato de ambas indicarem o

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

264

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

ponto final do evento. Com isso, o autor relaciona o aspecto terminatividade e a telicidade
fronteira ou ao limite (boundness).
O autor prope que a telicidade implica em perfectividade, mas perfectividade no
implica em telicidade. Ou seja, todo evento tlico seria perfectivo, mas nem toda a
perfectividade seria expressa por eventos tlicos. Reproduzimos a seguir a representao
proposta por Bertinetto (idem):
Quadro 1. Perfectividade e Telicidade.

+ perfectivo

- perfectivo

+ tlico

[a] SIM

[b] (NO)

- tlico

[c] SIM

[d] SIM

Essa relao bastante compreensvel, segundo o autor, pois se a imperfectividade


vista como envolvendo intervalos abertos, esperado que essa propriedade entre em
contradio com a definio do trao de telicidade, que justamente envolve um evento
fechado. Como a noo de habitualidade oposta noo de progressividade dentro do
aspecto imperfectivo, a telicidade pode estar presente na expresso da habitualidade.
3. Sobre a perfrase
Embora essa definio no seja consensual, Ilari (1997) e Castilho (2002) so autores
que defendem que nas perfrases verbais h um todo indivisvel, com papis bem definidos,
tanto para o verbo auxiliar quanto para verbo principal. O verbo auxiliar marca o tempo e os
traos de flexo, como pessoa e nmero e o segundo verbo particulariza o evento ou a ao
expressa.
Longo e Campos (2002) tambm definem as perfrases como um complexo unitrio
que rene um verbo e uma forma de infinitivo, gerndio ou particpio numa s predicao
(LONGO E CAMPOS, 2002, p. 447). As autoras definem os seguintes critrios para
classificar um verbo como auxiliar:
1. no possibilidade de desdobramento da orao intimamente relacionada existncia de um
sujeito nico.

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

265

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

2. perda sofrida pelo auxiliar de atribuir papis temticos aos elementos nominais com os
quais se combinam.
Neste artigo, tambm partimos da ideia de que a perfrase verbal a combinao de
dois elementos verbais: um verbo auxiliar flexionado e uma forma no flexionada (particpio
e gerndio). So perfrases aqueles complexos que funcionam como uma nica unidade
verbal.
Considerando-se que numa forma verbal simples como canto podemos encontrar
informaes sobre tempo e aspecto, o que podemos dizer de uma perfrase verbal? Essas
informaes de tempo e aspecto esto separadas no auxiliar e na forma no flexionada?
Seguindo uma determinada linha de pensamento, na sentena Alice est telefonando
para seu chefe., o tempo estaria concentrado na forma em presente do auxiliar est e a
noo aspectual de durao estaria concentrada na forma no flexionada de gerndio
telefonando.
Longo & Campos (2002) dividem as perfrases em aquelas que s indicariam o tempo
em que o evento ocorre em relao ao momento de fala, chamadas de temporais: ex.:
havamos programado; e aquelas que indicariam alm do tempo, o aspecto, ou seja, como o
evento se desenrola no tempo, chamadas aspectuais: ex.: esto entendendo. Para as autoras,
na perfrase temporal o verbo auxiliar tem localizao temporal separada do verbo principal
marca somente o tempo do evento.
Entretanto, neste artigo, atribumos as diferenas temporais e aspectuais a fatores, tais
como: o tempo verbal do auxiliar e a forma nominal que compem a perfrase (se se trata de
particpio ou se se trata de gerndio).
Defendemos, portanto, a possibilidade de que haja oscilaes entre as leituras
aspectual e temporal nas diferentes perfrases, bem como, a possibilidade de sobreposio de
diferentes leituras.
Compartilhamos com Wachowicz (2006) que nas perfrases pode haver uma diferena
de acordo com a forma nominal que compe a mesma. Nessa perspectiva, a terminao da
forma nominal ndo, do gerndio, favorece a leitura de eventos iniciados mas que no tm
necessariamente um fim e, portanto, seriam atlicos, ao passo que a terminao do, do
particpio, favorece a leitura de eventos que parecem ter um fim determinado e, portanto, esta
terminao geraria eventos tlicos.

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

266

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Com relao perfrase estar + particpio, que analisaremos neste artigo, Castilho
(1968) afirma que esta a principal forma de expresso do aspecto perfectivo resultativo, pois
representa um completamento total da ao que implica em um resultado que decorre desse
completamento. (CASTILHO, 1968, p. 78) J Travaglia (2006) afirma que essa perfrase
poder expressar tanto o aspecto perfectivo quanto o aspecto imperfectivo como em O
assaltante est preso. (TRAVAGLIA, 2006, p. 175)
Para o espanhol, o Diccionario de perfrasis verbales de 2006 afirma que as
perfrases de particpio esto estreitamente relacionadas com a voz passiva, pois ou so
passivas ou foram na sua origem. Alm disso, o autor Gmez Torrego (1988) afirma que o
particpio far sempre referncia a um fato anterior ao tempo designado pela frase verbal
principal. Para ele, isso se deve ao fato de que existem nas perfrases de particpio valores
aspectuais que remetem sempre ideia de perfectividade (ao acabada) do verbo. No
entanto, o autor chama a ateno para a perfrase estar + particpio que pode adquirir um
aspecto durativo de valor estativo, que o aproxima significao do gerndio. Como no
exemplo dado pelo prprio autor La casa de gobierno est vigilada por la polica (= la
polica la est vigilando). (GMEZ TORREGO, 1988, p. 195)
J no caso das perfrases com gerndio, tanto no portugus quanto no espanhol,
unnime a ideia de que estas s denotam imperfectividade.
4. Metodologia e Corpus
Neste artigo, utilizamos a Lingustica de Corpus porque acreditamos que a utilizao
de uma grande quantidade de dados relativos ao efetivo uso da linguagem e a ajuda de
programas de computador nos oferecer subsdios para o estudo da gramtica particular dos
indivduos. Utilizamos na nossa investigao do fenmeno lingustico proposto corpora orais
de fala espontnea compilados nos ltimos anos da dcada de 90. Analisamos trs entrevistas
sociolingusticas das amostras do espanhol falado na Cidade do Mxico do Projeto PRESEEA
Mxico, e, para anlise da variedade carioca do portugus do Brasil (doravante PB),
utilizamos oito entrevistas sociolingusticas do Projeto NURC-RJ.1 Os informantes, cujas
falas sero analisadas, possuem nvel de escolaridade superior e compreendem a faixa etria

Os temas das entrevistas selecionadas do espanhol so amigos, trabalho, estudos, situao familiar, filhos,
casamento, vida acadmica, histria, costumes e problemas do bairro Tepito, E os temas das entrevistas do
portugus so instituies, ensino, Igreja, cidade, comrcio, vida social, diverses, famlia, ciclo de vida e sade.

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

267

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

jovem (20 a 35 anos). O nmero desproporcional de entrevistas justificado pela grande


diferena de nmeros de palavras em cada entrevista. Nas trs entrevistas referentes
variedade da Cidade do Mxico, encontramos 34.648 palavras e nas oito entrevistas da
variedade carioca encontramos 32.801 palavras.
Com relao anlise dos dados, realizamos um levantamento quantitativo das
ocorrncias de sentenas com estar + gerndio e estar + particpio tendo o auxiliar no
presente do indicativo e verbos transitivos nas perfrases de particpio, tanto no PB quanto no
espanhol do Mxico (doravante EM), e de alguns fatores sintticos que circundam cada
sentena. Em seguida, realizamos uma anlise qualitativa dos contextos identificados para
chegar a um resultado que, de certa forma, mostre os fatores lingusticos que influenciam na
interpretao aspectual perfectiva e imperfectiva dessas perfrases.
Para tal anlise, o programa de computador utilizado foi o WordSmith Tools (verso
5). A ferramenta computacional WordSmith Tools (verso 5.0), desenvolvida por Mike Scott e
Oxford University Press, consiste em uma metodologia atual, organizada e totalmente
confivel que facilita a anlise quantitativa, pois nos mostra todas as ocorrncias existentes do
que estamos pesquisando. Dentre as ferramentas disponibilizadas pelo software, WordList,
Keywords e Concord entre outros utilitrios, a ferramenta Concord foi a de maior relevncia
para a anlise realizada na pesquisa, pois busca as palavras selecionadas dentro do seu
contexto.
5. Anlise dos dados
Inicialmente optamos por fazer uma anlise quantitativa dessas perfrases na variedade
carioca do portugus do Brasil (doravante PB) e na variedade do espanhol da Cidade do
Mxico (doravante EM). Embora no tenhamos conseguido o tempo de interao de cada
entrevista, resolvemos equilibrar a anlise a partir do nmero de palavras transcritas em cada
uma, o que nos proporcionou analisar trs entrevistas da variedade da Cidade do Mxico com
um total de 34.648 palavras e oito entrevistas da variedade carioca com um total de 32.801
palavras.

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

268

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Tabela 1. Anlise Quantitativa.

ANLISE QUANTITATIVA
PB (32.801 palavras)

EM (34.648 palavras)

Estar + particpio

11 perfrases

10 perfrases

Estar + gerndio

62 perfrases

50 perfrases

Com isso, encontramos no PB 11 sentenas com a perfrase estar + particpio e 62


sentenas com estar + gerndio. E no EM encontramos 10 sentenas com estar + particpio e
50 sentenas com estar + gerndio. O que nos leva a considerar a partir dos dados levantados
a possibilidade de uma maior seleo da perfrase de gerndio em ambas as lnguas
analisadas, sendo que no PB parece haver ainda uma maior ocorrncia, j que em uma
contagem menor de palavras apresentou mais sentenas com essa perfrase.
Considerando a proposta de Wachowicz (2006) segundo a qual a forma ndo marca a
atelicidade e mais acentuadamente a habitualidade, essa seleo da forma nominal de
gerndio nas duas lnguas pode ter repercusso na seleo dos demais elementos da sentena.
Dessas 62 perfrases de gerndio do PB, desconsideramos da anlise 11 sentenas, e das 50
perfrases de gerndio do EM, desconsideramos 8 sentenas. Isso porque as consideramos
como expresses lexicalizadas que poderiam comprometer a qualidade da anlise, como por
exemplo est dando aula, est fugindo do assunto, est sendo beneficiada no PB e
est pasando en la tele, estoy yendo bien a la chava, lo estoy echando como una carga
no EM.
Tabela 1. Sentenas analisadas.

Estar + particpio
Estar + gerndio

SENTENAS ANALISADAS
Portugus do Brasil
11
51

Espanhol do Mxico
10
42

Para a anlise qualitativa das sentenas com as perfrases de particpio e gerndio,


consideramos como variveis dependentes os aspectos perfectivo e imperfectivo e
observamos a composicionalidade aspectual a partir das seguintes variveis independentes
lingusticas: transitividade verbal, o tipo de verbo segundo as categorias de Vendler (1957) e a
telicidade do evento - se era tlico como em t vendo exatamente o dia-dia, atlico como
em a gente t vendo coisas ou sem telicidade delimitada como em agora no t estudando,

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

269

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

no sei o que, que uma sentena sem um complemento determinado prximo do verbo ou
de fcil recuperao.
Tabela 2. Estar + particpio, portugus do Brasil.

Portugus do Brasil
Estar + particpio
T Estado
R Atividade
A Proc. Culminado
N Culminao
Estado
I
N Atividade
T Proc. Culminado
R Culminao

[+T]
------3
---------

PERFECTIVO
[-T]
-----------------

X
----2
--1
1
--3

IMPERFECTIVO
[+T]
[-T]
x
-----------------------1
-------------------------

Das 11 sentenas encontradas com a perfrase estar + particpio no PB, 10 sentenas


apresentaram o aspecto perfectivo, por representarem um evento j acabado, sendo 3 com
verbos transitivos do tipo culminao com evento tlico, 3 verbos intransitivos do tipo
culminao e sem telicidade determinada, 2 sentenas com verbos transitivos do tipo processo
culminado e sem telicidade determinada, 1 verbo intransitivo do tipo estado sem telicidade
determinada e 1 verbo intransitivo do tipo atividade e tambm sem telicidade determinada.
Exemplos:
(1) Voc j t garantido no profissional (perfectivo, culminao, transitivo e
tlico)
(2) Ele t casado h dois anos (perfectivo, culminao, intransitivo e sem
telicidade determinada)
(3) Aqui no Rio, no t acostumado, n? (perfectivo, processo culminado,
transitivo, sem telicidade determinada)
(4) e voc no tiver um, ou uma famlia rica ou um convnio, t morto!
(perfectivo, estado, intransitivo e sem telicidade determinada)
(5) Agora a gente t brigado (perfectivo, atividade, intransitivo e sem
telicidade determinada)
Embora tenhamos obtido 2 sentenas com verbos do tipo [- tlico], ainda assim os
dados parecem sugerir uma relao entre telicidade e perfectivo, assim como entre telicidade
e particpio como afirmado por Bertinetto e Wachowicz, respectivamente.

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

270

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

J com o aspecto imperfectivo, obtivemos apenas 1 sentena que d a ideia de evento no


acabado com repetio devido expresso adverbial o tempo todo, apresentando verbo
transitivo e sem evento determinado. Exemplo:
(6) ... telefone t ocupado o tempo todo... (Culminao, transitivo, sem
telicidade determinada e imperfectivo/iterativo)
Essa ocorrncia nos leva a supor o importante papel da expresso adverbial na
composicionalidade aspectual de uma sentena.
Tabela 3. Estar + particpio, espanhol do Mxico.

Espanhol do Mxico
Estar + particpio
T Estado
R Atividade
A Proc. Culminado
N Culminao
Estado
I
N Atividade
T Proc. Culminado
R Culminao

[+T]
----4
3
---------

PERFECTIVO
[-T]
-----------------

X
------2
------1

IMPERFECTIVO
[+T]
[-T]
x
--------------------------------------------------

Diferentemente do PB, absolutamente todas as sentenas do EM apresentaram uma


significao perfectiva, por representarem um evento j acabado. Com relao ao tipo de
verbo, 6 eram do tipo culminao e 4 do tipo processo culminado, todos do tipo [+ tlico].
Das sentenas com verbos do tipo culminao, 3 sentenas eram com verbo transitivo e
evento tlico, 2 eram com verbo transitivo e no apresentaram telicidade determinada e 1 era
com verbo intransitivo e tambm sem telicidade determinada. Enquanto que das sentenas
com verbos do tipo processo culminado, todas eram com verbo transitivo e com eventos
tlicos. Exemplos:
(7) porque todo est modificado (perfectivo, culminao, transitivo, tlico)
(8) siento que si se puede porque est comprobado (perfectivo, culminao,
transitivo e sem telicidade determinada)
(9) Ya acuando llegas ya estoy dormido (perfectivo, culminao, intransitivo e
sem telicidade determinada)
(10) y ahorita pues est planeado construir todo um cuarto arriba (perfectivo,
processo culminado, transitivo e tlico)

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

271

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

A partir desses dados pudemos verificar uma semelhana entre as duas lnguas na
expresso do aspecto perfectivo em sentenas com perfrases de particpio. Ambas
apresentaram sentenas em sua maioria com eventos tlicos bem marcados, tanto no tipo de
verbo quanto no tipo de evento. Assim a relao da perfectividade com a telicidade e de
particpio com telicidade tambm pde ser verificada no espanhol.
Para a anlise das sentenas com a perfrase estar + gerndio, tambm consideramos
os aspectos perfectivo e imperfectivo, e tambm observamos a composicionalidade aspectual
a partir do tipo de verbo segundo as categorias de Vendler (1957) e os traos de Smith (1991),
a telicidade do evento e a transitividade do verbo.
Com relao ao aspecto, diferentemente das perfrases de particpio que alternaram, de
alguma forma, entre os aspectos considerados, as perfrases de gerndio apresentaram apenas
o aspecto imperfectivo, tanto no PB quanto no EM. Pois, a perfrase estar + gerndio parece
realmente suscitar, exclusivamente, uma leitura de eventos iniciados, mas que no tm
necessariamente um fim.
Analisando o tipo de verbo nas sentenas do PB, observamos 3 sentenas com o verbo
do tipo estado, 21 com o verbo do tipo atividade, 23 com o do tipo processo culminado e 4
com o do tipo culminao.
Tabela 4. Estar + gerndio. Portugus do Brasil.

Portugus do Brasil
Estar + gerndio
T Estado
R Atividade
A Proc. Culminado
N Culminao
Estado
I
N Atividade
T Proc. Culminado
R Culminao

[+T]
-----------------

PERFECTIVO
[-T]
-----------------

x
-----------------

IMPERFECTIVO
[+T]
[-T]
x
--2
1
---14
3
11
--6
----2
--------3
--6
----1
1
1

Das 3 sentenas com o verbo do tipo estado, todos so verbos transitivos, sendo 2
sentenas com eventos atlicos e 1 sentena sem telicidade determinada. Exemplos:
(11) uma pessoa que t querendo fazer Eletrnica (imperfectivo, estado,
transitivo e atlico)
(12) se voc t sendo seguido por algum carro (imperfectivo, estado, transitivo
e sem telicidade determinada)

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

272

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Das 20 sentenas com o verbo do tipo atividade, 17 apresentaram verbos transitivos,


sendo 14 com eventos atlicos e 3 sem telicidade determinada, e 3 com verbos intransitivos,
todas com eventos atlicos. Exemplos:
(13) isso nunca aconteceu no Brasil, no t entendendo isso (imperfectivo,
atividade, transitivo e atlico)
(14) essa loja t vendendo mais do que a gente (imperfectivo, atividade,
transitivo e sem telicidade determinada)
(15) porque eu t namorando h quatro anos e meio (imperfectivo, atividade,
intransitivo e atlico)
Das 23 sentenas com o verbo do tipo processo culminado, 17 apresentaram verbos
transitivos, sendo 11 com eventos tlicos e 6 sem telicidade determinada. As outras 6
sentenas, do total de 23 sentenas, apresentaram verbos intransitivos, sendo todos eventos
tlicos. Exemplos:
(16) quando eu estou em casa eu estou fazendo alguma coisa (imperfectivo,
processo culminado, transitivo e tlico)
(17) ele t tentando n, ele um cara corajoso (imperfectivo, processo
culminado, transitivo e sem telicidade determinada)
(18) tem que tomar muito cuidado, ele t crescendo bairro da Barra
(imperfectivo, processo culminado, intransitivo e tlico)
Das 5 sentenas com verbos do tipo culminao, 2 so verbos transitivos com
eventos sem telicidade determinada e os outros 3 so verbos intransitivos, sendo 1
com evento tlico, outro com evento atlico e outro sem telicidade determinada.
Exemplos:
(19) e t morando em Bonsucesso (imperfectivo, culminao, transitivo e sem
telicidade determinada)
(20) ah, t mudando um pouco (imperfectivo, culminao, intransitivo e tlico)
(21) no t nem a, mas t mudando (imperfectivo, culminao, intransitivo e
sem telicidade determinada)
Considerando os dados analisados, pudemos verificar que diferentemente do
perfectivo com sentenas tlicas ou sem telicidade delimitada, o imperfectivo apresentou
sentenas atlicas como o esperado, mas tambm sentenas tlicas, tanto no tipo de verbo
quanto no tipo de evento, assim como sentenas sem o complemento expresso. O que nos leva
a supor que a relao entre imperfectivo e atelicidade no to estreita quanto a relao entre
perfectivo e telicidade no PB.

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

273

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Analisando o tipo de verbo das sentenas com a perfrase estar + gerndio no EM,
observamos que das 42 sentenas, 3 so do tipo estado, 17 so do tipo atividade, 21 so do
tipo processo culminado e 1 do tipo culminao.
Tabela 5. Estar + gerndio, espanhol do Mxico.

Espanhol do Mxico
Estar + gerndio
T Estado
R Atividade
A Proc. Culminado
N Culminao
Estado
I
N Atividade
T Proc. Culminado
R Culminao

[+T]
-----------------

PERFECTIVO
[-T]
-----------------

x
-----------------

IMPERFECTIVO
[+T]
[-T]
x
--1
1
---8
6
19
----1
--------1
----3
2
-----------

Das 3 sentenas do tipo estado, 2 so com verbos transitivos sendo 1 com evento
atlico e outra sem telicidade determinada, e 1 sentena com verbo intransitivo com evento
sem telicidade determinada. Exemplos:
(18) es algo que se est viendo ultimamente (imperfectivo, estado, transitivo e
atlico)
(19) aparte me est gustando (imperfectivo, estado, transitivo e sem telicidade
de terminada)
(20) donde estoy vivendo ahorita (imperfectivo, estado, intransitivo e sem
telicidade determinada)
Das 17 sentenas do tipo atividade, 14 so com verbos transitivos, sendo 8 com
eventos atlicos e 6 com eventos sem telicidade determinada. As outras 3 sentenas restantes
contm verbos intransitivos com eventos sem telicidade determinada. Exemplos:
(21) se est metiendo lo que es este artculos de computacin (imperfectivo,
atividade, transitivo e atlico)
(22) ahorita se est usando as (imperfectivo, atividade, transitivo e sem
telicidade determinada)
(23) estoy radicando ... en el Pueblo de San Mateo (imperfectivo, atividade,
intransitivo e sem telicidade determinada)

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

274

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Das 21 sentenas com verbos do tipo processo culminado, 19 contm verbos


transitivos com eventos tlicos e 2 so verbos intransitivos tambm com eventos tlicos.
Exemplos:
(24) estoy haciendo mis trmites (imperfectivo, processo culminado, transitivo
e tlico)
(25) lo que estoy vivendo y experimentando (imperfectivo, processo
culminado, intransitivo e tlico)
E a nica sentena com verbo do tipo culminao, tem o verbo transitivo e o evento
tlico:
(26) lo que hace sentir bien/ es que cosas malas/ a lo mejor no les estoy
dejando.
De igual modo, no EM, a expresso do imperfectivo em sentenas com as perfrases
estar + gerndio tambm no apresenta uma relao to estreita entre o imperfectivo e a
atelicidade. Nos dados analisados do EM, tambm encontramos sentenas expressando o
imperfectivo com a telicidade marcada no tipo de verbo e no tipo de evento, assim como
sentenas sem a telicidade delimitada no complemento.
Tais resultados nos levam a supor um comportamento semelhante entre essas duas
lnguas na expresso do aspecto perfectivo em sentenas com perfrases de particpio e do
aspecto imperfectivo em sentenas com perfrases de gerndio.
6. Consideraes finais
Os dados levantados mostraram-se relevantes posto que por se tratar de lnguas de
morfologia rica espervamos a confirmao das tendncias descritas pelos estudos de aspecto
apresentados aqui. Ou seja, espervamos que todas as sentenas com perfrases de particpio
apresentassem o trao [+tlico] e que todas as sentenas com gerndio apresentassem o trao
[- tlico] conforme afirmado por Wachowicz (2006), o que no aconteceu.
Inicialmente, observamos uma maior ocorrncia da perfrase estar + gerndio em
ambas as lnguas analisadas, sendo que no PB parece haver ainda uma maior seleo dessa
perfrase, j que em uma contagem menor de palavras observamos um maior nmero de
sentenas com estar + gerndio.

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

275

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

No EM, todas as perfrases de estar + particpio expressaram o aspecto perfectivo. No


PB, apenas uma expressou o aspecto imperfectivo. No caso dessa sentena, a leitura de
imperfectividade vem dada por um marcador de duratividade.
Nos dados analisados no encontramos nenhuma sentena no EM com o aspecto
imperfectivo, embora Gmez Torrego (1988) afirme que a perfrase estar + particpio pode
adquirir um aspecto durativo de valor estativo.
Sobre a relao da perfectividade com a telicidade, no PB no encontramos nenhum
evento notadamente atlico com verbos transitivos, pois ou os eventos eram tlicos ou no
possuam telicidade determinada, ou apresentavam verbos do tipo [+ tlico]. No entanto, com
verbos intransitivos encontramos duas sentenas com verbos do tipo [- tlico] expressando a
perfectividade.
Ainda assim, os dados sugerem que h uma relao entre telicidade e perfectividade,
corroborando a proposta de Bertinetto (2001), assim como uma relao entre o particpio e a
telicidade, corroborando tambm a proposta de Wachowicz (2006). A ocorrncia de um nico
evento tlico com leitura imperfectiva e de duas sentenas com verbos intransitivos do tipo [tlico] com leitura perfectiva, mostrou a necessidade de investigar com maior detalhe essas
possibilidades nas duas lnguas.
Sobre as perfrases de gerndio, confirmamos realmente a sua leitura imperfectiva
favorecida pela terminao ndo do gerndio que nos oferece um evento aberto, sem um fim
determinado. No entanto, no podemos afirmar que a leitura imperfectiva do progressivo
modifica a telicidade do evento, como afirmado por Bertinetto (2001), justamente por termos
encontrado sentenas em imperfectivo com um complemento tlico que marcava o fim
inerente do evento, como em estoy escribiendo la tesis. Alm disso, tanto no PB quanto no
EM encontramos mais verbos do tipo [+ tlico] como processo culminado e culminao em
sentenas imperfectivas com a perfrase de gerndio, do que verbos do tipo [- tlico] como os
verbos do tipo estado e atividade. O que nos leva a considerar que a relao entre perfectivo e
tlico parece ser um pouco mais estreita que a relao entre imperfectivo e atlico.
Ao relacionarmos os aspectos lexical e gramatical, observamos tanto no PB quanto no
EM uma semelhana na composicionalidade das sentenas com estar + gerndio na expresso
do aspecto imperfectivo e das sentenas com estar + particpio na expresso do aspecto
perfectivo. Embora tenhamos encontrado uma sentena com estar + particpio no PB

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

276

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

expressando o aspecto imperfectivo, em ambas as lnguas os eventos e tipos de verbo eram


majoritariamente [+ tlico].
As sentenas analisadas com estar + gerndio, tanto no PB quanto no EM,
expressaram exclusivamente o aspecto imperfectivo e no confirmaram a relao entre
atelicidade e imperfectivo, pois a maioria dos verbos eram do tipo [+ tlicos] e a maioria dos
eventos tambm eram [+ tlicos].
Com relao transitividade verbal, pudemos verificar atravs dos dados a
necessidade de um estudo mais aprofundado quanto sua relevncia tanto na formao de
perfrases de particpio quanto nas de gerndio. Visto que em ambas as lnguas houve uma
ocorrncia bastante inferior de sentenas com verbos intransitivos.
Dessa forma, a partir dos dados levantados, neste estudo, podemos propor que o
falante de PB e EM leva mais em conta a forma nominal selecionada para a expresso do
aspecto, dando preferncia para o gerndio em uma leitura imperfectiva e para o particpio em
uma leitura perfectiva. O reduzido nmero de eventos com telicidade determinada com
particpio e gerndio parece sugerir que essa marcao pode no ser to relevante para o
falante dessas duas lnguas quando o seu interesse marcar um evento mais aberto ou mais
fechado.
Os resultados deste estudo so parciais e sugerem a necessidade de verificar tais
tendncias em corpus de registro escrito, tendo em vista a menor necessidade de recuperao
do referente e, consequentemente, favorecendo uma telicidade indeterminada.
Finalmente, no que diz respeito proposta de Bertinetto (2001) segundo a qual as
lnguas combinam diferentemente telicidade/atelicidade e perfectividade/imperfectividade e
esse pode ser um elemento que as aproxima ou as distancia, no caso do PB e da variedade do
espanhol analisada, as duas lnguas demonstraram um comportamento semelhante na
combinao de tais fatores sem distanciamentos significativos.
Referncias bibliogrficas
BERTINETTO, P. M. On a frequent misunderstanding in the temporal-aspectual domain: the
perfective-telic confusion. In: CECHETTO, C. et alii. Semantic Interfaces: reference,
anaphora and aspect. Stanford: CSLI Publications, 2001.
CASTILHO, A. T. de. Introduo ao estudo do aspecto verbal na lngua portugusa.
Marlia: FFCL, coleo teses, 1968.

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

277

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

COMRIE, B. Aspect: An Introduction to the Study of Verbal Aspect and Related Problems.
Cambridge: Cambridge:Cambridge University Press, 1976.
GARCA FERNNDEZ, L. (dir.), ngeles Carrasco Gutirrez, Bruno Camus Bergareche,
Mara Martnez- Atienza & Mara ngeles Garca Garca-Serrano: Diccionario de perifrasis
verbales. Madrid: Gredos, 2006.
GMEZ TORREGO, L. Perifrasis verbales. Sintaxis, se- mantica y estilistica.
Arco/Libros, Madrid, 1988.
ILARI, R. A expresso do tempo em portugus. So Paulo: Contexto,1997.
LONGO, B. de O.; CAMPOS, O. de S. A auxiliaridade: perfrases de tempo e aspecto no
portugus falado. In: Gramtica do portugus falado: Volume VIII - Novos estudos
descritivos. Campinas/ SP: Ed da Unicamp, 2002.
SCOTT, M. Wordsmith Tools. V 3.0. Oxford University Press, 1999.
SMITH, C. S. The Parameter of Aspect. Dordrecht, Kluwer Academic Press, 1991.
http://dx.doi.org/10.1007/978-94-015-7911-7
TRAVAGLIA, L. C. O aspecto verbal no portugus: a categoria e sua expresso. 4.ed.
Uberlndia: EDUFU, 2006.
VENDLER, Z. Linguistics in philosophy. Ithaca: Cornell University Press, 1957.

Bibliografia
BASSO, Renato Miguel. Telicidade e Detelicizao.In: Revista Letras, Curitiba, n.72, p.215232, MAIO/AGO. 2007.
CASTILHO, A. Introduo ao estudo do aspecto verbal na lngua portuguesa. Marlia:
Alfa, Faculdade de Filosofia, Cincias e Letras de Marlia, ed. 12, 2002.
CASTILHO, A. T. de; MORAES de CASTILHO, C. M. O aspecto verbal no portugus
falado. In: VIII Seminrio do Projeto de Gramtica do Portugus Falado. Campos do
Jordo. 1994. (Mimeo)
CAVALLI, S. Perfrases verbais (vir+gerndio e ter+particpio) e iteratividade. Comunicao
apresentada em VI FORUM DE LETRAS da PUCPR, 2005 Curitiba. (CD-ROM).
CAVALLI, S. & WACHOWICZ, T.C. Verbos auxiliares vs aspectualizadores. Simpsio
apresentado em 54. seminrio do GEL UNESP- Araraquara-SP, 2006. (HANDOUT)
CEGALLA, D. P. Novssima Gramtica da Lngua Portuguesa. So Paulo: Companhia
Editora Nacional, 46. ed., 2005.

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

278

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

CHIERCHIA, G. Semntica. Campinas: Editora da Unicamp; Londrina: Eduel, 2003.


COSTA, S. B. B. O aspecto em portugus. 3. ed. So Paulo: Contexto, 2002.
GILI GAYA, S. Curso superior de sintaxis espaola. 1948. Barcelona: VOX. 15 edio.
Reimpresso: outubro de 2000.
ILARI, R. Notas para uma semntica do passado composto em portugus. In: 4 CELSUL.
Curitiba/UFPR, 2000. (mimeo)
________ et al. Consideraes sobre a posio dos advrbios. In CASTILHO, A . T. de
(Org.). Gramtica do portugus falado: a ordem. Campinas: Ed. da Unicamp, v. 1, p. 63141, 1990.
_________ ; MANTOANELLI, I. As formas progressivas do portugus. In: Caderno de
Estudos Lingsticos. Campinas: IEL, Unicamp, n. 5, p. 27-60, 1983.
LENCI, A. & BERTINETTO, P. M. Aspect, adverbs and events habituality vs. Perfectivity.
In: HIGGINBOTHAM, J.; PIANESI, F.; VARZI, A. (eds.). Speaking of events. New York,
Oxford: Oxford University Press, p.245-287, 2000.
MAGGESSY, A. K. E. A significao aspectual iterativa da perifrase estar + gerndio
no portugus do Brasil e no espanhol do Mxico. Dissertao de mestrado. Rio de Janeiro,
UFRJ, 2013.
MASACHS, L. G. La adquisicin del tempo verbal en el aprendizaje del espanhol como
lengua extranjera. Tese de doutorado. Departamento de Filologia Espanhola. Universidade
Autnoma de Barcelona. 1998.
MENDES, R. B. Ter + particpio ou estar + gerndio? Aspecto verbal e variao em PB. In:
Estudos Lingusticos XXXIII, p. 1280-1285, 2004.
SANTOS, S. do R. C. dos. Perfrases Durativas do Portugus Brasileiro. Dissertao
apresentada ao Curso de Ps-Graduao em Letras, rea de Concentrao em Estudos
Lingusticos, Setor de Cincias Humanas, Letras e Artes da Universidade Federal do Paran.
Curitiba, 2008.
TREVIO, E. La iteracin de eventos. Acta Potica, 25-2. 145-183, 2004.
VARGAS, X. G. Las perfrasis verbales resultativas en espaol de Chile. Formas
compuestas y perfrasis verbales en el espaol de Chile. Exploraciones sobre el desarrollo y el
uso del aspecto perfecto. Tesis para optar al grado de licenciado o licenciada en Lengua y
Literatura Hispnica con mencin en Lingstica. Universidad de Chile. Facultad de Filosofa
y Humanidades. Departamento de Lingstica. Santiago, Chile, 2009.
WACHOWICZ, T. C. As leituras aspectuais da forma de progressivo do PB. In: Revista
Letras, Curitiba, n. 58, p. 397-406, jul./dez. 2002.

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

279

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

______. Marcas lingusticas de iteratividade em PB. In: Anais do 6 Encontro CelsulCrculo de Estudos Lingusticos do Sul, 2006.
______ ; FOLTRAN, M. J. Sobre a noo de aspecto. In: Cad. Est. Ling., Campinas, 48
(2):211-232, 2006.
YLLERA, A. Las perfrasis verbales de gerundio y participio. Gramtica descriptiva de la
lengua espaola. Ignacio Bosque y Violeta Demonte, eds. Vol. 2. p. 3391-3441. Madrid:
Espasa, 1999.
Anexos

ESTAR + PARTICPIO / PRESEEA-MXICO / 3 ENTREVISTAS


PRESENTE: 10
(E9) mejor en todos los aspectos/ ya sea como familia/ estando Culminao
como pareja/ o independientemente// pero siento eso/ siento que s --se puede/ porque a-/ est [comprobado] 39 E: [mh] 40 I: no?/ Transitivo
est comprobado// pero / no s como que todo eso ya lo tengo PERFECTIVO
as/// visualizado y pensado// digo si desafort
(E9) como familia/ estando como pareja/ o independientemente// Culminao
pero siento eso/ siento que s se puede/ porque a-/ est --[comprobado] 39 E: [mh] 40 I: no?/ est comprobado// pero / no Transitivo
s como que todo eso ya lo tengo as/// visualizado y pensado// PERFECTIVO
digo si desafortunadamente tuviera alguna complicacin y
(E8) iba/ se va/ a poner no s/ el lavadero o el cuarto de// donde Processo
metas la lavadora [y todo] 73 E: [para] quitar / de all abajo? 74 Culminado
I: aj/ s/ te digo/ est planeado// de esa manera 75 E: no pero a Tlico
futuro claro que queda/ [poco a poco] 76 I: [pero va/ va a durar] Transitivo
mucho/ [o sea s/ s]
(E8) E: mh 86 I: s/ porque/ hablaba de de/ l me/ me coment
algo// que/ a ellos les llama mucho la atencin cuando vienen a
esta zona// porque todo est modificado/ todo todo [todo] 87 E:
[mh] 88 I: aqu/ se supone de/ que en un principio// todo tena un/
(E8) I: entonces/ arriba se va a hacer otro cuarto ms grande 69 E:
ah/ pues va a quedar muy bien/ [no?] 70 I: [como] un
departamento/ yo creo/ pero eso est planeado para mis hermanos
(E8) I: ahorita/ porque te digo/ que hay muchas cosas/ pero/ pues
estaba ella y eran slo/ slo sus cosas// y ahorita pues est
planeado// construir este/ todo un cuarto arriba/ [pues ] 65 E:
[mh] 66 I: ya ves que aqu est este// ampliado/ [ya se ampli]
(E8) segn ella/ sus planes son// quitar el/ el/ el campo/ s sabes
que hay un campo de futbol? 909 E: mm 910 I: no?/ bueno/ lo
que pasa es que en el da est/ tapado 911 E: mh 912 I: los
puestos y las lonas lo tapan// justo aqu a/ una/ dos calles
(E8) cosa curiosa/ en/ en ningn este/ libro o/ o/ o en/ as/
oficialmente/ no est/ [no ha-/ aj] 583 E: [no ha-/ no hay una
delimitacin] 584 I: o no/ no est consignado como/ barrio de

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

PERFECTIVO
Culminao
Tlico
Transitivo
PERFECTIVO
Proc. Culminado
Tlico
Transitivo
PERFECTIVO
Proc. Culminado
Tlico
Transitivo
PERFECTIVO
Culminao
Tlico
Transitivo
PERFECTIVO
Proc. Culminado
Tlico

280

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Tepito o sea/ es la colonia Morelos

9
10

(E8) sabes qu es lo que venden 566 I: s 567 E: este/ cmo es


esa? 568 I: esa parte del barrio? 569 E: aj 570 I: mira// eh/ el
barrio// eh/ digamos que est delimitado/ bueno/ las calles que lo
delimitan es/ el eje/ el eje uno norte/ no?
(E9) decir/ oye mam/ este/ no por miedo al reproche de ay
mam pues es que t nunca me 74 I: o t/ llegas tarde 75 E:
aj 76 I: ya cuando llegas ya estoy dormido/ no s

Transitivo
PERFECTIVO
Culminao
Tlico
Transitivo
PERFECTIVO
Culminao
--Intransitivo
PERFECTIVO

ESTAR + PARTICPIO NURC RJ 8 ENTREVISTAS


1
h::... as opes... de/de diverso... entendeu?... ento ns... Proc. Culminado
1
a gente tem muita opo no sei se porque... eu/eu moro aqui h Transitivo
vinte e seis anos eu t acostumada mas eu tambm eu morei fora --ento eu vejo o que eu sentia muita falta tambm...
PERFECTIVO
23
e tem assim, tipo um parque, maravilhoso l, quer dizer, Proc. Culminado
2
principalmente pra gente que a gente v neve fica babando n Transitivo
(risos) aqui no Rio, no t acostumado, n?
--PERFECTIVO
33
fila de metr o pessoal t numa fila realmente, no t Estado
3
naquele amontoado, que nem aqui no Rio, e o cara fica parado e o Intransitivo
Metr pra exatamente onde voc t parado.
--PERFECTIVO
46
c quer. Ento cursos procurados como Eletrnica, Culminao
4
Produo, tem gente que fica de fora, por causa do CR, entendeu, Transitivo
e isso um outro problema, porque voc, se voc fizer no Bsico Tlico
no, entrou, voc j t garantido no profissional.
PERFECTIVO
47
se realmente, se voc, se acontece um acidente de carro, Estado
5
que voc, coisas que podem acontecer e voc no tiver um, ou Intransitivo
uma famlia rica ou um convnio, t morto! S de operao, de --anestesia, voc vai, morrer numa dessas,
PERFECTIVO
78
to pra lavar, e que ela no vai fazer, a ele vai fazer. DOC. Culminao
6
- E ... bem, voc falou que o, voc tem um irmo casado. Ele tem Intransitivo
filhos? LOC. - No. Ele t casado h dois anos, mais novo do --que eu at, tem vinte ... vinte e cinco, , tem vinte e cinco.
PERFECTIVO
81
Agora a gente t brigado, tem duas semanas que a gente Atividade
7
nem se fala, a, mas a, at passar a raiva, pensar se, vale a pena Intransitivo
voltar, no vale a pena voltar e tal
--PERFECTIVO
85
A, uma maior baguna, n a casa t sempre cheia tem os Culminao
8
amigos dos meus irmos que to sempre aqui, telefone t Transitivo
ocupado o tempo todo, quando no sou eu meu irmo, a ... ---assim.
IMPERFECTIVO
92
um acaso, elas no tm nenhum irmo, homem, sabe, s Culminao
9
irm, ento, acho que, eu acho que a parte negativa essa, Intransitivo
entendeu, hoje em dia, tem uma que t casada e ela atura coisas ---

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

281

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

10

11

do marido dela que eu no aturaria de um inimigo meu, sabe, de


no poder fazer isso, no quero voc conversando
117
eligvel ) LOC. - Ento n, como que a gente vai querer
ser, poder criticar alguma coisa, se voc no t fazendo nada, nem
por voc nem pelo social, t parado no teu lugar, n, at que
ponto voc no t sendo instrumento, reprodutor desse sistema

Culminao
Transitivo
Tlico
PERFECTIVO
136
Produo, tem gente que fica de fora, por causa do CR, Culminao
entendeu, e isso um outro problema, porque voc, se voc fizer Transitivo
no Bsico no, entrou, voc j t garantido no profissional. DOC. Tlico
- E tem como o cara, vamo supor, ele terminou o bsico e ...
PERFECTIVO

OCO.
1.

2.

PERFECTIVO

ASPECTO
(P1M3) Ento uma pessoa que t querendo fazer Eletrnica, vai Estado
ter Clculo, vai ter parte de Desenho,
Transitivo
Atlico
IMPERFECTIVO
(P1M4) t vendo, ltimo ano, voc tinha que t estudando, agora Atividade
no t estudando, no sei o que!
Transitivo
---IMPERFECTIVO

3.

(P2M4) , nossa, , e a gente t vendo coisas que, tava h


sculos n, parado

Atividade
Transitivo
Atlico
IMPERFECTIVO

4.

(P2M5) Brizola t fazendo coisa pra caramba, a gente t vendo


que ele t fazendo.

Proc. Culminado
Transitivo
Tlico
IMPERFECTIVO

5.

(P2M6) se voc no t fazendo nada, nem por voc nem pelo Atividade
social, t parado no teu lugar, n,
Transitivo
Atlico
IMPERFECTIVO
(P2M7) Ento perceber o que t acontecendo e tentar Atividade
interferir dentro disso de alguma forma,
Transitivo

6.

Atlico
IMPERFECTIVO
7.

(P2M9) Brizola t fazendo coisa pra caramba, a gente t vendo


que ele t fazendo.

8.

(P2M11) A sociedade t aumentando, as pessoas to Processo Culm.


aumentando em nmero, o espao fsico o mesmo,
Transitivo
Tlico
IMPERFECTIVO

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

Atividade
Transitivo
Atlico
IMPERFECTIVO

282

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

9.

10.

(P2M13) Brizola t fazendo coisa pra caramba, a gente t vendo Atividade


que ele t fazendo.
Transitivo
Atlico
IMPERFECTIVO
(P2M15) c v, esto asfaltando, "n" ruas do Rio, Atividade
principalmente as de acesso Barra da Tijuca, n.
Intransitivo
Atlico
IMPERFECTIVO

11.

(P2M16) O Graja. Eles to, asfaltando, melhorando tambm.

12.

(P2M17) , pois , eles to fazendo, ali no, no Borel, o Ciep de Processo Culm.
l,
Transitivo
Tlico
IMPERFECTIVO
(P2M18) A Avenida das Amricas, eles to recapeando ela Processo Culm.
toda, n.
Intransitivo

13.

Processo Culm.
Intransitivo
Tlico
IMPERFECTIVO

Tlico
IMPERFECTIVO
14.

(P2M19) Tem outro, a prpria, aquela rua, Teodoro da Silva n,


eles to recapeando tambm.

15.

(P2M20) , mas eles to mexendo sabe, melhor do que ficar s Atividade


parado. A Linha Vermelha, vai melhorar n, eu acho que...
Transitivo
Atlico
IMPERFECTIVO
(P2M21) 26 pessoas to aumentando em nmero, o espao Atividade
fsico o mesmo, mas isso em vez de, socializar mais as pessoas Transitivo
pelo contrrio, to deixando elas mais, agressivas.
Atlico
IMPERFECTIVO
(P2M22) A sociedade t aumentando, as pessoas to Atividade
aumentando em nmero, o espao fsico o mesmo,
Transitivo

16.

17.

Processo Culm.
Intransitivo
Tlico
IMPERFECTIVO

Atlico
IMPERFECTIVO
18.

(P2M23) esses comerciantes, eles tem uma um olho clnico a


pra ver o que que as pessoas to precisando, a hora que elas to
precisando, vem diretamente proporcional,

Estado
Transitivo
Atlico
IMPERFECTIVO

19.

(P2M24) eles tem uma um olho clnico a pra ver o que que as
pessoas to precisando, a hora que elas to precisando,

Atividade
Transitivo
Atlico

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

283

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

IMPERFECTIVO
20.

(P13M1) porque quando eu estou em casa eu estou fazendo


alguma coisa

21.

(P13M2) o tempo que eu tiver podendo ouvir tambm estou Atividade


ouvindo...no tenho preferncia por tipo de msica...
Transitivo
Atlico
IMPERFECTIVO
(P23M1) tenho a minha avaliao dele... mais at do que quando Atividade
eu estou jogando...
Transitivo

22.

Processo Culm.
Transitivo
Tlico
IMPERFECTIVO

Atlico
IMPERFECTIVO
23.

(P23M2) ou pelo menos tenho sempre uma opinio a dar quando


eu estou vendo o jogo... tenho a minha avaliao dele...

24.

(P3F1) essas duas que eu t falando, por um acaso, elas no tm Proc. Culminado
nenhum irmo, homem, sabe, s irm,
Intransitivo
Tlico
IMPERFECTIVO
(P3F2) Depende, entendeu, porque eu t namorando h quatro Atividade
anos e meio, e a fica meio dependente de namorado,
Intransitivo

25.

Processo Culm.
Transitivo
Tlico
IMPERFECTIVO

Atlico
IMPERFECTIVO
26.

(P3F3) Eu acho que, eu acho que existe, cobrana, por exemplo, Atividade
cobram, se voc t namorando h muito tempo, cobram, que Intransitivo
voc tem que casar,
Atlico
IMPERFECTIVO

27.

(P3F4) as minhas amigas que, achavam ridculo igreja, vu e


grinalda, hoje em dia, elas to casando de vu e grinalda,

28.

(P12F1) Que isso, isso nunca aconteceu no Brasil, no t Atividade


entendendo isso.
Transitivo
Atlico
IMPERFECTIVO
(P12F2) um problema, muito srio e voc, hoje em dia, Atividade
dirigindo um carro, voc, eu, pelo menos, sou assim, paro no Transitivo
sinal, voc no t, passeando pela cidade, voc no consegue
Atlico
passear.
IMPERFECTIVO
(P12F3) aqui no Rio a maioria das pessoas mora em prdios n, Culminao
So Paulo, geralmente o pessoal mora em casa, ah, t mudando Intransitivo
um pouco, mas, , So Paulo uma cidade mais, esparramada,

29.

30.

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

Culminao
Intransitivo
Atlico
IMPERFECTIVO

284

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Tlico
IMPERFECTIVO
31.

(P12F4) P, t velho, o cara no t cuidando! (risos) quer dizer,


os caras pensam em tudo,

32.

(P12F5) C pra no sinal, voc presta ateno se tem pivete, se Estado


tem algum olhando meio suspeito, se voc t sendo seguido Transitivo
por algum carro, entendeu, ento...
--IMPERFECTIVO
(P12F6) , meio acomodado. P t tudo bem, no t nem a, Culminao
mas, t mudando!
Intransitivo

33.

Atividade
Transitivo
Atlico
IMPERFECTIVO

---IMPERFECTIVO
34.

(P12F7) Ah essa loja t vendendo mais do que a gente, essa


outra t vendendo mais,

Atividade
Transitivo
--IMPERFECTIVO

35.

(P12F8) Ah essa loja t vendendo mais do que a gente, essa


outra t vendendo mais,

Atividade
Transitivo
--IMPERFECTIVO

36.

(P12F9) Porque eu no tava sabendo, voc no t convivendo o Processo Culm.


dia-a-dia do pas, ento, voc olhava aquela notcia, voc fica Transitivo
um pouco chocado.
Tlico
IMPERFECTIVO
(P12F10) quando voc vai num esquema desse de competio, Processo Culm.
voc no t vendo exatamente o dia-a-dia da cidade,
Transitivo

37.

Tlico
IMPERFECTIVO
38.

(P15F1) a Denise a respeito da injustia das mudanas que esto


havendo nas leis n... e o Paulo Goulart falou sobre famlia...

Processo Culm.
Transitivo
Tlico
IMPERFECTIVO

39.

(P25F1) gente que... poderia muito bem morar na Avenida


Atlntica e t morando em Bonsucesso... entendeu?

Culminao
Transitivo
--IMPERFECTIVO

40.

(P25F2) contra o que eu digo mas eu acho que ::ele um cara


que t tentando entendeu?...

Processo Culm.
Transitivo
Tlico
IMPERFECTIVO

41.

(P25F3) Barra um/ um::... um bairro que tem que tomar


muito cuidado ele t crescendo... n?

Processo Culm.

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

285

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Intransitivo
Tlico
IMPERFECTIVO
42.

(P25F4) Barra um/ um::... um bairro que tem que tomar


muito cuidado ele t crescendo... n?

43.

(P25F5) poderia muito bem morar na Avenida Atlntica e t Culminao


morando em Bonsucesso... entendeu?
Transitivo
--IMPERFECTIVO
(P25F6) ele no t tentando destruir a cidade ele t tentando Processo Culm.
melhorar como nenhum outro fez n? ele t tentando... n ele Transitivo
um cara corajoso...
--IMPERFECTIVO
(P25F7) ele t tentando:: modificar e::... ele t tentando::... Processo Culm.
h::... a/h/agradar mesmo o povo carioca...
Transitivo

44.

45.

Processo Culm.
Intransitivo
Tlico
IMPERFECTIVO

--IMPERFECTIVO
46.

(P25F8) ele t tentando:: modificar e::... ele t tentando::...


h::... a/h/agradar mesmo o povo carioca...

Processo Culm.
Transitivo
--IMPERFECTIVO

47.

(P25F9) ele faz tudo meio atrapalhado mas eu... eu acho que
ele... ele t tentando n...

Processo Culm.
Transitivo
--IMPERFECTIVO

48.

(P25F10) ele no t tentando destruir a cidade ele t tentando


melhorar como nenhum outro fez n?

Processo Culm.
Transitivo
--IMPERFECTIVO

49.

(P25F11) ele no t tentando destruir a cidade ele t tentando Processo Culm.


melhorar como nenhum outro fez n?
Transitivo
--IMPERFECTIVO
(P25F12) j te/te... to construindo muitos prdios no Recreio Processo Culm.
ento quer dizer...
Transitivo

50.

Tlico
IMPERFECTIVO
51.

(P25F13) j te/te... to construindo muitos prdios no Recreio Processo Culm.


ento... quer dizer... h::...
Transitivo
Tlico
IMPERFECTIVO

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

286

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

1.

(E3M1) me creers que ultim-/ ahorita estoy es-/ lo estoy


estudiando// y / a m se me hace padre

2.

(E3M2t hblame gey// aunque sepas que estoy trabajando/ t Atividade


hblame el fin de semana//
Intransitivo
--IMPERFECTIVO
(E3M3) o sea la gente que ya no quiero que/ tener cerca de m/ o Atividade
sea / yo no estoy pensando en qu estar haciendo esa persona/
Intransitivo

3.

Atividade
Transitivo
--IMPERFECTIVO

--IMPERFECTIVO
4.

5.

(E3M5)s!/ pero si te digo que lo estoy estudiando desde/ que Atividade


tengo/ cinco aos
Transitivo
--IMPERFECTIVO
(E3M6) o sea estoy haciendo el curso/ para hacer el Toefl // Processo Culm.
pero/ pero/ cundo empiezo?/ maana/ maana [empiezo]
Transitivo
Tlico
IMPERFECTIVO

6.

7.

(E3M7)no!/ pues es que/ digo/ he estudiado toda la vida// y Processo Culm.


ahorita ms bien estoy haciendo como el// curso para el Toefl
Transitivo
Tlico
IMPERFECTIVO
(E3M8) [entre] ellos/ tambin te lo coment hace rato/ estoy Processo Culm.
aprendiendo ingls
Transitivo
Tlico
IMPERFECTIVO

8.

9.

(E3M9) ya termin mi carrera// pero eh/ yo termin t-/ t-/ obtuve Processo Culm.
mi certificado// ya te estoy contando toda la historia
Transitivo
Tlico
IMPERFECTIVO
(E3M10) estoy radicando que es este/ te digo que en el pueblo Atividade
de San Mateo
Intransitivo
--IMPERFECTIVO

10.

(E3M11) eh/ yo despus/ este// del ochenta y cinco me vine a


vivir ya a lo que/ donde estoy viviendo ahorita/ [donde]

Estado
Intransitivo
--IMPERFECTIVO

11.

(E3M12) apenas voy a sacar mi ttulo/ estoy haciendo mis


trmites para el ttulo/ ya tengo todos mis papeles/

Processo Culm.
Transitivo
Tlico

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

287

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

IMPERFECTIVO
12.

(E3M14) pues s/ pero bueno/ nunca es tarde/ no? I: no/ o sea/


lo estoy haciendo/ por eso te digo o sea// me arrepiento de una
cosa me/

Processo Culm.
Transitivo
Tlico
IMPERFECTIVO

13.

(E3M15) s/ es lo que estoy haciendo ahorita// ya tengo todo// a


ver/ vamos a ver si no falta nada/ nada lo entrego//

Processo Culm.
Transitivo
Tlico
IMPERFECTIVO

14.

(E3M16) o hacer algo y/ pues ms o menos te enteras de/ qu


est diciendo// y y ms/ si ya ests estudiando ingls/

Processo Culm.
Transitivo
Tlico
IMPERFECTIVO

15.

(E3M17)s/ a fuerzas! y aprovchenlo/ t// no ests


estudiando entonces ingls?

Processo Culm.
Transitivo
Tlico
IMPERFECTIVO

16.

(E3M18) sea escuela/ trabajo/ tu barrio// donde caigas/ o sea/


conoces gente/ si no te gusta la gente que ests tratando/ pues
simplemente te aparta

Processo Culm.
Transitivo
Tlico
IMPERFECTIVO

17.

(E3M19) ay/ no/ o sea/ tengo inters// por aprenderlo y/ aparte Estado
me est gustando/ o sea ya/ ya le agarr gusto 687
Transitivo
--IMPERFECTIVO
(E3M20) vas viendo la pelcula/ y ms o menos como que/ Atividade
cuando ves a alguien platicar// o/ o hacer algo y/ pues ms o Transitivo
menos te enteras de/ qu est diciendo// y y ms/ si ya ests
--estudiando ingls/
IMPERFECTIVO
(E3M21) carpetas/ o sea todo lo que es artculo/ de hecho/ Atividade
ahorita es- ya se est metiendo lo que es este/ artculos de/ Transitivo
computacin//
Atlico
IMPERFECTIVO
(E3M23) entonces/ ella se dedica a lo que es fiscal// y / pero Processo Culm.
igual o sea el/ la conoc porque / estamos estudiando/ ingls
Transitivo

18.

19.

20.

Tlico
IMPERFECTIVO
21.

(E3M25) me lo estn diciendo con el afn de E: s/ no/ [no es


por ] I: [de ayudarme] E: por molestarte

22.

(E3M26) todo ese tipo de cosas ya/ se estn introduciendo/ est- Processo Culm.
esta empresa maneja/ varias marcas
Transitivo

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

Atividade
Transitivo
Atlico
IMPERFECTIVO

288

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Tlico
IMPERFECTIVO
23.

(E8F1) yo creo que es algo as/ es un fenmeno o algo as/ que


se est viendo ltimamente porque/ antes s// s siempre ha sido
peligroso el barrio/

24.

(E8F3) pues ahorita s/ se est/ usando as/ porque hay un Atividade


montn de triques ah
Transitivo
--IMPERFECTIVO
(E8F4) despus pues ya que/ te vuelves ms consciente/ te das Processo Culm.
cuenta de es lo que est sucediendo// pero de/ a ltimas fechas/ Transitivo
bueno de unos aos para ac/
Tlico
IMPERFECTIVO
(E8F5) no/ no/ es es lo que te digo// m-/ los/ o sea los/ los Atividade
medios de comunicacin/ no te van a decir la verdad// en primer Transitivo
lugar/ adems algo estn pensando/ porque bueno/ cmo te
Atlico
explicas
IMPERFECTIVO
(E8F6) pues n-/ mm/ tan truculento que no me imagino/ pero Atividade
hay algo as muy// muy oscuro/ muy negro no?/ que/ que estn Transitivo
pensando en hacer aqu// qu qu qu podra ser pues?
Atlico
IMPERFECTIVO
(E8F7) s/ me platicaba un amigo/ un ex vecino/ que ya no vive Atividade
aqu// que una vez/ su to/ vena a visitarlos/ no?/ el to era Transitivo
joven/ estamos hablando yo/ qu te dir/ del cincuenta/ sesenta
Atlico
IMPERFECTIVO
(E9F1) porque s hay momentos que llegas a ese grado// pero Processo Culm.
digo no/ o sea yo decid estudiar esto/ me gusta/ lo estoy Transitivo
disfrutando/ y creo que es lo que va a hacer que/ que valore
Tlico
todava ms/ ya se acab?
IMPERFECTIVO
(E9F2) ve que me subo al autobs// me voy// aparte de del Processo Culm.
aspecto aca-/ aspecto acadmico que he aprendido muchsimas Transitivo
cosas/ que estoy aprendiendo/// este// trato de aprovecharlo//
Tlico
porque// aprendo/ de// de las vivencias de/ de mis compaeros/
IMPERFECTIVO
de mis compaeras///
(E9F3) le digo/ bueno/ como quiera/ lo que me hace sentir Culminao
bien/ es que cosas malas/ a lo mejor no les estoy dejando E: Transitivo
claro
Tlico
IMPERFECTIVO
(E9F4) como que todo eso me ha servido/ y hace que/ que yo Processo Culm.
no desista de mis objetivos y hace de que yo no/ hace/ que yo no Intransitivo
desista de / de lo que estoy viviendo y experimentando como
Tlico
pareja/ entonces/ eso hace/ eso hace tambin que me motive y no
IMPERFECTIVO
desista/ del aspecto escolar//
(E9F5) si es/ si es lo que/ no quieres/ un ejemplo no/ [no estoy Atividade

25.

26.

27.

28.

29.

30.

31.

32.

33.

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

Estado
Transitivo
Atlico
IMPERFECTIVO

289

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

diciendo que/ que as sea mi pareja

34.

35.

Transitivo
Atlico
IMPERFECTIVO

(E9F6) en mi cabeza nunca pas la idea de tener novio/// ni Processo Culm.


mucho menos vivir con alguien// sucedi/ tuve novio// estoy Intransitivo
viviendo con una persona// ahorita estoy tranquila/
Tlico
IMPERFECTIVO
(E9F7) ciertas notas para su trabajo// yo me siento y estoy Atividade
estudiando// estoy leyendo// o luego le digo cmo ves?/
Transitivo
--IMPERFECTIVO

36.

(E9F8) elaborar// ciertas notas para su trabajo// yo me siento y


estoy estudiando// estoy leyendo// o luego le digo

Atividade
Transitivo
--IMPERFECTIVO

37.

(E9F9) 145 hijas o mis hijos 157 E: mh I: creo que no/ que es
lo ms tonto e inmaduro/ no?/ que puedo hacer/ porque ni ests
resolviendo el problema/ y les ests provocando conflictos
emocionales a tus hijos/ si no es que ya estn daados E: claro I:
entonces este// digo/ no/
(E9F10) como adultos/ aparte de que te comparten
conocimiento/ de la carrera que ests estudiando// te comparten
conocimientos de sus otras reas que hay

Atividade
Transitivo
Atlico
IMPERFECTIVO

39.

(E9F11) como profesionista/ porque no ests este/ limitando esa


parte// y aparte ests confiando en m

Processo Culm.
Transitivo
Tlico
IMPERFECTIVO

40.

(E9F12) creo que no/ que es lo ms tonto e inmaduro/ no?/ que


puedo hacer/ porque ni ests resolviendo el problema/ y les
ests provocando conflictos emocionales a tus hijos

Processo Culm.
Transitivo
Tlico
IMPERFECTIVO

41.

(E9F13) que te toca ver/ escuchar y dices// cmo es Atividade


posible?// se est demostrando no?/ que son personas Transitivo
egostas/ porque ni a l como padre/
Atlico
IMPERFECTIVO
(E9F14) te puede hacer bromas/ y que t le dices sabes qu?/ Processo Culm.
que estamos organizando una comida/ vamos a salir/ no s/ Transitivo
vas?/
Tlico
IMPERFECTIVO

38.

42.

Processo Culm.
Transitivo
Tlico
IMPERFECTIVO

Artigo recebido em: 15.10.2014


Artigo aprovado em: 14.11.2014

Maria Mercedes Riveiro Sebold, Anne Katheryne Estebe Maggessy; p. 261-290.

290

O corpus combinado e a pesquisa nos Estudos da traduo baseados


em corpora
The use of bidirectional parallel corpus within Corpus based translation studies
Silvana Maria de Jesus1
RESUMO: Este artigo aborda as relaes de
traduo de SAY/DIZER em textos
ficcionais no par lingustico ingls-portugus.
Adotando uma perspectiva emprica de
observao de dados em corpus combinado,
este trabalho aborda os tipos de corpora e
suas caractersticas, detalhando o corpus
combinado
e
os
procedimentos
metodolgicos ao se utilizar de dois
programas computacionais WordSmith
Tools e SPSS. O corpus combinado
apresentado composto de trs romances
originais em ingls e suas tradues para o
portugus e trs romances originais em
portugus e suas tradues para o ingls, e
faz parte do CORDIALL (Corpus Discursivo
para Anlises Lingusticas e Literrias)
desenvolvido pelos pesquisadores do LETRA
(Laboratrio Experimental de Traduo) da
Faculdade de Letras da UFMG. Os
programas WordSmith Tools e SPSS
(Statistical Package for the Social Sciences)
so utilizados para a extrao de dados
quantitativos para a construo de um banco
de dados. Os resultados apresentam os
equivalentes possveis de SAY/DIZER,
segundo as ocorrncias do corpus,
detectando-se padres distintos nas relaes
de traduo, conforme a direo, seja do
ingls para o portugus ou do portugus para
o ingls.

ABSTRACT: This work reports on a study


developed at LETRA - Laboratory for
Experimentation in Translation, Faculdade de
Letras, UFMG. Building on corpus based
translation studies, it examines equivalence
relations between two verbs in the pair
English-Portuguese,
SAY/DIZER.
Equivalence is looked at from an empirical
perspective drawing on data gathered from
translated and non-translated fiction in both
languages and in both translation directions.
Equivalence relations are studied applying
Corpus
Linguistics
methodology for
quantitative data analysis, using two software
WordSmith Tools and SPSS (Statistical
Package for the Social Sciences) and a
bidirectional parallel corpus (comparable and
parallel) compiled to that end. It investigates
the originals and their translations to search
and account for possible equivalents. Results
point to different patterns of these verbs,
relating to their functions and to equivalence
relations.

PALAVRAS-CHAVE: Estudos da traduo


baseados em corpora. Corpus combinado.
Relaes de traduo. Lingustica de Corpus.

KEYWORDS: Corpus based translation


studies. Bidirectional parallel corpus.
Equivalence relations. Corpus Linguistics.

Professora Doutora do Curso de Traduo do Instituto de Letras e Lingustica (ILEEL) da Universidade


Federal de Uberlndia (UFU).

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

1.Introduo
O uso de corpora de textos traduzidos em pesquisas de traduo tem como base os
trabalhos de Baker (1993, 1995, 1996), que por sua vez, tm como base os trabalhos de Toury
(1995) com sua proposta de Estudos descritivos da traduo. Baker introduziu uma
terminologia para os tipos de corpus, que se tornou bastante difundida, embora tenha recebido
crticas e reformulaes. Os trabalhos de Baker tambm so importantes pela abordagem que
propem a busca de universais de traduo que se constituiu em importante marco inicial
para a investigao dos textos traduzidos.
Este artigo no pretende fazer um histrico sobre a Lingustica de Corpus, tampouco
sobre os Estudos da Traduo baseados em corpora, assuntos sobre os quais o leitor
encontrar ampla discusso em Berber-Sardinha (2004) e no peridico Cadernos de Traduo
IX (TAGNIN, 2002), um nmero especial sobre Traduo e Corpora.
O objetivo deste trabalho trazer uma discusso sobre a terminologia utilizada para os
tipos de corpora e introduzir um tipo de corpus pouco utilizado, o corpus combinado;
pretende-se ainda mostrar como os dados brutos (raw data) do corpus oferecem material de
anlise ao pesquisador, a partir dos quais anlises mais refinadas podem ser desenvolvidas,
bem como descrever os procedimentos metodolgicos para a obteno de dados, destacandose os recursos informticos utilizados, especialmente os software WordSmith e SPSS.
Inicia-se, portanto, este artigo, com a discusso sobre os tipos de corpora e a definio
de corpus combinado. Em seguida, descrevem-se os procedimentos metodolgicos para a
obteno de dados do corpus atravs de programas computacionais, observando-se como
possvel formular perguntas de pesquisa a partir destes dados brutos e como estas perguntas
iniciais podem nortear o refinamento da anlise. Por fim, para ilustrar a metodologia,
desenvolve-se uma pequena anlise das relaes de traduo entre SAY e DIZER, a partir dos
dados de um corpus combinado.
2. Os diferentes tipos de corpora
Desde os trabalhos seminais de Baker (1993, 1995, 1996), que marcaram o incio da
interface entre os Estudos da Traduo e a Lingustica de Corpus, os tipos de corpora
utilizados nas pesquisas tm se diversificado de forma a contemplar diversos aspectos da
descrio e comparao de lnguas.

Silvana Maria de Jesus; p. 291-321.

292

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Inicialmente, foram definidos por Baker (1995:230) trs tipos: i) corpora paralelos
textos originais em lngua A e suas tradues em lngua B; ii) corpora multilngues textos
no-traduzidos compilados a partir de critrios comuns, como por exemplo, o gnero do
discurso, nas lnguas A e B; iii) corpora comparveis textos originalmente produzidos em
uma lngua A e textos traduzidos para essa mesma lngua A, ou seja, um corpus monolngue,
formado de textos no-traduzidos e textos traduzidos.
O termo comparvel, utilizado por Baker para se definir corpora de textos traduzidos
e no-traduzidos, pode ser usado como um termo geral, no sentido comum de se comparar
duas ou mais caractersticas, que podem ser textos traduzidos x no-traduzidos, lngua A x
lngua B, ou ainda gneros diferentes, como textos acadmicos x textos miditicos, o que
pode gerar certa confuso terminolgica. Nas pesquisas lingusticas, fora do mbito da
traduo, o termo usado para se nomear um corpus bilngue ou multilngue de textos notraduzidos em que aspectos de diferentes lnguas esto sendo comparados.
Nos Estudos da traduo, tem-se optado pelos termos corpus comparvel bilngue (ou
multilngue) e corpus comparvel monolngue para se distinguir entre a comparao de textos
no-traduzidos em lnguas diferentes e textos traduzidos e no-traduzidos em uma mesma
lngua, respectivamente (Olohan, 2004:34). Hansen e Teich (2001), em uma anlise
contrastiva do ingls e do alemo, utilizam os termos textos comparveis monolngues, para o
corpus de textos traduzidos e no-traduzidos em alemo, textos paralelos, para o corpus de
textos originais em ingls e textos traduzidos em alemo, e textos comparveis multilngues,
para o corpus de textos no-traduzidos em ingls e em alemo.
Observam-se, ainda, os tipos de corpora citados por Ana Frankenberg-Garcia (2006),
considerados pela autora como relevantes para os estudos da traduo: corpora comparveis
bilngues, corpora comparveis monolngues, corpora paralelos unidirecionais e corpora
paralelos bidirecionais. A nomenclatura dos tipos de corpora por si s no define as
caractersticas e finalidades dos mesmos, sendo ento explicitados pela autora.
Corpora comparveis bilngues so formados de um subcorpus de textos na lngua A
e um subcorpus de textos na lngua B, no-traduzidos, no-paralelos, semelhantes em gnero
e funo e podem ser usados para extrao de terminologia e no dia-a-dia de tradutores.
Corpora comparveis monolngues so formados de um subcorpus de textos no-traduzidos e
um subcorpus de textos traduzidos, ambos em lngua A, no-paralelos, semelhantes em
gnero e funo e podem ser usados para se observarem as diferenas entre a linguagem

Silvana Maria de Jesus; p. 291-321.

293

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

traduzida e a no-traduzida e para estudos tericos sobre a traduo. Corpora paralelos


unidirecionais so formados de um subcorpus de textos originais em lngua A e um
subcorpus com os textos traduzidos para a lngua B, so paralelos e semelhantes em gnero e
funo e podem ser usados para a pesquisa de equivalentes tradutrios, como suporte para a
criao de dicionrios bilngues e para a traduo automtica. Corpora paralelos
bidirecionais so corpora bastante complexos e merecem uma explicao mais detalhada.
Os corpora paralelos bidirecionais, segundo Frankenberg-Garcia (2006), so
formados de quatro subcorpora que, combinados entre si, podem formar outros corpora. Os
quatro subcorpora se compem em: 1) textos originais na lngua A e 2) as suas tradues para
a lngua B, 3) textos originais na lngua B e 4) as suas tradues para a lngua A.
A autora explica que estes corpora formam dois corpora comparveis monolngues (1
e 4, traduzidos e no traduzidos na lngua A, e 2 e 3, traduzidos e no traduzidos na lngua B)
e dois corpora comparveis bilngues (1 e 3, no-traduzidos na lngua A e no-traduzidos na
lngua B, e 2 e 4, traduzidos na lngua A e traduzidos na lngua B).
Este tipo de corpus denominado por Vela e Hansen-Schirra (2006) de corpus
combinado paralelo-comparvel (combined parallel-comparable corpus), ou simplesmente,
corpus combinado e apesar de sua complexidade tem-se mostrado mais produtivo para as
pesquisas em traduo. Hansen (2002:20) utiliza o termo corpus comparvel e paralelo
(comparable and parallel corpus) e descreve dois tipos de corpus combinado: o bilngue e o
multilngue (mais de duas lnguas).
Um dos estudos pioneiros na utilizao de um corpus combinado, embora o autor no
tenha utilizado esta denominao, o de Johansson (1998). O autor utiliza um corpus
formado de textos originais em ingls e suas tradues para o noruegus e textos originais em
noruegus e suas tradues para o ingls. Johansson sugere a utilizao dos seguintes termos
para a denominao dos diferentes tipos de corpora: i) corpora comparveis
bilngues/multilingues ou corpora de textos originais comparveis, ii) corpora de traduo ou
corpora de textos originais e suas tradues, podendo ser bilngue (original na lngua A e
traduo na lngua B) ou multilingue (original na lngua A e tradues nas lnguas B, C, D), e
iii) corpora comparveis monolngues ou corpora de textos originais e traduzidos na mesma
lngua.

Silvana Maria de Jesus; p. 291-321.

294

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Observando-se as classificaes apresentadas, nota-se que os corpora, que geralmente


so formados por distintos subcorpora, so classificados segundo trs aspectos: i) a(s)
lngua(s) envolvida(s), ii) o status do texto, e iii) a direcionalidade.
Em relao lngua, os corpora podem ser monolngues (somente textos em lngua
A), bilngues (textos em lngua A e B), ou multilngues (textos em lngua, A, B, C... n).
O status classifica o texto na sua relao com outros textos, podendo ser considerado
como original, traduo e texto no-traduzido. Destaca-se aqui que este status no se refere ao
texto em si, mas sua posio em relao a outro(s) texto(s) do corpus. Um texto ser
considerado como original se ele estiver em relao de traduo com outro(s) texto(s),
formando assim um corpus paralelo bilngue (ou multilngue) com original e traduo (ou
tradues). Este mesmo texto pode ser classificado como texto no-traduzido se ele estiver
sendo analisado em relao a um texto na mesma lngua que um texto traduzido, formando
assim, um corpus comparvel monolngue com texto(s) no-traduzido(s) em lngua A e
texto(s) traduzido(s) em lngua A.
O termo original visto por alguns tericos, principalmente aqueles voltados para a
interface entre os Estudos da traduo e os Estudos culturais, como inadequado, por pressupor
aspectos relativos s questes de hierarquia. Entretanto, opta-se por utilizar os termos
original/traduo para se destacar que so textos que esto em relao de traduo, sendo os
termos texto traduzido/texto no-traduzido utilizados para se referir aos textos que no esto
em relao de traduo entre si.
Aspectos discursivos tambm podem ser apontados no status, como tipo textual,
registro ou gnero textual. O corpus pode ser compilado de forma a contrastar as
caractersticas de um gnero textual em duas lnguas ou de gneros textuais diferentes em
uma mesma lngua.
O aspecto direcionalidade indica se a anlise feita apenas na direo da lngua A
para a lngua B ou se ela considera tambm a direo inversa, ou seja, da lngua B para a
lngua A. Pode, portanto, apresentar-se como unidirecional, quando, por exemplo, compara-se
uma dada caracterstica em textos originais na lngua A e em suas tradues na lngua B; ou
bidirecional, quando esta anlise ampliada com a comparao desta mesma caracterstica em
textos originais na lngua B e em textos traduzidos para a lngua A, ou seja, quando se utiliza
um corpus combinado.

Silvana Maria de Jesus; p. 291-321.

295

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Estes tipos bsicos podem ser combinados conforme as necessidades de pesquisa e,


como no h ainda uma terminologia consagrada para cada aspecto, cabe ao pesquisador
explicitar as diversas caractersticas do corpus utilizado.
Outros aspectos relacionados tipologia de corpus, como modo (falado ou escrito),
tempo (sincrnico ou diacrnico) e outros, so abordados por Berber Sardinha (2004:20). A
ttulo de ilustrao de diferentes tipos de corpora, podem-se observar alguns corpora em
desenvolvimento nos Estudos da traduo, como por exemplo, o TEC, o CORDIALL e o
CroCo.2 Remete-se ainda o leitor ao trabalho de Dayrell (2005:48) para um levantamento de
corpora existentes em portugus.
3. O corpus combinado
O corpus combinado apresentado nesse artigo foi usado por Jesus (2008), sendo parte
do Projeto CORDIALL (Corpus discursivo para anlises lingusticas e literrias,
desenvolvido pelos pesquisadores do LETRA Laboratrio Experimental de Traduo da
Faculdade de Letras da UFMG) 3. composto por doze romances, somando um total de
1.237.970 palavras. Caracteriza-se como um corpus combinado que, como foi dito,
composto de vrios corpora bsicos, cujas combinaes permitem a composio de vrios
corpora de anlise. Os quatro corpora bsicos desta pesquisa so 4:
1234-

Corpus PO - para portugus original ou no-traduzido


Corpus IT - para ingls traduzido
Corpus IO - para ingls original ou no-traduzido
Corpus PT - para portugus traduzido
Neste corpus os subcorpora 1-2 e 3-4 so paralelos, ou seja, no subcorpus 2 temos as

tradues dos textos que compem o subcorpus 1 e no subcorpus 4 as tradues dos textos
que compem o subcorpus 3. Em outra combinao, os subcorpora 1-4 e 2-3 so comparveis
monolngues, ou seja, so formados de textos traduzidos e no-traduzidos em portugus e em

TEC ( http://www.monabaker.com/tsresources/TranslationalEnglishCorpus.htm ), CORDIALL


( http://letra.letras.ufmg.br/letra/index.xml ) e CroCo (http://fr46.uni-saarland.de/croco/index_en.html ).
3
Site do LETRA - http://letra.letras.ufmg.br/letra/
4
As siglas IO, IT, PO, PT foram utilizadas por Tagnin (2002a:203) na construo do corpus para o Projeto
terminolgico para tradutores. A opo de utiliz-las na presente pesquisa deve-se ao fato de que as siglas
facilitam a visualizao do tipo de corpus, destacando-se ainda que os textos no-traduzidos utilizados no corpus
desta pesquisa so tambm os textos originais.

Silvana Maria de Jesus; p. 291-321.

296

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

ingls, respectivamente. H ainda um corpus comparvel bilngue formado por 1-3, com
textos no-traduzidos em portugus e ingls.
Os textos foram utilizados anteriormente por pesquisadores do LETRA, oferecendo,
portanto, a vantagem de j se encontrarem digitalizados. A compilao do corpus obedeceu
aos seguintes critrios: romances disponveis no CORDIALL, no par lingustico portugusingls, publicados no sculo XX. Foram selecionados trs romances para cada um dos
subcorpora. O Quadro 1 apresenta os dados bibliogrficos de cada romance e os corpora que
eles compem. 5
Quadro 1 Dados bibliogrficos dos romances do corpus combinado

Corpora

IO

IT

PO

PT

Sigla

Autor/Tradutor

1 edio

Edio
utilizada

PCP

Aldous Huxley

1928

1994

IWV

Anne Rice

1976

1997

Beloved

BEL

Toni Morrison

1987

1998

Macunama

MAC

E A Goodland

1984

1984

GAB

James L Taylor e
William Grossman

1962

1962

THS

Giovanni Pontiero

1986

1992

MHS

Mrio de Andrade

1928

1980

GCC

Jorge Amado

1958

1958

A hora da estrela

AHE

Clarice Lispector

1977

1998

Contraponto

CPO

rico Verssimo

1934

1971

ECV

Clarice Lispector

1977

1996

AMA

Evelyn Kay
Massaro

1987

1987

Ttulo
Point counter
point
Interview with the
vampire

Gabriela, clove
and cinammon
The hour of the
star
Macunama: o
heri sem carter
Gabriela, cravo e
canela

Entrevista com o
vampiro
Amada

Para maiores detalhes sobre os corpora, remete-se o leitor aos trabalhos de Assis (2004) para os romances
Beloved e Amada; Jesus (2004) para os romances Point counter point e Contraponto; Bueno (2005) para os
romances Macunama, o heri sem carter e Macunama; Canado (2005) para os romances Interview with the
vampire e Entrevista com o vampiro; Morinaka (2005) para os romances Gabriela, cravo e canela e Gabriela,
clove and cinammon; e Rodrigues (2005) para os romances A hora da estrela e The hour of the star.

Silvana Maria de Jesus; p. 291-321.

297

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Estes subcorpora podem ser combinados, segundo os objetivos de anlise, formando


outros corpora para a investigao de aspectos especficos:
i)

corpus paralelo IO-PT formado de textos originais em ingls (IO) e suas tradues
para o portugus (PT)

ii)

corpus paralelo PO-IT formado de textos originais em portugus (PO) e suas


tradues para o ingls (IT)

iii)

corpus comparvel monolngue IO-IT formado de textos no-traduzidos em ingls


(IO) e textos traduzidos em ingls (IT)

iv)

corpus comparvel monolngue PO-PT formado de textos no-traduzidos em


portugus (PO) e textos traduzidos em portugus (PT)

v)

corpus comparvel bilngue IO-PO formado de textos no-traduzidos em ingls (IO)


e textos no-traduzidos em portugus (PO)
Em relao aos trs aspectos que so observados em um corpus, quais sejam,

lngua(s), status e direcionalidade, este corpus caracteriza-se como bilngue, composto por
textos do par lingustico portugus-ingls; combinado, ou seja, contendo textos em ambas as
relaes traduzidos/no-traduzidos e traduzidos/originais; e bidirecional, visto que a anlise
pode ser feita tanto na direo do portugus para o ingls quanto do ingls para o portugus.
A prxima seo apresenta os procedimentos metodolgicos para obteno dos dados com o
uso de programas computacionais.
4. Procedimentos metodolgicos
O trabalho com corpus exige do pesquisador o uso de ferramentas
computacionais para a obteno de dados quantitativos. Esta seo introduz dois programas
que podem ser usados para anlises lingusticas, e os procedimentos metodolgicos utilizados,
ilustrando como as perguntas de pesquisa vo sendo desenvolvidas concomitantemente com a
anlise do corpus.

Silvana Maria de Jesus; p. 291-321.

298

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

4.1 O programa WordSmith Tools e os dados brutos


Aps a compilao do corpus da pesquisa, o tratamento do corpus feito com a
combinao de procedimentos manuais por parte do pesquisador e automticos com a
utilizao de programas computacionais.
O software WordSmith Tools6 tem sido bastante utilizado em pesquisas com corpus.
Para maiores detalhes sobre o programa remeto o leitor a Jesus (2004), Berber Sardinha
(2004), Alves e Morinaka (2004) e ao site do programa 7.
Com a ferramenta WordList possvel obter os seguintes dados do corpus: i) o
nmero total de vocbulos (types) e o nmero total de ocorrncias (tokens) do corpus e
tambm de cada romance e/ou subcorpus; e ii) o nmero de ocorrncias das formas de
SAY/DIZER no corpus. A partir das formas encontradas na lista de palavras fornecida pela
ferramenta Wordlist, buscam-se todas as ocorrncias de SAY/DIZER com a ferramenta
Concord.
A ferramenta Concord permite a busca de todas as formas de SAY/DIZER colocandose como ndulo, que a palavra de busca, a forma say*/said para SAY e
disse*/diz*/diria*/diga*/digo/dito/ditas/dir-se-ia para DIZER. A definio das formas a serem
utilizadas como ndulo foi feita atravs da observao das listas de palavras obtidas com a
ferramenta WordList. O asterisco (*) indica ao programa que se deve buscar todas as palavras
que iniciem pelas letras antes do asterisco, assim, no caso de say* o programa busca tambm
as formas saying e says. No caso de DIZER, quando se usa disse* buscam tambm as formas
disseram, dissemos e assim por diante. Neste processo, o programa busca tambm palavras
que no so formas de SAY/DIZER, como por exemplo, dizimados para a forma diz*, sendo
necessrio checar as linhas de concordncia e eliminar estes casos. Para se eliminar as linhas,
utiliza-se o comando deletar e o boto ZAP.
A Tabela 1 apresenta os dados de cada subcorpora do corpus combinado.

Uma outra opo o programa AntConc, que no possui as mesmas funcionalidades, mas de uso gratuito
http://www.laurenceanthony.net/antconc_index.html .
7
Mike Scotts Web http://www.lexically.net/wordsmith/ .

Silvana Maria de Jesus; p. 291-321.

299

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Tabela 1 Dados dos quatro corpora bsicos do corpus combinado

Types
Tokens

IO
29.392
402.525

Total de ocorrncias de 2.723


SAY/DIZER
% de SAY/DIZER x tokens 0.67

IT
22.594
234.599

PO
26.336
203.504

PT
40.434
397.342

776

707

2.385

0.33

0.34

0.60

O tamanho do corpus um aspecto bastante discutido na sua compilao (Olohan,


2004:45), com uma tendncia, nos Estudos da traduo baseados em corpora, para o uso de
corpora de mesmo tamanho (em relao ao nmero de textos ou de tokens). Entretanto, o
corpus combinado aqui apresentado formado de romances inteiros, originais e tradues, o
que dificulta a padronizao do tamanho. Alm disso, sero analisadas 150 ocorrncias de
cada subcorpus, no sendo, portanto, relevante a questo do tamanho do corpus.
Os dados brutos j permitem algumas consideraes para anlise:
i) corpus comparvel bilngue IO-PO
H 2.723 ocorrncias de SAY em IO e 707 ocorrncias de DIZER em PO.
Logo, a ocorrncia de SAY em textos no-traduzidos (IO) significativamente maior
do que a ocorrncia de DIZER em textos no-traduzidos (PO); SAY representa 0.67% de
tokens, ao passo que DIZER representa 0.34%;
ii) corpus paralelo IO-PT
H 2723 ocorrncias de SAY em IO e 2.385 ocorrncias de DIZER em PT.
Logo, a ocorrncia de SAY nos textos originais maior do que a de DIZER nos textos
traduzidos. SAY equivale a 0.67% de tokens dos textos originais, enquanto que nas tradues
a ocorrncia de DIZER de 0.60%.
iii) corpus paralelo PO-IT
H 707 ocorrncias de DIZER em PO e 776 ocorrncias de DIZER em IT.
Logo, a ocorrncia de DIZER nos textos originais semelhante ocorrncia de SAY
nos textos traduzidos. DIZER equivale a 0.34% de tokens dos textos originais enquanto que
nas tradues a ocorrncia de SAY de 0.33%. Nota-se que a diferena mnima em termos
percentuais, ao passo que, em termos de ocorrncias, o texto traduzido tem mais ocorrncias

Silvana Maria de Jesus; p. 291-321.

300

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

de SAY do que os originais tm de DIZER. Nota-se que a ocorrncia de SAY maior do que
a ocorrncia de DIZER tanto no corpus comparvel bilngue (IO-PO) quanto nos corpora
paralelos (PO-IT e IO-PT);
iv) corpus comparvel monolngue (IO-IT)
H 2.723 ocorrncias de SAY nos textos no-traduzidos (IO) e 776 ocorrncias de
SAY nos textos traduzidos (IT). SAY equivale a 0.67% de tokens dos textos no-traduzidos,
enquanto que nas tradues a ocorrncia de 0.33%. Nota-se, portanto, que a ocorrncia de
SAY nas tradues significativamente menor do que a ocorrncia em textos no-traduzidos.
v) corpus comparvel monolngue (PO-PT)
H 707 ocorrncias de DIZER nos textos no-traduzidos (PO) e 2.385 ocorrncias de
DIZER nos textos traduzidos (PT). DIZER equivale a 0.34% de tokens dos textos notraduzidos, enquanto que nas tradues a ocorrncia de 0.60%. Nota-se, portanto, que a
ocorrncia de DIZER nas tradues significativamente maior do que a ocorrncia em textos
no-traduzidos.
Estas consideraes iniciais, obtidas atravs da observao dos dados brutos do
corpus, permitem a elaborao de perguntas de pesquisas que orientaro a anlise qualitativa
do corpus. Cada um dos subcorpora do corpus combinado permite a anlise de distintos
aspectos das relaes entre os textos que, somadas, contribuem para uma compreenso mais
abrangente das relaes de traduo. Estas perguntas baseiam-se no modelo de anlise
proposto por Teich (2003):
1- Qual a relao entre as oraes verbais realizadas por SAY em textos ficcionais
no-traduzidos em ingls e oraes verbais realizadas por DIZER em textos
ficcionais no-traduzidos em portugus?
2- As oraes verbais realizadas por SAY so frequentemente traduzidas por oraes
verbais realizadas por DIZER e vice-versa? Qual a probabilidade de equivalncia
entre SAY/DIZER? Quais os outros itens lexicais em relao tradutria com
SAY/DIZER? possvel estabelecer padres que condicionem as relaes de
traduo?

Silvana Maria de Jesus; p. 291-321.

301

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

3- Qual a relao entre as oraes verbais realizadas por SAY/DIZER em textos notraduzidos e as oraes verbais realizadas por SAY/DIZER em textos traduzidos?
Os textos traduzidos apresentam os mesmos padres dos textos no-traduzidos ou
estes padres so condicionados pela relao dos textos traduzidos com os textos
originais?
Para a investigao de cada pergunta, focaliza-se uma combinao diferente do
corpus: 1- relaes entre textos no-traduzidos em portugus e ingls (IO-PO); 2- relaes
entre textos traduzidos e textos no-traduzidos em ingls (IO-IT); 3- relaes entre textos
traduzidos e textos no-traduzidos em portugus (PO-PT); 4- relaes entre textos originais
em ingls e suas tradues para o portugus (IO-PT); e 5- relaes entre textos originais em
portugus e suas tradues para o ingls (PO-IT).
4.2 O programa SPSS e o banco de dados
A partir dos dados brutos e das primeiras consideraes que eles permitem, possvel
uma anlise mais refinada dos dados. No total, h cerca de 6500 ocorrncias de SAY/DIZER
no corpus, que podem ser localizadas utilizando-se conjuntamente as ferramentas WordList e
Concord do software WordSmith Tools, como foi explicado. Optou-se por selecionar cerca de
10% das ocorrncias e, pensando-se em uma amostragem com o mesmo nmero de
ocorrncias de cada romance, optou-se por selecionar as primeiras 50 ocorrncias de cada
romance, totalizando 599 ocorrncias, visto que o nmero total de ocorrncias em um dos
romances 49.
Dado o foco do estudo, os processos verbais, foram eliminadas 30 ocorrncias, 04 de
SAY e 26 de DIZER, de oraes em que SAY/DIZER realizam processos simblicos e
processos relacionais, fugindo, portanto, do escopo da anlise.
Cada uma das 599 ocorrncias foi analisada na linha de concordncia fornecida pela
ferramenta Concord e selecionaram-se apenas as ocorrncias em que SAY/DIZER realizam
processos verbais. Aps este recorte, restaram 569 linhas de ocorrncias, sendo 296
ocorrncias de SAY (149 em textos no-traduzidos (IO) e 147 em textos traduzidos (IT)) e
273 ocorrncias de DIZER (132 em textos no-traduzidos (PO) e 141 em textos traduzidos
(PT)).

Silvana Maria de Jesus; p. 291-321.

302

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Estes dados j apontam o fato de que o papel de SAY na realizao de oraes verbais
parece ser mais frequente do que o de DIZER, visto que foram eliminados apenas 04 casos de
SAY e 26 casos de DIZER.
O prximo passo foi analisar cada ocorrncia em relao s categorias focalizadas. O
incio da anlise foi feito atravs de anotao 8 manual do corpus, que consiste em o
pesquisador estabelecer cdigos para as categorias analisadas e inserir estes cdigos no
corpus dentro de etiquetas (denominam-se etiquetas os parnteses angulares < e >, dentro dos
quais se insere o cdigo no corpus). Posteriormente, as etiquetas so contabilizadas
automaticamente com o programa WordSmith Tools para a obteno de dados, possibilitando
ao pesquisador desenvolver sua anlise qualitativa a partir dos dados quantitativos.
Entretanto, este processo bastante limitado para anlise de grande quantidade de dados,
principalmente quando se utilizam vrias categorias. Optou-se, portanto, pelo uso de um
programa estatstico, o SPSS (Statistical package for the social sciences).
O programa SPSS trabalha com casos ou ocorrncias, variveis e categorias, formando
um banco de dados em uma planilha semelhante s utilizadas pelo programa Excel. O SPSS
apresenta muitas facilidades: a construo do banco de dados simples; possvel classificar
separadamente cada aspecto observado e depois cruzar os dados; as ferramentas de gerao de
tabelas e grficos so simples e com muitos recursos de produo e edio; esto disponveis
diferentes formas de visualizao dos dados. Dentre suas limitaes pode-se apontar: custo
muito alto do programa; dificuldade para se trabalhar com uma varivel que possua mais de
cinco categorias; no apresenta nenhuma interface com o texto, visto que o programa no foi
desenvolvido especificamente para linguistas; necessidade de conhecimentos de estatstica
para anlises mais elaboradas.
O programa destaca-se pela facilidade de construo de um banco de dados que
possibilita o cruzamento de variveis, a extrao de dados de frequncia e a gerao de
tabelas e grficos, sem aprofundamento em testes estatsticos. Olohan (2004:86) aponta que
vrios linguistas consideram que os dados de frequncia podem ser suficientes para a anlise e
que os testes de significncia no so sempre necessrios. A autora cita uma observao de
Halliday sobre esse aspecto, em que o autor diz que dados brutos de frequncias geralmente
so suficientes para se aceitar a afirmativa do pesquisador de que alguma caracterstica

Confira Feitosa (2005) para um estudo mais detalhado sobre anotao de corpora.

Silvana Maria de Jesus; p. 291-321.

303

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

relevante no texto e que se deve verific-la9. Desta forma, o programa foi utilizado para o
processamento automtico de frequncia das variveis e categorias analisadas com a gerao
de tabelas e grficos10.
Inicialmente, o pesquisador estabelece as variveis e categorias de anlise que iro
fazer parte do banco de dados do SPSS. Recomenda-se a construo de um nico banco de
dados, portanto, as variveis e categorias devem englobar todas as ocorrncias do corpus.
Algumas variveis podem existir apenas para facilitar a organizao do banco de dados,
como, por exemplo, a varivel OCORRNCIAS, que no possui categorias e em que cada
nmero corresponde a uma das 50 linhas de concordncia selecionada para investigao em
cada romance. Outras variveis servem para facilitar a seleo de parte dos dados dentro do
banco de dados, por exemplo, a varivel STATUS cujas categorias so ingls original (IO),
portugus original (PO), ingls traduzido (IT), e portugus traduzido (PT). O programa
permite a seleo de parte dos dados, segundo as diferentes categorias, para a gerao de
dados, o que permite ao pesquisador, no exemplo da varivel STATUS, selecionar os dados
em relao s ocorrncias de portugus em geral, ou somente de portugus traduzido ou
somente de portugus original, segundo os objetivos da pesquisa.
Aps vrios testes, foram estabelecidas nove variveis para a anlise com suas
respectivas categorias, descritas a seguir.
1) Varivel: OCORRNCIAS. Sem categorias
Foram selecionadas 300 ocorrncias de SAY e 299 ocorrncias de DIZER que se
constituram das 50 primeiras ocorrncias de cada romance, sendo que um deles possui
apenas 49 ocorrncias de DIZER. O SPSS conta cada ocorrncia como um caso, ocupando
uma linha do banco de dados e numerando-as de 1 a 599. Depois de eliminados os 30 casos
em que SAY/DIZER no realizam processo verbal, restaram 569 casos. Na varivel
OCORRENCIA cada uma foi numerada segundo as linhas de concordncia selecionadas com
o programa WordSmith, ou seja, de 1 a 50 pela ordem de ocorrncia.

Minha traduo de: a rough indication of frequencies is often just what is needed: enough to suggest why we
should accept the analysts assertation that some feature is prominent in the text, and allow us to check his
statements(Halliday apud Olohan, 2004:86).
10
Para exemplos de pesquisas lingusticas com o uso do SPSS, veja a tese de Rothe-Neves (2002) na rea de
traduo e a dissertao de Oliveira (2006) na rea de fonologia da lngua portuguesa.

Silvana Maria de Jesus; p. 291-321.

304

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

2) Varivel: LEXICO. Categorias: SAY e DIZER


Cada ocorrncia foi classificada como SAY ou DIZER, conforme faa parte do corpus
em portugus ou do corpus em ingls.
3) Varivel: CORPUS. Categorias: os doze romances do corpus combinado
Foi assinalada a origem de cada ocorrncia, segundo os doze romances que compem
o corpus combinado. Essa classificao permite que se faam anlises separadas de cada
romance, procedimento necessrio, por exemplo, para a localizao de linhas de concordncia
a serem utilizadas como exemplos. Atribuiu-se uma sigla para cada um, conforme descrito na
Tabela 1.
PCP - Point counter point; IWV - Interview with the vampire; BEL Beloved;
MAC Macunama; GAB Gabriela, clove and cinammon; THS - The hour of
the star;
MHS Macunama: o heri sem carter; GCC Gabriela, cravo e canela;
AHE - A hora da estrela; CPO Contraponto; ECV - Entrevista com vampiro;
AMA - Amada
4- Varivel: FORMA. Categorias: as formas de SAY/DIZER
Foi analisada a frequncia das diferentes formas de SAY/DIZER. Enquanto SAY possui
apenas quatro formas, say, says, said, saying, DIZER possui vrias, sendo as mais frequentes,
disse, dizer, dizia.
5- Varivel: MODOPROJ. Categorias: relato, citao, verbiagem
Nesta varivel, cada orao verbal foi analisada segundo o modo de projeo: relato ou
citao. Os casos classificados como verbiagem indicam que no ocorreu a projeo.
6- Varivel: MODOEXP. Categorias: congruente e metfrico
Cada orao verbal foi classificada segundo o modo de expresso: congruente ou
metafrico. As oraes de verbiagem no foram analisadas em relao aos modos de
expresso.

Silvana Maria de Jesus; p. 291-321.

305

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

7- Varivel: TRADUO. Categorias: tradues de SAY/DIZER no corpus paralelo


Para a classificao desta varivel foi necessrio realizar antes o alinhamento do corpus
paralelo. Alinhar significa colocar um trecho do texto original seguido do trecho do texto
traduzido correspondente (Lawson, 2001). Este trabalho foi feito com o auxlio de bolsistas
do LETRA e utilizaram-se dois recursos diferentes: a ferramenta Viewer and Aligner do
programa WordSmith e o processador de texto Word. O resultado no muito distinto. O
Viewer faz o alinhamento automtico, por sentenas ou pargrafos, mas apresenta problemas
que precisam ser corrigidos manualmente pelo pesquisador; o texto alinhado pode ser
exportado para ser manuseado no Word. No Word, o alinhamento feito manualmente
dividindo-se as sentenas ou pargrafos em duas colunas de uma tabela, uma para o texto
original e outra para o texto traduzido.
Ento, cada equivalente encontrado passa a ser uma categoria, sendo que esta varivel
tem tantas categorias quantas forem os possveis equivalentes, agrupados sob a forma do
infinitivo, que funciona como lema. Por exemplo, os itens lexicais mais frequentes
correspondentes a SAY no corpus so DIZER, FALAR e RESPONDER. E os mais
frequentes correspondentes a DIZER so SAY, TELL e EXPLAIN. Os dados observados nos
corpora alinhados foram lanados diretamente no SPSS.
8- Varivel: RELAES. Categorias: prototpico, tpico, atpico, omisso e no-verbal
Os itens lexicais que aparecem no corpus em relao de traduo com SAY/DIZER,
foram agrupam nestas categorias, segundo o tipo de verbo dentro dos verbos que podem
realizar processo verbal.
9- Varivel: STATUS. Categorias: ingls/portugus e original/traduzido
Cada ocorrncia foi classificada em relao aos quatro corpora bsicos: ingls original
(IO), portugus original (PO), ingls traduzido (IT) e portugus traduzido (PT).
Todas as 569 ocorrncias foram classificadas em relao a estas nove variveis,
formando assim o banco de dados da pesquisa. O SPSS permite que se realize uma anlise
parcial, excluindo-se uma ou mais variveis e/ou categorias, facilitando a explorao do
banco de dados para diferentes tipos de anlise. O programa gera tabelas e grficos de dados,
com extensas possibilidades de edio e apresentao.

Silvana Maria de Jesus; p. 291-321.

306

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

A Figura 1 mostra uma janela do SPSS com as nove variveis de anlise e uma
amostra parcial das ocorrncias que compem o banco de dados.

Figura 1 Janela do programa SPSS com viso parcial do banco de dados

A Tabela 2 um exemplo de tabela produzida pelo SPSS e mostra as ocorrncias de


SAY/DIZER nos romances do corpus, abrangendo os quatro corpora bsicos do corpus
combinado. O corpus de textos originais em ingls (IO) com 149 ocorrncias, o corpus de
textos originais em portugus (PO) com 132 ocorrncias, o corpus de textos traduzidos em
ingls (IT) com 147 ocorrncias e o corpus de textos traduzidos em portugus (PT) com 141
ocorrncias, totalizando 569 casos ou ocorrncias de SAY/DIZER. Nota-se que as tabelas
produzidas pelo SPSS no seguem os padres da ABNT.

Silvana Maria de Jesus; p. 291-321.

307

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Tabela 2 Ocorrncias de SAY/DIZER no corpus combinado (exemplo de tabela produzida pelo SPSS)
Romances do corpus * Texto original ou traduo Crosstabulation
Count

Romanc es
do corpus

PCP
IWV
BEL
MAC
GAB
THS
MHS
GCC
AHE
CPO
ECV
AMA

ING nao-trad
50
49
50

Texto original ou tradu o


POR nao-trad
ING trad

POR trad

Total
50
49
50
47
50
50
40
47
45
49
45
47
569

47
50
50
40
47
45

Total

149

132

49
45
47
141

147

A Tabela 2 est no formato produzido pelo SPSS, mas o programa tem amplos
recursos para edio de tabelas. Pode-se, por exemplo, mudar o ttulo, excluir colunas, alterar
a fonte, inserir notas, alterar o tamanho e outras edies e formataes, conforme
exemplificado na Tabela 3.
Tabela 3 Exemplo de tabela editada com os recursos do SPSS
a
Ocorrncias de S AY /DIZER nos romances do corpus combinado

Count
Texto original ou tradu o

Ro man ces
do corpu s

PCP
IWV
BE L
MA C
GA B
THS
MHS
GCC
AHE
CP O
ECV
AMA

Total

ING
na o-tra d
50
49
50

POR
na o-tra d

ING tra d

POR
tra d

47
50
50
40
47
45

149

132

147

49
45
47
141

a. Corpus paralelo e comparvel bidirecional no par lingus tic o


ingls -portugus

Alm do manual do programa (em ingls), possvel encontrar manuais em portugus


com o passo-a-passo para a utilizao dos recursos do programa.

Silvana Maria de Jesus; p. 291-321.

308

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Todas estas variveis foram detalhadamente analisadas em Jesus (2008). A prxima


seo apresenta, parcialmente, a anlise de uma das variveis, as relaes de traduo, para
ilustrar a metodologia utilizada.
5. As relaes de traduo entre SAY-DIZER
O conceito leigo de equivalncia geralmente est associado ideia de que para um
determinado item em dada lngua A h um item equivalente na lngua B. Entretanto, os
estudos da traduo desde muito apontam que, para um determinado item em uma lngua A,
existem vrios itens equivalentes na lngua B ou, nos termos de Halliday (1992:16), um item
X na lngua do original tem um grupo de itens equivalentes em potencial - A, B, C, D, E, F na lngua da traduo11. Portanto, pode-se dizer que existem diferentes relaes de traduo
entre um item do texto original e seus vrios possveis equivalentes no texto traduzido.
A anlise das relaes de traduo de SAY/DIZER tem o objetivo de responder as
seguintes perguntas: i) Dado que, em dicionrios bilngues, DIZER o equivalente
prototpico de SAY, com qual frequncia SAY traduzido por DIZER? ii) Dado que h
ocorrncias de SAY que no so traduzidas por DIZER, pois no h apenas um equivalente,
quais seriam os possveis equivalentes de SAY alm de DIZER? E qual seria a frequncia de
ocorrncia destes equivalentes? As mesmas perguntas so colocadas em relao em relao a
DIZER, pensando-se na direo do portugus para o ingls.
Considerando-se SAY/DIZER como verbos que realizam Processo verbal, natural que
SAY/DIZER estejam em relaes de traduo com outros verbos que tambm realizam
processo verbal. A Gramtica sistmico-funcional (GSF, doravante) (HALLIDAY e
MATTHIESSEN 2004) apresenta dois grupos de verbos que realizam processo verbal,
segundo o modo de citao e o modo de relato.
Quadro 2 - Verbos que realizam Processo em oraes verbais no modo de citao

(1) Membro geral


(2)Verbos
especficos
funes de fala:
a) oferta
b) demanda

Proposio
Proposta
SAY
SAY
a a)
Declaraes:
TELL
(+a) Ofertas: SUGGEST, OFFER;
receptor), REMARK, OBSERVE,THREATHEN,
VOW,
POINT
OUT,
REPORT,PROMISE, AGREE.
ANNOUNCE.
b) Perguntas: ASK, DEMAND,b) Comandos: CALL, ORDER,

11

Minha traduo de: You are aware that an item X in the source language has a potential equivalence of items
A, B, C, D, E, F in the target language (Halliday, 1992:16).

Silvana Maria de Jesus; p. 291-321.

309

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Proposio
INQUIRE, QUERY.

Proposta
REQUEST, TELL, PROPOSE,
DECIDE;
URGE,
PLEAD,
WARN.
(3)Verbos com caractersticas REPLY, EXPLAIN, PROTEST,[consultar (2) acima]
adicionais
CONTINUE, ADD, INTERRUPT,
a) circunstanciais
WARN.
b)especificadores de modo ou INSIST, COMPLAIN, CRY,[em grande parte como as
conotao
SHOUT, BOAST, MURMUR,proposies]
BLARE,
STAMMER.
THUNDER, MOAN, YELL,
FUSS.
Fonte: Halliday e Matthiessen (2004:448). Traduo de Alves (2006:29)

A GSF aponta SAY como o membro geral da classe de verbos que realizam processos
verbais em citaes (Halliday e Matthiessen, 2004:448), conforme apresentado no Quadro 2.
Destaca-se seu papel como o membro no-marcado deste grupo de verbos (p. 252).
Thompson (1994:34-35) considera SAY como o verbo de elocuo bsico, utilizado quando
no se quer indicar nenhuma finalidade ou modo do dizer, portanto, um verbo neutro.
Considera ainda, como neutros, os verbos: tell, ask, write, speak, talk.
Halliday e Matthiessen (2004:448) consideram ainda que outros verbos que no so
verbos de dizer, podem, especialmente na narrativa ficcional, realizar Processos verbais. Os
autores destacam os verbos que tipicamente realizam Processos comportamentais (como sob,
snort, breathe) e que quando realizam processos verbais expressam atitudes, emoes e gestos
que acompanham o ato de fala.
A classificao dos diferentes tipos de verbos que realizam processos verbais
relevante para a anlise das relaes de traduo de SAY/DIZER, visto que aqueles so os
mais provveis candidatos ao quadro de equivalentes possveis destes verbos.
Para esta anlise, utilizaram-se os corpora paralelos do corpus combinado, compostos
de textos originais em ingls (IO) e suas tradues para o portugus (PT) e de textos originais
em portugus (PO) e suas tradues para o ingls (IT). A anlise bidirecional, ou seja,
observa as relaes de traduo tanto na direo do portugus para o ingls, quanto na direo
do ingls para o portugus.
Foram selecionadas as primeiras 50 ocorrncias de SAY/DIZER de cada romance.
Estas ocorrncias foram analisadas, excluindo-se as oraes em que SAY/DIZER no
realizam processo verbal, como mencionado. Portanto, analisam-se 149 oraes verbais
realizadas por SAY e 132 oraes verbais realizada por DIZER.

Silvana Maria de Jesus; p. 291-321.

310

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Inicialmente, foram observadas as relaes de traduo de SAY/DIZER,


considerando-se o estrato lxico-gramatical, ou seja, as relaes de equivalncia de SAY (em
IO) com DIZER e outros itens lexicais do portugus (em PT) e, por sua vez, as relaes de
equivalncia de DIZER (em PO) com SAY e outros itens lexicais do ingls (em IT).
Ao invs de se considerar isoladamente cada item em relao de traduo com
SAY/DIZER, decidiu-se por agrup-los em categorias semnticas, na perspectiva experiencial
de realizao de Processos verbais, segundo a classificao da GSF para os diferentes tipos de
verbos: i) membro geral, ii) verbos especficos e iii) verbos que, tipicamente, no so verbos
de dizer, mas podem realizar esse significado.
Observa-se que, embora no existam descries do portugus baseadas na LSF, Neves
(2000:48) apresenta uma classificao dos verbos discendi, que se aproxima da proposta da
GSF. A autora classifica os verbos de elocuo como neutros (dizer e falar), verbos que
indicam algum aspecto do dizer, como modo ou cronologia (repetir, gritar, responder) e
verbos que podem funcionar como introdutores do discurso (consolar, sorrir). Menciona-se
ainda a classificao de Garcia (1986:131), que considera como verbos de elocuo os verbos
discendi (dizer, perguntar, responder, exclamar) e os verbos sentiendi (gemer, suspirar,
lamentar-se, queixar-se), que introduzem o discurso e realizam emoes, atitudes,
comportamentos. Utilizou-se, ainda, para a anlise dos verbos em portugus, o Dicionrio
Houaiss da lngua portuguesa 12, observando-se as significaes possveis para os verbos e
suas relaes com o universo do dizer. Portanto, utiliza-se uma classificao das relaes de
traduo de SAY/DIZER em trs tipos: i) prototpicos, ii) tpicos e iii) atpicos.
Considera-se como prototpico o verbo que o membro geral da classe, ou seja,
SAY/DIZER. E como verbos tpicos todos os outros verbos que realizam oraes verbais nos
modos de citao e relato. Como verbos atpicos consideram-se os verbos que tipicamente
realizam outro tipo de Processo (mentais, materiais e outros), mas que nos textos ficcionais
geralmente realizam Processos verbais ou que eventualmente podem realizar este tipo de
Processo.
Assim, consideram-se trs tipos de relaes de traduo de SAY e DIZER: i) SAY
traduzido por DIZER, e vice-versa, em que a relao se d com o verbo prototpico; ii)
SAY/DIZER so traduzidos por outros verbos tpicos de processos verbais; iii) SAY/DIZER
12

Dicionrio online, disponvel para assinantes em http://educacao.uol.com.br/dicionarios/ .

Silvana Maria de Jesus; p. 291-321.

311

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

so traduzidos por verbos que no so verbos de dizer, mas que podem realizar processo
verbal, em que a relao se d com o verbo atpico.
Ocorrem ainda, no corpus, casos em que SAY/DIZER so traduzidos por um
substantivo, ou seja, a relao de traduo no se d entre verbos. Ou ainda, casos em que a
orao verbal realizada por SAY/DIZER omitida.
Portanto, as relaes de traduo de SAY/DIZER encontradas no corpus analisado so
classificadas em cinco tipos: prototpico, tpico, atpico, no-verbal e omisso. Esta
classificao feita a partir dos corpora paralelos: i) SAY/DIZER aparecem como
equivalentes, ou seja, SAY traduzido por DIZER e DIZER corresponde a SAY, casos
classificados como prototpicos; ii) SAY/DIZER so traduzidos por outros verbos que
tipicamente realizam Processo verbal como falar, perguntar, responder, pedir, tell, speak,
remark, point out, casos classificados como tpicos; iii) SAY/DIZER so traduzidos por
verbos que tipicamente realizam outros tipos de processos, como lembrar, fazer, mean, think,
que so classificados como atpicos; iv) casos em que SAY/DIZER so traduzidos por um
substantivo, e v) casos de omisso.
Inicialmente, foram observados os itens lexicais em relao de traduo com SAY no
corpus, apresentados na Tabela 4.
Tabela 4 Itens lexicais em relao de traduo com SAY
Valid

dizera
omisso
falar
respo nder
perguntar
no-verbal
comentar
pedir
convidar
repetir
concordar
fazer
retrucar
Tota l

Frequency Valid Percent


98
65,8
21
14,1
12
8,1
5
3,4
3
2,0
2
1,3
2
1,3
1
,7
1
,7
1
,7
1
,7
1
,7
1
,7
149
100,0

a. Corp us paralelo ingl s-portugus (IO-PT)

O corpus confirma a expectativa de que DIZER seja o equivalente mais frequente de


SAY; a relao com o verbo prototpico ocorre em 65.8% dos casos. Nota-se que a segunda

Silvana Maria de Jesus; p. 291-321.

312

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

relao mais frequente a de omisso, que ocorre em 14.1%. O terceiro item mais frequente
foi falar, um dos verbos tpicos, que ocorre em 8.1% dos casos. H dois casos (1.3%) de
relao no-verbal. Agrupando-se estes itens lexicais, segundo as categorias de anlise, temse outra perspectiva das relaes de traduo, apresentadas na Tabela 5.
Tabela 5 Relaes de traduo de SAY segundo as categorias

Valid

prototpicoa
tpicos
atpicos
nao-verbal
omisso
Tot al

Frequency
97
28
1
2
21
149

Valid Percent
65, 1
18, 8
,7
1,3
14, 1
100,0

a. Corpus paralelo ingls -portugus (IO-PT)

O equivalente prototpico ocorre em 65.1% dos casos, enquanto que verbos tpicos de
processos verbais ocorrem em 18.8%. Como foi dito, a omisso ocorre em 14.1% dos casos,
h duas ocorrncias de relao no-verbal (1.3%) e uma ocorrncia de verbo atpico (0.7%).
Exemplos do corpus so apresentados no Quadro 3.
Quadro 3 Exemplos do corpus das relaes de traduo de SAY em IO-PT

Prototpico
04 "You forgetting how little it is," said her mother. (BEL)
-- Voc est se esquecendo de que ela muito pequenina, disse a me. (AMA)

Tpico
45 But I mean we want to get married.
You just said so. And I said all right. (BEL)
--O que estou querendo dizer que vamos nos casar.
-- J me disse isso. E eu falei que est tudo bem. (AMA)

Atpico
46 'Were you?' said Lady Edward smiling and looking from one to the other. (PCP)
- Estavam? - fez Lady Edward, sorridente, olhando ora para uma ora para outra. (CPO)

Omisso
17 "We and Denver," she said.
"That all right by you? (BEL)
-- Eu e Denver.
-- E est tudo bem com voc? (AMA)

No-verbal
14 When the time came to say good-bye, he had shaken the skeleton hand. (PCP)
Chegara o momento da despedida: ele apertou na sua a mo esqueltica do doente, a mo que jazia inerte
sobre a coberta. (CPO)

Silvana Maria de Jesus; p. 291-321.

313

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

08 She had not thought to ask him and it bothered her still that it might have been possible-that for twenty
minutes, a half hour, say, she could have had the whole thing, every word she heard the preacher say at the
funeral (and all there was to say, surely) engraved on her baby's headstone: Dearly Beloved. (BEL)
No pensara em perguntar-lhe e ainda se perturbava com a probabilidade de ter sido possvel - que por vinte
minutos, talvez meia hora, teria obtido a coisa inteira, cada palavra que ouvira o pastor dizer no funeral (e
certamente tudo o que havia para ser dito) gravada na lpide de sua filhinha: Carssima Amada. (AMA)
Exemplos do corpus paralelo: ingls original (IO) e portugus traduzido (PT)

Em seguida, observaram-se os itens lexicais em relao de equivalncia com DIZER,


apresentados na Tabela 6.
Tabela 6 Itens lexicais em relao de traduo com DIZER
Valid

saya
t ell
omisso
ment ion
explain
no-verbal
speak
t hink
mutt er
ask
laugh
insist
believe
conclude
pronounce
divulge
inf orm
snap
retort
observe
call
remark
confide
object
comment
express
beg
rejoin
reply
hear
add
go
resume
accuse
f ind
concede
cover
imagine
Tot al

Frequency
61
14
8
4
4
3
3
3
2
2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
132

Valid Percent
46, 2
10, 6
6, 1
3, 0
3, 0
2, 3
2, 3
2, 3
1, 5
1, 5
,8
,8
,8
,8
,8
,8
,8
,8
,8
,8
,8
,8
,8
,8
,8
,8
,8
,8
,8
,8
,8
,8
,8
,8
,8
,8
,8
,8
100,0

a. Corpus paralelo portugus-ingls (PO -IT )

Silvana Maria de Jesus; p. 291-321.

314

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

DIZER se destaca como o equivalente prototpico de SAY, embora no chegue a 50%


dos casos (46.2%). O segundo item mais frequente tell, com 10.6%. A porcentagem de
omisso de DIZER de 6.1% e h trs ocorrncias de relao no-verbal (2.3%). A Tabela 7
mostra as relaes de traduo de DIZER, quando se agrupam estes itens segundo as
categorias de anlise.
Tabela 7 Relaes de traduo de DIZER segundo as categorias

Valid

prototpicoa
tpicos
atpicos
nao-verbal
omisso
Tot al

Frequency
61
49
11
3
8
132

Valid Percent
46, 2
37, 1
8,3
2,3
6,1
100,0

a. Corpus paralelo portugus-ingls (PO-IT)

O equivalente prototpico ocorre em 46.2% dos casos, enquanto que outros verbos
tpicos de processos verbais ocorrem em 37.1% e verbos atpicos em 8.3%. A omisso ocorre
em 6.1% e a relao no-verbal em 2.3%. Exemplos no Quadro 4.
Quadro 4 Exemplos do corpus das relaes de traduo de DIZER em PO-IT

Prototpico
17 -- Isso revoltante - dizia o Doutor enquanto o grupo caminhava pela rua sem calamento, contornando o
morro. (GCC)
"This is revolting," said the Doctor as the group walked along the unpaved street skirting the hill.

Tpico
37 O ticotiquinho ficava azaranzado porque estava padecendo fome e aquele nhenhenhm-nhenhenhm
azucrinando ele atrs, diz-que "Telo decum!... telo decum!..." (MHS)
The cowbird swallowed everything and resumed its habitual refrain "Boo-hoo! Mama, I'm famished, I'm
famished!" (MAC)

Atpico
32 E todos com muito medo foram correndo pra dentro. Ento Chuvisco desapeou e disse pra Macunama:
Est vendo? (MHS)
Shower came down and laughed at Macunama: "Did you see that?" (MAC)

Omisso
12 Em Itamarac Macunama passou um pouco folgado e teve tempo de comer uma dzia de manga-jasmim que
nasceu do corpo de dona Sancha, dizem. (MHS)
They ran to the island of Itamarac, where the hero ate some mangoes, a dozen jasmin mangoes that had sprung
from the grave of the late Dona Sancha; (MAC)

No-verbal

Silvana Maria de Jesus; p. 291-321.

315

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

03 O seu rico andor bordado de ouro, levavam-no sobre os ombros orgulhosos os cidados mais notveis, os
maiores fazendeiros, vestidos com a bata vermelha da confraria, e no pouco dizer, pois os coronis do cacau
no primavam pela religiosidade... (GCC)
The gold-embroidered litter bearing the image of the saint was carried on the shoulders of the town's most
important citizens, the owners of the largest plantations, dressed in the red gowns of the lay brotherhood. This
was significant, for the cacao colonels ordinarily avoided religious functions. (GAB)
21 Pelpidas de Assuno d'vila descendia de uns vilas, fidalgos portugueses estabelecidos nas bandas de
Ilhus ainda no tempo das capitanias. Pelo menos assim o afirmava o Doutor, dizendo-se baseado em
documentos de famlia. Opinio pondervel, de historiador. Descendente desses celebrados vilas, cujo solar
elevara-se entre Ilhus e Olivena, hoje negras runas ante o mar, cercadas de coqueiros, mas tambm de uns
Assunes plebeus e comerciantes - diga-se em sua homenagem, ele cultuava a memria de uns e de outros com
o mesmo fervor exaltado. (GCC)
Pelpidas de Assuno d'vila (the Doctor) maintained that he was descended from the Portuguese noblemen
named vila who had settled near what was now Ilhus during the period of royal land grants. The line of
descent could be clearly traced, he found, in family documents. The solid opinion of a historian. He was
descended also from certain plebeian, shopkeeping Assunes, and, to his great credit, he cherished the
memory of these ancestors and of the vilas with the same exalted fervor. (GAB)
01 Si o incitavam a falar exclamava:
- Ai! que preguia!...
e no dizia mais nada. (MHS)
If anyone tried to make him speak he would exclaim, "Aw! What a fucking life!" but nothing more.
Exemplos do corpus paralelo: portugus original (PO) e ingls traduzido (IT)

Vrios aspectos se destacam nas relaes de traduo de SAY e DIZER a partir destes
dados do corpus. Poder-se-ia pensar que SAY a traduo de DIZER na mesma proporo
que DIZER a traduo de SAY, mas os dados apontam diferenas nas relaes de traduo,
conforme a direo seja do ingls para o portugus ou do portugus para o ingls. Estas
diferenas so discutidas em cada uma das relaes de traduo observadas para SAY e
DIZER.
Relao de traduo I - equivalente prototpico
A ocorrncia do equivalente prototpico maior na direo do ingls para o portugus
(65.1%) do que do portugus para o ingls (46.2%).
Relao de traduo II equivalente tpico
SAY apresenta relaes de traduo com 09 verbos tpicos de Processos verbais no
portugus alm de DIZER: falar, responder, perguntar, comentar, pedir, convidar, repetir,
concordar e retrucar. DIZER, por sua vez, aparece em relao de traduo com 26 verbos
tpicos de Processos verbais alm de SAY: tell, mention, explain, speak, mutter, ask, insist,
pronounce, divulge, inform, snap, retort, observe, call, remark, confide, object, comment,

Silvana Maria de Jesus; p. 291-321.

316

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

express, beg, rejoin, reply, add, resume, accuse e concede. Estatisticamente, 18.8% das
ocorrncias de SAY esto em relao de traduo com verbos tpicos e 37.1% das ocorrncias
de DIZER.
Relao de traduo III equivalente atpico
SAY apresenta relao de traduo com 01 verbo atpico (fazer), ao passo que DIZER
apresenta relaes de traduo com 09 verbos atpicos: think, laugh, conclude, believe, hear,
go, find, cover e imagine. Este tipo de relao representa 0.7% das ocorrncias com SAY e
8.3% das ocorrncias com DIZER.
Relao de traduo IV equivalente no-verbal
H 02 casos com SAY (1.3%) e 03 com DIZER (2.3%).
Relao de traduo V omisso
A omisso ocorre 14.1% com SAY e 6.1% com DIZER.
6.Apontamentos finais
Este artigo analisou as relaes de traduo de SAY/DIZER a partir do uso de um
corpus combinado. Foram observados os equivalentes possveis destes itens, a partir dos
correspondentes encontrados no corpus. Apresentou-se, ainda, a metodologia da pesquisa e os
primeiros passos da anlise, visto que a metodologia no se desenvolve de forma linear, mas
vai sendo construda a partir das primeiras etapas da pesquisa em anlises piloto. Discutiu-se
a terminologia utilizada para classificao dos diferentes tipos de corpus, observando-se que o
corpus combinado oferece uma maior abrangncia de possibilidades de pesquisa, permitindo
ao pesquisador ampliar as perspectivas de anlise. Foram descritas as caractersticas de um
corpus combinado, bem como os procedimentos metodolgicos para extrao de dados.
Foram introduzidos os programas computacionais WordSmith Tools e SPSS e as variveis e
categorias que podem ser usadas para pesquisa com estes programas. Mostrou-se como iniciar
a pesquisa a partir dos dados brutos, que possibilitam ao pesquisador as primeiras observaes
a partir das quais a anlise pode desenvolver-se. Desta forma, o trabalho ilustra a
produtividade do uso de corpus combinado nos Estudos da traduo baseados em corpora.

Silvana Maria de Jesus; p. 291-321.

317

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Referncias bibliogrficas
ALVES, D. A. S. Aspectos da representao do discurso em textos traduzidos: os verbos
de elocuo neutros. 2006. Dissertao (Mestrado em Estudos Linguticos). Faculdade de
Letras, Universidade Federal de Minas Gerais.
ALVES, D. A. S.; MORINAKA, E. M. Compilao de procedimentos metodolgicos
adotados por pesquisadores(as) em Estudos da Traduo e interfaces com as
Lingusticas
Sistmico-Funcional
e
de
Corpus.
Disponvel
em
<
www.geocities.com/xalaskero/UFMG/Metodologia >. Acesso em < 15 junho 2007 >.
ASSIS, R. C. A transitividade na representao de Sethe no corpus paralelo BelovedAmada. 2004. Dissertao (Mestrado em Estudos Lingusticos). Faculdade de Letras,
Universidade Federal de Minas Gerais.
BAKER, M. Corpus linguistics and translation studies: implications and applications. In:
BAKER et al. (Ed.). Text and technology: in honour of John Sinclair.
Amsterdam/Philadelphia: John Benjamins Publishing Company, 1993. Cap., p. 233-250.
BAKER, M. Corpora in translation studies: an overview and some suggestions for future
research. Target, Amsterdam, v. 7, n. 2, p. 223-243, 1995.
http://dx.doi.org/10.1075/target.7.2.03bak
BAKER, M. Corpus-based translation studies: the challenges that lie ahead. In: SOMERS, H.
(Ed.). Terminology, LSP and translation: studies in language engineering in honour of Juan
C. Sager. Amsterdam/Philadelphia: John Benjamins Publishing Company, 1996. Cap., p. 177186.
BERBER SARDINHA, T. Lingustica de corpus. Barueri, SP: Manole, 2004.
BUENO, L. T. Transitividade, coeso e criatividade lexical em Macunama, de
Andrade, e Macunama, de Goodland. 2005. Dissertao (Mestrado em Estudos
Lingusticos). Faculdade de Letras, Universidade Federal de Minas Gerais.
CANADO, T. Transitividade e representao do discurso no corpus paralelo
Interview with the Vampire/Entrevista com o Vampiro. 2005. Dissertao (Mestrado
em Estudos Lingusticos). Faculdade de Letras, Universidade Federal de Minas Gerais.
DAYRELL, C. Investigating lexical patterning in translated Brazilian Portuguese: a
corpus-based study. 2005. 316 p. Tese (Doutorado em Estudos da Traduo). Centre for
Translation and Intercultural Studies , The University of Manchester.
FEITOSA, M. P. Uma proposta de anotao de corpora paralelos com base na lingustica
sistmico-funcional. 2005. Dissertao (Mestrado em Estudos Lingusticos). Faculdade de
Letras, Universidade Federal de Minas Gerais.
FRANKENBERG-GARCIA,
A.
Corpora
e Traduo.
Disponvel
http://www.linguateca.pt/escolaverao2006/ >. Acesso em < 15 junho 2007 >.

Silvana Maria de Jesus; p. 291-321.

em

318

<

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

GARCIA, O. M. Comunicao em prosa moderna. 13. ed. Rio de Janeiro: Fundao


Getlio Vargas, 1986.
HALLIDAY, M.A.K. Language theory and translation practice. Rivista internazionale di
tecnica della traduzione, Triesta, n. 1 (pilot issue), p. 15-25, 1992.
HALLIDAY, M.A.K.; MATTHIESSEN, C. M. I. M. An introduction to functional
grammar. 3rd edition, rev. ampl. London: Arnold, 2004. 689 p.
HANSEN, S.; TEICH, E. Multi-layer analysis of translation corpora: methodological issues
and practical implications. In: EUROLAN 2001: Workshop on Multi-layer Corpus-based
Analysis,
2001,
Proceedings
Disponvel
em
<http://www.coli.unisaarland.de/publications/show.php?year=2001>, Acesso em < janeiro de 2008 >.
HANSEN, S. The nature of translated text: an interdisciplinary methodology for the
investigation of the specific properties of translations. 2002. 245 p. Tese (Doutorado em
Estudos da Traduo). Department of Applied Linguistics, Saarland University. (Saarbrucken
dissertations in computational linguistics and language technology, v. 13).
JESUS, S. M.. Representao do discurso e traduo: padres de textualizao em corpora
paralelo e comparvel. 2004. 128 p. Dissertao (Mestrado em Estudos Lingusticos).
Faculdade de Letras, Universidade Federal de Minas Gerais.
JESUS, S. M. Relaes de traduo: SAY e DIZER em corpora de textos ficcionais. 2008.
Tese (Doutorado em Lingustica Aplicada). Faculdade de Letras, Universidade Federal de
Minas Gerais.
JOHANSSON, S. On the role of corpora in cross-linguistic research. In: JOHANSSON, S;
OKSEFJELL, S. (Ed). Corpora and cross-linguistic research: theory, method, and case
studies. Amsterdam: Rodopi, 1998. Cap. 1, p. 3-24.
JOHANSSON, S.; OKSEFJELL, S. (Ed). Corpora and cross-linguistic research: theory,
method, and case studies. Amsterdam: Rodopi, 1998. 376 p. (Language and computers:
studies in practical linguistics, n. 24)
LAWSON, A. Collecting, aligning and analyzing parallel corpora. In: GHADESSY, M. et al.
(Ed.). Small corpus studies and ELT. Theory and practice. Amsterdam: John Benjamins,
2001. Cap., p. 47-67.
MORINAKA, E. M. Gabriela, cravo e canela and its (re)textualization in English:
representation through lexical relations. 2005. Dissertao (Mestrado em Estudos
Lingusticos). Faculdade de Letras, Universidade Federal de Minas Gerais.
NEVES, M. H. de M. A gramtica funcional. So Paulo: Martins Fontes, 1997. (Coleo
Texto e Linguagem).
NEVES, M. H. de M. Gramtica de usos do portugus. So Paulo: UNESP, 2000: 31-53.

Silvana Maria de Jesus; p. 291-321.

319

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

OLIVEIRA, A. J. Variao em itens lexicais terminados em /l/+vogal na regio de


Itana/MG. 2006. Dissertao (Mestrado em Estudos Lingusticos). Faculdade de Letras,
Universidade Federal de Minas Gerais.
OLOHAN, M. Introducing corpora in Translation Studies. London: Routledge, 2004. 220
p.
RODRIGUES, R. R. A organizao temtica em A hora da estrela e The hour of the
star: um estudo de caso. 2005. Dissertao (Mestrado em Estudos Lingusticos). Faculdade
de Letras, Universidade Federal de Minas Gerais.
ROTHE-NEVES, R. Caractersticas cognitivas e desempenho em traduo: investigao

em tempo real. 2002. Tese (Doutorado em Estudos Lingusticos). Faculdade de Letras,


Universidade Federal de Minas Gerais.
SCOTT, M. WordSmith Tools. 1999. Disponvel em < http://www.lexically.net/wordsmith/
>Acesso em: 12 maro 2003.
TAGNIN, S. E. O. (Org). Cadernos de Traduo IX (Nmero especial sobre Traduo e
Corpora). Florianpolis: UFSC/NUT, 2002, n. 1, 278 p.
TAGNIN, S. E. O. Os corpora: instrumentos de auto-ajuda para o tradutor. Cadernos de
Traduo IX, Traduo e Corpora. Florianpolis, 2002a, n. 1, p. 191-219.
TEICH, E. Towards a model for the description of cross-linguistic divergence and
commonality in translation. In: STEINER, E.; YALLOP, C. (Ed.). Exploring translation
and multilingual text production: beyond content. Berlin, New York: Mouton de Gruyter,
2001. Cap, p. 191-227.
TEICH, E. Cross-linguistic variation in system and text: a methodology for the
investigation of translations and comparable texts. Berlin: Mouton de Gruyter, 2003. 276p.
(Text,
translation,
computational
processing,
5).
http://dx.doi.org/10.1515/9783110896541
THOMPSON, G. Collins Cobuild English Guides 5: Reporting. London: HarperCollins
Publishers, 1994.
TOURY, G. Descriptive translation studies and beyond. Amsterdam: John Benjamins,
1995. 311 p. (Benjamins Translation Library).
VELA, M; HANSEN-SCHIRRA, S. The use of multi-level annotation and alignment for the
translator. In: ASLIB Translating and the computer 28 conference, 2006, Londres.
Proceedings. Disponvel em < http://fr46.uni-saarland.de/croco/publication_en.html > Acesso
em < 14 junho 2007 >
Corpus analisado
AMADO, J. Gabriela, cravo e canela. Rio de Janeiro: Record, 1958.

Silvana Maria de Jesus; p. 291-321.

320

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

AMADO, J. Gabriela, clove and cinnamon. Trad. Taylor, J. e Grossman . New York: Avon
Books, 1962. (Traduo de Gabriela, cravo e canela).
ANDRADE, M. Macunama: o heri sem nenhum carter. So Paulo e Belo Horizonte:
Martins e Itatiaia, 1980.
ANDRADE, M. Macunama. Traduo de E. A. Goodland. London: Quartet Books, 1984.
(Traduo de: Macunama: o heri sem carter).
HUXLEY, A. Point counter point. London: Flamingo, 1994. (Coleo Modern Classic).
HUXLEY, A. Contraponto. Trad. rico Verssimo. Porto Alegre: Editora Globo, 1971.
(Traduo de: Point counter point Coleo Imortais da Literatura).
LISPECTOR, C. A hora da estrela. Rio de Janeiro: Rocco, 1998.
LISPECTOR, C. The hour of the star. Trad. Giovanni Pontiero. New York: New Directions
Books, 1992. (Traduo de A hora da estrela).
MORRISON, T. Beloved . New York: Alfred A. Knopf, 1998. 275p.
MORRISON, T. Amada. Traduo de Evelyn Kay Massaro. So Paulo: Ed. Best Seller,
1987. 321p. (Traduo de: Beloved).
RICE, A. Interview with the vampire. New York: Ed. Ballantine Books, 1997.
RICE, A. Entrevista com o vampiro. Trad. Clarice Lispector. Rio de Janeiro: Rocco, 1996.
(Traduo de: Interview with the vampire).

Artigo recebido em: 15.10.2014


Artigo aprovado em: 25.11.2014

Silvana Maria de Jesus; p. 291-321.

321

A equivalncia tradutria de Partculas Modais: um estudo baseado


em corpus
Translation equivalence of Modal Particles: a corpus-based study
Adriana Silvina Pagano *
Arthur de Melo S**
Kcila Ferreguetti***
RESUMO: Este artigo apresenta resultados
de um estudo sobre Partculas Modais
realizado
pelo
grupo
de
pesquisa
Modelagem
sistmico-funcional
da
traduo e da produo textual multilngue,
do Laboratrio Experimental de Traduo da
UFMG. Segundo Figueredo (2011), as
Partculas Modais so recursos gramaticais
utilizados por falante e ouvinte com a funo
de negociar os seus papis durante a
interao. Por serem uma particularidade do
sistema lingustico do portugus brasileiro e
seu uso estar mais circunscrito linguagem
falada, as Partculas Modais so uma
categoria escassamente representada em
corpora de grandes dimenses e pouco
estudada, constituindo um rico campo de
pesquisa, sobretudo nos estudos multilngues
uma vez que podem representar um problema
de traduo. Para investigar essa categoria,
foi compilado um corpus paralelo bilngue
portugus brasileiro ingls, formado por
histrias seriadas da Turma da Mnica e suas
respectivas tradues para o ingls. O
objetivo da pesquisa foi identificar quais
Partculas eram utilizadas com mais
frequncia no corpus, como elas foram
traduzidas para o ingls, e se era possvel
verificar um padro para as opes
tradutrias. A metodologia foi dividida em
trs etapas principais: 1) compilao,
preparao e alinhamento do corpus; 2)
busca e extrao das linhas de concordncia
contendo Partculas Modais em portugus
brasileiro e suas tradues para o ingls e 3)
anotao das ocorrncias segundo a descrio
proposta por Figueredo (2011) e com base
em cada opo tradutria verificada. Os

ABSTRACT: This paper reports the main


results of a study on Modal Particles carried
out by the research group Systemic-functional
modeling of translation and multilingual text
production at LETRA/FALE/UFMG. As
defined by Figueredo (2011), Modal Particles
are grammatical resources used by speaker
and listener to negotiate their roles during
their interaction. Due to their unique status as
a grammatical resource in Brazilian
Portuguese and the fact that their use is
mostly confined to spoken language, Modal
Particles
are a
category that
is
underrepresented in large corpora and
scarcely studied, thus constituting a rich field
of research in multilingual studies,
particularly in view of their being a potential
source for translation problems. In order to
investigate this category, a bilingual parallel
corpus was compiled with comic strips from
Turma da Mnica in Brazilian Portuguese
and their translation into English. The aim
was threefold: 1) to identify which Modal
Particles were most frequent in the corpus; 2)
to verify how they were translated into
English and 3) to observe whether translation
patterns can be found.
The analysis
comprised three stages. First, the corpus was
compiled, prepared and aligned; then it was
queried for occurrences of Modal Particles
that were extracted along with their
translations. After that, they were annotated
according to the description on Figueredo
(2011) and based on each translation choice.
Results revealed significant frequencies of
occurrence for some of the Particles as well
as patterns in their translation equivalents in
English.

Universidade Federal de Minas Gerais. apagano@ufmg.br


Universidade Federal de Minas Gerais. arthurdemelosa@gmail.com
***
Universidade Federal de Minas Gerais.kicilaferreguetti@yahoo.com.br
**

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

resultados evidenciaram frequncias de


ocorrncia significativas para algumas das
Partculas encontradas bem como padres
nos equivalentes tradutrios na lngua
inglesa.
PALAVRAS-CHAVE: Estudos da Traduo
baseados em corpus. Corpus Paralelo
Bilngue. Equivalncia tradutria. Partculas
Modais. Lingustica Sistmico-Funcional.

KEYWORDS: Corpus-based Translation


Studies.
Parallel
Bilingual
Corpus.
Translational Equivalence. Modal Particles.
Systemic Functional Linguistics.

1. Introduo
O presente artigo apresenta uma anlise de uma categoria gramatical pouco estudada no
portugus brasileiro 1, tendo como base dados obtidos de um corpus de textos nessa lngua e
seus equivalentes tradutrios numa segunda lngua, neste caso, o ingls. Trata-se das
Partculas Modais utilizadas de maneira geral na interao oral entre falante e ouvinte com a
funo de validar o argumento do falante durante essa interao. As Partculas Modais
representam um desafio para seu estudo, uma vez que demandam a compilao de um corpus
oral, devidamente transcrito de forma a preservar essas construes, o que poderia ser
encontrado em alguns estudos do portugus falado.
Todavia, se desejamos examinar equivalentes tradutrios dessas Partculas numa outra
lngua, passveis de ser obtidos de um corpus paralelo bilngue, o desafio torna-se ainda
maior, haja vista que so escassos os textos orais que so traduzidos para o ingls e
compilados na forma de corpus. A forma encontrada para superar esta limitao foi a
compilao de um corpus de textos escritos do portugus brasileiro, que possuem traduo
publicada em ingls e que pelas caractersticas do discurso histrias em quadrinhos que
visam reproduzir alguns aspectos da oralidade incluem ocorrncias de Partculas Modais. O
corpus compilado uma seleo de histrias em quadrinhos da Turma da Mnica e suas
tradues para o ingls, nas quais temos a encenao de dilogos e narrativas
majoritariamente entre crianas, as quais se valem de Partculas para as diversas funes
interativas.
1

As descries da lngua portuguesa em textos de gramtica publicados no Brasil no contemplam as Partculas


Modais. Apenas Castilho (2010) dedica um captulo de sua gramtica linguagem da conversao e apresenta
uma relao de marcadores discursivos que incluem algumas das realizaes do que se entende neste estudo
por das Partculas Modais. O autor recolhe resultados de estudos anteriores sobre marcadores discursivos,
notadamente em Neves (1999). Cumpre destacar que marcadores discursivos abrangem diversas classes de
palavra e funes assim classificados sob uma perspectiva funcionalista da linguagem, a qual difere da
perspectiva sistmico-funcional aqui adotada.

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

323

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

As Partculas Modais pesquisadas neste corpus so aquelas descritas por Figueredo


(2011) em sua Introduo ao perfil metafuncional do portugus brasileiro e sua descrio
est baseada na teoria sistmico-funcional (HALLIDAY; MATTHIESSEN, 2004;
CAFFAREL; MARTIN; MATTHIESSEN, 2004). O objetivo foi verificar quais Partculas
eram utilizadas com mais frequncia no corpus compilado com histrias seriadas da Turma da
Mnica e como elas foram traduzidas para o ingls, com vistas a examinar como o significado
de Partculas Modais do portugus brasileiro realizado nas tradues em ingls e o qu o
mesmo revela sobre o seu funcionamento.
O estudo das Partculas Modais em portugus brasileiro oferece a oportunidade de se
preencher uma lacuna nos estudos descritivos baseados em corpus, que como foi dito no
contam com corpora com um nmero significativo de ocorrncias dessa categoria gramatical.
Complementando as observaes no corpus monolngue, os equivalentes tradutrios obtidos
de um corpus paralelo bilngue oferecem indcios de como os significados realizados pelas
Partculas Modais podem ser construdos em outras lnguas. Em uma perspectiva aplicada, as
Partculas possuem um grande potencial de pesquisa no campo dos Estudos da Traduo, uma
vez que, por se tratarem de uma particularidade do sistema lingustico do portugus brasileiro,
podem configurar-se como um problema de traduo.
O estudo foi realizado no escopo dos projetos do grupo de pesquisa Modelagem
sistmico-funcional da traduo e da produo textual multilngue, do Laboratrio
Experimental de Traduo (LETRA) da UFMG.
2. Reviso da literatura
De acordo com Caffarel, Martin e Matthiessen (2004), as lnguas possuem um potencial
de significao2 que incorpora trs tipos de significado: o ideacional, o interpessoal e o
textual. Esses significados recebem o nome de metafunes. Assim, a teoria sistmicofuncional considera que as metafunes ideacional, interpessoal e textual so as responsveis
por construir de forma simultnea a mensagem em qualquer texto.
O foco de estudo desta pesquisa a metafuno interpessoal, que como Matthiessen e
Halliday (2009) afirmam, a responsvel pela interao entre falante e ouvinte(s). Ainda de
acordo com os autores, a metafuno interpessoal possui os recursos necessrios para, em

Potencial de significao a traduo adotada por Figueredo (2011) para meaning potential.

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

324

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

uma interao dialgica, realizarem a encenao de papis sociais (de maneira geral) e de
papis discursivos (de maneira especfica) (MATTHIESSEN e HALLIDAY, 2009).
O sistema de

MODO

uma das principais categorias gramaticais da metafuno

interpessoal, e dentro dele, encontra-se um componente especfico: o sistema de

VALIDAO,

que realizado pelas Partculas Modais. Ambos sero detalhados a seguir.


2.1 A metafuno interpessoal
Como definido por Martin e White (2005, p. 7), os recursos interpessoais lidam com a
negociao de relaes sociais: como as pessoas interagem, incluindo os sentimentos que
tentam compartilhar3. Partindo-se desta ideia, a lngua pode ser analisada e descrita com base
nas relaes entre falante e ouvinte, e esta a proposta desta pesquisa: analisar a relao entre
falante e ouvinte por meio da observao das Partculas Modais. Na metafuno interpessoal
encontram-se os sistemas de

MODO

VALIDAO,

assim como os conceitos de funo

discursiva, proposio e proposta, discutidos a seguir.


De acordo com Matthiessen e Halliday (2009):
ao interagir com o outro, o ser humano se insere em uma variedade de
relacionamentos interpessoais, fazendo escolhas entre diferentes estratgias
semnticas, como bajular, persuadir, incitar, solicitar, ordenar, sugerir,
asseverar, insistir, duvidar, etc. A gramtica fornece os recursos bsicos para
a expresso dessas funes discursivas na forma de um conjunto de sistemas
da orao altamente generalizados conhecidos como MODO4.

Dessa maneira, o

MODO

um sistema para a expresso da mensagem que o falante quer

passar. Este faz determinadas escolhas neste sistema e, assim, produz seu discurso por meio
da fala ou da escrita.
Esta pesquisa se detm anlise no estrato da lexicogramtica. O sistema de

MODO

realizado neste nvel semelhante para o portugus brasileiro e para o ingls, sendo realizado
na forma de duas opes principais: indicativo e imperativo. O indicativo, por sua vez, ainda

Nossa traduo para: Interpersonal resources are concerned with negotiating social relations: how people are
interacting, including the feelings they try to share.
4
Nossa traduo para: In interacting with one another, we enter into a range of interpersonal relationships,
choosing among semantic strategies such as cajoling, persuading, enticing, requesting, ordering, suggesting,
asserting, insisting, doubting, and so on. The grammar provides us with the basic resource for expressing these
speech functions, in the form of a highly generalized set of clause systems referred to as MOOD (grifo do
autor).

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

325

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

realizado por duas outras opes: declarativo e interrogativo. Sendo assim, esta pesquisa
baseia sua anlise nessas trs opes iniciais do sistema de

MODO:

imperativo, declarativo e

interrogativo. A Figura 1, adaptada de Matthiessen e Halliday (2009), representa esse sistema.


Dentro da concepo da metafuno interpessoal tambm definido o conceito de
funo discursiva. De acordo com Figueredo (2011, p. 173), so funes semnticas
responsveis pela troca de informao ou de bens-&-servios de um falante que assume
determinado papel na troca. Entende-se, ento, que o falante pode assumir diferentes papis
em uma interao (troca). Nessa troca, o produto pode ser informao ou bens-&-servios.
Quando o produto da troca uma informao, esta troca recebe o nome de proposio, e
quando so bens-&-servios, recebe o nome de proposta (cf. CAFFAREL, MARTIN e
MATTHIESSEN, 2004).

declarativo
TIPO DE

indicativo
interrogativo

MODO
imperativo

Figura 2 Rede do sistema de MODO do portugus brasileiro e do ingls.


Fonte: Traduzida e adaptada de Matthiessen e Halliday (2009).

Figueredo (2011, p. 174) ainda explica que as proposies se caracterizam pela troca
de declaraes e perguntas, enquanto as propostas pela troca de comandos e ofertas. Tem-se
ento uma relao entre esses quatro conceitos:

MODO,

funo discursiva, proposio e

proposta. Sendo assim, as diferentes combinaes de mercadorias e papis formam as quatro


funes discursivas iniciais do portugus brasileiro e do ingls: declarao, pergunta,
comando e oferta; e essas funes discursivas so realizadas prototipicamente por
determinadas opes do sistema de

MODO.

A relao apresentada aqui pode ser melhor

visualizada no Quadro 1, adaptado de Figueredo (2011).

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

326

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Quadro 2 - Relao entre MODO, funo discursiva, proposta e proposio.

Fornecer
Demandar

Informao
[DECLARAO]
proposio
MODO declarativo
[PERGUNTA]
proposio
MODO interrogativo

bens-&-servios
[OFERTA]
proposta
sem MODO especfico
[COMANDO]
proposta
MODO imperativo

Fonte: Adaptado de Figueredo (2011, p. 175)

possvel observar no quadro as quatro funes discursivas iniciais. A primeira a


opo de fornecer informao: uma proposio denominada declarao e realizada por
oraes no modo declarativo. J a segunda a opo de fornecer bens-&-servios: uma
proposta denominada oferta e no realizada por um modo especfico. A terceira, por sua vez,
a opo de demandar informao: uma proposio denominada pergunta e realizada por
oraes no modo interrogativo. A quarta, e ltima, a opo de demandar bens-&-servios:
uma proposta denominada comando e realizada por oraes no modo imperativo.
Esses conceitos e a relao entre eles so relevantes para esta pesquisa, pois muitas
Partculas Modais somente so realizadas em um determinado ambiente do
Partculas so realizadas na orao de forma contnua ao sistema de

MODO

MODO.

Assim, as

e realizam funes

discursivas juntamente com este sistema (cf. FIGUEREDO, 2011, p. 217), como veremos a
seguir.
2.2 O sistema de VALIDAO do portugus brasileiro
Em portugus brasileiro, a metafuno interpessoal tambm apresenta o sistema de
VALIDAO

ilustrado na Figura 2, abaixo. De acordo com Figueredo (2011, p. 218), este

sistema realizado por Partculas Modais e tem a funo de validar as proposies ou


propostas enquanto um argumento da troca. O autor tambm afirma que a principal funo
das Partculas Modais negociar entre os interlocutores o papel do falante em uma
proposio ou proposta a fim de que esta se torne um significado compartilhado na interao
(FIGUEREDO, 2011, p. 220).
Alm disso, o autor argumenta que os resultados da anlise das Partculas Modais em
sua pesquisa demonstram que, em geral, os falantes empregam os recursos deste sistema
quando necessitam que seus interlocutores endossem seu papel de falante na troca
(FIGUEREDO, 2011, p. 221). Dessa forma, o que se percebe que o sistema de

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

VALIDAO

327

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

tem a funo de negociar o papel do falante com relao ao ouvinte, e os papis de ambos
com relao proposio ou proposta.
Ainda segundo o autor:
Na ordem da orao, as Partculas do sistema de VALIDAO encerram duas
funes interpessoais complementares: indicam a forma pela qual a orao
deve ser validada em termos de concordar, assentir, exortar, etc.; e so
retomadas pelo ouvinte como forma de dar continuidade a troca. Em muitos
casos [...] elas respondem sozinhas por um argumento. (FIGUEREDO, 2011,
p. 229)

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

328

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Figura 3 Sistema de VALIDAO


Fonte: Adaptada de Figueredo (2011, p. 234)

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

329

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Portanto, o sistema de VALIDAO tem a funo no s de avaliar os papis do falante e


do ouvinte, mas tambm de, por meio dessa validao, dar continuidade ao discurso, pois
somente mediante a validao do ouvinte que o falante d prosseguimento ao discurso. De
outra forma, caso o ouvinte no valide algum (ou todos) dos papis em questo, h uma
quebra no discurso, dando incio a uma nova troca por parte do prprio ouvinte.
Sabendo que o sistema de
contnua ao

MODO

VALIDAO

atua na construo da mensagem de forma

(FIGUEREDO, 2011, p. 2017), este lhe acrescenta mais um nvel de

delicadeza. Assim, quando o falante constri uma proposta ou proposio e esta apresenta
uma Partcula Modal, h uma seleo primria pelo

TIPO DE MODO,

seguida de uma seleo

secundria de acordo com a categoria de avaliao. Dessa forma, o sistema de


no s influenciado por escolhas feitas no sistema de

MODO,

VALIDAO

mas tambm participa dessas

escolhas.
Por fim, o estudo de Figueredo (2011) ainda define opes mais delicadas do sistema de
VALIDAO

ilustradas na Figura 2 e exemplificadas no Quadro 2 (a seguir) juntamente com as

realizaes de todas as Partculas. Para fins deste artigo, sero enfocadas as Partculas Modais
dos tipos Anuncia e Confirmao. A escolha dessas Partculas foi embasada por testes
estatsticos que revelaram que esses dois tipos foram os nicos que apresentaram relevncia
estatstica na sua traduo; no caso desta pesquisa, apresentaram um valor-p maior que 0,05
portanto, em conformidade com H0 e dentro da rea de no-rejeio da distribuio chiquadrado5.
A Partcula de Anuncia realizada em proposies, que, por sua vez, so realizadas
por oraes declarativas. Figueredo (2011) afirma que:
esta Partcula possui a funo de pedir ao ouvinte que d seu assentimento ao
falante para que a proposio possa se tornar parte do conhecimento
compartilhado entre eles. Neste caso, o ouvinte no precisa,
necessariamente, concordar com a opinio do falante, mas apenas dar seu
aval para que o falante permanea no lugar de avaliador da proposio. (p.
225)

O falante, portanto, pede o aval do ouvinte para que sua proposio seja compartilhada
entre eles, consolidando assim o seu papel na troca. Isso permite que ele prossiga com o
argumento e que o ouvinte permanea nessa posio. Como exemplo, pode-se ver no
5

Os testes estatsticos foram realizados no ambiente de programao R (R CORE TEAM, 2014) e sero
detalhados na seo de metodologia.

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

330

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Exemplo 16 que o falante (CBe) pede ao ouvinte (Zdr) que d o seu aval para que a
proposio seja compartilhada. O ouvinte valida o papel do falante e ainda constri uma nova
proposio complementar do falante, demonstrando que validou o papel de CBe. O contexto
neste exemplo : os dois personagens esto pegando is (um tipo de formiga) para fazer um
prato culinrio. Alguns is escapam, enquanto outros, os machos (bitus), vo atrs destes.
Exemplo 1 Partculas de Anuncia:
CBe Tem uns qui inda iscapa, n, Z?
Zdr ! Com os noivos bitus voando atrs.
No que diz respeito Partcula de Confirmao, Figueredo (2011) argumenta que o uso
dessa Partcula ocorre da seguinte maneira: o ouvinte constri uma proposio ou realiza
uma ao sobre a qual o falante constri uma proposio imaginando que o ouvinte a
compreendeu e ir negoci-la da maneira esperada (FIGUEREDO, 2011, p. 227).
O Exemplo 2 demonstra o uso dessa Partcula em uma situao na qual o ouvinte
construiu uma proposio, que levada em considerao pelo falante da maneira descrita
acima. O contexto a chegada do personagem Fra na base secreta de Nim e DCm. Estes
ltimos questionam como o primeiro encontrou a base, que revela a fonte dessa informao
(Joaquim da padaria). O personagem Nim infere quem havia revelado a Joaquim o local da
base: Mag; e ento produz uma proposio direcionada a Mag, mas que respondida por Fra,
que confirma a inferncia de Nim. Dessa forma, a proposio de Nim negociada da maneira
esperada.
Exemplo 2 Partculas de Confirmao:
Nim Ei! Como voc entrou aqui?
Fra Pela porta.
DCm No! Como achou meu esconderijo?
Fra O Joaquim da padaria me contou.
Nim Padaria, hein?
Mag Glup!
Fra ! Ela deu o endereo pra entrega de quinhentos pezinhos!
O Exemplo 3 demonstra o uso dessa Partcula numa situao na qual o ouvinte realizou
uma ao. Dessa forma, o falante constri sua proposio em relao a esse comportamento, e

Todos os exemplos apresentados ao longo do texto foram extrados do corpus da pesquisa.

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

331

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

espera que o ouvinte a compreenda e negocie da forma esperada. No entanto, o ouvinte no


negocia da forma esperada, empregando uma Partcula (no) na negociao. O contexto aqui
o personagem Pir fugindo do personagem Cas em uma luta com espadas.
Exemplo 3 Partculas de Confirmao:
Cas Fugindo da minha espada, hein?
Pir No! Fugindo do seu cheiro!
importante ainda elucidar que o sistema de

VALIDAO

possui dois tipos de

argumento: inicial e respondente. O argumento inicial aquele no qual o falante requisita por
parte do ouvinte a validao de sua proposio ou proposta. O argumento respondente
aquele no qual o ouvinte faz a sua validao do que foi apresentado pelo falante. O
movimento respondente ainda realizado por duas opes mais delicadas: esperado ou
arbitrrio; pois o ouvinte pode responder conforme o esperado pelo falante, ou pode responder
de forma arbitrria, invalidando a proposio ou proposta do falante. No caso de ofertas,
demandas e perguntas elementais, o argumento respondente pode no apresentar Partculas
Modais. Mesmo assim, nesses casos o ouvinte valida a mensagem do falante ao reagir da
maneira esperada por ele (aceite, obedincia ou resposta), ou ento o ouvinte invalida a
mensagem, ao reagir de maneira arbitrria (rejeio, recusa ou renncia).
3. Metodologia
Para a realizao desta pesquisa, foi compilado um corpus paralelo bilngue
unidirecional (portugus brasileiro ingls) formado por onze histrias seriadas da Turma da
Mnica, criadas por Maurcio de Souza, e suas respectivas tradues para o ingls7. O corpus
constitudo de aproximadamente 38.205 tokens, distribudos conforme a Tabela 1, abaixo.
Para a compilao do corpus, as histrias seriadas da Turma da Mnica foram
transcritas, seguindo alguns critrios previamente definidos, tais como: 1) os personagens so
indicados por siglas referentes aos seus nomes em portugus brasileiro. A mesma sigla foi
utilizada nos textos em ingls, visando facilitar o alinhamento e as buscas no corpus; 2) as
transcries no apresentam itlicos, negritos ou outro tipo de formatao adicional de estilo

Disponvel em: <http://www.monica.com.br/comics/seriadas.htm>. Acesso em 14 de outubro de 2014.


O corpus foi compilado com anuncia dos editores da revista; seu acesso restrito aos pesquisadores do
LETRA/UFMG.

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

332

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

do texto, pois os textos foram compilados em arquivo eletrnico do tipo .txt, que no permite
esse tipo de formatao; 3) aspas, parnteses, vrgulas e reticncias foram removidos, pois
podem causar conflitos quando o texto submetido a algum software para a anlise do
corpus; e 4) foram mantidas as letras maisculas de nomes prprios aps ponto final, ponto de
interrogao, ponto de exclamao, e no incio de cada sentena. Ao final do processo de
transcrio e obedecida a padronizao exemplificada acima, as compilaes em ambas as
lnguas foram armazenadas em arquivos eletrnicos de texto com a extenso .txt.

portugus
Ingls
Total

Total

Superparque

Romeu e Julieta

Que furada de reportagem!

Ou ns acabamos com as
formigas...

Os doze trabalhos da
Mnica

O unicrnio

Mnica e os brbaros

Horacic Park

Comandante gancho

Coelhada nas estrelas

Batmenino? Eternamente

Tabela 4
Composio do corpus em nmero de tokens

1730 908 570 1096 2803 1446 1536 1707 3112 3275 734 18917
1857 947 597 1057 2987 1507 1540 1673 3181 3181 761 19288
3587 1855 1167 2153 5790 2953 3076 3380 6293 6456 1495 38205

Aps a transcrio, as compilaes nas duas lnguas foram alinhadas no nvel da


sentena, utilizando o software ParaConc (Barlow, 2012). A Figura 3 ilustra esta etapa.
A busca por Partculas Modais foi feita com o auxlio da ferramenta de pesquisa do
ParaConc, tomando o portugus brasileiro como ponto de partida e baseada no Quadro 2
abaixo, proposto por Figueredo (2011), onde o autor lista as Partculas Modais observadas em
sua pesquisa.

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

333

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Figura 4 Captura de tela do ParaConc: Alinhamento.


Quadro 3 - Partculas Modais de acordo com Figueredo (2011).

Ambiente para as partculas


orientao
Funo
ambiente
do
e
MODO
mercadoria

Partculas Modais
Inicial
Respondente
esperada
arbitrria

ATENO

fornecer
informao

Declarao:
indicativo
declarativo

ANUNCIA
CONCORDNCIA
INSISTNCIA

tch, u,
s, p

ah, ; ah,
t; t

ENTENDIMENTO
CONFIRMAO

hein,

EXCLAMAO

Pergunta
Polar:
indicativo
CONFIRMAO
interrogativo
Pergunta
EXORTAO
Elemental:
responder
indicativo
interrogativo
DESAFIO
Comando:
EXORTAO
imperativo
obedecer

no
n no
no
no s;
no u;
no tch

ah

viu
t (curto),

---

no
t (longo)

---

---

, s, tch

no

tch, s,
p, hein

resposta

renncia

s, tch,
p

obedincia

recusa

s
bah, n,
oxe, p,
tch, etc.

EMPATIA

demandar
bens-e-

u, uai,
ah
viu, visse

CONCLUSO

demandar
informao

n
t

---

p/

p/

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

334

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

servios

ATENUAO

p/

obedecer
Fornecer
bens-eservios

Oferta: imperativo
ATENUAO
ou
indicativo
aceitar
interrogativo

p/

a, aqui

obedincia

recusa

tch, s,
a, aqui

aceite

rejeio

Fonte: Figueredo (2011, p. 222).

Essa busca no corpus gerou listas de concordncia por meio das quais foi possvel
classificar os itens lexicais como Partculas Modais ou no. Os itens identificados com funo
de Partcula foram ainda classificados segundo os nveis mais delicados do sistema de
VALIDAO,

enquanto os itens identificados com outras funes no foram analisados mais

profundamente, sendo assim descartados.


importante mencionar que, de acordo com Figueredo (2011), a diferena entre
algumas Partculas, como o caso de t (longo) e t (curto), prosdica, sendo passvel de
ser observada pela extenso da slaba tnica. Essa diferena pode ser percebida em textos
orais transcritos com essa anotao; porm, a menos que haja uma diferenciao grfica para
essa extenso da slaba tnica, ela impossvel de ser observada em textos escritos, como o
caso do presente corpus, composto por textos escritos que no apresentam essa diferenciao
grfica. No presente estudo, optou-se pela busca de ocorrncias de t em geral e uma vez
localizadas, proceder-se a sua anlise numa tentativa de categorizao delas como Partcula de
Confirmao em um argumento respondente, isto , como t (curto) e t (longo).
Esse tipo de anlise foi possvel graas ao princpio da agnao, que, segundo Figueredo
(2011, p. 85), significa trabalhar tanto com as realizaes, quanto com outras possveis
realizaes para um mesmo elemento. Ainda de acordo com o autor,
constitui-se como um princpio analtico a utilizao de acrscimos,
substituies e subtrao de itens e funes; a inverso da estrutura que as
realiza; e a possibilidade de expanso ou retrao dos termos do sistema para
determinada funo, observando sempre as mudanas no registro. Tais
exerccios de possibilidade so adotados como critrio para se entender
quais os itens que compem um determinado sistema e os que compem
sistemas diferentes. (FIGUEREDO, 2011, p. 85)

Como ilustrao desse princpio, observa-se o item n no Exemplo 4 a seguir.


Exemplo 4 Partcula de Anuncia:
Mon Hum, voc no me trouxe aqui s pra no apanhar, n?
Ceb E-eu? Clalo que no.

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

335

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

possvel classificar o n como uma Partcula de Anuncia comparando-o com outros


tipos agnatos de Partcula, por exemplo: de Entendimento e de Concordncia, que tambm
realizam funo discursivo-funcional: de verificao: de papel: neutra como pode ser
observado na Figura 2. Isso porque se pode fazer a substituio do n pelas realizaes dos
outros tipos de Partcula, por exemplo: 1) pela de Entendimento viu: voc no me trouxe
aqui s pra no apanhar, viu; e 2) pela de Concordncia t: voc no me trouxe aqui s pra
no apanhar, t.
Com essa substituio, verifica-se que mantido o contraste na delicadeza entre esses
trs tipos de Partcula, pois cada uma realiza uma funo diferente na orao. Alm disso,
tambm observa-se que o contraste mantido em relao s Partculas de Insistncia (e.g. p),
de Confirmao (e.g. s) e de Concluso (e.g. uai), pois estas realizam funo discursivofuncional: de verificao: de papel: tendenciosa na orao (cf. Figura 2). Dessa forma, ao
substituir o n por outros itens com outras funes, possvel classific-lo como uma
Partcula de Anuncia, pois os contrastes com as outras opes neutras e com as opes
tendenciosas dentro do sistema de TIPO DE PAPEL so mantidos.
Aps a obteno e extrao das ocorrncias das Partculas Modais e suas tradues,
estas foram arquivadas no formato .txt e passou-se sua anlise propriamente. Para isso,
foram estabelecidos alguns parmetros e utilizadas algumas ferramentas, ambos apresentados
a seguir.
Primeiramente, foi feita a anlise quantitativa utilizando o ambiente de programao R
(R CORE TEAM, 2014), com base nos dados extrados pelo ParaConc, que possibilitou
observar o nmero total de ocorrncias de cada item lexical pesquisado nos textos em
portugus brasileiro. Esses itens foram ento analisados individualmente, para verificar se
eram ou no uma Partcula. Foi ento feita uma comparao entre o nmero de ocorrncias
totais do item lexical e o nmero de vezes em que ele usado como Partcula. Com isso, foi
feito o clculo da frequncia relativa entre as ocorrncias totais dos itens e as ocorrncias de
Partculas. Como exemplo, o item lexical no ocorreu 432 vezes; desse total, somente duas
ocorrncias configuram Partculas Modais; isso representa uma frequncia relativa de 0,46%,
na qual, dentre todas as ocorrncias de no, somente 0,46% so Partculas Modais.
Alm disso, cada item lexical foi analisado qualitativamente com o objetivo de definir
quais tipos de Partcula Modal eram realizados por eles. Esta anlise teve como base o

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

336

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Sistema de

VALIDAO

do portugus brasileiro proposto por Figueredo (2011), ilustrado pela

Figura 2 anteriormente. Caso os itens lexicais se tratassem de Partculas Modais, eles eram
anotados, de acordo com as opes mais delicadas do sistema, como Anuncia ou
Confirmao, por exemplo. Para a realizao desta etapa de anotao semiautomtica, foi
usado o software UAM Corpus Tool (ODonnell, 2014).
No que diz respeito s tradues das Partculas Modais para o portugus, cada
ocorrncia foi anotada manualmente segundo a opo tradutria, visando observar como foi
realizada a traduo de cada Partcula. Cada opo tradutria foi quantificada, possibilitando a
investigao de padres nas realizaes dos itens em ingls.
Por fim, os dados foram analisados estatisticamente (cf. GRIES, 2013) no ambiente de
programao R (R Core Team, 2014). Os testes utilizados foram o teste exato de Fisher para a
comparao de propores e o teste chi-quadrado para a verificao da distribuio dos dados
e da igualdade de propores.
Para o teste exato de Fisher, a hiptese nula de que as propores so iguais entre os
itens com observaes positivas e negativas da varivel, e a hiptese alternativa de que essas
propores so diferentes. Por exemplo: a hiptese nula sugere que as propores so iguais
entre 1) o item n com funo de Partcula e com outra funo e 2) o item com funo de
Partcula e com outra funo, enquanto a alternativa sugere que essas propores so
diferentes.
Para o teste de aderncia chi-quadrado, a hiptese nula de que a amostra (neste caso as
ocorrncias de Partculas Modais nos textos selecionados) se encontra numa distribuio chiquadrado, e que, portanto, a populao (isto , as ocorrncias de Partculas no portugus
brasileiro) possui o mesmo comportamento, enquanto a hiptese alternativa de que a
amostra no se encontra nessa distribuio, e consequentemente a populao se comporta de
maneira diferente. Por exemplo: segundo a hiptese nula, a populao se comporta da mesma
forma que a amostra de Partculas Modais encontradas no corpus, mas, segundo a hiptese
alternativa, a populao se comporta de maneira diferente.
Alm disso, o teste chi-quadrado pode ser aplicado somente aos itens da pesquisa de
forma independente com o objetivo de testar a igualdade entre as propores das observaes
das variveis. A hiptese nula assume que as propores entre as observaes so iguais,
enquanto a alternativa, que as propores so diferentes. Por exemplo: as propores de

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

337

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

ocorrncias de n com funo de Partcula Modal e com outras funes podem ser iguais (H0)
ou diferentes (HA).
Primeiramente, foram aplicados os testes s propores entre os itens lexicais em
portugus brasileiro e os que podiam ser considerados Partculas Modais. E em uma segunda
etapa, foram aplicados testes s propores entre as Partculas e seus equivalentes tradutrios.
Os resultados da pesquisa so apresentados a seguir.
3. Resultados
3.1 Anlise das ocorrncias dos itens lexicais em portugus brasileiro
A Tabela 2 mostra: na primeira coluna, os itens lexicais encontrados no corpus (e.g. n,
u, bah, etc.); na segunda, o total de ocorrncias desses itens lexicais; na terceira, o nmero de
ocorrncias do item com funo de Partcula Modal; e na ltima coluna, a frequncia relativa
entre o total de ocorrncias do item lexical no corpus e as ocorrncias que realizam funo de
Partcula.
TABELA 5.
Total de ocorrncias, total de Partculas e frequncia relativa.

Item lexical
n
u
bah
uai
ah,

hein
ah
t
a

no
aqui
viu
n
s
Totais

Total de ocorrncias
19
8
5
3
6
10
30
120
56
49
488
432
68
11
3
2
1310

Funo de Partcula
19
8
5
3
3
4
9
22
7
6
5
2
0
0
0
0
93

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

Frequncia Relativa
100%
100%
100%
100%
50%
40%
30%
18,3%
12,5%
12,2%
1,02%
0,46%
0%
0%
0%
0%
7,10%

338

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Ao todo, foram encontradas 1310 ocorrncias dos itens lexicais pesquisados no corpus.
Porm, somente 93 dessas ocorrncias realizam a funo de Partculas Modais, e os itens que
realizam essa funo so: n, u, bah, uai, ah, , , hein, ah, t, a, , no, aqui, viu, n e s.
Alm disso, os tipos de Partcula Modal verificados no corpus so: Anuncia, Confirmao,
Exclamao, Concluso, Atenuao, Ateno, Concordncia e Exortao, sendo as suas
respectivas ocorrncias no corpus: 21, 18, 38, 3, 5, 5, 3 e 1.
importante mencionar que neste corpus no foram encontradas Partculas Modais com
funo de Insistncia, Entendimento, Empatia, Desafio, Exortao (para obedecer) e
Atenuao (para aceitar).
O teste utilizado para a verificao da distribuio dos dados e validao das
probabilidades (teste chi-quadrado) evidenciou que os itens lexicais uai, ah, , hein, ah, t, a,
, no, aqui, viu, n e s apresentaram valor-p inferior a 0,05, indicando que todos
encontram-se na rea de rejeio de H0. Dessa forma, maior a probabilidade de esses itens
terem uma proporo diferente da populao (i.e. as ocorrncias de Partculas no portugus
brasileiro), e, por isso, provavelmente eles se comportam de maneira diferente.
J para os itens n, u, bah e , o teste de aderncia chi-quadrado no rejeitou a hiptese
nula de que esses dados (as ocorrncias dos itens lexicais n, u, bah e no corpus) estavam
dentro da distribuio chi-quadrado, e, portanto, a populao (todas as ocorrncias dos itens
lexicais n, u, bah e no portugus brasileiro) teria um comportamento semelhante.
possvel observar na Tabela 2 que todas as ocorrncias dos itens lexicais n, u e bah
neste corpus tm a funo de Partcula Modal. Para estes trs itens o resultado do valor-p no
teste estatstico igual a 1, o que demonstra uma probabilidade alta de a populao tambm
ter o mesmo comportamento: realizar somente a funo de Partcula Modal. Os Exemplos 5, 6
e 7 ilustram os usos dessas Partculas.
Exemplo 5 Partcula de Anuncia:
Vam Legal quando o cliente fica contente, n?
Pen E ainda nos elogia!
Exemplo 6 Partcula de Exclamao:
Mag Eu sou contra qualquer casamento secreto!
Mon U! Por que?
Exemplo 7 Partcula de Exclamao:
Cas Desgraa pouca bobagem.
Ceb Bah! Detesto ditados.

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

339

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Observa-se ainda na Tabela 2 que o item lexical ocorre dez vezes neste corpus. No
entanto, somente em quatro ocorrncias ele possui a funo de Partcula. Em todas as outras,
o item tem a funo de um Adjunto que acompanha o Vocativo, como em Fiz exatamente
como pediu, Zeus. O Exemplo 8 ilustra o uso do como Partcula Modal:
Exemplo 8 Partcula de Ateno:
CBe Si bem qui o corno dele mais parece um sorvete na testa.
PZe Bobagem! Ele um unicrnio igualzinho ao do livro, !
No caso desse item, o valor-p resultado do teste estatstico igual a 0,1088.
Considerando que o valor de utilizado foi 0,05, o teste revela que tambm neste caso o item
se encontra dentro da rea de no-rejeio da distribuio chi-quadrado. Assim, embora a
probabilidade de a populao se comportar da mesma forma seja menor, ainda vlido
afirmar que o item possui uma probabilidade de 40% de realizar a funo de Partcula
Modal no portugus brasileiro.
Cabe ainda uma importante observao sobre o item ah, . Como possvel observar na
Tabela 2, ele ocorre seis vezes no corpus, sendo trs dessas ocorrncias de Partculas; mais
especificamente, os trs casos so de Partculas Modais de Exclamao. O Exemplo 9 ilustra
o uso de ah, com funo de Partcula.
Exemplo 9 Partcula de Exclamao:
Her No sou sua av!
Mon Ah, ! Desculpe, vodrasta!
Nos outros trs casos de ah, os itens provavelmente tratam-se de Partculas Modais,
porm, a anlise de Figueredo (2011) no contempla essas construes, as quais
aparentemente seriam uma outra opo do sistema, diferente das descritas por ele. A anlise
desses itens, apresentados nos Exemplos 10, 11 e 12, revela que os trs so encontrados antes
de propostas nos Exemplos 10 e 11 precedem uma demanda de informao, e no Exemplo
12, uma demanda de bens-&-servios. Observa-se tambm que o falante constri sua proposta
baseado na fala do ouvinte, utilizando a Partcula ah, para se opor ao ouvinte. Assim, o
falante aparentemente espera que o ouvinte valide seu papel como contrrio. Dessa forma,
possvel afirmar que, nestes casos, o item ah, se trata de uma Partcula Modal com a funo

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

340

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

de Oposio. Ainda assim, seria necessria uma pesquisa mais aprofundada sobre esse item
para confirmar essa hiptese, pois somente foram encontradas trs ocorrncias de ah, com
essa provvel funo.
Os trs exemplos apresentados a seguir demonstram todos os usos do item ah, com a
possvel funo de Partcula de Oposio. Para o Exemplo 10, o contexto um dilogo entre
os personagens Mon e Dar, no qual o primeiro interrogado pelo segundo sobre a localizao
de uma base rebelde.
Exemplo 10 Partcula de Oposio:
Mon Devolve meu coelhinho, lorde Feio!
Dar Primeiro conta onde fica a base rebelde!
Mon Eu no sei!
Dar Ah, ? No vai falar, gorducha?
Mon Como que ?
Dar Igor vai obrig-la a falar.
Para o Exemplo 11, o contexto uma luta entre os personagens Mon e Had. Aps
derrotar os guardas de Had, Mon tenta atac-lo:
Exemplo 11 Partcula de Oposio:
Mon E agora voc, seu feioso!
Had Ah, ? Pensa que pode comigo?
E para o Exemplo 12, o contexto um dilogo entre o personagem Tit e Ceb, sendo que
este ltimo participa de um jogo de bolas-de-gude e o primeiro aparece em cena, interrompe o
jogo e faz um pronunciamento:
Exemplo 12 Partcula de Oposio:
Tit Por ordem de sua alteza, o prncipe Xaveco, ficam todos avisados que esto
proibidas as brigas e duelos entre inimigos. E quem perturbar a paz ser
severamente castigado!
Ceb Ah, ? Ento sai da, que voc est atlapalhando o jogo!
Na seo seguinte, sero examinados os equivalentes tradutrios em ingls para as
Partculas encontradas no corpus.

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

341

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

3.2 Anlise da traduo das partculas modais


Nesta etapa da anlise, foi observado como cada Partcula foi traduzida para o ingls, e
quantificada cada uma das opes tradutrias. Tambm foi investigada a existncia de
padres na traduo de algumas Partculas, sendo que apenas as de Anuncia e de
Confirmao (em declaraes) apresentaram padres estatisticamente relevantes para as suas
tradues.
Esta seo apresenta os resultados da anlise da traduo das Partculas Modais
encontradas neste corpus, comeando pela traduo das Partculas de Anuncia.
TABELA 6.
Traduo das Partculas de Anuncia.

Partcula de
Anuncia
n

no

Item em ingls

(tag question)
Huh
Right
Eh
(no realizado)
Yep
No
Totais

Total de ocorrncias do item Total de ocorrncias


em ingls traduzindo essa
do item em ingls
Partcula
no corpus
7
9
4
21
4
46
2
8
2
NA
1
6
1
133
21
223

Comeando pela Partcula n, possvel observar na Tabela 3 que ela traduzida como
uma tag question sete vezes, como huh e right quatro vezes, como eh duas vezes e houve a
no-realizao em outras duas ocasies. As Partculas e no foram traduzidas como yep e
no, respectivamente e somente uma vez cada.
A Partcula de Anuncia n foi traduzida sete vezes como uma tag question. Isso pode
ser considerado um padro na traduo deste item, o que reforado pelo valor-p (0,6171) do
teste chi-quadrado para este item, que maior que o valor de (0,05) e, por isso, encontra-se
na rea de no rejeio da distribuio. Ainda, o princpio da agnao permitiu notar que na
traduo para o ingls, o texto alvo apresenta uma pequena mudana na prosdia. Enquanto a
entonao prototpica de uma tag question semelhante de uma pergunta polar, a sentena
que contm essa traduo apresenta uma entonao semelhante de declaraes. Isto , as tag
questions das tradues de n no so um estmulo resposta, mas um convite do falante para

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

342

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

que o ouvinte valide sua proposio. O Exemplo 13 exemplifica o uso dessa Partcula e sua
traduo para o ingls como tag question.
Exemplo 13 Traduo da Partcula de Anuncia n:
Zeu Hera espero que tenha aprendido a sua lio! Voc no ganha nada sendo
to violenta! E voc Mnica tambm aprendeu uma lio, n?
Mon Claro! De hoje em diante vou ser mais cuidadosa!
__________________
Zeu I hope you learned your lesson Hera! You gain nothing by being violent! And
you learned a lesson too, didnt you, Monica?
Mon Yes! From now on Ill be more careful!
Na Tabela 3 tambm possvel observar que a Partcula n foi traduzida como huh e
right, cada uma em quatro ocasies. No entanto, o teste estatstico revela que estes itens se
encontram na rea de rejeio, pois o valor-p menor que o de : 0,0006739 e 2,855e-09,
respectivamente. Dessa forma, no possvel afirmar que a traduo de n como huh e right
se configura como um padro, dado que provvel que a populao se comporte de maneira
diferente.
A Partcula n ainda foi traduzida como eh duas vezes. As duas ocorrncias desse item
permitem dizer que este seja outro padro na traduo de n. O teste chi-quadrado para este
item revela que o valor-p (0,05778) pouco maior que o de (0,05). Embora seja um
resultado limtrofe, ainda possvel afirmar que a populao se comporta da mesma forma,
porm espera-se que a frequncia seja menor em relao traduo de n como tag question.
O Exemplo 14 apresenta a traduo de n como eh.
Exemplo 14 Traduo da Partcula de Anuncia n:
Mon Pronto pessoal! Caso resolvido! s aliment-lo uma vez ao dia!
Ps2 Tudo graas a voc, Mnica!
Ceb O Com a minha assistncia, clalo!
Mon Em vez de s falar bem que voc podia ajudar mesmo, n, Cebolinha?
__________________
Mon There people! Case solved! Just feed him once a day!
Ps2 Its all thanks to you, Monica!
Ceb With my help, of couwse!
Mon Instead of just yakking you could actually help me, eh, Jimmy?
Houve, ainda, dois casos de no realizao. Em um dos casos, a sentena no texto fonte
se tratava de uma declarao, com a Partcula realizada no fim da orao. No texto alvo, a

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

343

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

estrutura da sentena muda, passando a ser uma pergunta polar. Esse caso demonstrado pelo
Exemplo 15. O contexto o desembarque de uma caixa grande por dois entregadores, sendo
que um deles, En2, ao desembarcar a caixa, deixa-a cair em cima do outro entregador; a caixa
uma encomenda para Mau.
Exemplo 15 Traduo da Partcula de Anuncia n:
En2 No estragou nada, n?
Mau No! T tudo aqui. Desde a primeira arte original do Horcio at a ltima.
__________________
En2 Everything okay?
Mau Yes! It's all here. From the very first drawings of Horacio to the last.
possvel observar que no texto fonte o personagem En2 faz uma declarao no
estragou nada e pede que o ouvinte valide essa declarao n?. No texto alvo, o falante faz
uma pergunta para o ouvinte, e exige dele uma resposta. A agnao mostra ainda que a
pergunta em ingls possui uma entonao semelhante s tradues de n para tag questions.
Dessa forma, a traduo para o ingls mantm o convite validao do falante, porm, na
forma prosdica somente. Assim, quando o ouvinte responde Yes e completa its all here,
ele est validando o papel de En2 e sua proposio.
O Exemplo 16 mostra o outro caso em que houve uma no-realizao na traduo de
n. O contexto aqui a personagem Mon procurando pelo personagem Sebolak. Ao encontrar
o personagem Cebolinha preso em uma masmorra, Mon fica surpresa.
Exemplo 16 Traduo da Partcula de Anuncia n:
Mon Oh! Cebolinha! Ento foi aqui que voc se escondeu, n, moleque?
__________________
Mon Oh! Jimmy Five! So this is where you came to hide, you scamp!
Neste caso, a agnao permitiu verificar que o significado de n realizado na forma de
prosdia no texto alvo, com um prolongamento das vogais, de forma que o falante negocia
no somente a mensagem, mas tambm seu posicionamento como falante. Assim, o ouvinte
deve validar esse posicionamento.
Como o nmero de ocorrncias da traduo como no realizado pequeno, no
possvel afirmar que este seja o padro neste corpus. Alm disso, como a no-realizao na
traduo para o ingls no envolve um item lexical, no possvel fazer a contagem das
ocorrncias nos textos em ingls. Dessa forma, cada ocorrncia de no-realizao deve ser

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

344

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

considerada como nica, no sendo possvel, no escopo desta pesquisa, fazer uma anlise
mais aprofundada desse item ou uma modelagem estatstica.
Por fim, tem-se as tradues das Partculas e no. Estas Partculas esto presentes no
corpus em movimentos respondentes, mais especificamente, como um movimento
respondente esperado e um arbitrrio, para e no, respectivamente. Por isso, a traduo
tambm segue esses movimentos, sendo traduzida como yep para o movimento esperado, e
como no para o arbitrrio. Como essas Partculas e suas tradues somente ocorrem uma vez
no corpus, no possvel fazer afirmaes sobre o padro nas tradues desses itens.
O prximo tipo de Partcula Modal abordado o de Confirmao. De acordo com
Figueredo (2011), este tipo de Partcula pode ser encontrado em declaraes ou em perguntas
polares. Neste artigo so apresentados somente os dados da anlise de declaraes.
A traduo das Partculas Modais de Confirmao em sentenas declarativas pode ser
vista na Tabela 4. Nota-se que houve quatro no-realizaes na traduo da Partcula hein,
duas tradues para eh, e duas para huh. A Partcula t (longo) foi traduzida duas vezes como
okay e duas como yeh. Alm disso, foi traduzido como huh e yes uma vez cada, e no
tambm foi traduzido somente uma vez como no.
TABELA 7.
Traduo das Partculas de Confirmao (em declaraes).

Partcula de Confirmao
Total de ocorrncias do item Total de ocorrncias
Item em ingls
(em declaraes)
traduzindo essa Partcula
do item em ingls
(no realizado)
4
NA
Hein
eh
2
8
huh
2
21
t (longo)
okay
2
45
yeh
2
3

huh
1
21
yes
1
44
No
no
1
133
Totais
15
275
Na Tabela acima, observa-se a ocorrncia de quatro no-realizaes na traduo de
hein. Novamente, como no caso das tradues da Partcula de Anuncia n, os casos de norealizao do item em ingls devem ser tratados como ocorrncias nicas, no sendo possvel
uma anlise mais aprofundada ou um tratamento estatstico.

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

345

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

A Partcula de Confirmao hein foi tambm traduzida como eh em duas ocasies. O


teste chi-quadrado revela que o valor-p para esses dados (0,05778) maior que o valor de
(0,05). Ainda que seja um valor limtrofe, possvel afirmar que a populao se comporta de
forma semelhante. Sendo assim, pode-se considerar que o padro da traduo de hein neste
corpus eh. O Exemplo 17 ilustra esse caso.
Exemplo 17 Traduo da Partcula de Confirmao hein:
Ceb Mas voc bem pesadinha, hein?
__________________
Ceb But youre pretty heavy, eh?
As demais Partculas de Confirmao no apresentam um padro em sua traduo,
sendo isso revelado pelo teste chi-quadrado que revela valores-p menores que o de (0,05)
para esses itens ou uma ocorrncia muito baixa para a realizao do teste (como o caso da
Partcula t (longo) e sua traduo como yeh).
4. Discusso dos resultados e concluso
Foram encontradas ao todo 1310 ocorrncias dos itens lexicais pesquisados no corpus,
mas somente 93 dessas ocorrncias realizam a funo de Partculas Modais. Os itens que
realizam funo de Partcula Modal so: n, u, bah, uai, ah, , , hein, ah, t, a, , no, aqui,
viu, n e s. Os tipos de Partcula Modal verificados no corpus so: Anuncia, Confirmao,
Exclamao, Concluso, Atenuao, Ateno, Concordncia e Exortao.
A anlise dos textos na lngua fonte portugus brasileiro revelam um padro na
realizao das Partculas de Anuncia n, de Exclamao u e bah, e de Ateno . A anlise
estatstica desses itens revelou que esses itens se encontram na rea de no-rejeio da
hiptese nula da distribuio chi-quadrado e, por isso, provvel que, na populao (no
portugus brasileiro), as Partculas do mesmo tipo sejam realizadas pelos mesmos itens
lexicais.
Alm disso, a caracterizao das Partculas de Oposio configura-se como uma
importante contribuio desta pesquisa. No entanto, como se trata de somente trs
ocorrncias, um estudo com um corpus maior poderia revelar se a populao tambm se
comporta da mesma maneira, havendo assim um novo tipo de Partcula Modal em portugus
brasileiro.

Adriana Silvina Pagano, Arthur de Melo S, Kcila Ferreguetti; p. 322-348.

346

LETRAS & LETRAS


( http://www.seer.ufu.br/index.php/letraseletras) - v. 30, n. 2 (jul/dez. 2014) - ISSN 1981-5239

Em relao aos outros tipos de Partculas Modais encontrados no corpus (Confirmao,


Concluso, Atenuao, Concordncia e Exortao) o tratamento estatstico dos dados revelou
que, para os itens que as realizam, a hiptese nula deve ser rejeitada. Dessa forma, deve-se
assumir a hiptese alternativa de que a populao se comporta de maneira diferente. Tambm
possvel afirmar que a quantidade de ocorrncias para essas Partculas Modais foi pequena,
e que os dados observados so justamente os que se encontram na rea de rejeio. Sendo
assim, uma pesquisa que envolva um corpus maior poderia revelar com maior preciso a
relao entre os itens lexicai