Você está na página 1de 30

COPA-TRAD

UM CONJUNTO DE FERRAMENTAS PARA A PESQUISA, ENSINO E PRÁTICA DA TRADUÇÃO


Lincoln P. Fernandes
Rossana da Cunha Silva
Carlos Eduardo da Silva
Estrutura geral do minicurso
Primeiro encontro (26 / 05 / 2015)

1. Objetivos.
2. O que é corpus?
3. Tipologia de corpus.
4. Critérios de classificação de corpora.
5. Considerações para a criação de um corpus.
6. O conceito de webcorpus.
7. Tipologia de textos.
8. Tipos de aplicabilidade: pesquisa,ensino e prática da tradução.
9. Apresentação dos corpora online gratuitos mais conhecidos.
Estrutura geral do minicurso
Segundo encontro

1. Apresentação da ferramenta com exemplo prático da aplicabilidade para:


a. Ensino.
b. Pesquisa.
c. Tradução.
2. Prática com os corpora online gratuitos mais conhecidos.
3. Apresentação do COPA-TRAD o que é igual e diferente dos outros?
a. Pesquisa: O uso do COPA-TRAD para a terminologia.
b. Ensino: O uso do COPA-TRAD na formação de tradutores.
c. Tradução: O uso do COPA-TRAD na resolução de problemas tradutórios.
Objetivos

● Apresentar conceitos fundamentais de Estudos da Tradução com base


em Corpus (ETC) para contextualizar os ouvintes nas ferramentas de
corpora propostas;

● Demonstrar as vantagens na utilização de ferramentas ETC para obter


suporte empírico para a pesquisa, prática e ensino de tradução.
O que é corpus (pl. corpora)?
Uma coleção de textos armazenada em formato eletrônico e que possa
ser analisada semi ou automaticamente de diversas formas, cuja
amostragem seja representativa para o fenômeno tradutório em análise
(BAKER, 1995, p.225; FERNANDES, 2008, p.89).
Tipologia de um corpus

Corpora comparável
Consiste de duas coleções de textos na mesma língua.

Textos originais Traduções na


na Língua A Língua A
Tipologia de um corpus

Corpora Paralelo
Consiste de uma coleção de textos em uma língua A alinhados às suas
traduções em uma língua B.

Textos originais Traduções na


na Língua A Língua B
Tipologia de um corpus

Corpora Multilíngue
Consiste de uma conjunto de dois ou mais corpora monolíngues em
diferentes línguas, construídos nas mesmas ou diferentes instituições, e
utilizando o mesmo critério de seleção de textos.

Textos originais Traduções na Textos originais Traduções na


na Língua A Língua A na Língua B Língua B
Critérios de classificação de corpora
Considerações para a criação de um
corpus
● O que é um corpus vs. um não corpus: mitos e verdades.
● Objetivo e metodologia da pesquisa que será aplicada ao corpus.
● Escolha do tipo de corpus.
● Escolha dos textos.
○ Copyright.
○ Tipos de textos (gêneros) e domínio.
○ Muitos textos é sinônimo de sucesso em uma pesquisa?
○ O dilema da rotulação (tagging/labelling) de textos.
● Balanceamento ou equilíbrio de um corpus.
● Ferramentas de processamento e análise.
● Apresentação dos resultados.
O conceito de webcorpus

● Consideramos um web corpus como uma coleção estática de textos


baixados da Internet (SHAFER & BILDHAUER, 2013).

● O que é um corpus com base na web e o que é um software de corpus


com base na web? (LUZ, 2011).

● O conceito de webcorpus não é muito claro por ser amplo demais.

● Corpus na Nuvem ou Cloud Corpus. (SILVA - pesquisa de doutorado


em andamento).
Tipologia de textos

● Características ou elementos específicos utilizado na organização de


um texto.
○ Os elementos textuais e paratextuais.
○ Critérios específicos da pesquisa para classificar o texto. Por
exemplo, textos de diferentes gêneros que apresentam um mesmo
padrão linguístico.
● Estrutura textual:
○ texto.
○ bitexto.
● A questão de dados não estruturados, semi-estruturados e
estruturados.
Tipos de aplicabilidade
Como as ferramentas com base em corpus podem ajudar no
ensino, pesquisa e tradução?

Corpora eletrônicos podem ser aplicados na formação de tradutores, na


prática tradutória e na pesquisa em Estudos da Tradução:

● Na identificação de estratégias e soluções adotadas por tradutores


profissionais;

● Na investigação de artifícios e características estilísticas de autores


e tradutores.
Outros exemplos de como as ferramentas
podem ajudar
● Auxiliando os alunos na busca por soluções de
problemas que surgem tipicamente em textos
traduzidos;
● Na pesquisa sobre padrões de tradução;
● Na extração de termos para a terminologia e
lexicografia;
● No fornecimento de dados empíricos para tradução
automatizada com base em corpus.
Corpora disponíveis online
Alguns dos corpora paralelos que estão disponíveis
gratuitamente pela internet tem como par linguístico o
português e o inglês:

● COMPARA;
● CorTrad;
● OPUS CORPUS;
● COPA-TRAD
COMPARA
Corpus paralelo bidirecional de português e inglês (2011)
O projeto COMPARA teve início em 1999 dentro do Linguateca (financiado
pelo governo português desde maio de 2000) e utiliza o sistema DISPARA
(DIStribuição de corpora PARAlelos na web).
CorTrad
Corpus paralelo de tradução - 2009

Parte do projeto CoMET – Corpus Multilíngue para ensino e tradução, desenvolvido


dentro da USP. O projeto CoMET é composto de três corpora: (i) CorTrad (Corpora
de tradução); (ii) CoMAprend (Corpus de aprendizes); (iii) CorTec (Corpus técnico).
OPUS CORPUS
Corpus paralelo de software livre (2012)

O principal objetivo do OPUS é proporcionar um conjunto de dados que


estejam disponíveis gratuitamente pela internet.
COPA-TRAD
Corpus paralelo de tradução (2011)
Desenvolvido por Silva (2013) no âmbito da Universidade Federal de Santa Catarina
(UFSC) a partir da tese de doutorado de Fernandes (2004, p.74). Atualmente é mantido
por Fernandes, L.P.; Silva, C.E. e Silva, R.C..
Principais características do COPA-TRAD

Consiste de CINCO subcorpora:

● Literatura Infantojuvenil;
● Textos clássicos da literatura;
● Textos teóricos sobre tradução;
● Resumos de trabalhos acadêmicos;
● Textos jurídicos.
Principais características do COPA-TRAD

E as ferramentas de busca:

● Concordanciador Bilíngue;
● Concordanciador Monolíngue;
● Wordlist;
● Ferramenta de criação Do-It-Yourself.

Esta ferramenta permite que o usuário crie seu próprio


corpus e o analise semi ou automaticamente.
COPA-CONC

Ferramenta capaz de exibir todas as


ocorrências de uma palavra, frase ou
qualquer outro elemento de um texto-
fonte alinhadas lado a lado com sua
tradução.
MONO-CONC

Ferramenta capaz de exibir todas as


ocorrências de uma palavra, frase ou
qualquer outro elemento dos textos
que compõem os subcorpora do
COPA-TRAD.
WORDLIST

Ferramenta capaz de exibir em


ordem alfabética as palavras mais
frequentes do COPA-TRAD.
COPA-STATS
Ferramenta responsável por manter
toda a parte de dados quantitativos de todo o corpus.
CORPUS-BUILDER

Ferramenta capaz de criar


um corpus paralelo
descartável e realizar buscas
em seu concordanciador
paralelo.
Considerações finais

A relevância do conjunto de ferramentas disponibilizadas pelo COPA-TRAD, vem a


facilitar o uso de ferramentas com base em corpus.

Acredita-se ainda que o sistema em questão torne-se futuramente indispensável para


seus usuários, à medida que seu uso seja divulgado e disseminado, principalmente, pelo
mundo acadêmico. (SILVA, R.C., Em andamento)
Referências
BAKER, M.. Corpora in Translation Studies. An Overview and Suggestions for Future Research.
Target, n. 7, v.2, p. 223-243, 1995.
BAKER, M. In Other Words: A Coursebook on Translation. Disponível em: http://books.google.com.
br/books?isbn=1136839720, 2011.
FERNANDES, L.P. Corpora in Translation Studies: revisiting Baker’s typology. 2008.
FERNANDES, L. P. & Silva, C. E. COPA-TRAD (Corpus Paralelo de Tradução). Disponível em: <http:
//copa-trad.ufsc.br>, 2014.
LUZ, S.. ‘Web-based Corpus Software’ in A. Kruger, K. Wallmachand J. Munday (eds) Corpus-Based
Translation Studies: Research and Applications, Londres: Continuum, 2011.
SCHOEPPING, G. (2012). Um estudo exploratório a partir de um framework para seleção de
práticas ágeis. Disponível em: https://repositorio.ufsc.br/handle/123456789/100449, 2012.
SILVA, C. E.. Developing online parallel corpus-based processing tools for translation research
and pedagogy. Programa de Pós-Graduação em Inglês, UFSC, Florianópolis, 2013.
Referências
SILVA, C. E.. Utilização de técnicas de mineração de textos em corpora paralelo para auxílio na
pesquisa acadêmica em estudos da tradução: um estudo de caso. Pós-graduação em Engenharia
e Projetos de Software, UNISUL, Florianópolis, 2014.
SILVA, C.E.. Corpus Mining a New Method for the Study of Translation. Programa de Pós-
Graduação em Inglês, UFSC, Florianópolis, Em andamento.
SILVA, R.C.; PEREIRA, C.M. Using corpora as a tool for solving IT challenges in translation.
Apresentação durante a disciplina de Estudos da Tradução com base em Corpus - Programa de Pós-
Graduação em Inglês, UFSC, Florianópolis, 2014.
SILVA, R.C.; Investigação de um sistema com base em corpus: uma abordagem ergonômica e
de usabilidade. Programa de Pós-Graduação em Estudos da Tradução, UFSC, Florianópolis, Em
andamento.
Lincoln P. Fernandes - lico.fernandes@gmail.com

Rossana da Cunha Silva - rossanacs@gmail.com

Carlos Eduardo da Silva - carlosedasilva@gmail.com

Você também pode gostar