Você está na página 1de 110

UNIVERSIDADE PAULISTA

O USO DE PHRASAL VERBS NA COMUNICAO INFORMAL POR E-MAIL: UMA ANLISE SOB A PERSPECTIVA DA LINGUSTICA DE CORPUS

JULIANA GRANDOLFO RA:0900319 LUCILENE DA SILVA LEITE R.A: 0902780

CAMPINAS 2011

UNIVERSIDADE PAULISTA

JULIANA GRANDOLFO LUCILENE DA SILVA LEITE

O USO DE PHRASAL VERBS NA COMUNICAO INFORMAL POR E-MAIL: UMA ANLISE SOB A PERSPECTIVA DA LINGUSTICA DE CORPUS

Trabalho de Concluso de Curso Graduao Licenciatura em Letras, Lngua Portuguesa e Lngua Inglesa, apresentado comisso julgadora da Universidade Paulista, UNIP sob a orientao da Professora Cntia Yokota.

CAMPINAS 2011

GRANDOLFO, Juliana; LEITE, Lucilene da Silva O uso de Phrasal Verbs na Comunicao Informal por E-mail: Uma Anlise sob a Perspectiva da Lingustica de Corpus / Juliana Grandolfo e Lucilene da Silva Leite: orientadora Prof Cntia Yokota -- Campinas, 2011. 110p. Trabalho de Concluso de Curso Instituto de Cincias Sociais e Comunicao da Universidade Paulista UNIP. 1. O uso de Phrasal Verbs na Comunicao Informal por E-mail: Uma Anlise sob a Perspectiva da Lingustica de Corpus.

BANCA EXAMINADORA

_________________________________________________

_________________________________________________

_________________________________________________

CAMPINAS 2011

Dedicamos este trabalho a todos os professores que passaram por nossas vidas e nos ensinaram muito do que sabemos e do que somos hoje.

Agradecemos aos nossos amigos americanos que colaboraram com esta pesquisa, dedicando um pouco de seu tempo para responder aos e-mails, em especial a Jan, que foi sempre muito atenciosa conosco e preocupada com o resultado de nossa empreitada. Agradecemos tambm nossa orientadora Cntia Yokota pela ateno com que respondeu nossas dvidas e acompanhou o desenvolvimento de nosso trabalho. E por ltimo, agradecemos a todos os profissionais que tem se dedicado s pesquisas na rea de Lingustica de Corpus, em especial aos pesquisadores do LAEL PUCSP, que nos proporcionaram uma excelente bibliografia para a realizao desta pesquisa.

"A parte que ignoramos muito maior que tudo quanto sabemos. Plato "S sabemos com exatido quando sabemos pouco, medida que vamos adquirindo conhecimentos, instala-se a dvida." Johann Goethe

SUMRIO LISTA DE TABELAS ............................................................................................ 10 LISTA DE GRFICOS .......................................................................................... 11 LISTA DE FIGURAS ............................................................................................ 11 RESUMO.............................................................................................................. 13 ABSTRACT .......................................................................................................... 14 INTRODUO ..................................................................................................... 15 1. FUNDAMENTAO TERICA ..................................................................... 17 1.1. Lingustica de Corpus.............................................................................. 17 Definio ........................................................................................... 17 Breve Histrico ................................................................................. 19 Classificao dos Corpora ................................................................ 21 Principais reas de Pesquisa ........................................................... 24 Ferramentas Computacionais ........................................................... 25 Consideraes Finais ....................................................................... 28

1.1.1 1.1.2. 1.1.3 1.1.4 1.1.5 1.1.6 1.2

Phrasal Verbs .......................................................................................... 28 Definio ........................................................................................... 28 Breve Histrico.................................................................................. 30 Aspectos sintticos e semnticos dos Phrasal Verbs ....................... 33 Consideraes Finais ....................................................................... 34

1.2.1 1.2.2. 1.2.3 1.2.4 1.3 2

A Lingustica de Corpus e os Phrasal Verbs ............................................ 35

METODOLOGIA ............................................................................................ 37 2.1 2.2 2.3 Objetivos e Questionamentos ................................................................. 37 Coleta e Construo do Corpus .............................................................. 38 Softwares utilizados na pesquisa ............................................................ 42 AntConc: Software para Anlise de Corpus ..................................... 43

2.3.1

2.3.2 2.4 2.5 3

CLAWS : Etiquetador Morfossinttico para Textos em Ingls .......... 54

Corpus de Referncia ............................................................................. 59 Procedimentos para Levantamento das Estatsticas do Corpus ............. 63

APRESENTAO E ANLISE DOS RESULTADOS .................................... 68 3.1 3.2 Estatsticas dos Corpora ......................................................................... 68 Anlise dos Padres de Concordncias dos Termos Selecionados ....... 73 Padres do phrasal verb go out ........................................................ 75 Padres do phrasal verb be out ........................................................ 77 Padres do phrasal verb look for ...................................................... 78 Padres do phrasal verb go on ......................................................... 81 Padres do phrasal verb work on ..................................................... 83 Padres do phrasal verb come back................................................. 85 Padres do phrasal verb find out ...................................................... 87 Padres do phrasal verb get out ....................................................... 88 Padres do phrasal verb go back ..................................................... 90

3.2.1 3.2.2 3.2.3 3.2.4 3.2.5 3.2.6 3.2.7 3.2.8 3.2.9

3.2.10 Os padres mais comuns dos phrasal verbs no corpus de estudo ... 91 3.3 Atividades Propostas............................................................................... 92 Atividade 1 ........................................................................................ 93 Atividade 2 ........................................................................................ 95 Atividade 3 ........................................................................................ 98

3.3.1 3.3.2 3.3.3

CONSIDERAES FINAIS ............................................................................... 100 REFERNCIAS BIBLIOGRFICAS ................................................................... 102 ANEXOS ............................................................................................................ 105 Anexo 1 : Relao das 100 Palavras mais frequentes no Corpus de Estudo . 105 Anexo 2: Relao dos 193 diferentes Phrasal Verbs encontrados no Corpus de Estudo, classificados pelo nmero de ocorrncias (frequncia) ..................... 108

LISTA DE TABELAS Tabela 1: Classificao de Tamanho de um Corpus (BERBER SARDINHA, 2004)...................................................................................................................... 19 Tabela 2 Conjunto Mnimo de Etiquetas segundo o Eagles (BERBER SARDINHA, 2004, p. 151)..................................................................................... 28 Tabela 3 Total de Tokens (palavras) e Types (formas) do Corpus da pesquisa................................................................................................................. 40 Tabela 4 Classificao do Corpus analisado na Pesquisa conforme critrios listados por Berber Sardinha (2004)..................................................................... 40 Tabela Tabela 5 6 Critrios Relao Iniciais de para a compilao do do corpus padro de C5 estudo.................................................................................................................... 41 Etiquetas CLAWS4, Tagset................................................................................................................... 58 Tabela 7 Relao de Phrasal Verbs mais frequentes no corpus de estudo................................................................................................................... 70 Tabela 8 Relao de Phrasal Verbs mais frequentes no corpus de estudo por ordem de frequncia no corpus de referncia..................................................... 71 Tabela 9 Normalizao: Relao dos Phrasal Verbs mais frequentes do corpus de estudo x a proporo desses no corpus de referncia................................... 72 Tabela Tabela Tabela Tabela Tabela Tabela Tabela 10 11 12 13 14 15 16 Padres Padres Padres Padres Padres Padres Padres do do do do do do do phrasal phrasal phrasal phrasal phrasal phrasal phrasal verb verb verb verb verb verb verb GO GO BE BE LOOK LOOK GO OUT OUT OUT OUT FOR FOR ON no no no no no no no Corpus Corpus Corpus Corpus Corpus Corpus Corpus de de de de de de de Estudo.................................................................................................................. 75 Referncia........................................................................................................... 76 Estudo.................................................................................................................. 76 Referncia............................................................................................................ 77 Estudo................................................................................................................... 78 Referncia............................................................................................................. 78 Estudo.................................................................................................................. 80

Tabela Tabela Tabela

17 18 19

Padres Padres Padres

do do do

phrasal phrasal phrasal

verb verb verb

GO WORK WORK

ON ON ON

no no no

Corpus Corpus Corpus

de de de

Referncia............................................................................................................ 81 Estudo................................................................................................................... 82 Referncia............................................................................................................ 83 Tabela 20 Padres do phrasal verb COME BACK no Corpus de Estudo................................................................................................................. Referncia........................................................................................................... Tabela Tabela Tabela Tabela Tabela 22 23 24 25 26 Padres Padres Padres Padres Padres do do do do do phrasal phrasal phrasal phrasal phrasal verb verb verb verb verb FIND FIND GET GET GO OUT OUT OUT OUT BACK no no no no no Corpus Corpus Corpus Corpus Corpus Estudo................................................................................................................. Referncia.......................................................................................................... Estudo................................................................................................................ Referncia.......................................................................................................... 84 84 de 85 de 85 de 86 de 86 de 90 Tabela 21 Padres do phrasal verb COME BACK no Corpus de

Estudo.................................................................................................................. 88 Tabela 27 Padres do phrasal verb GO BACK no Corpus de Referncia...... Tabela 28 Padres tiveram taxas prximas de ocorrncias em ambos os corpora.................................................................................................................. 92 LISTA DE GRFICOS Grfico 1 Total de Phrasal Verbs x Verbos Comuns no Corpus de Estudo...... 70

LISTA DE FIGURAS Figura 1 Endereo do Site para download do Programa AntConc.................... 44 Figura 2 Janela Inicial do Programa AntConc 3.2.3 para Windows.................. 44 Figura 3 Como abrir um arquivo para gerar uma lista de palavras.................... 45 Figura 4 Arquivo aberto no AntConc ................................................................. 46

Figura 5 WordList gerada no AntConc............................................................... 46 Figura 6 Exemplo de concordncia utilizando a preposio / advrbio ON....... 48 Figura 7 Concordncia da preposio / advrbio ON (Opo Save Window)... 48 Figura 8 File View, apresentao do texto completo......................................... 49 Figura 9 Ferramenta Concordance Plot ........................................................... 50 Figura 10 Clusters, palavras que se agrupam com a preposio ON ............. 50 Figura 11 Collocates, palavras que aparecem ao lado da preposio ON...... 51 Figura 12 Selecionando o Corpus de Referncia Criando uma KeyWord List .............................................................................................................................. 52 Figura 13 Criando uma KeyWord List no AntConc............................................ 53 Figura 14 Salvando lista de palavras-chave gerada no AntConc...................... 53 Figura 15 Pgina do CLAWS 4, verso gratuita online..................................... 56 Figura 16 Pgina do CLAWS 4 com o resultado da etiquetagem do Corpus.... 57 Figura 17 Pgina Inicial do Corpus of Contemporary American English........... 60 Figura 18 Exemplo de busca de Palavras/Termos no Corpus de Referncia.. 62 Figura 19 Visualizao dos Contextos em que a Palavra / Termo est inserido .............................................................................................................................. 62 Figura 20 Lista de Concordncias das Etiquetas VB*, VD*, VM0, VH* e VV*.. 65 Figura 21 Tela das Opes Avanadas de Busca no AntConc........................ 65 Figura 22 Salvando as Linhas de Concordncia, geradas pelo AntConc......... 67 Figura 23 Tela do Excel com a relao de Phrasal Verbs do Corpus............. 67 Figura 24 Ferramenta Concordance, busca avanada.................................... 73 Figura 25 Ferramenta Concordance, com a busca do phrasal verb GO OUT .............................................................................................................................. 74 Figura 26 Ferramenta Cluster, Lista de Palavras que se agrupam com o phrasal verb GO OUT....................................................................................................... 74 Figura 27 Exemplo de busca pelo Termo Looking for + ponto final................... 79 Figura 28 Busca pelo Termo Look for + Pronomes Pessoais........................... 80 Figura 29 Busca pelo Termo What`s going on + ?............................................ 82 Figura 30 Busca pelo Termo Working on + ING Verb....................................... 83 Figura 31 Busca pelo Termo get [*p] out of.................................................... 87

RESUMO Considerando que os phrasal verbs apresentam-se como padres que ocorrem com certa probabilidade na lngua inglesa e que esses padres so caractersticas do discurso informal, e levando em conta a fundamental importncia que as ferramentas de comunicao disponveis na Internet possuem na sociedade atual, nosso trabalho teve como objetivo identificar os phrasal verbs mais frequentes do gnero e-mail informal, bem como os principais padres lxico-gramaticais com os quais so encontrados dentro de textos desse mesmo gnero. Para realizarmos essa pesquisa, utilizamos duas coletneas de e-mails: (1) e-mails trocados pelas pesquisadoras entre junho e outubro de 2011 com um grupo de americanos (falantes nativos) e (2) e-mails extrados do romance E Squared de Matt Beaumont, uma histria totalmente contada atravs de uma sucesso de e-mails informais, mensagens de textos (SMS) e mensagens em blogs. Para tanto, o presente trabalho buscou suporte terico na Lingustica de Corpus, que definida por Berber Sardinha (2004) como uma rea da lingustica que trata da coleta e da explorao de corpora, ou conjunto de dados lingusticos textuais coletados criteriosamente, com o propsito de servirem para a pesquisa de uma lngua ou variedade lingustica. Para a comparao dos padres encontrados em nosso corpus de estudo (as duas coletneas de e-mails), precisamos utilizar um corpus de referncia. Como no existe um corpus de referncia especfico para o gnero e-mail, optamos pelo gnero Spoken (falado) do Corpus of Contemporary American English (CoCa), com 85 milhes de palavras. A partir dessa anlise, verificamos que os phrasal verbs so utilizados na comunicao informal escrita (por e-mail), tanto quanto so utilizados na comunicao informal oral (falada), alm de seguirem padres lxico-gramaticais semelhantes, visto que a caracterstica que iguala as duas modalidades de comunicao, escrita e falada, o fato de ambas serem utilizadas no discurso informal. Palavras-Chave: phrasal verbs, comunicao informal por e-mail e lingustica de corpus.

ABSTRACT

Whereas the phrasal verbs are presented as patterns that occur with a certain probability in the English language and these patterns are characteristic of informal speech, and taking into account the fundamental importance of the communication tools available on the Internet have for the current society, our research aimed to identify the most common phrasal verbs in informal e-mails, as well as major lexical-grammatical patterns with which they are found in texts of that genre. To accomplish this research, we use two collections of e-mails: (1) emails exchanged by the researchers between June and October 2011 with a group of Americans (native speakers) and (2) e-mails extracted from the novel wrote by Matt Beaumont E Squared, a story told entirely through a series of informal emails, text messages (SMS) and blogs. Thus, the present study sought theoretical support in Corpus Linguistics, which is defined by Berber Sardinha (2004) as an area of linguistics that deals with the collection and exploitation of corpora, linguistic or textual data set collected carefully, in order to serve for the detection of a language or language variety. To compare the patterns found in our corpus of study (two collections of e-mails), we use a reference corpus. As there is no specific reference corpus for genre e-mail, we chose the genre (spoken) of the Corpus of Contemporary American English (Coca), with 85 million words. From this analysis, we found that phrasal verbs are used in informal written communication (by email) as well as are used in informal oral (spoken) communication, and follow similar lexical-grammatical patterns, because of the characteristic that equals the two types of communication, written and spoken, is the fact that both are used in informal speech. Key-Words: Phrasal Verbs, Informal Communication by E-mail and Corpus Linguistics.

15

INTRODUO

Com a crescente importncia da lngua inglesa no mundo globalizado, e a dependncia cada vez maior dos meios de comunicao, com destaque para a Internet, os professores de ingls tm sido cada vez mais exigidos por seus alunos, que precisam com urgncia de uma boa fluncia na lngua inglesa para conseguirem se comunicar com colegas de trabalho e amigos (falantes nativos) de diferentes pases, muitas vezes, utilizando as ferramentas disponveis na Internet para realizar tal comunicao. Percebendo tal necessidade que os aprendizes possuem de adquirir bom nvel de fluncia, tanto oral quanto escrita, e considerando que os phrasal verbs apresentam-se como: (1) padres que ocorrem com certa probabilidade na linguagem e (2) padres que so caractersticas do discurso informal, inclusive, sabendo da importncia histrica deles na lngua inglesa, o presente trabalho teve como objetivo, mapear a frequncia desses elementos lingusticos dentro do corpus de mensagens eletrnicas (e-mails) informais. O Email um gnero textual que se popularizou com o advento da Internet e que est muito presente em nosso dia a dia, tanto na vida pessoal como na profissional. No h meios de imaginar a comunicao escrita na sociedade contempornea sem a presena desta importante ferramenta. Para tanto, optou-se por realizar a presente anlise sob a perspectiva da Lingustica de Corpus, rea de estudo que, conforme definio de Berber Sardinha (2004), trata da coleta e da explorao de corpora, ou conjunto de dados lingusticos textuais coletados criteriosamente, com o propsito de servirem para a pesquisa de uma lngua ou variedade lingustica. O corpus de estudo foi gerado a partir de duas fontes distintas: (1) mensagens eletrnicas trocadas com um grupo de americanos nativos e (2) mensagens eletrnicas extradas do livro E Squared (2009) do britnico Matt Beaumont , uma histria totalmente contada atravs de uma sucesso de e-mails que circulam pela rede corporativa de uma empresa de publicidade, bem como emails pessoais de alguns personagens. O livro ainda inclui algumas conversas em formato de mensagens de textos (SMS) enviadas por celular e mensagens em

16

blogs, porm, como o foco do trabalho a anlise do gnero e-mail, as conversas em blogs e mensagens de textos foram desconsideradas. A presente pesquisa foi realizada em trs etapas, sendo que cada etapa originou cada um dos captulos do trabalho, conforme descrito a seguir: No Captulo 1 foram apresentadas as reas de estudo que forneceram embasamento terico pesquisa. O captulo foi dividido em trs sees: primeiramente falou-se sobre a Lingustica de Corpus; em um segundo momento, sobre os Phrasal Verbs; e por ltimo, ao final do captulo, a relao entre ambos os assuntos foi estabelecida. No Captulo 2 foi apresentada a metodologia utilizada para a realizao da pesquisa. O captulo foi dividido em cinco sees: primeiramente foram esclarecidos os objetivos do estudo e levantados os questionamentos da pesquisa; na sequncia mostrou-se como foi realizada a escolha do corpus a ser analisado, sua coleta e construo; posteriormente foram apresentados os softwares utilizados durante a pesquisa, com destaque para o concordanciador e listador de palavras AntConc e o etiquetador CLAWS 4. Por ltimo, o Corpus de Referncia foi escolhido, e tambm, foram descritos os procedimentos utilizados para levantamento das estatsticas do corpus. Finalmente, no Captulo 3, foram apresentados os resultados da anlise realizada nos dois corpora - de estudo e de referncia, e tambm respondidos aos questionamentos da pesquisa. O captulo foi dividido em trs sees: a primeira seo mostrou as estatsticas gerais dos dois corpora; em um segundo momento, as anlises dos padres encontrados para os phrasal verbs mais frequentes foram apresentadas; e por ltimo, foram sugeridas trs propostas de atividades em sala de aula baseadas nos resultados da pesquisa.

17

1.

FUNDAMENTAO TERICA

Este Captulo apresenta as reas de estudo que forneceram embasamento terico nossa pesquisa. Primeiramente trataremos da Lingustica de Corpus, que se baseia na viso probabilstica da linguagem e dedica-se explorao desta atravs de evidncias empricas. Em um segundo momento, estudaremos os Phrasal Verbs, locues verbais da lngua inglesa compostas de um verbo e uma preposio ou um advrbio. E por ltimo, ao final do captulo, a relao entre ambos os assuntos ser estabelecida. 1.1. Lingustica de Corpus

1.1.1 Definio Segundo Berber Sardinha (2004), a Lingustica de Corpus uma rea da lingustica que trata da coleta e da explorao de corpora, ou conjunto de dados lingusticos textuais coletados criteriosamente, com o propsito de servirem para a pesquisa de uma lngua ou variedade lingustica, dedicando-se explorao da linguagem atravs de evidncias empricas, extradas por meio de computador. O estudo de corpora (plural de corpus) vem se mostrando muito vantajoso para a pesquisa lingustica, conforme afirma Trask (2004, citado por Alusio e Barcellos Almeida, 2006, p. 3): Em vez de consultar nossas intuies, ou de extrair informaes dos falantes, penosamente, uma a uma, podemos examinar um vasto material que foi produzido espontaneamente na fala ou na escrita das pessoas (corpus oral ou corpus textual), e, portanto podemos fazer observaes precisas sobre o real comportamento lingustico de gente real. Sendo assim, os corpora podem nos proporcionar informaes altamente confiveis e isentas de opinies e de julgamentos prvios, sobre os fatos de uma lngua. Considerando a definio acima, e de acordo com Berber Sardinha (2004), a Lingustica de Corpus vista como um sistema probabilstico, o que significa que a lngua vista mais como uma questo de probabilidade que de possibilidade, ou seja, embora os traos lingusticos sejam possveis teoricamente, na prtica eles no ocorrem com a mesma frequncia, o que existe uma correlao entre as caractersticas lingusticas e situacionais.

18

Os cinco aspectos presentes em um corpus, que tornam sua anlise lingustica diferente de outros mtodos, so apontados por Sinclair (1991, citado por Ferreira, 2008, p. 24): 1. Os dados so autnticos. 2. Os dados no so pr-selecionados segundo critrios preestabelecidos pela pessoa que os analisa. 3. H grande quantidade de dados. 4. Os dados esto sistematicamente organizados. 5. Os dados no so classificados conforme as teorias tradicionais, ou seja, bloqueando a descoberta de novos aspectos da linguagem. Refletindo sobre o terceiro aspecto, que um corpus possui uma grande quantidade de dados, Berber Sardinha (2004) afirma que a extenso de um corpus abrange trs dimenses: o nmero de palavras, o nmero de textos e o nmero de gneros, registros ou tipos textuais. Com base no nmero de palavras, Berber Sardinha (2004) apresenta a seguinte classificao de tamanho:

Tamanho em Palavras Menos de 80 mil 80 a 250 mil 250 mil a 1 milho 1 milho a 10 milhes 10 milhes ou mais

Classificao Pequeno Pequeno-Mdio Mdio Mdio-Grande Grande

Tabela 1: Classificao de Tamanho de um Corpus (BERBER SARDINHA, 2004, p. 26)

19

Alm da classificao do corpus por tamanho, algumas caractersticas da Lingustica de Corpus so apresentadas por Leech (1992, citado por Ferreira, 2008, p. 26): 1. Falsificabilidade: um modelo baseado em corpus pode ser testado em novas amostras de outro corpus. 2. Completude: Inclui todos os dados do corpus sem prvia seleo. 3. Simplicidade: a Lingustica de Corpus contabiliza os dados do corpus com um conjunto mais parcimonioso de conceitos sobre o domnio em investigao. 4. Fora: a Lingustica de Corpus se limita aos dados que esto presentes no modelo, excluindo os dados que intuitivamente deveriam figurar no corpus, mas que no esto presentes. 5. Objetividade: os modelos podem ser replicados e testados por observadores ou pesquisadores independentes, inclusive por aqueles que no tm nenhuma ligao emocional com o sucesso ou o fracasso do modelo. No h espao para o subjetivismo na Lingustica de Corpus.

1.1.2. Breve Histrico Atualmente os dados lingusticos coletados so extrados por meio do computador, porm importante observar que nem sempre foi assim. Berber Sardinha (2000) faz algumas consideraes interessantes sobre a evoluo da Lingustica de Corpus ao longo da histria:
Havia corpora antes do computador, j que o sentido original da palavra corpus corpo, conjunto de documentos (conforme o dicionrio Aurlio). Na Grcia Antiga, Alexandre o Grande definiu o Corpus Helenstico. Na Antiguidade e Idade Mdia, produziam-se corpora de citaes da Bblia. Em 1897, Kading utilizou um corpus de 11 milhes de palavras para analisar a frequncia e a sequncia da distribuio das letras do alemo. Para realizar tal tarefa, Kading precisou de 5 mil analistas.

A respeito dessa evoluo, Granger (1998, citado por Berber Sardinha, 2000), relata que durante boa parte do sculo XX houve muitos pesquisadores

20

que se dedicaram descrio da linguagem por meio de corpora, porm h duas diferenas fundamentais entre esta poca e a atual. A primeira, que os corpora no eram eletrnicos, ou seja, todo o trabalho de coleta e anlise era realizado manualmente. A segunda que a nfase destes trabalhos era em geral o ensino de lnguas, sendo que atualmente temos a predominncia da descrio da linguagem. Contudo importante observar que recentemente tem ressurgido um interesse no emprego de corpora na sala-de-aula, com o objetivo de melhorar o sistema de ensino-aprendizagem de uma determinada lngua. Berber Sardinha (2000) ainda lembra que um trabalho fenomenal, considerando os recursos limitados da poca, foi a identificao das palavras mais frequentes da lngua inglesa, feita por Thorndike h mais de 75 anos atrs. Sardinha nos conta que o levantamento de Thorndike foi feito manualmente em um corpus de 4,5 milhes de palavras, e, quando publicado, trouxe mudanas significativas no ensino de lngua inglesa e lngua estrangeira, tanto nos Estados Unidos quanto na Europa. Pouco mais de duas dcadas depois, Thorndike revisou seu levantamento inicial utilizando um corpus de 18 milhes de palavras, e como resultado, publicou uma obra listando as 30 mil palavras mais comuns da lngua inglesa. Aps essa publicao, no ano de 1953, veio o General Service List of English Words escrito por Michael West, que provavelmente a mais famosa descrio do lxico ingls pr-computador. A pesquisa de Michael West apresenta uma lista das 2 mil palavras mais frequentes do ingls, e baseou-se no trabalho de pioneiros como Thorndike. Um bom exemplo de abordagens de ensino que foram inspiradas em estudos e pesquisas como o de Thorndike, ainda lembrado por Sardinha, so as abordagens de ensino de lnguas voltadas para o controle do vocabulrio, nas quais os alunos tm contato em primeiro lugar com as palavras mais frequentes da lngua. O advento do computador mudou este quadro. Como descrito por Berber Sardinha (2000): Nos anos 60, os computadores mainframe passaram a equipar centros de pesquisa universitrios e foram sendo aproveitados para a pesquisa em linguagem. Com a popularizao dos computadores, possibilitou-se o acesso de mais pesquisadores ao processamento de linguagem natural, e concomitantemente, a sofisticao do equipamento permitiria a consecuo de tarefas mais complexas, mais eficientemente, sem falar no aumento da capacidade de armazenamento e na introduo de novas mdias, as quais

21

facilitaram a criao e manuteno de corpora em maior nmero. Com a entrada em cena dos microcomputadores pessoais (Personal Computers), nos anos 80, uma nova onda de mudanas viria a acontecer, com a popularizao de corpora e de ferramentas de processamento, o que contribui decisivamente para o reaparecimento e fortalecimento da pesquisa lingustica baseada em corpus. O primeiro corpus lingustico eletrnico, lanado em 1964, o corpus Brown, da Brown University dos Estados Unidos, continha uma quantidade considervel de dados para a poca: um milho de palavras. H 47 anos as dificuldades de informatizar os de textos eram muito grandes. Para se ter uma ideia da dificuldade, os textos tiveram que ser transferidos para o computador por meio de cartes, perfurados um a um, tal era a tecnologia da poca. Os padres de tamanho de corpora mudaram nestes 47 anos. Atualmente existem corpora de mais de 300 milhes de palavras (Bank of English), um dos corpus mais influentes possui 100 milhes de palavras (BNC), e o corpus que servir de referncia para este trabalho Corpus of Contemporary American English (COCA) possui atualmente 425 milhes de palavras. 1.1.3 Classificao dos Corpora Os corpora podem ser classificados normalmente de acordo com seu contedo e propsito, mas existem outras nomenclaturas utilizadas para tal classificao. Os tipos principais citados na literatura so apresentados abaixo, agrupados segundo alguns critrios, conforme explica Berber Sardinha (2004): Modo
1. Falado: Composto de pores de fala transcritas. 2. Escrito: Composto de textos escritos, impressos ou no.

Tempo
1. Sincrnico: Compreende um perodo de tempo. 2. Diacrnico: Compreende vrios perodos de tempo. 3. Contemporneo: Representa o perodo de tempo corrente. 4. Histrico: Representa um perodo de tempo passado.

22

Seleo 1. De amostragem (sample corpus): Composto por pores de textos ou de variedades textuais, planejado para ser uma amostra finita da linguagem como um todo. 2. Monitor: A composio reciclada para refletir o estado atual de uma lngua. Ope-se a corpora de amostragem. 3. Dinmico ou orgnico: O crescimento e diminuio so permitidos, qualifica o corpus monitor. 4. Esttico: Oposto de dinmico, caracteriza o corpus de amostragem. 5. Equilibrado (balanced): Os componentes (gneros, textos, etc.) so distribudos em quantidades semelhantes (por exemplo, mesmo nmero de textos por gnero).

Contedo
1. Especializado: Os textos so de tipos especficos (em geral gneros ou

registros definidos).
2. Regional ou dialetal: Os textos so provenientes de uma ou mais

variedades sociolingusticas especficas.


3. Multilngue: Inclui idiomas diferentes.

Autoria 1. De aprendiz: Os autores dos textos no so falantes nativos. 2. De lngua nativa: Os autores so falantes nativos.

Disposio interna 1. Paralelo: Os textos so comparveis (p.ex. original e traduo). 2. Alinhado: As tradues aparecem abaixo de cada linha do original.

Finalidade
1. De estudo: O corpus que se pretende descrever. 2. De referncia: Usado para fins de contraste com o corpus de estudo.

23

3. De treinamento ou teste: Construdo para permitir o desenvolvimento de

aplicaes e ferramentas de anlise. Alm dos critrios acima, Berber Sardinha (2004) prope alguns outros meios para a classificao dos corpora segundo sua composio: 1. Pluralidade de autoria: Os textos foram produzidos por um autor apenas ou mais? 2. Origem da autoria: Os textos foram produzidos por falantes nativos ou no-nativos? 3. Meio: Os textos foram escritos ou falados? 4. Integralidade: Os elementos do corpus so textos integrais ou fragmentos? 5. Especificidade: O corpus composto de tipos variados de texto ou textos especficos? 6. Dialeto: As variedades presentes no corpus so do tipo padro ou regionais / dialetais? 7. Equilbrio: As variedades do corpus so distribudas equitativamente ou no? 8. Fechamento: permitida a incluso de contedos novos ou no? 9. Renovao: O contedo do corpus reflete um perodo definitivo de tempo ou se renova? 10. Temporalidade: O corpus planejado para retratar perodos histricos de tempo ou no? 11. Plurilingusmo: O corpus possui s textos originais ou tambm as tradues destes textos para uma ou mais lnguas? 12. Intercalao: As tradues dos textos so incorporadas a cada linha do texto original ou vm em textos separados?

24

1.1.4 Principais reas de Pesquisa Segundo Kennedy (1991, citado por Berber Sardinha, 2000), as pesquisas em Lingustica de Corpus concentram-se em quatro reas principais: 1. Compilao de corpus; 2. Desenvolvimento de ferramentas para anlise de corpora; 3. Descrio da linguagem; 4. Aplicao de corpora (ensino-aprendizagem de lnguas, processamento de linguagem natural por mquinas, reconhecimento de voz, traduo, etc.). A rea da descrio a rea que escolhemos para nossa pesquisa, e a rea que com certeza tem mais trabalhos publicados. H um nmero grande de trabalhos que privilegiam principalmente o lxico e a gramtica a partir da anlise de um corpus. Estes trabalhos se ocupam do que Kennedy (1991, p.98, citado por Berber Sardinha, 2000) chama de ecologia lingustica, isto , do comportamento de itens lexicais ou de estruturas gramaticais no seu habitat natural (o meio lingustico que ocorrem). De acordo com Hoey (1997, citado por Berber Sardinha, 2000), as questes que os pesquisadores da rea da descrio procuram responder so basicamente as seguintes: 1. Quais os padres lexicais dos quais a palavra faz parte? 2. A palavra se associa regularmente com outros sentidos especficos? 3. Em quais estruturas ela aparece? 4. H uma correlao entre o uso/sentido da palavra e as estruturas das quais ela participa? 5. A palavra est associada com uma certa posio na organizao textual? Os questionamentos acima so aqueles levantados no presente trabalho, portanto, temos aqui uma pesquisa de descrio da linguagem, e que poder

25

eventualmente ser utilizada na rea de aplicao de corpora no ensinoaprendizagem de lngua inglesa.

1.1.5 Ferramentas Computacionais Como j vimos, o computador tem desempenhado um papel fundamental para os estudos na rea de lingustica de corpus. Por esse motivo, hoje em dia temos vrias ferramentas computacionais disponveis para auxiliar na coleta e anlise de um corpus. Inclusive, o desenvolvimento de ferramentas eletrnicas que promovam maior automatizao da anlise dos corpora parte das pesquisas em corpus. As ferramentas computacionais mais comuns so: Concordanciadores De acordo com Tagnin (2010), Concordanciadores so programas de computador que extraem todas as ocorrncias de uma palavra de busca num corpus juntamente com seu contexto, apresentando-as na forma de uma concordncia, ou seja, eles constroem listas com as ocorrncias de uma determinada palavra ou expresso, previamente indicada pelo usurio, a qual fica centralizada, com uma quantidade definida de contextos, tanto da esquerda como da direita, fornecendo uma visualizao privilegiada do item para facilitar a anlise. Atualmente, muitos concordanciadores, alm de produzirem

concordncias, tambm executam outras funes, como listar a frequncia de palavras em um texto ou extrair palavras-chave e colocados. Como exemplo podemos citar os concordanciadores WordSmith, MonoConc, AntConc, KitConc, etc. Programas para listar palavras Esses programas fazem a contagem das palavras em um corpus. Atualmente a maioria dos Concordanciadores j possuem ferramentas para executar tal tarefa.

26

Etiquetadores Os etiquetadores fazem anlises automticas do corpus e inserem etiquetas (cdigos) de ordem morfossinttica, sinttica, semntica ou discursiva. Etiquetar um corpus introduzir informaes que facilitem a anlise lingustica (Sanchz-Gijon, 2004, citado por Rampazzi, 2008, p.56). Este processo torna o corpus uma fonte de informao muito mais rica (Leech, 1997, citado por Rampazzi, 2008, p.56). Conforme Berber Sardinha (2004) h um grande nmero de etiquetadores por computador em uso, mas eles se encaixam em trs tipos bsicos: 1. Etiquetadores regidos por regras (rule-based taggers): a

desambiguao feita por meio da aplicao de regras estruturais. 2. Etiquetadores probabilsticos (probabilistic): a desambiguao efetuada pela observao da ocorrncia de etiquetas em um corpus. 3. Etiquetadores Hbridos (Hybrid): utilizam a combinao de regras e probabilidades para realizar a desambiguao. Conforme j citado acima, existem 4 (quatro) formas principais de etiquetagem. Tagnin (2010) explica melhor cada uma delas: 1. Etiquetagem morfossinttica (em ingls pos-tagging): processo pelo qual o contedo do corpus recebe etiquetas morfolgicas, isto , de categorias gramaticais (por exemplo, substantivo, adjetivo, verbo etc.); 2. Etiquetagem sinttica: processo pelo qual o contedo do corpus recebe etiquetas sintticas (por exemplo, sujeito, predicado, objeto direto etc.); 3. Etiquetagem semntica: processo pelo qual o contedo do corpus recebe etiquetas semnticas (por exemplo, cor, roupa, tempero, utenslio etc.); 4. Etiquetagem discursiva: processo pelo qual o contedo do corpus recebe etiquetas que demarcam as partes de um texto (por exemplo, ingredientes,modo de fazer, resumo, introduo, materiais e mtodos etc.). Hunston (2002) nos fala sobre a etiquetagem morfossinttica, que a mais comum de ser encontrada em pesquisas acadmicas, A etiquetagem

27

morfossinttica (POS-tagging em ingls) consiste em atribuir uma etiqueta que representa a categoria gramatical, a cada uma das palavras do corpus. Por exemplo, a palavra light receber uma etiqueta de verbo, substantivo ou adjetivo cada vez que ela ocorrer no corpus. Berber Sardinha (2004) ainda lembra-nos que as etiquetas morfossintticas so, em geral, escritas aps cada palavra e separadas em si da palavra por meio de um separador (um cdigo ou caractere incomum na ortografia como, por exemplo, casa_s, onde _s significa etiqueta de substantivo). O primeiro sistema de etiquetagem morfossinttica foi o TAGGIT (99), com o qual foi feita a etiquetagem do Corpus Brown. A etiquetagem auxilia na desambiguao lexical. Citando exemplo dado por Berber Sardinha (2004): pela etiquetagem gramatical possvel saber se a palavra casa, isolada, refere-se ao substantivo Moradia ou ao verbo Casar. Essas formas seriam etiquetadas casa_s e casa_v, respectivamente. O conjunto mnimo de etiquetas que qualquer lngua europeia (incluindo as lnguas inglesa e portuguesa) deve ter apresentado por Berber Sardinha (2004) no seu livro, Esse conjunto de treze etiquetas da tabela abaixo sugerido pelo Expert Advisory Group on Language Engineering Standards (Eagles):

Etiqueta S V Aj PD AT AV AP C NU I Substantivo Verbo Adjetivo

Significado

Pronome/Determinante Artigo Advrbio Aposio Conjuno Numeral Interjeio

28
U R P nico Residual Pontuao

Tabela 2 Conjunto Mnimo de Etiquetas segundo o Eagles (BERBER SARDINHA, 2004, p. 151)

1.1.6 Consideraes Finais Finalizamos a primeira parte da fundamentao terica desta pesquisa, portanto importante lembrar que at o momento apresentamos os principais conceitos da lingustica de corpus. Neste momento j sabemos o que um corpus, do que se trata a rea de estudo chamada de Lingustica de Corpus, como e quando ela surgiu, como podemos classificar os diferentes corpora, quais so as principais reas de pesquisa, e tambm as ferramentas computacionais que do apoio s pesquisas na rea de anlise de corpora nos dias atuais. Na prxima seo veremos os principais conceitos a respeito dos Phrasal Verbs, conceitos fundamentais para a continuidade deste trabalho.

1.2 Phrasal Verbs 1.2.1 Definio Segundo Celce-Murcia e Larsen-Freeman (1983) os phrasal verbs so verbos seguido de partcula. Essa partcula pode ser uma preposio, um advrbio ou uma combinao dos dois. O verbo e a partcula juntos funcionam como um nico verbo, como em: James pick up his keys (James pega suas chaves), com up fazendo a funo de advrbio, e Maria go up the stairs (Maria sobe as escadas), nesse caso up, a mesma partcula, exercendo a funo de preposio. Santos e Nogueira (2004) lembram que os phrasal verbs so tambm conhecidos como two and three-word verbs, prepositional verbs, compound verbs e multiword verbs. Os mesmos autores explicam que esses so descritos pela maioria das gramticas como locues verbais da lngua inglesa compostas de um verbo e uma preposio ou um advrbio, e que tambm so uma

29

peculiaridade da lngua inglesa que tornam a linguagem mais informal e esto presentes em muitas situaes, tanto no cotidiano quanto nas situaes que requerem um certo nvel de formalidade. Alm disso, eles caracterizam a forma natural de um falante nativo se expressar, e em alguns casos so a nica maneira de expressar um pensamento pelo fato de no existir outro verbo correspondente. importante atentar para o fato de que por ser uma peculiaridade da lngua inglesa, no existe uma associao direta dos Phrasal Verbs com locues da lngua portuguesa nem com outras locues de lnguas no germnicas. S as lnguas de origem germnica (Alemo, Holands e lnguas escandinavas) apresentam estruturas similares aos chamados Phrasal Verbs. Sendo assim, de acordo com Schutz (2011), eles devem ser encarados como vocbulos independentes dos elementos que os compem e, portanto, como uma palavra nova a ser assimilada, porque normalmente a adio de uma preposio ou advrbio ao verbo altera substancialmente o seu significado original. O verbo get out, por exemplo, um phrasal verb, mas a sua traduo literal no revela o seu verdadeiro significado ou, pelo menos, no algo aceitvel na lngua portuguesa. Get significa receber ou "pegar" e out significa fora. Dizer que get out significa receber fora um erro grosseiro e que no encontra respaldo na gramtica da lngua portuguesa. Isso revela a complexidade desses verbos e a confuso que eles podem causar para os aprendizes. Os Phrasal Verbs so sempre estudados como elementos lingusticos de uso informal, ou coloquial, muitas vezes at como grias, na lngua inglesa. Mas a sua presena to forte, por serem tipicamente caractersticos do Ingls, que quase impossvel no encontr-los num texto escrito qualquer. Conforme CelceMurcia (1983), citado por Santos e Nogueira (2004):
[...] they (phrasal verbs) are ubiquitous in English; no one can speak or understand English, at least the informal register, without a knowledge of phrasal verbs.

De acordo com Lamont (2005) existem milhares de phrasal verbs, e o nmero est crescendo a cada dia, visto a lngua ser viva e, portanto, estar sempre ganhando novos vocbulos. Como na maioria das vezes eles no podem ser traduzidos palavra por palavra para outro idioma em razo da partcula (preposio ou advrbio) que vem ligada a eles, esses devem ser definidos e

30

compreendidos como um item de vocabulrio nico, com um significado especfico. 1.2.2. Breve Histrico O surgimento dos Phrasal Verbs na lngua inglesa no bem especificado, mas j so encontrados em textos desde antes de Shakespeare. Sua formao se d com verbos de origem anglo-saxnica, por isso, geralmente podem ser substitudos por verbos de uma s palavra de origem latina (Santos e Nogueira, 2004, p. 2). Devemos considerar que como a lngua inglesa desenvolveu-se em diferentes pases surgiram, ao longo do tempo, muitos phrasal verbs com significados regionais. Ainda hoje temos alguns phrasal verbs que so falados no Reino Unido e desconhecidos nos Estados Unidos, por exemplo. Contudo, esses phrasal verbs esto paulatinamente sendo incorporados pelos demais pases que falam ingls, pois esto se espalhando principalmente atravs de filmes, livros, programas de televiso e Internet. Segundo Lamont (2005) podemos observar que so raras as ocorrncias de phrasal verbs em textos escritos na Idade Antiga. Muito mais comum nessa poca o chamado prefixed verbs, uma forma verbal em que uma partcula anexada ao incio do verbo, e que comparvel a atual estrutura dos phrasal verbs. No ingls atual, por exemplo, existe o verbo transitivo to burn (queimar), e ento o phrasal verb to burn up (queimar). No ingls antigo existiam os verbos brnan (to burn) and forbrnan (to burn up). O prefixo for permanecia afixado ao verbo e no podia mover-se como as partculas modernas podem. Lamont (2005) tambm explica que tais verbos do ingls antigo eram altamente idiomticos, pois o significado da forma composta no refletia, necessariamente, o significado do verbo raiz. Como exemplo, podemos citar berdan que significava to dispossess (desapossar), enquanto o seu verbo raiz rdan, significava to advise (aconselhar). Esse fenmeno ainda sobrevive hoje no particpio forlorn,bem como no verbo understandan, o qual nos dias atuais no significa to stand underneath (something) (ficar embaixo de alguma coisa), mas to comprehend (compreender). Caminhando para a Idade Mdia, podemos perceber que a lngua inglesa sofreu fortes influncias do francs e do anglo-normando, bem como alguma

31

influncia do nrdico antigo. Lamont (2005) acredita que o emprstimo de verbos franceses na Idade Mdia provavelmente retardou o desenvolvimento dos phrasal verbs por causa da concorrncia em campos semnticos. Por exemplo, o emprstimo francs destroy(destruir)poderia acomodar o significado do verbo do Ingls Antigo forbrecan (break up, ou romper, em portugus). Devemos lembrar tambm que o francs era a lngua do estado na Inglaterra aps a conquista normanda, a lngua da nobreza, e os phrasal verbs, muito comuns pelo sculo XIV, eram considerados informais demais, portanto pouco utilizados pela aristocracia e pelos escritores da poca. No entanto, eles conseguiram recuperar sua fora por volta do sculo XV. Tanabe (1999, citado por Lamont, 2005) observa a ocorrncia de 162 phrasal verbs em The Letters Paston, apesar da qualidade formal das referidas cartas, e a incidncia de give up na Crnica Peterborough. Ainda na Idade Mdia o ingls passou por uma mudana na sintaxe de muitos casos de SOV (sujeito objeto verbo) para SVO (sujeito verbo objeto), conforme lembra-nos Lamont (2005), uma vez que perdeu muitas inflexes sintticas (e consequentemente as ordens das palavras nos textos mudaram). A ordem das novas palavras VO, como afirma Akimoto (1999, citado por Lamont, 2005), provavelmente permitiu aos prefixos do Ingls Antigo se tornarem partculas adverbiais ps-posicionadas. Como no exemplo j citado, no Ingls Antigo forbrecan tornou-se to break up no ingls da Idade Mdia. De acordo com Fischer (1992, citada por Lamont, 2005), no fim da Idade Mdia, os phrasal verbs podiam ser divididos em trs categorias: 1) Ao estilo da Idade Antiga com partculas inseparveis + verbo (understand, overtake); 2) Phrasal verbs incluindo verbo + partcula separvel (take up, write up); 3) Compostos nominais derivados dos dois primeiros (outcry, write-off) . Na idade Moderna a incidncia dos phrasal verbs explodiu. Shakespeare utilizava muito essa forma verbal em suas peas. Hiltunen (1999, citado por Lamont, 2005) cita um estudo realizado por Castillo, em que 5.744 phrasal verbs foram identificados dentro do corpo das peas de Shakespeare. Hiltunen explica

32

que os phrasal verbs foram amplamente utilizados na Idade Moderna em textos dramticos por causa de sua variedade de significados e capacidade produtiva. Akimoto (1999, citado por Lamont, 2005) salienta tambm que os phrasal verbs ocorrem mais frequentemente em cartas e dramas do que em ensaios ou textos acadmicos nos sculos XVIII e XIX. Isto confirma que os phrasal verbs ocupavam uma posio social menos privilegiada na Idade Moderna do que, talvez, os verbos de origem latina. Apesar disso, Lamont (2005) conta-nos que os phrasal verbs continuaram a se consolidar. Surgiram substantivos compostos de trs estgios, como break down (destruir) e come back (voltar). Podemos reparar no estresse sobre a partcula na forma verbal (dizemos: I have to break DOWN these boxes (Eu tenho que destruir essas caixas), e a mudana do estresse da partcula para o componente verbal quando este age como um substantivo (como em he had a BREAKdown (Ele teve um colapso). Alm disso, os phrasal verbs na Idade Moderna tambm podiam ser formados a partir de um substantivo + partcula, tais como to louse up(arruinar). Foi tambm neste perodo que os pronomes comearam a ser usados antes das partculas (She put it on no She put on it) como uma prtica padro, enquanto os objetos nominais foram movidos antes e depois da partcula: She put the dress on / She put on the dress (Ela colocou o vestido). Atualmente, os phrasal verbs so muito utilizados pelos falantes da lngua inglesa, nativos ou no. E hoje temos, inclusive, uma forma mais complexa, the three-part phrasal-prepositional verb, que inclui um verbo, uma partcula psposicionada e uma frase complementar preposicional. Exemplos como put up with (tolerar) e do away with (dar cabo de), que podem ser traduzidos pelos verbos de origem latina tolerate e abolish, atentando para o fato de suas partculas no serem mveis: o correto I put up with traffic every day, no I put with traffic up every day (Eu tolero o trnsito todos os dias). Muitos novos phrasal verbs so inventados a cada ano. Alguns so inventados como resultado de mudanas sociais e da necessidade de desenvolver palavras para descrever fenmenos novos. E devido a isso, cada vez mais eles ganham papel de destaque na lngua inglesa.

33

1.2.3 Aspectos sintticos e semnticos dos Phrasal Verbs De acordo com Schutz (2011), dentro da categoria genrica do que alguns autores chamam de multiword verbs, temos os phrasal verbs e os prepositional verbs, os quais so normalmente compostos de duas palavras e frequentemente so chamados de two-word verbs, e os phrasal-prepositional verbs, tambm chamados de three-word verbs. Outra definio interessante apresentada por Rigueira (2007) o phrasal verb: 1) trata-se de uma combinao verbal de verbo + partcula; 2) funciona como verbo (portanto, como uma nica palavra); 3) pode ser intransitivo ou transitivo; 4) se for transitivo, pode ou no ser separado da partcula pelo seu objeto; 5) se for separvel e o objeto for pronominal, este vem entre o verbo e a partcula; 6) a combinao pode ter um significado idiomtico (ou no literal). Considerando essa definio, podemos entender que a principal diferena entre phrasal verbs e prepositional verbs ocorre no plano sinttico: quando transitivos, os phrasal verbs, tambm chamados de separable, exigem a colocao do objeto entre o verbo e a preposio sempre que o objeto for um pronome, enquanto que prepositional verbs, tambm chamados de inseparable, no permitem a colocao do objeto entre o verbo e sua preposio (Schutz, 2011). Como exemplo, podemos citar o phrasal verb Call Up (telefonar), que pode ser empregado de duas formas, tanto com o objeto no final, como por exemplo: They called up the man, como com o objeto entre o verbo e a preposio: They called the man up. Enquanto que o Prepositional Verb Call On (visitar) somente pode ser empregado colocando o objeto aps o verbo e a preposio, como no exemplo They called on the man. No plano semntico, observa-se que nos phrasal verbs o grau de distanciamento do significado deste em relao ao significado original do verbo tende a ser maior. Como exemplo podemos pegar o verbo give e o phrasall verb give up. O verbo give, que significa dar em lngua portuguesa, se distancia muito do phrasal verb give up que significa parar, desistir. Segundo Rigueira (2007) o significado de um phrasal verb pode variar segundo as combinaes nas quais o mesmo se apresenta. De acordo com Moon

34

(1997, citado por Rigueira, 2007), estas podem ser transparentes (transparent), como break off (partir; tirar pedao) e write down (escrever); completivas (completive), como eat up (comer com avidez) e stretch out (alongar), onde a partcula age reforando o grau da ao denotada pelo verbo; e, por fim, opacas (opaque), como nos casos de butter up (puxar o saco) e tick off (repreender; irritar). J para Palmer (1988, citado por Rigueira, 2007), a distino mais direta: o sentido transparente ou literal se ope ao sentido opaco. Moon (1997, citado por Rigueira, 2007) acredita ser essa opacidade de sentido que torna um phrasal verb idiomtico e pode confundir os falantes no nativos. Alm disso, phrasal verbs so compostos predominantemente de verbos monossilbicos, enquanto que nos prepositional verbs, o verbo frequentemente bissilbico. Finalmente, Schutz (2011) classifica uma terceira categoria de multiword verbs: os phrasal-prepositional verbs, tambm chamados de three-word verbs por serem compostos de um verbo, um advrbio e uma preposio. Estas locues ocorrem predominantemente em linguagem informal. 1.2.4 Consideraes Finais Finalizamos a segunda parte da fundamentao terica desta pesquisa, portanto importante lembrar que at o momento apresentamos os principais conceitos sobre a lingustica de corpus e os phrasal verbs. Nesta seo abordamos os principais conceitos sobre os phrasal verbs, portanto j sabemos o que so phrasal verbs, quando e como estes surgiram, como podemos classific-los de acordo com as diferentes formaes, considerando inclusive seus aspectos sintticos e semnticos. Observamos que, apesar de termos visto as diferenas entre os phrasal verbs e os prepositional verbs, como o termo phrasal verb o mais difundido para definio de toda a categoria de multiword verbs, trataremos a partir de agora, todos os multiwords verbs, como phrasal verbs, a fim de facilitar a abordagem, pois no h relevncia em nossa pesquisa em realizar a distino deles. Na prxima seo esclareceremos a relao entre a lingustica de corpus e os phrasal verbs dentro deste trabalho.

35

1.3 A Lingustica de Corpus e os Phrasal Verbs Neste Captulo foram apresentados os conceitos relevantes para a presente pesquisa: Os principais conceitos tericos dentro da rea de Lingustica de Corpus, e tambm os conceitos que cercam os estudos dos Phrasal Verbs na Lngua Inglesa. Considerando que os phrasal verbs apresentam-se como: (1) padres que ocorrem com certa probabilidade na linguagem e (2) padres que so caractersticas do discurso informal, nosso trabalho tem o objetivo de mapear a frequncia desses elementos lingusticos dentro do corpus de mensagens eletrnicas (e-mails) informais. O Email um gnero textual que se popularizou com o advento da Internet e que est muito presente em nosso dia a dia, tanto na vida pessoal como na profissional. No h meios de imaginar a comunicao escrita na sociedade contempornea sem a presena desta ferramenta. Considerando, portanto, a grande importncia de tal ferramenta, e atravs da viso probabilstica que a Lingustica de Corpus nos apresenta, faremos a explorao das evidncias empricas utilizando duas fontes para extrairmos nosso corpus: (1) mensagens eletrnicas trocadas com um grupo de americanos nativos e (2) mensagens eletrnicas extradas do livro E Squared (2009) do britnico Matt Beaumont , uma histria totalmente contada atravs de uma sucesso de e-mails informais que circulam pela rede corporativa de uma empresa de publicidade, bem como e-mails da vida pessoal de alguns personagens. O livro ainda inclui algumas conversas em formato de mensagens de textos (SMS) enviadas por celular e mensagens em blogs, porm para o presente trabalho somente aproveitaremos os e-mails do livro. Para colocarmos em prtica nossa investigao lingustica, optamos por utilizar o programas AntConc e , j citado neste trabalho. O AntConc uma ferramenta computacional, freeware, multiplataforma, para realizao de pesquisa em lingustica de corpus. Ele um concordanciador, e contador de palavras desenvolvido pelo pesquisador britnico, residente no Japo, Laurence Anthony. Alm disso, utilizaremos o etiquetador CLAWS 4, desenvolvido e mantido pela Universidade de Lancaster, na Inglaterra, para etiquetarmos o corpus, de forma a facilitar a manipulao deste no AntConc.

36

Com o auxlio de ambos os softwares, faremos a anlise de nosso corpus de estudo e tambm a anlise comparativa com o corpus de referncia escolhido.

37

METODOLOGIA

Neste Captulo apresentaremos a metodologia utilizada para a realizao da pesquisa. Primeiramente trataremos dos objetivos do estudo e dos questionamentos levantados, os quais so esperados que sejam respondidos ao final deste trabalho. Na sequncia mostraremos como foi realizada a escolha do corpus a ser analisado, sua coleta e construo e, posteriormente faremos uma breve explicao dos softwares utilizados na pesquisa e principalmente do funcionamento das ferramentas contidas no software AntConc. Por ltimo, falaremos sobre o Corpus de Referncia e descreveremos os procedimentos utilizados para a anlise dos dados. 2.1 Objetivos e Questionamentos Como j foi dito no Captulo 1, os phrasal verbs so uma peculiaridade da lngua inglesa que tornam a linguagem mais informal e esto presentes em muitas situaes, tanto no cotidiano quanto nas situaes que requerem certo nvel de formalidade, tanto na comunicao oral quanto na comunicao escrita, pois caracterizam a forma natural de um falante nativo se expressar e so essenciais para a conversao e compreenso da lngua inglesa, merecendo, portanto, dedicao da parte de quem estuda esse idioma. Devido a tal importncia, o presente trabalho se props a analisar o uso dos Phrasal Verbs na comunicao escrita e informal em Ingls. Com o auxlio de mensagens eletrnicas (e-mails) trocadas com um grupo de americanos (falantes nativos) e tambm uma coletnea de e-mails extrados do livro E Squared (2009) do escritor britnico Matt Beaumont, a proposta desse trabalho responder aos seguintes questionamentos:

1) 2) 3) 4)

Qual a ocorrncia de phrasal verbs no corpus de estudo? Quais so os phrasal verbs mais frequentes no corpus de estudo? Qual a frequncia dos mesmos no corpus de referncia? Com quais padres lxico-gramaticais podem ser encontrados?

38

5)

Os padres encontrados no corpus de estudo tambm esto

presentes no corpus de referncia?

Considerando os questionamentos listados acima, esta pesquisa tem como objetivo principal identificar os phrasal verbs mais frequentes no corpus de estudo, assim como os padres lxico-gramaticais com os quais podem ser encontrados neste mesmo corpus. A escolha do tema levou em conta a importncia e complexidade desse tipo de formao verbal, to particular da lngua inglesa. Estudar os Phrasal Verbs considerar o processo histrico pelo qual a lngua inglesa passou, a velocidade com que ela mudou e como ela ainda continua viva e se modificando ao longo dos tempos. Aps analisar a frequncia e a maneira com que os Phrasal Verbs so utilizados na comunicao escrita em ingls, teremos uma viso mais detalhada de um dos mais importantes aspectos lingusticos dessa lngua e teremos condies de propor algumas atividades que podem ser realizadas em sala de aula, com base nos resultados desta pesquisa.

2.2 Coleta e Construo do Corpus De acordo com Martins, Caseli e Nunes (2001) o termo corpus usado para fazer referncia a uma coleo de textos escritos armazenados eletronicamente e processados por computador com propsitos de pesquisa lingustica. Ao construir um corpus de textos, procura-se fazer uma seleo de dados representativa, isto , que constitua um corpo de evidncias lingusticas que possa suportar generalizaes e contra as quais se possam testar hipteses. Considerando a definio acima e conforme j informado na seo anterior, o corpus objeto deste estudo foi coletado de duas fontes: 1) 122 mensagens eletrnicas trocadas pelas pesquisadoras com um grupo de americanos (falantes nativos), no perodo de 5 meses, de junho a outubro de 2011;

39

2) 971 mensagens eletrnicas extradas na integra do livro E Squared (2009) do escritor britnico Matt Beaumont. Ambas as fontes tratam de textos com contedo informal, ou seja, mensagens trocadas por amigos, familiares ou colegas de trabalho, abordando assuntos gerais do cotidiano, representando assim a naturalidade da comunicao escrita de falantes nativos americanos e britnicos. A construo do corpus de pesquisa foi guiada pela experincia que temos com a lngua inglesa, como estudantes e professoras, devido ao contato com amigos e familiares americanos, e em viagens j feitas aos Estados Unidos e Inglaterra. Assim sendo, nossa pesquisa foi iniciada com a troca desses e-mails para constituio de um corpus de comunicao (1) informal (2) escrita (3) em ingls. Portanto, trata-se de uma pesquisa limitada a um grupo composto somente por americanos ou seja, falantes nativos da lngua inglesa. Em um segundo momento, para termos um corpus mais representativo do gnero email em ingls, considerando (1) o tamanho do corpus e (2) as diferenas lingusticas do ingls americano para o ingls britnico, escolhemos o livro E Squared do escritor britnico Matt Beaumont, publicado em 2009 pela Bantam Press. E Squared um romance epistolar moderno, muito divertido, sobre a vida, o trabalho, o amor e relacionamentos em geral, escrito inteiramente atravs de emails, mensagens de textos (SMS) e mensagens em blogs. O livro possui 512 pginas e 971 e-mails que foram extrados para esta pesquisa. O mesmo autor j publicou outros dois livros escritos inteiramente em e-mails. O Best Seller E. A Novel e E. before Christmas, ambos publicados no ano 2000. Considerando as duas fontes descritas acima, organizamos essa coletnea de mensagens eletrnicas que constitui nosso corpus de pesquisa. O corpus ento foi migrado para um arquivo texto (formato.txt) para que pudssemos abri-lo no AntConc, que nos forneceu os dados abaixo atravs da ferramenta WordList.

40

Fonte 122 e-mails falantes nativos (americanos) 971 e-mails Livro E Squared, de Matt Beaumont Total 81.773 9.971 46.836 7.749 Nmero de Tokens 34.937 Nmero de Types 4.191

Tabela 3 Total de Tokens (palavras) e Types (formas) do Corpus da pesquisa

Conforme a Tabela 3 observamos que a ferramenta WordList do software AntConc registra a quantidade total de palavras contidas no Corpus, a qual estamos chamando de Tokens, e tambm o total de palavras diferentes, ou seja, sem considerar as vrias ocorrncias do mesmo vocbulo, o qual trataremos como Types. Como podemos observar na Tabela 3 o corpus de estudo composto por 81.773 tokens (palavras ou ocorrncias), sendo 34.937 oriundos dos e-mails trocados com o grupo de americanos e 46.836 do livro E Squared, de Matt Beaumont, e 9.971 types (formas ou vocbulos diferentes), sendo 4.191 oriundos dos e-mails trocados com o grupo de americanos e 7.749 do livro E Squared, de Matt Beaumont. Ainda segundo a Tabela 3 e os critrios listados por Berber Sardinha (2004), vistos no Captulo 1 deste trabalho, classificamos o corpus analisado em nossa pesquisa como Pequeno-Mdio de 80 a 250 mil de palavras. Outra classificao do corpus a ser feita referente tipologia, tambm seguindo critrios estabelecidos por Berber Sardinha (2004), conforme Tabela 4 abaixo:

Critrio Modo Tempo Seleo Contedo Autoria

Classificao do Corpus Escrito Contemporneo Esttico, de amostragem Especializado de lngua nativa

41

Finalidade

de estudo

Tabela 4 Classificao do Corpus analisado na Pesquisa conforme critrios listados por Berber Sardinha (2004)

Para a construo do corpus, foram estabelecidos tambm os critrios a seguir, com base na tabela apresentada por Bowker & Pearson (2002:72), citado por Rampazzi, 2008, p. 52:

Critrios Tamanho Nmero de Documentos Meio Assunto Tipo de Texto Autoria 81.773 palavras (tokens) 1093 e-mails Escrito em formato eletrnico Cotidiano: Relacionamentos, trabalho e amizades E-mails (mensagens eletrnicas) Falantes Nativos (americanos) e o escritor britnico Matt Beaumont Lngua Periodo Ingls cinco meses

Tabela 5 Critrios Iniciais para a compilao do corpus de estudo

Para a escolha do corpus da pesquisa tambm consideramos os quatro requisitos que um corpus computadorizado deve atender (Berber Sardinha, 2004, citado por Rampazzi, 2008, p. 54): 1. Ser composto de textos autnticos e em linguagem natural; 2. Ser composto de textos autnticos, sendo que a autenticidade dos textos significa terem sido escritos por falantes nativos;

42

3. Possuir contedo que tenha sido selecionado criteriosamente; 4. Representar uma variedade lingustica ou idioma. O corpus deste trabalho atende a todos os requisitos descritos acima, pois so textos autnticos, escritos em linguagem natural por falantes nativos da lngua inglesa. O contedo foi selecionado criteriosamente pelas pesquisadoras, e este representa a comunicao informal por e-mail da lngua inglesa. 2.3

Softwares utilizados na pesquisa

Para a construo, coleta e anlise do corpus utilizamos vrias ferramentas computacionais. Na coleta do corpus dos e-mails utilizamos cinco softwares diferentes conforme os passos descritos a seguir: (1) primeiramente utilizamos o webmail, onde as mensagens eletrnicas trocadas com o grupo de americanos eram recebidas e respondidas; (2) em um segundo momento estas mensagens foram sendo migradas para o Editor de Textos Microsoft Word, onde foram sendo catalogadas, por ordem, data e remetente; (3) em um terceiro momento, utilizamos o Bloco de Notas (Notepad) para convertermos essas mensagens no formato texto (.txt), que o formato aceito pelo software AntConc. Os mesmos procedimentos descritos nos passos (2) e (3) foram realizados para a coleta do corpus do livro E Squared, porm antes dos e-mails do livro serem catalogados no Microsoft Word tivemos que adquirir o E-Book (livro em formato eletrnico) e fazer o download do (4) sistema Kindle, software para leitura de livros eletrnicos disponvel gratuitamente no site da Amazon http://www.amazon.com/. O livro comprado pelo site foi automaticamente disponibilizado na ferramenta Kindle j instalada no computador. Para que este fosse convertido em formato pdf, suportado pelo Adobe Acrobat Reader, tivemos que utilizar a ferramenta (5) Kindle PC Converter, disponvel em verso demonstrativa (gratuita) no endereo - http://www.ebook-converter.com/download.htm. J com o documento em pdf, para possibilitar a migrao do contedo do livro para o Microsoft Word, fizemos a converso do E-Book para o formato OCR

43

(reconhecimento tico de caractere), que foi realizada com a utilizao da ferramenta (6) Adobe Acrobat Pro 9, e assim os passos (2) e (3) descritos acima foram tambm realizados. Para a anlise do corpus foram utilizadas trs ferramentas: (1) AntConc, software para anlise de corpus, que realizou os procedimentos de gerao de listas de palavras (WordList) e concordncias (concordances), (2) o etiquetador CLAWS 4 (the Constituent Likelihood Automatic Word-tagging System) que realizou a etiquetagem morfossinttica de todas as palavras do corpus de estudo e (3) o Microsoft Excel que foi responsvel pela organizao e filtragem dos dados gerados pelo AntConc e pelo CLAWS 4. Como o AntConc e o CLAWS 4 foram fundamentais para a realizao desta pesquisa, falaremos a seguir um pouco sobre cada um deles, j explicando como extramos os dados do corpus com a utilizao deles, e mais detalhadamente sobre as ferramentas disponveis na verso AntConc 3.2.3 para Windows. 2.3.1 AntConc: Software para Anlise de Corpus

Como j citado anteriormente, para a anlise do nosso corpus utilizamos o software AntConc, que realizou a contagem de palavras, o levantamento de frequncias e as concordncias. O AntConc uma ferramenta de anlise de Corpus totalmente gratuita, desenvolvida pelo pesquisador britnico Laurence Anthony. Ele multiplataforma, ou seja, compatvel com os sistemas operacionais Windows, Linux e Macintosh. Ele permite a extrao de listas de palavras (WordList), listas de concordncias (concordance) e palavras-chave (KeyWord). Nesta seo vamos apresentar as principais ferramentas disponveis no AntConc, para que possa ser entendido como as utilizamos para a anlise do corpus desta pesquisa. O programa pode ser instalado atravs do endereo

http://www.antlab.sci.waseda.ac.jp/software.html, conforme figura abaixo:

44

Figura 1 Endereo do Site para download do Programa AntConc

Aps programa:

finalizar

instalao,

basta

clicar

no

arquivo

executvel

antconc3.2.3w.exe e comear a utiliz-lo. A Figura 2 mostra a janela inicial do

Figura 2 Janela Inicial do Programa AntConc 3.2.3 para Windows

45

Para analisar um texto no AntConc, primeiramente necessrio observar que este deve estar em formato txt (somente texto). Portanto, caso o corpus a ser analisado esteja em outro formato, deve-se convert-lo para arquivo somente texto (.txt) antes de abri-lo no AntConc. Assim que o corpus esteja em formato somente texto, seguir os procedimentos seguintes para gerar a lista de palavras, que a primeira solicitao que deve ser executada no programa: Clicar no menu File, opo Open File para abrir o arquivo, conforme Figura 3.

Figura 3 Como abrir um arquivo para gerar uma lista de palavras

O arquivo deve ser encontrado no computador e aberto, e aparecer no AntConc conforme o exemplo da Figura 4, onde os arquivos correspondentes ao nosso corpus de estudos aparecem na lista do Corpus Files a esquerda da tela.

46

Figura 4 Arquivo aberto no AntConc

A seguir selecione o (s) arquivo (s) j aberto (s), clique na aba WordList e no boto Start, para gerar a lista de palavras (ver Figura 5).

Figura 5 WordList gerada no AntConc

47

A lista de palavras do AntConc ser uma ferramenta muito til para nossa pesquisa, pois como pode-se observar na Figura 5, ela possui trs colunas com informaes muito importantes. A primeira coluna o Rank, que ordena as palavras pela frequncia que elas aparecem no texto, ou seja, a palavra que est no Rank 1 a palavra que mais vezes se repete naquele arquivo. Seguindo temos a coluna Freq de frequncia, essa coluna nos mostra a frequncia que a palavra aparece no texto, no caso a palavra que est no Rank 1 aparece 2868 vezes no arquivo do corpus de estudo. E por ltimo, temos a coluna Word, que como o prprio nome diz, mostra a palavra. Sendo assim, no nosso exemplo, sabemos que a palavra the aparece 2868 vezes no arquivo de nosso corpus, e que ela a palavra que mais vezes se repete, estando, portanto, em primeiro lugar (Rank 1) da lista de palavras. Uma vez armazenado o arquivo e solicitada a lista de palavras, outras funes podem ser acionadas, por exemplo, a funo Concordance. Como exemplo, pegamos o advrbio / preposio ON que aparece 690 vezes no arquivo do corpus, clicamos na guia Concordance, digitamos a palavra ON (conforme Figura 6) e clicamos no boto Start.

48

Figura 6 Exemplo de concordncia utilizando a preposio / advrbio ON

Se clicarmos no boto Save Window, podemos notar que a lista apresenta as 690 ocorrncias da preposio/advrbio ON, a qual ficou centralizada e grifada, com uma quantidade definida de contextos, tanto da esquerda como da direita, fornecendo uma visualizao privilegiada desta, conforme pode-se observar na Figura 7.

Figura 7 Concordncia da preposio / advrbio ON (Opo Save Window)

49

A opo Save Window est tambm disponvel na ferramenta File View, e permite a migrao das informaes geradas pelo AntConc para outros sistemas. A palavra ou frase a ser analisada tambm pode ser visualizada dentro do prprio texto, clicando na guia File View, conforme pode ser visto na Figura 8.

Figura 8 File View, apresentao do texto completo

A ferramenta Concordance Plot nos apresenta o grfico de ocorrncias da palavra pesquisada (no caso a preposio / advrbio ON) em cada um dos arquivos do corpus, como pode ser observado na Figura 9.

50

Figura 9 Ferramenta Concordance Plot

A ferramenta Clusters ir mostrar as palavras que se agrupam com a palavra ou frase escolhida para a lista de concordncias. Somente necessrio selecionar a guia Clusters e clicar no boto Start (ver Figura 10).

Figura 10 Clusters, palavras que se agrupam com a preposio ON

51

E na guia Collocates so apresentadas as palavras que formam os colocados, no caso, com a preposio ON (ver Figura 11). No nosso exemplo, a palavra ON aparece acompanhada de outras palavras como Monday (on Monday), move (move on), going (going on), etc.

Figura 11 Collocates, palavras que aparecem ao lado da preposio ON

Outra ferramenta disponvel a Lista de Palavras-Chave (KeyWord List). Para cri-la basta clicar em KeyWord List e ir na guia Tool Preferences. Assim que entrar em Tool Preferences, selecione KeyWord List e escolha o arquivo ou diretrio que serviro de referncia, clicando em um dos botes Add Directory, caso queira selecionar todos os arquivos de um mesmo diretrio, ou Choose File, caso queira escolher arquivos contidos em diretrios diversos, conforme Figura 12 abaixo.

52

Figura 12 Selecionando o Corpus de Referncia Criando uma KeyWord List

Os arquivos selecionados comporo o chamado Corpus de Referncia. Em seguida clique em Apply. O programa volta para a janela inicial do AntConc, portanto basta apenas clicar em Start para que ele faa o cruzamento do Corpus de Estudo com o Corpus de Referncia e obtenha a Lista de Palavras-Chave, conforme mostrado na Figura 13.

53

Figura 13 Criando uma KeyWord List no AntConc

Para salvar a lista gerada, v a File Save OutPut to text file conforme figura abaixo:

Figura 14 Salvando lista de palavras-chave gerada no AntConc

54

O arquivo ser salvo em formato txt para ser manipulado posteriormente. Basicamente essas so as ferramentas disponveis no software AntConc, verso 3.2.3. Em nossa pesquisa somente no faremos uso da ferramenta KeyWord List, visto que nosso corpus de referncia no est disponvel em arquivo para realizarmos o cruzamento dos dados. 2.3.2 CLAWS : Etiquetador Morfossinttico para Textos em Ingls

Como j vimos no Captulo 1, Part-of-speech (POS) tagging, tambm chamada de etiquetagem morfossinttica ou gramatical, a forma mais comum de etiquetagem de corpus, e foi a primeira forma de etiquetagem a ser desenvolvida pela Universidade de Lancaster na Inglaterra. Essa universidade tem desenvolvido e aperfeioado continuamente o software POS tagging (etiquetador morfossinttico) para textos em Ingls, CLAWS (the Constituent Likelihood Automatic Word-tagging System) desde o incio de 1980, sendo que a verso mais recente do etiquetador, CLAWS 4, foi utilizada para a realizao da etiquetagem morfossinttica de 100 milhes de palavras do British National Corpus (BNC). O CLAWS um etiquetador hbrido, que como j vimos no Captulo 1, utiliza a combinao de regras probabilsticas e no probabilsticas para realizar a desambiguao. Ele atribui uma etiqueta (ou s vezes duas tags) a uma palavra, como resultado de quatro processos principais: 1. Tokenizao: onde ele divide o corpus em (1) palavras e (2) sentenas ortogrficas, pois esses so os segmentos normalmente demarcados por (1) espaos e (2) frases (sentena com pontuao final seguida por uma palavra iniciada por letra maiscula). Esse procedimento no to simples como parece, principalmente por causa da ambiguidade de pontos finais (que podem significar marcas de abreviatura, bem como demarcadores de sentenas) e de letras maisculas (o que pode sinalizar uma expresso de nomeao, bem como o incio de uma frase). Essas falhas podem ocorrer, mas raramente causam erros de marcao.

55

2. Atribuio Inicial de Etiquetas: A segunda etapa atribuir a cada smbolo ou palavra uma ou mais etiquetas. Muitas palavras pertencem a apenas uma classe gramatical, recebendo apenas uma etiqueta, outras, porm, pertencem a mais de uma classe gramatical, chegando a receber 7 (sete) etiquetas diferentes. A palavra Broadcast, por exemplo, pode ser etiquetada como VVB, VVI, VVD, VVN (ver relao de etiquetas na Tabela 5, logo abaixo), pois pode ser present tense, infinitive, past tense or past participle, alm disso, ela pode ser um substantivo (nN1) ou um adjetivo (AJ0). Para etiquetar as palavras, o CLAWS procura-a em um lxico de 50.000 entradas de palavras. Esta busca normalmente encontra a maioria das palavras de qualquer corpus. As palavras mais raras precisaro passar por outros procedimentos para serem etiquetadas. Outro procedimento a busca pelo final da palavra, por exemplo, as palavras terminadas com o prefixo ness sero sempre substantivo. 3. Seleo de Etiqueta: Analisando o contexto em que a palavra se encontra, o CLAWS faz a escolha da tag mais provvel (procedimento probabilstico). Um mtodo conhecido como alinhamento de Viterbi usa as estimativas probabilsticas disponveis, tanto em termos das associaes etiqueta-palavra quanto as probabilidades de sequencias de etiquetaetiqueta, para calcular o resultado mais provvel, porm, se pararmos nesse ponto, somente 95 a 96% de palavras sero marcadas corretamente, por esse motivo outro procedimento faz-se necessrio, o idiomtagging. 4. Idiomtagging: Consiste em uma verificao muito mais poderosa que o alinhamento de Viterbi, pois consegue operar em vrias janelas de palavras sequenciais, que podem captar as famosas expresses idiomticas do ingls. De acordo com o UCREL Centro de Pesquisas de Linguagem de Corpus Computadorizados da Universidade de Lancaster, o CLAWS normalmente tem alcanado preciso de 96 a 97% (o grau exato de preciso varia de acordo com o tipo de texto). Avaliando-o somente em termos de grandes categorias, o sistema

56

teve uma taxa de erro de apenas 1,5%, com ambiguidades de 3.3% de termos no resolvidos, dentro do BNC. No presente trabalho utilizamos a verso online gratuita do etiquetador CLAWS 4, que foi acessada pelo endereo http://ucrel.lancs.ac.uk/claws/trial.html. A verso online gratuita permite que colemos um corpus de at 100 mil palavras em uma caixa de texto para que este seja etiquetado, conforme a figura abaixo:

Figura 15 Pgina do CLAWS 4, verso gratuita online

Como nosso corpus possui 81.773 tokens (palavras), conseguimos realizar a etiquetagem de todo o corpus de estudo de uma nica vez. Escolhemos o sistema de etiquetagem Tagset C5, que aps testes julgamos ser o mais fcil de interpretar. Como estilo de sada optamos pelo Horizontal, para que pudssemos realizar posteriormente a busca no AntConc, e por fim clicamos em Tag Text Now, que apresentou o resultado da figura abaixo.

57

Figura 16 Pgina do CLAWS 4 com o resultado da etiquetagem do Corpus

Na Tabela abaixo podemos conferir a relao das 62 etiquetas disponveis no CLAWS 4, padro C5, e o significado de cada uma delas. Etiqueta AJ0 AJC AJS AT0 AV0 AVP AVQ CJC CJS CJT CRD DPS DT0 DTQ EX0 ITJ NN0 NN1 NN2 NP0 NULL ORD Significado adjective (unmarked) (e.g. GOOD, OLD) comparative adjective (e.g. BETTER, OLDER) Superlative adjective (e.g. BEST, OLDEST) article (e.g. THE, A, AN) adverb (unmarked) (e.g. OFTEN, WELL, LONGER, FURTHEST) adverb particle (e.g. UP, OFF, OUT) wh-adverb (e.g. WHEN, HOW, WHY) coordinating conjunction (e.g. AND, OR) Subordinating conjunction (e.g. ALTHOUGH, WHEN) the conjunction THAT cardinal numeral (e.g. 3, FIFTY-FIVE, 6609) (excl ONE) possessive determiner form (e.g. YOUR, THEIR) general determiner (e.g. THESE, SOME) wh-determiner (e.g. WHOSE, WHICH) existential THERE interjection or other isolate (e.g. OH, YES, MHM) noun (neutral for number) (e.g. AIRCRAFT, DATA) singular noun (e.g. PENCIL, GOOSE) plural noun (e.g. PENCILS, GEESE) proper noun (e.g. LONDON, MICHAEL, MARS) the null tag (for items not to be tagged) ordinal (e.g. SIXTH, 77TH, LAST)

58

PNI PNP PNQ PNX POS PRF PRP PUL PUN PUQ PUR TO0 UNC VBB VBD VBG VBI VBN VBZ VDB VDD VDG VDI VDN VDZ VHB VHD VHG VHI VHN VHZ VM0 VVB VVD VVG VVI VVN VVZ XX0 ZZ0

indefinite pronoun (e.g. NONE, EVERYTHING) personal pronoun (e.g. YOU, THEM, OURS) wh-pronoun (e.g. WHO, WHOEVER) reflexive pronoun (e.g. ITSELF, OURSELVES) the possessive (or genitive morpheme) 'S or ' the preposition OF preposition (except for OF) (e.g. FOR, ABOVE, TO) punctuation - left bracket (i.e. ( or [ ) punctuation - general mark (i.e. . ! , : ; - ? ... ) punctuation - quotation mark (i.e. ` ' " ) punctuation - right bracket (i.e. ) or ] ) infinitive marker TO "unclassified" items which are not words of the English lexicon the "base forms" of the verb "BE" (except the infinitive), i.e. AM, ARE past form of the verb "BE", i.e. WAS, WERE -ing form of the verb "BE", i.e. BEING infinitive of the verb "BE" past participle of the verb "BE", i.e. BEEN -s form of the verb "BE", i.e. IS, 'S base form of the verb "DO" (except the infinitive), i.e. past form of the verb "DO", i.e. DID -ing form of the verb "DO", i.e. DOING infinitive of the verb "DO" past participle of the verb "DO", i.e. DONE -s form of the verb "DO", i.e. DOES base form of the verb "HAVE" (except the infinitive), i.e. HAVE past tense form of the verb "HAVE", i.e. HAD, 'D -ing form of the verb "HAVE", i.e. HAVING infinitive of the verb "HAVE" past participle of the verb "HAVE", i.e. HAD -s form of the verb "HAVE", i.e. HAS, 'S modal auxiliary verb (e.g. CAN, COULD, WILL, 'LL) base form of lexical verb (except the infinitive)(e.g. TAKE, LIVE) past tense form of lexical verb (e.g. TOOK, LIVED) -ing form of lexical verb (e.g. TAKING, LIVING) infinitive of lexical verb past participle form of lex. verb (e.g. TAKEN, LIVED) -s form of lexical verb (e.g. TAKES, LIVES) the negative NOT or N'T alphabetical symbol (e.g. A, B, c, d)

Tabela 6 Relao de Etiquetas do CLAWS4, padro C5 Tagset

59

2.4

Corpus de Referncia

Conforme definio de Berber Sardinha (2004, citado por Bernardes Gonalves, 2006) o corpus de referncia, tambm conhecido como corpus de controle, funciona como termo de comparao para a anlise lingustica. Sua funo fornecer uma norma com a qual se far a comparao das frequncias do corpus de estudo. As palavras cujas frequncias no corpus de estudo forem significativamente maiores segundo o resultado da prova estatstica so consideradas chave. O corpus de referncia deve conter as seguintes caractersticas gerais conforme afirma ainda Bernardes Gonalves (2006): 1. O corpus de referncia no deve conter o corpus de estudo; 2. Um corpus de um gnero especfico, igual ao daquele do corpus de estudo, tende a filtrar os elementos genricos (relativos a um mesmo gnero) comuns; 3. Um corpus de referncia geral, incluindo vrios gneros, no excluir as palavras genricas (relativas a um gnero); 4. Tamanho mnimo necessrio para resultados significativos (mnimo de 2 a 5 vezes o corpus de estudo) O corpus de referncia foi utilizado neste trabalho para validar as ocorrncias encontradas no corpus de estudo. Como no existe um corpus de referncia especfico para o gnero e-mail, escolhemos um corpus de referncia geral, que inclui vrios gneros textuais, incluindo linguagem oral e escrita, com contedo formal e informal. O corpus escolhido o Corpus of Contemporary American English, criado pelo Professor de Lingustica Mark Davies da Brigham Young University www.byu.edu/, do estado de Utah. O corpus pode ser consultado gratuitamente, sem a necessidade de registro, no endereo http://corpus.byu.edu/coca/.

60

O corpus em questo composto por 425 milhes de palavras do ingls contemporneo extradas de mais de 160 mil textos. Em mdia 20 milhes de palavras por ano esto sendo adicionadas a este corpus desde 1990, sendo que a atualizao mais recente foi feita em maro deste ano.

Figura 17 Pgina Inicial do Corpus of Contemporary American English

O corpus dividido em cinco gneros, conforme descrito abaixo: 1. Spoken (ingls falado) Transcries de conversas espontneas de cerca de 150 diferentes programas de rdio e TV. Atualmente conta com aproximadamente 85 milhes de palavras; 2. Fiction (Fico) - Contos e peas de teatro, primeiros captulos de livros e roteiros de cinema. Atualmente conta com aproximadamente 81 milhes de palavras; 3. Popular Magazines (Revistas populares) - Conta com cerca de 100 revistas diferentes, a partir de uma variedade de assuntos, tais como notcias, sade, casa e jardinagem, mulheres, finanas, religio e esportes. Atualmente conta com aproximadamente 86 milhes de palavras; 4. Newspaper (Jornais) - Conta com dez jornais de todo os Estados Unidos, com textos de diferentes sees dos jornais, como notcias

61

locais, opinio, esportes e a seo financeira. Atualmente conta com aproximadamente 81 milhes de palavras; 5. Academic Journals (Publicaes Acadmicas) - Conta com cerca de 100 diferentes revistas que passaram por reviso paritria. Estas publicaes normalmente foram selecionadas para cobrir toda a gama de assuntos do sistema de classificao da Biblioteca do Congresso. Atualmente conta com aproximadamente 81 milhes de palavras; A Interface do sistema de consulta a mesma do BNC British National Corpus, que possui 100 milhes de palavras. O Corpus somente est disponvel atravs da interface web devido s restries de direitos autorais. Para a comparao com o corpus de estudo utilizaremos apenas os gnero Spoken (ingls falado), que se aproxima mais da linguagem utilizada nos e-mails informais, pois trata-se de transcries de conversas espontneas que representam bem o discurso informal. Para tanto, seguimos os procedimentos descritos abaixo para a pesquisa da quantidade de ocorrncias dos phrasal verbs mais frequentes no corpus de estudo dentro do corpus de referncia, e os principais padres para esses phrasal verbs. Na tela inicial do COCA, selecionamos as seguintes opes: Display List, Search String Word, na caixa Word digitamos o phrasal verb, no caso o nosso exemplo mostra o phrasal verb get back. Em Sections, na primeira caixa de seleo selecionamos Spoken, na segunda caixa de seleo selecionamos Ignore. Sorting and Limits ficam marcados como Frequency, e clicamos no boto SEARCH. Os dados so apresentados conforme figura abaixo:

62

Figura 18 Exemplo de busca de Palavras/Termos no Corpus de Referncia

Podemos notar que o phrasal verb get back aparece 4195 vezes no corpus de referncia de acordo com nossa busca, porm importante lembrar que ainda precisamos realizar a pesquisar pelos termos got back, getting back e gotten back. Aps processar o resultado da consulta, somente necessrio clicar em cima do phrasal verb GET BACK para visualizar o contexto em que ele aparece:

Figura 19 Visualizao dos Contextos em que a Palavra / Termo est inserido

63

2.5

Procedimentos para Levantamento das Estatsticas do Corpus

Em sntese, os procedimentos adotados para levantamento e anlise dos phrasal verbs (termos-alvo) deste trabalho, foram os descritos abaixo: 1. Como j mostrado na Seo 2.3.1, Figura 5, com o auxlio da ferramenta WordList do software AntConc, obtemos o tamanho do corpus - quantidade de tokens e de types, e a lista de palavras, contendo a relao das ocorrncias, bem como a frequncia que aparecem no corpus. 2. Com o auxlio do Etiquetador CLAWS 4, conforme mostrado na Seo 2.3.2, Figuras 15 e 16, atribumos etiquetas morfossintticas a todos os 81.773 vocbulos do corpus. 3. Migramos esse corpus etiquetado para o AntConc, e com base na formao dos phrasal verbs, que so sempre formados por verbo + partcula, que pode ser advrbio ou preposio, separamos 27 das 62 etiquetas do CLAWS 4 que se enquadram nesse perfil, conforme os trs grupos abaixo: I. II. III. Etiqueta de Preposio (exceto a preposio OF): PRP Etiqueta de Partcula Adverbial: AVP Etiquetas referentes s formas verbais: VBD, VBG, VBI, VBN, VBZ, VDB, VDD, VDG, VDI, VDN, VDZ, VHB, VHD, VHG, VHI, VHN, VHZ, VM0, VVB, VVD, VVG, VVI, VVN e VVZ. Como essa quantidade de etiquetas ainda muito grande para realizao da busca das ocorrncias, separamos as etiquetas do grupo de formas verbais em cinco subgrupos, para que fiquemos com sete grupos no total, conforme abaixo: I. II. III. PRP PRP (todas as preposies, exceto preposio OF); AVP AVP (partcula adverbial); VB* - VBD, VBG, VBI, VBN, VBZ (grupo de etiquetas relativas ao verbo BE);

64

IV.

VD* - VDB, VDD, VDG, VDI, VDN, VDZ (grupo de etiquetas relativas ao verbo DO);

V.

VH* - VHB, VHD, VHG, VHI, VHN, VHZ VDZ (grupo de etiquetas relativas ao verbo HAVE);

VI. VII.

VM0 VM0 (grupo de etiquetas relativas aos verbos modais); VV* - VVB, VVD, VVG, VVI, VVN e VVZ VDZ (grupo de etiquetas relativas a outros verbos);

Sendo assim, tivemos que combinar na busca do AntConc, os cinco grupos de formas verbais com os dois grupos preposio PRP e partcula adverbial AVP, portanto, nossa busca foi feita de acordo com os procedimentos abaixo: A. Abrimos o arquivo do corpus etiquetado; B. Carregamos novamente a lista de palavras; C. Utilizando a ferramenta Concordance, fomos nas opes

avanadas de busca (Advanced), selecionamos a opo Use Seach Term (s) from list below e carregamos um arquivo texto com as etiquetas referentes s formas verbais VB*, VD*, VM0, VH* e VV*. Depois selecionamos a opo Use Contexts Words and Horizons e adicionamos na lista as etiquetas PRP e AVP, referentes s preposies e partculas adverbiais. Em Context Horizon, colocamos a distncia das Context Words em relao aos termos VB*, VD*, VM0, VH* e VV*. Colocamos From 0 , que significa que no queremos pesquisar nenhuma palavra a esquerda do termo, visto que para a construo dos phrasal verbs somente consideramos preposies e partculas adverbiais a direita do verbo, e em To colocamos 5R, que significa que queremos pesquisar at 5 palavras a direita do termo. Observem as figuras abaixo para melhor entendimento:

65

Figura 20 Lista de Concordncias das Etiquetas VB*, VD*, VM0, VH* e VV*.

Figura 21 Tela das Opes Avanadas de Busca no AntConc

Berber Sardinha (2004, citado por Santos, 2008) ressalta que alm de conhecer bem o funcionamento da ferramenta concordanciadora que estamos

66

utilizando, importante tambm conhecer o significado de alguns termos-chave para continuarmos com nossa anlise e organizao dos dados. No caso da ferramenta concordanciadora do AntConc, utilizada para nossa anlise, apresentamos as definies abaixo: Termo de Busca (Search Terms): palavra ou grupo de palavras do qual o usurio tem o interesse em obter uma concordncia; Palavras de Contexto (Context Words): palavras que devem estar prximas do termo de busca. So opcionais, ou seja, possvel fazer uma busca sem especific-las, porm em nossa pesquisa, precisamos fazer uso delas; Horizontes do Contexto (Context Horizon): distncia mxima entre o termo de busca e a palavra de contexto. Conforme Berber Sardinha (2004) de modo prtico, o mais comum estabelecer um horizonte de cinco palavras para cada lado do termo de busca, portanto, 5L e 5R. Na busca acima, por exemplo, definimos que nossa palavra de contexto no deve aparecer esquerda do termo de busca, visto que a preposio ou partcula adverbial nunca aparece esquerda do verbo na formao dos phrasal verbs, e considerando o recomendado por Berber Sardinha (2004), definimos at cinco posies a direita do termo de busca. Caractere Curinga (Wildcard): um caractere que pode significar muitos outros. No nosso caso o * asterisco foi utilizado como caractere curinga para que pudssemos implicar nossa busca. 4. Com o auxlio da Opo Save Window, mostrada na Seo 2.3.1, migramos todas as linhas de concordncia para um documento txt, e fizemos a busca dos phrasal verbs nesse documento, planilhando os dados localizados no MS Excel, conforme figuras abaixo:

67

Figura 22 Salvando as Linhas de Concordncia, geradas pelo AntConc

Figura 23 Tela do Excel com a relao de Phrasal Verbs do Corpus

5. Obtivemos uma relao de 193 diferentes phrasal verbs, que agrupamos por ordem de frequncia (ver Anexo 2).

A partir dessas informaes, responderemos no prximo captulo, as questes da pesquisa, realizando a anlise dos padres encontrados para esses termos.

68

APRESENTAO E ANLISE DOS RESULTADOS

Neste Captulo apresentaremos os resultados da anlise realizada nos dois corpora - de estudo e de referncia, e tambm responderemos aos questionamentos da pesquisa. Primeiramente mostraremos as estatsticas gerais dos dois corpora. Em um segundo momento, trataremos da anlise dos padres encontrados para os phrasal verbs, tanto no corpus de estudo quanto no corpus de referncia. Por ltimo, faremos uma proposta de atividade para aprendizado de phrasal verbs baseada nos resultados de nossa pesquisa. 3.1 Estatsticas dos Corpora

Nesta seo responderemos a trs das cinco questes propostas na pesquisa: 1) Qual a ocorrncia de phrasal verbs no corpus de estudo? 2) Quais so os phrasal verbs mais frequentes no corpus de estudo? 3) Qual a frequncia dos mesmos no corpus de referncia?

Como j vimos no Captulo 2, o corpus de estudo possui 81.773 tokens (palavras) e o corpus de referncia, o gnero Spoken do Corpus of Contemporary American English (COCA) possui atualmente cerca de 85 milhes de palavras. Como se percebe, pelo nmero de palavras (tokens), o corpus de referncia muitas vezes maior que o corpus de estudo. O recomendado pela literatura na rea (Berber Sardinha, 2004) que o corpus de referncia seja de duas a cinco vezes maior que o corpus de estudo, portanto como nossos corpora possuem grandezas numricas diferentes, e o corpus de referncia bem maior do que o recomendado para a comparao com o corpus de estudo, utilizamos o procedimento da normalizao dos nmeros, conforme empregado por Vicentini (2006), para que essa diferena de tamanho no interferisse na anlise comparativa proposta. De acordo com Vicentini (2006), a normalizao consiste em realizar clculos de razo/proporo entre os corpora para que a discusso dos

69

resultados seja feita com base em nmeros de mesma grandeza. Como exemplo, podemos fazer o clculo simples de razo e proporo do tamanho total de nossos corpora. Considerando, portanto, que razo uma forma de se realizar a comparao de duas grandezas de mesma unidade de medida, e sabendo que a razo entre dois nmeros a e b obtida dividindo-se a por b, temos ento que a razo de 85.000.000 : 81.773 igual a 1039,46, ou seja, 85.000.000 (corpus de referncia) dividido por 81.773 (corpus de estudo) igual a 1039,46 palavras. Sendo assim, para cada palavra do corpus de estudo, temos aproximadamente 1039 palavras no corpus de referncia, que significa que o corpus de referncia 1039 vezes maior que o corpus de estudo. Como proporo, podemos entender a igualdade entre razes. Por exemplo, no corpus de estudo temos a ocorrncia do phrasal verb go out no topo das frequncias, com 29 ocorrncias, em um universo de 81.773 palavras. O corpus de referncia apresenta 12040 ocorrncias do mesmo phrasal verb, em um universo de 85.000.000 de palavras. Para utilizar o procedimento de normalizao, precisamos que os dois corpora estejam em igualdade, portanto, temos que considerar o universo de 100.000 palavras no corpus de referncia. Sendo assim, se em um corpus de 85.000.000 de palavras temos 12040 ocorrncias do phrasal verb go out, na proporo de 100.000 palavras desse mesmo corpus, temos 14 ocorrncias desse phrasal verb. No Anexo 2 pode ser consultada a relao dos 193 diferentes phrasal verbs encontrados no corpus de estudo, j classificados por ordem de frequncia. Pela tabela do Anexo 2 podemos perceber que juntos, esses phrasal verbs aparecem 724 vezes no corpus de estudo, portanto, em um corpus de 81.773 tokens / palavras, temos 1 (uma) ocorrncia de phrasal verb para cada 113 palavras, o que j responde nossa primeira questo de pesquisa. Alm disso, fazendo um filtro nas etiquetas correspondentes a verbos (ver Tabela 6 no Captulo 2), verificamos que o corpus possui 11.197 palavras etiquetadas como tipos verbais, portanto, com base nesses dados, e considerando que os 193 diferentes phrasal verbs aparecem 724 vezes dentro do corpus de estudo, podemos definir a porcentagem de phrasal verbs em relao aos verbos comuns no corpus de estudo:

70

Grfico 1 Total de Phrasal Verbs x Verbos Comuns no Corpus de Estudo

Considerando o grfico acima, temos que 100% (11.197) das palavras etiquetadas como formas verbais do corpus de estudo, 94% (11.125) tratam-se de verbos comuns, enquanto 6% (724) correspondem aos phrasal verbs, o que mostra sua representatividade dentro do corpus. Para nossa anlise, consideraremos apenas aqueles que apresentaram frequncia igual ou superior a 10 (dez), conforme tabela abaixo: Ordem Phrasal / Prep. Verb 1 go out 2 be out 3 look for 4 get in 5 go on 6 work on 7 come back 8 get back 9 put in 10 check out 11 find out 12 look forward to 13 move on 14 get out 15 go back 16 go up Freq 29 26 23 22 18 16 15 12 12 11 11 11 11 10 10 10

71

17 18

pick up sort out

10 10

Tabela 7 Relao de Phrasal Verbs mais frequentes no corpus de estudo

Abaixo, a Tabela 8 mostra a frequncia desses mesmos phrasal verbs no Corpus de Referncia:

Ordem Phrasal / Prep. Verb 1 go on 2 come back 3 go back 4 look for 5 find out 6 go out 7 get out 8 be out 9 work on 10 get in 11 pick up 12 go up 13 get back 14 put in 15 move on 16 look forward to 17 check out 18 sort out

Freq 33933 22381 17118 13687 13683 12040 11712 10691 8159 7753 7599 6863 5769 4375 4025 2584 1560 489

Tabela 8 Relao de Phrasal Verbs mais frequentes no corpus de estudo por ordem de frequncia no corpus de referncia

Analisando as duas tabelas, podemos perceber que o phrasal verb que aparece no topo de nossa lista do corpus de estudo o phrasal verb go out, com 29 ocorrncias, enquanto que na lista do corpus de referncia este mesmo phrasal verb aparece em 6 colocao, com 12040 ocorrncias, portanto, apresentamos abaixo uma tabela contendo o resultado do clculo da proporo de todos os phrasal verbs encontrados no corpus de estudo, em relao ao corpus de referncia:

72

Phrasal Verb

Ocorrncias Corpus Ocorrncias Corpus de de Estudo (81.773 Referncia (por palavras) 100.000 palavras)

go out be out look for get in go on work on come back get back put in check out find out look forward to move on get out go back go up pick up sort out

29 26 23 22 18 16 15 12 12 11 11 11 11 10 10 10 10 10

14 13 16 9 40 10 26 7 5 2 16 3 5 14 20 8 9 0.6

Tabela 9 Normalizao: Relao dos Phrasal Verbs mais frequentes do corpus de estudo x a proporo desses no corpus de referncia

Conforme a Tabela 9, notamos que o procedimento de normalizao foi utilizado a fim de reduzir o corpus de referncia mesma proporo do corpus de estudo, para uma melhor comparao da frequncia dos phrasal verbs analisados. Sendo assim, percebemos que dos 18 (dezoito) phrasal verbs que possuem frequncia igual ou superior a 10 (dez) no corpus de estudo, somente 9 (nove) possuem a mesma taxa de frequncia no corpus de referncia, so eles: go out, be out, look for, go on, work on, come back, find out, get out e go back, portanto pela representatividade em ambos os corpus, faremos a anlise das linhas de concordncias desses phrasal verbs na prxima seo.

73

3.2 Anlise dos Padres de Concordncias dos Termos Selecionados

Nesta seo iremos responder s questes 4 e 5 de nossa pesquisa: Com quais padres lxico-gramaticais os phrasal verbs podem ser encontrados? Os padres encontrados no corpus de estudo tambm esto presentes no corpus de referncia? Para a realizao da anlise dos padres de concordncia dos phrasal verbs selecionados, utilizamos novamente o AntConc. Retornando ao AntConc, abrimos o documento do corpus, utilizando o arquivo que no foi etiquetado, e a partir da relao dos phrasal verbs que possuem a mesma taxa de frequncia no corpus de estudo e corpus de referncia, geramos a linhas de concordncia e listas de palavras que se agrupam com os Termos de busca. Nesta etapa utilizamos as ferramentas Concordance e Clusters, conforme exemplo com o verbo go out:

Figura 24 Ferramenta Concordance, busca avanada

74

Figura 25 Ferramenta Concordance, com a busca do phrasal verb GO OUT

Figura 26 Ferramenta Cluster, Lista de Palavras que se agrupam com o phrasal verb GO OUT

75

Notem que para realizar a busca na ferramenta Clusters, marcamos que o termo pesquisado se encontra a esquerda e tambm que o tamanho mnimo e o mximo da lista de palavras (cluster) 4 e 5 respectivamente. Vejamos agora, utilizando os procedimentos acima descritos, os padres encontrados nas linhas de concordncias dos phrasal verbs go out, be out, look for, get in, go on, work on, come back, find out, get out e go back. 3.2.1 Padres do phrasal verb go out O phrasal verb go out aparece 29 vezes em nosso corpus de estudo. Conforme resultado apresentado na Figura 26, conseguimos os quatro principais padres deste phrasal verb: Padro Go out/ going out of my mind Go out and + verb (another action) Go out for + noun (something) Go out with + pers. pronoun (somebody) Significado Sair da mente / viajar em pensamentos e lembranas Sair e fazer alguma coisa Frequncia 3

Sair para fazer alguma coisa

Sair com algum

Tabela 10 Padres do phrasal verb GO OUT no Corpus de Estudo

Os pronomes, substantivos e verbos que acompanham o phrasal verb go out, de acordo com os padres selecionados acima, esto divididos nos trs grupos abaixo: 1. and Another action: and play / and celebrate / and party / and keep it 2. with Somebody: with Lorraine / with another old workmate / with Don and Kaz / with nekka

76

3. for Something: for dinner / for a drink / for a walk . Alm disso, com a juno dos grupos 2 e 3, de acordo com as ocorrncias encontradas no corpus de estudo, conseguimos formar dois novos subgrupos: A. Go out with SOMEBODY for SOMETHING. Ex: I will go out with nekka for a walk when the rain finishes. B. Go out for SOMETHING with SOMEBODY. Ex: if you'll go out for a drink with me. Posteriormente, fizemos a busca desses termos no Corpus de Referncia.
Ocorrncias Corpus de Referncia (por 100.000 palavras)

Padro Go out / going out of my mind Go out and + verb (another action) Go out for + noun (something) Go out with + pers. pronoun (somebody)

Ocorrncias Corpus de Estudo (81.773 palavras)

3 7 5 6

4 3 0,12 0,40

Tabela 11 Padres do phrasal verb GO OUT no Corpus de Referncia

Percebemos que o padro Go out and + verb (another action) o mais frequente em ambos os corpora. Lembramos que os termos de busca pesquisados, tanto no AntConc quanto no CoCa, consideraram todas as formas verbais a seguir, exceto as negativas, visto que no houve registros de padres com formas negativas em nosso corpus de estudo: go out, goes out, going out, gone out e went out.

77

3.2.2 Padres do phrasal verb be out

O phrasal verb be out aparece 26 vezes em nosso corpus de estudo. Para este phrasal verb encontramos cinco padres principais de concordncia: Padro Be out of the + noun (some place) Be out in the + noun (some place) Be out there (no complement) Be out and + verb (another action) Be out + adverb of time (tonight, this morning) Significado Estar ausente de algum lugar Frequncia 18

Estar fora, em algum lugar Estar l fora Estar ausente de algum lugar e fazendo alguma coisa Estar fora esta noite, esta manh

2 3 1

Tabela 12 Padres do phrasal verb BE OUT no Corpus de Estudo

Os substantivos, advrbios e verbos que acompanham o phrasal verb be out, de acordo com nossa lista de concordncias e clusters, esto divididos nos trs grupos abaixo: 1. and Another action: and singing and having fun. 2. Adverb of Time: tonight / this morning. 3. Some place: there / office / place / my mind / sun. Comparando com o corpus de referncia, temos que:

78
Ocorrncias Corpus de Estudo (81.773 palavras) Ocorrncias Corpus de Referncia (por 100.000 palavras)

Padro

Be out of the + noun (some place) Be out in the + noun (some place) Be out there (no complement) Be out and + verb Be out + adverb of time (tonight, this morning)

18

0,38

3 1 2

3 0,17 0,15

Tabela 13 Padres do phrasal verb BE OUT no Corpus de Referncia

Percebemos que o padro Be out of the + noun (some place) o mais frequente em ambos os corpora. Lembramos que os termos de busca pesquisados, tanto no AntConc quanto no CoCa, consideraram todas as formas verbais a seguir, exceto as negativas, visto que no houve registros de padres com formas negativas em nosso corpus de estudo: be out, been out, being out, am out, is out, are out, was out e were out. 3.2.3 Padres do phrasal verb look for

O phrasal verb look for aparece 23 vezes no corpus. Para este phrasal verb encontramos trs padres principais de concordncia:

79

Padro Looking for (no complement) Look for + poss. pronoun (somebody) Look for + noun (something)

Significado Procurando Procurar por algum ou por alguma coisa Procurar por alguma coisa

Frequncia 2 9 12

Tabela 14 Padres do phrasal verb LOOK FOR no Corpus de Estudo

Os pronomes e substantivos que acompanham o phrasal verb look for, de acordo com os padres selecionados acima, esto divididos nos dois grupos abaixo: 1. for Somebody: him / me / you / Noah. 2. for Something: the stuff I Googled / the likes of Keira / something more / their first Big Brother suicide / It / beach glass / the recipe dessert / more / a house / a new pair of shoes / the international phone card / a window to go back. Comparando com o corpus de referncia, temos que:
Ocorrncias Corpus de Estudo (81.773 palavras) Ocorrncias Corpus de Referncia (por 100.000 palavras)

Padro

Looking for (no complement) Look for + poss. pronoun (somebody) Look for + noun (something)

0,42

12

Tabela 15 Padres do phrasal verb LOOK FOR no Corpus de Referncia

80

Para a busca no corpus de referncia do padro Looking for (sem complemento), fizemos um filtro pelas ocorrncias Looking for que so seguidas por vrgula, ponto final e ponto de exclamao, conforme mostrado na figura abaixo:

Figura 27 Exemplo de busca pelo Termo Looking for + ponto final

Para a busca no corpus de referncia da expresso Look for + pronoun (somebody) tivemos que realizar a seleo dos termos Look for, Looked for, Looks for e Looking for + Pronomes Pessoais para encontrar os padres YOU, HIM e ME, que foram aqueles encontrados no corpus de estudo, conforme exemplo da figura abaixo:

81

Figura 28 Busca pelo Termo Look for + Pronomes Pessoais

Para a busca ao padro Look for + noun (something), tivemos que adotar trs tipos de critrios: (1) look for, looked for, looks for, looking for + substantivo (todos); (2) look for, looked for, looks for, looking for + pronome (todos) e (3) look for, looked for, looks for, looking for + artigo (todos). Nessas listas, selecionamos os artigos the e a, os pronomes It e their e todos os substantivos. Aps a comparao realizada com o corpus de referncia, percebemos que o padro Look for + noun (something) o mais frequente em ambos os corpora. 3.2.4 Padres do phrasal verb go on

O phrasal verb go on aparece 18 vezes no corpus. Para este phrasal verb encontramos quatro padres principais de concordncia: Padro What`s going on? Go on with + noun / poss. pronoun (somebody, something) Significado O que est acontecendo? Continuar com algum ou alguma coisa Frequncia 4 3

82

Go on and on (no complement) Go on and + verb (another action)

Continuar sem parar Continuar e fazer uma segunda ao

3 4

Tabela 16 Padres do phrasal verb GO ON no Corpus de Estudo

Os pronomes, substantivos, verbos e demais palavras que acompanham o phrasal verb go on, de acordo com os padres selecionados acima, esto divididos nos dois grupos abaixo: 1. with Somebody/Something: Noah / my new beginning of my life / my beautiful daughter. 2. and Another action: alerts me of who is near by / send them to you / plan for their first cruise / carry on. Comparando com o corpus de referncia, temos que:

Padro

Ocorrncias Corpus de Estudo (81.773 palavras)

Ocorrncias Corpus de Referncia (por 100.000 palavras)

What`s going on? Go on with + noun / poss. pronoun (somebody, something) Go on and on (no complement) Go on and + verb (another action)

0,12

0,36

0,23

0,38

Tabela 17 Padres do phrasal verb GO ON no Corpus de Referncia

83

A busca do Termo What`s going on? foi realizada utilizando procedimento diverso dos demais, visto tratar-se de uma expresso com a forma verbal fixa no gerndio (going) e com o ponto de interrogao no final da frase (ver figura abaixo). Os demais termos foram localizados pela busca simples.

Figura 29 Busca pelo Termo What`s going on + ?

Aps a comparao realizada com o corpus de referncia, percebemos que o padro Go on and + verb (another action) o mais frequente em ambos os corpora. 3.2.5 Padres do phrasal verb work on

O phrasal verb work on aparece 16 vezes no corpus. Para este phrasal verb, encontramos dois padres principais de concordncia: Padro Working on + Ing Verb (some action) Work on + noun / poss. pronoun (something) Significado Desenvolvendo/Trabalhando em alguma atividade Melhorar ou desenvolver Frequncia 3

13

Tabela 18 Padres do phrasal verb WORK ON no Corpus de Estudo

84

Os pronomes, substantivos e verbos que acompanham o phrasal verb work on, de acordo com os padres selecionados acima, esto divididos nos trs grupos abaixo: 1. Some action: getting IT systems up / getting a job / trying to help 2. Something: my thighs / Ted's split end / international stage / it now / an installation / GIT / the team / this / the remodeling of my bathroom / her masters / your academic studies / their art. Posteriormente, fizemos a busca desses termos no Corpus de Referncia.

Padro

Ocorrncias Corpus de Estudo (81.773 palavras)

Ocorrncias Corpus de Referncia (por 100.000 palavras)

Working on + Ing Verb (some action) Work on + noun / poss. pronoun (something)

3 13

0,13 0,80

Tabela 19 Padres do phrasal verb WORK ON no Corpus de Referncia

A busca pelo padro Working on (some action) foi realizada considerando somente os verbos terminados com ING, sendo assim, selecionamos a combinao Working on + Verb Ing, conforme se pode conferir na figura abaixo.

85

Figura 30 Busca pelo Termo Working on + ING Verb

A busca pelo padro work on (something) foi realizada com a combinao work on, worked on, works on e working on + substantivo (todos) e work on , worked on, works on e working on + pronome (todos). Aps a comparao realizada com o corpus de referncia, percebemos que o padro work on + noun/pronoun (something) o mais frequente em ambos os corpora. 3.2.6 Padres do phrasal verb come back

O phrasal verb come back aparece 15 vezes no corpus. Para este phrasal verb, encontramos trs padres principais de concordncia: Padro Come back to + noun / possessive pronoun (some place) Come back from + noun / possessive pronoun (some place) Significado Regressar, voltar para algum lugar Regressar, voltar de algum lugar Frequncia 8

86

Come back in + adverb of time

Regressar, voltar em algum momento do passado ou futuro

Tabela 20 Padres do phrasal verb COME BACK no Corpus de Estudo

O grupo de palavras que acompanha o phrasal verb come back, de acordo com os padres selecionados acima, esto divididos conforme abaixo: 1. Some Place: from the Andes / from the airport / from their holiday / to a tree in our yard / to my classes now / to life / to my bed / to New York City / to school / to my office. 2. Adverb of Time: a moment / two hours / today. Posteriormente, fizemos a busca desses termos no Corpus de Referncia.

Padro

Ocorrncias Corpus de Estudo (81.773 palavras)

Ocorrncias Corpus de Referncia (por 100.000 palavras)

Come back to + noun / possessive pronoun (some place) Come back from + noun / possessive pronoun (some place) Come back in + adverb of time 3 0,84 4 0,72 8 4

Tabela 21 Padres do phrasal verb COME BACK no Corpus de Referncia

Percebemos que o padro Come back to + noun/possessive pornoun (some place) o mais frequente em ambos os corpora. Lembramos que os termos de busca pesquisados, tanto no AntConc quanto no CoCa, consideraram todas as formas verbais a seguir, exceto as

87

negativas, visto que no houve registros de padres com formas negativas em nosso corpus de estudo: come back, comes back, came back, coming back. Alm disso, tambm foi considerado o fato do phrasal verb come back ser separvel, e, portanto, na busca do AntConc tivemos que utilizar mais uma vez o caractere Curinga (*) para criar os termos come * back, comes * back, came * back e coming * back. 3.2.7 Padres do phrasal verb find out

O phrasal verb find out aparece 11 vezes no corpus. Para este phrasal verb, encontramos trs padres principais de concordncia: Padro Find out how Find out what Find out who Significado Descobrir como ou quanto Descobrir o qu Descobrir quem Frequncia 2 4 2

Tabela 22 Padres do phrasal verb FIND OUT no Corpus de Estudo

O grupo de palavras que acompanha o phrasal verb find out, de acordo com os padres selecionados acima, esto divididos conforme abaixo: 1. How: how much / how you can get involved / how their food was. 2. What: what he knows about electronic tags? / what you're up to / what really happened. 3. Who: who I am? / who finally did it. Posteriormente, fizemos a busca desses termos no Corpus de Referncia:

88

Padro Find out how Find out what Find out who

Ocorrncias Corpus de Estudo (81.773 palavras)

Ocorrncias Corpus de Referncia (por 100.000 palavras)

2 4 2

0,75 2 0,65

Tabela 23 Padres do phrasal verb FIND OUT no Corpus de Referncia

Percebemos que o padro Find out what o mais frequente em ambos os corpora. Lembramos que os termos de busca pesquisados, tanto no AntConc quanto no CoCa, consideraram todas as formas verbais a seguir, exceto as negativas, visto que no houve registros de padres com formas negativas em nosso corpus de estudo: find out, finds out, found out e finding out. Alm disso, tambm foi considerado o fato do phrasal verb find out ser separvel, e, portanto, na busca do AntConc tivemos que utilizar mais uma vez o caractere Curinga (*) para criar os termos find * out, finds * out, found * out e finding * out. 3.2.8 Padres do phrasal verb get out

O phrasal verb get out aparece 10 vezes no corpus. Para este phrasal verb encontramos apenas um padro principal de concordncia: Padro Get + personal pronoun (somebody) out of Significado Retirar algum de algum lugar Frequncia 6

Tabela 24 Padres do phrasal verb GET OUT no Corpus de Estudo

89

As palavras que acompanham o phrasal verb get out, de acordo com o padro selecionado acima, so: It, him, himself e us. Posteriormente, fizemos a busca desse termo no Corpus de Referncia:

Padro Get + personal pronoun (somebody) out of

Freq. Corpus de Estudo 6

Freq. CoCa 0,65

Tabela 25 Padres do phrasal verb GET OUT no Corpus de Referncia

Para a busca no corpus de referncia da expresso get (somebody) out of tivemos que realizar a seleo dos termos get [*p] out of, gets [*p] out of, got [*p] out of e getting [*p] out of, para encontrar os padres dos pronomes IT, HIM, HIMSELF e US, que foram aqueles encontrados no corpus de estudo.

Figura 31 Busca pelo Termo get [*p] out of

90

3.2.9 Padres do phrasal verb go back

O phrasal verb go back aparece 10 vezes no corpus. Para este phrasal verb, encontramos apenas um padro de concordncia: Padro (Not) Go / going back to + noun / possessive pronoun (some place) Significado Retornar ou retornando para algum lugar Frequncia 9

Tabela 26 Padres do phrasal verb GO BACK no Corpus de Estudo

O grupo de palavras que acompanha o phrasal verb go back, de acordo com os padres selecionados acima, esto divididos conforme abaixo: 1. Some Place: to my lawyer / to Delray / university / to the boat / to the court / to Marsh Harbour / to ManOWar. Posteriormente, fizemos a busca desses termos no Corpus de Referncia:

Padro

Ocorrncias Corpus de Estudo (81.773 palavras)

Ocorrncias Corpus de Referncia (por 100.000 palavras)

(Not) Go / going back to + noun / possessive pronoun (some place) 9 11

Tabela 27 Padres do phrasal verb GO BACK no Corpus de Referncia

Lembramos que os termos de busca pesquisados, tanto no AntConc quanto no CoCa, consideraram todas as formas verbais a seguir, inclusive as negativas, visto que houve registros de padres com formas negativas em nosso corpus de estudo para o padro Go/going back to: go back to, goes back to, went back to, going back to.

91

Alm disso, tambm foi considerado o fato do phrasal verb go back ser separvel, e, portanto, na busca do AntConc tivemos que utilizar mais uma vez o caractere Curinga (*) para criar os termos go * back to, goes * back to, went * back to, going * back to. 3.2.10 Os padres mais comuns dos phrasal verbs no corpus de estudo

Para finalizar esta seo, conforme a anlise que acabamos de realizar, segue abaixo um resumo dos padres mais comuns de concordncia encontrados no corpus de estudo: 1. Go out go out of my mind, go out and + verb, go out for + noun (something), go out with + personal pronoun (somebody); 2. Be out be out of the + noun / possessive pronoun (some place), be out in the + noun / possessive pronoun (some place), be out there, be out and + verb, be out + adverb of time (tonight/this morning); 3. Look for looking for (no complement), look for + personal pronoun (somebody), look for + noun / possessive pronoun (something); 4. Go on What`s going on? , go on with + noun / pronoun (somebody/something) , go on and on (no complement), go on and + verb; 5. Work on Working on + Ing Verb, Work on + noun / possessive pronoun (something); 6. Come back come back to + noun / possessive pronoun (some place) , come back from + noun / possessive pronoun (some place), come back in + adverb of time (some time); 7. Find out Find ou how, find out what, find out who; 8. Get out get + personal pronoun (somebody) out of; 9. Go back (not) go/going back to + noun / possessive pronoun (some place).

92

importante notar que somente trs padres tiveram taxas prximas de ocorrncias em ambos os corpora:

Padro

Ocorrncias Corpus de Estudo (81.773 palavras)

Ocorrncias Corpus de Referncia (por 100.000 palavras)

Go out / going out of my mind Be out there (Not) Go / going back to + noun / possessive pronoun (some place)

3 3 9

4 3 11

Tabela 28 Padres tiveram taxas prximas de ocorrncias em ambos os corpora

De modo geral os phrasal verbs encontrados no corpus de estudo tiveram taxas de frequncia bem mais baixas no corpus de referncia, porm como foram encontrados no gnero Spoken, conseguimos comprovar a relevncia deles para o aprendizado da lngua inglesa. Alm disso, devemos observar que nenhum dos phrasal verbs possuem o mesmo significado que seu verbo constituinte. Em nossa pesquisa os phasal verbs mais frequentes so formados pelos verbos to go, que significa ir; to get, que dentre os diversos significados possveis, pode ser conseguir; to be, que o verbo ser / estar; to look, que o verbo olhar; to find que o verbo encontrar; to work que o verbo trabalhar, funcionar e to come que o verbo vir. 3.3

Atividades Propostas

Nesta seo so apresentadas duas propostas de atividades envolvendo o aprendizado de phrasal verbs e uma proposta de atividade envolvendo a redao de e-mails em ingls com a utilizao dos phrasal verbs aprendidos, considerando inclusive, os padres mais comuns de concordncia apresentados na seo anterior.

93

A primeira atividade foi preparada para introduzir aos aprendizes os significados dos phrasal verbs go out, be out, look for, go on, work on, come back, find out, get out e go back, portanto, os exerccios visam a associao da partcula preposio ou advrbio + verbo para a formao dos phrasal verbs. um exerccio muito til para esclarecer aos aprendizes que os phrasal verbs possuem significados diferentes daqueles verbos que participam de sua formao. A segunda atividade apresenta os principais padres desses phrasal verbs para os aprendizes. Sendo assim, elaboramos o exerccio extraindo fragmentos do corpus de estudo e corpus de referncia em que esses phrasal verbs aparecem, e solicitamos que os alunos escolham qual das alternativas (a ou b) se encaixa melhor no contexto. E por fim, a terceira atividade trata-se de uma proposta de elaborao de um e-mail informal. O aluno ter um e-mail modelo, e dever incluir pelo menos trs phrasal verbs aprendidos na atividade 1, bem como ficar atento aos padres que foram apresentados na atividade 2. 3.3.1 Atividade 1

1. Go out

Complete the text with the phrasal verbs from the box in the correct tense. Go on Work on Look for Find out Be out Come back Go back Get out

I normally stay in on Fridays night and on Saturdays I to a pub with my friend Ann. We for dinner but She always .. about her companys problems. Shes of the office all day, and when She Shes tired but She wants to

94

. projects. Shes a new job and Shell a better company. 2. Complete the sentences with the preposition/adverbial particle from the box. out back for on

1. Im looking . Sarah. Have you seen her? 2. I usually come home . at 6 am on Fridays. 3. Come . and take a seat . 4. The scientist found. the problem 5. Get . of here! 6. Go away ! And dont come . ! 7. Look . ! The traffic lights are red. 8. She doesn't get . much now she has her baby. 9. Clean up this mess, Kids!!! Then we can go . . 10. He and I go. a long way- we were at school together. 11. Scientists are working genetically modified crops and foods. 12. I cant go . tonight. I have to do my homework . 13. Hes lost his keys. Hes looking . . 3. Complete the sentences. Use a verb form the box plus the

preposition/adverbial particle. If necessary, put the verb into the correct form. go be get find work come look

+ on /out/ back/ for 1. I don't know where my book is. I have to . it. 2. She . on a visit for the day. 3. I went to the library to . all I could about the life and work of Joe Meek. 4. The investigators have no clues to . . 5. Theyre . the cure for arthritis.

95

6. We . to work after the break. 7. The dog . because I left the door open. 8. There are loads of people out in the street; what's .? 9. .the olive oil for the salad. 10. "Hello, is John in?" "No, I'm sorry, he .right now. 3.3.2 Atividade 2

Choose the correct answer: 1) Over half an hour ago I told you I'm pregnant. No response. What the hell have you been doing I'm______________________here. a) going out of my mind b) getting (somebody) out of 2) I'm guessing the Turkish thing is about money. Can you

_____________much and I`ll see what I can rustle up. By the way the Turks aren't his only problem. David Crutton is itching to stick him with the office thefts. I'm surprised the cops haven't been to talk to him yet. a) look for (something) b) find out how 3) Mr-KINNEY: This community has a right to have that alternative considered for it just as has happened already in Kentucky and Colorado and Maryland and Indiana, all of which rejected incineration and are now perfectly happy with neutralization; low-temperature, low-pressure, no emissions. PEEPLES: Kinney also doesn't think the community is prepared for an emergency. Local schools are still _____________ constructing overpressurized rooms to be used as shelters. The Army has promised not to burn the liquid nerve agent during school hours or to transport weapons during school hours from outdoor igloos, where they're currently stored, into the incinerator. Army officials have maintained all along that the weapons

96

pose the greatest danger to the community not in an incinerator but sitting in their earthen bunkers, and many here believe them. Mr-KEITH-HOWLAND: I'm happy that the beginning of the end has started. a) working on + (Ing Verb) b) go on and + verb 4) Just caught Susi in the kitchen heating it up on the new oven. She says Ted's ________________the Andes with both, frostbite and a traditional Argentinian remedy. But she assured me it's 100% organic, then We can safely warm up our spaghetti at lunchtime. a) go back to b) come back from 5) Dad and I ______________. Can you keep an eye on your sister? I don't want to come home and find a policewoman babysitting her again. a) are out tonight b) go out for (something) 6) Mr-KNEPPER: I'm saying that when you inject yourself into that kind of arena when you're dealing with alcohol, when you're dealing with anonymous sex, that the rules change. That there are certain signals that you're sending out that the man can reasonably interpret as an invitation to sex. You're ____________ his room to rhapsodize philosophical about Plato. You're not going to discuss homework tips. These are the rules of the arena. And the point that the column makes in the later paragraphs is that if you're uncomfortable with this, then you shouldn't be having anonymous sex. Of course, if she says no at any time, then that implicit consent has been revoked and at that point it would constitute rape. MARTIN: Okay. And the reaction was what? a) not going back to

97

b) coming back to 7) So you survived your first hurricane. Exciting I know. Growing up as kids we would secretly be happy about hurricanes projected our way because it ____________school for quite some time. Of course we weren't really old enough to truly understand the devastation they can cause. Anyway theres always a bustle and excitement around the days prior to the storm wondering where it's going to hit and how strong it will be. Sometimes they even do loops and turns which are totally unexpected. I'm glad to hear you all weren't hit. a) was out of the b) got us out of 8) And she was beautiful. And she didn't talk. But we were eyeball to eyeball. And I'm yelling at her, Christina-Taylor Green, don't you die on me, don't you go away from me, girlfriend. You stay. Don't leave me here to do this by myself. Stay here. Where are -- don't -- where are -- Christina? ChristinaTaylor Green? And she's looking at me, and it was -- she was wondering. She was confused. She was asking me, ________________? a) what `s going on b) Looking for (somebody) 9) BRADY: She was very mad at me. SCHLESINGER: Really? Are you surprised? Ms-LIPPERT: Tell them how great the dress looked. Mr-KASARSKY: The dress was fabulous. SCHLESINGER: A dress so tight that she couldn't sit down. Ms. BRADY: Well, you know... (Home-video-of-a-we) SCHLESINGER: (Voiceover) Your words. Ms. BRADY: (Voiceover) Some days people genuinely feel that I've made fun of them at their wedding and they are really stunned. But I never feel

98

that I'm making fun of people. I am ______________humor in a day that sometimes people feel has and should have no humor in it. a) looking for (something) b) going out for (something) 3.3.3 Atividade 3

Write an e-mail to some friend, telling him/her about your personal life. You should write at least 150 words. Allow yourself 20 minutes for this task. You do not need to write your own e-mail address. You must use at least 3 phrasal verbs from list below: go out, be out, look for, go on, work on, come back, find out, get out , go back Look this sample e-mail: Date: Tue, 21 Jun 2011 16:14:51 -0500 Subject: Re: Hey.. From: xxxxxxxx@gmail.com To: yyyyyyyy@hotmail.com

Hi my Friend!! Thank you all is well here. We have had rain lighting n thunder, high winds and some hail since early morning!.. so no sunny skies here but rain is needed in many states, not being this one... have plenty rain so far. I am doing well, just watched alot of television today and also thinking of how I will decorate my bedroom in colors. I am thinking of a nice summer white comforter and matching pillow, white sheer curtains and some soft pastel colors for pics over the bed, maybe cottage look, simple and elegant I love!!! I have never been to the cheeseburger party in the Bahamas. I have been told it's a grand time. My to be x hubby is very good friends with Bob Henderson n Pat. I met your sister only twice, she is a lovely lady and I like her alot. The

99

cheeseburger party is in July first week.. but, I will not be attending. Maybe, one year if you plan to go, we can meet up and go together. I think that would be such fun. I am not in liking sailboats very much, they lean over too much and makes me sick. lol... my xhubby has a yacht but I never sailed on it ever, only saw it a few times whilst in florida and it was in the dock. Honestly, when he bought this boat is when our marriage went down the tubes, and much money spent on that boat. I hop they all have fun, but I will not be there. I am baking banana nit bread, and the house smells lovely. Do you like this bread? I make many different desserts, but I love this one too. hee.. I don't overeat foods and bakery foods, just enough to enjoy and not gain weight. I would love to try the avacados form minca, I love them to eat alone or with other foods. I also love plantains.. and flan too?? Do you bake? I will go out with nekka for a walk when the rain finishes, she is my lil doll face baby dog!! I hope you are having a great night and enjoy. God's blessings to you and your parents. huggs, XXX

Respostas da Atividade 1: 1 . I normally stay in on Fridays night and on Saturdays I GO OUT to a pub with my friend Ann. We GO OUT for dinner but She always GOES ON about her companys problems. Shes IS OUT of the office all day, and when She COME BACK. Shes tired but She wants to WORK ON projects. Shes LOOKING FOR a new job and Shell FIND OUT a better company. 2 . 1) FOR 2) BACK 3) BACK 4) OUT 5) OUT 6) BACK 7) OUT 8) OUT 9) OUT 10) ON 11) ON 12) OUT 13) FOR. 3 1) LOOK FOR 2) IS OUT 3) FIND OUT 4) GO ON 5) WORKING ON 6) WENT BACK 7) GOES OUT 8) LOOKING FOR 9) GETS OUT 10) IS OUT Respostas da Atividade 2: 1) a 2) b 3) a 4) b 5) a 6) a 7) b 8) a 9) b

100

CONSIDERAES FINAIS O presente trabalho buscou realizar uma anlise da utilizao dos phrasal verbs na comunicao informal por e-mail, dada a sua importncia para os falantes da lngua inglesa, e tambm considerando a dificuldade que muitos aprendizes enfrentam pela falta de similaridade com qualquer padro que possamos ter na lngua portuguesa, ou em qualquer outra lngua de origem latina. Como vimos, os phrasal verbs so muito utilizados na comunicao informal, tanto falada quanto escrita, e muito comum um falante de ingls como segunda lngua acabar deixando de se comunicar com maior naturalidade e fluncia devido s lacunas de aprendizado de phrasal verbs. Ns, brasileiros, por exemplo, como falantes de uma lngua latina, temos maior facilidade de lembrarmo-nos de verbos e palavras da lngua inglesa que tambm possuem origem latina, os chamados cognatos, porm, para o discurso informal esses verbos de origem latina podem no se encaixar no contexto. Alm disso, algumas aes somente podem ser expressas com a utilizao de um phrasal verb, um verbo acrescido de uma partcula preposio ou advrbio. Nossa pesquisa utilizou do gnero e-mail para analisar a frequncia dos phrasal verbs na comunicao informal em ingls, e para tanto, encontrou o embasamento terico e prtico na Lingustica de Corpus, uma rea que investiga a linguagem de uma maneira emprica e probabilstica, com o auxlio de softwares de computadores, chamados de concordanciadores, listadores de palavras e etiquetadores. A pesquisa foi norteada pelos seguintes questionamentos: 1. Qual a ocorrncia de phrasal verbs no corpus de estudo? 2. Quais so os phrasal verbs mais frequentes no corpus de estudo? 3. Qual a frequncia dos mesmos no corpus de referncia? 4. Com quais padres lxico-gramaticais podem ser encontrados? 5. Os padres encontrados no corpus de estudo tambm esto presentes no corpus de referncia?

101

A metodologia empregada na pesquisa consistiu de 1) fazer o levantamento do corpus de estudo; 2) realizar a etiquetagem do corpus de estudo com o auxlio do etiquetador CLAWS 4; 3) gerar a lista de palavras e as linhas de concordncia com o auxlio do software AntConc; 4) planilhar os phrasal verbs encontrados nas linhas de concordncia com o auxlio do MS Excel; 5) realizar a anlise comparativa do corpus de estudo com o corpus de referncia: o Corpus of Contemporary American English (CoCa); 6) realizar a anlise dos padres de concordncia com o auxlio do AntConc e do corpus de referncia. Os resultados da pesquisa, bem como s respostas aos questionamentos, foram apresentados no Captulo 3. Todos os dados referentes ao corpus de estudo e corpus de referncia, bem como a relao dos phrasal verbs mais frequentes e seus padres mais comuns, foram apresentados de modo direto, com o auxlio de tabelas, figuras e grficos. Esclarecemos que nossa inteno no foi criar uma lista de phrasal verbs que devem ser memorizados, mas sim chamar a ateno para o fato de que existem muitos phrasal verbs na lngua inglesa, com seus diferentes significados e formas de emprego, e que estes devem ser utilizados, pois so recursos poderosos para melhorar o vocabulrio e a expresso comunicativa em ingls. Esperamos que nosso trabalho possa despertar nos professores de ingls uma maior ateno na elaborao de propostas de aulas para o ensino de phrasal verbs, e tambm possa servir de base para futuros trabalhos na rea de lingustica de corpus. Por ltimo, gostaramos de registrar que a experincia vivenciada durante esta pesquisa foi enriquecedora, pois nos proporcionou contato com uma rea de estudo da linguagem que no to atual, mas que para ns, como graduandas em Letras, totalmente nova: a lingustica de corpus. A pesquisa ainda nos mostrou o valor do ato de pesquisar e a importncia do processo de aprendizado contnuo.

102

REFERNCIAS BIBLIOGRFICAS Corpus Lingustico. In Wikipdia, a enciclopdia livre. Disponvel em

http://pt.wikipedia.org/wiki/Corpus_linguistico. Acesso realizado em 10/09/2011. Lingustica de Corpus. In Wikipdia, a enciclopdia livre. Disponvel em http://pt.wikipedia.org/wiki/Lingustica_de_corpus. 10/09/2011. Computador, corpus e concordncia no ensino da lxico-gramtica de lngua estrangeira. In G1 Real. Disponvel em http://teacherwillians.g1real.com.br/?p=400. Acesso realizado em 13/09/2011. Berber Sardinha, Tony (2000). Lingustica de Corpus histrico e problemtica. So Paulo: LAEL PUCSP. Berber Sardinha, Tony (2004). Lingustica de Corpus. So Paulo: Manole. Rampazzi, Elaine (2008). A Lingustica de Corpus e os Seriados Seinfeld e Friends como base para o ensino de verbos frasais e verbos preposicionados para alunos de Lngua Inglesa. So Paulo: PUCSP. Gonzalez, Zeli (2007). Lingustica de Corpus na Anlise do Internets. So Paulo: PUCSP. Vicentini, Giseli (2006). A Lingstica de Corpus e o seriado Friends como base para o ensino de chunks em sala de aula de Lngua Inglesa. So Paulo: PUCSP. Ferreira, Elias (2006). Palavra Frequente, Pronncia Diferente: A Lingustica de Corpus auxiliando o ensino da pronncia do ingls como lngua estrangeira. So Paulo: PUCSP. Alusio, Sandra Maria e Barcellos Almeida, Gladis Maria de (2006). O que e como se constri um corpus? Lies aprendidas na compilao de vrios corpora para pesquisa lingustica. Porto Alegre: UNISINOS. Rigueira, Adriana Mesquita (2007). Ensino e Aprendizado de Phrasal Verbs: Alguns Insights a partir da Pesquisa com Leitura. Rio de Janeiro: PUC Rio. Acesso realizado em

103

Gonalves, Lourdes Bernardes (2006). A compilao de um Corpus de Referncia Literrio. XI Simpsio Nacional de Letras e Lingustica, Uberlndia: Universidade Federal de Uberlndia. Martins, Mnica Saddy, Caseli, Helena de Medeiros e Nunes, Maria das Graas Volpe (2001). A construo de um corpus de textos paralelos ingls-portugus. So Carlos: NILC - ICMC-USP. Santos, Elisa Cristina do (2008). Corpus multilngue especializado em reciclagem: uma anlise das faixas de frequncia de formas e ocorrncias. So Paulo: USP. Hunston, S. (2002). Corpora in Applied Linguistics. Cambridge : Cambridge University Press. TAGNIN, S. E. O. Glossrio de Lingustica de Corpus. So Paulo: HUB Editorial, 2010. Phrasal Verb. In Wikipdia, a enciclopdia livre. Disponvel http://pt.wikipedia.org/wiki/Phrasal_Verb. Acesso realizado em 07/09/2011. em

Multi Word Verbs. In Scribd. Disponvel em http://pt.scribd.com/doc/4007449/MultiWord-Verbs. Acesso realizado em 14/09/2011. Multi Word Verbs in Early Modern English, A corpus based study. In Google Books. Disponvel em http://books.google.com.br/books?id=8kfvotMI5hYC&printsec=frontcover&dq=MUL TI-WORD+VERBS&hl=pt-BR&ei=jp-RTqm9H8Pn0QG7tUa&sa=X&oi=book_result&ct=result&resnum=2&ved=0CDAQ6AEwAQ#v=onepa ge&q&f=false. Acesso realizado em 11/09/2011. The English Phrasal Verb. In University of North Carolina Website. Disponvel em http://www.uncp.edu/home/canada/work/caneng/phrasal.htm. em 07/09/2011. Phrasal Verbs. In Advanced English Grammar Website. Disponvel em http://www.advanced-english-grammar.com/phrasal-verbs.html. Acesso realizado em 07/09/2011. Acesso realizado

104

Phrasal Verbs in Britain. In Phrasal Verbs in Britain Website. Disponvel em http://www.phrasalverbsinbritain.com. Acesso realizado em 07/09/2011. Cordeiro Nogueira, Robson e Bezerra dos Santos, Htalo Wagner (2004). O ENSINO E A APRENDIZAGEM DE PHRASAL VERBS. Recife: UFPE. B. Faria, Selma, Chaves Bernardo, Daniela e Xavier Garcia Silva, Fabola (2007). Phrasal Verbs em Ingls: aprender o melhor remdio. Rio de Janeiro: UFRJ. The History of Multi-Word Verbs. In Google Books. Disponvel em

http://books.google.com.br/books?id=8kfvotMI5hYC&pg=PA83&lpg=PA83&dq=Th e+History+of+Multiword+Verbs&source=bl&ots=f3RN3aFyji&sig=4eHulql2rfvLXTIj _2MRDQYMwr4&hl=ptBR&ei=s6hqTpPYPMu4tgeYx9TKBQ&sa=X&oi=book_resul t&ct=res ulti-word%20Verbs&f=false. Acesso realizado em 07/09/2011. Phrasal Verbs - Verbos Preposicionais. In Colgio Web. Disponvel em http://www.colegioweb.com.br/ingles/phrasal-verbs.html. Acesso realizado em 07/09/2011. Phrasal 07/09/2011. MULTI-WORD VERBS, por Ricardo Schtz (2007). Disponvel em Verbs. In Ingls VIP. Disponvel Acesso realizado em em

http://www.inglesvip.com/grammar/phrasal-verbs.html.

www.sk.com.br/sk-twow.html. Acesso realizado em 07/09/2011. AntConc Download and Web Tutotial. In Laurence Anthony`s Website Disponvel em http://www.antlab.sci.waseda.ac.jp/antconc_index.html. Acesso realizado em 18/09/2011. Corpus of Contemporary American English. In Wikipdia, a enciclopdia livre. Disponvel realizado em 08/10/2011. Corpus of Contemporary American English. In Brigham Young University Website. Disponvel em http://corpus.byu.edu/coca. Acesso realizado em 08/10/2011. em http://en.wikipedia.org/wiki/Corpus_of_Contemporary_American_English. Acesso

105

ANEXOS

Anexo 1 : Relao das 100 Palavras mais frequentes no Corpus de Estudo

Ranque 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38

Frequncia 2868 2667 2489 2206 1746 1702 1247 1103 873 823 811 800 664 662 655 583 576 575 552 540 499 434 431 429 422 417 416 410 402 379 353 351 329 299 298 291 286 280

Palavra the I to and you a of in is s for it on that my have me with be t so but will at your was he are we as this not out up m all do am

106

39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83

277 260 258 245 245 239 233 231 231 224 217 216 211 208 204 202 202 200 199 195 194 191 188 188 185 185 184 184 181 178 178 177 175 173 166 165 165 164 160 154 144 143 143 141 138

from can get like there know his him she her an You ll The go about It time one here had We if very re some they when good has or He now just And been well love ve too make day our by don

107

84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100

138 133 131 129 126 125 124 121 121 119 118 117 116 115 112 109 109

much going think would got them see more were want new back what off any e us

108

Anexo 2: Relao dos 193 diferentes Phrasal Verbs encontrados no Corpus de Estudo, classificados pelo nmero de ocorrncias (frequncia)

Frequncia no Corpus de Estudo Phrasal Verb Freq Phrasal Verb go out 29 keep on be out 23 lock up look for 23 make for get in 22 move away go on 18 move up work on 16 pack up come back 15 pass away get back 12 reach out put in 12 run away check out 11 run out of find out 11 run up look forward to 11 settle down move on 11 show off get out 10 slow down go back 10 stay up go up 10 throw up pick up 10 tie up sort out 10 turn to come in 9 walk out leave on 9 wind down move out 9 write in come up 8 stand up keep up 8 bring forward sing up 8 bunk off catch up 7 call on get on 7 carry off go down 7 check into look into 7 clear up make up 7 close in pass on 7 cut in put up 7 cut off sit out 7 die back turn out 7 dress up turn up 7 drive back figure out 6 drive out fill in 6 face up to take up 6 fall down check in 5 fall out come out 5 fall over

Freq 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

109

come up with go into grow up keep in kick off pay off put on sign off take on take out turn on work out ask for come by come on fall off get off get over go off go over look out put out set up show up take down bring back carry out clean up come over cool down draw up end up get away with give up hold back look up move in set in sit on take off touch down blow off bring on call in come down

5 5 5 5 5 5 5 5 5 5 5 5 4 4 4 4 4 4 4 4 4 4 4 4 4 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 2 2 2 2

finish up fire off gang up go around go by go away hand in hand on hang around hang out heat up hurry up keep around kick around kick out knock back knock off knock up light up line up live on make out make over mess up move into pass by pay for pick out press on put down rack up rake up rattle off run off run through screw up send out ship out shoot off shut down sit by sit down slow up stay away stop by

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

110

fill up focus on get around get away get away from get down get into get up give away give in head up hold out hook up

2 2 2 2 2 2 2 2 2 2 2 2 2

tidy up track down turn over wait on wait up wake up walk on walk up warm up wash down write down write off

1 1 1 1 1 1 1 1 1 1 1 1

Você também pode gostar