Você está na página 1de 33

Integrando a variao social e mtodos quantitativos na investigao sobre linguagem e cognio: para uma sociolingustica cognitiva do portugus europeu

e brasileiro
Integrating social variation and quantitative methods in the investigation of language and cognition: towards a cognitive sociolinguistics of European and Brazilian Portuguese
Augusto Soares da Silva
Universidade Catlica P ortuguesa Braga Portuguesa

Abstract
The purpose of this paper is two-fold. First it argues the case for systematic integration of language variation and corpus-based methodology with its accompanying methods of quantitative and statistical analysis in the cognitive study of language, as it has been occurring in Cognitive Linguistics. The second and most important goal is to present a program for Cognitive Sociolinguistics of European and Brazilian Portuguese, centered in the issue of convergence and divergence between the two national varieties in the past 50 years. First, we will highlight two instances of tension in the current stage of the development of Cognitive Linguistics (one focus of tension on the object and the other on the methodology). Then we will show how its usage-based perspective implies to integrate and to correlate a social object and an empirical methodology. We will then identify specific contributions of the emergent Cognitive Sociolinguistics and onomasiological profile-based methodology to the study of language variation. Finally, we will show the results of our sociolexicological research about convergence and divergence in the vocabulary of

SILVA

50

football and clothing the two national varieties converge for football and diverge for clothing and we point out the extension of this first stage of research to the domains of functional words and non-lexical variables.

Keywords
Cognitive Linguistics; Cognitive sociolinguistics; Corpus linguistics; Denotational synonyms; European/Brazilian Portuguese; Language variation; Methodology; Quantitative methods; Social cognition; Sociolectometry; Usage-based model; Statistics.

Resumo
Este artigo tem um objectivo duplo. Um argumentar sobre a necessidade de integrar sistematicamente a variao lingustica e a metodologia do corpus acompanhada de mtodos quantitativos e de anlise estatstica no estudo cognitivo da linguagem, tal como tem sido desenvolvido pela Lingustica Cognitiva. O outro, e mais importante, apresentar um programa de sociolingustica cognitiva do portugus europeu e brasileiro centrado na questo da convergncia e divergncia entre as duas variedades nacionais nos ltimos 50 anos. Primeiramente, assinalaremos duas tenses no desenvolvimento actual da Lingustica Cognitiva (uma no objecto e outra no mtodo) e mostraremos como que a sua perspectiva baseada no uso implica integrar e complementar o objecto social e a metodologia emprica. A seguir, identificaremos os contributos especficos da emergente Sociolingustica Cognitiva e do mtodo dos perfis onomasiolgicos para o estudo da variao lingustica. Finalmente, apresentaremos os resultados da nossa investigao sociolexicolgica sobre convergncia e divergncia nos vocabulrios do futebol e do vesturio as duas variedades convergem no futebol e divergem no vesturio e indicaremos as extenses desta primeira fase da investigao para os domnios das palavras funcionais e das variveis no-lexicais.

Palavras-chave
Cognio social; Estatstica; Lingustica Cognitiva; Lingustica de corpus; Metodologia; Mtodos quantitativos; Modelo baseado no uso; portugus europeu/brasileiro; Sinnimos denotacionais; Sociolectometria; Sociolingustica cognitiva; Variao lingustica.

Rev. Est. Ling., Belo Horizonte, v. 16, n. 1, p. 49-81, jan./jun. 2008

51

1. Introduo

ara alm do epteto que lhe d o nome e a define como o movimento mais consistente e consequente de estudo cognitivo da linguagem, a Lingustica Cognitiva apresenta-se tambm como um modelo baseado no uso (LANGACKER, 1988, 2000) e um modelo (re)contextualizante da linguagem, no sentido de (re)introduzir no estudo das lnguas as vrias facetas do contexto, que foram eliminadas pelo programa autonomista da Gramtica Generativa. Tais caractersticas implicam, j por si, uma ateno particular pela variao lingustica e um interesse preferencial por mtodos empricos. Todavia, e por um lado, a filosofia experiencialista da Lingustica Cognitiva (LAKOFF & JOHNSON, 1999), em particular a tese da corporizao do pensamento e da linguagem, tende a conceber a cognio humana como fenmeno individual e invarivel ou universal; por outro lado, a mesma filosofia no-objectivista e a assuno da centralidade do significado no estudo cognitivo das lnguas mostram alguma relutncia pelos mtodos empricos, por natureza, objectivistas das descries lingusticas, tendendo a preferir a introspeco, como mtodo de acesso directo aos fenmenos semnticos, por natureza menos objectivos do que quaisquer outros fenmenos lingusticos. Criam-se, assim, duas tenses no desenvolvimento actual da Lingustica Cognitiva: uma tenso no objecto da pesquisa entre o apelo a todas as dimenses contextuais da linguagem, como dimenses da experincia humana, incluindo os aspectos sociais, culturais e variacionais, e a tradicional concepo individual e neurolgica da cognio humana; e uma tenso no mtodo da pesquisa entre o interesse cada vez maior pelos mtodos empricos, sejam experimentais, neurofisiolgicos ou de corpus (ver GONZALEZ-MARQUEZ et al., 2007), e um certo cepticismo terico pela metodologia objectivista no estudo de fenmenos subjectivamente experienciados, como so os lingusticos em geral e os semnticos em particular. Procuramos neste estudo argumentar, continuando a posio construtiva de alguns autores, como Geeraerts (2005, 2006), sobre a importncia ou, melhor,

SILVA

52

a inevitabilidade de integrar sistematicamente a variao social e mtodos quantitativos baseados em corpora no estudo cognitivo das lnguas. O segundo e mais importante objectivo deste artigo apresentar, no quadro da emergente Sociolingustica Cognitiva (KRISTIANSEN & DIRVEN, no prelo), um programa de sociolingustica cognitiva do portugus europeu e brasileiro centrado na questo da convergncia ou divergncia entre as duas variedades nacionais. Nas duas primeiras seces, dedicadas s duas tenses referidas, exporemos as razes para integrar o objecto social e a metodologia emprica na perspectiva da Lingustica Cognitiva, j teoricamente favorvel a estes desenvolvimentos. Nas duas seces seguintes, identificaremos os contributos especficos da sociolingustica cognitiva para o estudo da variao lingustica e apresentaremos o mtodo da variao onomasiolgica envolvendo sinnimos denotacionais e os mtodos quantitativos para medir a convergncia e a divergncia entre as duas variedades nacionais do portugus. Nas duas ltimas seces, sumariaremos os resultados da anlise sociolexicolgica sobre o vocabulrio do futebol e o vocabulrio do vesturio e indicaremos as extenses desta primeira fase da investigao para os domnios das palavras funcionais, particularmente preposies, e das variveis gramaticais.
2 . Cognitivo e social

Muito sinteticamente, podemos definir a Lingustica Cognitiva como um modelo recontextualizador, experiencialista, orientado para o significado e baseado no uso. Cada uma destas quatro caractersticas implica uma investigao socialmente orientada. O mesmo dizer que, relativamente tenso no objecto da pesquisa, anteriormente mencionada, temos aqui quatro razes intrnsecas para integrar sistematicamente o social no cognitivo e, num plano mais geral, entender a cognio como cognio social. Como modelo recontextualizador, em resposta descontextualizao da gramtica, exemplarmente efectuada pela Gramtica Generativa, a Lingustica Cognitiva no poder deixar de incorporar nenhuma das facetas do contexto: no s as bases cognitivas e experienciais dos falantes ou contexto cognitivo, como tambm o nvel interaccional do uso lingustico ou contexto situacional e o ambiente sociocultural da lngua ou contexto social. A integrao sistemtica dos aspectos sociais da linguagem nas diversas linhas de investigao cognitiva das lnguas constituir a fase final da expanso da Lingustica Cognitiva.

Rev. Est. Ling., Belo Horizonte, v. 16, n. 1, p. 49-81, jan./jun. 2008

53

Como modelo experiencialista, a Lingustica Cognitiva dever atender a todas as dimenses da experincia humana, construdas pela e na linguagem, no s a experincia individual (corprea, neurofisiolgica), como tambm a experincia colectiva, social e cultural e com esta naturalmente as diferenas entre culturas, grupos sociais ou mesmo indivduos. Como veremos mais adiante, esta implicao coloca o desafio de reinterpretar a cognio como cognio social (ou cognio situada) e especificamente saber como que interagem factores individuais, neurofisiolgicos e universais, de um lado, e factores interindividuais, socioculturais e variacionais, do outro. Como modelo orientado para o significado, a Lingustica Cognitiva no poder menosprezar a variao sociolingustica, por duas ordens de razes mais especficas: por um lado, os traos semnticos no-ortodoxos da salincia e vaguidade, amplamente explorados em Semntica Cognitiva, contribuem para a variao lingustica; por outro lado, a variao sociolingustica constitui uma forma especfica de significado. Efectivamente a variao lingustica d origem a diferentes tipos de significado no-denotacional: o significado emotivo (de termos pejorativos, por exemplo), o significado estilstico e mais estritamente sociolingustico (de termos populares ou eruditos, regionais ou sociais) e o significado discursivo (nico de expresses como as interjeies e os marcadores discursivos; presente em termos como senhor, voc, tu e outras formas de tratamento). Finalmente, como modelo baseado no uso caracterizao de Langacker (1988, 2000), popularizada por Barlow & Kemmer (2000) e reforada em publicaes mais recentes como as de Tomasello (2000, 2003), Bybee & Hopper (2001), Croft & Cruse (2004) ou Geeraerts (2006) , a Lingustica Cognitiva no pode evitar a variao lingustica como seu objecto de investigao. A razo simples: a variao a consequncia imediata e inevitvel do uso; nunca uma comunidade lingustica totalmente homognea e qualquer lngua um diassistema social. Por outro lado, o interesse crescente pelos mtodos empricos, implicado por esta mesma razo da importncia do uso, como veremos na seco seguinte, obriga o linguista a ter em conta os aspectos variacionais. Na verdade, um corpus representativo nunca ser absolutamente homogneo, incluindo sempre alguma variao lectal, isto , relacionada com qualquer tipo de variedades ou variantes de uma lngua ou, simplesmente, lectos (dialectos, regiolectos, sociolectos, idiolectos, variedades nacionais, registos ou estilos, etc.). Mesmo que a anlise no se centre na variao lectal, esta ser sempre um factor,

SILVA

54

no sentido de que necessrio saber se a variao observvel no corpus resulta ou no de factores lectais. No h, portanto, maneira de evitar a variao lingustica a partir do momento em que se assuma sria e plenamente um modelo baseado no uso. Como alerta Geeraerts (2001, p. 53), it is impossible to take seriously the claim that Cognitive Linguistics is a usage-based approach and at the same time to neglect the social aspects of language use. Se a Lingustica Cognitiva est teoricamente bem colocada para integrar no objecto da pesquisa lingustica os aspectos sociais da linguagem e sendo certo que a investigao socialmente orientada e a investigao variacional no esto ausentes do seu programa, como veremos na seco 4, no menos verdade que o estudo sistemtico da variao intralingustica ainda uma tendncia minoritria da sua agenda. Alm disso, ou como causa disso, ela est confrontada com a existncia no seu seio de dois modos, em conflito, de definir experiencialismo e cognio, e ainda no resolveu a questo de saber como que interagem factores individuais e interindividuais. As estruturas lingusticas exprimem conceptualizaes e as conceptualizaes realizadas na e atravs da linguagem esto intrinsecamente relacionadas como o modo como os seres humanos experienciam a realidade, tanto fisiolgica como culturalmente. Constitui este experiencialismo a prpria filosofia da Lingustica Cognitiva, paradigmaticamente elaborada por Lakoff & Johnson (1999), em ruptura com o objectivismo de outras grandes correntes lingusticas, com a estruturalista e a generativista. Mas a interpretao de Lakoff & Johnson (1999), com a qual mais se identificou a Lingustica Cognitiva no seu conjunto, parcial: a tese da corporizao (embodiment) do pensamento e da linguagem ou a filosofia na carne foca a vertente individual e universal da cognio humana (o corpo um universal da experincia humana), o seu lado fsico e neurofisiolgico, recentemente explorado por Lakoff (2003) na sua Teoria Neural da Metfora. Ora, tendo a experincia humana uma dimenso tambm colectiva e interactiva, impe-se no reduzir a filosofia experiencialista e o princpio da corporizao a operaes neurais meramente individuais e reconhecer a natureza socialmente interactiva da linguagem e o seu ambiente cultural como elementos igualmente fundacionais da perspectiva cognitiva. justamente isto que tem sido reclamado por autores como Tomasello (1999), Zlatev (1999, 2003), Sinha & Jensen de Lpez (2000), Harder (2003), Bernrdez (2004, 2005). S assim que a Lingustica Cognitiva poder evitar cair no perigo do solipsismo epistemolgico ou no que Sinha (1999) designa como solipsismo neural.

Rev. Est. Ling., Belo Horizonte, v. 16, n. 1, p. 49-81, jan./jun. 2008

55

O problema est ento na prpria concepo da cognio humana e na separao entre o individual e o colectivo, o interno e o externo, o pensamento e a aco, a cognio e a actividade pensamento individual e aco colectiva, ser esta a equao adequada? Poderemos conceber a cognio sem a interaco? Poderemos continuar a assumir, como habitual na cultura ocidental (e no s), que o pensamento individual interno tem algum tipo de preeminncia sobre a actividade supra-individual externa ou sobre o pensamento dirigido para a (inter)aco? Vrios filsofos, psiclogos, neurocientistas e linguistas respondem que no. Lembremos a inseparabilidade da cognio e da emoo, demonstrada nos estudos de Damsio (1995, 2000). Efectivamente, tem havido, nos ltimos vinte ou mais anos, um alargamento significativo do mbito da cognio: desde uma perspectiva puramente interna, com a primeira gerao das cincias cognitivas, perspectiva corporizada (VARELA, THOMPSON & ROSCH, 1991; EDELMAN, 1992; DAMSIO, 1995, 2000; LAKOFF & JOHNSON, 1999; GIBBS, 2006) aberta ao exterior e, mais recentemente, incluso da situao, actividade ou interaco na cognio e, assim, noo de cognio situada ou cognio social (ZLATEV, 1997, 1999; TOMASELLO, 1999; BERNRDEZ, 2004, 2005; e, particularmente, as obras colectivas organizadas por ZIEMKE, ZLATEV & FRANK e FRANK, DIRVEN, ZIEMKE & BERNRDEZ, ambas ainda no prelo). Bernrdez (2005) sumaria importantes pontos da concepo sciocognitiva da linguagem: as lnguas existem somente na forma de actividade social; a actividade lingustica essencialmente colectiva, social por natureza; consequentemente, a linguagem um fenmeno inerentemente histrico e, como tal, fenmenos que hoje so examinados a nvel individual (como a metfora e a metonmia) so o resultado de uma cristalizao social, histrica; a actividade lingustica (o uso lingustico) determina formas e estruturas lingusticas, umas preferidas e outras no; atravs de um processo de integrao cognitiva, as formas produzidas e preferidas pela actividade lingustica so gradualmente fixadas na mente do indivduo, a ponto de a sua conexo original com a actividade se perder e, desse modo, se tornarem parte da cognio individual assim que a actividade lingustica social influencia os prprios processos cognitivos.

SILVA

56

3 . Cognitivo e emprico

Vrias das caractersticas que, como vimos na seco anterior, definem a Lingustica Cognitiva e a comprometem a incorporar sistematicamente no objecto da pesquisa lingustica a variao social, tambm a conduzem a optar pela metodologia emprica. O seu epteto de (cincia) cognitiva leva a Lingustica Cognitiva a seguir os mtodos empricos que se tm revelado adequados e produtivos no paradigma das cincias cognitivas em geral, designadamente as tcnicas experimentais da psicologia, as modelaes computacionais e a anlise neurofisiolgica. Gibbs (1994, 2006) e Lakoff (2003) so, entre outros, excelentes exemplos da aplicao de mtodos experimentais e neurofisiolgicos, respectivamente, no estudo da metfora conceptual. H, porm, que notar que esta ideia de que o cognitivo implica o emprico pode no se verificar. A prova que a Gramtica Generativa, que tomou parte na chamada revoluo cognitiva dos anos 50, sendo portanto tambm uma lingustica cognitiva, adoptou a metodologia oposta essencialmente introspectiva. Mas h que reconhecer que o adjectivo cognitivo no significa a mesma coisa nos dois quadros tericos quer lingusticos quer das cincias cognitivas em geral: na Gramtica Generativa esse epteto significou a tese da autonomia da linguagem relativamente a outras capacidades cognitivas (e no cognitivismo clssico significou o objectivismo), ao passo que na Lingustica Cognitiva isso significa justamente o contrrio, isto , que a linguagem parte integrante, e no um mdulo separado, da cognio e que, por isso mesmo, deve ser estudada no contexto de outras capacidades cognitivas. Ora, esta concepo no-autonomista da capacidade cognitiva da linguagem que propicia a adopo da metodologia emprica. Como segunda caracterstica da Lingustica Cognitiva que favorece a adopo de uma metodologia emprica, est a sua natureza de modelo baseado no uso uma orientao de baixo-para-cima, maximalista e no-redutiva, em contraste com a perspectiva de cima-para-baixo, minimalista e redutiva da Gramtica Generativa. A razo simples: no se pode ter uma lingustica baseada no uso se no se estudar o uso efectivo da lngua, e o uso efectivo da lngua manifesta-se em dados espontneos e no-eliciados de um corpus ou em dados eliciados de inquritos, tarefas de resoluo de problemas ou outras experimentaes.

Rev. Est. Ling., Belo Horizonte, v. 16, n. 1, p. 49-81, jan./jun. 2008

57

Uma terceira caracterstica da Lingustica Cognitiva que a conduz investigao emprica a sua concepo contextualizada da linguagem. O interesse pelas diferenas sociais e culturais leva-a ao interesse pela variao lingustica e o interesse pela variao sociolingustica leva-a inevitavelmente a uma metodologia baseada em dados do corpus. Eis como a implicao, vista na seco anterior, do cognitivo para o social traz consigo esta implicao do cognitivo para o emprico: o reconhecimento dos aspectos sociais da linguagem implica uma metodologia emprica de observao do uso dos dados e a forma mais natural de os encontrar em corpora textuais representativos. H, todavia, uma outra caracterstica essencial da Lingustica Cognitiva que pode favorecer a via metodolgica oposta: a nfase posta no significado lingustico joga com a ideia de que a introspeco o nico mtodo de acesso directo aos fenmenos semnticos. Como os significados no se do directamente nos dados de um corpus nem nos dados eliciados, ganha (mais) fora a ideia de que a introspeco , em ltima instncia, o mtodo apropriado para os estudar. Continuando a ideia, uma metodologia objectivista no serve para uma teoria noobjectivista. Ora, temos aqui um equvoco, que o exemplo da Psicologia ensinaria a evitar, ao demonstrar que se pode e deve estudar objectivamente fenmenos no objectivos como so os cognitivos. Ou seja: os processos cognitivos que se estudam em nvel do objecto podem ser no-objectivos, mas a descrio no metanvel terico tem que ser objectiva. Outros factores tambm podem explicar esta resistncia da Lingustica Cognitiva metodologia emprica. Um deles o prprio exemplo de algumas das principais figuras e fundadores da Lingustica Cognitiva: Langacker (1987, 1991), Talmy (2000) ou Fauconnier (1997, FAUCONNIER & TURNER, 2002) aderem, se no na teoria pelo menos na prtica, ao mtodo tradicional da introspeco (ver TALMY, 2007, para uma defesa da introspeco); no h nos seus estudos inovadores e inspiradores nenhuma anlise sistemtica de corpus nem nenhuma experimentao desenvolvida. J Lakoff, mas mais recentemente, tem procurado evidncia neurofisiolgica para a sua teoria da metfora conceptual (LAKOFF, 2003). Observe-se, a propsito, uma certa divergncia dentro da Lingustica Cognitiva entre o ramo europeu, mais adepto da metodologia emprica de corpus, e o ramo americano, mais inclinado para a metodologia introspectiva, qual herana da Gramtica Generativa. Um outro factor est no tradicional cepticismo terico em relao aos mtodos empricos, sobretudo quando esto em causa fenmenos

SILVA

58

que no so acessveis a partir de fora, que no podem ser tomados objectivamente, como so os fenmenos semnticos e todos os outros fenmenos cognitivos. E no s aquele cepticismo mais forte que considera que, face superioridade da interpretao, a evidncia emprica no necessria; como tambm o cepticismo mais moderado que considera que a evidncia emprica, por mais relevante que seja, no suficiente, pois h fenmenos subjectivamente experienciados que se lhe escapam. Num estimulante e construtivo artigo sobre metodologia em Lingustica Cognitiva, Geeraerts (2006) assevera que a lingustica actual, em geral, e a Lingustica Cognitiva, em particular, precisam de uma revoluo emprica. Os estudos lingusticos do sculo passado foram prdigos em modelos e grandes teorias. tempo, no incio deste novo sculo, de encontrar provas para refinar ou abandonar essas teorias. O que falta essencialmente o trabalho de operacionalizao emprica das hipteses lingusticas. Para esse efeito, a lingustica tem ao seu dispor vrios mtodos empricos: pode utilizar as tcnicas de experimentao da psicologia, as tcnicas da anlise neurofisiolgica, as tcnicas topogrficas e de trabalho de campo da sociologia e dispe ainda da anlise de corpus, que o mtodo emprico mais genuinamente lingustico. Mas a necessria revoluo emprica tem duas exigncias especficas: sofisticao de tcnicas e interpretao dos dados. Por um lado, no basta utilizar o corpus de um modo que Tummers, Heylen & Geeraerts (2005) classificam como investigao meramente ilustrada por um corpus, isto , no basta dispor de um corpus como mero repositrio de ocorrncias e depois analisar essas ocorrncias de modo predominantemente intuitivo. de facto este o procedimento da maior parte dos estudos que se dizem baseados num corpus. preciso fazer anlise estatstica; preciso desenvolver e utilizar mtodos de anlise quantitativa e multivariacional. Exemplos de trabalhos com aprecivel sofisticao quantitativa e estatstica dentro da Lingustica Cognitiva so os de Geeraerts, Grondelaers & Speelman (1999), Grondelaers, Speelman & Geeraerts (2002), Speelman, Grondelaers & Geeraerts (2003), Grondelaers, Geeraerts & Speelman (2007), Gries (2003), Stefanowitsch (2003), Stefanowitsch & Gries (2003, 2005). Mas trabalhos como estes so ainda uma minoria ver o estado da arte em Tummers, Heylen & Geeraerts (2005), Gries & Stefanowitsch (2006) e Gonzalez-Marquez et al. (2007). Por outro lado, a anlise de corpus nem automtica nem arredada da tarefa hermenutica. Quer isto dizer que preciso

Rev. Est. Ling., Belo Horizonte, v. 16, n. 1, p. 49-81, jan./jun. 2008

59

fazer o trabalho de operacionalizao das hipteses, isto , formular hipteses que sejam empiricamente testveis, confrontar as hipteses com os dados empricos, refinar gradualmente as hipteses confrontando-as repetidamente com os dados empricos. Assim, e contrariando o equvoco vrias vezes cometido, a investigao emprica no implica abandonar a teoria em favor de uma investigao puramente descritiva, mas antes test-la e refin-la. Em suma, a investigao emprica envolve, como Geearerts (2006) claramente explica, as seguintes tarefas: recolha e coleco representativa de dados, mtodos quantitativos e anlise estatstica, formulao de hipteses, operacionalizao de hipteses e um ciclo emprico de tipo hlice de refinamento gradual das interpretaes atravs do confronto repetido com os dados empricos.
4 . Sociolingustica Cognitiva

O social e a variao lingustica esto presentes em algumas linhas de investigao em Lingustica Cognitiva, desde o seu incio. o caso do estudo dos modelos culturais, teorias populares ou modelos cognitivos culturais, isto , representaes individualmente idealizadas e interindividualmente partilhadas sobre fenmenos sociais e culturais como o casamento, as emoes, a mente humana, a linguagem humana, o gnero e as raas, os astros, concepes sociais e polticas, normas sociais e jurdicas, desde os trabalhos reunidos por Holland & Quinn (1987) at estudos mais recentes como os coligidos por Dirven, Frank & Ptz (2003).Ainvestigao sobre estes e outros aspectos da variao cultural, incluindo as exploraes das especificidades culturais da metfora conceptual (LAKOFF, 1993; KVECSES, 2000, 2005) ou da cognio espacial (LEVINSON, 2003), constitui o que no seio do mesmo movimento se designa como lingustica cultural (PALMER, 1996). A tudo isto devem ainda juntar-se os estudos sobre linguagem e ideologia, como os de Lakoff sobre poltica (sobretudo LAKOFF, 1996) e os mais recentes reunidos em Dirven, Hawkins & Sandikcioglu (2001) e Dirven, Frank & Ilie (2001). Estes estudos exploram as conotaes negativas das ideologias e relaes de poder, mas h tambm trabalhos sobre conotaes positivas ou neutras, como o de Geeraerts (2003) sobre modelos culturais (racionalista e romntico) da variao e estandardizao lingusticas ou o de Kristiansen (2003) sobre esteretipos associados a variantes fonticas como pontos de referncia na identificao regional e social dos falantes.

SILVA

60

A variao lingustica tem sido estudada na perspectiva cognitiva (ou cognitivo-funcionalista) de trs pontos de vista: diacrnico, com a extensa investigao sobre gramaticalizao, mudana semntica e mudana fonolgica (por ex., HOPPER & TRAUGOTT, 1993; TRAUGOTT & DASHER, 2002; GEERAERTS, 1997; BLANK & KOCH, 1999; BYBEE, 2001); tipolgico e antropolgico, incluindo os estudos referidos no pargrafo anterior e outros trabalhos como os de M. Bowerman, S. Levinson e D. Slobin sobre diferenas interlingusticas; e psicolingustico, sobre a aquisio e o desenvolvimento da linguagem, destacando-se o estudo de Tomasello (2003). Mas a variao intralingustica ou diversidade sociolingustica, essa tem sido menos estudada dentro da Lingustica Cognitiva. Representam esta linha de investigao os estudos exemplares de Geeraerts, Grondelaers & Speelman (1999) e Speelman, Grondelaers & Geeraerts (2003) sobre a variao lexical e com uma rica metodologia quantitativa e variacional de corpus, o trabalho de Kristiansen (2003) sobre variao fontica e a colectnea de estudos organizada por Kristiansen & Dirven (no prelo), institucionalizando a rea emergente da sociolingustica cognitiva. Mais centrada na variao lingustica, a Sociolingustica Cognitiva procura, no entanto, integrar as linhas anteriores de investigao socialmente orientada, examinando as correlaes entre a variao lingustica e modelos culturais, a variao lingustica e a diversidade social e cultural, a variao lingustica e ideologias e incluindo as questes de poltica da lngua. Cabe perguntar o que que h de especfico na emergente sociolingustica cognitiva e que contributo pode ela oferecer investigao sociolingustica em geral? Podemos apontar trs especificidades e contributos. Em primeiro lugar, a prpria perspectiva cognitiva dos fenmenos variacionais; concretamente, a aplicao dos diversos modelos descritivos j existentes no estudo da variao lingustica. Por exemplo, a abordagem da variao fontica pela teoria do prottipo (KRISTIANSEN, 2003) ou a utilizao de metforas conceptuais e modelos culturais na identificao de atitudes lingusticas (GEERAERTS, 2003). Em segundo lugar, a explorao da cognio social, particularmente, a elucidao da interaco dialctica entre o nvel individual cognitivo e o lado social das normas colectivas. Finalmente, mas no menos importante, o desenvolvimento de mtodos quantitativos baseados em corpora e de mtodos de anlise multivariacional da confluncia de factores conceptuais, discursivos e variacionais dos fenmenos lingusticos.

Rev. Est. Ling., Belo Horizonte, v. 16, n. 1, p. 49-81, jan./jun. 2008

61

Entre os vrios tipos de variao lingustica, a variao lexical a que tem sido objecto de maior estudo dentro da Lingustica Cognitiva, pelo facto de que este paradigma comeou a afirmar-se na rea da semntica lexical. Os estudos de Semntica Cognitiva muito tm contribudo para o desenvolvimento da teoria lexicolgica, em geral, e da teoria da variao lexical, em particular. Podem apontar-se dois importantes contributos. Por um lado, passa-se de um interesse nas estruturas lexicais (campos lexicais e taxionomias), tpico da semntica estrutural, para um interesse no uso e em fenmenos de salincia ou prototipicidade. Por outras palavras, a teoria lexicolgica alarga o seu objecto de pesquisa da dimenso qualitativa dos fenmenos lexicais (unidades e relaes) para a dimenso quantitativa das diferenas de salincia conceptual entre essas unidades e relaes. Por outro lado, faz-se a extrapolao dos efeitos de salincia do domnio semasiolgico para o domnio onomasiolgico, com a noo de ancoragem conceptual (entrenchment) entre diferentes categorias e a hiptese do nvel bsico das taxionomias lexicais. Um outro contributo a abertura da onomasiologia ao estudo da escolha que os falantes tm que fazer de uma expresso particular entre outras disponveis para nomear determinado conceito ou referente a chamada onomasiologia pragmtica (GRONDELAERS & GEERAERTS, 2003), que releva do plano do uso real das expresses lingusticas, distinta da onomasiologia estrutural, que releva do plano da estrutura e constitui a modalidade tradicional da onomasiologia. Um importante contributo descritivo e terico sobre a variao lexical o trabalho de Geeraerts, Grondelaers & Bakema (1994). Por tudo isto, natural que o conhecimento adquirido sobre a variao lexical constitua uma espcie de modelo para o estudo cognitivo das outras formas de variao lingustica. Importa distinguir trs tipos de variao lexical: variao semasiolgica: diferentes sentidos e/ou (tipos de) referentes de um item lexical, isto , polissemia e prototipicidade (ver SILVA, 2006c); variao onomasiolgica conceptual: diferentes categorias conceptuais para nomear determinado conceito ou tipo de referente; por exemplo, escolhas taxionmicas entre jogador e atacante ou entre casaco e bluso;

SILVA

62

variao onomasiolgica formal: diferentes termos para nomear uma mesma categoria conceptual, isto , sinnimos denotacionais, como atacante, avanado e dianteiro ou casaco e blazer.

A estes trs tipos pode adicionar-se um quarto: a variao contextual ou variao sociolingustica e estilstica, pragmtico-discursiva e diacrnica. H aqui uma diferena: a variao contextual constitui uma dimenso adicional para as variaes semasiolgica e onomasiolgica categorial, ao passo que justamente essa variao contextual a que define a variao onomasiolgica formal, isto , as diferenas entre os sinnimos denotacionais. precisamente a variao onomasiolgica formal e, portanto, aquela que tem a ver com as escolhas efectivas entre sinnimos denotacionais o objecto mais especfico da sociolexicologia e da nossa investigao, que apresentaremos a seguir. Com efeito, os sinnimos denotacionais evidenciam tipos de diferenas sociolingusticas e so estas diferenas regionais, sociais, estilsticas, pragmticodiscursivas e histricas que definem a prpria existncia e a competio de variedades lectais de uma lngua. Acrescente-se, por ltimo, que estes tipos de variao lexical, incluindo o que aqui objecto de pesquisa (variao onomasiolgica formal), se podem aplicar variao gramatical.
5 . Lexicologia quantitativa e sociolectometria

Para medir a distncia entre duas variedades lectais no nosso caso, para medir a convergncia e a divergncia lexical entre as duas variedades nacionais do Portugus , so utilizados dois mtodos quantitativos: a medida de uniformidade (U) entre as variedades e a medida do impacto de determinado trao (A), ligado a itens ou a conceitos lexicais, na uniformidade entre as variedades. Ambas as medidas foram desenvolvidas por Geeraerts, Grondelaers & Speelman (1999), no seu trabalho sociolexicolgico sobre as duas variedades nacionais do Neerlands. A medida U ou medida da uniformidade lingustica baseada em perfis (GEERAERTS, 2001; SPEELMAN, GRONDELAERS & GEEARERTS, 2003) a medida fundamental. Envolve duas noes especficas: perfil (onomasiolgico formal) ou conjunto de sinnimos denotacionais usados para designar determinado conceito ou funo, diferenciados pela sua frequncia relativa, e uniformidade ou medida da correspondncia entre dois conjuntos de dados, definidos em termos de perfis onomasiolgicos. Por exemplo, a

Rev. Est. Ling., Belo Horizonte, v. 16, n. 1, p. 49-81, jan./jun. 2008

63

uniformidade de um conceito entre duas amostras, em que uma contm 6 ocorrncias do termo A e 4 do termo B e a outra 3 ocorrncias de A e 7 de B, resulta do nmero de pares comuns de nomeao desse conceito (7 pares), sendo, portanto, U = 70%. Este mesmo resultado percentual obtm-se somando as frequncias relativas mais pequenas de cada termo alternativo: 30% de A e 40% de B. Tecnicamente, a uniformidade de um conceito calculada pela seguinte frmula: U (Y ,Y ) = min(F ( x ), F ( x ))
n Z 1 2 i =1 Z ,Y 1 i Z ,Y 2 i

Isto , a uniformidade U para um conceito Z entre duas amostras Y1 e Y2 equivale soma dos mnimos das frequncias relativas F do termo x nos perfis onomasiolgicos de Z em Y1 e Y2. O smbolo xi representa os diferentes termos x1 a xn usados nas amostras Y para designar o conceito Z. A uniformidade mdia calculada em termos de mdia ponderada, atravs da seguinte frmula:
n

U'( Y 1 ,Y 2 ) = U (Y 1 ,Y 2 ).G
Zi

Zi

i =1

A uniformidade U para um conjunto de conceitos Z entre duas amostras Y1 e Y2 equivale soma dos valores-U dos Zs ponderados pela frequncia relativa G de Z dentro do conjunto total de Zs. Obtm-se o coeficiente de ponderao GZi ou frequncia relativa de um conceito Z, dividindo a soma das ocorrncias de Z em Y1 e Y2 pelo nmero total de ocorrncias para os conceitos Z1 a Zn. Convergncia e divergncia entre duas variedades exprimem-se em aumento e diminuio de U/U, respectivamente. Os clculos ponderados (U e, a seguir, A) so mais representativos, porque tm em conta a frequncia relativa dos diferentes conceitos e termos. Uma diferena inferior a 5% estatisticamente irrelevante. A proporo de termos com determinado trao, ou medida A, calculada pelas seguintes duas frmulas:
A K,Z (Y) = F Z,Y (Xi). WXi (K)

A proporo A de todos os termos x com o trao K no perfil onomasiolgico do conceito Z na amostra Y igual soma das frequncias relativas dos termos x ponderada pelo valor de pertena a W.

AK (Y) =

A K,Zi (Y). GZi (Y)

SILVA

64

A proporo A de todos os itens x com o trao K na amostra Y igual soma de todas as medidas-A ponderada por G, isto , a frequncia relativa do conceito Z em Y.
6 . Estudo de caso: convergncia e divergncia lexical entre o portugus europeu e o portugus brasileiro

Passamos a apresentar, de modo bastante sumrio, os dados e os resultados principais de trs questes de investigao sobre as relaes lexicais entre o portugus europeu e o portugus brasileiro (doravante, PE e PB):
(1) saber se as duas variedades nacionais esto num processo de convergncia ou de divergncia lexical nos ltimos 50 anos; (2) saber que influncia tm factores lingusticos internos na tendncia evolutiva global; (3) saber se a distncia lexical entre registo padro e registos subpadro (intermdios) maior numa variedade ou na outra.1

As duas primeiras questes as mais importantes da presente investigao implicam uma anlise diacrnica, sendo externa a primeira e interna a segunda. A ltima a questo sincrnica da estratificao lexical. O objecto de anlise a variao onomasiolgica formal, isto , aquela que, como vimos na seco anterior, envolve sinnimos denotacionais; e a base emprica consiste em largos milhares de observaes do uso de sinnimos alternativos designando 43 conceitos nominais de dois campos lexicais futebol e vesturio. Est ainda em anlise um terceiro campo lexical o dos termos de sade. Este estudo apoia-se na concepo geral e nos mtodos quantitativos da investigao de sociolexicologia cognitiva desenvolvida por Dirk Geeraerts e sua equipa para o Neerlands da Holanda e da Blgica (GEERAERTS, GRONDELAERS & SPEELMAN, 1999). Como hipteses sobre as relaes entre PE e PB, admite-se (i) uma influncia crescente do PB sobre o PE, que costuma ser justificada pelas to populares telenovelas brasileiras, pelo sempre popular e apaixonante futebol brasileiro e pela emigrao brasileira; (ii) maior receptividade do PB aos estrangeirismos; (iii) maior distncia entre registos formais e registos informais no PB; e (iv), embora no se encontrem hipteses claras na respectiva literatura, a ideia generalizada de uma fragmentao progressiva e inelutvel e, portanto, a hiptese da divergncia.

Rev. Est. Ling., Belo Horizonte, v. 16, n. 1, p. 49-81, jan./jun. 2008

65

Os materiais de investigao foram extrados manualmente de trs fontes: (i) jornais de desporto e revistas de moda dos primeiros anos das dcadas de 50, 70 e 90-2000; (ii) linguagem da Internet de conversao on-line de IRC ou chats; e (iii) etiquetas de roupas de lojas de vesturio. Os materiais de (i) permitiro responder questo da convergncia/divergncia e os materiais de (ii) e (iii) questo da estratificao. Os materiais do PB provm dos dois centros urbanos mais importantes do pas: So Paulo e Rio de Janeiro. O sub-corpus de futebol compreende textos de 8 jornais desportivos com a extenso de 2,7 milhes de palavras e textos de chats com a extenso de 15 milhes de palavras. O subcorpus de vesturio contm textos de 24 revistas de moda com a extenso de 1,2 milhes de palavras e 1.300 imagens de etiquetas de lojas de vesturio. Estes dois sub-corpora constituem o corpus CONDIVport, actualmente com 4 milhes de palavras do registo formal (jornais e revistas) e 15 milhes de palavras do registo informal (chats e etiquetas). Est parcialmente disponibilizado no stio da Linguateca, em www.linguateca.pt/ACDC. A anlise compreende 21 perfis onomasiolgicos de futebol, perfazendo um total de 183 termos, estudados numa base de dados constituda por 90.202 observaes do uso destes termos nos jornais de desporto e 143.946 observaes nos chats, e 22 perfis onomasiolgicos do vesturio de homem (M) e de mulher (F), num total de 264 termos, estudados numa base de dados de 12.451 observaes nas revistas de moda e 3.240 observaes nas etiquetas de lojas de vesturio. Para no inflacionar as diferenas, foram excludos os termos marcadamente populares. Pelas limitaes de espao, apresentamos apenas os nomes dos conceitos ou perfis na designao utilizada no PE: Futebol: rbitro, rbitro auxiliar, avanado, baliza, bola, defesa, equipa, extremo, falta, finta, fora-de-jogo, golo, grande penalidade, guarda-redes, jogada, jogo, mdio, pontap, pontap de canto, pontap livre, treinador Vesturio: blusa F, bluso M/F, calas M/F, calas curtas M/ F, calas justas F, camisa M, camisola M/F, casaco F, casaco M, casaco curto F, casaco curto M, casaco de cerimnia M/F, casaco de malha M/F, casaco impermevel M/ F, casaco quente (Inverno) M/F, conjunto F, fato M, jaqueta M/F, jeans M/F, saia F, t-shirt M/F, vestido F

SILVA

66

Apenas dois exemplos de perfis onomasiolgicos:


GUARDA - REDES :

arqueiro, goal-keeper, goleiro, golquper, guarda-meta, guarda-redes, guarda-vala(s), guardio, keeper, porteiro, quper, vigia

CASACO F: blazer, blizer, casaco, casaquinho/a, manteau, mant, palet, paletot

A questo (1), anteriormente enunciada, subdivide-se nas seguintes trs questes especficas:
(1.1) convergncia ou divergncia entre o PE e o PB? (1.2) a tendncia convergente/divergente ocorre dos dois lados ou apenas de um? (1.3) a uniformidade interna de cada variedade aumenta ou diminui?

A Figura 1 sintetiza os resultados percentuais de uniformidade ponderada U dos 21 perfis de futebol e dos 22 perfis de vesturio do portugus de Portugal (P) e do Brasil (B) das dcadas de 50, 70 e 90-2000: os nmeros nas linhas horizontais indicam a percentagem de U entre o PE e o PB nos anos 50, 70 e 2000, respondendo assim questo (1.1); os nmeros nas linhas verticais e diagonais indicam a percentagem de U de perodo para perodo e entre diferentes perodos e respondem questo (1.2); os nmeros subpostos a cada variedade e perodo indicam a percentagem de U dentro de cada variedade, respondendo questo (1.3).

Rev. Est. Ling., Belo Horizonte, v. 16, n. 1, p. 49-81, jan./jun. 2008

67

P50
51,9

43,8
42,3

B50
30,9

P50
66,5

78,8
67,5

B50
76,5

86,7

68,7

48

50,0

66,1

P70
55,6

55,2
58,1

B70
61,9

P70
63,0

65,9
54

87,3

84,8

56,3

74,4

58,3

P00
62,4

56,8

B00
65,8

P00
68,8

57,1

FUTEBOL

VESTURIO

FIGURA 1: Resultados de uniformidade ponderada U dos termos de futebol e vesturio

Em relao questo (1.1) e no caso do futebol, as percentagens de U das linhas horizontais indicam convergncia de 50 para 70 e estabilidade a partir de ento, mas as de U (que aqui no esto indicadas) no mostram qualquer alterao significativa: U aumenta 11,4% entre 1950 e 1970 e somente 1,6% entre 1970 e 2000, ao passo que o valor U permanece mais ou menos o mesmo. Quer isto dizer que em nvel dos conceitos mais frequentes que a convergncia se verifica. Ao mesmo tempo, os nmeros mostram uma grande distncia entre as duas variedades nos trs perodos. Pelo contrrio, no caso do vesturio as percentagens de U evidenciam divergncia ao longo do tempo: U diminui 21,7% entre 1950 e 2000. Temos, portanto, resultados diferentes: convergncia restringida no vocabulrio do futebol e divergncia clara no vocabulrio do vesturio. A hiptese da divergncia confirma-se no domnio do vesturio, mas no no domnio do futebol. Para a questo (1.2) e no caso do futebol, as percentagens de U das linhas verticais mostram que h mais mudanas do lado do PB. Alm disso, de 50 para 70 o PB parece aproximar-se do PE (ver a linha diagonal): B70 est mais prximo, no somente de P70, mas tambm de P50 (48% contra 42,3%). Estes dois resultados coadunam-se com a convergncia anteriormente observada.

73,8

68,1

B70
55,7

B00
67,9

SILVA

68

Mais adiante, veremos se se trata efectivamente de uma aproximao do PB ao PE e quais os factores internos que explicam esta aparente aproximao. No caso do vesturio, as percentagens de U e U das linhas verticais e diagonais indicam simetria nas tendncias evolutivas das duas variedades e mostram que a divergncia se d dos dois lados nos dois perodos. Para a questo (1.3), as percentagens de U dentro de cada variedade e poca mostram que h mais mudanas do lado do PB: em ambos os campos lexicais, o PB muda mais do que o PE. Alm disso, as mudanas mais acentuadas do-se de 50 para 70. No caso do futebol, h um grande aumento da uniformidade interna no PB, ao passo que as alteraes no PE so menores. Isto poder indicar maior estandardizao do vocabulrio do futebol no PB nos ltimos anos e/ou menor preocupao com o apuramento estilstico da lngua nos jornais brasileiros de hoje. No caso do vesturio, temos um padro evolutivo idntico: diminuio da uniformidade interna de 50 para 70 e aumento de 70 para 2000. Passemos agora questo (2), do impacto de factores lingusticos internos. Vamos medir o impacto de dois traos ligados aos itens lexicais em anlise na tendncia evolutiva global: endo/exogeneidade e estrangeirismos. No primeiro caso, queremos saber se existe uma orientao endgena ou exgena que faa com que uma das variedades se aproxime ou se afaste da outra. No segundo caso, queremos saber qual o impacto do ingls e do francs na tendncia evolutiva global. Um terceiro factor, ainda em estudo, tem a ver com a influncia normativa e por ele queremos saber qual a consequncia da propaganda lingustica na tendncia evolutiva global. A endo/exogeneidade deriva matematicamente do corpus: palavras endgenas so termos tpicos de um sub-corpus (ocorrem muitas vezes nesse sub-corpus) e palavras exgenas so termos tpicos do resto do corpus. Temos de calcular a proporo de palavras com os traos binacional (AUNI), endgeno (AENDO) e exgeno (AEXO). Matematicamente, a evoluo convergente implica aumento de AUNI e AEXO e diminuio de AENDO; o inverso determina a evoluo divergente. Sem podermos apresentar aqui os respectivos clculos, fiquemos apenas com a indicao dos resultados. No futebol, temos aumento de AUNI de 50 para 70, maior do lado do PB; diminuio de AENDO tambm de 50 para 70 e maior do lado do PB; e maior alterao de AEXO no PB. Estes resultados condizem com a convergncia

Rev. Est. Ling., Belo Horizonte, v. 16, n. 1, p. 49-81, jan./jun. 2008

69

anteriormente observada (de 50 para 70) e confirmam que o PB muda mais do que o PE. O aumento de EXO sempre maior do que a diminuio de ENDO tanto no PB como no PE, mas mais ainda naquele do que neste. Quer isto dizer que as duas variedades adoptam mais itens exgenos do que abdicam de termos endgenos. No vesturio, a divergncia anterirmente verificada faz-se pela diminuio de AUNI e, sobretudo, pelo aumento de AENDO. Nos anos 70 e nos anos 2000, surgem novos termos endgenos tanto no PB como no PE, o que explica a evoluo divergente de ambos os lados. Esta endogeneidade nova tem a ver com a entrada no mundo da moda de termos novos ou de usos novos de termos j existentes. Vejamos agora a influncia estrangeira. Vamos medir a proporo de itens com o trao (A) anglicismo, galicismo ou estrangeirismo (qualquer que seja a provenincia) no perfil onomasiolgico de um conceito e, depois, no conjunto dos conceitos analisados nas amostras do PE e PB. A atribuio deste trao A no uma questo binria (presena ou ausncia), mas um continuum: atribudo o valor mais alto (1) aos estrangeirismos que mantm a forma original e o valor mais baixo (0,25) a fortes adaptaes e a decalques. As Tabelas 1 e 2 apresentam os resultados com as percentagens de anglicismos (AIngl), francesismos (AFr) e todos os estrangeirismos (Aestrang).
TABELA 1 Estrangeirismos no corpus do futebol AIngl (P50) AIngl (P70) AIngl (P00) Aestrang (P50) Aestrang (P70) Aestrang (P00) 7,1% 9,8% 10,2% 13,9% 17,9% 18,5% 18,0% 17,1% 16,2% 23,5% 22,8% 23,3% AIngl (B50) AIngl (B70) AIngl (B00) Aestrang (B50) Aestrang (B70) Aestrang (B00)

SILVA

70

TABELA 2 Estrangeirismos no corpus do vesturio AFr (P50) AFr (P70) AFr (P00) AIngl (P50) AIngl (P70) AIngl (P00) Aestrang (P50) Aestrang (P70) Aestrang (P00) 17,6% 15,9% 10,2% 3,3% 5,8% 16,9% 22,4% 22,1% 28,2% 18,5% 18,1% 7,9% 4,2% 7,6% 17,0% 23,8% 26,7% 24,9% AFr (B50) AFr (B70) AFr (B00) AIngl (B50) AIngl (B70) AIngl (B00) Aestrang (B50) Aestrang (B70) Aestrang (B00)

No corpus do futebol, a influncia de anglicismos e de outros estrangeirismos claramente maior no PB do que no PE. A grande diferena percentual entre B50 e P50 resulta do facto de haver maior nmero e maior frequncia de estrangeirismos conservando a sua forma original no PB. Estes resultados contribuem, em parte, para uma distncia maior entre as duas variedades nos anos 50 e, consequentemente, para a tendncia convergente global. No corpus do vesturio, verifica-se uma diminuio de francesismos (mais acentuada no PB) e um claro aumento de anglicismos, por razes socioculturais bem conhecidas. interessante verificar que a influncia do francs no menos importante no PB do que no PE. No conjunto de todos os estrangeirismos, temos um aumento no PE e uma situao de estabilidade no PB. A influncia dos estrangeirismos continua a ser maior no PB. Estes resultados confirmam a hiptese de uma maior permeabilidade do PB aos estrangeirismos, quer importando-os directamente quer adaptando-os. Em relao adaptao de termos estrangeiros, a Tabela 3 mostra a maior tendncia do PB adaptao, em contraste com o PE, que tende para a substituio por termos vernculos. A percentagem de adaptaes de termos ingleses de futebol aumenta fortemente no PB de 50 para 70. Todos estes resultados explicam a emergncia e tambm o tremendo fracasso das atitudes de purismo lingustico no Brasil.

Rev. Est. Ling., Belo Horizonte, v. 16, n. 1, p. 49-81, jan./jun. 2008

71

TABELA 3 Adaptaes/decalques de anglicismos no corpus de futebol AIngl.adapt (P50) AIngl.adapt (P70) AIngl.adapt (P00) 6,0% 7,9% 8,9% 2,8% 16,9% 16,0% AIngl.adapt (B50) AIngl.adapt (B70) AIngl.adapt (B00)

Foram ainda calculadas as propores de trs outros traos ligados aos itens lexicais. Primeiro, h mais mudanas onomasiolgicas formais, incluindo arcasmos, neologismos e termos de gria, no PB do que no PE. Segundo, a variao onomasiolgica formal diminui no futebol (crescente estandardizao do vocabulrio do futebol), em grau mais acentuado no PB, como efeito de popularidade e globalizao. Finalmente, a esperada influncia crescente do PB sobre o PE, em particular no domnio do futebol, no se confirma claramente, como se pode verificar na Tabela 4. So apresentados dois clculos: as percentagens da esquerda tm em conta apenas os brasileirismos de que h menos dvidas e, as da direita, todos os brasileirismos que esto atestados nalgum dicionrio de referncia.
TABELA 4 Brasileirismos no corpus portugus de futebol ABras (P50) ABras (P70) ABras (P00) 0,8% 1,0% 1,1% 2,3% 3,4% 2,0%

Atravs do mtodo estatstico da anlise de regresso , pudemos verificar que a varivel endogeneidade a que mais se correlaciona com a uniformidade U: esta correlao apresenta sempre resultados estatsticos significativos (p inferior a 0,05) e uma mdia de 99% da evoluo de U pode ser descrita com a frmula AENDO. As variveis anglicismos e todos os estrangeirismos so tambm significativas no vocabulrio do futebol no PE; as outras correlaes no passam no teste de p. Mais especificamente, h uma correlao negativa entre U e endogeneidade e, com excepo do futebol no PE, entre U e anglicismos e todos os estrangeirismos (e tambm exogeneidade,

SILVA

72

embora no significativa), isto , U diminui quando a proporo destas variveis aumenta; e h uma correlao positiva entre U e francesismos no vocabulrio do vesturio. Finalmente a questo (3) da estratificao. Para calcular a distncia entre o estrato padro e o estrato subpadro, vamos comparar, no caso do futebol, os dados do registo mais formal dos jornais dos anos 90/2000 (P00 e B00) e os dados do registo informal dos chats (Psub00 e Bsub00) e, no caso do vesturio, os dados do registo mais formal e mais nacional das revistas de moda dos anos 90/2000 (P00 e B00) e os dados do registo menos formal e mais local das lojas de vesturio (Psub00 e Bsub00). Os resultados so os seguintes: Futebol:
U(P00, Psub00) 80,9% U(B00, Bsub00) 78,8%

Vesturio:
U(P00, Psub00) 71% > > U(B00, Bsub00) 57,9%

A hiptese de uma distncia maior entre padro e subpadro no PB confirma-se no sub-corpus do vesturio, mas no no do futebol. No caso do futebol, h um grau relativamente elevado de uniformidade entre padro (jornais) e subpadro (chats) dentro de cada uma das variedades, o que poder indicar padronizao lexical na conversao pela Internet. Os utilizadores de chat tendem a ser conformistas quando se referem a conceitos to populares como os do futebol. Alm disso, a informalidade da linguagem do chat determinada mais por outros factores lingusticos do que pelos factores lexicais. J a uniformidade entre as duas variedades em nvel do estrato subpadro desce consideravelmente para um valor muito prximo do da uniformidade em nvel do estrato padro: 59,2% e 56,8%, respectivamente. Ou seja: a grande distncia entre as duas variedades verifica-se em nvel tanto do padro como do subpadro. No caso do vesturio, h ainda a verificar que a distncia entre as duas variedades maior em nvel do estrato subpadro (45,8%) do que em nvel do estrato padro (57,1%).

Rev. Est. Ling., Belo Horizonte, v. 16, n. 1, p. 49-81, jan./jun. 2008

73

7 . Extenses lexicais e gramaticais

A fase seguinte da investigao pretende estender o trabalho realizado em trs direces: (i) ainda no domnio lexical, vamos incluir palavras de outros campos lexicais, como os termos de sade, e passar das palavras de contedo para as palavras funcionais, particularmente as preposies; (ii) em direco ao domnio gramatical, pretendemos analisar parmetros no-lexicais, designadamente variveis sintcticas e morfolgicas; (iii) ampliar e refinar a situao estratificacional de cada variedade, acrescentando mais varveis estilsticas, em ordem ao estudo dos indicadores (lexicais e no-lexicais) de subpadronizao. Mais especificamente, pretendemos analisar as correlaes entre variveis lexicais e variveis no-lexicais e comparar o seu impacto na convergncia/ divergncia, na estratificao particularmente as hipteses de assimetria estratificacional (distncia maior entre padro e subpadro no PB) e maiores alteraes de uniformidade interna no PB (sinal de padronizao tardia) e na subpadronizao das duas variedades nacionais. Ser que palavras funcionais, como preposies, repetiro os resultados obtidos com os termos de futebol e vesturio? Ser que as variveis no-lexicais contribuiro de modo diferente das variveis lexicais para a estrutura variacional? Quantos mais nveis de estratificao devero ser tomados em conta? Ser a estratificao multidimensional? Como determinar o impacto mtuo dos vrios factores variacionais? Relativamente questo principal da convergncia/divergncia e tendo em conta a distino entre lxico (mais conscincia) e gramtica (menos conscincia), a hiptese a confirmar a de maior divergncia: as palavras funcionais e as construes gramaticais divergiro mais do que as palavras de contedo. Sero analisados 15 perfis de preposies e 20 perfis de construes sintcticas, seguindo os mesmos mtodos onomasiolgico e de uniformidade baseada em perfis (a sinonmia de preposies e construes sintcticas entendida no sentido de equivalncia funcional). Os perfis preposicionais so restringidos aos mesmos tipos de complementos e ao mesmo contexto sintagmtico, de forma a satisfazer a condio de sinonmia denotacional (p.ex. reflectir/ pensar em/sobre, interesse em/por, por/atravs de/via fax/internet/correio). Os perfis construccionais so seleccionados de entre construes causativas/ perceptivas (fazer/mandar/deixar/ver y + INF flex/no-flex / INF no-flex + y / orao de que), construes causativas sintticas vs. analticas, construes completivas e adverbiais finitas vs. infinitivas, construes de elevao,

SILVA

74

construes de sujeito nulo e de objecto nulo, construes alternativas de indicativo/conjuntivo, padres alternativos de ordem de palavras, colocaes alternativas do adjectivo atributivo e, eventualmente, outras construes. Analisaremos, ainda, formaes diminutivas e aumentativas, sufixos derivacionais alternativos, formas alternativas dos pronomes possessivos e pessoais, verbos de particpio duplo e formaes de plural. As tcnicas de regresso linear e multilinear permitiro analisar as correlaes entre estas variveis dependentes e entre elas e as variveis independentes estilsticas (jornais de qualidade > jornais populares > Internet off-line > Internet on-line, oralidade).
8 . Concluso

O estudo cognitivo das lnguas, representado pela Lingustica Cognitiva, encerra actualmente duas tenses correlacionadas: uma temtica, entre o individual-neurofisiolgico-universal e o interindividual-sociocultural-variacional; outra metodolgica, entre introspeco e empiricismo. um mito acreditar que a linguagem geneticamente constrangida a ser uniforme ou que as comunidades lingusticas so homogneas. E um equvoco pensar que fenmenos noobjectivistas como os cognitivos e os lingusticos no podem ser objectivamente estudados. E se a Lingustica Cognitiva quer ser, de facto, um modelo baseado no uso, ento tem que resolver aquelas duas tenses explorando o seu segundo elemento. Esperamos ter conseguido mostrar que a perspectiva cognitiva da linguagem implica a integrao sistemtica da variao social e da metodologia emprica baseada nos dados de um corpus (ou nos dados experimentais) e em tcnicas quantitativas e estatsticas para os analisar. Estes dois desenvolvimentos implicam-se mutuamente e cada um deles tem as suas exigncias. A integrao da variao social implica a adopo da metodologia do corpus e exige a reinterpretao da cognio como cognio social. A adopo da metodologia do corpus exige sofisticao em tcnicas quantitativas e estatsticas e implica um ciclo emprico-interpretativo de refinamento gradual das hipteses pelo confronto repetido com os dados empricos. A convergncia destes dois desenvolvimentos marca uma das principais extenses da Lingustica Cognitiva nestes primeiros anos do sc. XXI o desenvolvimento da emergente Sociolingustica Cognitiva. Esperamos ter conseguido mostrar tambm as vantagens da perspectiva cognitiva, do mtodo da variao onomasiolgica entre sinnimos denotacionais

Rev. Est. Ling., Belo Horizonte, v. 16, n. 1, p. 49-81, jan./jun. 2008

75

e de mtodos quantitativos multivariacionais no estudo da convergncia e divergncia entre o portugus europeu e o portugus brasileiro. Os resultados da investigao sociolexicolgica realizada mostram que a hiptese da divergncia se confirma no campo lexical do vesturio, mas no no do futebol: os termos de vesturio so mais representativos do vocabulrio comum e, por isso, os resultados do vesturio estaro provavelmente mais prximos da realidade sociolingustica; a ligeira convergncia de 50 para 70 no campo do futebol , provavelmente, um efeito da globalizao e da padronizao do vocabulrio do futebol. Alm disso, no parece haver uma orientao de uma variedade em relao outra; a variedade brasileira muda mais do que a europeia, mais permevel importao e adaptao de estrangeirismos e apresenta uma distncia maior entre estrato padro e subpadro. Precisamos de consolidar a anlise sociolexicolgica, incluindo outros campos lexicais, e precisamos de a estender ao domnio das palavras funcionais e das variveis no-lexicais. A anlise das correlaes entre variveis lexicais e no-lexicais e entre estas variveis dependentes e as variveis independentes estilsticas permitir um conhecimento mais exacto da verdadeira situao actual de divergncia ou convergncia entre as duas variedades nacionais e da estrutura estratificacional de cada uma. Com a sociolingustica cognitiva e quantitativa, pretendemos contribuir para o desenvolvimento da sociolingustica e da sociolectometria do portugus europeu e brasileiro e estamos certos de que os resultados obtidos garantiro uma base emprica segura para a construo de melhores polticas da lngua portuguesa, como lngua plurinacional e transcontinental.
Nota
Este estudo faz parte do projecto de investigao Convergncia e Divergncia no Lxico do Portugus, financiado pela Fundao para a Cincia e a Tecnologia de Portugal (Ref POCTI/LIN/ 48575/2002), no mbito do POCTI do fundo comunitrio europeu FEDER. Para descries parciais mais desenvolvidas dos resultados deste projecto, ver Silva & Duarte (2005) e Silva (2006a, b, no prelo).
1

SILVA

76

Referncias Bibliogrficas
BARLOW, M.; KEMMER, S. (Eds.). Usage-based Models of Language. Stanford: CSLI Publications, 2000. BERNRDEZ, E. Intimate enemies? On the relations between language and culture. In: SILVA, A. S. da, TORRES, A.; GONALVES, M. (Org.). Linguagem, cultura e cognio: estudos de Lingustica Cognitiva. Coimbra: Almedina, 2004. V. I, p. 21-45. BERNRDEZ, E. Social cognition: variation, language, and culture in a cognitive linguistic typology. In: RUIZ DE MENDOZA, F.J.; PEA CERVEL, S. (Ed.). Cognitive Linguistics. Internal Dynamics and Interdisciplinary Interaction. Berlin/ New York: Mouton de Gruyter, 2005. p. 191-222. BLANK, A.; KOCH, P. (Ed.). Historical Semantics and Cognition. Berlin/New York: Mouton de Gruyter, 1999. BYBEE, J. Phonology and Language Use. Cambridge: Cambridge University Press, 2001. BYBEE, J.; HOPPER, P. (Ed.). Frequency and the Emergence of Linguistic Structure. Amsterdam: John Benjamins, 2001. CROFT, W.; CRUSE, D. A. Cognitive Linguistics. Cambridge: Cambridge University Press, 2004. DAMSIO, A. O erro de Descartes. Emoo, razo e crebro humano. Mem Martins: Publicaes Europa-Amrica, 1995. DAMSIO, A. O sentimento de si. O corpo, a emoo e a neurobiologia da conscincia. Mem Martins: Publicaes Europa-Amrica, 2000. DIRVEN, R.; FRANK, R.; ILIE, C. (Ed.). Language and Ideology. Vol. II: Descriptive cognitive approaches. Amsterdam: John Benjamins, 2001. DIRVEN, R.; FRANK, R.; PTZ, M. (Ed.). Cognitive Models in Language and Thought. Ideology, Metaphors and Meanings. Berlin/New York: Mouton de Gruyter, 2003. DIRVEN, R.; HAWKINS, B.; SANDIKCIOGLU (Ed.). Language and Ideology. Vol. I: Theoretical cognitive approaches. Amsterdam: John Benjamins, 2001. EDELMAN, G. M. Bright Air, Brilliant Fire: On the Matter of the Mind. New York: Basic Books, 1992. FAUCONNIER, G. Mappings in Thought and Language. Cambridge: Cambridge University Press, 1997.

Rev. Est. Ling., Belo Horizonte, v. 16, n. 1, p. 49-81, jan./jun. 2008

77

FAUCONNIER, G.; TURNER, M. The Way We Think: Conceptual Blending and the Minds Hidden Complexities. New York: Basic Books, 2002. FRANK, R. M; DIRVEN, R.; ZIEMKE, T.; BERNRDEZ, E. (Ed.). Body, Language, and Mind II: Sociocultural Situatedness. Berlin: Mouton de Gruyter, 2008. GEERAERTS, D. Diachronic Prototype Semantics. A Contribution to Historical Lexicology. Oxford: Clarendon Press, 1997. GEERAERTS, D. On measuring lexical convergence. In: SILVA, A. S. (Org.). Linguagem e cognio: a perspectiva da Lingustica Cognitiva. Braga: Associao Portuguesa de Lingustica / Universidade Catlica Portuguesa, 2001. p. 51-61. GEERAERTS, D. Cultural models of linguistic standardization. In: DIRVEN, R.; FRANK, R.; PTZ, M. (Ed.). Cognitive Models in Language and Thought. Ideology, Metaphors and Meanings. Berlin/New York: Mouton de Gruyter, 2003. p. 25-68. (republicado em SILVA, A. S. da; TORRES, A.; GONALVES, M. (Org.). Linguagem, cultura e cognio: Estudos de Lingustica Cognitiva. Coimbra: Almedina, 2004. V. I. p. 47-84.) GEERAERTS, D. Lectal data and empirical variation in Cognitive Linguistics. In: RUIZ DE MENDOZA, F. J.; PEA CERVEL, S. (Ed.). Cognitive Linguistics. Internal Dynamics and Interdisciplinary Interactions. Berlin/New York: Mouton de Gruyter, 2005. p. 163-189. GEERAERTS, D. Methodology in Cognitive Linguistics. In: KRISTIANSEN, G.; ACHARD, M.; DIRVEN, R.; RUIZ DE MENDOZA, F. J. (Ed.). Cognitive Linguistics: Current Applications and Future Perspectives. Berlin/New York: Mouton de Gruyter, 2006. p. 21-49. GEERAERTS, D. (Ed.). Cognitive Linguistics: Basic Readings. Berlin/New York: Mouton de Gruyter, 2006. GEERAERTS, D.; GRONDELAERS, S.; BAKEMA, P. The Structure of Lexical Variation. Meaning, Naming, and Contrext. Berlin/New York: Mouton de Gruyter, 1994. GEERAERTS, D.; GRONDELAERS, S.; SPEELMAN, D. Convergentie en Divergentie in de Nederlandse Woordenschat. Amsterdam: Meertens Institut, 1999. GIBBS, R. W. The Poetics of Mind. Figurative Thought, Language, and Understanding. Cambridge: Cambridge University Press, 1994. GIBBS, R. W. Embodiment and Cognitive Science . New York: Cambridge University Press, 2006. GONZALEZ-MARQUEZ, M.; MITTELBERG, I.; COULSON, S.; SPIVEY, M. J. (Ed.). Methods in Cognitive Linguistics. Amsterdam: John Benjamins, 2007.

SILVA

78

GRIES, S. T. Multifactorial Analysis in Corpus Linguistics: A Study of Particle Placement. London: Continuum Press, 2003. GRIES, S. T.; STEFANOWITSCH, A. (Ed.). Corpora in Cognitive Linguistics. Corpusbased Approaches to Syntax and Lexis. Berlin/New York: Mouton de Gruyter, 2006. GRONDELAERS, S.; GEERAERTS, D. Towards a pragmatic model of cognitive onomasiology. In: CUYCKENS, H.; DIRVEN, R.; TAYLOR, J. (Ed.). Cognitive Approaches to Lexical Semantics. Berlin/New York: Mouton de Gruyter, 2003. p. 67-92. GRONDELAERS, S.; GEERAERTS, D.; SPEELMAN, D. A case for a Cognitive corpus linguistics. In: GONZALEZ-MARQUEZ, M.; MITTELBERG, I.; COULSON, S.; SPIVEY, M. J. (Ed.). Methods in Cognitive Linguistics. Amsterdam: John Benjamins, 2007. p. 149-169. GRONDELAERS, S.; SPEELMAN, D.; GEERAERTS, D. Regressing on er. Statistical analysis of texts and language variation. In: MORIN, A.; SBILLOT, P. (Ed.). 6th International Conference on the Statistical Analysis of Textual Data. Rennes: Institut National de Recherche en Informatique et en Automatique, 2002. p. 335-346. HARDER, P. The status of linguistic facts. Rethinking the relation between cognition, social institution, and utterance from a functional point of view. Mind and Language 18, p. 52-76, 2003. HOLLAND, D.; QUINN, N. (Eds.). Cultural Models in Language and Thought. Cambridge: Cambridge University Press, 1987. HOPPER, P. J.; TRAUGOTT, E. C. Grammaticalization. Cambridge: Cambridge University Press, 1993. KVECSES, Z. Metaphor and Emotion. Language, Culture, and Body in Human Feeling. Cambridge-Paris: Cambridge University Press, 2000. KVECSES, Z. Metaphor in Culture: Universality and Variation. Cambridge: Cambridge University Press, 2005. KRISTIANSEN, G. How to do things with allophones: Linguistic stereotypes as cognitive reference points in social cognition. In: DIRVEN, R.; FRANK, R.; PTZ, M. (Ed.). Cognitive Models in Language and Thought: Ideologies, Metaphors, and Meanings. Berlin/New York: Mouton de Gruyter, 2003. p. 69-120. KRISTIANSEN, G.; DIRVEN, R. (Ed.). Cognitive Sociolinguistics. Berlin/New York: Mouton de Gruyter. (No prelo).

Rev. Est. Ling., Belo Horizonte, v. 16, n. 1, p. 49-81, jan./jun. 2008

79

LAKOFF, G.. The contemporary theory of metaphor. In: ORTONY, A. (Ed.). Metaphor and Thought, Cambridge: Cambridge University Press, 1993. p. 202-251. LAKOFF, G.. Moral Politics: What Conservatives Know that Liberals Dont. Chicago: The University of Chicago Press, 1996. LAKOFF, G.. The brains concepts. The role of the sensory-motor system in reason and language. Working papers of the NTL Group at the International Computer Science Institute (ICSI). Berkeley: University of California, Berkeley, 2003. LAKOFF, G.; JOHNSON, M. Philosophy in the Flesh: The Embodied Mind and its Challenge to Western Thought. New York: Basic Books, 1999. LANGACKER, R. W. Foundations of Cognitive Grammar. V. 1: Theoretical Prerequisites. Stanford: Stanford University Press, 1987. LANGACKER, R. W. A usage-based model. In: RUDZKA-OSTYN, B. (Ed.). Topics in Cognitive Linguistics. Amsterdam: John Benjamins, 1988. p.127-161. LANGACKER, R. W. Foundations of Cognitive Grammar. V. 2: Descriptive Application. Stanford: Stanford University Press, 1991. LANGACKER, R. W. A dynamic usage-based model. In: BARLOW, M.; KEMMER, S. (Ed.). Usage-based Models of Language. Stanford: CSLI Publications, 2000. p. 1-63. LEVINSON, S. C. Space in Language and Cognition. Cambridge: Cambridge University Press, 2003. PALMER, G. B. Toward a Theory of Cultural Linguistics. Austin: University of Texas Press, 1996. SILVA, A. S. O lxico do futebol no Portugus Europeu e no Portugus Brasileiro: convergncia ou divergncia? Diacrtica. Cincias da Linguagem 20-1, p. 167-196, 2006a. SILVA, A. S. Sociolingustica cognitiva e o estudo da convergncia/divergncia entre o Portugus Europeu e o Portugus Brasileiro. Veredas 10. Revista de Estudos Lingsticos. Disponvel em: <http://www.revistaveredas.ufjf.br>. 2006b. SILVA, A. S. O mundo dos sentidos em portugus: polissemia, semntica e cognio. Coimbra: Almedina, 2006c. SILVA, A. S. Medindo a convergncia e divergncia lexical entre o Portugus Europeu e o Portugus Brasileiro. In: Anais do II Congresso da Associao Internacional de Lingustica do Portugus, Universidade Federal do Rio de Janeiro, set. 2007. p. 25-27. (No prelo).

SILVA

80

SILVA, A. S.; DUARTE, M. O lxico do vesturio no Portugus Europeu e no Portugus Brasileiro: convergncia ou divergncia? Revista Portuguesa de Humanidades 9, p. 117-136, 2005. SINHA, C. Grounding, mapping, and acts of meaning. In: JANSSEN, T.; REDEKER, G. (Ed.). Cognitive Linguistics: Foundations, Scope, and Methodology. Berlin/ New York: Mouton de Gruyter, 1999. p. 223-255. SINHA, C.; JENSEN DE LPEZ, K. Language, culture, and the embodiment of spatial cognition. Cognitive Linguistics 11, p. 17-41, 2000 SPEELMAN, D.; GRONDELAERS, S.; GEERAERTS, D. Profile-based linguistic uniformity as a generic method for comparing language varieties. Computers and the Humanities 37, p. 317-337, 2003. STEFANOWITSCH, A. Constructional semantics as a limit to grammatical alternation: The two genitives of English. In: ROHDENBURG, G.; MONDORF, B. (Ed.). Determinants of Grammatical Variation. Berlin/New York: Mouton de Gruyter, 2003. p. 413-444. STEFANOWITSCH, A.; GRIES, S. T. Collostructions: Investigating the interaction between words and constructions. International Journal of Corpus Linguistics 8, p. 209-243, 2003. STEFANOWITSCH, A.; GRIES, S. T. Covarying collexemes. Corpus Linguistics and Linguistic Theory 1, p. 1-43, 2005. TALMY, L. Toward a Cognitive Semantics. Cambridge: The MIT Press, 2000. 2 v. TALMY, L. Foreword. In: GONZALEZ-MARQUEZ, M.; MITTELBERG, I.; COULSON, S.; SPIVEY, M. J. (Ed.). Methods in Cognitive Linguistics. Amsterdam: John Benjamins, 2007. p. XI-XXI. TOMASELLO, M. The Cultural Origins of Human Cognition. Cambridge: Harvard University Press, 1999. TOMASELLO, M. First steps toward a usage-based theory of language acquisition. Cognitive Linguistics 11, p. 61-82, 2000. TOMASELLO, M. Constructing a Language: A Usage-Based Theory of Language Acquisition. Cambridge: Harvard University Press, 2003. TRAUGOTT, E. C.; DASHER, R. B. Regularity in Semantic Change. Cambridge: Cambridge University Press, 2002. TUMMERS, J.; HEYLEN, K.; GEERAERTS, D. Usage-based approaches in Cognitive Linguistics: A technical state of the art. Corpus Linguistics and Linguistic Theory 1, p. 225-261, 2005.

Rev. Est. Ling., Belo Horizonte, v. 16, n. 1, p. 49-81, jan./jun. 2008

81

VARELA, F.; THOMPSON, E.; ROSCH, E. The Embodied Mind . Mass.: Massachusetts Institute of Technology, 1991. ZIEMKE, T.; ZLATEV, J.; FRANK, R. M. (Ed.). Body, Language, and Mind I: Embodiment. Berlin/New York: Mouton de Gruyter. (No prelo). ZLATEV, J. Situated Embodiment: Studies in the Emergence of Spatial Meaning. Stockholm: Gotab, 1997. ZLATEV, J. Situated embodied semantics and connectionist modeling. In: ALLWOOD, J.; GARDENFORS, P. (Ed.). Cognitive Semantics: Meaning and Cognition. Amsterdam: John Benjamins, 1999. p. 173-194. ZLATEV, J. Beyond cognitive determination. Interactionism in the acquisition of spatial semantics. In: LEATHER, J.; VAM DAM, J. (Ed.). Ecology of Language Acquisition. Amsterdam: Kluwer Academic Publishers, 2003. p. 83-107.

Você também pode gostar