Você está na página 1de 7

Introdução

O léxico: seu papel na arquitectura e funcionamento da língua. Lugar do léxico nos estudos da
linguagem. O aprendizado da língua e o vocabulário. Nas últimas décadas, os linguistas não têm
dado muita atenção a problemas de grande relevância relativos ao léxico. Contudo, o
vocabulário exerce um papel crucial na veiculação do significado, que é, afinal de contas, o
objecto da comunicação linguística.
Léxico é palavra familiar a todos, mas de definição menos imediata. Vocabulário, glossário,
dicionário são outros termos que remetem para essa mesma esfera conceitual e frequentemente
todos eles são usados em variação livre, apesar de, por convenção terminológica, poderem
referir dimensões distintas. Essa multiplicidade de designações explica-se por uma longa
tradição de polissemia e pelo fato de se tratar de um conceito complexo que remete para uma
realidade analisável a partir de diversos pontos de vista. Fiquemos, então, com a etiqueta léxico,
que, no domínio dos estudos linguísticos, foi aquela que ganhou o estatuto de designação de um
domínio do conhecimento e disciplinar. Neste capítulo, faremos uma caracterização desta
entidade que ocupa uma posição central na gramática, estabelecendo uma distinção entre o
léxico dos sistemas linguísticos (as línguas, as variedades de uma língua, os dialetos), o léxico
dos falantes e o léxico enquanto componente de um modelo de gramática.

Colégio Cacilhas Centro


Turma 8.2
Trabalho Colectivo De Língua Portuguesa
Fundamentação Teórica
Em seguida, olharemos para o léxico dos sistemas linguísticos particulares, desviando o foco
para o léxico do Português. Esta língua, que modestamente se individualizou há mais de oito
séculos no noroeste da Península Ibérica, é actualmente partilhada e diversificada por um
promissor número de falantes e oferece matéria de análise interessante a vários níveis: um deles
é a sua constituição histórica e os fenómenos de mudança na diacronia; um outro é a sua
diversidade interna comparando as variedades brasileira e portuguesa. No final desta parte I,
discutiremos a materialidade das palavras, em particular no que respeita a questões de
segmentação do contínuo sonoro. Mas também, e porque o acesso aos dados dele faz um uso
intensivo, trataremos aqui do registo gráfico das palavras.
Falar de léxico é falar de quê?
Pode-se afirmar que o léxico é um repositório das unidades lexicais de uma língua, mas
nenhuma das partes desta afirmação é incontroversa. Comecemos pelo último domínio de
reflexão. A associação do conceito de léxico ao conceito de língua exige uma clarificação sobre
o que se entende ser uma língua, e também uma variedade, um dialeto ou um socioleto,
conceitos que são mais do campo de interesse da política linguística do que da análise
linguística. Vejamos por quê. Quando se consulta uma gramática de uma língua particular, como,
por exemplo, do Português, o que se encontra é um conjunto de instruções que configuram o
que os seus autores consideram ser o “bom uso” dessa língua, e a que habitualmente se dá o
nome de norma.
É provável que nenhum falante do Português cumpra de modo irrepreensível a totalidade das
instruções contidas nas gramáticas, sejam elas mais ou menos “normativas” e sejam eles, os
falantes, mais ou menos “normalizados”. Essas gramáticas são textos de referência, vinculados
a uma autoria e especialmente elaborados para o uso escrito da língua. Servem para garantir
unidade linguística numa comunidade de falantes. Essas gramáticas definem uma língua a partir
de uma descrição abstracta e particular – nesse sentido, o Português é o que a gramática do
Português disser que ele é. O mesmo pode ser dito sobre um dicionário do Português, se
considerarmos um dicionário geral de língua. O acatamento da autoridade das gramáticas e
dicionários para uma dada língua não é muito problemático, nos casos em que existe
coincidência entre língua e soberania, mas nem sempre esta condição se verifica. Inventariar e
normalizar as línguas, desconsiderando fronteiras políticas, não é uma tarefa óbvia. O resultado
do recenseamento mais recente, publicado online pelo The Ethnologue2 (2009), refere-se à
existência de 6.909 línguas maternas, 163 mais do que na edição anterior (2005). Dessas, 80
surgem por diferenciação no seio de línguas já conhecidas. Há, então, 166 a menos, 75 por
fusão com outras línguas e 91 por perda definitiva de falantes. Os dados disponibilizados
permitem ainda verificar onde está boa parte das línguas em extinção e quais são os territórios
linguisticamente mais estáveis.
A pesquisa inversa, ou seja, procurar saber que línguas são faladas em cada país, é um
processo ainda mais delicado: nem sempre a realidade linguística agrada ao poder político, pelo
que a “despromoção” de línguas a dialectos constitui uma estratégia frequentemente utilizada. O
entendimento de dialecto como sistema linguístico desprestigiado, que é o entendimento do
senso comum, não tem qualquer fundamento linguístico. Na verdade, o sistema conhecido como
norma é também um dialecto, no sentido em que dialecto é um conceito que procura ter como
referente um sistema linguístico que não dependa do reconhecimento político Nos casos em que

Colégio Cacilhas Centro


Turma 8.2
Trabalho Colectivo De Língua Portuguesa
uma língua é partilhada por diversas soberanias nacionais, e esse é o caso do Português, a
discussão política torna-se ainda mais relevante.

Com a distância geográfica e a criação de padrões culturais autónomos, a partilha linguística


inicial não é condição suficiente para a sua preservação, tanto mais que, do ponto de vista
estritamente linguístico, as razões para defender a unidade são frequentemente tão fortes
quanto as que possam apoiar a diferenciação. Não sendo declaradas línguas distintas, essas
diferentes apropriações de uma língua podem ser chamadas variedades nacionais, podendo,
cada uma delas, como claramente sucede no Brasil, apresentar ainda significativa variação
interna.
A informação veiculada pela mensagem faz-se, sobretudo, por meio do léxico, das palavras
lexicais que integram os enunciados. Sabemos, também, que a referência à realidade extra
linguística nos discursos humanos faz-se pelos signos linguísticos, ou unidades lexicais, que
designam os elementos desse universo segundo o recorte feito pela língua e pela cultura
correlatas. Assim, o léxico é o lugar da estocagem da significação e dos conteúdos significantes
da linguagem humana. Por outro lado, o léxico está associado ao conhecimento, e o processo de
nomeação em qualquer língua resulta de uma operação perceptiva e cognitiva.
Assim, no aparato linguístico da memória humana, o léxico é o lugar do conhecimento, sob o
rótulo sintético de palavras - os signos linguísticos. Um importante problema relacionado ao
léxico é o do aprendizado tanto do vocabulário de uma primeira, como do vocabulário de uma
segunda língua. Infelizmente, a aquisição do vocabulário tem sido negligenciada pela pesquisa
linguística, como bem acentuou Meara (1980). Além disso, essa pesquisa tem sido assistemática
e sem continuidade, não permitindo que cheguemos a conclusões claras. Desde a década de
1940, a justificação para a escolha dos índices verborum no ensino/aprendizagem do
vocabulário tem-se baseado na frequência de seu uso na língua.
Essa tem sido também a técnica e a prática no ensino de uma segunda língua. Pouca pesquisa
tem sido feita sobre essa complexa matéria. Pouco sabemos sobre como o léxico é aprendido e
como é estucado na memória. Esta última questão, porém, tem merecido a atenção de
psicólogos que se preocupam com o problema da memória. Sob um determinado prisma, o
léxico pode ser considerado um problema da memória. As entradas lexicais são, de fato,
entradas da memória. Os problemas de registo, armazenamento e recuperação das palavras na
codificação e descodificação da mensagem linguística constituem uma das questões mais
intrigantes da memória. Tudo leva a crer que o léxico se estrutura de tal forma que permita a
recuperação muito rápida, instantânea mesmo, das palavras que o integram. Com certeza, uma
das propriedades constitutivas da unidade lexical, e que possibilitam a sua recuperação no
acervo da memória, é a frequência da palavra.
Desde o início dos anos 60, pesquisas baseadas em métodos estatísticos evidenciaram a
existência de um núcleo lexical no interior do léxico de um idioma, que ocorre em qualquer tipo
de discurso formulado na língua em questão. Os dicionários de frequência das línguas
românicas, elaborados por Juilland et al. (1964; 1965; 1971; 1973), mostraram que, nas cinco
línguas (espanhol, português, francês, italiano e romeno), cerca de 80% de qualquer texto são
constituídos pelas 500 palavras mais frequentes da língua, incluindo-se aí um conjunto de
palavras de valor semântico muito geral e a totalidade das palavras gramaticais dessas línguas.
Outras pesquisas foram realizadas sobre as línguas românicas com o objectivo de estabelecer
vocabulários básicos para o ensino dessas línguas a estrangeiros. A ciência da Estatística
Colégio Cacilhas Centro
Turma 8.2
Trabalho Colectivo De Língua Portuguesa
Léxica ou Léxico - estatística desenvolveu-se muito em razão desse fim pragmático. Dada a
enorme extensão do léxico, uma selecção lexical criteriosa e baseada em princípios
lexicoestatísticos apresentou-se como a melhor alternativa para estabelecer os índices verbonim
das palavras mais frequentes e usuais dentre as centenas de milhares que constituem o léxico
de uma língua de civilização moderna. Dessa forma, podem-se evitar o empirismo e uma
selecção vocabular com base apenas na intuição.
Por conseguinte, o ensino de línguas a estrangeiros propiciou a delimitação de um vocabulário
mínimo, indispensável à comunicação. Pretende-se, assim, atender às exigências de
comunicação rápida do mundo moderno, visando a objectivos essencialmente práticos.
Questões lexicológicas e terminologia técnica: o sistema lexical e a unidade léxica
Em se tratando de trabalho lexicológico, na selva terminológica que nos cerca, é preciso
estabelecer com clareza os limites de um conceito, bem como defini-lo com precisão, não
ignorando a tradição, com seus acertos e erros. Por outro lado, é perigoso misturar as teorias,
pois como bem afirmou Saussure, o ponto de vista do cientista cria o objecto. Ora, a pesquisa do
PF era um trabalho de estatística lexical; assim, era natural que os pesquisadores se
reportassem a um especialista na área, a saber: Charles Muller. Embora Muller tenha examinado
com rigor a questão da unidade léxica, não foi feliz na cunhagem de seus termos, assim como
na referencialidade que lhes atribui. A crítica principal que lhe faço é a de utilizar palavras da
linguagem comum para cunhar conceitos lexicoestatísticos novos, a saber: "mot" et "vocable".
A oposição que Muller estabelece entre mot e vocable é pertinente; foi inadequada, porém, a
etiquetagem dos termos. Se mot é uma palavra inadequada por causa de sua imprecisão e de
seu desgaste lingüístico, o mesmo se pode dizer de vocable. O dicionário etimológico de Bloch &
Wartburg (1950) informa que vocable, registrado por volta de 1400, é usual no século XVI. Mais
tarde tornou-se raro, voltando à circulação no século XLX. O Littré (1964-1965) define vocable :
"1- Teime de giammaiíe. Mot, partie integrante du langage ". A seguir dá abonações do século XV
I (Rabelais e Montesquieu). Por conseguinte, a despeito de não ser usada durante um certo
tempo, vocable é palavra antiga no francês, podendo ser considerada sinônima de mot nesse
idioma. Donde se deduz que melhor fora que Muller evitasse o termo vocable, já que ele será
sempre co-referido a mot. Na literatura técnica em língua inglesa, estatísticos lingüísticos de
renome, como Herdan, opuseram os termos type e token, que tampouco são adequados.
Contudo, não oferecem a desvantagem adicional de procederem do repertório da Lexicologia.
A despeito da conceituação registada no Dicionário de Linguística, de Dubois et al. (1973), julgo
que não se deva reproduzir Muller como aí consta. Em português como em francês, vocábulo
(vocable) é palavra antiga da língua, sendo igualmente sinónima de palavra {mot). Bluteau
(1712-1721) e Morais Silva (l.ed., 1789; 2.ed., 1813) registaram esses termos com esses valores
semânticos. E lembremos ainda que a fonte de dados de ambos é textos e autores dos séculos
XV I e XVII. Em suma, para um novo conceito de Estatística Lexical, deve-se forjar um termo
novo, para evitar imprecisões, ambiguidades.
No plano das realizações discursivas qualquer seqüência significativa será chamada indiferente
e imprecisamente de palavra ou vocábulo. A unidade denominativa para um conjunto de formas
flexionadas que compõem um paradigma será denominada lexema/lema. Lema é também a
entrada canónica nos dicionários da língua em questão. O uso desses termos técnicos eliminaria
as ambiguidades, indesejáveis em ciência. O termo palavra é operacional como elemento da
linguagem comum. Num uso não específico é a designação pertinente, já que qualquer falante
do idioma identifica o seu designado sem problemas. Também o termo forma não é ambíguo
Colégio Cacilhas Centro
Turma 8.2
Trabalho Colectivo De Língua Portuguesa
para a designação referida. O termo palavra é inadequado, porém, quando se trata de identificar
as unidades léxicas da língua (nível do sistema), sobretudo numa praxis contábil como a da
Estatística Léxica, em que é necessário distinguir bem aquilo que se conta.
O termo monema, proposto por Martinet, não me parece funcional em Lexicologia. Inversamente,
o termo lexia, proposto por Pottier, é bastante útil, sobretudo por ser um termo técnico, e não
correr o risco de ser maculado com as conotações discursivas, que podem gerar a ambigüidade
encontrada em palavra e/ou vocábulo. Assim, no plano da língua, o termo lexema refere a
unidade abstrata do léxico. As manifestações discursivas dos lexemas devem ser referidas
tecnicamente como lexias.
Consideremos outro problema teórico que se põe de imediato: a identificação das unidades
léxicas no texto, em virtude das imprecisões e inadequações do sistema ortográfico e da tradição
gráfica. Registram-se dois tipos de unidades: Jexías simples e lexias complexas. Exemplos de
lexias simples: escola, meio, hora, esperar, fazer, esse, ali, alguém etc. Exemplos de iexias
complexas: fim de semana, sala de jantar, dona de casa, além de, de repente, pouco a pouco,
de pé, para com, fora de mão.
Portanto, lexias complexas são aquelas unidades lexicais que, no plano da escrita, são grafadas
como uma sequência de unidades, embora correspondam a um único referente no plano da
língua. Ainda com respeito aos conceitos teóricos básicos da Lexicologia parece-me importante
clarificar mais um ponto. De que unidades se compõe o léxico? Convém insistir nessa questão,
já que se constata que alguns lingüistas parecem entender diversamente a questão. Para nós, o
léxico é constituído por todos os elementos lexicais da língua, vale dizer: os lexemas de valor
lexical (as palavras plenas) e os lexemas de valor gramatical (as palavras gramaticais,
vocábulos-morfema), que alguns linguistas chamaríam gramemas, adoptando a terminologia
potieriana.
Aliás, Pottier inclui nessa classe também os afixos, somando os elementos de valor meramente
mórfico às unidades de nível superior, a saber: as palavras gramaticais. Não me parece
operacional essa categorização porque um tanto ambígua, a despeito de esses dois tipos de
elementos guardarem semelhanças em seu uso e valor linguísticos. Quanto a incluir no léxico
tanto as palavras plenas como as palavras gramaticais, convém lembrar que essa é uma velha
tradição nas línguas ocidentais. Desde o século XVI os dicionários das línguas ocidentais
registam essas duas categorias de lexemas. Essa prática lexicográfica não pode ser ignorada,
pois os dicionários são as únicas descrições globais dos léxicos das línguas.
Para identificar a unidade lexical, a equipe do PF utilizou como árbitro o Vocabulário da Língua
Portuguesa (VLP), de Rebelo Gonçalves (1966). Embora a prática usual em trabalhos de
lexicoestatística fosse escolher um dicionário como base de referência, essa decisão não foi a
ideal. A metodologia de atribuir ao dicionarista a arbitragem na identificação e categorização das
unidades lexicais cria vários escolhos para o lexicólogo.
Não existe em língua portuguesa um dicionário que tenha operado com critérios aceitáveis pelo
actual estágio dos conhecimentos em Lexicologia. Ademais, como o léxico está em perpétua
mutação e movimento, acompanhando as mudanças socioculturais, nenhum dicionário
conseguirá registar fidedignamente esse acervo, pois as unidades complexas encontram-se em
estágios diferentes de cristalização. A rigor, nenhum dicionário pode ser considerado árbitro. Os
estatísticos léxicos têm adoptado tal critério por uma questão de comodidade, sabendo contudo
da sua precariedade. Trata-se sempre de uma obra incompleta, inacabada, dada a natureza
inferi do léxico. De fato, todo dicionário precisaria ser actualizado, no mínimo, a cada dez anos.
Colégio Cacilhas Centro
Turma 8.2
Trabalho Colectivo De Língua Portuguesa
A esse espaço de variação que o conceito de língua intrinsecamente encerra, há que associar a
dimensão temporal. A mudança linguística só excepcionalmente é abrupta. Via de regra, ela
ocorre paulatinamente, opera de geração em geração, afectando as componentes lexical,
fonética ou sintáctica. Para uma geração de falantes, a língua falada pelos seus antepassados
directos não é percebida como radicalmente diferente, embora se detectem mudanças, muitas
vezes de natureza lexical, que asseguram a coerência interna de cada faixa geracional, mas a
comparação entre sincronias mais distantes mostra mais diferenças e bem mais evidentes. Os
falantes que integram uma dada comunidade linguística podem variar entre si no uso da língua
– ou provêm de variedades ou dialectos distintos ou são falantes conservadores face a outros
mais inovadores. Geralmente, esse espaço de “desacerto” linguístico não impede a
intercompreensão e também não é caracterizado como erro, o que nos traz de volta ao
conceito abstracto de língua, ou da língua que a norma de cada momento prestigia. Os erros
estão na margem que vai da variação aceitável à invariância artificial da norma. Como a norma
também muda, pode-se admitir que o que foi erro num determinado momento deixe de o ser
mais tarde. No léxico, mais do que em qualquer outro domínio da gramática, não é o conceito
de erro aquele que melhor serve para avaliar o estatuto das palavras na língua e no seu uso. A
identificação do léxico de uma língua depende do entendimento que se tiver de língua, ou de
dialecto (se a questão for deslocada para esse domínio), o que, como vimos, depende mais de
critérios ideológicos do que razões linguísticas. Assim, a descrição do léxico de uma língua
pode cobrir realidades bastante diferentes, incluindo ou excluindo a oralidade, registos
discursivos mais ou menos prestigiados, ou diferentes delimitações temporais.

O léxico de uma língua é, pois, uma entidade abstracta que se obtém por acumulação: às
palavras em uso por cada falante, no seio de uma dada comunidade de falantes, juntam-se as
palavras em uso por outras comunidades linguísticas falantes da mesma língua; às palavras em
uso na contemporaneidade, somam-se as que estiveram em uso em sincronias passadas, de
que temos notícia pela documentação escrita e que, por vezes, ressurgem; aos dados da
escrita, unem-se os da oralidade, quando é possível apreendê-la, dada a muito maior fluidez
da oralidade face à escrita. Procurar conhecer o léxico de uma língua a partir do conhecimento
do léxico dos falantes implica compreender o que se passa nessa dimensão. O léxico de cada
falante, que é também chamado de léxico mental, depende da sua apropriação dos estímulos
lexicais a que é exposto, e, portanto, variará muito em função da sua experiência linguística
individual, do que ouve, do que lê, do que fala e do que escreve. Um indivíduo não é falante de
uma dada língua porque nasceu e cresceu no país onde essa é a língua oficial, mas porque
esses foram os dados linguísticos a que foi exposto, enquanto membro de uma dada
comunidade, crucialmente nos seus primeiros anos. A aprendizagem de palavras é uma
possibilidade que acompanha os falantes ao longo de toda a sua vida, mas há também perdas
e esquecimentos motivados pelo desuso. O conhecimento lexical que o falante possui num
dado momento pode, pois, não ser idêntico ao de um momento anterior ou posterior: trata-se
de um saber cumulativo e, também, degradável.

Segundo Aitchison (1987; 1990: 7), o volume de dados que o léxico mental integra é
consideravelmente grande: o léxico de um adulto tem entre 50.000 e 250.000 palavras,
havendo uma distinção básica entre o léxico passivo, mais extenso, e que é usado nas
operações de reconhecimento de enunciados linguísticos, e o léxico activo, mais reduzido, e
que está disponível para a produção. Apesar desse enorme volume de dados, tanto o
reconhecimento como a produção de cada palavra ocorrem muito rapidamente, em fracções
de segundo. Mas a dimensão individual do conhecimento lexical não diz apenas respeito à
quantidade de palavras que cada falante conhece e usa – também há diferenças na qualidade
Colégio Cacilhas Centro
Turma 8.2
Trabalho Colectivo De Língua Portuguesa
do conhecimento das unidades lexicais. Para exemplificar essa última questão pode-se
mencionar a ortografia ou a informação etimológica. Ainda que a escolarização intervenha
actualmente na formação da quase totalidade das populações, e que, portanto, a
aprendizagem da escrita esteja mais ou menos generalizada, sabe-se que continua a haver
franjas de analfabetismo e, mais relevantemente, largos contingentes de analfabetos
funcionais. Nem o desconhecimento da escrita, nem os desvios à norma ortográfica
determinam o grau de conhecimento das restantes propriedades das palavras, nomeadamente
a sua realização fonética ou o seu significado. O mesmo se verifica com o conhecimento
etimológico. Nesse caso, é necessário salvaguardar, desde logo, que boa parte da etimologia
do léxico das línguas está ainda por estudar. Mesmo nos casos em que as hipóteses conhecidas
são plausíveis e estão documentadas, não sendo conjecturais e, portanto, polémicas, a maior
parte dos falantes desconhece-as.

Pode replicar-se este argumento em relação ao conhecimento do(s) significado(s)3 ou das


propriedades de selecção das unidades lexicais4 , ou de qualquer outra das suas propriedades,
o que nos leva a admitir que o conhecimento dos vários tipos de propriedades das unidades
lexicais é obtido de forma independente. Também se pode admitir a hipótese de que o
conhecimento de uma dada propriedade das unidades lexicais potencia o conhecimento de
outra ou outras das suas propriedades, ou seja, que, ainda que independentes, as
propriedades das unidades lexicais são inter-relacionáveis. Retomemos o exemplo da
ortografia, que permite observar esta interacção pela sua relação com a realização fonética da
unidade lexical. Como é sabido, a ortografia do Português tem uma forte componente
fonética, baseada no estabelecimento sistemático de uma correspondência entre um som e
uma grafia. Quem souber como se pronuncia uma palavra poderá, pois, tentar escrevê-la,
mesmo sem nunca ter “aprendido” a fazê-lo. Este princípio dá bons resultados em muitos
casos e levanta problemas em vários outros: no Português, um som como [v] é sempre grafado
com), mas um som como [ς] dispõe de várias alternativas

Ouvir uma palavra pode, pois, permitir a realização do seu registo gráfico, mas a ortografia das
palavras é também um conhecimento independente e bastante fértil em imprevisibilidades e é
essa imprevisibilidade que permite que uma única grafia, como por exemplo a de , possa servir
de lugar de encontro a tantas pronúncias diversas.

Colégio Cacilhas Centro


Turma 8.2
Trabalho Colectivo De Língua Portuguesa

Você também pode gostar