Você está na página 1de 429

Serie

lingstica

6
COLECCIN B A S E

COLECCIN B A S E

Serie
lingstica

A LEXICOGRAFA GALEGA moderna


recursos e perspectivas

A lexicografa , nos estudos lingsticos do galego, unha lia de atencin preferente e incesante desenvolvemento. Neste volume renense 19
contribucins resultantes do convite
feito polo Instituto da Lingua Galega
a distintos investigadores co fin de
facer unha instantnea do estado
actual desta disciplina en Galicia e, a
partir dela, planificar o traballo da
sa seccin de lexicografa para os
prximos anos.
Pola sa temtica, os traballos responden a tres grandes perspectivas:
(a) a historiografa e a metodoloxa
lexicogrficas, (b) os recursos lexicogrficos no presente e as sas perspectivas de futuro e (c) a lexicografa
acadmica. A presenza fundamental
do galego como obxecto de estudo
vese enriquecida con olladas selectas
a outras linguas como o portugus, o
casteln, o cataln e o italiano.

ERNESTO GONZLEZ SEOANE


ANTN SANTAMARINA
XAVIER VARELA BARREIRO

EDITORES

CONSELLO
DA CULTURA
GALEGA

A LEXICOGRAFA
GALEGA moderna
recursos e
perspectivas

ERNESTO GONZLEZ SEOANE


ANTN SANTAMARINA
XAVIER VARELA BARREIRO

CONSELLO
DA CULTURA
GALEGA

INSTITUTO DA LINGUA GALEGA

COLECCIN B A S E

EDITORES

INSTITUTO DA LINGUA GALEGA

CONSELLO
DA CULTURA
GALEGA

A LEXICOGRAFA GALEGA MODERNA


RECURSOS E PERSPECTIVAS

A lexicograa galega moderna: recursos e perspectivas /


Ernesto Gonzlez Seoane, Antn Santamarina, Xavier Varela Barreiro
(editores).- Santiago de Compostela: Consello da Cultura Galega: Instituto
da Lingua Galega, 2008.- 425 p. ; 22 cm.
(Coleccin Base. Serie Lingstica; 6)
D.L. VG 1648-2008.- ISBN: 978-84-96530-85-0
1. Lingua Galega-Lexicografa. I. Gonzlez Seoane, Ernesto. II. Santamarina, Antn. III. Varela Barreiro, Xavier. IV. Consello da Cultura Galega, ed. V.
Instituto da Lingua Galega, ed.

CONSELLO DA CULTURA GALEGA

INSTITUTO DA LINGUA GALEGA

Pazo de Raxoi, 2 andar

Praza da Universidade, 4

Praza do Obradoiro, s/n

15782 Santiago de Compostela

15705 Santiago de Compostela

Tel. 981 563 100 Fax 981 572 770

Tel. 981 957 202 Fax 981 957 205

ilgsec@usc.es

correo@consellodacultura.org
Proxecto grco
Agalip
Deseo de cubertas
Manuel Janeiro
ISBN 978-84-96530-85-0
Depsito legal VG- 1648-2008
Imprime: C/A grca

A LEXICOGRAFA GALEGA MODERNA


RECURSOS E PERSPECTIVAS
Ernesto Gonzlez Seoane
Antn Santamarina
Xavier Varela Barreiro (eds.)

NDICE

Limiar .....................................................................................................................................................

I. HISTORIOGRAFA E METODOLOXA

Manuel Alvar Ezquerra


Problemas tericos y prcticos en la redaccin del NTLE ............................... 19
Dieter Messner
Os dicionrios como fonte lexicogrca .....................................................................

41

Xos-lvaro Porto Dapena


A informacin gramatical nos dicionarios ...............................................................

57

Telmo Verdelho
Lexicograa portuguesa. Perspectiva crtica ...........................................................

83

II. RECURSOS E PROXECTOS

Mara Xess Bugarn Lpez


O galego fundamental: dicionario de frecuencias .............................................. 117
Eva M Domnguez Noya
O Corpus de Referencia do Galego Actual (CORGA): presente e
futuro ..................................................................................................................................................... 139

Francisco Fernndez Rei / Carme Hermida Gulas


O Arquivo do Galego Oral e o seu aproveitamento lexicogrco ............. 153
Xess Ferro Ruibal
A fraseoloxa como fonte lexicogrca ........................................................................ 167
Ana Beln Crespo Bastos / Xos Mara Gmez Clemente
Novos criterios para a elaboracin dun dicionario de neoloxismos ...... 183
Xavier Gmez Guinovart
A investigacin en lexicografa e terminoloxa no Corpus
Lingstico da Universidade de Vigo (CLUVI) e no Corpus Tcnico
do Galego (CTG) .............................................................................................................................. 197
Paulo Martnez Lema
Un corpus para o estudo do galego medieval: O TMILG (Tesouro
Medieval Informatizado da Lingua Galega) .............................................................. 217
Xusto Rodrguez Ro
bUSCatermos: banco de datos terminolxico multilinge ............................ 235
Maria Francisca Xavier
O Dicionrio do Portugus Medieval. Fontes, concepo e
metodologia ...................................................................................................................................... 241

III. A LEXICOGRAFA ACADMICA

Manuel Gonzlez Gonzlez


O novo dicionario da Real Academia Galega ........................................................... 257
Joaquim Rafel i Fontanals
La actividad lexicogrca del Institut dEstudis Catalans.
Pasado, presente y futuro. ...................................................................................................... 289
Joo Malaca Casteleiro
Actividades lexicogrcas da Academia das Cincias de Lisboa ............. 315

Guillermo Rojo
Pasado, presente e futuro nos traballos lexicogrcos da Real
Academia Espaola .................................................................................................................... 323
Pr Larson
O Tesoro della Lingua Italiana delle Origini: o futuro do italiano
antigo? .................................................................................................................................................. 329
Antn Santamarina
Os dicionarios histricos. Trazos dun dicionario histrico
galego e consideracins sobre a sa viabilidade .................................................. 343

Bibliografa citada ........................................................................................................................ 393

LIMIAR

Recentemente o Instituto da Lingua Galega quixo facer unha instantnea do estado actual da lexicografa galega co n de, a partir dela, propiciar unha reexin e planicar o traballo da sa seccin de lexicografa
para os prximos anos. Con tal motivo convidou a participar a distintos
especialistas, da casa e de fra, e encargoulles a realizacin de traballos
orixinais nos que desen conta dalgn aspecto da sa propia investigacin
que fose relevante neste eido e, deste xeito, contribusen a xar as reas
temticas preferentes e delimitar mellor, dentro delas, as vas polas que
haxa que encamiar no futuro os esforzos lexicogrcos.
Neste volume renense 19 contribucins, mais poderan gurar algunhas mis que, estando previstas no chamamento inicial, non chegaron a termo. A uns e a outros contribuntes exprsalles o Instituto da Lingua Galega o seu agradecemento pola colaboracin prestada.
***
A idea inicial foi abordar de forma proporcional tres grandes perspectivas: (a) a historiografa e a metodoloxa lexicogrcas, (b) os recursos
lexicogrcos no presente e as sas perspectivas de futuro e (c) a lexicografa acadmica. Ao cabo as seccins non resultaron exactamente
proporcionais mais nas tres comparecen traballos representativos e de
innegable valor.
Abre a seccin de metodoloxa o traballo de Manuel Alvar Ezquerra
(Universidad Complutense de Madrid). Nel d noticia pormenorizada dos
aspectos mis cotins e ntimos do proceso de construcin do monumental 11 volumes e 10.522 pxinas e recentemente aparecido (2007) Nuevo
tesoro lexicogrco del espaol (s. XIV-1726) (NTLE), feito en colaboracin
con Lidio Nieto Jimnez. Este captulo un bo exemplo de caderno de

10

bitcora da fabricacin dun dicionario de dicionarios. Nel non faltan as


alusins aos problemas do lexicgrafo cunha informtica balbuciente (nais dos 80 e comezos dos 90), ao compromiso de seleccionar os materiais
nunha longa lista de fontes, ao intenso esforzo de lematizacin de textos dunha elevadsima variacin grca e, tamn, continxencia de ter
que enfrontar unha reforma ortogrca na metade do camio (RAE 2000).
No segundo captulo, Dieter Messner (Paris-Lodron-Universitt Salzburg)
explora no seu tamn monumental e anda en curso de publicacin Dicionrio dos dicionrios portugueses (1994- ) (20 volumes e 12.000 pxinas)
o aproveitamento, non sempre ou case nunca recoecido, da informacin lexicogrca dos dicionarios na producin dicionarstica portuguesa
ata 1858. Nela sobresaen como fontes lexicogrcas, en distintas pocas,
os propios dicionarios portugueses (nun lugar destacado o Bluteau (17121728), os espaois (moi especialmente o Tesoro de la lengua castellana o espaola de Covarrubias (1611) e o Diccionario de Autoridades da RAE (17261739) e, en menor medida, os franceses (a Encyclopdie (1752). D. Messner
especialmente crtico co abuso deste procedemento no Diccionario da
Lingoa Portugueza publicado pela Academia Real das Sciencias de Lisboa
(1793), que considera un exemplo reprobable dos dicionrios que copiavam por inteiro o que est em outros dicionrios (neste caso o Diccionario de Autoridades). Xos-lvaro Porto Dapena (Universidade da Corua)
ofrece no terceiro captulo o seu punto de vista sobre o papel e o lugar da
informacin gramatical nos dicionarios xerais e comns. Desde a sa longa experiencia como lexicgrafo e gramtico e moi especialmente desde
a praxe actual da elaboracin, como director, do Diccionario Corua de
la lengua espaola actual (DCLEA), de futura aparicin, revisa os aspectos
tericos da distincin entre Lxico e Gramtica e o espiento cometido
de establecer na informacin gramatical os lmites entre o que obxecto
da gramtica e o que obxecto do dicionario. Pasa revista a practicamente todos os valores gramaticais susceptibles de guraren nun dicionario,
tanto na macroestrutura como na microestrutura. Por ltimo, Telmo Verdelho (Universidade de Aveiro) fai no seu captulo unha historia crtica
da lexicografa portuguesa ata 1900, desprovista cronicamente do amparo das institucins polticas nacionais. Entre as sas caractersticas menciona unha aparicin tarda comparativamente con outras: italiana, espaola, francesa e a orixinalidade de iniciarse, en dicionarios bilinges,
tomando como punto de partida o vernculo e non o latn. Destaca nela,
como fos condutores sucesivos, a lia de obras nacidas como resposta ao
encontro interlingstico con Asia e Amrica (o Brasil) na que foi verdadeira pioneira e na que tiveron un papel destacadsimo os Xesutas (ata

11

1750), e como resposta ao confronto moderno do portugus coas linguas


de Europa. A nivel de autores salienta a gura do Rafael Bluteau e o seu
monumental Vocabulario Portuguez (1712-1728).
O segundo bloque de contribucins rene traballos dedicados presentacin de proxectos e recursos de aproveitamento lexicogrco desenvolvidos no mbito do galego, co engadido dalgn do portugus. Un
deles, o captulo 5, de Mara Xess Bugarn (ILG), ten carcter individual e
presntase como investigacin concluda. Nel explica a autora a elaboracin da sa obra O galego fundamental. Dicionario de frecuencias (2007),
referida ao galego moderno. Detense na indicacin das utilidades varias
dunha obra deste tipo , neste dominio, a primeira e nica publicacin
sobre o galego e, sobre todo, relata con abundancia de exemplos ilustrativos o proceso de elaboracin (construcin do corpus, tratamento dos
materiais e obtencin de resultados).
Nos outros captulos deste segundo bloque dse noticia de proxectos,
recursos e investigacins lexicogrcas en curso, realizados colectivamente por equipos de investigacin de carcter universitario ou institucional.
Coinciden todos eles en presentaren experiencias, propostas e logros na
lingstica de corpus ou na fabricacin de bases de datos de orientacin
lexicogrca. No captulo 6 describe Eva Domnguez o Corpus de Referencia
do Galego Actual (CORGA) do Centro Ramn Pieiro para a Investigacin
en Humanidades. Centra a atencin, sobre todo, no etiquetador e lematizador do corpus, do que forman parte o sistema de etiquetas ou tagset, o
lexicn, o preprocesador (sen resolucin de ambigidades) e o etiquetador
(resolucin de ambigidades). No captulo 7 expoen Francisco Fernndez
Rei e Carme Hermida Gulas (ILG) a estrutura e composicin do Arquivo do
Galego Oral (AGO) do Instituto da Lingua Galega (seis subarquivos, mis
de 2.500 horas de gravacins, voces de 7.000 informantes e 315 concellos de
Galicia + 38 da Galicia exterior + mostras dos concellos cacereos do Val de
Xlima) e ilustran cun caso prctico o aproveitamento lxico dos seus materiais. No captulo 8 Xess Ferro Ruibal, director do proxecto Fraseoloxa
Galega do Centro Ramn Pieiro, rescata das compilacins paremiolxicas de Vicente Llpiz (1954a e 1954b) e de Francisco Vzquez Saco (1962)
unha manchea de valores semnticos, variantes gramaticais infrecuentes,
voces xa pouco frecuentes ou hibernadas e mesmo voces ntegras que non
aparecen rexistrados nas obras lexicogrcas compiladas no Diccionario
de diccionarios de Antn Santamarina (2003b), o que demostra que a fraseoloxa [] anda unha despensa lxica e que hai que tela mis presente. No captulo 9 Ana Beln Crespo Bastos e Xos Mara Gmez Clemente
(Universidade de Vigo) presentan os novos criterios de identicacin de

12

neoloxismos empregados nos traballos do Observatorio de Neoloxa da


Universidade de Vigo. Inciden, unha vez mis, na necesidade de revisin
do concepto de neoloxismo, na importancia de establecer con coherencia as marcas dos dicionarios de neoloxismos (marcas temporais, marcas
de frecuencia absoluta e dispersins temporal e marcas lingsticas) e na
importancia das tecnoloxas informticas como ferramenta auxiliar (extractores semiautomticos de neoloxismos). Xavier Gmez Guinovart,
director do Seminario de Lingstica Informtica (SLI) da Universidade
de Vigo, ocpase no captulo 10 dos logros lexicogrcos e terminolxicos
obtidos a partir dos crpora da Universidade de Vigo creados polo SLI e o
OdN. Explica as caractersticas dos crpora Corpus Lingstico da Universidade de Vigo (CLUVI) e Corpus Tcnico do Galego (CTG), e, como produtos
propiamente lexicogrcos, presenta o Dicionario CLUVI Ingls-Galego
e o Banco de Datos Terminolxico da Universidade de Vigo. Detense nos
proxectos que o grupo ten en perspectiva e entre eles destaca a colaboracin co Instituto da Lingua Galega en distintas empresas cientcas. No
seguinte captulo, o 11, Paulo Martnez Lema (ILG) amosa a nova versin do
Tesouro Medieval Informatizado da Lingua Galega (2007), o corpus lingstico medieval do Instituto da Lingua Galega (USC). Explica a sa estrutura
e caractersticas (tipoloxa textual, cronoloxa e glotoloxa, microestrutura
do corpus) e indica as expectativas que ten abertas como banco de datos
doutros proxectos lexicogrcos (Dicionario Medieval Galego-Portugus,
Dicionario Histrico Galego e Inventario Toponmico da Galicia Medieval).
No captulo 13 Xusto Rodrguez Ro (USC) describe o bUSCatermos e mais o
Banco de Datos Terminolxico (BDT), das instancias dun mesmo recurso
terminolxico do Servizo de Normalizacin Lingstica da Universidade
de Santiago de Compostela. Explica moi sucintamente a composicin das
fontes empregadas (propias e alleas) e o proceso de reelaboracin do material recollido (aplicacin do enfoque onomasiolxico, arrequentamento
da informacin das fontes e anlise valorativa das propostas alleas). No
captulo 13, Maria Francisca Xavier (Centro de Lingustica da Universidade
Nova de Lisboa) ofrece, como directora, unha panormica de dous proxectos de investigacin lexicogrca do portugus medieval: o Dicionrio do
Portugus Medieval (DPM) e o Corpus Informatizado do Portugus Medieval (CIPM). En relacin co primeiro, presenta as publicacins derivadas, explica o sistema de traballo (preparacin dos datos, identicacin das unidades lxicas e anlise delas) e explicita a estrutura da cha lexicogrca
(vedetta, clasicacin das palabras, etimoloxa, acepcins, aboamentos e
remisins). En relacin co corpus, ofrece a listaxe de obras procesadas.

13

O terceiro bloque acolle os seis traballos recibidos de representantes


autorizados de Academias e institucins investidas de potestade na xacin do estndar lingstico das sas respectivas comunidades ou altamente representativas delas. Algns, seguindo as indicacins dos editores deste volume, preferiron ofrecer unha visin histrica da actividade
lexicogrca da institucin representada, outros optaron por ocuparse
dun aspecto ou obra concreta e outros decidiron conxugar as das solucins anteriores. No nome da Real Academia Galega e como Secretario
dela, Manuel Gonzlez presenta no captulo 14 a actividade dicionarstica
do Seminario de Lexicografa desta institucin do que director nos
ltimos vinte anos. Despois de pasar unha rpida revista ao Diccionario
da lingua galega (ILG/RAG 1990) e ao Diccionario da Real Academia Galega (RAG 1997), expn as caractersticas da futura versin da segunda das
obras mencionadas, que conter 50.000 entradas. Detense nas fontes empregadas (obras lexicogrcas anteriores, corpus representativo da lingua
escrita do galego moderno e corpus representativo da lingua oral actual),
na macroestrutura da obra e na sa microestrutura. Joaquim Rafel i Fontanals comparece, no captulo 15, na representacin do Institut d Estudis
Catalans. No plano xeral, ofrece unha visin da historia, das funcins e da
estruturacin en seccins do Institut. En referencia aos traballos lexicogrcos da Seccin Filolxica, d noticia dos dicionarios de 1995 e 2001 e
detense na elaboracin do Diccionari del catal contemporani (DCC). Presntao como produto in eri da realizacin, en das fases, de proxectos
previos: o Corpus Textual Informatitzat de la Llengua Catalana (CTILC) e
a Base de Dades Lexicogrca (BDLex). Partindo da informacin contida
nestes dous recursos e contando cunha excelente estacin de traballo
lexicogrca, estase a realizar na actualidade este dicionario descritivo,
que tiene por objeto la denicin de las unidades lxicas de la lengua
desde el punto de vista de su contenido y de su utilizacin real, sin restricciones basadas en criterios prescriptivos. No captulo 16, Joo Malaca
Casteleiro (Academia das Cincias de Lisboa) fai unha sntese da historia
dos dicionarios da Academia desde o ano 1793, no que aparece o Diccionario da lingoa portugueza, ata a actualidade, cando xa est concludo,
anda que indito desde o 2005, o Novo Dicionrio da Lngua Portuguesa.
Ao seu antecedente, o Dicionrio da Lngua Portuguesa Contempornea
(2001), dedcalle boa parte do captulo. Explica o mbito cronolxico (sculos XIX e XX), o volume da sa informacin (70.000 entradas e 170.000
signicados e acepcins) e o seu carcter panluso (presenza notable de
brasileirismos, africanismos e asiaticismos). Por parte da Real Academia
Espaola e como Secretario dela, Guillermo Rojo (USC) fai no captulo 17

14

un balance histrico da actividade lexicogrca da RAE. Correspondendo co pasado, explica as caractersticas bsicas das sucesivas edicins
do DRAE anteriores de 2001. Como actividades presentes da Academia
destaca a realizacin dos crpora moderno (CREA) e diacrnico (CORDE),
culminada coa publicacin, en 2001, do Diccionario de la lengua espaola
(edicin en CD-ROM en 2003). De cara ao futuro sinala, como losofa de
traballo, a importancia da colaboracin entre todas as Academias e, no
terreo das obras lexicogrcas, a posta en marcha do Nuevo diccionario
histrico de la lengua espaola, do Diccionario acadmico de americanismos e a prxima publicacin dun novo DRAE (2013?) no que xa non se
incla a informacin diacrnica e diatpica correspondente aos dous
dicionarios mencionados. No captulo 18 e na representacin da Opera
del Vocabolario Italiano (OVI), Pr Larson describe o marco institucional e
lolxico de OVI (representa a continuacin da Accademia della Crusca) e
cntrase no Tesoro della Lingua Italiana delle Origini (TLIO). Realiza unha
visita guiada a este dicionario do italiano antigo, inclundo referencias
mnimas ao corpus no que se fundamenta. Pasa revista aos oito en realidade nove apartados que compoen a estrutura das entradas (lema
o moderno, variantes grcas, etimoloxa, atestacins, observacins
lingsticas, anotacins, valores semnticos estruturados e informacin
sobre os redactores) e destaca tres opcins deste recurso on-line: a posibilidade de recuperacin de explicacins semnticas nos propios textos
(opcin Gloss.), a indicacin do grao de abilidade e representatividade
lingstica das fontes textuais e a posibilidade de recuperacin conxunta
das unidades polirremticas.
No captulo que clausura o volume, Antn Santamarina (director da
Seccin de Lexicografa do Instituto da Lingua Galega-USC e membro
numerario da Real Academia Galega) contribe cun extenso texto preparatorio do Dicionario Histrico da Lingua Galega. Nas sas pxinas
condensa a experiencia e o esforzo de varias dcadas de traballo lexicogrco orientado realizacin desta vasta obra que situar o galego no
restrito grupo de linguas romnicas que conten cun dicionario histrico.
Por varias veces refrese a estes dicionarios como monumentos imprescindibles das culturas nacionais, pero ao que con mis nfase lle atribe
esta cualidade ao Oxford English Dictionary (OED), que chega a cualicar
como un dos principais monumentos da cultura mundial do sculo XX.
Nunha primeira parte de carcter historiogrco bota unha ollada aos
mis importantes dicionarios histricos. Cita algns antecedentes antigos e detense mis demoradamente nos dicionarios de linguas da Europa occidental, moi maioritariamente de linguas xermnicas (alemn,

15

ingls, holands, afrikaans, sueco, dans, noruegus), anda que tamn


dalgunha lingua romnica (francs e, moi sinaladamente, cataln). Na
segunda parte vai debullando os trazos constitutivos do futuro DHG: o
alcance cronolxico ou profundidade histrica, as fontes textuais (crpora e dicionarios), as caractersticas da macroestrutura e a organizacin
da microestrutura (informacin fontica, variantes grcas, etimoloxa,
informacin lxico-semntica). Por ltimo valora a viabilidade da empresa atendendo a cinco parmetros: (a) quen debe levala a cabo, (b) en que
institucin, (c) canto tempo vaia levar, (d) custo das actividades e (e) como
se vaia facer (tecnoloxas informticas).
***
No nome do Instituto da Lingua Galega queremos deixar constancia
do agradecemento a distintas institucins e organismos polas axudas recibidas. A Real Academia Galega patrocinou, ofreceu axuda econmica e
deu acollida na sa sede a algns actos. O Ministerio de Educacin e Ciencia contribuu con axuda econmica. A Facultade de Filoloxa (USC) deu,
como sempre, acollida maior parte dos actos e eventos a que deu lugar
esta iniciativa (realizacin dun simposio en novembro de 2006). Mencin
especial merece o Consello da Cultura Galega, que estende o seu patrocinio ao ILG desde o ano 2001, no que inaugurou esta prestixiosa Serie
Lingstica, dentro da Coleccin Base, editada en formato papel e electrnico (http://www.consellodacultura.org), este ltimo cunha difusin
extraordinaria. Quedamos en dbeda tamn cos compaeiros do Instituto da Lingua Galega polo apoio constante ofrecido aos editores durante
este tempo, moi especialmente a Paulo Martnez Lema, que, ademais de
participar como contribunte, colaborou ecazmente nas actividades organizativas. Finalmente reiteramos o noso recoecemento aos autores
dos traballos includos neste libro, na seguranza de que a sa difusin e
lectura fomentar a perseverancia dos lexicgrafos actuais e a incorporacin de novos investigadores que aseguren a continuidade no cultivo da
lexicografa.
Os editores

17

I. HISTORIOGRAFA E METODOLOXA

19

PROBLEMAS TERICOS Y PRCTICOS


EN LA REDACCIN DEL NTLE*
Manuel Alvar Ezquerra

Universidad Complutense de Madrid

Cuando los organizadores de este volumen me propusieron que escribiera sobre los problemas en la redaccin de diccionarios generales de la
lengua, me alegr porque me haca recordar pasados retos e imaginaba
los que pueden presentarse a la actividad diccionarstica en los prximos
aos. Sin embargo, no me atrev a sostener el envite porque en estos momentos mis preocupaciones se hallan orientadas en otras direcciones.
Mirando hacia el quehacer actual que absorbe la mayor parte de mi tiempo fue cuando les propuse tratar de las dicultades que surgen, que nos
han surgido, en la elaboracin de un tesoro lexicogrco, el Nuevo tesoro
lexicogrco del espaol (s. XIV-1726) (NTLE)1, que, por otra parte, no deja
de ser un diccionario de carcter general, si bien muy diferente de lo que
concebimos habitualmente como un diccionario general de la lengua, de
carcter descriptivo y sincrnico. Por otro lado, el NTLE se encuentra ms
cerca, porque lo es, de los repertorios de carcter acumulativo e histrico,
y muchos de los problemas que se nos presentaron son comunes a los
que aparecen en cualquier otro proyecto de lexicografa histrica. No son,
pues, problemas nuevos, sino viejos conocidos como siempre, unos ms
que otros que reaparecen al emprender una nueva obra.
Una de las principales dicultades con las que se encuentra cualquiera que desee redactar un diccionario, del tipo que sea, es la informatizacin, pues, como resulta conocido de todos, hoy ya no se acomete una
empresa lexicogrca sin acudir a los ordenadores, no puede ser de otro
modo. No creo necesario recordar aqu que fueron los estudios lexicolgicos y lexicogrcos de los primeros en beneciarse de los avances
*

Este trabajo se encuadra dentro de los llevados a cabo para el proyecto Nuevo Tesoro Lexicogrco del
Espaol (s. XIV-1726), que goza de una ayuda del Ministerio de Ciencia y Tecnologa (HUM2004-05344).

1.

A propsito de la obra, vanse Alvar Ezquerra (2003a, 2003b, 2004 y 2006a). Adems, Nieto Jimnez / Alvar
Ezquerra (2004) y Alvar Ezquerra / Nieto Jimnez (2006).

20

Manuel Alvar Ezquerra

tecnolgicos, como ha ocurrido siempre, por lo menos desde que la imprenta irrumpi en nuestro mundo. El uso de los ordenadores en nuestros mbitos ya no es una novedad: han transcurrido ms de treinta aos
desde que comenzaron a hacerse los primeros trabajos de informatizacin aplicada al lxico y a los diccionarios del espaol. Por supuesto, los
medios, tcnicas, procedimientos, rapidez, volumen de datos tratados,
complejidad de las consultas, etc., etc., han cambiado de forma sustancial, y lo que hoy podemos hacer en nuestra casa en unos minutos con
un ordenador personal y un programa comercial, entonces requera de
un gran esfuerzo personal y material, y de unas cuantas semanas, si no
meses, de trabajo.
Por lo que respecta al NTLE, los inconvenientes en su informatizacin
han surgido por cualquier parte cuando menos los esperbamos, y hemos
tenido que acudir a mltiples frentes para ir solucionando los problemas
que se planteaban cada vez que desebamos avanzar un paso en el trabajo.
En primer lugar, para tratar informticamente los datos contenidos
en los diccionarios que desebamos recopilar resultaba necesario darles
un formato electrnico, como es obvio. Para ello haba que disponer de
ordenadores, pero de qu tipo? En el inicio de las tareas, una parte del
equipo se encontraba en Madrid, y otra en Mlaga, as que debamos buscar la mxima compatibilidad posible, para evitar problemas en el envo
de datos de un lado a otro. Nos pareci lo ms apropiado emplear ordenadores personales en lugar de grandes equipos, decisin que vena avalada
por mi experiencia anterior durante la redaccin del Diccionario general
ilustrado de la lengua espaola (DGILE 1987), en la que la utilizacin de
grandes equipos informticos nos proporcion ms de un sobresalto, y
siempre debido a motivos ajenos a la propia redaccin lexicogrca. Es
ms, cuando la editorial Biblograf s. a. decidi crear en Mlaga el CELEX
(Centro de Lexicografa Vox), se opt por los ordenadores personales, pues
eran la mejor solucin para facilitar el trabajo en equipo con sedes diferentes, y para el envo de materiales entre Mlaga y Barcelona.
La segunda parte del problema informtico inicial consista en la recuperacin de la informacin contenida en las fuentes que iban a servir
para la elaboracin del NTLE. El trabajo que pretendamos llevar a cabo se
nos presentaba inmenso: agrupar decenas y ms decenas de diccionarios
y otras obras con contenido lxico. La primera idea que acude a cualquiera que se vea en la misma tesitura es la de escanear los repertorios. Sin
embargo, apenas la consideramos, entreviendo la multitud de inconvenientes que nos iban a surgir, derivados de los tipos de materiales tan
heterogneos que bamos a manejar.

Problemas tericos y prcticos en la redaccin del NTLE

21

De entrada, quedaba descartado el escaneo de los manuscritos, pues


los medios tcnicos a nuestro alcance no pueden recuperar su informacin,
mxime habida cuenta del psimo estado en que se encuentra la mayor
parte de los que hemos utilizado, y que no son pocos, pues del centenar y
medio de fuentes manejadas 23 son manuscritos que hemos tenido que leer
nosotros mismos, y dos ms de los que se dispone de transcripciones ables,
junto con los tres glosarios medievales editados por Amrico Castro. Por otra
parte, tampoco era posible el escaneo de los repertorios impresos, pues resulta evidente que, de ningn modo, se nos facilitaran los originales para tal
tarea, por lo que hubiramos debido partir de las fotocopias de que hemos
dispuesto, en las que los problemas se acentan, debido a la falta de limpieza que tienen para poder realizar un escaneo con unas mnimas garantas.
Es cierto que disponemos de ediciones facsimilares de algunas obras, de los
dos diccionarios grandes de Nebrija (1492, 1495?) y de sus Introductiones latin (Nebrija 1481), del de Cristbal de las Casas (1570), del de John Minsheu
(1599), del de Hadrianus Junius (1567), de los dos annimos ingleses de 1554
(Annimo 1554a y Annimo 1554b), del Vocabulario del humanista de Lorenzo Palmireno (1569), del Vitruvio de Miguel de Urrea (1582), de la Instruccin
nutica de Diego Garca de Palacio (1587), del tratado de Bernardo de Aldrete
(1606), as como de otras obras de gran envergadura de las que queramos
extraer datos, como el Dioscrides de Andrs Laguna (1555) o el tratado de las
aves de Francisco Marcuello (1617). Poca cosa ante el panorama que se nos
presentaba, mxime cuando las ediciones facsimilares, en algunos casos,
tampoco presentan la limpieza que se necesita en estas ocasiones, y parten de reproducciones de baja calidad. En cualquier caso, fuesen originales,
facsmiles o fotocopias, el escaneado no pareca la mejor solucin debido a
mltiples causas que se comprenden con facilidad:
la diversidad tipogrca, que hubiera obligado a instruir al programa en cada caso particular, si es que llegaba a reconocer el tipo
de letra. Pinsese en las diferencias entre los impresos de nales
del siglo XV y los del siglo XVIII, o en el empleo de tipografa gtica, mantenida durante varios siglos en los textos en alemn y
amenco junto a otros tipos para las otras lenguas de los mismos
repertorios.
las manchas de tinta debidas a una impresin no excesivamente
cuidada (acrecentadas en las fotocopias), que hubieran dicultado
la interpretacin de las letras.
la escasa calidad de los papeles empleados para la impresin, que
aportan otras manchas que dicultan la lectura, en el caso en que

22

Manuel Alvar Ezquerra

el contraste hubiese sido suciente entre el papel y la tinta, debido


al deterioro de aqul.
la variedad de lenguas utilizadas en los repertorios, y alfabetos
distintos: latino, griego, hebreo, rabe.
el empleo de frecuentes abreviaturas, no sistemticas, y, espordicamente, de algunos signos no alfabticos.
las numerosas erratas y errores debidos a que una buena cantidad
de los repertorios fueron impresos fuera de nuestras fronteras, por
impresores que no conocan bien nuestra lengua.
Tngase en cuenta, adems, que los diccionarios eran obras de carcter didctico, de consulta, por lo que los papeles empleados en ellos no
eran los mejores, y su impresin no resultaba todo lo cuidada que hubiramos deseado, y, por supuesto, de una calidad inferior a la de otros
libros, por no pensar en el desgaste por el uso en manos de estudiantes,
comerciantes y otras personas, lo que no necesariamente afecta a todos
los ejemplares conservados.
Si nos hubisemos decidido por el escaneo, las tareas de lectura y correccin hubiesen sido muy superiores a lo tolerable para que la solucin
fuese razonable en trminos de tiempo, de trabajo y de gasto.
Aunque poco deseable, y menos apetecible, la nica solucin que nos
quedaba era teclear, uno a uno, todos los diccionarios que deban constituir el cuerpo del NTLE, labor a la que nos hemos dedicado varias personas
durante unos cuantos aos. Pero no se trataba de comenzar el tecleado
a ciegas, sin haber imaginado el resultado nal. Para qu iban a servir
los datos codicados? Sin duda, como en tantos otros diccionarios, tendramos que montar una base de datos para los tratamientos y consultas
que fuese necesario realizar antes de alcanzar la meta propuesta. Mi decisin estaba tomada de antemano: trabajaramos con Access de Microsoft,
pese a que se baraj la posibilidad de emplear otra base de datos para
ordenadores personales. Ello era as porque conoca el funcionamiento
y prestaciones de esa base de datos, gracias a la experiencia con ella en
otro tesoro lexicogrco, bien es cierto que de un carcter diferente del
que estbamos acometiendo, terminado ya cuando habamos comenzado el NTLE, el Tesoro lxico de las hablas andaluzas (Alvar Ezquerra 2000),
en cuya realizacin me surgieron no pocos problemas, de los que he dado
cuenta en otros lugares2, y que alumbraron nuestros primeros pasos. Sin
embargo, debido a la heterogeneidad del equipo, de la diversidad de per2.

Vase el propio prlogo de la obra, as como Alvar Ezquerra (1996).

Problemas tericos y prcticos en la redaccin del NTLE

23

sonas que iban a trabajar y de la disponibilidad de equipos informticos


de todas ellas, as como por la falta de conocimientos en herramientas
informticas, y otros inconvenientes menores, no resultaba aconsejable
pasar directamente los datos a la base de datos. Fue ste el motivo por el
que se opt por teclear los diccionarios en un programa de tratamiento
de textos, disponible en todos los equipos, en un formato RTF, con el n de
que no surgieran los problemas de compatibilidad que se nos presentaron en varias ocasiones con el Tesoro lxico de las hablas andaluzas.
Esa resolucin conllevaba, como es lgico, que todos los colaboradores trabajasen del mismo modo, por lo que fue necesario redactar unas
normas de tecleado en las que se especicaban las instrucciones que deban seguirse, los signos que se deban emplear, formatos, tamaos de
archivos, etc., etc. Como es fcil de imaginar, estas normas fueron modicndose durante los primeros tiempos a medida que avanzaba el trabajo,
pues no fue posible prever todas las contingencias desde los inicios. Algunas de esas modicaciones nos obligaron a volver atrs y rehacer parte
de lo que ya tenamos hecho, lo cual no siempre fue bien entendido por
los colaboradores, aunque lo perseguido era dar consistencia al conjunto
de los materiales. Bien es cierto que ahora vemos lo acertado de las decisiones, pues la base de datos nos permite avanzar con una rapidez que, de
otro modo, no hubiese sido posible. El ulterior paso desde las informaciones codicadas en el tratamiento de textos a la base de datos, entre otras
cosas, obligaba a marcar la separacin entre algunos campos para que
la carga en ella no plantease otras dicultades sobrevenidas. Pero tambin ello obligaba a tener en cuenta otros aspectos. Por ejemplo, la base
de datos no permite los cambios de tipo de letra, por lo que no era posible
el empleo de cursivas y negritas, para lo cual seguimos el mismo procedimiento que en el Tesoro lxico de las hablas andaluzas: poner unas marcas
de apertura y de cierre, de modo que los cambios fuesen fcilmente detectables en cualquier momento y para cualquier necesidad que pudiese
surgir en el futuro, como as sucedi. Tampoco eran posibles los cambios
de tamaos de letra, o el empleo del alfabeto griego o el hebreo, pues todos esos signos desaparecan al cargar la base; igualmente, no era posible
el empleo de algunos signos especiales, como cruces y otros smbolos que
encontramos en algunos de los originales, bien es cierto que de forma
muy espordica. Para todo se fueron adoptando soluciones, que obligaran a cambios ms adelante en el trabajo.
Al tiempo que se realizaba el tecleado, se marcaban las supresiones
de texto innecesario, los blancos, las ausencias, los rotos en el papel, los
cortes que impedan la lectura, etc., etc. Pero esos no eran los nicos as-

24

Manuel Alvar Ezquerra

pectos formales que se iban solucionando. En los textos manejados han


aparecido numerossimos errores y erratas debidos al poco escrpulo con
que se componan los diccionarios, a la escasa formacin de algunos tipgrafos, o sus pocos conocimientos de espaol cuando las impresiones se
realizaban fuera de nuestras fronteras, o a que no interpretaban adecuadamente los manuscritos que les llegaban. No resulta extrao encontrar
confusiones de u por n o a la inversa, de c por , numerosos casos de seseo
y algunos de ceceo, etc. Se efectuaron las correcciones de errores y erratas
poniendo entre corchetes nuestra interpretacin, aadiendo unas interrogaciones a aquellas de las que no nos hallbamos muy seguros, hasta
una comprobacin posterior. Por el contrario, las lecturas que resultan
sorprendentes, o para las que no tenemos una solucin satisfactoria, van
seguidas de unas interrogaciones entre corchetes, o de un sic, con el n de
que el usuario no tenga dudas sobre lo que lee. Hemos optado por ofrecer
a continuacin de la palabra su reconstruccin ntegra entre corchetes,
y no poner slo la letra o signo cambiado en su interior, de modo que si
en algn momento se realiza una consulta automtica de una cadena de
caracteres no se nos escamoteen las soluciones porque no se haya tenido
en cuenta un corchete que no puede estar previsto en la cadena buscada.
Esta solucin es tanto ms necesaria cuando lo modicado es la palabra
que gura como entrada del diccionario: hemos respetado el original,
pero en el NTLE aparece como lema la solucin correcta.
Como se ve, los textos no se han tecleado tal cual guran en los originales. Se han modicado la puntuacin y la acentuacin, para adecuarlas
a las reglas y usos actuales en espaol, no as en las otras lenguas, lo cual
hubiera requerido un esfuerzo para el que no estbamos capacitados, ni
para el que tenamos medios personales y materiales, aunque en determinadas ocasiones, y para facilitar la lectura, se ha cambiado la puntuacin o la acentuacin, o se han introducido correcciones entre corchetes,
pero, repito, slo de manera muy espordica. Por eso, el lector encontrar
en lo escrito en lenguas diferentes al espaol unas tildes o unos signos de
puntuacin que resultan chocantes (por ejemplo, tildes en algunos textos
latinos, empleos de diacrticos que no se corresponden con los actuales
en italiano o en francs, etc., por no hablar de los signos de puntuacin).
Esta tarea, que pareca fcil, se nos vino a complicar con la aparicin de
las nuevas normas ortogrcas de la Academia (RAE 2000). Tuvimos que
plantearnos si volver atrs en todo lo que tenamos realizado hasta entonces, que era mucho, o seguir adelante con los mismos criterios. Optamos por esta ltima posibilidad para no estar tejiendo y destejiendo de
modo continuo, lo que a la postre, ira en contra del desarrollo del trabajo,

Problemas tericos y prcticos en la redaccin del NTLE

25

y nos alejara el puerto al que queramos llegar, todava lejano. Adems, el


mantenimiento de la ortografa anterior no supona un atentado demasiado grande contra la lengua, de ninguna manera impedira la lectura de
la obra, ya que los usuarios, al menos los actuales, estn acostumbrados al
sistema conservado, y sabran comprender lo sucedido.
En este proceso tambin se comprobaban las remisiones que hacan
los autores a otras partes de sus diccionarios, sealndose aquellos casos
en que se trataba de pistas perdidas, cuando no era un simple error, habindose corregido como los dems.
Tambin se desarrollaron las abreviaturas espaolas para hacer fcilmente comprensible el texto, excepto las que son habituales hoy, como
S., Sr., etc. A la vez, se fueron incluyendo remisiones cuando en el interior
del texto reproducido se dena otra palabra, o haba una referencia a ella
digna de ser tenida en cuenta, o se utilizaban varios equivalentes espaoles para una forma extranjera, o la entrada espaola contena varias voces, y tantas otras posibilidades ms. Se ha puesto especial cuidado para
que estas remisiones no se confundan con las que se ponan los propios
autores para guiar al usuario en la consulta de su obra; stas aparecen
con la misma tipografa empleada para el texto de los diccionarios, mientras que las nuestras van con un tipo de letra diferenciado.
En denitiva, hemos seguido unos criterios que resultan habituales
en la edicin de textos, y que no sorprendern al lector experimentado.
En este sentido, quiero dejar claro que las erratas muy evidentes se han
corregido sin ms, aunque en pocos casos. Adems de todo ello, durante
el proceso de tecleado se sustitua el signo tironiano de acuerdo con la
norma en la lengua correspondiente, excepto en ingls, por el uso que
sigue teniendo.
El tecleado result verdaderamente complicado con el Vocabulista
aruigo en letra castellana de fray Pedro de Alcal (1505). La ventaja inicial que presentaba esta obra, al hallarse las voces rabes transliteradas
en nuestro alfabeto, se vio desvanecida inmediatamente, ya que el autor
emple unos signos especiales para determinados sonidos, que no se encuentran en la tabla de signos ASCII que hemos manejado, la ms reducida, para, como siempre, evitar problemas. La solucin que adoptamos
fue el empleo de unas combinaciones de signos que sustituyeran a los
del autor, que han sido, a su vez, cambiados por los correctos en el tratamiento nal del NTLE, antes de su envo a la imprenta. Tuvimos la suerte
de contar con una hispanista marroqu para el tecleado de esa obra, con
lo que las dudas e inconvenientes que podra haber tenido cualquiera de
nuestros colaboradores se solucionaron en el acto. Creo que ste es el mo-

26

Manuel Alvar Ezquerra

mento oportuno para decir que ha sido la nica ocasin en que durante
el proceso de tecleado hemos debido acudir, fuera de nuestro equipo, a un
especialista en lenguas que no fuesen la nuestra. Nuestros colaboradores,
afortunadamente, poseen unos conocimientos sobrados de otros idiomas
para las tareas realizadas, y solamente el amenco ha ofrecido alguna
resistencia, no demasiada, pues, para nuestra sorpresa, una de nuestras
colaboradoras se haba iniciado en el conocimiento de esa lengua, y varios miembros del equipo dominaban a la perfeccin el alemn. Por lo
dems, el latn, el griego, el francs, el ingls, el cataln, el gallego o el
portugus no han presentado especiales dicultades, y slo las pocas palabras en hebreo que hay en el Tesoro de Covarrubias (1611), y las escasas
del Minsheu (1617) o del manuscrito de Bartolom Valverde (1760?) nos
han llevado a consultas externas.
A la vez que se realizaba el proceso de codicacin, se avanzaba ya algn paso en la redaccin del NTLE, como fue el ir efectuando una incipiente lematizacin, para la que se reserv un campo especial: los sustantivos
y adjetivos iran en singular, estos ltimos bajo la forma masculina, con
la terminacin femenina si fuese el caso, las formas de los paradigmas
verbales se lematizaban en innitivo, etc. Como no es difcil de sospechar,
las unidades fraseolgicas han presentado no pocas dicultades. Se ha
procurado lematizarlas bajo la entrada que tena el autor, salvo en aquellas ocasiones en que aparecan bajo un elemento de relacin, en cuyo
caso se han llevado a la palabra que soportara la mayor carga semntica
de la expresin. Cuando hemos detectado que una construccin de este
tipo aparece bajo entradas diferentes, porque as lo hacan los autores,
hemos procurado poner unas referencias cruzadas, con el n de que no
se pierdan las informaciones. En general, hemos marcado los refranes y
frases proverbiales entre unas comillas de valor, no as las frases hechas y
las locuciones, mxime cuando el DRAE las registra como tales. Tampoco
llevan una seal especial las numerosas frases y ejemplos que guran en
algunos repertorios como meros modelos de uso. En este sentido, he de
decir que se han detectado algunos refranes y frases proverbiales que se
presentaban truncados, y que tambin se han marcado, para mantener
una cierta coherencia con los que no estn truncados en los mismos artculos del Tesoro.
De modo simultneo al tecleado, se iban incorporando unas referencias internas que nos ayudasen ms adelante en la agrupacin de variantes, o para que sirviesen de llamadas de atencin. Esas referencias
se han revisado en la correccin nal, para mantener nicamente como
remisiones internas aquellas que fuesen necesarias y eliminar las que

Problemas tericos y prcticos en la redaccin del NTLE

27

slo sirvieron para el desarrollo interno de nuestro trabajo, que no deban


trascender el mbito de la redaccin. Una vez nalizado todo el proceso
de correccin, en la Universidad Politcnica de Madrid nos han preparado
un nuevo programa que efecta una comprobacin de todas las remisiones que hemos dejado, para que remitan al artculo correspondiente, y
no a una variante que se haya lematizado bajo una entrada diferente o
tenga un error de cualquier tipo, realizando los cambios correspondientes. Adems, incorpora remisiones desde todas las variantes documentadas en cada autor, de modo que el usuario se encuentre siempre asistido
en sus bsquedas. Por otra parte, genera un informe indicando aquellos
artculos en cuyo interior hay ms de tres remisiones a un mismo lugar,
que hemos empleado en la revisin nal para prescindir de aquellas que
guraban en cinco o ms autores, sustituyndolas por una genrica al
nal del artculo. Esto mismo se ha hecho en aquellos artculos con menos remisiones pero que contaban con un nmero reducido de fuentes,
o que enviaban a lugares con pocas autoridades. Sin embargo, cuando se
remita desde un artculo con muchas fuentes, o a uno de esas mismas caractersticas, se han mantenido en cada autor, para no obligar al usuario
a una tediosa bsqueda.
Los diccionarios, poco a poco, iban siendo tecleados, pero eso no era
sino el comienzo de un proceso, que ya en sus inicios era pesado. Una vez
nalizada la codicacin electrnica de cada obra, los responsables del
proyecto procedamos a su lectura y correccin sobre papel, que devolvamos a los colaboradores para que efectuasen las modicaciones sealadas. Cuando se conclua este proceso, se archivaba una copia, y se proceda a una alfabetizacin del contenido, que sufra un nuevo tratamiento,
para unicar bajo una sola entrada toda la informacin del diccionario, y
para eliminar las repeticiones innecesarias, ms frecuentes en los repertorios de carcter temtico que en los estrictamente alfabticos. Despus,
se ponan las marcas de identicacin del texto y se guardaba una copia
de esta versin, que se converta a un formato TXT, tambin guardado por
separado, que era el empleado para ir cargando la base de datos.
Ya avanzada esta fase del proceso tuvimos un gran tropiezo imprevisto, que supusimos debido a nuestra propia inexperiencia: comprobamos
que las informaciones de la base de datos no eran las mismas que haba en la versin del tratamiento de textos, pues el contenido de algunos
campos estaba truncado. No sabamos a qu se deban las diferencias, y
lo achacamos a algn error cometido inadvertidamente, por lo que reiniciamos una nueva carga de datos. Hicimos los controles pertinentes, y
vimos que los errores detectados no se haban producido. Pero el alivio

28

Manuel Alvar Ezquerra

dur poco y son otra alarma. En el nuevo proceso de carga volva a suceder lo mismo, desaparecan los errores, pero se presentaban otros que no
haba antes. Ya no quedaba duda, el programa realizaba unos cortes aleatorios, probablemente debidos a la cantidad de informacin trasvasada.
Recurrimos entonces al Grupo de Estructura de Datos de la Universidad
de Las Palmas de Gran Canaria, que ya me haba ayudado en las tareas
informticas del Tesoro lxico de las hablas andaluzas, y nuestras sospechas fueron conrmadas. A partir de ese instante la colaboracin ha sido
intensa, y las herramientas de que hemos ido disponiendo son resultado
de su generosa asistencia, aunque en los ltimos meses hemos recurrido
a informticos de la UPM, como he dicho, por la comodidad de la proximidad, y la necesidad del contacto directo y continuo. Fueron aquellos
quienes nos propusieron la solucin adoptada, y la importacin de datos,
desde entonces, no se ha hecho directamente empleando los recursos de
Access, sino mediante un programa diseado ad hoc, que es el que lleva la
informacin desde el tratamiento de textos a la base de datos, con el n
de que no se pierda nada, y, para mayor seguridad, a continuacin realiza
una comparacin para comprobar que lo que ha llegado a la base de datos
sea igual a lo que se deseaba trasvasar. El proceso es extraordinariamente
rpido y, sobre todo, nos proporciona una seguridad en nuestros medios
que habamos comenzado a perder. Pasado el tiempo he constatado que
los errores no eran culpa nuestra, ni se deban a cdigos mal empleados,
pues otras personas que han llevado a cabo procesos similares en otras
empresas lexicogrcas se han tropezado con idnticos inconvenientes.
Tal vez se trate de un defecto en el diseo del programa, cuestin sobre la
que no he querido indagar ms, una vez que los problemas sobrevenidos
estaban ya resueltos.
En el momento en que consideramos que disponamos de una cantidad signicativa de obras en la base de datos, procedimos a generar un
informe para ir viendo los resultados parciales, y animarnos en nuestro
quehacer. As, a nales de 1999 (tras varios aos de intensos trabajos) elaboramos el primer borrador del NTLE, pasando todo el contenido de la
base de datos a un tratamiento de textos, Word de Microsoft. Los cientos
y cientos de pginas producidos nos caus asombro, pero tambin nos
mostraba que el camino que quedaba por recorrer an era largo.
Cuatro aos ms de esfuerzos nos llevaron a realizar un nuevo ensayo del resultado nal, y vimos, nuevamente, cmo se producan errores
en la carga de la base de datos, si bien esta vez ya no eran imputables a
fallos en los programas informticos, sino a nosotros mismos: se haban
producido durante el proceso de tecleado. Esta alerta se produjo cuando

Problemas tericos y prcticos en la redaccin del NTLE

29

las marcas para separar campos no coincidan con los de la base de datos.
Se trataba de un mero problema formal fcilmente subsanable. Pero, a
la vez, nos percatamos tambin de la presencia de otras faltas formales,
como equivocaciones en las secuencias de signos y otros errores de consistencia. Afortunadamente, se podan sistematizar, y, por tanto, corregir
de una forma automatizada. El grupo informtico de Las Palmas se dispuso a prepararnos un nuevo programa que comprobara si los separadores
de campos estaban bien puestos, y otro que comprobara si las marcas
sistemticas que habamos ido utilizando haban sido tecleadas correctamente. A partir de ese momento, comenzamos a buscar y detectar otros
errores formales que pudiesen ser corregidos de una manera automtica,
o con la asistencia de sistemas informticos, lo que nos llev a solicitar
nuevos programas. En realidad, es un solo programa que va realizando
mltiples tareas encadenadas, y en un orden estricto para que unas instrucciones no puedan afectar a los cambios realizados por otras. De este
modo, se increment el programa para detectar que siempre que se abra
un parntesis, un corchete, un signo de interrogacin o de exclamacin,
unas comillas, etc., estn cerrados en el mismo campo, que los diferentes campos terminen de la misma manera, en especial que al nalizar
el texto de cada artculo aparezca un punto, que no surjan espacios en
blanco delante de los signos de puntuacin, y que haya uno tras ellos (menos para el punto nal), que no aparezcan dos espacios en blanco consecutivos, que los puntos suspensivos sean tres, etc., etc. Son pequeos
detalles cuya correccin, en el conjunto del NTLE, hubiera requerido una
gran dedicacin de haberla realizado manualmente, y, lo que es peor, sin
la garanta del resultado nal. De este modo, hemos podido disponer de
un corrector formal que se ha ido perfeccionando continuamente, hasta
en doce versiones diferentes, algunas de las cuales suponan una marcha
atrs, pues, a veces, los requerimientos para una correccin concreta afectaban a otros lugares, producindose cambios en exceso, o se introducan
elementos que no deban aparecer. En denitiva, se trataba de ir anando
la herramienta y puliendo los errores en su diseo o en la apreciacin de
las tareas que se requeran.
La utilidad de este sistema es innegable, y desde los primeros instantes nos produjo una gran fascinacin por las ventajas que presentaba, no
slo porque nos exoneraba de una gran cantidad de trabajo, a la vez que
nos proporcionaba una considerable seguridad sobre el contenido formal
de los originales, lo que nos permiti en la posterior fase de correccin
manual centrar nuestra atencin en otros aspectos. Por otra parte, la rapidez del mecanismo resultaba asombrosa, pues la correccin de cual-

30

Manuel Alvar Ezquerra

quier diccionario no le ocupaba ms de un minuto, adems de generar un


informe con las correcciones realizadas para que nos cerciorsemos de
lo que haba hecho, al tiempo que sealaba lugares en que no se haban
realizado modicaciones aunque eran posibles, y marcaba otros que se
deban comprobar y corregir manualmente. Esta otra tarea, en cambio,
requera un tiempo considerable, innito en comparacin con la rapidez
de la comprobacin automtica.
La alegra que nos proporcionaba el funcionamiento de esa herramienta iba siempre acompaada de un poco de amargura, pues pese a los
esfuerzos realizados, al cuidado con que se efectuaba el trabajo, en cada
texto que se haca pasar por el programa se descubran numerosos errores e inconsistencias, que, cuando el repertorio era extenso, resultaban
ser varios cientos. Aquello que creamos bien hecho, sometido a varias correcciones por distintas personas, nunca alcanzaba la perfeccin deseada,
y nuestra euforia por ver cerca el nal del tratamiento de cada diccionario
se vea atemperada siempre que nos sometamos al juicio informtico,
inexorable. De todos modos, no podamos renunciar a tan valiosa ayuda
para que el contenido de las obras que iban pasando a la base de datos
fuese el deseado, y cumpliese, al menos, unos estrictos requisitos formales. Era la nica manera de ir avanzando con un pie rme sin necesidad de
mirar continuamente hacia atrs.
Los problemas formales, de organizacin y de informatizacin, como
los descritos hasta ahora, con ser importantes y afectar de manera directa
a la marcha del trabajo, evidentemente, no han sido los nicos con los que
nos hemos ido encontrando durante la elaboracin del NTLE, pues los ha
habido de otra ndole que tambin han incidido en la organizacin del
trabajo, el general y el cotidiano.
Una de las decisiones que se nos antojaba fcil era la de qu repertorios habran de formar parte del Tesoro. Por el carcter del proyecto, y
lo ambicioso de nuestro objetivo, que ha continuado sindolo hasta el nal, la respuesta era inmediata: todos los anteriores a la publicacin del
Diccionario de Autoridades (1726-1739), as de sencillo. Sin embargo, como
siempre sucede, esa simplicidad era solamente aparente. Resultaba necesario precisar, y elaborar una lista de obras para trabajar sobre ella. El
elenco de lo manejado por Gili Gaya (1960) para su Tesoro poda constituir
un buen punto de arranque, si bien pronto apreciamos los defectos que
encerraba aquella nmina que nos pareca extensa. Por un lado, algunas
obras estaban confundidas, otras no eran las primeras ediciones, de unas
pocas haba manejado varias ediciones, otras estaban en la relacin pero
no las encontrbamos citadas en el interior de los artculos... Haba ms.

Problemas tericos y prcticos en la redaccin del NTLE

31

No se recogan todos los diccionarios del periodo abarcado, y faltaban algunos anteriores, como pusieron de maniesto quienes se encargaron de
hacer reseas del Tesoro cuando fue publicado (por ejemplo, Alonso 1951,
Coln 1956 y Pottier 1962). Adems, aquella era una lista de diccionarios
en la que tambin guraban obras que no eran de carcter lexicogrco,
ni mucho menos, por ms que su inters para la historia de nuestro lxico resultaba incuestionable, por lo que su incorporacin, fuera de otras
consideraciones, estaba sobradamente justicada desde el punto de vista
lexicolgico.
Ante todo ello, se impona elaborar nuestra propia lista de obras, tarea
a la que nos dedicamos de inmediato, y que no hemos abandonado sino
en el ltimo instante, al concluir el proceso de redaccin, tal ha sido nuestro empeo por ser consecuentes con nuestras decisiones, y por proporcionar al usuario la mayor cantidad posible de materiales, siempre que
no se entorpeciera el manejo de la obra y que no se acumulasen informaciones de manera farragosa hasta ocultar las informaciones verdaderamente interesantes. ste es el motivo por el que no damos cuenta de
algunas nomenclaturas que, en la parte espaola, no hacen sino repetir
cabalmente lo que ya gura en los repertorios que toman como fuente,
con escassimos o nulos cambios, adems, en un lxico, que, por la naturaleza de las obras, es el ms cotidiano, por lo que aparece abundantemente
documentado en la lexicografa y en la historia de la lengua.
En otros lugares he descrito cmo se ha ido congurando el conjunto
de obras que ha terminado por ser el cuerpo del NTLE3. Si don Samuel haba dado cabida a textos no lexicogrcos, y, como he dicho, su presencia
en su Tesoro quedaba justicada, nosotros no slo mantuvimos aquella
decisin, sino que la extendimos, de modo que retomamos los mismos
textos y aadimos alguno ms. De este modo, si haba razones para recoger el lxico del Dioscrides de Andrs Laguna (1555)4, ya que incluye unas
tablas en varias lenguas de los nombres registrados en su interior (entre
ellas, por supuesto, de los espaoles), no tena sentido prescindir de los
trminos espaoles que puso Antonio de Nebrija (1518) en la edicin del
Dioscrides impresa en 1518 por Guilln Arnao de Brocar, partiendo de la
edicin de Ruelio, publicada poco antes en Pars. Y ello nos llev a incorporar tambin las voces espaolas que Amato Lusitano (1553) haba incluido
en su versin de la obra, aparecida slo dos aos antes que la de Laguna.
Los motivos que amparaban la inclusin de las palabras espaolas con3.

Vanse los trabajos que cito en la primera nota.

4.

Gili Gaya emple la edicin de 1570, y no la primera, de 1555, como hemos hecho nosotros.

32

Manuel Alvar Ezquerra

tenidas en esas obras son los mismos que autorizan la de las que hay en
la obra de Conrad Gesner (1551-1587) (cfr. Alvar Ezquerra, 2002-2004), o en
la Historia de las yeruas y plantas de Juan Jarava (1557)5, o en el anterior
Modus faciendi cum ordine medicandi de fray Bernardino de Laredo (1527)
la primera farmacopea escrita en espaol, que tambin tienen ndices
de las palabras espaolas registradas en su interior. Y desde ellas llegamos al Tesoro de medicinas para todas enfermedades de Gregorio Lpez
(1672)6. De esta manera, en el interior de nuestro NTLE se halla un tesoro
lxico de la medicina de la poca, que, sin duda, presenta un notable inters y puede ser de gran utilidad a quienes se interesan por esa parcela del
lxico. Como nos ha sucedido con otros grupos de obras, han sido ms las
consultadas, pero no han pasado a engrosar las pginas del NTLE por no
ser de carcter lexicogrco y no presentar un ndice de voces que avalase
su incorporacin, pese a que el vocabulario contenido en ellas sea de inters, como por ejemplo, el Tractado de las drogas y medicinas de las Indias
Orientales de Cristbal Acosta (1578) (cfr. Alvar Ezquerra 2006b).
Ciertamente, ese grupo de obras constituye un conjunto homogneo
de fuentes para un mbito de lxico especco, pero no es el nico que
hay en nuestro NTLE, aunque s el ms rico. No carece de importancia el
dedicado a la terminologa marinera, tanto es as que Lidio Nieto (2002)
dio un avance de esa parte en su Tesoro lexicogrco del espaol marinero anterior a 1726, aunque despus se ha aadido alguna obra ms. En
otros mbitos, como el del derecho, las bellas artes o las ciencias exactas,
la riqueza no es tan grande, y no por falta de empeo por nuestra parte.
Los repertorios de lxico tcnico se desarrollan despus del periodo abarcado en el NTLE, y son muy pocos los elencos de que hemos podido disponer. Es lo mismo que sucede con las listas de palabras de uso regional,
pues antes de 1726 solamente aparece la de Gernimo de Blancas (1641)7,
mientras que s hay algn elenco de voces anticuadas, as como de carcter etimolgico segn se entenda la etimologa en la poca, aunque
una buena porcin de ellos slo se han conservado manuscritos, pese a
su trascendencia, como sucedi con el repertorio de voces de origen ra-

5.

Disponemos de una edicin moderna de M Jess Mancho Duque (2005), con varios estudios preliminares
donde se desentraan los problemas relativos a la obra y su contenido.

6.

De 1672, aunque redactado a nales del siglo anterior. El manuscrito holgrafo ha sido editado por Francisco Guerra (1982).

7.

Son las voces aragonesas que se encuentran en el ndice donde se declaran algunos vocablos aragoneses
antiguos [...], que puso en las Coronaciones de los serenssimos reyes de Aragn, publicadas en 1641, si bien
fueron escritas en 1583.

Problemas tericos y prcticos en la redaccin del NTLE

33

be del P. Guadix (1593)8 o las etimologas de Bartolom Valverde (1760?)9 o


Francisco del Rosal (1601)10, por no sealar nada ms que un par de ellos.
Por supuesto, en el NTLE estn recogidos los diccionarios monolinges
anteriores al Diccionario de Autoridades (1726-1739), no solamente los especcos, sino los ms extensos, as como los bilinges y plurilinges que
contienen el espaol, sean alfabticos, sean temticos. La cantidad de
obras recogidas es un centenar y medio, aunque son ms las consultadas.
De ello se da cuenta en las pginas preliminares del NTLE.
La lista de obras que iban a congurar el contenido del NTLE qued esbozada en un primer momento, pero no cerrada. Las consultas de fondos
bibliogrcos, de repertorios de toda ndole, de catlogos de la imprenta
en Espaa y en otros pases, de variados trabajos cientcos, no solamente de lexicologa y lexicografa, sino tambin de historiografa lingstica,
de historia de la ciencia, etc., etc., as como las investigaciones que desarrollan nuestros colaboradores para sus tesis doctorales y otros trabajos
de investigacin, nos han hecho descubrir de forma continua obras cuyo
examen era necesario para decidir si su contenido deba verterse en el
Tesoro o no, con lo que han quedado por el camino muchos esfuerzos, y
algn que otro libro. De unos ni siquiera se mantiene un rastro en el NTLE,
de otros se da una somera explicacin de los motivos por los que no se
han tenido en consideracin. De todos modos, alguna que otra obra de
las que no han pasado al interior del NTLE ha sido objeto de estudio por
parte de los miembros del equipo, por lo que, con los trabajos que ya se
van derivando de nuestra empresa, no se ha perdido del todo el lxico de
esas otras obras no incorporadas, y nuestros esfuerzos han dado frutos,
aunque no en el interior del NTLE; es lo ocurrido, por ejemplo, con la breve
lista de palabras que aparece en The Key of the Spanish Tongve de Lewis
Owen (1605)11, que es solamente ingls-espaol, con la Janua linguarum
(1611) de Salamanca (cfr. Alvar Ezquerra 1992), latn-espaol, o con el vocabulario francs-espaol que aparece en la gramtica de Monsieur de
Maunory (1701). Este continuo desvelo por las fuentes ha hecho que la nmina de obras no se haya cerrado hasta el ltimo instante, cuando la correccin nal de los datos se hallaba muy avanzada, con la incorporacin
8.

Recopilacin de algunos nombres arbigos [...], ms. 59-I-24 de la Biblioteca Colombina (Sevilla), manejado
por los lexicgrafos posteriores.

9.

De la obra se conservan, al menos, dos copias ms manuscritas.

10. Origen y etimologa de todos los vocablos originales de la lengua castellana, ms. 6929-T.127 de la Biblioteca
Nacional, Madrid. Tambin hay ms copias de l. Hay una edicin moderna con estudio de Enrique Gmez
Aguado (1992) y reproduccin del manuscrito citado.
11. Sobre ella, vase Nieto Jimnez / Alvar Ezquerra (2002).

34

Manuel Alvar Ezquerra

de un pequeo repertorio multilinge de la primera mitad del siglo XVI,


el Quinque linguarum (1534), cuya copia tard en llegar, por lo que habamos introducido una edicin posterior, en seis lenguas, de 1541, con escasas diferencias en la parte espaola (Vocabulario de seis linguaies 1541)12.
Con la lista de obras esbozada comenz una nueva complicacin, la
de conseguir reproducciones sobre las que trabajar. En unos casos, no
muchos, haba reproducciones facsimilares sobre las que podramos trabajar, o ediciones modernas, por ms que su grado de abilidad no fuese muy elevado, como nos ha sucedido con la citada de Francisco Guerra
(1982) del Tesoro de medicinas para todas enfermedades de Gregorio Lpez
(1672). Pero no siempre hemos empleado las ediciones modernas, pues
unas veces hemos acudido a los originales, como en el Tesoro de Covarrubias (1611), ya que tenamos a mano un ejemplar de la primera edicin, si
bien hemos consultado la edicin de Martn de Riquer en caso de duda;
diferente ha sido el caso de los Diez previlegios para mugeres preadas de
Juan Alonso y de los Ruyzes de Fontecha (1606), pues, una vez realizado
nuestro tecleado, ha aparecido una edicin moderna (Zaba Lasala 1999),
que nos ha servido de gua en el proceso de correccin posterior.
Por otra parte, tenamos fotocopias de otras obras, tampoco muchas,
que conservbamos de trabajos nuestros anteriores, o que habamos ido
acumulando por diversos motivos. Con stas, y las ediciones de que acabo
de hablar, era suciente para iniciar el tecleado de los contenidos, aunque
fuese de una manera desordenada, pues siempre que nos ha sido factible,
hemos avanzado de manera cronolgica, entre otras razones, para que
aquellas obras que fueron utilizadas como fuente por otras posteriores
nos sirviesen de gua o facilitasen el trabajo.
Del resto del elenco comenzamos a buscar ejemplares en las bibliotecas pblicas. Primero acudamos a las madrileas, por ser las ms cercanas
y ricas en fondos. Si no encontrbamos en ellas la obra en cuestin, rastrebamos su presencia en otras bibliotecas espaolas, y, en caso negativo, nuestras pesquisas se dirigan al extranjero. Incluso en alguna ocasin
hemos entrado en bibliotecas particulares, espaolas y extranjeras, tal ha
sido la intensidad de la bsqueda, para la que nos han ayudado grandemente los repertorios bibliogrcos que han ido apareciendo durante los
ltimos aos, y los cheros on-line de las principales bibliotecas, aunque
no siempre ha sido sa la manera de llegar hasta el ejemplar deseado.
12. Es preciso advertir que tanto la versin en cinco lenguas como la de seis coinciden en su primera parte
con el Quinque linguarum (1526), aunque no en la segunda, que presenta diferencias, por lo que la hemos
trasladado al NTLE, donde el lector podr comprobar los cambios.

Problemas tericos y prcticos en la redaccin del NTLE

35

Con la localizacin de ejemplares tampoco se terminaba el proceso de


bsqueda, salvo, evidentemente, de los manuscritos. Era preciso conocer
el estado de los libros para que no faltasen pginas y para que el texto
no estuviese mutilado. Por ello, no han sido pocas las veces en que, tras
comprobar la reproduccin que nos llegaba, y cerciorarnos del estado del
original, hemos tenido que reiniciar el proceso de bsqueda. En otras ocasiones, las reproducciones estaban mal hechas, con los mrgenes cortados, hojas sin reproducir, texto desenfocado o con tantas manchas que
resultaba ilegible, y con cuantas complicaciones que ni nosotros mismos
ramos capaces de imaginar. Entonces tenamos que volver a la biblioteca
para reclamar, con el malestar de todos, como es fcil de suponer. Aunque
estos problemas causaban trastornos, especialmente porque debamos
adaptar el ritmo de las tareas a las circunstancias, era tal la cantidad de
obras que tenamos entre manos, y la cantidad de correcciones y ltros
que se efectuaban, que nunca se constituyeron en un gran inconveniente
para el progreso de los quehaceres.
Pese a que los servicios de informacin y de reproduccin de las bibliotecas funcionan razonablemente bien, la obtencin de fotocopias ha llegado a constituir un verdadero conjunto de adversidades. En este sentido,
nunca se nos olvidarn las acaecidas con el Diccionario espaol-francs de
fr. Pierre Seguin, que a punto estuvieron de hacernos abandonar y de provocar que su contenido no gurase en el NTLE, pero nuestro tesn estaba
hecho a toda prueba, por difciles que se planteasen las contrariedades.
Se trata de un manuscrito de la Biblioteca Nacional de Francia, empleado
por Gili Gaya en su Tesoro. Solicitamos su reproduccin tanto directamente como con la ayuda de nuestra Biblioteca Nacional, y fueron nuestros
colaboradores a Pars en varias ocasiones, sin que lo consiguiramos; por
n, y tras una reclamacin a la direccin de la biblioteca al cabo de los
aos, pudimos saber que haba cambiado la signatura de la obra, con lo
que volvimos a iniciar el proceso, pero la reproduccin que nos enviaron
no tena nada que ver con nuestro manuscrito. Vuelta a las quejas, y admitieron haber cometido un error en la signatura que nos comunicaron. Para
poder seguir adelante tuvimos que devolver las fotocopias recibidas, pero
las nuevas no llegaban, pese a las promesas, as que aprovech un viaje a
Pars para averiguar lo sucedido; me dijeron que el envo se haba efectuado unos das antes, pero en Madrid no reciba nada. Nuevas quejas, y cada
vez ms serias, hasta conseguir las dichosas fotocopias. Haban transcurrido unos cuantos aos desde la primera solicitud. En honor a la verdad,
y en defensa de las bibliotecas y de sus trabajadores, he de decir que sta
no ha sido la tnica general, aunque nunca nos han llegado las copias con

36

Manuel Alvar Ezquerra

la rapidez deseada, con algunas excepciones, como la de la Real Academia


Espaola. Si el funcionamiento de las bibliotecas no hubiese sido el adecuado, nuestro trabajo no hubiera podido llevarse a cabo, o lo hubiramos
hecho de manera ms lenta y penosa, y no hubiramos podido contar con
reproducciones de ejemplares conservados en bibliotecas tanto espaolas
como extranjeras. Las bibliotecas espaolas han sido fundamentalmente
madrileas (principalmente la Biblioteca Nacional, la de la Real Academia
Espaola y la Biblioteca Histrica Marqus de Valdecilla de la Universidad Complutense de Madrid, pero tambin la Biblioteca de Palacio, la de
la Real Academia de la Historia, Biblioteca General de Humanidades del
CSIC, Biblioteca del Instituto de Filologa del CSIC, Biblioteca Histrica Municipal, la del Museo Naval, la de la Fundacin Universitaria Espaola, la
del Monasterio de El Escorial), aunque tambin de otros lugares de nuestra
geografa (Biblioteca Universitaria de Salamanca, Biblioteca Universitaria
de Granada, Biblioteca de la Universidad de Barcelona, Biblioteca Pblica
de Mlaga, Biblioteca Colombina de Sevilla, Biblioteca Valenciana de Valencia). Una buena parte de las bibliotecas extranjeras han sido de Francia
(Bibliothque Nationale de France, Bibliothque de lArsenal, Bibliothque
Mazarine, Bibliothque Sainte Genevive, en Pars, as como la Bibliothque
Municipale de Rouen y la Bibliothque Municipale de Montauban), pero
tambin hemos acudido a las de Alemania (Bayerische Staatsbibliothek
de Munich, Herzog August Bibliothek de Wlfenbttel, Stadtbibliothek de
Nrnberg, Universitts Bibliothek de Augsburgo), de Blgica (Universidad
de Amberes, Rijks Universiteit de Gante), de Italia (Biblioteca Nazionale
Centrale de Roma, Biblioteca Nazionale Marciana de Venecia), de Portugal
(Biblioteca Nacional de Lisboa), de Gran Bretaa (British Library), de Austria (sterreichische Nationalbibliothek de Viena), de Argentina (Biblioteca Nacional de Buenos Aires), y de Estados Unidos (The Hispanic Society
of America), as como alguna ms particular en Espaa y en Francia. Adems, a muchas de las bibliotecas reseadas, tanto espaolas como extranjeras (en Europa y en Estados Unidos) hemos acudido personalmente para
comprobar los ejemplares, o para cotejar nuestras lecturas.
En todos los casos, hemos utilizado reproducciones de las primeras
ediciones de las obras, dejando de lado otras ediciones, cuando las hubo,
ya que en una buena parte de ellas los cambios introducidos no eran
muchos, y, de todas maneras, no se trataba de realizar ediciones crticas
para saber la evolucin de la obra, por ms que el NTLE sea la base fundamental para realizarlas. nicamente se ha hecho una excepcin con el
diccionario nebrisense, por su importancia para la lexicografa posterior,
en que, adems de la primera edicin, hemos incorporado las variantes

Problemas tericos y prcticos en la redaccin del NTLE

37

(slo las variantes) de la edicin de 1520, ltima hecha en vida del autor
y corregida por l, que coincide, sustancialmente, con la de 1516, tambin
corregida por Nebrija13.
Aunque se ha introducido todo el contenido de los repertorios seleccionados, como se dijo antes, en ocasiones se ha suprimido texto (especialmente en las obras no lexicogrcas), cuando resultaba irrelevante
para el conocimiento de la palabra. Como el NTLE es un repertorio lxico,
no han pasado a l los numerosos nombres propios que aparecen en las
fuentes, sean geogrcos, de personas, de seres mitolgicos, de animales
fantsticos, de constelaciones y cuerpos celestes, etc., salvo, evidentemente, cuando estn lexicalizados, o cuando constituyen parte de una expresin pluriverbal jada.
Por lo que se reere a los diccionarios bilinges y plurilinges, nicamente hemos tenido en consideracin la parte espaol-otra lengua, no
la parte en la que nuestra lengua es a la que se vierten las palabras. No
se nos oculta que en esa otra parte de los diccionarios hay lxico de enorme inters para la historia de nuestra lengua, pero no es menos cierto
que la informacin, en bastantes ocasiones, hubiese sido muy repetitiva,
alargando en exceso el NTLE, y, adems, nuestros recursos tanto humanos como econmicos resultaban limitados para acometer esa tarea, que
queda para fases posteriores del proyecto, si es que retomamos energas
para continuarlo. De todos modos, son muchas las excepciones que se
han hecho a este principio, ya que hemos llevado al NTLE las voces espaolas de todos los repertorios anteriores a 1500, independientemente de
su posicin en la obra (como entrada o como lengua meta). Igualmente
se ha hecho excepcin de algunos repertorios posteriores, entre ellos todos los de Nebrija, que no slo son sus dos diccionarios grandes los ms
conocidos, por otra parte, y los diccionarios que iniciaban la lexicografa
bilinge del espaol con otra lengua. El lugar que ocupa el espaol no se
ha planteado para las nomenclaturas, ya que en ellas lo importante no es
la posicin de la lengua, sino el modo de ordenar las informaciones, que,
al pasar al NTLE, se muestran segn el orden alfabtico.
En el momento en que se tuvieron seleccionadas todas las obras, y
se hubieron tecleado, se comenz el proceso de lematizacin denitiva,
esbozado cuando se pasaban los textos a formato electrnico. La diferencia es que entonces se realizaba aisladamente para cada una de las obras
manejadas, mientras que ahora se proceda de una manera conjunta, y
13. De esta ltima hay una edicin debida a Gerald J. Macdonald (1981). El contenido lxico de esta salida ha
sido analizado por Mara Lourdes Garca Macho (1993, 1995 y 2005).

38

Manuel Alvar Ezquerra

denitiva. El problema con que nos hemos encontrado en esta fase ha


sido el de las numerosas variantes grcas que constan en los repertorios.
Para facilitar la consulta del NTLE, las hemos agrupado todas bajo una
sola entrada, remitiendo a ella desde el lugar alfabtico que les corresponda a cada una de ellas. Es cierto que son numerosos los reenvos, pero
no lo es menos que de otra manera hubiramos tenido una inmanejable
red de referencias cruzadas que habran dicultado la consulta de la obra,
y habran enfadado no poco al usuario. Como hizo Gili Gaya, podramos
haber dejado cada forma en el lugar que le hubiese correspondido por el
orden del abecedario, pero as la informacin hubiese aparecido desperdigada en mil lugares de la obra, inconexos entre s, tanto ms cuanto ms
distantes eran las formas. Pero no nos pareci una forma adecuada de
ofrecer los materiales.
La solucin adoptada permite ver la historia lexicogrca de la palabra, adems de presentar agrupadas las variantes tras la forma de la
entrada. Para esta tarea se ha desarrollado otro programa informtico en
la Universidad Politcnica de Madrid que, adems, resalta la forma coincidente con el lema lo que permite, con un simple vistazo, saber si gura
en las fuentes utilizadas, o pone un asterisco tras l cuando no coincide
con ninguna de las variantes registradas, lo cual puede ser de inters para
los estudiosos que acudan a consultar el NTLE.
Gracias al sistema informtico empleado, la informacin contenida
en los diversos textos ha aparecido ordenada de manera cronolgica, para
lo cual cada obra va acompaada de una clave con la que se ordena. Si dos
o ms obras pertenecen a la misma fecha, esa clave, que no gura en la
versin impresa, va acompaada de un dgito diferenciador. De esta manera, se ofrecen los datos en una secuencia histrica que vale para conocer no slo la evolucin formal de la palabra en cuestin, o su tratamiento
lexicogrco, sino tambin para ver la liacin y deudas de unas obras
con otras.
Cuando se hubo procedido a la lematizacin del conjunto de las informaciones, que en total han sobrepasado largamente los 600000 registros
en la base de datos, se procedi a una impresin en papel, con un formato
similar al que tiene la versin impresa, sobre la que se ha efectuado un
doble proceso de correccin, para asegurarnos de la calidad del contenido, lo cual, por otro lado, es obvio. Esta tarea ha llevado ms tiempo del
previsto, por los errores detectados, lo que nos ha obligado a una tercera
lectura, cuando creamos que ya estaba el trabajo culminado. Sin dudas,
los yerros e inconsistencias sern menores de este modo, aunque quedarn todava, pues ninguna obra humana es perfecta.

Problemas tericos y prcticos en la redaccin del NTLE

39

Con todos los datos unicados, nos ha sido posible corregir errores
que haban pasado desapercibidos al tratar las obras aisladamente, o que
no habamos podido solucionar a falta de mayor informacin. Ha sido
tambin ste el momento en que hemos podido solventar muchas de las
dudas que haban quedado durante el proceso de tecleado. Pero tambin
nos ha obligado a unicar la puntuacin en aquellos lugares en que lo
contenido es similar, y que, al ser tratado independientemente, se haba
codicado segn el criterio de cada colaborador.
Sabamos de la dependencia de unas obras de otras, que, ahora, queda
bien patente, pero tambin, al reunir todos los datos, hemos podido comprobar nuevas liaciones y deudas. Queda, a partir de estos momentos,
una enorme labor de estudio, pues antes no se haban entrevisto muchas
de las concomitancias que se muestran con nitidez al presentar todos los
diccionarios agrupados y ordenados, como se puede apreciar en la larga lexicografa con el ingls (cfr. Nieto Jimnez / Alvar Ezquerra 2006). En
otras ocasiones se aprecia cmo se han repetido armaciones que no tenan consistencia, o que deben ser precisadas, como la deuda de Stevens
respecto a Minsheu (cfr. Alvar Ezquerra / Nieto Jimnez 2003), o la de Pedro de Alcal con respecto a Nebrija (cfr. Alvar Ezquerra, 2006c). Disponer
de un modo conjunto de todas las informaciones nos proporciona un excelente panorama de la historia de nuestro lxico y de la representacin
de cada una de las palabras a travs de los diccionarios, pero adems se
convierte en un instrumento de primera magnitud para ver la liacin
y la interdependencia de los diccionarios, y eso que nicamente hemos
recogido las primeras ediciones de las obras, excepcin hecha, como he
comentado, de Nebrija, aunque en una sola de sus obras. Es ms, las posibilidades que nos brinda una base de datos nos permite comparaciones
entre obras, entre series de obras, entre repertorios de una misma poca,
o la bsqueda de soluciones para una voz de otra lengua en diversos elencos, e, incluso, rastrear la actividad de un lexicgrafo cuando es autor de
varios repertorios, etc. (Alvar Ezquerra 2006a: 55).
Ha sido ciertamente revelador comprobar cmo los errores y erratas
se transmitan de un elenco a otro. En este sentido, el NTLE se convierte
en un excelente instrumento para averiguar las fuentes empleadas por
determinados autores, o para seguir la presencia de un lexicgrafo en los
diccionarios posteriores, o para conocer qu edicin de una obra pudieron manejar sus seguidores. En este sentido, cabe hablar de la delidad
de los diccionarios ingleses con respecto a los anteriores, pese a las innovaciones que hay en todos ellos. En ocasiones, nuestro trabajo nos ha
llevado a consultar no slo varias ediciones de un mismo repertorio, sino

40

Manuel Alvar Ezquerra

hasta diversos ejemplares de una misma edicin, lo que nos ha permitido


descubrir emisiones distintas, como las que detect para la Bibliotheca
hispanica de Richard Percivale (cfr. Alvar Ezquerra 2002: 175-176).
El trabajo est nalizado. Han sido muchos aos de dedicacin y de
renuncias. Me gusta recordar las palabras del humanista Juan Lorenzo
Palmireno en la nota Al lector que hay despus del octavo abecedario
del Vocabvlario del hvmanista:
Mi propito fue poner nueue abecedarios, tratando en el vltimo

las antiguallas que al principio


prometo: pero quien tiene familia que utentar en aos tan caros, y in Mecenate, que ayude al papel, por fuera ha de boluer a tras; contemplando que pone us ojos, alud, fama, y dinero a votos
del vulgo: el qual con u acotumbrada ingratitud dize, que vendo muy caro ete librico: en el qual,
allende de los pecadores y caadores que he etrenado, y combidado, para ver cmo quadraba lo
que yo acaua de los libros con lo que ellos experimentan. En lo Hipplito Saluiano, y los otros
autores que de peces ecriuen gat veynte y cinco ducados: y por no dexar agrauiado al lector de
lo que aqu eperaua, hata que yo tenga dinero, para acar a parte lo que le he prometido, lea entre
tanto lo que e igue (Lorenzo Palmireno 1569: II, 114).

Con otras apariencias, bajo otras formas, en otros tiempos, las dicultades y los problemas continan siendo los mismos. Dicho con la desesperacin y el estoicismo del autor del Eclesiasts (1, 9), y como advertencia,
y alivio, para quienes en el futuro intenten abrirse paso en este mundo:
nihil novum sub Sole.
Esperamos que los esfuerzos no sean baldos y sirvan para el mejor
conocimiento de nuestro lxico, de nuestros diccionarios y de nuestra
lengua. Indocti discant, et ament meminisse periti (que los que no saben
aprendan, y los instruidos gocen al recordar), que cuentan decan los
edictos romanos.

41
1

OS DICIONRIOS COMO FONTE LEXICOGRFICA


Dieter Messner

Paris-Lodron-Universitt Salzburg

Rafael Bluteau publicou a partir de 1712 o Vocabulrio Portuguez e


Latino que, em grande parte, j foi redigido antes de 1700; nele h duas
entradas: uma Santiago, e a outra Compostela:

1.

Bluteau (1712-1728)

Covarrubias (1611)

Compostella, ou San-Thiago de Galiza.


Cidade, & Arcebispado de Galia em
Hespanha.
Covarrubias, curioso investigador de
Etymologias, confessa, que lhe no foy
possvel achar a deste nome; & sospeita, que Compostella se disse de alguma
estrella, que assinalasse o lugar, donde
estava o corpo do Santo Apostolo. []
V. San-Tiago.

Compostella [] La etimologia de
Compostela no la s con certidumbre;
pudo haberse dicho de alguna estrella o
cometa, que sealase el lugar donde estaba el cuerpo santo del Apstol.

Santiago. Cidade de Hespanha, no Reyno de Galliza. Tem Arcebispo, & Universidade.


He celebre pelo grande concurso dos peregrinos, que vo visitar na Igreja Metropolitana o corpo do Apostolo Santiago.
Chama-se por outro nome Compostella,
que segundo alguns he o Brigantium de
Antonino, Dion, & Osrio []. V. Compostella.

Santiago. Ciudad populosa y memorada


en toda la cristiandad, pues de todas partes della vienen en peregrinacin a visitar
el cuerpo del apstol Santiago [].

No ano 1986, com motivo dum colquio de lexicograa (cfr. Ramn Lorenzo 1988), reunira-se na cidade de
Santiago de Compostela um grupo de importantes lexicgrafos das lnguas romnicas. Alguns, infelizmente, j desapareceram. Para que a memria deles continue, reproduzo uma foto em anexo.

42

Dieter Messner

Bluteau menciona expressis verbis a fonte, o lexicgrafo espanhol Sebastin de Covarrubias Horozco, o autor do Tesoro de la lengua castellana o
espaola, deixando ver um comportamento que muitos lexicgrafos antigos e modernos no mostram to frequentemente, ocultando as fontes.
Se compararmos as citaes sacadas dos dois dicionrios, podemos constatar uma semelhana bastante alta. provvel que Bluteau no s tenha
copiado a etimologia proposta pelo Covarrubias ele o confessa, mas sim
tambm outros troos da microestrutura do modelo espanhol, que sublinhei
no texto. E com este exemplo j estamos no centro da minha contribuio.
Fui convidado para tratar dos dicionrios como fonte lexicogrca, e
concentrar-me em dicionrios portugueses, por isso no me vou ocupar
de dicionrios espanhis, os quais, ao contrrio do que aconteceu com os
portugueses, j foram analisados sob este ponto de vista. De cada dicionrio espanhol com certa importncia j se conhece a genealogia, por exemplo do Universal Vocabulario de Alfonso de Palencia (1490) dizem uma
fonte foi o Elementarium Doctrinae rudimentum de Papias, do Tesoro de
Covarrubias (1611) uma fonte foi o Calepino, etc., etc. (cfr. Azorn Fernndez 2000). No conheo o nmero exacto de estudos, so muitssimos, que
se zeram sobre os dicionrios que copiavam as vrias edies do Diccionario de la lengua espaola (DRAE). E no s os lexicgrafos espanhis
copiaram o DRAE, mas sim tambm os autores de dicionrios galegos,
como mostrou Santamarina, que chamou a ateno sobre a forma como
Sobreira copiou o DRAE de 1780: se se cotexan as papeletas de Sobreira co
diccionario da RAE 1780 o asunto resulta case escandaloso (Santamarina
2003b: 54). E para a lngua catal consta: El diccionari de lAcademia espaola ser guia universal dels de la nostra llengua (Rico / Sol 1995: 127).
A minha presena aqui justica-se por ser responsvel de um projecto
de grande envergadura que se chama Dicionrio dos dicionrios portugueses. Publiquei j 20 volumes, com um total de 12.000 pginas (Messner
1994- ).
Para o espanhol existe uma obra semelhante, o Tesoro lexicogrco
1492-1726, de Samuel Gili Gaya (1947-1957); infelizmente cou inacabado.
Mas teremos dentro de pouco um Nuevo Tesoro, o NTLE, redigido por Manuel Alvar e Lidio Nieto.
Com a ajuda da obra de Gili Gaya foi possvel esclarecer a histria de
palavras espanholas, e a genealogia dos dicionrios. S quero mencionar
o exemplo da palavra aferes que Nebrija atribuu o signicado nugae,
quer dizer coisas sem importncia, um signicado errado que se conservou em todos os dicionrios seguintes, durante mais de dois sculos, at
ao ano de 1726. S o Diccionario de Autoridades corrige este signicado.

43

Os dicionrios como fonte lexicogrca

Descobrir a genealogia de palavras pode fazer-se agora tambm para


a lngua galega com o Diccionario de diccionarios, um CD-Rom editado
por Antn Santamarina (2003b). E tambm j est pronto o Tresor lexicogrc valenci (Guardiola Savall 2006).
O Dicionrio dos dicionrios portugueses rene uns 40 dicionrios e
obras de interesse lexicogrco, publicados entre 1554 e 1858. Comecei,
claro, com muitos mais dicionrios; mas muitos so cpias de dicionrios
anteriores, por isso, tirei-os da minha lista actual (cfr. http://www.sbg.
ac.at/rom/people/prof/messner/dddport.htm).
As entradas portuguesas do dicionrio portugus-latim de Bento
Pereira (1697) foram copiadas, pela maior parte, por um lexicgrafo desconhecido em 1701, para o primeiro dicionrio bilingue portugus-ingls
(A. J. 1701), e por Alewyn em 1714, para o primeiro dicionrio portugusamengo (Alewyn / Coll 1714).
Pereira (1697)

A.J. (1701)

Alewyn / Coll (1714)

abano, ou avano. Flabellum, i.

abano: A fan.

abano, or, avano. Een


waajer.

abano de enxotar moscas. Muscarium, i.

abano de enxotar moscas: A flie flap.

abano de enxotar moscas. Eeen waajer, on vliegen te verjaagen.

abanos. Collaria, ium.

abanos: Collars.

abanos:
kraagen.

abanos da camisa. Patagiata, ae...

abanos de camisa: The


gathering of the neck...

abanos de camisa.
Hemds banden...

halsbanden,

Bluteau (1712-1728) foi a fonte de Folqman (1755), de Marqus (17581764), autor do primeiro dicionrio portugus-francs, e de Transtagano
(1773), autor do segundo dicionrio portugus-ingls.

44

Dieter Messner

Transtagano (1773)

Bluteau (1712-1728)

Folqman (1755)

Marques (1758-1764)

abanar. Agitar, &


causar vento [...] ventilare...

abanar (causar vento),


ventilare...

abanar (causar vento),


ventilare....

abanar, v. a. to fan.

abanar o fogo: ignem


flabello excitare...

abanar o fogo, ignem


ventilare...

abanar o fogo, ignem


ventilare...

abanar o lume, ou
o fogo, to kindle the
fire...

abanar hum arvore:


arborem quatere...

abanar hum arvore,


arborem quatere...

abanar huma arvore,


arborem quatere...

abanar as arvores, to
shake the trees...

abanar moscas. Vid.


enxotar.

abanar as moscas,
muscas abigere.

abanar as moscas,
muscas abigere.

abanar as moscas, to
drive the flies away...

abanarse. Auram flabello colligere.

abanar-se, aurem flabello colligere...

abanar-se, auram flabello colligere...

abanar-se, to coll
ones self with a fan.

abanar as orelhas:
[...] Surdum simulare.

abanar as orelhas
[...], surdum simulare.

abanar as orelhas
[...], surdum simulare.

abanar as orelhas, to
give a negative answer.

Entre os muitos dicionrios portugueses que consultei antes de comear o meu projecto existe mesmo um dedicado s cincias naturais,
que descreve, entre outros, tambm os animais. provvel que o autor
no tenha tomado obras cientcas como base, mas, sim, o dicionrio de
Bluteau.
o Diccionario Portuguez das plantas, arbustos, matas, arvores, animaes quadrpedes, e reptis, aves, peixes, mariscos, insectos, gomas, metaes,
terras, mineraes, &. [] escrito por Jos Monteiro de Carvalho (Carvalho
1765).

45

Os dicionrios como fonte lexicogrca

Bluteau (1712-1728)

Carvalho (1765)

Abada, abada [...]. Fera de Africa nas terras de Benguela [], a Abada he hum
animal do tamanho de um potro de
dous annos, com a cabea mais pequena, & mais chata, que a do cavallo; tem
o pelo denso, & spero, rabo de boy, mas
mais curto, & ps fendidos, muito mais
grossos, que os de veado; tem este animal dous cornos, hum na testa do comprimento de trs, ou quatro palmos, &
este negro, ou pardo escuro, lizo, agudo
na ponta [...]. Tem a Abada outro corno
na nuca, mais curto [...], esta ponta da
abada tem fama de contra veneno [...]. O
P. Gaspar Schot [...], & outros authores
vulgares, como Covarrubias [...] se tem
equivocado [...].

Abada. Animal quadrpede, e feroz, que


se cria nas terras de Africa: tem a grandeza de hum potro de dous annos, o pello
denso, e spero, rabo de Boi, porm curto, os ps fendidos, e grossos, com duas
pontas: huma na testa de quatro palmos
de comprido, negra, liza, e aguda; outra
na nuca de menor grandeza: qualquer
dellas he singular antdoto para todo o
gnero de veneno.

Uma breve anotao entre parntese: Bluteau uma das raras excepes pouca presena portuguesa na dicionarstica espanhola.
No primeiro dicionrio da Academia espanhola, publicado entre 1726
e 1739, o que chamamos hoje Diccionario de Autoridades, encontramos
tambm Rafael Bluteau. Nos volumes publicados a partir de 1734 achamos citaes do dicionrio de Bluteau (Gmez-Pablos 2004):
Galardon: El premio, recompensa retribucion de los mritos, servicios y beneficios. Bluteau en
su Diccionario Portugus siente que esta voz se deriva del Francs Guerdn, que antiguamente se
deca Guerredon, esto es don o premio de guerra [segundo Corominas: origen germnico].
Roque: Pieza grande en el juego del Axedrez, que se coloca en la esquinas del tablero. Camina por
lnea recta, y puede andar de una vez todas sus casas, si las halla desembarazadas de otras piezas.
Covarr. dice que significa la fortaleza que se suele hacer al frente de los enemigos: y assi algunos le
dan la etymologia de Roca: y Bluteau en su Diccionario Portugues previene, que algunos se la dan
de la voz Persa Rokh, que significa caballero errante o aventurero [Corominas: rabe].

Acredito que o Dicionrio dos dicionrios portugueses vai ser til muito tempo, porque nem no Brasil nem em Portugal existe algo semelhante ao Corpus diacrnico del espaol (CORDE) da RAE em Madrid. Existem
muitas tentativas de criar corpora, todos pequenos, nenhum projecto de
grande envergadura. Se compararmos os resultados j publicados do Corpus informatizado do portugus medieval (CIPM) da Universidade Nova

46

Dieter Messner

de Lisboa com o Vocabulrio do Portugus medieval, um CD-Rom de Antnio Geraldo da Cunha (2002), constatamos lacunas:
CIPM (consulta 1.11.2006)
DULDAR cf. DUVIDAR
Ocorrncias: 3
C6

duldari 1 (Foro real)

CP3

dulte 1 (CantigasEsc.Mald.)

PP f.s.

dultada 1 (CEM)

Cunha (2002)
duldar (4) vb. Duvidar: sXIII Fuero
Real III.820; S XIV Gen.Estoria 23,1;
Crnica Gen.Gallega 897,50; Hist.Troyana 33.33.;
dultar. (7) vb. Duvidar: sXIII CSM 50.3,
sXIV Crnica Gen.Gallega 98.43; SantoGraal 119b7; Miragres 225,9; Tristan
79.3; Hist.Troiana 104.4 Crn.Troyana
1. 156.6.

Temos que falar tanto de dicionrios portugueses em tanto que fonte de dicionrios portugueses, como tambm de dicionrios escritos em
outras lnguas, a espanhola, sobretudo, e a francesa tambm, que os lexicgrafos portugueses usaram para redigir as suas obras.
Tambm temos que distinguir entre dicionrios receptores que copiaram inteiramente as entradas do seu modelo, e os outros que s tiraram
uma parte do modelo, ou a transformaram.
Com a citao da entrada Compostela, tomada de Bluteau, mostrei
que o Covarrubias (1611), chamado por Bluteau curioso investigador de
etimologias, era uma fonte importante para explicar a etimologia de palavras portuguesas em 1700, mas nem sempre Bluteau aceitou cegamente o que escreveu Covarrubias. Por isso reproduo uma parte da entrada
Abada:
O P. Gaspar Schot [...], & outros authores vulgares, como Covarrubias [] se tem equivocado.

Covarrubias foi tambm a fonte para difundir as explicaes etimolgicas em Portugal que o Padre Guadix j redigiu antes de 1593 (Guadix
1593; cfr. Messner 2007a).
O seguinte exemplo, que ilustra a prolongada inuncia de Covarrubias em Portugal, provm do Dicionrio da Academia Portuguesa, publicado em 1793:

47

Os dicionrios como fonte lexicogrca

Academia das Cincias (1793)

Covarrubias (1611)

Alquitira. s. f. Certo arbusto de flores


polypetalas, e da familia das leguminosas.
He denominada por Linneo Astragalus
tragacantha. He hum arbusto pequeno,
espinhoso, que nasce frequentemente na
Asia, nas vizinhanas de Alepo, em Candia, e outras mais partes [...].
He voz puramente Arabiga, segundo
Covarrubias, que traz as origens, que lhe
assigno Diogo de Urra e o P. Guadix.
A. da Cruz, Recop. 2,8 Fao este colerio. R. Sarcaiola nutrida [...] alquitira, &c.
Azev. Correc. 2,2,121 Alquitira e gomma arabiga. Morat. Pratic. 1,30,1 Gomma
alcatira, amendoas doces, de cada hum
meia ona.

Alquitira. Es cierto gnero de goma que


distila una planta dicha [] tragacantha,
id est, hircispinae; nace ordinariamente
en Arcdia y en Creta y en el Peloponeso;
descrbela Dioscrides, lib. 3, cap. 21; y
por esta razn Ant. Neb. vuelve dragantum. Los mdicos la llaman gummi dragantina, los arbigos alquitira; y dice Diego de
Urrea que se dijo as del verbo cathare,
que sinifica distilar, porque es gota que
se distila del dicho rbol. Parceme que
le da la mesma raiz que dio a alquitara.
El padre Guadix dice haberse dicho alquitara de quitir, que vale mucho, porque
echada en agua poa cantidad della se
extiende y se hace mucho.

Quando encontrei esta palavra no dicionrio portugus de 1793 perguntei-me, por qu que, pouco antes do ano de 1800, os lexicgrafos acadmicos copiaram o resumo que Covarrubias fez das duas etimologias
propostas, uma pelo Padre Guadix, do que o livro recebeu a licena em
1593, quer dizer j 200 anos antes da publicao do dicionrio portugus
de 1793, e a outra por Diego de Urrea, uma autoridade parece ao redor
de 1600, porque nomeado por Covarrubias no prlogo ao leitor assim:
Yo he consultado a Diego de Urrea, intrprete del rey nuestro seor.
Os dicionrios portugueses posteriores so mais explcitos:
Alquitira ou Alcatira, s. f. (do Arab. alcatira, derivado do verbo ctara, pingar, destillar, gottejar,
porque a gomma alcatira ou tragacantho transsuda da planta), a gomma tragacantho; it. a planta
que a d (astragalus tragacantha) (Constncio 1836).

Ponho ao lado do dicionrio de 1845 a entrada do de 1793:

48

Dieter Messner

Diccionario Universal (1845)

Academia das Cincias (1793)

Alquetira, (ant.) V. Alquitira.


Alquitira, s. f. (bot.) Arbusto de flores
polyptalas, e da familia das leguminosas, denominada por Linneo astragalus
tragacantha. pequeno e espinhoso; d
umas flores purpurinas, s quaes succedem bainhas villosas, inchadas, e cheias
de pequenos gros da figura de um rim.
Do tronco e ramos desta planta, corre
naturalmente, ou por incises que se fazem, um succo gommoso (draganthum
gummi) branco ou cinzento, luzidio,
leve, sem gosto nem cheiro, que tambem
se chama alquitira. Quando se lana de
infuso em agua, incha muito, e parece
uma especie de creme gelado. Esta mucilagem de gomma alquitira emprega-se
na pharmacia, e serve para outros usos.
arab. alcatira; do v. ctara, pingar, distillar,
gottejar; porque a gomma alcatira, ou tragacantho transsuda da planta.

Alquitira. s. f.
Certo arbusto de flores polypetalas, e da
familia das leguminosas. He denominada por Linneo Astragalus tragacantha. He
hum arbusto pequeno, espinhoso [...]. As
flores so pequenas, leguminosas, e quasi
purpurinas. s flores succedem bainhas
villosas, inchadas, e chas de pequenos
gros da figura de hum rim. Nos principios de Junho, e mezes seguintes corre,
ou naturalmente, ou por incises feitas no
tronco ou ramos deste arbusto, em maneira de fio, ou fita mais ou menos comprida, enrolada, crespa, ou em grumos,
hum succo gommoso, branco, ou cinzento, luzidio, leve, sem gosto, ou cheiro, que
se chama tambem gomma alquitira, ou s
alquitira. Quando se lana de infuso em
agoa se incha muito, e parece huma especie de creme gelado. Esta mucilagem
da gomma alquitira serve na Pharmacia,
e outros usos. He voz puramente Arabiga, segundo Covarrubias, que traz as
origens, que lhe assigno Diogo de Urra
e o P. Guadix. A. da Cruz, Recop. 2,8
Fao este colerio. R. Sarcaiola nutrida
[...] alquitira, &c. Azev. Correc. 2,2,121
Alquitira e gomma arabiga. Morat. Pratic.
1,30,1 Gomma alcatira, amendoas doces,
de cada hum meia ona.

Alquitra, s. f. (do Arab. alcatira) Herva, e juntamente gomma medicinal. (Dragacanthum gummi). Morat. Prat. 1. 30. 1. . Alguns dizem alquetiro (Morais 18586).
Alquitira, s. f. (Do rabe alcatira) O mesmo que Alcatira [...] (Vieira 1871-1874).
Alcatira s. f. ant. (Do rabe alcatira; do verbo catara, pingar, distillar.) Arbusto de flores polyptalas, da famlia das leguminosas. Produz um succo gommoso, branco, cinzento, inodoro e inspido;
uma mucilagem empregada na Pharmacia [...] (Vieira 1871-1874).

Constncio deve ter conhecido tambm o dicionrio de Covarrubias,


porque o seu texto se parece muito ao de Covarrubias. Foi copiado pelos
lexicgrafos do Diccionario Universal (1845), no qual o resto da microestrutura provm do dicionrio acadmico de 1793 (isso fez tambm Domingos Vieira).

Os dicionrios como fonte lexicogrca

49

Os acadmicos portugueses de 1793 foram prudentes. Fizeram bem porque algumas explicaes so extravagantes. Guadix, por exemplo, deduz
o nome da capital da ustria, Viena, de elementos rabes. Os acadmicos
portugueses no transcrevem as duas propostas etimolgicas de Covarrubias, porque no souberam qual a melhor entre as duas. J tiveram entre mos uma obra, os Vestgios da Lngua Arbica em Portugal, ou lexicon
etymologico das palavras, e nomes portuguezes, que tem origem arbica
(Sousa 1789). Muitas vezes aproveitam dela, mas na edio de 1789 a palavra alquitira ainda no est; por isso foram forados a recorrer a Covarrubias, sem meterse nas explicaes divergentes entre Urrea e Guadix.
De onde que vem ento a frase derivado do verbo ctara pingar,
distillar? Constncio (1836) copiou a explicao etimolgica da palavra
alcatro que est em Sousa (1789), porque este deduz alcatro do verbo
rabe ctara; verbo que est em Covarrubias e que provm de Urrea:
Alcatro [] Alcatrn. Espcie de bitume liquido. Deriva-se do verbo ctara pingar, distillar, cahir
s pingas; porque o pez se colhe das gotas da resina, que o pinheiro de si distilla (Sousa 1789).

Na nova edio do mesmo livro sobre Vestgios arbigos, feita em Lisboa em 1830, j est alquitira com o timo:
Alquitira [] Arab. Alcatira. He nome de certo arbusto, ou da goma de certa raiz (Sousa /
Moura 1830).

Por isso, os redactores do Morais (18586) cpiam esta explicao e no


reproduzem aquela do Diccionario Universal (1845).
Vemos ento, graas a estes exemplos que so muitos os dicionrios
espanhis que serviam de fonte aos antigos dicionrios portugueses.
interessante constatar que ainda hoje, os dicionrios portugueses
modernos recorrem a fontes espanholas para explicaes etimolgicas
de palavras portuguesas.
Comparei os comentrios etimolgicos sobre a palavra chinela em
sete dicionrios portugueses modernos (Messner 2007b), e constatei que
existe uma semelhana textual bastante grande entre as explicaes etimolgicas dos dicionrios citados.
A soluo do enigma que todos os lexicgrafos portugueses citados
copiaram o que foi escrito, bastantes anos antes, pelo lexicgrafo espanhol Joan Corominas (1954-1957) no Diccionario crtico etimolgico de la
lengua castellana, texto retomado letra por letra na edio de 1980.

50

Dieter Messner

Como j disse antes, a minha especialidade a dicionarstica histrica


da lngua portuguesa: por isso vou servir-me de exemplos tirados do meu
Dicionrio dos dicionrios portugueses, para ilustrar a minha contribuio.
J mencionei o facto de existirem dicionrios que copiavam por inteiro o que est em outros dicionrios. Um exemplo: um dos dicionrios
portugueses que contem microestruturas que diferem de maneira vistosa das denies contidas em dicionrios anteriores o Diccionario da
Lingoa Portugueza publicado pela Academia Real das Sciencias de Lisboa
(Academia das Cincias 1793), que s contm a letra A, um dicionrio j
mencionado antes, quando falei do arabista espanhol Guadix.
Por um lado encontramos no dicionrio acadmico muitas descripes
cientcas de plantas e animais (j o vimos na entrada alquitira, onde
aparece uma informao modernssima, a do botnico Linneo, ao lado de
uma etimologia proposta 200 anos antes):
agoa [...]. As agoas naturaes destilladas so tambem do numero das artificiaes, estas, e as da chuva
so as mais puras, que se conhecem, e no seu pezo especifico so para a agoa do mar :: 10000 :
10263; so para o ouro :: 1 : 19114 e so para o ar :: 800 : 1; estando o barometro em 28 pollegadas,
e o thermometro de Reaumur em 14112 gros [].

Pelo outro lado h denies de palavras triviais, que diferem das dos
dicionrios anteriores, e em terceiro lugar h microestruturas no acompanhadas de textos reais.
Esta falta de ilustraes contrasta com uma frase do prlogo, onde podemos ler:
O Diccionario [...] dever conter os vocabulos puramente Portuguezes em todas as suas significaes [...] inteiramente com o uso regular [...] fixado tudo pelos exemplos dos Autores
Classicos.

A discrepncia entre a metodologia proposta no prlogo e a realidade


tal qual a encontramos nas entradas conduz-me a comparar o dicionrio
acadmico portugus com obras estrangeiras, tambm com a da Academia espanhola, o chamado Diccionario usual (RAE 1780).
No dicil ver que nas microestruturas de muitas entradas as denies portuguesas e espanholas so semelhantes, o que no pode ser
um puro acaso.

51

Os dicionrios como fonte lexicogrca

RAE (1780)

Academia das Cincias (1793)

Ala. Mil. La parte de tropa que cubre el


centro del exrcito por qualquiera de los
dos costados (p. 36).

Ala Milic. A parte da tropa, que cobre o


centro do exercito por qualquer dos dous
costados (p. 178).

Alcanzadura s. f. Alb. La hinchazon que


suele hacerse a las caballeras de algun
golpe de hierro, piedra en la parte trasera del pie junto la ua, casco. Llmase
tambien as la contusin, herida que se
les hace topndose el pie con la mano
[...] (p. 44) [= Diccionario de Autoridades,
17702, 148].

Alcanadura, s. f. Alveit. Inchao, que


se costuma fazer nas cavalgaduras por algum golpe de ferro o de pedra na parte
posterior do p junto unha ou casco; ou
tambem a contuso ou ferida, que ellas
mesmas se fazem a si, tocandose com a
ferradura do p na mo [...] (p. 190).

Algo s. m. ant. Bienes, hacienda, caudal;


en este sentido se us tambin antiguamente en nmero plural (p. 50)

Algo s. m. antiq. Fazenda, haver, cabedal,


bens. Tambem se usa neste sentido no
plural (p. 212).

Alguns colegas atribuem certa importncia ao primeiro e nico volume de este dicionrio:
Em suma, verifica-se que o 1. Dicionrio da Academia ainda hoje um modelo de tcnica lexicogrfica, elaborado com o maior rigor cientfico [...] (Casteleiro 1993: XXII).

Eu acho que este dicionrio, visto sob uma perspectiva moderna, no


merece estes elgios.
De vez em quando os trs lexicgrafos citam de maneira explcita o
dicionrio castelhano da RAE.
Na entrada alcorque podemos ler:
Academia das Cincias
(1793)

Diccionario de Autoridades (1770)

RAE (1780)

Alcorque. s. m. ant. Certo


calado antigo, que tinha a
sola de cortia. No Diccion.
Castelhano se diz, que parece vir do Arabigo crque,
que significa o mesmo,
accrescentado o articulo
al [].

Alcorque, s. m. antiq. Zapato outro calzado, que


tenia la suela de corcho.
Parece viene del rabe
corque, que significa lo
mismo aadido el artculo
al [].

Alcorque, s. m. antiq. Zapato, outro calzado, que


tena la suela de corcho.
Parece viene del rabe
corque, que significa lo
mismo aadido el artculo
al [].

52

Dieter Messner

O mesmo dicionrio da Academia Portuguesa serviu-se tambm de


uma obra fundamental francesa, a Encyclopdie (1752), traduzindo-a e reorganizando a estrutura interna das entradas, sem indicar, claro, a fonte,
que foi, naquela poca, proibida em Portugal. A numerao minha:

No quero falar demasiado da inuncia que exerceu o Tesoro de la


lengua castellana o espaola de Covarrubias (1611) no dicionrio de Rafael
Bluteau, publicado entre 1712 e 1728.

53

Os dicionrios como fonte lexicogrca

Mais interessante e provavelmente no conhecida a inuncia espanhola sobre os dicionrios posteriores em Portugal, no sculo XIX, no
que as grandes lnguas europeias criaram os seus dicionrios.
Os trs lexicgrafos acadmicos de 1793 no foram os nicos em traduzir dicionrios espanhis, sem declar-lo. Em 1806 publicou-se o Novo
Diccionario da Lingua Portugueza, composto sobre os que at ao presente
se tem dado ao prelo, e Accrescentado de varios vocabulos extrahidos dos
Classicos Antigos, e dos Modernos de melhor nota, que se acha universalmente recibidos (Novo Diccionario 1806).
notria a insero de muitos neologismos recuperados dizem no
ttulo de autores portugueses antigos e modernos. A verdade por completo outra: encontrei as palavras tambm no Diccionario castellano con
las voces de ciencias y artes y sus correspondientes en las tres lenguas Francesa, Latina Italiana, de Esteban de Terreros y Pando (Terreros 1786).
Terreros (1786)

Novo Diccionario
(1806)

Diccionario Universal
(1845)

Alioth, termino de Astronomia, nombre de una


estrella que est en la cola
de la Osa mayor; sirve para
conocer la altura del Polo.

Allioth, s. m. Estrella da
cauda da ursa maior.

Allioth, s. m. (ast.) Estrella na cauda da ursa-maior,


que se observa no mar
para se conhecer a altura
do polo.

possvel que os redactores do dicionrio universal de 1845 tenham


copiado tambm o Terreros y Pando, visto a semelhana textual:
Terreros (1786)

Novo Diccionario
(1806)

Diccionario Universal
(1845)

Alibanias, ciertas telas


de algodon, que trahen
de las Indias Orientales
Holanda.

Alibania s. f. Estofo das


Indias Orientaes.

Alibania, s. f. (Com.) Panno de algodo da India.

possvel que os redactores do dicionrio de 1818 copiassem tambm


o Terreros y Pando, visto a palavra algodo.
Tambm o Morais copiou de uma obra, do Viterbo (1798-1799). Na segunda edio de Morais, de 1813, aparecem os mais raros arcasmos, alguns deles hapaxlegomena em dicionrios portugueses do sculo XIX, se

54

Dieter Messner

bem que Morais argumenta, no Prlogo do autor primeira impresso,


de 1813: Os Autores, com que autorizei os Artigos addidos, so Portuguezes castios [...]. Um exemplo:
Ousm. Atrevimento, insolencia, desaforo. Vem do Latino Audeo (Viterbo 1798-1799).
Ouso, s. m. antiq. Atrevimento. Elucidar (Morais 1813).
Ouso, s. f. (ant.) Atrevimento (Diccionario Geral 1818).
Ouso, s. m. antiq. Atrevimento. Elucidar (Morais 1831).
Ouso s. obsol. V. Atrevimento, Ousadia (Constncio 1836).
Ouso, s.m.ant. Atrevimento. Eluc. (Morais 1858).
Ouso, s. m. Termo antiquado. Audacia, arrojo, atrevimento (Vieira 1871-1874).

uma palavra para a qual nem Viterbo reproduz o documento, mas


com a entrada no Morais de 1813 e a sua autoridade obteve direito vida
e perpetuou-se em todos os dicionrios seguintes.
Ter-me-ia sido possvel enumerar muitos mais exemplos para indicar a dependncia de dicionrios portugueses de outros, portugueses e
estrangeiros, que lhes antecedem, mas, acredito, os exemplos com o que
ilustrei a minha contribuio so sucientes.

Os dicionrios como fonte lexicogrca

55

ANEXO
1. Coloquio de Lexicografa (Instituto da Lingua Galega, Santiago de Compostela, 27 de febreiro 1 de marzo de 1986).

57

A INFORMACIN GRAMATICAL NOS DICIONARIOS


Xos-lvaro Porto Dapena

Universidade da Corua

0. introducin
Cando nos preguntamos pola informacin gramatical nos dicionarios, estamos a partir en realidade da existencia dunha dicotoma a de
gramtica / dicionario, na que certamente cada da se cre menos, anda
que, por outro lado, vea sendo mantida tradicionalmente mesmo dende
moito antes de que Saussure fundase a lingstica sobre as sas famosas antinomas. Estou seguro de que a inmensa maiora dos que aqu nos
atopamos seguimos pensando que posur unha lingua non consiste basicamente noutra cousa que, por unha banda, en coecer o seu vocabulario
e, por outra, en dominar as regras gramaticais que nos permiten xerar ou
producir, a partir daquel, un indenido nmero de enunciados. Pero non
menos certo, ao mesmo tempo, que todos estamos absolutamente convencidos de que en materia de linguaxe e, polo tanto, tamn na lingstica non hai compartimentos estancos, de maneira que nunca se poden
facer delimitacins exactas e, conseguintemente, os lmites que intentemos establecer sern sempre imprecisos e necesariamente difusos.
No que aos terreos da Lexicografa e da Gramtica se rere, esta indenicin pxoa recentemente moi ben de manifesto Ignacio Bosque
(2004: LXXIX e ss.) na introducin do seu REDES, dicionario dedicado, como
sabido, ao aspecto combinatorio do lxico, por certo nunca tratado anteriormente en ningunha lingua. Segundo observa, cando informaba das
particulares caractersticas da sa obra, anda en elaboracin, aos colegas,
haba discrepancias entre eles no sentido de que, se eran gramticos, lle dican que o que estaba a facer era lexicografa, mentres que, tratndose de
lexicgrafos, se inclinaban a pensar que a sa investigacin corresponda,
pola contra, ao mbito do gramatical. E certamente nin el mesmo que,
segundo confesa, non lexicgrafo, senn gramtico parece estar moi

58

Xos-lvaro Porto Dapena

seguro de que a sa obra, malia o seu ttulo, sexa un verdadeiro dicionario,


cousa que eu que si son lexicgrafo xamais puxen en dbida, nin sequera antes de ser publicada, nas mias conversas co propio Bosque.
Para empezar, sinalemos que opoer Gramtica e Dicionario implica
ante todo ter unha idea clara e vez particular anda que s sexa teoricamente dos respectivos dominios destas das disciplinas, dominios que
anda non foron xados dun modo unnime. Sen entrar na dicultade
posta de manifesto hai algns anos por Alvar Ezquerra (1993: 59 e ss.)
hora de denir o concepto de dicionario, abonde con xarnos na variedade de concepcins sobre o verdadeiro contido e extensin da Gramtica,
concepcins que, por certo, non sempre permiten manter a sa oposicin
fronte ao Dicionario. Pensemos, se non, no caso dos xenerativistas cando a interpretan no seu sentido mis amplo, equivalente a Lingstica, e
segundo o cal o Dicionario ou Lexicn non vira a ser mis que unha das
sas partes ou compoentes.
evidente que, se nos preguntamos pola presenza de informacin
gramatical nos dicionarios, porque estamos a entender a Gramtica
no seu sentido mis tradicional e xeneralizado, dicir, como a suma de
Morfoloxa e Sintaxe, entendida a primeira, grosso modo, como estudo
da forma das palabras e a segunda como estudo da combinatoria destas
para formar unidades sintagmticas de orde mis complexa, isto , frases
ou oracins. Porque neste sentido, efectivamente, os dicionarios anda
sen sar dos mis comns e correntes, isto , os de carcter xeral, alfabtico e sobre todo didctico abundan en informacins de tipo morfolxico
e sintctico, mesmo mis al do que, s veces, poidan mostrar as puras
aparencias. E sendo isto as, un dicionario tpico, isto , de carcter semasiolxico, non consiste contra o que talvez tende a pensarse nun puro
estudo semntico do lxico, exclusivamente encamiado a informar dos
signicados ou acepcins das palabras, senn que, como non podera ser
doutro xeito, nos informa ademais doutros moitos aspectos, entre os que
cabe destacar, por ser o tema deste traballo, o morfolxico e, sobre todo,
o sintctico.

1. algunhas cuestins previas


1.1. Contido do dicionario
O Dicionario, segundo iso, presntasenos como un estudo hbrido, isto
, a cabalo entre o estritamente lexical, que constituira o seu primordial

A informacin gramatical nos dicionarios

59

e xenuno mbito, e o gramatical, chegando a abranguer mesmo outros


moitos campos que nalgns casos superan o terreo estritamente lingstico, para inclur tamn o que non mis que saber enciclopdico. Non
fai falta insistir en que, efectivamente, nun dicionario podemos atopar,
por exemplo, informacin etimolxica, terminolxica, pragmtica, sociolingstica, dialectal, fontico-fonolxica, ortogrca e un longo etctera,
dependendo claro est do tipo especco de dicionario.
Pero volvendo cuestin da informacin gramatical, anda que de
feito non se pode negar a existencia de certo solapamento entre Dicionario e Gramtica, de sorte que nun e noutra atopamos s veces estudadas
as mesmas cuestins (pensemos, por exemplo, no tratamento das preposicins e, en xeral, das chamadas palabras gramaticais), non menos
certo que, en non poucas ocasins, se lle nega lexitimidade ao Dicionario
para ocuparse de cuestins de natureza morfolxica ou sintctica, porque
penso que erroneamente se consideran todas elas patrimonio exclusivo da Gramtica. A mesma denominacin que s veces utilizamos eu
o primeiro (vxase, por exemplo, Porto Dapena 2002a: 64) de dicionarios
gramaticais para referirnos a aqueles cuxas entradas se elixen atendendo
precisamente a certas peculiaridades morfosintcticas, pon ben s claras
a vixencia de semellante opinin.
, non obstante, un erro negar que, por exemplo, un dicionario non
debe dar conta de que un verbo ha de construrse cun determinado tipo
de complemento, de que un adxectivo pode xuntarse soamente a certos
substantivos ou de que unha determinada palabra pode funcionar como
adverbio e preposicin ou ofrece, por outro lado, algunha particularidade
na sa conformacin morfonolxica. E un erro porque tales cuestins,
lonxe de pertenceren Gramtica tal como a entendemos normalmente, corresponden s e exclusivamente ao Dicionario.
E chegados a este punto, vxome na necesidade de observar que Morfoloxa e Sintaxe non son contra o que comunmente tende a pensarse
disciplinas exclusivamente gramaticais, senn tamn lxicas, de sorte
que entre elas, por unha parte, e entre Gramtica e Dicionario, por outra,
se d unha relacin de cruzamento, tal como se pode esquematizar no
seguinte grco:

60

Xos-lvaro Porto Dapena

M
O
R
F
O
L
O
X

GRAMTICA

LXICO

S
I
N
T
A
X
E

Anda que insisto a delimitacin entre os membros de cada un destes dous pares de disciplinas sexa na prctica relativamente difusa, non
cabe a mis mnima dbida de que as como na Gramtica existen unha
morfoloxa e unha sintaxe, tamn no estudo do lxico e por ende na
Lexicografa haber que facer a mesma distincin. Hai que falar, como
se fai con frecuencia, dunha morfoloxa lxica xunto a unha morfoloxa
gramatical, preocupada esta ltima fundamentalmente polos aspectos
exivos; pero tamn dunha sintaxe lxica, referida ao nivel mis concreto
da palabra, fronte a unha sintaxe gramatical, enfocada mis ben ao estudo da oracin e as sas partes ou funcins.

1.2. Delimitando o noso obxecto de estudo


Anda que resulte un pouco contraditorio co que acabo de observar,
cando se me suxeriu que me ocupase da informacin gramatical nos dicionarios, entendn inmediatamente que o que se me estaba a propoer
era que tratase fundamentalmente de cuestins de morfoloxa e, sobre
todo, de sintaxe lxicas rexistradas nos dicionarios xerais e comns. Por
iso nelas moi especialmente nas sintcticas no que vou centrar o
obxecto da mia exposicin. Non hai que perder de vista, non obstante,
que van quedar fra outros aspectos neste caso mis estritamente gramaticais e sen dbida interesantes, como pode ser, por exemplo, o tratamento nos mesmos dicionarios de palabras gramaticais, de cuestins
relacionadas coa exin e categorizacin das palabras ou, en n, o estudo
da terminoloxa gramatical e con el da propia Gramtica.
Respecto a isto ltimo, xa dica Gili Gaya (1945) que un dicionario non
debe ser unha gramtica estruturada en artigos dispostos por orde alfabtica, anda cando aceptable que, sobre todo tratndose de dicionarios
de tipo escolar, se empregue certa manga ancha neste aspecto, inclundo,
entre outras cousas, explicacins e informacins de tipo gramatical, como
poden ser paradigmas exionais, formas irregulares e mesmo algunhas
regras sintcticas elementais. Dende logo, todos nos temos beneciado
algunha vez da presenza destas cuestins gramaticais nos nosos peque-

A informacin gramatical nos dicionarios

61

nos dicionarios bilinges cando eramos estudantes. Pero non hai que
acudir exclusivamente aos dicionarios escolares para constatar este feito, pois tamn os dicionarios comns e correntes de tipo mis ou menos
descritivo e normativo pensemos, para o espaol, no DRAE ou no DUE de
Mara Moliner tenden a inclur as mesmo este tipo de informacin en
atencin a que estn destinados a un pblico non particularmente versado en materia gramatical.
En calquera das das estruturas que caracterizan un dicionario pode
detectarse a informacin morfosintctica. En primeiro lugar, na macroestrutura, isto , atendendo ao lemario ou conxunto de entradas, e en segundo termo, na microestrutura ou interior do artigo lexicogrco. No
primeiro caso cabe anda referirnos a dous aspectos: o que atende aos
tipos de lxico rexistrado, ao inclur, entre outras cousas, palabras ou morfemas gramaticais as como elementos morfolxicos por exemplo, prexos e suxos derivativos, e, por outra banda, o que se rere mis ben
forma da entrada, a cal, ademais de informar sobre a sa propia ortografa, pode facelo as mesmo sobre as sas particularidades morfolxicas, e
ata s veces fontico-fonolxicas.
Dende logo todos os dicionarios de tipo xeral rexistran as chamadas
palabras gramaticais, isto , pronomes, preposicins e conxuncins, de
modo que aqu atopamos o primeiro solapamento entre Gramtica que
mis propiamente a que debe estudar estes elementos e o Dicionario,
o cal, por outro lado, cando de tipo xeral, non se limita a recoller as unidades lxicas, senn todo tipo de vocbulos indo mesmo mis al destes:
por exemplo, a rexistrar as mesmo certos axos ou, sen ir mis lonxe, as
letras do abecedario (vxase a este respecto Porto Dapena 2000-2001) e ata
s veces elementos que non pertencen propiamente lingua, como o
caso do DUE de Mara Moliner cando recolle mesmo certos clics (chsss!,
mmm, etc.).
Pero falando de elementos de tipo gramatical includos na nomenclatura do Dicionario, cabe anda seguindo unha feliz distincin de Eugenio
Coseriu (1977: 107-109) entre linguaxe primaria e metalinguaxe separar
entre entradas gramaticais, as representadas por pronomes, preposicins,
formas irregulares, etc., que pertencen, obviamente, linguaxe primaria,
e, por outro lado, entradas de gramtica, isto , terminoloxa gramatical,
pertencente ao lxico especializado da Gramtica ou, mis ben, da Lingstica, estudado s veces enciclopedicamente non s, por suposto,
nos dicionarios e vocabularios especializados, senn mesmo s veces se
ben iso non se xustique doadamente nos dicionarios xerais e comns.
Exemplicando co mesmo DUE de Mara Moliner, os artigos que esta au-

62

Xos-lvaro Porto Dapena

tora chama de desarrollo gramatical corresponden precisamente a este


ltimo tipo de entradas.
Anda se atendemos lematizacin ou forma en que aparecen rexistradas as entradas no Dicionario, este pode ofrecer de feito informacin
gramatical. Se, ante todo, inclumos dentro desta a de tipo ortogrco,
quen non usou algunha vez o dicionario para descubrir, en caso de dbida, como se escribe unha palabra? Pero, referndonos mis especicamente ao aspecto morfolxico, non infrecuente no enunciado das entradas que, ao lado do lema, isto , a forma bsica que se toma en conta para
a orde alfabtica, aparezan outras formas ou ben de tipo exional (por
exemplo, a forma feminina xunto masculina nos artigos de adxectivos
e de certos substantivos) ou ben variantes de tipo morfonolxico, dando
as lugar a enunciados polimrcos.
A pesar de todo isto, a maior e talvez mis importante informacin
tanto morfolxica como, sobre todo, sintctica nos dicionarios vn dada
na microestrutura, xa sexa directamente, isto , mediante explicacins
ad hoc ou por medio da correspondente marcacin gramatical, para indicar neste caso, en abreviatura, a categora ou subcategora (por exemplo,
adxectivo, transitivo, masculino, plural), xa sexa indirectamente, como
algo que se desprende doadamente das propias denicins ou dos contextos de que estas forman parte. As, non infrecuente nos dicionarios
correntes sinalar o tipo de conxugacin propia dos verbos irregulares ou
indicar as peculiaridades prosdicas e mesmo s veces de pronuncia cando se trata dunha palabra polo regular un emprstito cuxa ortografa
non se adapta s regras xerais de equivalencia entre grafa e pronuncia.
Moitos dicionarios sinalan tamn certas posibilidades de construcin;
por exemplo, cando se di dun verbo que tamn se usa como pronominal ou que rexe unha determinada preposicin, que vai acompaado dun
complemento especial, etc.
xeralmente neste ltimo punto de vista no que os dicionarios comns e correntes adoitan ser menos explcitos, conando na maior parte
dos casos na competencia e intuicin lingstica dos usuarios, que se ven
obrigados a descubriren indirectamente as peculiaridades sintcticas ou
combinatorias da palabra en cada unha das sas acepcins. Precisamente neste ltimo tipo de informacin ao tratarse sen dbida do aspecto
menos evidente e coecido e, por iso, mis interesante no que vou centrar o resto da mia exposicin, pois o tema deste traballo tan amplo
que nos sera imposible abranguelo aqu en todos os aspectos que acabo
de sinalar moi esquematicamente.

A informacin gramatical nos dicionarios

63

As pois, vou referirme concretamente informacin sintctica contida case sempre implicitamente nas denicins lexicogrcas, ou nos
contextos de que estas forman parte dentro das respectivas acepcins. Os
exemplos que vou utilizar corresponden todos eles a dicionarios do espaol, concretamente ao DRAE, ao DUE e ao DEA de Manuel Seco, Olimpia
Andrs e Gabino Ramos, por ser a lexicografa espaola o mbito no que
mis traballei e, polo tanto, mellor me movo.

2. a informacin gramatical na macroestructura


De acordo, pois, co esquema que acabo de trazar, voume xar antes
de nada na informacin gramatical contida na macroestrutura dos dicionarios. E neste punto, atendendo en primeiro lugar ao tipo de lxico
estudado, cabe sinalar, como vimos antes, a presenza de, por unha parte,
palabras ou elementos de signicacin exclusivamente gramatical, como
as partculas e os pronomes, xunto a voces pertencentes ao que poderiamos chamar metalxico, dicir, referentes a realidades gramaticais ou
lingsticas en xeral. Pero as mesmo, independentemente do signicado
ou referencia das entradas, o modo como estas aparecen rexistradas no
dicionario pode nalgunha medida informar acerca dalgunha ou dalgunhas das sas peculiaridades gramaticais.

2.1. Con atencin ao tipo de lxico rexistrado


Non este, dende logo, o momento de entrar na discusin acerca do
nivel ou niveis de unidades lingsticas que deben ou non formar parte da nomenclatura dun dicionario. Todos estamos de acordo en que as
entradas estn constitudas basicamente por palabras; palabras ortogrcas, claro est, posto que nos estamos a referir a unha obra de carcter
escrito. Iso non obsta, sen embargo, para que, sa vez, formen parte da
nomenclatura elementos menores que a palabra, como o caso de certos
suxos ou prexos utilizados na formacin de palabras, e mesmo outros
como o caso das letras do abecedario ou dos clics que non son nin
sequera unidades lingsticas propiamente falando.
A presenza na nomenclatura dos dicionarios das chamadas palabras
gramaticais constite sen dbida o mis claro expoente de interferencia
entre gramtica e dicionario. Realmente o punto de vista adoptado na
descricin das conxuncins e preposicins, por exemplo, non vara substancialmente dun dicionario a un tratado gramatical, a non ser talvez

64

Xos-lvaro Porto Dapena

no carcter polo xeral mis minucioso daquel: comparemos, sen ir mis


lonxe, o tratamento, de apenas das pxinas, que se d preposicin entre na Gramtica descriptiva de la lengua espaola dirixida por Bosque e
Demonte (De Bruyne 1999: 674-676) co correspondente artigo, redactado
por min mesmo, do DCR, que ocupa mis de vinte pxinas a dobre columna. As diferenzas entre dicionarios e gramticas son talvez maiores no
que se rere ao tratamento dos pronomes, debido, entre outras razns,
necesidade de ter que adaptarse naqueles estruturacin alfabtica, o
que fai que formas dun mesmo paradigma gramatical como poden ser,
por exemplo, en galego, eu, me ou comigo, ou as correspondentes formas
yo, me, conmigo do espaol aparezan espalladas en lugares moi distintos da macroestrutura dun dicionario.
O tratamento, por certo, que na simple nomenclatura reciben os pronomes ou o artigo, xunto cos hoxe chamados determinantes, pode ser
ndice das bases tericas que, con respecto concepcin do pronome,
subxacen no propio dicionario. As, por exemplo, pode ser signicativo
que, como acontece no DGILE, se rexistren como entradas independentes
os demostrativos en funcin adxectiva e en funcin substantiva, o que signica que o autor ou autores do dicionario opoen como, por outra parte, se veu facendo frecuentemente os adxectivos demostrativos aos seus
correspondentes pronomes, reducidos funcin substantiva. De todos os
xeitos, como estudei nun artigo sobre o tema (Porto Dapena 2003-2004), os
dicionarios mostran unha gran vacilacin hora de rexistrar na sa nomenclatura as formas pronominais, que tenden, como acabo de observar,
dispersin, ao gurar cada forma na sa correspondente posicin alfabtica. Por iso, quizais, pode dicirse que os pronomes en xeral aparecen,
dende logo, mellor tratados nas gramticas que nos dicionarios.
Algo parecido ao que acabo de dicir dos pronomes se pode armar
de palabras, sobre todo verbos, con exin irregular. Neste caso, efectivamente, non ser imposible, sobre todo en dicionarios de aprendizaxe,
rexistrar como entradas independentes as formas irregulares, remitindo
claro est en cada unha delas forma baixo a cal se describe o correspondente vocbulo e onde se informa, entre outras cousas, das correspondentes irregularidades.
Evidentemente, este modo de proceder explcase sobre todo nos chamados dicionarios pedagxicos ou de aprendizaxe, posto que van destinados a un pblico cun baixo nivel de coecementos en materia gramatical. A mesma explicacin pode valer, por certo, para xusticar a presenza
na nomenclatura dos dicionarios xerais da terminoloxa gramatical ou
lingstica, isto , do metalxico utilizado na descricin das linguas, cir-

A informacin gramatical nos dicionarios

65

cunstancia que se aproveita s veces para ofrecer na correspondente microestrutura todo un estudo de tipo gramatical, entrando as o Dicionario
no que xa habera que considerar saber enciclopdico. Considrese a este
propsito, por exemplo, o longo artigo, de mis de corenta pxinas, que a
propsito da palabra verbo aparece na primeira edicin do DUE de Mara
Moliner, o cal constite un amplo e detallado captulo digno de gurar
nun tratado de gramtica descritiva.
De todos os xeitos, habemos de coincidir con Gili Gaya en que un dicionario, como xa queda sinalado, non debe ser nunca unha gramtica
estruturada en captulos dispostos por orde alfabtica, que realmente o
que Mara Moliner xo cos artigos de desarrollo gramatical e que, precisamente por esa razn, os encargados de preparar a segunda edicin do
DUE, eliminaron da nomenclatura, pasndoos a formar un longo apndice ao nal da obra. inevitable, con todo, que un dicionario comn trate
o lxico metalingstico, anda que, evidentemente, sen chegar ao grao
de especializacin dun dicionario de lingstica ou sobre terminoloxa
gramatical, nin, por suposto simplemente porque cadra de camio, tomar como pretexto ese vocabulario para desenvolver toda unha teora
lingstica ou un estudo detallado da gramtica da lingua en cuestin.
Isto ltimo supora unha confusin por certo bastante frecuente nos
dicionarios comns entre o lingstico e a realidade (anda que neste caso
esteamos a falar vez dunha realidade lingstica), pois unha cousa, loxicamente, ser denir a palabra verbo, que o que atinxe ao dicionario, e
outra ocuparse como fai Mara Moliner da realidade chamada verbo. s
veces a confusin tan forte que se chegan a inclur na nomenclatura dos
dicionarios elementos que, anda sendo realidades lingsticas, non constiten verdadeiras unidades lxicas, como o caso, por exemplo, das letras,
segundo puxen de manifesto hai algn tempo nun artigo sobre o tema
(Porto Dapena 2000-2001). Realmente unha entrada como B, por exemplo,
non unha palabra (fronte ao substantivo be), senn a letra mesma, a cal,
malia ser unha realidade grca e, polo tanto, lingstica, non debera
gurar como entrada en ningn dicionario e s, en todo caso, nunha enciclopedia. Cando, efectivamente, o DRAE nos dene
b 1. f. Segunda letra del abecedario espaol y del orden latino internacional, que representa un
fonema consonntico labial y sonoro. Su nombre es be, be alta o be larga.

non nos est a dar o signicado dunha palabra b inexistente, senn que
nos est a caracterizar a letra mesma, o signo ortogrco; por iso non ten
ningn sentido a marcacin f. (feminino) que fai desta entrada.

66

Xos-lvaro Porto Dapena

Situacin moi distinta a correspondente aos axos derivativos, pois,


malia non ser palabras, constiten unidades lingsticas cun signicado e unha evidente potencialidade combinatoria para constitur novos
vocbulos ou facer posible a anlise doutros xa existentes. De a que os
dicionarios sexan cada da mis proclives a aceptar estes elementos morfolxicos na sa nomenclatura, facendo as innecesario o rexistro de, por
exemplo, aumentativos e diminutivos nos substantivos, ou superlativos
nos adxectivos, que tanto inaron noutro tempo a macroestrutura do
DRAE. En realidade estas formas as como outros tipos de derivados (por
exemplo, os deverbais) deberan ser tratados na microestrutura, quero
dicir, nos artigos correspondentes s palabras de que derivan, a non ser,
loxicamente, cando presentan signicados non previsibles, isto , non derivables dos seus elementos morfolxicos compoentes.

2.2. Con atencin lematizacin ou forma das entradas


Pero, como xa queda dito, a informacin gramatical na macroestrutura
non s vn dada polo tipo de entradas que a constiten, senn tamn pola
forma en que estas aparecen rexistradas no dicionario. dicir, a lematizacin representa sen dbida sexa directa ou indirectamente un aspecto
importante para determinar algunhas caractersticas gramaticais das palabras tomadas como entradas. Concretamente, as relacionadas en primeiro
lugar coa sa ortografa e pronuncia, e, en segundo termo, as que atinxen,
por exemplo, s sas caractersticas exionais, morfonolxicas ou grcas.
Mis arriba, en efecto, xa me refern ao feito en absoluto infrecuente de que os dicionarios comns son consultados coa especca nalidade de descubrir a ortografa dun vocbulo concreto. Trtase claro est
dun tipo de informacin indirecta, por canto que a entrada, ao vir dada
na sa representacin grca, fai supoer que tal representacin ha de
ser a correcta. Nalgns dicionarios, non obstante, ao lado do lema isto ,
a forma do enunciado do artigo sometida orde alfabtica poden aparecer como sublemas outras formas ortogrcas posibles, como o caso,
por exemplo, do enunciado de
guion o guin. [] 1. m. Escrito en que breve y ordenadamente se han apuntado algunas ideas
o cosas con objeto de que sirva de gua para determinado fin.

que atopamos na ltima edicin do DRAE. Dende logo nos dicionarios histricos, ao detectrense s veces mltiples grafas dunha mesma palabra,
moi frecuente atoparnos con enunciados deste tipo.

A informacin gramatical nos dicionarios

67

Achmonos neste ltimo caso ante enunciados polimrcos, os cales non s poden informar da existencia de variantes ortogrcas, senn
moitas veces tamn morfonolxicas, como sera o caso, por exemplo, dun
dicionario que rexistrase como entradas as formas amueblar ou amoblar,
carnicera ou carnecera, espabilar ou despabilar, etc. Mesmo por exemplo, na primeira edicin do DUE de Mara Moliner dentro dun mesmo
enunciado pode aparecer toda unha familia morfolxica, con remisin
entrada que se subordinan; o caso, por exemplo, de
perfeccin; perfeccionador, -a; perfeccionamiento; perfeccionar; perfeccionarse; perfectamente; perfectibilidad; perfectible; perfectivo, -a. V. bajo PERFECTO.

Evidentemente, no caso do espaol, que ten, como o galego, unha


ortografa doadamente transcodicable en elementos sonoros, o simple
enunciado da entrada en forma escrita proporciona tamn informacin
anda que as mesmo indirecta acerca da pronuncia, ao se poder interpretar como representacin desta. Non acontece, en troques, o mesmo
con certos extranxeirismos que, como leasing, lead ou pizza, se escriben
como na lingua orixinal sen que, por outro lado, exista a correspondencia
grco-fontica propia do espaol. Neste caso, como procede o DRAE na
sa ltima edicin, tal inequivalencia vn marcada polo tipo de letra a
cursiva utilizado na lematizacin, mentres que a pronuncia, cando se d,
se expresa directamente na microestrutura, dicir, dentro do artigo lexicogrco. As, por exemplo, considrese no DRAE:
leasing. (Voz ingl.) 1. m. Econ. Arrendamiento con opcin de compra del objeto arrendado.

E no DEA:
lead (ing; pronunc corriente, /lid/; pl normal, -s) m En un peridico: Entradilla.

En canto a aspectos relacionados coa pronuncia dados na macroestrutura, cabe engadir que algns dicionarios por exemplo, o GDUEA de
SGEL presentan as entradas con separacin silbica, dando as informacin cremos que innecesaria e s veces ata discutible acerca deste particular. As, des.a.gra.de.ci.do, em.plas.to, ma.nual.men.te.
Agora ben, a informacin mis estritamente gramatical ofrecida pola
forma en que se rexistran as entradas , evidentemente, a que atinxe ao
carcter exivo, isto , gramaticalmente variable ou, pola contra, invariable das palabras. En primeiro lugar, como sabido, os substantivos e

68

Xos-lvaro Porto Dapena

adxectivos que posen variacin de xnero rexstranse na cabeceira do


artigo baixo a forma masculina acompaada da terminacin feminina,
e, no caso dos verbos, que se presentan s nunha forma, o innitivo, a
terminacin -ar, -er ou -ir suciente para determinar a conxugacin e
polo tanto o modelo de exin a que corresponde. S no caso de que se
trate dun verbo irregular se fai necesario indicar esa particularidade na
microestrutura, remitindo, como fai o DRAE ou o DEA de Manuel Seco, ao
modelo de conxugacin ou s formas concretas de carcter irregular. As,
por exemplo, no DRAE:
retraer [...] MORF. conjug. actual c. traer.

3. a informacin gramatical na microestructura


, con todo, na microestrutura onde os dicionarios comns ofrecen
unha maior cantidade de informacin gramatical, informacin que, dada
dun xeito explcito ou implcito, directo ou indirecto, sen dbida superior
ao que habitualmente se cre, anda cando iso si presenta deciencias
evidentes, en comparacin sobre todo con dicionarios especiais, como os
de valencias, de construcin e rxime, e os combinatorios ou de colocacins. De feito, no interior dun artigo posible atopar todo tipo de informacin gramatical: nel pode darse conta, entre outras cousas, tamn da
pronuncia, ortografa, etimoloxa e particularidades de exin, as como
da categorizacin ou subcategorizacin da entrada e o que mis importante e, polo tanto, ao que aqu vou prestar especial atencin do seu
comportamento sintagmtico.
3.1. Indicacins sobre pronuncia, ortografa, etimoloxa e exin
Non vou insistir aqu sobre as indicacins por outro lado evidentes, dado
o seu carcter explcito e directo que aparecen con frecuencia nos dicionarios
ao uso sobre a pronuncia, etimoloxa ou propiedades de orde ortogrca ou
exiva. Son indicacins, por certo, que adoitan aparecer no que poderiamos
chamar periferia do artigo, dicir, na parte inicial, despois da entrada, ou nal
deste, para non se confundiren con ningunha das acepcins en particular. E
as frecuente que a etimoloxa e o mesmo as particularidades fontico-ortogrcas aparezan, como acontece, por exemplo, no DRAE, inmediatamente despois da entrada, entre parnteses, ou que as particularidades de exin
se indiquen nunha especie de apndice ao nal de artigo.

A informacin gramatical nos dicionarios

69

Dende logo, como xa sinalou A. Quilis (1982), nun dicionario de espaol a indicacin da pronuncia non ten demasiada xusticacin, dada a
normal e case exacta correspondencia entre letras e fonemas. A lectura
do espaol (e tamn do galego) non ofrece, efectivamente, ningunha dicultade sobre todo aos falantes nativos coecendo, claro est, esas
equivalencias, que, ademais, non son absolutamente idnticas para todos
os hispanofalantes (e galegofalantes), o que dicultara s veces a sa
transcricin fontica1. S excepcionalmente, no caso de emprstitos tomados doutras linguas na sa orixinal grafa, poden presentarse dicultades neste sentido e, polo tanto, resulta necesario e conveniente realizar
algunha observacin ao respecto, sempre, naturalmente, que a pronuncia
contradiga dalgn xeito as correspondencias letra /son de espaol ou galego. Considrese, como exemplo, o caso de sndwich tal como aparece na
primeira edicin do DUE:
sandwich (pronunc. aproximadamente sanuich; y a la espaola, vulgarmente, sambich). Palabra inglesa con que se designa [...].

A dicultade deste tipo de indicacins radica, naturalmente, no feito


de que o dicionario, ao ir destinado a un pblico descoecedor da fontica, non pode utilizar senn os grafemas ordinarios e, polo tanto, dar unha
pronuncia tan s aproximada, como acontece no caso anterior. O DEA,
penso que acertadamente, d, non obstante, a transcricin fonolxica.
Polo que se rere indicacin da etimoloxa, os dicionarios comns
contntanse normalmente con sinalar, entre parnteses, o timo precedido da indicacin da lingua a que este pertence xunto con, a continuacin
do timo, o signicado orixinal. Non se engade ningn comentario acerca
da evolucin fontica e semntica, nin se aborda ningunha discusin de
carcter crtico sobre outras posibles hipteses.
De todas estas informacins a mis destacable sen dbida a referente a aspectos exionais, como o caso da conxugacin dos verbos.
Polo xeral, os dicionarios tan s fan referencia aos casos de irregularidade, sinalando as correspondentes formas irregulares ou ben indicando o
tipo de conxugacin, contida nun apndice da obra onde se ofrecen os
paradigmas prototpicos completos. Este ltimo , por exemplo, o procedemento seguido polo DEA de Manuel Seco. Mis completo, dende logo,
1.

Resulta, polo tanto, redundante o procedemento seguido polo GDLE, que incle invariablemente a pronuncia segundo a norma espaola de todas as sas entradas, as cales aparecen en transcricin fontica: as,
ha.ber [ar]

70

Xos-lvaro Porto Dapena

o mtodo seguido polo DRAE, que na sa versin electrnica ofrece a posibilidade de despregar a conxugacin completa de cada verbo, picando
simplemente o botn azul que aparece ao lado da entrada. En calquera
caso, velaqu un punto mis onde Gramtica no seu sentido mis estrito e Dicionario interren claramente.

3.2. A marcacin gramatical


Outro caso, por certo, de interferencia que adoita sinalarse hora de
establecer a separacin entre Dicionario e Gramtica o representado
pola indicacin das categoras e subcategoras, habida conta de que estas corresponden de cheo ao terreo gramatical. Teamos en conta, non
obstante, a este respecto que os dicionarios non se ocupan propiamente
das categoras gramaticais do mesmo xeito que o fai a Gramtica, que as
estuda en xeral, como partes da oracin, dicir, atendendo ao seu comportamento ou funcins dentro da unidade sintctica por antonomasia.
O Dicionario, en cambio, limtase a tomalas como criterio de clasicacin
das palabras concretas, as cales, de acordo coa devandita clasicacin,
posuirn un determinado contido categorial, asociado iso si a unhas
posibilidades combinatorias ou sintcticas.
A categorizacin nos dicionarios vn dada sempre por marcas, consistentes en abreviaturas, como adx. (adxectivo), adv. (adverbio), m. ou f.
(masculino ou feminino), tr. (transitivo), amb. (ambiguo), etc. Algn dicionario, non obstante, como o caso do DUE de Mara Moliner na sa primeira edicin (p. XXIII), prescinde desta marcacin, habida conta de que a
categora e subcategora dunha palabra doadamente deducible da correspondente denicin: un substantivo, en efecto, non pode ser denido
mis que mediante outro substantivo ou sintagma equivalente, un verbo
por medio doutro verbo e as sucesivamente. A falta de categorizacin nun
artigo lexicogrco pode crear problemas, como cando se trata de palabras
que poden ser obxecto de recategorizacin; por exemplo, un adxectivo que
pode substantivarse ou funcionar adverbialmente, etc. Por outro lado, nos
verbos, non sempre son deducibles da denicin os carcteres de transitivo ou intransitivo, etc. De a que na sa segunda edicin o DUE rexistre
tamn a categora ou subcategora, que de ningn xeito deben tomarse
como informacin redundante, senn absolutamente necesaria.
Como dixen noutro lugar (Porto Dapena 2002a: 253), a indicacin da
categora e subcategora nos dicionarios responde ante todo ao obxectivo
fundamental de determinar o comportamento gramatical tanto paradigmtico como sintagmtico das entradas. De todos os xeitos, como

A informacin gramatical nos dicionarios

71

sinalou recentemente Ignacio Bosque (2006), certo que os dicionarios


deberan incrementar a marcacin gramatical, inclundo subcategorizacins como animado / non animado, contable / non contable nos substantivos, ou, por exemplo, perfectivo / imperfectivo, incoativo / cursivo /
terminativo nos verbos, posto que estas caractersticas semanticamente
clasemas tamn inen no comportamento morfosintctico das palabras en cuestin.
Trtase, en todo caso, de trazos que, polo menos nalgunhas ocasins,
son dalgn xeito deducibles das respectivas denicins, como penso
mostrar nun prximo traballo sobre este tema. Para non me alongar agora demasiado, contentareime con presentar dous ou tres casos: por exemplo, os verbos cuxas denicins estn constitudas pola frase verbal facer
(esp. hacer) + oracin substantiva son verbos factitivos:
acosar. tr. Hacer correr al caballo.
anticipar. tr. Hacer que algo suceda antes del tiempo sealado o esperable, o antes que otra cosa.

Os que, pola sa banda, se denen por empezar, comezar ou poerse a


+ innitivo sern incoativos:
adormecerse. prnl. Empezar a dormirse, o ir poco a poco rindindose al sueo.
templar. intr. Dicho de una cosa: Perder el fro, empezar a calentarse.

Tern, pola sa banda, carcter terminativo desinente aqueles que se


denen mediante deixar (esp. dejar) de + innitivo, como
callar. intr. Dicho del mar, del viento, de un volcn, etc.: Dejar de hacer ruido.
morir. intr. Dejar de vivir.

etctera.
3.3. A informacin gramatical nas denicins: o contorno
Pero falando da denicin lexicogrca como fonte de informacin
gramatical, convn non esquecer que esta non consiste contra o que
doadamente se puidese pensar nunha mera descricin do signicado
ou contido semntico dunha palabra ou unidade lxica, senn que moitas veces informa tamn, implcita ou explicitamente, acerca do seu comportamento sintagmtico. Isto quere dicir que nunha denicin poden
distinguirse con frecuencia dous elementos: o que propuxen chamar

72

Xos-lvaro Porto Dapena

enunciado parafrstico, que repite o contido semntico do denido e, polo


tanto, en principio, pode substitur a este en calquera contexto, xunto ao
que, despois dun memorable traballo de Manuel Seco, deu en denominarse contorno denicional, no que se expresan as condicins contextuais de
uso (cfr. Seco 1979; Porto Dapena 1997 e 2002a: 307-328, e Rafel 2006). As, por
poer un exemplo sinxelo, na denicin
comprar. tr. Adquirir algo por dinero

o que aparece subliado o contorno, posto que funcionar tamn como


complemento directo do denido, fronte ao resto do deniens, que reproduce
o contido interno de comprar, pois pode substitur a este, por exemplo, en
Pedro compr una moto = Pedro adquiri por dinero una moto.

Notemos de paso que s veces a maior parte dos compoentes dunha


denicin non analizan contra o que sera de esperar o signicado do
denido, senn que informan mis ben do seu comportamento sintctico, como o caso en
confluir. intr. Juntarse dos o ms ros u otras corrientes de agua en un mismo lugar

que vn a ser mis ben unha denicin sinonmica, dado que o enunciado parafrstico est representado por unha soa palabra; pero onde se nos
informa acerca das caractersticas do suxeito (ten que ser unha corrente
de auga) e da necesidade dun complemento de lugar.
Non foron estudadas anda en profundidade as circunstancias en que
unha denicin ha de ofrecer o seu contorno. Dende logo este non debe
faltar, obviamente, cando os elementos que o compoen tean que cumprir unhas determinadas condicins semnticas e, polo tanto, exista un
condicionamento por parte do denido, representado xeralmente por un
verbo ou, se acaso, un adxectivo. Pola contra, non necesarioe polo tanto
non debe aparecer cando doadamente deducible do contexto parafrstico. De a, por exemplo, que esta denicin tomada do DRAE:
anglfono. adj. Dicho de una persona o de un pas: Que tiene el ingls como lengua nativa

presente un contorno en certo modo redundante, posto que ter unha


lingua como nativa tan s pode atribuirse a persoas ou, por metonimia,
ao pas onde viven. Pero, desgraciadamente, tamn acontece o contrario

A informacin gramatical nos dicionarios

73

nos dicionarios: s veces as denicins non son o sucientemente explcitas porque lles falta o contorno, como esta outra, tomada as mesmo do
DRAE,
abanicar. tr Hacer aire con el abanico

onde, evidentemente, falta a alguien, que o complemento directo do


verbo denido.
De acordo con estas observacins, existen, por unha parte, contornos
explcitos e contornos non explcitos, anda que doadamente deducibles
do contexto denicional, como, por exemplo,
sabiondo. adj. coloq. Que presume de sabio sin serlo.

Non fai falta sinalar que se di unicamente de persoas. Por outra banda, os contornos explcitos poden ser integrados, cando como o tpico
forman parte do enunciado denicional, e non integrados, se aparecen
fra del; as, en
transcurrir. intr. Dicho generalmente del tiempo: Pasar, correr

o contorno externo ou non integrado.


Dende logo, o ideal que o contorno sexa integrado e, ademais, desempee no deniens as mesmas funcins sintcticas que ha de desempear cando se constre co denido, como acontece, por exemplo, nestes
casos:
contener. tr. Llevar o encerrar dentro de s una cosa a otra.
trasladar. tr. Llevar a alguien o algo de un lugar a otro.
apto, ta. adj. Idneo, hbil, a propsito para hacer algo.
digno, na. adj. Merecedor de algo.

Non fai falta subliar, efectivamente, que un contorno deste tipo, ao


que chamamos homoxneo, altamente informativo dende o punto de
vista gramatical, pois non s pon de manifesto o nmero e caractersticas
semnticas dos actantes ou valencias, senn tamn as sas respectivas
funcins sintcticas.
Lamentablemente, non sempre resulta posible utilizar contornos homoxneos, e entn btase man de contornos heteroxneos, dicir, aqueles
en que nos temos que contentar con explicitar os argumentos ou actan-

74

Xos-lvaro Porto Dapena

tes do verbo denido, pero con funcins sintcticas distintas s que lles
corresponden cando se constren con el. o caso, entre outros, de
rizar. tr. Formar en el pelo artificialmente anillos o sortijas, bucles, tirabuzones, etc.

onde pelo acta como complemento circunstancial no deniens, mentres


que co denido sera o complento directo; as mesmo, en
resucitar. tr. Volver la vida a un muerto.

o complemento indirecto sera, non obstante, o directo do denido. Notemos que, nestas circunstancias, o poder informativo sintacticamente
falando do contorno queda bastante minguado, o que levou a algns autores de dicionarios o caso, por exemplo, do DEA ou do DS e antes, anda
que tan s parcialmente, do DUE a sinalar por diversos procedementos
formais as funcins sintcticas que os elementos do contorno han de desempear cando aparecen co denido. Considrese, como exemplo, esta
denicin do DEA:
retirar. tr. Hacer que [alguien o algo (cd)] deje de estar [en un lugar (compl DE)]

onde, como sabido, os elementos entre corchetes pertencen ao contorno,


os cales, ao desempearen funcins sintcticas distintas que co denido,
van seguidos da indicacin de funcin entre parnteses.
Como sinalei no seu da nun artigo sobre o contorno (Porto Dapena
1997: 221-222), o poder informativo do dicionario podera potenciarse anda mis, sinalando na denicin, por exemplo, o rxime preposicional, o
carcter obrigatorio ou non dun complemento, a sa condicin de complemento interno, etc., simplemente utilizando distintos tipos de parnteses: concretamente, propoa entn usar corchetes ([ ]) para indicar o
carcter obrigatorio, parnteses angulares (< >) para os complementos
non obrigatorios, e, nalmente, parnteses normais para os complementos internos, ademais dunha serie de subndices encargados de sinalar a
funcin (cando non coincidise coa do deniens) ou o rxime preposicional. As, resultara o seguinte:
abanicar. tr. Hacer aire od[a alguien] (con un abanico u otro objeto a modo de abanico).
abastecer. tr. Dar o vender od[a alguien] cp de, con<todo lo que se necesita>.

A informacin gramatical nos dicionarios

75

Sistema semellante a este, anda que mis sinxelo, foi o adoptado despois polo DS.
De todos os xeitos, habida conta de que toda esta parafernalia de parnteses e subndices resultan bastante enguedellantes hora de consultar o dicionario, eu avogara hoxe por separar nas acepcins os elementos
contextuais ou contorno, dos propiamente denicionais ou parafrsticos,
rexistrando en primeiro lugar o contexto e logo a denicin, que as quedar bastante despoxada de elementos externos. , por certo, unha prctica que estou a adoptar penso que con xito no meu futuro Diccionario
Corua de la lengua espaola actual (DCLEA) e que, ao meu xuzo, far
deste dicionario, sendo xeral, un dos mis informativos dende o punto de
vista sintctico. Proporei tan s un caso a xeito de simple mostra:
beber v. 1. tr. [~ un animal o persona (suj.) <una cosa lquida> <p. e. agua> (od.)]. Ingerirla o meterla
en la boca hacindola pasar al tubo digestivo.
Yo nunca bebo soda. Cuando tengo sed, mejor bebo agua. (Santiago, El sueo de Amrica, 21
[CREA])
a) intr. Sin obj. directo puede significar particularmente consumir bebidas alcohlicas. En este
caso puede ir acompaado de los advs. de cantidad mucho, demasiado o poco, o tambin con la expresin como un cosaco. Si no lleva ningn adv., se entiende siempre mucho o demasiado y, por lo tanto,
el verbo adquiere ms particularmente el significado de ser alcohlico o tener el vicio de tomar
bebidas alcohlicas. Finalmente, en frase negativa equivale siempre a ser abstemio, no probar el
alcohol: Domingo no bebe, pero su hijo s.
Y el espaol bebe sobre todo fuera de casa y raras veces bebe en solitario. (Domingo, El sabor
de Espaa, 40 [CREA])
Viva en una pensin y beba como un cosaco. (Leguineche, La tierra, 151 [CREA])
No fuma, no bebe y habla con el desparpajo y la insolencia propias de su edad. (El Pas [CREA],
02/08/87 [CREA])
b) [~ alguien (suj.) por algo o alguien (cp.)]. Tomar una copa p. e. despus de un brindis para
celebrar o desear algo positivo a favor de la persona o cosa que se expresa.
Vamos a beber por los buenos consejos. (Loriga, Hroes, 130 [CREA])
Contra sus hbitos, la madre pidi que le sirvieran vino y bebi por su esposo y sus hijos, mencionando cada nombre con tal nfasis (luego comentaran) que quiz quiso despedirse de esta
manera. (Otero, Temporada de ngeles, 130 [CREA])

Trtase, como pode verse, da primeira acepcin do verbo beber: o


contexto aparece entre corchetes, as parnteses angulares serven para
indicar a non obrigatoriedade do elemento que acoutan, e nas denicins
aparecen s aqueles elementos do contorno (en cursiva) que resultan sintacticamente imprescindibles para facer viable o enunciado denicional.

76

Xos-lvaro Porto Dapena

3.4. Informacin gramatical e separacin de acepcins


No tocante s informacins gramaticais contidas nas denicins lexicogrcas ou que se poden doadamente deducir delas, quero referirme
agora a unha cuestin que, no que a min se me alcanza, non foi ata agora
abordada por ningun, porque atinxe ao aspecto sen dbida mis problemtico e vez espiento da Lexicografa, como a delimitacin ou
separacin de acepcins. Concretamente, a cuestin que quero formular
aqu ata que punto as acepcins en que se dividen os artigos lexicogrcos corresponden tal como se adoita crer a signicados diversos
da palabra-entrada ou, mis ben, a distintos comportamentos sintcticos
desta e, polo tanto, proporcionan unicamente informacin gramatical.
De todos sabido que, para a separacin de acepcins, non existen
uns criterios universalmente aceptados polos lexicgrafos, o que explica
a gran disparidade con que os dicionarios ags nos casos, non infrecuentes, de plaxio describen dende este punto de vista unha mesma palabra,
atribundolle un maior ou menor nmero de acepcins, por outra parte
non sempre coincidentes. Por regra xeral, confndense nesta operacin
caractersticas de moi distintas ordes: semnticas, gramaticais, pragmticas, enciclopdicas... O lexicgrafo, guiado pola sa intuicin, limtase a
constatar os diversos sentidos que vai detectando nos textos proporcionados polo corpus, sen distinguir normalmente se se trata realmente de
signicados distintos ou mis ben de puras variantes dun mesmo signicado. o que acontece, como lxico, nos dicionarios que, como o DRAE,
non rexistran mis que acepcins; pero anda nos que separan acepcins
e subacepcions as no DUE e no DEA tampouco se seguen uns criterios
homoxneos e, dende logo, obxectivos2.
A pregunta que se fan todos os que por primeira vez se teen que enfrontar coa redaccin de artigos sempre a mesma: que debemos separar
en primeiro lugar, os signicados ou as construcins? O que en realidade
equivale a cuestionar se na separacin de acepcins debe primar o sintctico sobre o semntico ou, pola contra, o semntico sobre o sintctico.
2.

En realidade non existe unha idea clara na lexicografa tradicional acerca do que ha de ser unha acepcin
e unha subacepcin, e, polo tanto, tal distincin obedece as mesmo a criterios meramente subxectivos.
Na mia opinin, non obstante, os dous termos deberan empregarse, respectivamente, para referirse aos
signicados e s variantes de signicado: debe entenderse que dous sentidos dun vocbulo corresponden
a signicados ou acepcins distintas cando en ambos a devandita palabra forma parte de paradigmas
lxico-semnticos diferentes, mentres que, de pertenceren ao mesmo paradigma, acharmonos ante variantes ou subacepcins dun mesmo signicado (vxase Porto Dapena (2002a: 199). Sobre os problemas do
establecemento de acepcins ocupronse recentemente J. A. Pascual Rodrguez e R. Garca Prez (2007: 117
e ss.).

A informacin gramatical nos dicionarios

77

Dende logo eu non teo ningunha dbida como non a tivo tampouco
Cuervo no seu DCR de que a separacin de acepcins debe consistir basicamente en distinguir signicados ou, por mellor dicir, sentidos, anda
cando cada un destes vaia moitas veces asociado a un determinado comportamento sintctico. Pero non todo o mundo segue este procedemento:
sen ir mis lonxe, o DEA, que representa nestes momentos sen dbida o
mellor dicionario do espaol actual, parte, como sabido, dunha separacin sintctica, ao estudar separadamente nos artigos dos verbos as
construcins transitiva, intransitiva e pronominal, cousa que o leva, por
certo, a repetir en moitos casos o mesmo signicado en cada unha desas
construcins, duplicando ou triplicando as o nmero de acepcins. Considrese, por poer un exemplo sinxelo, o seguinte artigo do DEA:
enfermar A intr 1 Ponerse enfermo [1]. Tb. (reg) pr (~ se). A veces con un compl. DE.
B tr 2 Poner enfermo [1 y 2] [a alguien o algo]. A veces con un compl DE o, raro, CON.

onde se establecen das acepcins, que en realidade non son mis que
unha, anda que en construcins sintcticas distintas: as diferenzas veen aqu dadas pola conguracin sintctica dos actantes, pois o suxeito
de 1 o complemento directo de 2, onde vez se incrementa un novo
actante, un causante ou instigador.
Cando unha mesma acepcin dun verbo susceptible de expresarse
mediante construcins distintas o mis frecuente nos dicionarios porque este o proceder preferido polo DRAE utilizar unha soa denicin
de acordo cunha desas construcins (a que se considera mis xenuna) e
engadir, mediante abreviaturas, na mesma acepcin, expresins como u.
t. c. tr. (intr. ou prnl.), dicir, usado tamn como transitivo (intransitivo
ou pronominal). As,
derrumbar [...].2. tr. Derribar, demoler una construccin o parte de ella. U. t. c. prnl.

A informacin sintctica resulta correcta, pero sen dbida insuciente, posto que non se explica a modicacin funcional de que sern obxecto os actantes.
Estes mesmos dicionarios, non obstante, non seguen un criterio homoxneo nesta cuestin, posto que, ao lado desta solucin, atopamos
tamn, o mesmo que no exemplo que acabamos de ver do DEA, unha diversicacin de acepcins, que repito non presentan mis que unha
pura variacin na conguracin sintctica dos actantes. Considrese, por
exemplo, o seguinte artigo tomado do propio DRAE:

78

Xos-lvaro Porto Dapena

empapar. 1. tr. Humedecer algo de modo que quede enteramente penetrado de un lquido. Empapar
una sopa en vino. U. t. c. prnl. El pan se empapa en el vino. 2. tr. Dicho de una cosa: Absorber dentro de
sus poros o huecos algn lquido. La tierra empapa el agua. U. t. c. prnl. La tierra se empapa de agua. 3. tr.
Absorber un lquido con un cuerpo esponjoso o poroso. Empapar con un trapo el agua vertida. 4. tr. Dicho
de un lquido: Penetrar los poros o huecos de un cuerpo. La lluvia empapa los vestidos. U. t. c. prnl. La
lluvia se empapa en la tierra.

cuxas catro acepcins son en realidade unha soa, pero con distintas funcins sintcticas dos mesmos actantes e que poderiamos resumir nas seguintes frases:
1. Juan empap la esponja en agua.
2. La esponja empap el agua.
3. Juan empap el agua con una esponja.
4. El agua empap la esponja.

onde, como se ve, utilizamos os mesmos argumentos ou actantes, dicir,


A1 = Juan, A2 = esponja, e A3 = agua (cfr. Porto Dapena 2002b).

3.5. Informacin sobre o rxime e as colocacins


Con ser as denicins, xa sexa, como acabamos de ver, a travs dos
contornos ou na sa relacin con outras acepcins dentro do mesmo artigo lexicogrco, unha importantsima e indiscutible fonte de informacin gramatical nos dicionarios comns, non cabe dbida de que estes,
ao mesmo tempo, presentan indubidables deciencias hora de precisar
o comportamento sintctico ou combinatorio das palabras. De acordo co
que sinalou recentemente Ignacio Bosque (2004: CVII), das denicins de
sumo, por exemplo, que tomo do DEA abreviado,
sumo1, -ma [...] adj 1. Mximo, o superior a todos los de su especie. 2. Muy grande en calidad o
intensidad.

non se deduce senn mis ben ao contrario que non sexan aceptables, entre outras, expresins como *Tena suma hambre ou *Esta lmpara es suma, fronte, en cambio, a Lo har con sumo gusto, Hay que
tener sumo cuidado, que seran perfectamente aceptables. Nos dicionarios, efectivamente, case nunca se precisa con que palabra ou palabras concretas adoita construrse de feito un vocbulo; dicir, non
se rexistra o que hoxe coecemos co nome de colocacins, as como
en moitsimos casos tampouco se mostra o rxime preposicional das

A informacin gramatical nos dicionarios

79

palabras, segundo acontece, por exemplo, neste artigo, que tomamos


do DRAE:
comparar. 1. tr. Fijar la atencin en dos o ms objetos para descubrir sus relaciones o estimar sus
diferencias o semejanza.|| 2. tr. cotejar.

Non se precisa, en efecto, que dos obxectos comparados un deles haber de actuar como complemento preposicional precedido de con.
Non , dende logo, agora o momento de entrar na discusin do que
debemos entender exactamente por colocacin, nocin, como se sabe,
dabondo controvertida (vxase, entre outros, Alonso Ramos 1994-1995 e
Koike 2001) e que eu aplicara, por razns prcticas, a toda combinacin
xa de palabras establecida polo uso que se repite sen que entre elas
exista solidariedade nin que, por outro lado, posa signicado idiomtico.
dicir, a presenza dunha non esixe necesariamente a da outra non existe condicionamento ou seleccin semntica e, dende o punto de vista do
seu contido, cada unha conserva o seu correspondente signicado. As, a
expresin frecuente durmir profundamente ou pracidamente ser unha
colocacin, pois nin durmir esixe a profundamente ou pracidamente, nin
ningn destes adverbios a durmir, e, ademais, ambas as das palabras
conservan o seu signicado individual. Pero notemos que a semellante
combinacin non se fai a mis mnima alusin en ningn dicionario xeral da lingua galega (nin da espaola verbo do comportamento parello
de dormir).
En relacin, por certo, co espaol dormir, en todos os dicionarios atopamos rexistradas expresins como dormir a pierna suelta ou dormir
como un lirn, que, ao meu modo de ver, seguen sendo tamn colocacins, agora constitudas por dormir e as locucins a pierna suelta e como
un lirn. Neste caso penso que tal rexistro se debe interpretacin sen
dbida errnea desas combinacins como locucins verbais anda que,
evidentemente, o carcter locucional corresponde unicamente s correspondentes expresins adverbiais.
Non este, naturalmente, o nico caso en que os dicionarios comns
rexistran colocacins. Obsrvese, por exemplo, o seguinte exemplo tomado do DRAE:
tomar [] 28. tr. Ponerse a ejecutar la accin o la labor para la cual sirve un determinado instrumento. Tomar la pluma, ponerse a escribir. Tomar la aguja, ponerse a coser.

80

Xos-lvaro Porto Dapena

onde evidente que tomar la pluma e tomar la aguja son as mesmo colocacins. O rexistro, con todo, deste tipo de construcins sempre espordico e, dende logo, nada sistemtico.
E outro tanto cabe dicir do rxime preposicional, cando este non deducible do enunciado denicional, como no caso de comparar, a que me
refern antes. S algns dicionarios por exemplo, o DEA e, na maiora dos
casos, o DUE ofrecen realmente esa informacin. E as, no artigo correspondente mesma palabra comparar, o DEA di o seguinte:
comparar [...] 2 Expresar la semejanza que se encuentra [entre una persona o cosa (cd) y otra
(compl A o CON).

E no DUE de Mara Moliner:


comparar [...]1 (con) tr. *Examinar alternativamente dos o ms cosas para apreciar sus semejanzas y diferencias.

onde, como sabido e pode aqu observarse, o rxime preposicional se


indica mediante unha parntese diante da denicin, anda que non se
precisa que elemento ha de levar a preposicin. Son, con todo, sempre casos excepcionais e case sempre espordicos.

4. conclusin
E, xa para conclur, direi que, dende logo, os dicionarios comns de
tipo xeral e semasiolxico ou alfabtico, aos que aqu me vin referindo, non informan sobre aspectos morfolxicos e, sobre todo, sintcticos
coa mesma intensidade e detalle con que o fan os dicionarios especializados ou dicionarios gramaticais, dicir, entre outros, os de valencias, de
construcin e rxime, combinatorios, de colocacins, etc. Se as non fose,
obvio que a existencia destes ltimos carecera de toda xusticacin.
Non obstante, como creo quedou sucientemente demostrado ao longo desta breve exposicin, os dicionarios comns anda sen pretendelo
moitas veces informan sobre eses e outros aspectos en maior medida do
que quizais podera pensarse primeira vista. Isto, por outra banda, non
signica que o dicionario se extralimite nas sas funcins de informar
sobre o lxico da lingua, entrando nun terreo que non lle corresponde e
reservado unicamente gramtica. Realmente, anda que verdade que
existe certa imbricacin entre Dicionario e Gramtica, como, por exem-

A informacin gramatical nos dicionarios

81

plo, acontece segundo vimos co tratamento de palabras gramaticais ou


formas irregulares de exin por parte daquel, non menos certo que
os aspectos valenciais e combinatorios en xeral das palabras concretas
son aspectos que atinxen s e exclusivamente ao Dicionario, o cal de ningn xeito se pode limitar a informar sobre os signicados ou, en xeral,
os trazos estritamente paradigmticos do lxico. En realidade, como moi
ben se demostra na anlise das denicins lexicogrcas, sera imposible
delimitar o signicado dunha palabra sen ter en conta ao mesmo tempo
a sa proxeccin sintagmtica, isto , o contexto ou contextos en que ese
signicado pode aparecer; digamos que entre o paradigmtico e o sintagmtico existe unha interdependencia e, polo tanto, sera imposible o
estudo dun prescindindo absolutamente do outro. O nico que, en todo
caso, cabe lamentar que os dicionarios comns non exploten en maior
medida as posibilidades que, sen apenas custo, teen de informar mis
e mellor acerca do comportamento morfosintctico das palabras, como,
dende logo, hai que lamentar vez que os usuarios do dicionario carezan
na maior parte dos casos das debidas destrezas como para sacalle todo o
rendemento que cabe sacar s consultas lexicogrcas. A verdade que
se usa pouco e mal o dicionario.

82

83

LEXICOGRAFIA PORTUGUESA. PERSPECTIVA CRTICA


Telmo Verdelho

Universidade de Aveiro

1. O biblinimo Dictionarium foi pela primeira vez publicado em Portugal em 1551 no ttulo de um pequeno manual escolar, Hieronymi Cardosi Dictionarium Iuventuti studiosae admodum frugiferum (Cardoso 1551)1,
destinado ao ensino do latim a estudantes portugueses. Trata-se de um
abreviado vocabulrio latim-portugus, com 3.300 entradas, distribudas
por grupos temticos, sem qualquer ordem alfabtica e com valorizao
de um universo de referncia profano, com alargado espao para a terminologia da medicina.
A primeira dicionarizao efectiva do portugus, com alfabetao do
conjunto do corpus lexical, teve lugar em 1562, com a publicao de um
dicionrio de portugus-latim (Cardoso 1562-1563). Regista cerca de 12.000
entradas e oferece uma boa documentao do vocabulrio comum, tradicional e no erudito da lngua. Todavia, apresenta j alguns indcios da
renovao latinizante que se encontrava crescentemente exercitada nos
textos dos humanistas e nos versos de poetas como Cames.
A lexicograa portuguesa, prolongando a herana latina, nasceu um
pouco mais tarde do que a de outras lnguas europeias, e teve um percurso menos abundante, em obras publicadas, mas no deixou de preencher
um espao interessante, pela sua dimenso lingustica e cultural, e ainda
por uma certa originalidade, no panorama amplo da elaborao dicionarstica das lnguas modernas.
Poderemos salientar, entre vrios aspectos observveis no percurso
histrico da lexicograa portuguesa, um conjunto de traos mais caracterizadores, que particularmente a distinguem de outras experincias
lexicogrcas suas contemporneas, e que marcam a sua especicidade.
Nomeadamente:
1.

No se conhece actualmente nenhum exemplar da edio princeps.

84

Telmo Verdelho

herana residual no que respeita produo glossarstica da Idade


Mdia,
estreita e continuada vinculao tradio europeia, particularmente italiana, espanhola e francesa,
surgimento relativamente tardio,
produo de uma precoce e original lexicograa transeuropeia ligada missionao,
destacado predomnio da lexicograa escolar dos Jesutas, at
1750,
emergncia singular duma obra monumental: o Vocabulrio de
Rafael Bluteau (1712-1728),
perodo ureo de produo lexicogrca na segunda metade do
sculo XVIII, correspondente ao incio de uma dicionarstica verdadeiramente moderna,
recepo dos dicionrios no Brasil e interaco francesa,
democratizao do dicionrio prtico na primeira metade do sculo XIX,
inexistncia de uma poltica da lngua e desamparo institucional
em relao elaborao e produo lexicogrca, em contraste
com o contributo gracioso proveniente do espao no lusfono.
Estas observaes no compendiam toda a histria dos dicionrios
portugueses. Muitos outros factos assinalaram o seu percurso e condicionaram a sua produo e interaco no horizonte lingustico e cultural
portugus. Os dicionrios para alm de inesperadas peripcias bibliogrcas, que muitas vezes acompanharam a sua publicao, integraram-se na
vida das lnguas e dos povos como um objecto de civilizao. Constituem
agora, pela acumulao de alguns sculos, um patrimnio documental
onde se encontram repercutidas, de maneira muito sensvel, a sociedade
e as suas vicissitudes, neles transparecem os recursos tcnicos e econmicos, a vida literria, e at o trnsito poltico e as ondas ideolgicas. Os
dicionrios portugueses so, sob este ponto de vista, proveitosamente
instrutivos. Tiveram um processo de emergncia e de divulgao, que
lhes permitiu acompanhar, com uma discreta inocncia testemunhal,
sobretudo os ltimos duzentos anos da histria nacional. Alguns foram
objecto de edies sequenciadas em genealogias mais ou menos generosas e mais ou menos prolongadas. O caudal do lxico foi-se acumulando
e transmitindo de maneira quase automtica, com algumas raras interferncias de vigilncia crtica.

Lexicografa portuguesa. Perspectiva crtica

85

Perspectivando um roteiro da lexicograa portuguesa poderiamos


anotar uma linhagem sucessria em que se distinguem os nomes de
Jernimo Cardoso (1510?-1569) Bento Pereira (1605-1681), Rafael Bluteau
(1638-1734), Antnio de Morais Silva (1755-1824), Joaquim Jos da Costa e
S (1740-1803), Pedro Jos da Fonseca (1751-1816), Francisco Solano Constncio (1772?-1846), Jos da Fonseca (1788-1866), Incio Roquete (1801-1870),
Domingos Vieira (?-1854), Caldas Aulete (1823-1878), Antnio Lopes Santos
Valente (1839-1896), Candido de Figueiredo (1846-1925), Augusto Moreno
(1870-1955), Cardoso Jnior (1884-1969), Francisco Torrinha (1879-1955), Jos
Pedro Machado (1914-2005), Almeida Costa, Sampaio e Melo, e no Brasil,
entre outros, Antenor Nascentes (1886-1972), Aurlio Buarque de Holanda Ferreira (1910-1989), Geraldo da Cunha (1924-1999) e Antnio Houaiss
(1915-1999).
O contributo destes autores uiu, transfundiu-se e transcendeu
o mbito do legado pessoal, para ser continuado em edies pstumas actualizadas, revistas, corrigidas, renovadas, emendadas,
acrescentadas, melhoradas, enriquecidas, reformadas, ampliadas, adicionadas, numa herana de intercolaborao de geraes,
que faz de quase todos os dicionrios textos caractersticos de autoria
colectiva.
Na tradio portuguesa, a mais ilustre e prolongada linhagem a de
Antnio de Morais Silva que, por sua vez, retoma o testemunho do Vocabulrio de Bluteau que ele prprio quis repercutido no ttulo da edio
inicial. Comeou em 1789 com a publicao do Diccionario da lingua portugueza / composto pelo padre D. Rafael Bluteau; reformado e accrescentado por Antonio de Moraes Silva (Morais 1789), e foi reeditado, sempre
em dois volumes, em 1813, 1823, 1831, 1844, 1858, 1877-78, 1889, 1891, e nalmente retomado para uma edio monumental (12 volumes), com
o ttulo Grande dicionrio da lngua portuguesa / Antnio de Morais
Silva; 10 ed / revista, corrigida muito aumentada e actualizada segundo as regras do acordo ortogrco luso - brasileiro de 10 de Agosto de
1945 por Augusto Moreno, Cardoso Jnior e Jos Pedro Machado (Morais
1949-1959). Geralmente mencionado, desde as primeiras edies, pela designao metonmica de o Morais, este dicionrio citado e aludido,
sobretudo a partir dos meados do sculo XIX, por gramticos e grandes
escritores, entre eles, Camilo Castelo Branco, como a mais importante
referncia normativa para autorizar e esclarecer o lxico portugus (cfr.
Verdelho 2002).

86

Telmo Verdelho

2. A reexo lexicogrca participa da histria da lngua, uma condio do seu ordenamento normativo e, de certo modo, acompanha a
lngua escrita antes do aparecimento dos dicionrios. O dicionrio um
instrumento metalingustico tardio, que veio fazer parceria com a gramtica, no apoio ao ensino e ao uso da lngua. A gramtica surgiu na
antiguidade clssica, na sequncia da reexo lingustica dos lsofos e
sostas gregos e dos llogos helenistas, mas o dicionrio uma arte
moderna, criada para o estudo e uso do latim, no mbito do humanismo
renascentista, e depois desenvolvida, at aos nossos dias, com o apoio da
tcnica tipogrca, no percurso progrediente da generalizao da escrita
por parte das lnguas modernas.
Em todo o caso, os dicionrios latinos, que comearam a ser publicados no nal do sculo XV, no surgiram ex nihilo, foram precedidos
por alguns textos medievais pr-dicionarsticos v.g. Elementarium de
Papias (1050) (cfr. de Angelis 1977-1980 e Shaw 1997) e Catholicon de Balbo (1286) (cfr. Shaw 1997) e sobretudo por uma considervel produo
glossarstica, que facilitava o acesso aos textos latinos e apoiava o ensino
do latim. Desse patrimnio de glossrios medievais, que relativamente abundante para algumas lnguas europeias, guarda-se para o portugus apenas um modesto e delido manuscrito alcobacense, dos sculos
XIII ou XIV, com uma lista alfabtica de verbos latinos (cerca de 3.000)
a que foram acrescentadas as equivalncias portuguesas (1.130 formas
diferentes muitos verbos portugueses so vrias vezes repetidos e utilizados para traduzirem os verbos latinos correspondentes que foram
agenciados de modo mais copioso por uma longa tradio de escrita)2.
Houve provavelmente mais glossrios de latim-portugus, mas so hoje
herana perdida.
A escrita portuguesa desse tempo repercute o esprito pr-dicionarstico da cultura literria medieval, especialmente nos textos dedicados ao
relacionamento jurdico, que retomam as formas latinas e as traduzem
quanto letra e quanto ao sentido (cfr. Jos de Azevedo Ferreira 1980 e
1987, e ainda Miranda Menndez 2004).
Tambm nos textos de Avis so frequentes as transcries de sequncias glossarsticas e os enunciados redundantes, que procuram com insistncia garantir o acesso signicao das palavras. Nestas obras, com
objectivos bem distantes da reexo discursiva, salienta-se a informao
2.

Descrito no Inventrio dos cdices alcobacenses com o n CDIV/286: Pequeno dicionrio de verbos latinos
com a correspondente signicao em portugus. No m algumas notas sobre versicao... letra gtica
cursiva, mida, dos meados do sculo XIV (p. 257); ver Carter (1953). Cfr. Verdelho (1995: 195 e 515).

Lexicografa portuguesa. Perspectiva crtica

87

metalingustica, sobretudo orientada para o esclarecimento lexical e lolgico, e a preocupao de traduzir o latim para linguagem3.
A escrita em linguagem, na Idade Mdia, pela sua insistente redundncia, acusa bem a ausncia dos dicionrios, que a partir do sculo XVI vo
libertar os autores para um certo aligeiramento da intransparncia semntica, para a inovao lexical, e tambm para uma fcil intertextualizao
do latim em citaes eruditas e de ornamento estilstico. Com o advento da
produo lexicogrca, termina tambm a tradio glossarstica. As gramticas latinas, que comearam a ser impressas em grande nmero e distribudas individualmente pelos estudantes, e os pequenos dicionrios escolares,
organizados por grupos temticos de palavras, permitiam a aprendizagem
sistemtica, dos verbos e nomes anmalos e do vocabulrio em geral.
3. Em Portugal a renovao deste horizonte metalingustico foi feita
no mbito duma estreita e continuada vinculao tradio europeia.
A lngua portuguesa, desde o incio da sua memria escrita, recebeu
informao metalexicogrca, proveniente de um convvio interlingustico em que, juntamente com o latim, se ia cultivando uma relao com
os vernculos, particularmente com o espanhol, o provenal, o italiano e
o francs, e sobretudo com a produo lexicogrca latina originada no
espao central da Europa.
A prosa no historiogrca produzida em lngua portuguesa durante
a Idade Mdia retomava e traduzia, geralmente a partir do latim, como
j notmos, textos e fragmentos avulsos de smulas e enciclopdias que
transmitiam o legado do saber europeu, elaborado desde a antiguidade.
Esses textos pr-dicionarsticos continuaram a ser usados depois do sculo
XV, juntamente com os dicionrios humanistas, j impressos, provenientes de Espanha, Itlia e Frana. No esplio acumulado das bibliotecas portuguesas e ainda no mercado do livro antigo, encontram-se exemplares,
no raros, desses monumentos inaugurais da elaborao lexicogrca.
Para alm de testemunhos manuscritos ainda conservados (um fragmento do Catholicon e os cdices alcobacenses das Derivationes de Hugcio e do Elementarium de Papias, este em trs preciosos volumes), temos
3.

Servem-nos de ilustrao estes exemplos do Livro da Montaria: E con este escolhimento representa a outra
virtude a que dizem vontade e, se se acorda con aquillo que o entender boo acorda, entom lhe dizem bom
entendimento porque se ajunta a esta palavra de duas virtudes, de entender e de vontade, a que dizem
mente. Tomando estas duas palavras, entender e mente, vem a fazer aquella concordia daquellas virtudes e
chamam-lhe entendimento (1.1). E porque ha hi huma palavra en latin que comprehende a muytas partes,
demais aos que as obran, que diz assi: Omnis laus in ne canitur, que quer dizer, todo louvor est en n das
cousas quando bem feitas son, ca, das cousas que bem feitas non son, non pode en ellas caber louvor (1.23).

88

Telmo Verdelho

notcia da utilizao de textos impressos, alguns dos quais se encontram


ainda hoje entre o esplio remanescente nas bibliotecas portuguesas. Na
livraria, assaz modesta, da Universidade de Lisboa, por altura da sua transferncia para Coimbra, foi inventariado um vaqabulairo de marmotreto4.
Esto referenciadas tambm algumas edies incunabulares e renascentistas do Catholicon e de textos paralexicogrcos como o enigmtico
Suda ou suidas lexicon graecum, publicado por Demetrios Chalkondyles
(Milo, 1499)5, a Cornucopia de Nicolaus Perottus, a verso latina do Onomasticon de Julius Pollux e vrios outros (Verdelho 1995: 496-499).
Nos primeiros decnios da pedagogia e da cultura humanista em Portugal, foi sobretudo a obra lexicogrca de Nebrija, mais do que todas as
anteriores, que teve curso em Portugal e que tutelou a escolarizao e o
uso literrio do latim. Houve mesmo uma edio do seu conjunto dicionarstico (Nebrija 1545), impressa na Blgica, expressamente destinada
ao pblico portugus (composto pelos dicionrios de latim-castelhano
em que foi integrado um dicionrio de termos de medicina com a colaborao do portugus Lus Nunes, castelhano-latim e um dicionrio
de nomes prprios). Foi ainda o dicionrio de latim-espanhol deste autor
que serviu de matriz para o primeiro dicionrio latim-portugus publicado em 1569 por Jernimo Cardoso. Os dicionrios espanhis devem ter
acompanhado a formao de quase todos os humanistas portugueses e
contriburam para o convvio interlingustico e interliterrio peninsular.
Foram certamente utilizadores de Nebrija os cerca de 1.800 portugueses
que escreveram em castelhano at alguns anos depois de 1640.
Alm dos manuais do humanista espanhol, a produo europeia foi
correspondendo procura lexicogrca portuguesa, mesmo depois do
aparecimento dos primeiros dicionarios portugueses, na segunda metade do sculo XVI. A importao alargou-se aos dicionrios histricos
e de especialidade, que preencheram o espao portugus com bastante
auncia e, poderemos acrescentar, com satisfatrio proveito. Alguns foram mesmo impressos em Portugal, como o dicionrio de nomes prprios
publicado por Stochkammer6; e o dicionrio de vozes eclesiticas de Ximenes Arias (1490-1578?) (Ximenez Arias 1566)7.
4.

Citado em Teixeira de Carvalho (1914: 484). Ver ainda Isaas da Rosa Pereira (1964-1966).

5.

Ed. crtica de Ada Adler (1928-1938).

6.

Propriorum nominum... Trata-se de um texto quase integralmente retomado directa ou indirectamente


do Dictionarium poeticum, geralmente designado Elucidrio, de Hermannus Torrentinus (1450-1520). Foi
integrado no conjunto dicionarstico de Cardoso a partir de 1569 e repetido nas edies seguintes at ao
nal do sculo XVII.

7.

Teve a primeira edio em 1566 em Salamanca e foi duas vezes impresso em Portugal (Braga, 1569 e Lisboa, 1588).

Lexicografa portuguesa. Perspectiva crtica

89

Foram bem conhecidas e muito manuseadas as recolhas lexicais ciceronianas de Mrio Nizolio (1488-1567) e de Pedro Juan Nez de Valencia
(1522-1602), e vrios outros dicionrios literrios, de eptetos e de citaes,
particularmente as obras de Ravsio Textor (1480-1524) (Ofcina, Cornucopia e Epithetorum opus). A obra de Textor, sobretudo a Ofcina, reiteradamente citada em textos portugueses. Heitor Pinto na Imagem da
Vida Crist refere-se-lhe 14 vezes; Barros cita Ravsio no Espelho de Casados (1540); Jorge Ferreira de Vasconcelos recolheu, na obra de Textor, os
nomes das suas personagens e numerosas outras informaes histricas
e mitolgicas; e Cames, muito provavelmente, socorreu-se dos eptetos
recolhidos por Textor, para o provimento de grande parte da alatinada adjectivao que ornamenta a sua obra, alm de outros elementos poticos,
como a designao para o fabuloso e oportuno mito do Adamastor.
Os grandes dicionrios latinos do sculo XVI e XVII, especialmente o
Thesaurus Linguae Latinae de Robert Estienne (1503-1559), o Calepino de
Ambrsio Calepino (1435-1511) e a Amalthea de Giuseppe Laurenzi (1573?1647) tiveram recepo ampla e diuturnamente recorrida entre os humanistas e pedagogos portugueses.
O Thesaurus Linguae Latinae (Estienne 1531), nos seus trs volumes in
folio, foi conhecido e muito utilizado. A sua difuso pode ter sido condicionada pelo facto de Robert Estienne ser um autor damnatus, pela adeso
ao calvinismo; em todo o caso, temos notcia certa de que o Thesaurus circulou com muito desimpedimento e foi citado pelos estudiosos em Portugal, ao longo dos sculos XVI, XVII e XVIII. Conservam-se, nas bibliotecas
portuguesas, vrios exemplares, ainda que alguns se encontrem riscados
e mutilados, pelo mau uso dos leitores ou pelas injrias censrias. Amaro
Reboredo deve ter recolhido no Thesaurus as sries de locues, de listas
coocorrentes e de grupos de signicantes sinonmicos ou analgicos que
alargam inesperadamente um bom nmero de artigos.
O dicionrio de Ambrsio Calepino (1502) foi, entre toda a lexicograa
europeia, a obra que mais se difundiu e utilizou em Portugal, e ainda
hoje o ttulo dicionarstico importado que se encontra com mais abundncia no fundo bibliogrco portugus, pblico e privado, e teve o privilgio de ser levado pelos Missionrios portugueses at ao Japo em 1595
(Verdelho 1999-2000).
No sculo XVII, a Amalthea onomastica de Laurenzi (1640) motivou o
modesto vocabulrio escolar de Frei Toms da Luz (1633-1713) a Amalthea
sive hortus onomasticus (Luz 1673) (cfr. Telmo Verdelho 2006) e serviu de
fonte copiosssima (cerca de 7.300 citaes) para a reviso da Prosdia de
Bento Pereira, levada a cabo em 1697.

90

Telmo Verdelho

A abertura do espao lingustico portugus para o acolhimento da


lexicograa europeia vai alargar-se com a participao de lexicgrafos e
editores estrangeiros como Rafael Bluteau (1638-1734) e de vrios impressores franceses que, a partir da segunda metade do sculo XVIII e durante mais de um sculo, sediados em Portugal e em Frana, estimularam e
sustentaram a publicao da maior parte dos dicionrios portugueses e
suscitaram a interaco dos modelos estrangeiros.
4. A dicionarizao e alfabetao da lngua portuguesa aconteceu relativamente tarde, tendo em conta a cronologia da emergncia lexicogrca em outras lnguas europeias. Em 1562, o italiano, o espanhol, o francs
e o ingls (para citar apenas as grandes lnguas mais prximas) tinham
j, no seu conjunto, vrios ttulos, reproduzidos em muitas dezenas de
edies, em que as nomenclaturas desses vernculos preenchiam as entradas que recebiam a equivalncia do latim.
A originalidade do portugus esteve em comear pelo portuguslatim, supondo um trabalho de agenciamento e inventariao do lxico
sem poder contar com alfabetaes anteriores e sem ter a possibilidade
de recorrer a um dicionrio de latim-portugus, como fonte ampla e privilegiada do fundo lexical. Outras lnguas, como por exemplo o espanhol,
puderam socorrer-se dos respectivos dicionrios de latim-vernculo, fazendo uma espcie de reverso do corpus lexical.
A alfabetao do lxico de uma lngua constitui hoje uma tcnica elementar de execuo fcil, com os recursos da informtica. Mas no foi assim
no incio da dicionarizao das lnguas. As primeiras tentativas confrontavam-se com o nmero, a variedade e a uidez das palavras, e sentiram
certamente muitas diculdades para procederem recolha sistemtica e
identicao de um corpus o mais possvel abrangente, que pudesse corresponder ao propsito de roteirar a lngua, at aos limites de uma tendencial
exaustividade. Por outro lado, as condies materiais da escrita, nos sculos
XV e XVI, no facilitavam a ordenao alfabtica dos elementos acumulados. No havia ainda o recurso da cha lexicogrca (o professor Quemada,
nos seminrios leccionados na cole des Hautes Etudes, em Paris, atribua a
inveno a Diderot (1713-1784)) e a elaborao de um dicionrio exigia uma
repetida reescrita, com reintegrao e reordenao alfabtica de todas as entradas, em sucessivos manuscritos, com a forma de grandes cadernos.
Jernimo Cardoso pode ter contado com a colaborao dos seus discpulos, que eram diligentes e numerosos (e possivelmente tambm com o
apoio das lhas), para compor uma primeira alfabetao da lngua portuguesa e d-la imprensa, oito anos antes da publicao do primeiro dicio-

Lexicografa portuguesa. Perspectiva crtica

91

nrio de latim-portugus, que ele prprio tambm preparou, certamente


com a ajuda dos mesmos colaboradores.
De modo diferente, a primeira alfabetao sistemtica do espanhol foi
publicada por Nebrija, alguns anos depois de ter composto e publicado o
Lexicon hoc est dictionarium ex sermone latino in hispaniense (Nebrija 1492),
e muito provvel que tenha aproveitado o corpus vernculo desta obra
para preencher as entradas do Dictionarium ex hispaniense in latinum sermonem (Nebrija 1495?). Tambm para o francs, segundo o estema gentico
proposto por Wooldridge (1977: 18), teramos, nas origens da sua lexicograa,
a seguinte linhagem de dicionrios: Latinae linguae thesaurus (1531-36)
Dictionarium latinogallicum (1538) Dictionaire franois-latin (1539).
A nomenclatura do Dictionarium ex Lusitanico in Latinum Sermonem
(Cardoso 1562-1563), continuou, depois da sua primeira publicao, a ser
objecto de pesquisa e de recolha, com o mesmo esprito de agenciamento em relao a um vocabulrio difuso, e foi desse modo alargada com
mais 728 novas entradas na 2 edio em 1569-1570, perfazendo no seu
todo 12.787 lemas. Muitas destas palavras no se encontram no conjunto
dos restantes dicionarios (de latim-portugus) de Jernimo Cardoso, conrmando assim uma elaborao original e sem recurso a um processo de
reverso sobre os dicionrios de latim-portugus.
O vocabulrio coligido por Cardoso tornou-se uma referncia instituidora, uma espcie de matriz alfabtica, retomada e continuada na tradio lexicogrca da lngua portuguesa.
Foi essa nomenclatura que serviu de base para um primeiro encontro interlingustico entre a Europa e a China, num Dicionrio PortugusChins, redigido pelos missionrios jesutas (com destaque para o Padre
Matteo Ricci, S.J., 1552-1610) aproximadamente entre 1583 e 1588 e transmitido manuscrito at aos nossos dias.
5. Este dicionrio de portugus-chins faz parte de um conjunto bastante amplo de estudos e ensaios lingusticos, realizados no quadro dos
descobrimentos e da expanso ultramarina portugueses, motivados sobretudo pelo desejo de comunicar a mensagem crist.
Sob a urgncia do impulso missionrio foram elaborados vocabularios, e artes de mo... congurados pelos modelos dos manuais escolares
humanistas e emparceirando frequentemente o latim, pela primeira vez,
com as lnguas exticas.
Ao lado da motivao apostlica, surgiram tambm textos menores,
de tipo paralexicogrco, suscitados pelas necessidades do imprio, pelo
relacionamento pessoal e comercial e pelo interesse cientco. O exem-

92

Telmo Verdelho

plo mais interessante ser o pequeno glossrio (138 termos) conservado


em anexo do manuscrito do Roteiro de Alvaro Velho na primeira viagem
de Vasco da Gama (1497)8. De muito interesse histrico e cientco so as
recolhas de designaes botnicas e de drogas farmacuticas, como as
que se encontram na Suma Oriental de Tom Pires (1465?-1540?) (Corteso
1978) e na obra de Garcia da Orta (1501-1568), Colquio dos simples e drogas
e coisas medicinais da ndia, impresso em Goa em 1563 e difundido em
verses latinas por toda a Europa (Orta 1563).
No que respeita ao Brasil, embora com menos proximidade em relao aos modelos lexicogrcos, conhecem-se hoje vrios ttulos que do
testemunho do confronto com as palavras das lnguas indgenas. Bluteau
transcreve, em muitas centenas de citaes, nomes braslicos recolhidos
especialmente nas obras do jesuta Simo de Vasconcelos (1597-1671) e de
Francisco de Britto Freire (1623-1692).
Os vocabulrios coligidos no mbito da aculturao missionria, destinados a superar o detrimento da lngua no apoio actividade escolar
e catequtica, so obras de um raro interesse lexicogrco, lingustico e
etnocultural. Do testemunho de uma aguda sensibilidade perante a expresso vria da comunicao verbal, e mobilizam uma formao metalingustica iluminada pela tradio terica gramatical e lolgica grecolatina. Ilucidativo a este propsito o texto de Joo de Lucena, quando
relata a iniciativa de So Francisco Xavier que estimula e orienta os confrades para o estudo da lngua malabar:
Desejando habilitar ainda nesta parte os instrumentos da diuina palaura, quanto fosse possivel, ordenou ao padre Francisco Anriquez, a que sentio mais aplicaam, & talento reduzisse a arte, a lingoa
Malabar, como anda a latina, com suas declinaes de nomes, & pronomes, conjugaes de verbos,
generos, preteritos, & todas as mais regras de grammatica [...]. O padre Francisco Anriquez aprendeo
em menos de seis meses a fallar, & a ler, & escreuer as proprias letras & caracteres da terra, & em breue
tempo sahio com a arte, & vocabulario da lingoa com espanto dos naturais (Lucena 1600: 367)9.

A necessidade de vocabulrios no apoio missionao vem igualmente documentada no Prologo do Vocabulario da lingoa de Iapam; nele se
declara que ja ha annos auia alguns Vocabularios, & Artes de mo (Rodrigues Tuzu et al. 1603-1604).
Na sua maior parte, esses vocabulrios eram transmitidos de forma
manuscrita porque no havia meios, nem teriam qualidade suciente8.

Foi objecto de vrias edies; cfr. Marques (1999). Ver ainda Messner (1998) e Losada Soler (2006).

9.

Barbosa Machado (1741-1758: II, 449-450) atribui a autoria da arte de gramtica da lngua malabar e deste
vocabulrio ao P. Henrique Henriques (c. 1520-1600), que partiu para a ndia em 1546 e teria pronto o Vocabulrio em 1550.

Lexicografa portuguesa. Perspectiva crtica

93

mente revista para acederem publicao impressa. Temos notcia de


que um dos autores de Vocabulrios da lngua japonesa (os Jesutas chegaram ao Japo em 1549) foi o P. Duarte da Silva, que ali faleceu em 1564.
A intercomunicao com as lnguas no europeias tem suscitado ultimamente algum interesse entre os estudiosos da cultura e da historiograa lingustica, mas no temos ainda informao suciente para fundamentar um levantamento sistemtico do encontro do portugus com
o universo das lnguas exticas descobertas.
Pode fazer-se uma ideia aproximada dessa produo retomando as
informaes coligidas por David Lopes (1867-1942), (com as anotaes de
Lus de Matos (1911-1995) na 2 edio) (Lopes 1936) e por Maria Leonor
Buescu (1983). Merecem oportuna lembrana os nomes duma boa dzia
de lexicgrafos, entre os Authores que escrevero em linguas Ultramarinas, citados na Biblioteca Lusitana de Barbosa Machado (1741-1758):

lvaro Semedo (1585-1658), lingua chinense (I, 114)


Antnio Barbosa (1 metade do sc. XVII), anamitica (I, 215)
Boaventura de Santo Antnio ( 1697), brasilica (IV, 80)
Diogo Ribeiro ( 1633), canarina (I, 691)
Duarte da Silva ( 1564), japonica (I, 745)
Francisco de Pina (1588-1625), anamitica (II, 221)
Gaspar do Amaral ( 1645), anamitica (II, 332)
Gaspar Ferreira (1574-1649), chinense (II, 351)
Henrique Henriques (1520-1600), malabarica (II, 450)
Manuel Dias (1574-1659), chinense (III, 246-247) (?)
Manuel Ferreira (1630-c. 1699), anamitica (III, 265)
Miguel de Almeida (c. 1604-1683), canarina (III, 462).

Tambm se encontram alguns nomes na obra do Pe. Francisco Rodrigues (1917):

Anto de Proena ( 1666), tamlico-portugus (publ. 1679) (346)


Antnio Saldanha (1598-1663), concan (353)
Gaspar Lus (1 metade do sc. XVII), anamita (360)
Joo Fernandes ( 1567), japons (371)
Joo Rodrigues ( 1633), japons (370)
Manuel Barreto ( 1620), japons (374)
Manuel Viegas ( 1608), lngua dos maramomis (381)
Miguel de Almeida ( 1681), concan (354).

94

Telmo Verdelho

Esta lexicograa das origens teve uma renovada emergncia, a partir


do nal do sculo XIX, especialmente em relao a algumas lnguas africanas. Trata-se todavia de uma produo de modestas propores que mal
se pode comparar com as dimenses, a importncia e a originalidade do
patrimnio antigo. Entre os textos mais remotos que chegaram at ns,
salientam-se, com justo relevo, os j citados Dicionrio Portugus-Chins e
o Vocabulario da lingoa de Iapam (Rodrigues Tuzu et al. 1603-1604), e alm
destes, o Dictionarivm latino lvsitanicvm, ac iaponicvm ex Ambrosii Calepini
(1595), o Vocabulario da lingoa canarina (Diogo Ribeiro? 1626), o Diccionario
Portuguez e Brasiliano e Brasiliano-Portuguez (1795/1934)10, os dicionrios
da Lingua Bunda ou Angolense e da Lingua Congueza do missionrio capuchinho italiano Bernardo Maria de Cannecatim (1804 e 1805).
A interlexicograa portuguesa com lnguas orientais teve ainda uma
interessante realizao na obra do oratoriano Jcome Gonalves (16761742), natural de Divar (Goa). Segundo o testemunho de Barbosa Machado
(1966: II, 472-474), o padre oratoriano compilou um conjunto de dicionrios: Vocabulrio cingals-lusitano (1730), Vocabulrio lusitano-cingals,
Vocabulrio lusitano, tamul e cingals. Deste ltimo conhecem-se cpias
manuscritas feitas pelo oratoriano Eusbio do Rosrio em 1772 (cfr. Edmund Peiris 1943).
A herana interlexicogrca do portugus com as lnguas no europeias um testemunho primordial na histria da dicionarstica moderna
que distingue a lngua portuguesa, no panorama da lexicograa interlingustica. Trata-se de uma importante comunicao transeuropeia que
levou ao novo mundo da Amrica, Africa e ao Oriente remoto, o alfabeto latino e uma cincia metalingustica acumulada e exercitada desde a
antiguidade clssica. Para a histria da lngua portuguesa constitui uma
preciosa fonte de informao porque documenta o confronto do vocabulrio portugus com outros sistemas lingusticos que do o nome a civilizaes distantes, que organizam o mosaico semntico do mundo de
modo muito diferente do universo lexical europeu.
6. Os dicionrios elaborados nas terras de misso so o resultado de
uma competncia lexicogrca adquirida e parcialmente exercitada na
tradio europeia e na experincia escolar. A lexicograa transeuropeia
com participao portuguesa foi, na sua maior parte, promovida pelos
padres da Companhia de Jesus, que ocuparam tambm um lugar muito destacado na histria da lexicograa verncula portuguesa, especial10. tila Almeida (1988: 285) atribui este dicionrio a Jos Mariano da Conceio Veloso A.A.

Lexicografa portuguesa. Perspectiva crtica

95

mente no mbito da lexicograa escolar, publicada at sua compulsiva


extradio em 1759.
Deixaram-nos uma produo vultosa e amplamente difundida, dedicada ao latim e ao portugus, orientada para o apoio aos mestres e para
a habilitao literria dos discpulos portugueses, que estudavam o latim
e a arte oratria nos colgios da Companhia e em outras instituies de
ensino.
O nome que mais avulta entre os autores desta lexicograa latino portuguesa o de Bento Pereira (1605-1681) que foi um operoso pedagogo,
llogo e dicionarista, mas mais autores podem ser referenciados: Fernando Pires (c. 1530-1597), Antnio Velez (1545-1609), Manuel de Gouveia,
Manuel Barreto (1561-1620), Matias de S. Germano, Antnio Franco (16621732), Manuel de Azevedo (1713-1796), Jos Caeiro, e outros mais que caram no anonimato de um trabalho de colaborao. A feitura de vocabulrios era uma actividade propcia ao trabalho participado, e os Jesutas
tinham um enquadramento pedaggico favorvel, valorizavam o contributo dos alunos, criavam espaos funcionais, suscitavam a intercomunicao, validavam os manuais na exercitao escolar e podiam garantir o
seu sucesso editorial.
A simples observao dos ttulos produzidos e publicados entre 1599 e
1754 deixa transparecer a abrangncia e a importncia desta lexicograa
que se conserva ainda hoje como um patrimnio de referncia para a histria da lngua e da cultura portuguesas.
Principais ttulos da lexicograa latino-portuguesa elaborada pelos
Jesutas:
1.

Antnio Velez (1599?): Index totius artis (Emmanuelis Aluari e Societate Iesu De institutione grammatica libri tres). vora.
2. Manuel Barreto (1607): Vocabulario Lusitanico Latino composto na
Provincia de Japo. 3 vols. manuscritos (Academia das Cincias de
Lisboa).
3.1. Bento Pereira (1634): Prosodia in Vocabularium Trilingue, Latinum,
Lusitanicum, & Hispanicum digesta, in qua dictionum signicatio, et
sylabarum quantitas expenditur. vora [reeds. em Lisboa, 1653; Lisboa,
1661; Lisboa, 1669; Lisboa, 1674; Lisboa, 1683 (cfr. infra Pereira 1697)].
4.1. Bento Pereira (1647): Thesouro da Lingoa Portuguesa. Lisboa. Publicado sempre juntamente com a Prosodia a partir de 1661.
5.1. Bento Pereira (1655): Florilegio dos modos de fallar, e adagios da
lingoa portuguesa: dividido em duas partes, em a primeira das
quaes se poem pella ordem do Alphabeto as Frases Portuguesas, a

96

Telmo Verdelho

que correspondem as mais puras, & elegantes Latinas: na segunda


se poem os principaes adagios Portugueses, com seu Latim proverbial correspondente. Pera se ajuntar a Prosodia, & Thesouro Portugues, como appendiz, ou complemento. Lisboa. Publicado sempre
juntamente com a Prosodia e o Thesouro a partir de 1661.
3.2. Prosodia in vocabularium bilingue, Latinum, et Lusitanum digesta...
4.2. Thesouro da lingua portugueza.
5.2. Primeira parte das frases portuguezas, a que correspondem as mais
puras, & elegantes latinas como tiradas de Marco Tullio, & outros
authores de primeira classe.
5.3. Segunda parte dos principaes adagios portuguezes, com seu latim
proverbial corespondente.
5.4. Bento Pereira (1697): Tertia pars selectissimarum descriptionum, quas
idem auctor vel olim se compositas, vel probatissimis scriptoribus
emendicatas alphabetico ordine digessit. Ubi quae sine ullo auctore
proponuntur, auctor ipse Florilegii composuit, reliquas collegit. vora [reed. em vora, 1710; vora, 1723; vora, 1732; vora, 1741; vora,
1750].
6. Antnio Franco (1716): Indiculo universal: contm distinctos em
suas classes os nomes de quasi todas as couzas que ha no mundo.
vora [reed. em 1754, 1804].
7. Francisco Pomey / Manuel de Azevedo (1736): Pomarium latinitatis elegantiori consitum cultu, longeque paritiori descriptum
manu in quo locutiones synonymae bene multae...editio postrema
ac nova lusitano ordine translata. Coimbra.
Neste elenco bibliogrco, o Index totius artis, o Indiculo universal e
o Pomarium latinitatis so textos especcamente escolares. O primeiro
teve um percurso regular e assduo no espao escolar portugus, porque
foi sempre publicado como anexo da gramtica latina de Manuel lvares.
Na ltima edio (vora, 1755), compunha-se de 300 pginas 8, e oferecia
cerca de 3.600 entradas latinas, s quais correspondia um corpus lexical
portugus bastante mais amplo.
O Indiculo Universal servia como vocabulrio enciclopdico, organizado pelo universo de saber escolarizado naquele tempo. Prolongava a tradio do Onomasticon de Julius Pollux, que valorizava a memorizao do
vocabulrio como instrumento do conhecimento erudito. Foi composto
sem qualquer preocupao com a ordem alfabtica. A verso portuguesa,
bastante diferenciada do original francs, foi coordenada pelo P. Antnio
Franco com uma apreciada e motivada colaborao dos alunos.

Lexicografa portuguesa. Perspectiva crtica

97

O Pomarium Latinitatis deve ter surgido quase exclusivamente como


uma exercitao escolar orientada para a escrita latina e particularmente
para a elaborao literria. Foi um ttulo com escassa recepo.
Os textos mais importantes encontram-se no conjunto dicionarstico
composto pela Prosdia, pelo Tesouro da lingua portuguesa e pelo Florilgio, geralmente referenciado unicamente pelo ttulo Prosodia. Este conjunto congurava um grande volume in-folio, com cerca de 1.400 pginas, impressas em tipo mido, e deveria ser entre os livros indispensveis
e de uso frequente aquele que mais avultava nas estantes das escolas. Foi
reeditado mais de uma dezena de vezes, preencheu, aproximadamente
durante uma sesquicentria, o espao editorial, e serviu aos mestres, aos
estudantes e aos estudiosos e letrados como principal apoio e instrumento de referncia para a intercomunicao latina e para a leitura e a escrita
em latim e em portugus.
A Prosodia (entenda-se todo o manual) ocupou de maneira predominante um perodo instituidor da histria da lexicograa, tornou-se um
ttulo quotidiano, quase popular, no panorama escolar e cultural dos sculos XVII e XVIII, e inuenciou, como nenhum outro dicionrio, o percurso diacrnico da lngua portuguesa.
Os manuais escolares dos Jesutas incluindo os dicionrios, foram severamente proibidos e mandados queimar pelo Marqus de Pombal (Verdelho 1982). Todavia, a inuncia e a repercusso desta lexicograa no
se extinguiu com a proibio e com a expulso dos Jesutas. A obra de
Bento Pereira, especialmente o Tesouro, no que respeita nomenclatura
portuguesa, foi quase integralmente retomado por Bluteau e, por esta via,
entrou na tradio lexicogrca subsequente. Por sua vez, a Prosodia, com
a reviso e as correces que lhe foram acrescentadas ainda pelos Jesutas, foi continuada no Magnum Lexicon (que teve publicao autorizada
apenas depois de terminado o consulado pombalino) pelo franciscano
Manuel de Pina Cabral (1746-c. 1810) (Cabral 1780).
A nomenclatura do Tesouro foi integralmente retomada num dicionrio de portugus-ingls publicado em Londres em 1701 (A. J. 1701), e num
dicionrio de portugus-amengo, publicado em Amsterdam em 1714
(Alewyn / Coll 1714).
7. A lexicograa escolar dos Jesutas era sobretudo latino-portuguesa.
Repercutiu-se certamente com muita inuncia na histria da lngua,
mas o seu objectivo principal no era a dicionarizao do portugus. Neste mbito, o Tesouro de Bento Pereira coligiu e inventariou um vocabulrio muito amplo e, nos textos introdutrios da primeira edio (elididos

98

Telmo Verdelho

nas seguintes), acrescenta mesmo um primeiro elenco de autores portugueses procurados e valorizados como fontes de referncia para o registo
e testemunho do bom uso das palavras do vernculo, mas as entradas
desse dicionrio de portugus-latim, para alm das equivalncias latinas,
no tm enquadramento de glosas, com denio ou contextuao e explicao semntica em portugus.
O primeiro tratamento lexicogrco da lngua portuguesa foi elaborado por Rafael Bluteau, no Vocabulario Portuguez e Latino, publicado em
oito volumes in folio, com mais dois outros de suplemento, entre 1712
e 1728 (Bluteau 1712-1728). Trata-se de uma realizao monumental, no
tanto pela sua dimenso, pela feitura tipogrca, pela encadernao e
pelo cuidado tratamento biblioflico (que so, em todo o caso, notveis),
mas sobretudo pela abundncia dicionarstica, pela memria da lngua
acumulada, pela erudio enciclopdica (englobando os saberes modernos e a sabedoria antiga) e, nalmente, tambm pelos seus mritos literrios.
Rafael Bluteau foi um padre teatino cosmopolita e poliglota, que nasceu de uma famlia francesa, em Londres, onde aprendeu o ingls e o francs; estudou depois em Itlia (doutorou-se em Roma), e aos 30 anos, ao
servio da religio, veio para Lisboa, onde se familiarizou rapidamente
com o portugus, comeando desde logo a us-lo na oratria e na escrita.
Interessou-se pelo estudo do vernculo e preocupou-se com a normalizao lexical e ortogrca. Confrontando-se com a modstia dos recursos
dicionarsticos empreendeu, com grande generosidade e com sentido de
servio a elaborao desse magnum opus que to faustosamente haveria de avultar na histria da lexicograa portuguesa.
Os paratextos introdutrios e posfaciais, a informao bibliogrca e
o conjunto de vocabulrios especiais coligidos no suplemento fazem da
obra de Bluteau uma importante referncia da reexo lexicogrca e
metalingustica na histria da lngua portuguesa11.
Em anexo ao tomo VIII do Vocabulario encontra-se um Diccionario castelhano y portuguez de 189 pginas, magno in quarto, com cerca de 22.000
entradas, registando a equivalncia portuguesa apenas quando no h coincidncia ou semelhana lexical entre as duas lnguas (cerca de 11.000 formas contrastantes). Este dicionrio precedido por um vocabulrio bsico
de portugus-castelhano com cerca de 1.200 entradas (Salas Quesada 2003).
11. Nas Prosas portuguesas Bluteau retomou a reexo sobre a norma lingustica Decisoens Academicas de
Palavras Portuguezas (Bluteau 1714-1728: I, 1) e sobre a ortograa, especialmente na Prosa grammatonomica (Bluteau 1714-1728: II, 186).

Lexicografa portuguesa. Perspectiva crtica

99

O Vocabulrio foi modelado pelo ideal de dicionrio autorizado e locupletssimo, procurou coligir toda a memria lexical disponvel, incluindo as variedades regionais, diacrnicas e as terminologias do universo
tcnico e erudito, com seleccionada excluso no que respeita aos nomes
prprios da geograa e da histria. Acumulou um corpus lexical considervel para a poca, muito superior aos registos at ento efectuados e,
sobretudo textualizou, pela primeira vez, de modo sistemtico, em cerca de 36.000 entradas, a interpretao e as denies das palavras portuguesas, tornando-se uma fonte imprescindvel para toda a lexicograa subsequente. Os artigos lexicogrcos de Bluteau desprendem-se do
constrangimento dicionarstico e aproximam-se da exercitao literria,
oferecendo-se, ainda hoje, como um exemplo de leitura aprazvel do patrimnio clssico.
Jos Caetano (1690-post 1757) elaborou um Complemento do Vocabulario portuguez de Bluteau, aproveitando ainda alguns apontamentos
deixados pelo autor, que comeou a ser impresso justamente antes do
terramoto de Lisboa de 1755. A destruio e o incndio que se seguiram
provocaram o seu total desaparecimento. Sorte diferente, menos aniquiladora, sofreu a compilao efectuada pelo P. Carlos Folqman (1704-?). O
seu Diccionario Portuguez e Latino, no qual as dices e phrases da lingua
portugueza [] se acham clara e distinctamente vertidas na latina, e authorisadas com exemplos dos auctores classicos. [] Compilado do Vocabulario do Reverendo Padre D. Rafael Bluteau (Folqman 1755), publicado
imediatamente antes do terramoto, foi igualmente destrudo pelo fogo,
mas resgataram-se alguns exemplares que nos servem para confronto e
que nos permitem apreciar a recepo e o percurso de evoluo e de actualidade do Vocabulrio12.
A mais importante sequncia do Vocabulrio de Bluteau foi empreendida por Antnio de Morais Silva, acima citado, que o transformou no
primeiro dicionrio moderno e funcional da lngua portuguesa. A partir
de 1789, todos os dicionrios monolingues do portugus participaram no
processo de herana e de actualizao desse monumento instituidor da
lexicograa portuguesa. Recentemente foi retomado no projecto do Corpus Lexicogrco do Portugus, da Universidade de Aveiro, e foi objecto
de uma tese de doutoramento (Silvestre 2004).
O texto integral do Vocabulrio encontra-se j disponvel em memria digital, transcrito em modo texto, e est em preparao uma edio
12. O dicionrio de Folqman e as origens da lexicograa monolingue do portugus: edio e estudo o ttulo do
projecto de doutoramento de Paula Cristina Barbosa Arajo (bolseira da FCT, na Universidade de Aveiro).

100

Telmo Verdelho

com registo e manuteno da informao original, e com reviso e uma


prtese de remisses que permitem a redicionarizao ortogrca da nomenclatura e a integrao do suplemento.
8. A segunda metade do sculo XVIII foi um perodo ureo da lexicograa portuguesa. Nele se deu incio a uma dicionarstica moderna, bilingue e monolingue, inovadora, original e s vezes tambm com alguma
excntrica erudio, prxima do jocoso e do recreativo (Ramalho Ortigo 1945: II, 251 ss.). Entre 1750, data da ltima edio da Prosodia de Bento
Pereira, e 1806, ano em que foi publicado o primeiro dicionrio prtico monolingue do portugus, foram feitas, contando com as reimpresses de
vrios ttulos, cerca de uma centena de publicaes de tipo dicionarstico;
entre elas salientam-se algumas das mais teis e perdurveis elaboraes
lexicogrcas portuguesas.
A cronologia desses ttulos bem esclarecedora:
1750

Bento Pereira (1605-1681) / Matias de S. Germano (1667-1699): Prosodia in vocabularium


bilingue, Latinum, et Lusitanum digesta. Eborae: ex Typographia Academiae.

1754

[Francisco Pomey / Antonio Franco (1662-1732)]: Indiculo universal: contm distinctos em


suas classes os nomes de quasi todas as couzas que ha no mundo. Evora: Off. da Universidade.
Antnio Pereira de Figueiredo (1725-1797): Coleco de palavras familiares assim portugusas
como latinas. Lisboa: Miguel Rodrigues [vrias reeds.].

1755

Carlos Folqman: Diccionario Portuguez, e Latino [...], Compilado do Vocabulario do Reverendo


Padre D. Rafael Bluteau. Lisboa: Miguel Manescal da Costa.

1758-64

Jos Marques: Nouveau dictionnaire des langues franoise et portugaise: Novo diccionario das linguas portugueza e franceza. 2 vols. Lisboa: Imp. de Jos da Costa Coimbra / Of. Patr. de
Francisco Luiz Ameno.

1760

Antnio Pereira de Figueiredo (1725-1797): Breve diccionario da latinidade pura e impura, com
a significao portugueza. Lisboa: Of. Patr. de Francisco Luiz Ameno.

1762

Carlos Folqman: Nomenclatura portugueza, e latina [...] com hum pequeno vocabulario de verbos
portuguezes. Lisboa: Miguel Rodrigues.
Pedro Jos da Fonseca (1737-1816): Parvum lexicon latinum Lusitana interpretatione adjunta.
Lisboa: Miguel Manescal da Costa [vrias reeds.].

1764

Jos Marques: Novo Diccionario das lnguas portugueza, e franceza. Lisboa: Of. Patr. de Francisco Luiz Ameno.

Lexicografa portuguesa. Perspectiva crtica

101

Bartolomeu Alvares da Silva: Colleco de palavras familiares portuguezas, francezas, latinas e


britanicas. Coimbra: Na Real Officina da Universidade.
1765

Jos Monteiro de Carvalho: Diccionario Portuguez das plantas, arbustos, matas, arvores, animaes
quadrupedes, e reptis, aves, peixes, mariscos, insectos, gomas, metaes, pedras, terras, mineraes &.
Lisboa: Officina de Miguel Manescal da Costa.
Francisco Jos Freire (Cndido Lusitano) (1719-1773): Diccionario poetico. Lisboa: Na Of.
Patr. de Francisco Luiz Ameno [reeds. em 1794, 1820].

1766

Diccionario abbreviado da Bblia traduzido do francez. Lisboa: Antonio Rodrigues Galhardo,


17942.

1767

Fr. Luis do Monte Carmelo (1715-1785): Compndio de orthografia, com sufficientes catalogos.
Lisboa: Antonio Rodrigues Galhardo.

1771

Pedro Jos da Fonseca (1737?-1816): Diccionario portuguez, e latino. Lisboa: Regia Officina
Typografica [vrias reeds.].

1773

Antonio Vieira Transtagano: A Dictionary of the Portuguese and English Languages, in two
parts. Londres: J. Nourse [vrias reeds.].

1773-74

Joaquim Jos da Costa e S (1740-1803): Diccionario italiano e portuguez. 2 vols. Lisboa:


Rgia Oficina Tipogrfica.

1775-76?

Jos Marques: Nouveau Dictionnaire des langues franoise et portugaise. Lisboa: Imp. Royale [3 ed.].

1778

Miguel Tibrio Pedegache Brando Ivo (1730?-1794): Novo Diccionario francez e portuguez.
Lisboa [4. ed. Falta notcia das eds. anteriores; teve depois vrias reeds.].

1779

Vicente de Bastos Teixeira: Dictionnaire moderne franois expliqu en portugais Tome premier.
Lisbonne: Imp. Louisiane [1 vol. at lettra C].
Pierre Chompr / Pedro Jos da Fonseca (1737-1816) (trad.): Diccionario abbreviado da
fabula. Lisboa: Na Regia Officina Typografica [vrias reeds.].

1780

Manuel de Pina Cabral: Magnum lexicon latinum et lusitanum. Olysipone: Typii Regiae Officinae [vrias reeds.].
Antnio Jos Teixeira (?) (trad.): Noticia da mythologia. Lisboa: Na Typ. Rollandiana [reed.
em 1803].

1781

[Francisco Lus Ameno (1713-1793)]: Diccionrio exegtico. Lisboa: Of.. Patr. de Francisco
de Luiz Ameno.
Joo de Moraes Madureyra Feyj (1688-1741): Orthographia, ou arte de escrever, e pronunciar
com acerto a lingua portugueza. Lisboa: Na Regia Officina Typografica [3 impr.].

102

Telmo Verdelho

1783

Bernardo de Lima e Melo Bacelar: Diccionario da lingua portugueza... Lisboa: Of. de Joz
de Aquino Bulhoens.

1784

Bernardo de Lima e Melo Bacelar: Arte, e diccionario do commercio, e economa portugueza.


Lisboa: Of. de Domingos Gonsalves.
Miguel do Couto Guerreiro (c. 1720-1793): Tratado da versificaa portugueza [...]. Diccionario de Consoantes. Lisboa: Na Of. Patr. de Francisco Luiz Ameno.
Lus lvares Pinto: Diccionario pueril para uso dos meninos. Lisboa: Of. Patr. de Francisco
Luiz Ameno.

1784-86

Manuel de Sousa / Joaquim Jos da Costa e S (1740-1803): Nouveau dictionnaire FranoisPortugais. 2 vols. Lisboa: Simo Thaddeo Ferreira.

1785

Fr. Francisco de Jesus Maria Sarmento (?): Thesouro biblico ou diccionario historico, e etymologico dos nomes proprios. Lisboa: Na Of. de Simo Thaddeo Ferreira.

1788

Pedro de Mariz de Sousa Sarmento: Elementos de construco e diccionario francez e portuguez


de todas as pessas de... navios... Lisboa: Of. Patr. de Francisco Luiz Ameno.
Domingos Vandelli: Diccionario dos termos technicos de Historia Natural extrahidos das obras de
Linno. Coimbra: Real Officina da Universidade.

1789

Pedro de Mariz de Sousa Sarmento: Preceitos de construco de navios e da sua mastrio e


nomenclatura portugueza dos termos technicos da mastrio e diccionario delles em francez e portuguez.
Lisboa: Of. de Antnio Rodrigues Galhardo.
Antnio de Morais Silva (1755-1824): Diccionario da lingua portugueza composto pelo padre
D. Rafael Bluteau; reformado e accrescentado por.... Lisboa: Of. de Simo Thaddeo Ferreira
[reeds. em 1813, 1823, 1831, 1844, 1858, 1877-78, 1889, 1891, 1922, 1949-1959].
Joo de Sousa (1730?-1812): Vestigios da lingua arabica em Portugal, ou lexicon etymologico das
palavras, e nomes portuguezes, que tem origem arabica. Lisboa: Academia Real das Sciencias
[reeds. em 1830, 1981].

1790

Manuel Rodrigues Maia: Diccionrio das elypses, que mais frequentemente se encontram nos auctores clssicos: interpretadas. Lisboa: Of. de Antnio Gomes.

1793

[Academia das Cincias]: Diccionario da lingoa portugueza publicado pela Academia Real
das Sciencias de Lisboa. Lisboa: Officina da mesma Academia.
Diccionario universal das moedas: assim metallicas, como ficticias, imaginarias, ou de conta, e das de
fructos, conchas, &c. que se conhecem na Europa, Asia, Africa, e Amrica. A que se ajunta huma
noticia das Moedas dos Judeos, Gregos, e Romanos; e dois Mappas dos pzos das principaes Cidades de
Commercio; das Medidas dextenso reduzidas a palmos, covados, e varas; e das de capacidade, assim
para secos como para molhados. Recopilado por***. Lisboa: Of. de Simo Thaddeo Ferreira.

Lexicografa portuguesa. Perspectiva crtica

1794

103

Joaquim Jos da Costa e S (1740-1803): Diccionario portuguez-francez-e-latino. 2 vols. Lisboa: Na Officina de Simo Thaddeo Ferreira.
Antonio Vieira Transtagano: A Dictionary of the Portuguese and English. Diccionario abbreviado da Bblia traduzido do francez Lisboa: Typ. Rollandiana [2 ed.].
Joaquim do Rosrio: Compendio do Diccionario dos Casos de Consciencia de Pontas. 8 vols.
Lisboa: Simo Thaddeo Ferreira.

1795

Diccionario portuguez e brasiliano. Lisboa: Oficina Patriarcal.

1798-99

Frei Joaquim de Santa Rosa de Viterbo (1744-1822): Elucidario das palavras, termos, e frases,
que em Portugal antigamente se usro e que hoje regularmente se ignoram.... 2 vols. Lisboa: Of. de
Simo Thaddeo Ferreira [reeds. em 1865, 1966].

1804

Fr. Joo de Deus (1732-179?): Diccionario historico, juridico, e theologico. Porto: Typ. de Antonio Alvarez Ribeiro.
Fr. Bernardo Maria da Cannecattim: Diccionario da lingua bunda ou angolense, explicada na
portugueza, e latina composto por... Lisboa: Impresso Regia.

1804-06

Francisco Soares Franco (1772-1844): Diccionario de agricultura. 5 vols. Coimbra: Real


Imprensa da Universidade.

1805

Fr. Bernardo Maria da Cannecattim: Colleco de observaes grammaticaes sobre a lingua bunda
ou angolense, a que se ajunta dicionario abreviado da lngua conguesa. Lisboa: Imp. Regia.

1806

Novo diccionario da lingua portugueza. Lisboa: Typ. Rollandiana.

Nesta sequncia de ttulos avultam cinco aspectos essenciais que haveriam de caracterizar de maneira estruturante a histria dos dicionrios
portugueses ao longo dos ltimos dois sculos:
(a) a renovao da lexicograa latino-portuguesa (Folqman 1755,
Figueiredo 1754 e 1760, Fonseca 1762 e 1771, Pina Cabral 1780);
(b) a emergncia da interlexicograa do portugus com as lnguas
europeias (francs: Marques 1758 e 1764, Silva 1764, Ivo 17784,
Sousa / S 1784-86, Teixeira 1779, S 1794; italiano: S 1773-74;
ingls: Vieira Transtagano 1773);
(c) o despontar de dicionrios especializados em domnios cientcos e tcnicos, sobre a economia, o comrcio, as cincias naturais, a agricultura, as cincias jurdicas e a teologia (Carvalho
1765, Bacelar 1784, Francisco Sarmento 1785, Pedro Sarmento

104

Telmo Verdelho

1788-89, Vandelli 1788, Diccionario universal das moedas 1793,


Joo de Deus 1804);
(d) a criao da lexicograa monolingue do portugus com dicionrios gerais e prticos (Bacelar 1783, Morais Silva 1789, Academia das Cincias 1793, Novo diccionario 1806);
(e) o aparecimento de uma lexicograa de especializao metalingustica, com relevo para a ortograa (Feij 17813, Carmelo
1767), a histria da lngua (Frei Joo de Sousa 1789, Viterbo 179899) e a escrita literria (Cndido Lusitano 1765, Francisco Lus
Ameno 1781, Couto Guerreiro 1784).
A elaborao dicionarstica pluralizou-se e desenvolveu domnios de produo relativamente autnomos, de acordo com estes vectores de referncia. Para a lexicograa portuguesa poderemos considerar muito relevante e
instituidora a experincia deste perodo, no que respeita particularmente
tradio interlingustica e ao patrimnio lexicogrco monolingue.
O convvio com as lnguas europeias vai intensicar-se e marcar uma
nova sociedade escolarizada e cada vez mais interdependente do espao
cultural e econmico europeu, com predomnio do relacionamento com
a Frana e o Reino Unido. Esta relao interlingustica sustentou e promoveu os dicionrios bilingues, suscitando uma produo cada vez mais
abundante e, nem sempre, mais qualicada. No deixou tambm de
ter alguma repercusso nos dicionrios monolingues, em todo o caso, a
lexicograa da lngua portuguesa, mesmo quando, composta em Frana
e sob a inuncia dos modelos estrangeiros, nunca se desprendeu da ligao matricial ao sculo XVIII.
No mbito da lexicograa de apoio escrita literria e informao
diacrnica, o dicionrio de rimas (ento com o nome mais tradicional de
consoantes) de Couto Guerreiro (1784), o Dicionario potico de Francisco
Jos Freire (de nome arcdico Cndido Lusitano) (1765), o vocabulrio com
a informao etimolgica de origem rabe, recolhido e estudado por Frei
Joo de Sousa (1789), e o Elucidrio dito de Frei Joaquim de Santa Rosa de
Viterbo (1798-1799) (em grande parte coligido por Fr. Bernardo da Encarnao), subsistiram e mantm-se em grande medida insuperados, mesmo quando escassamente reeditados.
Mais importante ainda, na histria da lexicograa monolingue portuguesa, foi o legado de Antnio de Morais Silva (1789) e a adequao ao
uso prtico e funcional que teve incio com o Novo dicionrio (1806). Estas duas obras denitivamente modernas abriram caminho para os dois
modelos bsicos de dicionrios da lngua verncula que preencheram o

Lexicografa portuguesa. Perspectiva crtica

105

percurso subsequente da lexicograa portuguesa. O dicionrio de Morais


foi reeditado de dcada em dcada at ao sculo XX e retomado e transgurado (1949-1959) como grande dicionrio autorizado. O Novo Dicionrio
inspirou e serviu de exemplo para uma preenchida linhagem de dicionrios prticos, que se prolongou at actualidade, de uso fcil e acessvel,
na escola e no espao familiar.
A tentativa inndada (e que se revelaria at hoje inndvel) do dicionrio da Academia Real das Cincias (Academia das Cincias 1793)13 no
foi certamente uma experincia perdida. O contributo propriamente lexicogrco foi modesto, cou-se pela letra A, no conseguiu estabelecer um
modelo de dicionrio autorizado com viabilidade de realizao prtica, no
quadro da instituio acadmica, e foi escassamente gerador de exemplaridade metalexicogrca. O verbo azurrar, lugar de chegada e limite nal
no seu percurso inacabado, suscitou humoradas aluses entre os escritores
e intelectuais do sculo XIX. Em todo o caso, o trabalho do diligente dicionarista Pedro Jos da Fonseca, j citado, e dos dois acadmicos que o coadjuvaram, Bartolomeu Incio Jorge e Agostinho Jos da Costa de Macedo, deixou
uma referncia fundamental na histria da lexicograa. Os textos introdutrios (a Planta para se formar o Diccionario, as Memorias e Louvores da
Lingoa Portugueza, o Catalogo dos Autores) e o grande volume in folio
constituem um documento culturalmente muito estimvel e uma fonte de
informao lexicogrca aufervel, que aguarda ainda uma leitura e um
estudo que facilitem a sua entrada na memria activa da lngua14.
Herana louvvel foi a valorizao do patrimnio escrito, como referncia do vernculo. O dicionrio da Academia foi uma instncia privilegiada para a reexo sobre o cnone autoral do portugus. Alm da lista de autores que integra o volume, suscitou uma segunda e mais ampla
indexao dos autores, num Catalogo dos livros que se ha de ler para
a continuaa do Diccionario da Lingua Portugueza, mandado publicar
pela Academia Real das Sciencias de Lisboa, em 1799.
Entre alguns factos sempre lembrados na histria deste perodo, destaca-se, de modo promontoriante, como um dos episdios jocosos da
lexicograa portuguesa, a publicao da obra de Bernardo de Lima e Melo
Bacelar (1783), Dicionrio da lngua portuguesa. O ttulo ocupa lugar inaugural, visto que nunca antes se tinha utilizado como epgrafe esta precisa
designao. Trata-se, na realidade, da primeira publicao em absoluto
13. O Dicionrio da Lngua Partuguesa Contempornea, publicado em 2001 com a chancela da Academia (Academia das Cincias 2001), no corresponde ao projecto anunciado e ensaiado em 1793.
14. O dicionrio da Academia (1793) foi objecto de uma reproduo facsimilada, em 1993, assinalando o segundo centenrio da sua publicao.

106

Telmo Verdelho

de um dicionrio geral monolingue da lngua portuguesa15. Deve todavia


observar-se que no obra muito digna dessa primazia. Com efeito, a sua
realizao, sob o ponto de vista lexicogrco e metalingustico disforme, incoerente, mal fundamentada e praticamente intil. A apreciao
incomplecente de Inocncio, no seu registo bibliogrco, no muito esclarecedora quanto s caractersticas dicionarsticas, mas um indicador
da sua pouca qualidade e um desimpedido testemunho sobre o modo
como foi recebida pelo pblico:
Esta tentativa, anterior de alguns annos, como se v pela data, publicao da primeira edio do
Diccionario de Antonio de Moraes Silva, faz por certo honra aos bons e patrioticos sentimentos do
auctor, cujo zelo inconsiderado o levou a tentar uma empresa na verdade superior as suas foras
e para a qual lhe faleciam os elementos e especies necessarias. fora de querer ser conciso e
systematico em demasia, tornou-se escuro, e por vezes ridiculo; e nas suas extravagantes investigaes etymologicas adoptou opinies insustentaveis, e s proprias de um espirito irreflexivo,
que deixando se dominar por idas antecipadas, v tudo a travez do prisma de uma imaginao
preoccupada. A obra, logo que sahiu a luz, comeou a servir de alvo aos apodos e sarcasmos dos
criticos; e ha quem diga que a auctoridade publica interviera, mandando retirar da circulao os
exemplares, que por isso chegaram a tornar-se raros, e valeram conseguintemente preos mais
elevados (Silva 1858-1958: I, 378-379).

9. A recepo dos dicionrios no Brasil e a interaco dos centros de


produo franceses so aspectos preponderantes na histria da lexicograa portuguesa.
Em 1807, a transferncia da Corte portuguesa para o Brasil marca o
incio de uma acentuada transumncia lingustica. O portugus ganha
um novo espao e uma identidade regional, amplia o consumo da leitura
e suscita o crescimento do mercado livreiro, com especial solicitao no
que se refere aos manuais escolares e aos textos de apoio ao uso da lngua, gramticas e dicionrios.
Antnio de Morais Silva, o grande dicionarista da lngua portuguesa
moderna, , a este respeito, uma gura emblemtica. Nasceu no Rio de Janeiro, estudou e escreveu na Europa (Portugal, Inglaterra e Frana) e, depois
de regressar ao Brasil, continuou a trabalhar na reviso do dicionrio, produzindo acrescentos e correces que foram retomados at 4 edio.
Neste mbito, merece tambm referncia Manuel Joaquim Henriques
de Paiva (1752-1829), provvel companheiro e incentivador de Morais Silva.
-lhe atribudo o trabalho de reviso e mesmo uma possvel colaborao
autoral na publicao ou numa das reedies do primeiro dicionrio pr15. O Dicionrio potico (Cndido Lusitano 1764) era j um dicionrio monolingue, mas era pouco mais do que
um vocabulrio de eptetos.

Lexicografa portuguesa. Perspectiva crtica

107

tico bilingue publicado em Lisboa, o Novo dicionrio francs e portugus


(Ivo / Paiva 1786), objecto de sucessivas edies no nal do sculo XVIII e
princpio do sculo XIX. Henriques de Paiva nasceu e estudou em Portugal e foi no Brasil (embora na condio de degredado, por insubmisso
intelectual) um mdico estudioso e um devotado intrprete da intercomunicao de Portugal com o Brasil. Traduziu vrias obras do francs e do
ingls e, ainda no mbito lexicogrco, comps uma farmacopeia e um
dicionrio de Botnica (Bahia, 1819) (cfr. Silva 1858-1958: VI, 12-18).
A procura de dicionrios, no Brasil, estimulou de tal modo o trabalho
de edio que, perante a incapacidade de resposta do parque grco em
Portugal, motivou o surgimento de um centro editorial portugus em
Frana, em grande parte dedicado produo de dicionrios.
Ao longo de todo o sculo XIX imprimiram-se em Frana, com tiragens de muitos milhares de exemplares, vrias dezenas de dicionrios
portugueses, monolingues e bilingues, que eram transportados de barco
para Portugal e para o Brasil.
Alguns dicionaristas portugueses acompanharam a deslocao do
centro editorial, viveram em Frana e, sob a inuncia dos modelos europeus, especialmente franceses, elaboraram as suas obras. Entre outros,
tiveram copiosa divulgao no Brasil os dicionrios de Solano Constncio
(c. 1772-1846), Jos da Fonseca (c. 1788-1866) e Jos Incio Roquete (18011870), todos impressos em Frana (cfr. Ramos 1972).
Estes dicionrios, na sua maior parte, e bem assim outros manuais
escolares, traziam no rosto uma dedicatria formal: eram oferecidos
mocidade estudiosa de Portugal e do Brasil, ou estudiosa mocidade
portugueza e brasileira.
A partir dos meados do sculo XIX estabeleceram-se linhas regulares
de circulao entre a Europa e o Brasil, com recurso parcial navegao a
vapor, os livros (particularmente os dicionrios) beneciaram dessa melhoria e ocuparam, durante algum tempo, um segmento muito signicativo nas exportaes para o Brasil. A difuso dos dicionrios portugueses
no Brasil (impressos em Frana) acentuou-se justamente a partir desses
anos.
Correspondendo a essa solicitao do mercado, em 1858, Eduardo Faria (1823-1860) lanou no Brasil uma edio do Diccionario da Lingua Portugueza (Faria 1859) e, na reedio revista deste dicionrio, feita em Lisboa, por D. Jos de Lacerda (1803-1877), alm de se referir no prprio ttulo
a integrao de um vocabulario da lingua Tupy, invocava-se expressamente o pblico do Brasil como parceiro destinatrio: Diccionario da lingua portugueza: para uso dos portuguezes e brazileiros (Faria 1858-1859)

108

Telmo Verdelho

conrmando a importncia comercial crescente desse espao de escrita e


leitura e de estudo da lngua portuguesa.
Um dos dicionrios mais divulgados no Brasil foi o de Antnio de Morais Silva, sobretudo a partir da 7 edio (1877), consideravelmente aumentada. No prefcio pode ler-se uma informao esclarecedora, a este
respeito:
Do grande numero de termos novos accrescentados, uma parte consideravel respeita ao Brasil,
onde o Diccionario de Moraes to consultado.

A procura e o uso deste dicionrio devem ter-se intensicado no Brasil, por iniciativa da Editora Empresa Literria Fluminense de A. A. da
Silva Lobo, que tinha sede no Rio de Janeiro e que promoveu tambm a
8 edio em 1889. Diz o editor, na nota introdutria desta Nova edio
revista e melhorada:
Fmos ns que ha onze annos, ao comearmos a nossa casa no Brazil, ahi levmos o Moraes,
collocando cinco sextas partes do total da 7 edio, que um nosso amigo fazia em Lisboa a esse
tempo.

10. Acompanhando a democratizao da escrita e da leitura, os dicionrios foram alargando o seu espao de recepo e de difuso at se tornarem hoje um instrumento de uso quotidiano, indispensvel no relacionamento das sociedades. So uma condio de civilizao.
O primeiro dicionrio prtico portugus, procurado pelo pblico e
muito divulgado, foi um dicionrio bilingue de francs-portugus, acima
referido (Ivo / Paiva 1786). Era um volume manual in 8 que ter comeado
a publicar-se pelos anos de 1770 e que teve um assinalado sucesso editorial, com tiragens numerosas, no dizer dos editores. Teve uma edio,
que se dizia stima, em 180316. Oferecia-se com a aparncia de um livro
funcional, gracamente aligeirado, utilitrio e certamente menos dispendioso do que outros de volume semelhante. Transcreve-se a portada da
edio de 1786, que se dizia 5:
Novo Diccionario Francez e Portugues, composto segundo os mais clebres diccionarios e enriquecido de muitos
termos de medicina, de anatomia, de cirurgia, de farmacia, de quimicia [sic], de historia natural, de botanica, de
16. Os applausos com que o pblico tem recebido, e approvado este Diccionario todas as vezes que tem sahido luz, a grande estimao que delle fez, a brevidade com que seis edies to numerosas se consummiro, tudo isto prova bem evidentemente a sua bondade e merecimento (Aviso, texto introdutrio da
7 ed.).

Lexicografa portuguesa. Perspectiva crtica

109

mathematica, de marinha, e de todas as outras artes e sciencias, notavelmente corrigido, emendado, e addicionado
com hum sem numero de termos, e locues, e algumas frazes em ambos os idiomas. Quinta Edio. Lisboa: Na
Officina de Filipe da Silva e Azevedo. Anno M.DCC.LXXXVI.

No se indica, nesta edio, o nome do autor, mas o Novo Dicionario


Francs e Portugus, publicado pelo menos at 1817, geralmente atribudo a Miguel Tibrio Pedegache Brando Ivo (1730?-1794) e tambm
referido como responsvel pela sua reviso e melhoria, o j citado Manuel Joaquim Henriques de Paiva (1755-1829)17. O nmero de entradas do
lxico francs aproxima-se, neste dicionrio, das 34.000. Trata-se de um
valor quantitativo aprecivel correspondente a um registo muito elevado
do domnio lexical da lngua, tendo em conta os nveis mdios das nomenclaturas dos dicionrios monolingues da poca. Neste Novo Diccionario, convergiam j as principais caractersticas dos dicionrios de fcil
e frequente utilizao, que se tornaram instrumentos imprescindveis no
trnsito escolar e na interaco discursiva da vida moderna, cada vez mais
ocupada pela escrita e pela comunicao alargada. Mas havia ainda margem para reduzir o vulto e a cpia dos dicionrios prticos. A adequao
a um pblico de novos leitores e solicitao escolar haveria de torn-los
mais pequenos, mais maleveis e fceis de manusear e de consultar, e
mais adequados para acompanharem a mobilidade dos utilizadores.
Este e outros dicionrios de francs-portugus, numerosamente publicados desde o nal do sculo XVIII, correspondiam certamente ao impulsionamento do uso e do ensino do francs em Portugal e no Brasil, mas
podemos tom-los tambm como um indicador do incio de um processo
de vulgarizao dos dicionrios.
A lexicograa teve incio bilingue, com os dicionrios de latim-vernculo, e foi ainda a procura bilingue que suscitou, no espao da lngua
portuguesa, a democratizao do dicionrio, comeando e crescendo com
o progrediente desenvolvimento do ensino do francs e (com menos solicitao, e um pouco mais tarde) tambm do ingls.
O dicionrio monolingue veio um pouco depois. A sua divulgao e
uso generalizado podem tomar como referncia cronolgica inaugural o
ano de 1806, com a publicao de um dicionrio prtico da lngua portuguesa (j acima citado), por iniciativa do operoso tipgrafo francs, instalado em Lisboa, Francisco Rolland (1743-1814) (Novo diccionario 1806).
17. A notcia biliogrca desta mesma edio que se encontra em catlogos internacionais apresenta algumas diferenas; provavelmente foram feitas diferentes tiragens com a mesma referncia de edio. Num
desses registos bibliogrcos menciona-se Joo Henriques de Paiva, como eventual responsvel pela melhoria da edio, mas no se conhece documentao que possa conrmar esse dado, que poder ser um
lapso do catalogador.

110

Telmo Verdelho

Trata-se de um volume in 4 pequeno, com 864 pginas (no numeradas),


que oferece cerca de 30.000 entradas, distribudas, com grande legibilidade, em duas colunas. Foi publicado annimo e no temos ainda hoje
informao provvel sobre a sua autoria, para alm de uma muito previsvel implicao do prprio editor. Foi objecto de reedio correcta e
augmentada em 1817 e 1835. Comea com um parafraseado exergo, na
pgina de rosto, adiantando algumas informaes sobre a doutrina lexicogrca e lingustica que ter orientado a sua publicao:
Novo Diccionario da Lingua Portugeza, composto sobre os que at o presente se tem dado ao prelo, accrescentado
de varios Vocabulos extrahidos dos Classicos Antigos, e dos Modernos de melhor nota, que se acho universalmente recebidos. Lisboa, na Typografia Rollandiana. 1806. Com Licena da Meza do Desembargo
do Pao.

A valorizao da memria patrimonial da lngua e a aceitao de uma


norma do bom uso so os aspectos lembrados como indicadores da qualidade da obra. A invocao dos autores clssicos sobretudo ornamental
e encontra-se muito ocasionalmente repercutida no texto do dicionrio.
Diz-se no Prlogo que foram omitidas as numerosas citaes e allegaes porque ocupariam uma boa parte do volume. A criteriosa seleco
da nomenclatura recolhida nos dicionrios de Antnio de Morais Silva
(1789) e de Joaquim Jos da Costa e S (1794), e a sntese dos artigos recolhidos nas mesmas fontes dispensaram o autor de recorrer aos clssicos
para extrair os vocbulos dicionarizados. Assim mesmo, e pelo mrito
das fontes, o Novo dicionrio marca um momento de referncia na histria dos dicionrios portugueses.
A lexicograa prtica monolingue prosseguiria, logo no incio do sculo XIX, com os dicionrios portteis ainda mais pequenos, em tamanho de bolso, e mais numerosos, despertando a concorrncia de autores e
editores. Foram produzidos, na sua maior parte, em prelos franceses.
Entre os vrios dicionrios prticos da lngua portuguesa publicados
durante o sculo XIX, o que mais se distingue o Diccionario da Lingua
Portugueza de Jos da Fonseca, feito inteiramente de novo e consideravelmente augmentado por Jos Incio Roquete, publicado pela primeira vez
em Paris, pelos editores Guillard/Aillaud, em 1848, juntamente com o Diccionario dos Synonimos, Poetico e de Epithethos da Lingua Portugueza, pelos mesmos autores (Fonseca / Roquete 1848a e b). Este conjunto de dicionrios teve sucessivas edies at ao nal do sculo, e foi provavelmente
a elaborao lexicogrca mais difundida e com maior volume de vendas
em toda a histra da dicionarstica portuguesa. Segundo o testemunho de
Alberto de Oliveira (s. d.: 44-46) foi este um dos dicionrios usados por Ea

Lexicografa portuguesa. Perspectiva crtica

111

de Queirs, este, certamente entre outros, porque o talentoso romancista


foi um frequentador assduo de dicionrios e a eles se refere em vrios
locais da sua obra18. Serve-nos o seu exemplo tambm para documentar
uma implicada reciprocidade entre os dicionrios e a elaborao literria,
potenciada, neste caso com a parceria do Diccionario dos Synonimos19.
certo que os dicionrios de apoio composio literria tinham j uma
tradio que remontava ao sculo XVI, mas a sua utilizao foi fortemente incentivada com o alargamento do consumo literrio no sculo XIX.
Almeida Garrett, numa nota primeira edio do poema Cames (1825),
notava a necessidade e as vantagens dessa elaborao lexicogrca:
Direi sempre que sem um bom Dicionrio de Sinnimos e outro de origens ou etimolgico, nunca chegaremos a falar uma lngua perfeita e de nao civilizada (Garrett 1966: II, 429).

A utilizao geral e individualizada dos dicionrios, a democratizao


que transparece claramente em ttulos como dicionrio popular, elementar, escolar, coalesce com a expanso da literatura de co romanesca e da actividade jornalstica, ao longo do sculo XIX, estabelecendo
vnculos e interdependncias sinrgicas que se repercutem na histria
das lnguas.
No sculo XIX, intensica-se a ligao entre o espao da literatura e os
dicionrios, que se tornam ingrediente oculto mas vital para a produo
literria e, de um modo mesmo mais amplo, para todo o discurso do universo cultural.
11. A lexicograa portuguesa preencheu a sua histria geralmente
confrontada com um certo desamparo institucional, e sem o apoio de
uma poltica da lngua, responsvel e esclarecida. Os ideais de defesa,
estudo e ilustrao da lngua verncula, que ardorosamente estimularam escritores e llogos portugueses, motivaram tambm algumas
vezes o discurso poltico, mas raramente se repercutiram em aces
concretas.
No existe em Portugal uma academia da lngua, nem outro qualquer instituto do estado que lhe seja dedicado de modo exclusivo. A
18. Entre outras citaes, menciona em Os Maias, O Crime do Padre Amaro e A Ilustre Casa de Ramires dicionrios de rimas e dicionrios de sinnimos, com subtil ironia, deixando implcita a ideia de que a sua
utilizao torna articial e falseia a criao literria, mas claro que ele os conhecia e podemos supor que
poderia muito bem utiliz-los.
19. Extinta a parceria editorial entre os dois dicionrios, no nal do sec. XIX, o percurso do dicionrio de sinnimos prosseguiu ao longo do sculo XX com muitas reedies na Editora Lello & Irmo, Porto.

112

Telmo Verdelho

Academia Real das Cincias (hoje Academia das Cincias de Lisboa),


fundada em Dezembro de 1779, inclua no seu programa a publicao
de uma gramtica e de um dicionrio, mas os ns da Academia abrangiam, para alm dos saberes lingusticos, todo o espectro amplo das
cincias e por isso, ela era corporizada por uma diversidade escolhida de
sbios que no tinham que privilegiar as iniciativas literrias e lolgicas. A histria do Dicionrio da Academia um concludente exemplo, se
no da sua inoperncia, pelo menos da diculdade em implementar o
projecto fundacional.
Apesar de tudo, a Academia foi uma das poucas instituies pblicas
a assegurar alguma referncia normativa, promovendo a publicao de
trabalhos metalingusticos20, apoiando a codicao e a legislao ortogrca, e assumindo a elaborao do Vocabulrio Ortogrco da Lngua
Portuguesa (Academia das Cincias 1940), depois redimensionado no
Vocabulrio ortogrco resumido da lngua portuguesa (Academia das
Cincias 1947 e 1970), e, nalmente, tentando sempre a elaborao de um
Dicionrio Acadmico. Na estrutura da Academia foi integrado um Instituto de Lexicologia e Lexicograa da Lngua Portuguesa que apoiou j a
publicao do Dicionrio da Lngua Portuguesa Contempornea (Academia das Cincias 2001)21.
Os empreendimentos de pesquisa e de elaborao lexicogrca em
Portugal foram realizados, na sua maior parte, sem o apoio do estado ou
de instituies pblicas, sobretudo at aos ltimos decnios do sculo XX,
quando comeou a poder contar-se com o trabalho de investigadores ligados s universidades e, em especial, ao Centro de Estudos Filolgicos,
actualmente Centro de Lingustica da Universidade de Lisboa (CLUL).
O projecto do Portugus Fundamental (Bacelar do Nascimento et al.
1984 e 1987), aqui iniciado em 1970, foi o primeiro contributo institucio20. Alm da Gramtica de Jernimo Soares Barbosa (1822), podero mencionar-se, entre outros, alguns textos
mais orientados para o estudo do vocabulrio, como os ensaios de Antnio das Neves Pereira, Antnio
Pereira de Figueiredo e Francisco Dias Gomes; os estudos lexicogrcos de Fr. Joo de Sousa e do Cardeal
Saraiva, e as Reexes sobre a lingua portugueza por Francisco Jos Freire (1842).
21. De acordo com os Estatutos actualmente em vigor, entre as nalidades da Academia, destacam-se as
seguintes disposies referentes lngua portuguesa: Estimular o enriquecimento e o estudo do pensamento, da literatura, da lngua e demais formas de cultura nacional (art. 4 b); A Academia o rgo
consultivo do Governo Portugus em matria lingustica (art. 5); No que respeita unidade e expanso
da lngua portuguesa, a Academia procura coordenar a sua aco com a Academia Brasileira de Letras e
com as instituies culturais dos outros pases de lngua portuguesa e dos ncleos portugueses no estrangeiro. Academia compete propor ao Governo ou a quaisquer instituies cientcas e servios culturais
as medidas que considerar convenientes para assegurar e promover a unidade e expanso do idioma
portugus (art. 6).

Lexicografa portuguesa. Perspectiva crtica

113

nal para o agenciamento e estudo estatstico do lxico portugus em uso


activo.
A iniciativa deu origem a uma base de dados actualizvel, que se prolongou e que se encontra recongurada, a partir de 1988, no Corpus de Referncia do Portugus Contemporneo (CRPC). Nele se acumulam presentemente cerca de 334 milhes de palavras, recolhidas num alargado leque
de tipos de discurso e de variedades regionais de todo o espao lusfono,
com um alcance diacrnico dos meados do sculo XIX at actualidade.
O estudo e a pesquisa nos domnios da lexicograa, so hoje objecto
de linhas de investigao e de projectos em desenvolvimento, em vrias
Universidades e em alguns Centros da Fundao para a Cincia e a Tecnologia, com destaque para o Instituto de Lingustica Terica e Computacional (ILTEC), criado em 1988, para dar apoio a um projecto europeu
de traduo automtica (EUROTRA), manteve-se depois, ligado s Universidades de Lisboa, privilegiando, entre os seus objectivos, a execuo de
projectos orientados para a a construo e a informatizao de lxicos e
terminologias.
Assinalvel referncia merece tambm o projecto do Corpus Lexicogrco do Portugus (CLP) empreendido no Centro de Lnguas e Culturas
na Universidade de Aveiro, iniciado em 2003, com nanciamento da FCT.
Tem por objecto a recuperao da memria lexical portuguesa, dicionarizada desde o sculo XVI. Foi j efectuada a leitura crtica e o tratamento
computacional do texto da maior parte dos dicionrios antigos, facultando-se o acesso a todas as formas portuguesas neles registadas e respectiva concordncia, atravs de um motor de busca DICIWEB (Verdelho /
Silvestre 2007).
Alm da abundante pesquisa desenvolvida no Brasil, onde a dicionarstica da lngua portuguesa tem actualmente os centros mais dinmicos
da sua realizao, a lexicograa portuguesa tem podido contar ainda com
a colaborao generosa de estudiosos lusitanistas ligados a centros de investigao fora de Portugal. A maior parte dessa colaborao encontra-se
em dicionrios bilingues, mas foram produzidos tambm textos de muito
mrito no mbito da lexicograa monolingue portuguesa. Entre outros,
devem citar-se o Dicionrio inverso da lngua portuguesa, publicado em
Moscovo, em 1971, pela saudosa Professora Elena Wolf (1971); e o compendioso Dicionrio dos dicionrios portugueses, publicado com diligente persistncia pelo Professor Dieter Messner, a partir de 1994, numa sequncia
que vai j em 20 volumes (Messner 1994- ).
Ainda fora do espao lusfono, o reconhecimento e estudo do vocabulrio portugus tem sido beneciado tambm por projectos de inves-

114

Telmo Verdelho

tigao que recorrem tecnologia computacional e que oferecem na Internet a informao elaborada. Entre outros, merecem boa lembrana, o
Corpus do Portugus (Davies/Ferreira 2006) que d acesso a uma base de
dados com mais de 45 milhes de palavras, permitindo acesso fcil a todas as formas contextuadas com as respectivas concordncias22.
Especial meno devida ao Tesouro Medieval Informatizado da Lingua Galega (TMILG), promovido pelo Instituto da Lingua Galega (Santiago
de Compostela) e dirigido pelo Prof. Xavier Varela Barreiro. Trata-se de um
trabalho lolgico feito com rara sistematicidade e com recorrida acribia.
Alm da fruio literria dos textos, acrescenta um tratamento computacional que faculta acesso a todas as formas ocorrentes oferecendo-se
como o mais importante recurso paralexicogrco, presentemente disponvel, para o estudo do portugus antigo.

22. Transcreve-se a informao fornecida pelos autores: O Corpus do portugus foi generosamente patrocinado pela US National Endowment for the Humanities (2004-06). O projeto do corpus foi concludo no vero
de 2006, mas a interface, a anotao/etiquetagem e a arquitetura do corpus ainda esto sendo modicados. Tambm recebemos um apoio muito generoso de nossas respectivas universidades: Brigham Young
University (Mark Davies) e Georgetown University (Michael J. Ferreira).

115

II. RECURSOS E PROXECTOS

117

O GALEGO FUNDAMENTAL: DICIONARIO DE FRECUENCIAS


Mara Xess Bugarn Lpez

Instituto da Lingua Galega

0. introducin
O galego fundamental: dicionario de frecuencias o ttulo da mia
tese de doutoramento presentada na Universidade de Santiago de Compostela (Bugarn 2007)1. Anda que o obxectivo inicial era o establecemento do lxico galego fundamental, a magnitude do traballo, as limitacins
humanas, cronolxicas, tecnolxicas, etc. levaron a acoutar o campo de
traballo ao lxico galego de frecuencia, un dos dous elementos base para
a construcin do lxico fundamental.
A denominacin de Dicionario de frecuencias vn dada pola presentacin das formas obtidas do corpus, xa que foron agrupadas baixo o seu
lema correspondente.

1. lxico, lxico fundamental e lxico de frecuencias.


que son?
Unha das acepcins recollidas no DRAG di que lxico o conxunto
de palabras dunha lingua. Se falamos dunha lingua viva, este conxunto
caracterzase por ser aberto, susceptible de cambios. As palabras nacen,
cambian no seu uso (amplan os seus signicados, perden algunhas das
acepcins...), deixan de ser usadas, etc.
As a todo, a tendencia xeral que se observa en todas as linguas que
a maiora dos seus usuarios, a pesar da sa maior ou menor riqueza de
vocabulario, fan uso unicamente dunha pequena parte dos seus recursos
lxicos. Ese sera o lxico fundamental: un ncleo de palabras que todo
1.

Agradzolle ao Dr. Manuel Gonzlez Gonzlez a oportunidade que me brindou ao darme a coecer esta
lia de investigacin, os seus nimos e a direccin da tese.

118

Mara Xess Bugarn Lpez

membro dunha comunidade debe coecer para establecer unha comunicacin elemental.
Pero, como se chega ao establecemento do lxico fundamental dunha
lingua? Xeralmente na construcin do lxico fundamental adoitase recorrer combinacin do lxico de frecuencias e do lxico de dispoibilidade. Do primeiro extrense as formas mis usadas polos falantes mentres
que o segundo proporciona aquelas palabras que os falantes actualizan
de modo mis espontneo a travs de estmulos axeitados, anda que non
alcancen unha determinada frecuencia.

2. utilidade dos vocabularios e dicionarios de frecuencias


Coecer a frecuencia do lxico dunha lingua moi til e o seu establecemento resulta un material bsico para o desenvolvemento de novos
estudos ou de aplicacins en campos tan diversos como os seis seguintes,
por poer algns exemplos:
(1) O ensino de lingua para estranxeiros. Nesta rea xurdiron as primeiras listas de frecuencias, coas que se buscaba o vocabulario que deban coecer as persoas que se achegaban a unha lingua distinta sa
establecendo unha gradacin para a sa posterior aprendizaxe.
Os estudos de frecuencia coinciden en sinalar que son as palabras
gramaticais as que aparecen sempre nos mis altos ndices de frecuencia,
como tamn en que hai un nmero moi reducido de palabras que se repiten ao longo de todo o corpus cunha determinada frecuencia, mentres
que as formas denominadas hpax son as maioritarias. Estes coecementos son os que permiten o establecemento dunha gradacin: elemental
ou introdutorio, medio e superior.
(2) Relacionado co campo anterior est a elaboracin do material escolar, en lingua galega no noso caso, dun xeito racionalizado, gradual e
progresivo. Cal o lxico que deben aprender e xar os cativos en cada
unha das distintas etapas de escolarizacin debe ser algo previo ao deseo editorial.
(3) Este traballo tamn til na elaboracin e correccin de dicionarios. As formas que integra calquera dicionario estn expostas a unha serie de procesos que van desde a aparicin do termo, a ampliacin de signicados, a restricin dos mesmos, ata a completa cada en desuso. Todos
eses aspectos deben ser tidos en conta hora da actualizacin das obras
lexicogrcas. Outro factor importante son as diferenzas internas entre
os vocbulos que conforman o lxico dunha lingua. Algns termos son

O galego fundamental: Dicionario de frecuencias

119

moi frecuentes por posuren moitas acepcins mentres que outros son
raros por apareceren en contextos de uso demasiado especializados ou
tcnicos. nde establezamos o corte far que o dicionario sexa de tipo bsico ou escolar, por exemplo, onde deben estar recollidas as formas mis
usuais, fronte a outro concibido coma un tesouro da lingua, xa no outro
extremo, onde se pretende recoller todo o lxico desa lingua.
(4) Outro campo de aplicacin o da recuperacin de pacientes con
perda ou problemas de fala. Cando tratamos de dicir unha palabra que
sae do noso campo de lxico habitual e frecuente adoitamos atoparnos
con certas dicultades chegando a tela... na punta da lingua. Ese fenmeno, anda que mis agravado, afecta a persoas afsicas. Neste grupo
tamn poderiamos inclur as persoas con dicultades na lectoescritura.
(5) O galego, como o resto das linguas, debe incorporarse ao mundo
das novas tecnoloxas para poder ser til aos seus falantes. Entre as sas
mltiples aplicacins centrmonos, por un instante, no desenvolvemento
de recoecedores de fala. Hoxe en da o home pode establecer dilogos
coas mquinas para que as elas leven a cabo as tarefas para as que foron
concibidas. As e todo, as comunicacins adoitan producirse en medios
que non estn exentos de rudos e interferencias. Se a mquina dispn de
ferramentas como listaxes de lxico acompaadas de datos estatsticos
de frecuencia de uso pode chegar a recompoer aquelas mensaxes dubidosas grazas lxica matemtica.
(6) Se seguimos dentro do campo informtico, o deseo de xogos tamn necesita dunha ferramenta de apoio que indique os distintos niveis
de frecuencia e, coa mesma, de proximidade ou afastamento do xogadorfalante fronte aos vocbulos-xogo. Un clsico Aforcado en soporte electrnico, por exemplo, ten que posur distintos niveis de dicultade e non
errar neles se quere ter xito e non perder o xogador xa no nivel principiante por exceso de dicultade.

3. lxico de frecuencia da lingua galega


3.0. Antecedentes
Para a lingua galega en 1986 fxose un traballo deste tipo que nunca
chegou a ver a luz e do que souben por un dos seus autores. Trtase do
Vocabulario de frecuencias da lingua oral, elaborado por Dolores Snchez
Palomino e Manuel Gonzlez Gonzlez. Esta obra, froito dun proxecto de
investigacin nanciado pola Xunta de Galicia, consistiu na creacin dun

120

Mara Xess Bugarn Lpez

corpus de 300.000 palabras que permitiu a elaboracin dunha lista coas


1.000 mis frecuentes.

3.1. Elaboracin do Dicionario de frecuencias da lingua galega


3.1.1. Deseo e creacin do corpus
A elaboracin do vocabulario de frecuencias requira primeiramente
a creacin dun corpus-mostra como punto de partida ou base da nosa
investigacin.
En primeiro lugar consultronse e analizronse distintas obras relacionadas co noso mbito de traballo. Esas obras versaban maioritariamente
sobre linguas romnicas casteln, cataln, francs, italiano, portugus... ,
xa que os problemas que o galego podera presentar seran mis facilmente predicibles. Logo procedemos ao deseo do corpus e posterior
recompilacin do material que o integrara e que pretendera ser unha
representacin da lingua galega actual en todas as sas manifestacins.
De cara a conseguir o obxectivo proposto, creamos un corpus de carcter textual, con documentos completos, subdividido en dous subcrpora:
un de lingua escrita (65%) e outro de lingua oral (35%). O subcorpus de
lingua escrita estaba formado por obras literarias (novela, teatro, poesa),
cientco-tcnicas, divulgativas e ensasticas, en distintas proporcins.
sa vez, o subcorpus de lingua oral recolla exemplos de intervencins
formais (no mbito do Parlamento ou na Universidade) e non formais
(conversas, contos, etc.). Os materiais lingsticos que o integraban pertencan ao perodo cronolxico comprendido entre os anos 1975 e 1999,
dicir, aos ltimos 25 anos do pasado sculo XX.
Na elaboracin do corpus ideal hai moitos atrancos, algns difciles
de resolver, aos que o investigador se debe enfrontar e que converten esta
tarefa, segundo os estudosos, nunha utopa. Refermonos a dicultades
como o nivel de lingua en que basear o traballo lingua estndar, lingua
comn, lingua corrente, dialectos..., o distinto valor e a porcentaxe dos
materiais lingsticos que se utilizan escrito/oral, prosa/verso..., os problemas tcnicos adquisicin do material, uso de programas..., e por qu
non, a inexperiencia do deseador, etc. A precaucin ante tales avisos
levounos a tentar contrarrestar os previsibles erros de seleccin de material cun tamao global do corpus o sucientemente grande para que,
dalgn xeito, conseguise facelos mnimos. O noso labor, individual e sen
apoio informtico, xo que situaramos o lmite ao redor dos 2 millns de
ocorrencias.

O galego fundamental: Dicionario de frecuencias

121

Na escolla do material empregado, das proporcins establecidas e do


perodo temporal pesaron, grosso modo, tres razns:
(1) A travs das distintas porcentaxes tentamos solucionar unha serie
de problemas que podan interferir na calidade dos materiais recollidos.
A linguaxe literaria est fortemente inuda por das variables: (a) a
cultura castel dos escritores (ben sexa a simple escolarizacin recibida en
territorio galego, ben a realizacin de estadas en universidades de fra de
Galicia, por exemplo), e (b) a accin dos correctores nas editoriais, accin
que explicarei un pouco mis adiante.
Do mesmo xeito pode verse afectada a expresin oral formal, en ocasins froito dunha traducin simultnea desde un pensamento formulado orixinariamente en casteln (por exemplo, a lingua dalgns parlamentarios).
Para contrarrestar a posible desviacin e empobrecemento lexical,
os textos de recolla oral de rexistro non-formal permiten o acceso a un
lxico mis propio e variado, xa que non podemos deixar de lado que a
cultura rural foi a gran depositaria durante sculos da lingua galega.
(2) A seleccin cronolxica veu dada en primeiro lugar pola intencin
de actualidade. A primeira caracterstica que buscou sempre esta investigacin foi a sa practicidade e posterior aplicabilidade aos problemas
que sofre a lingua galega como entidade minoritaria. En segundo lugar,
preferiuse que a seleccin de textos fose dun perodo non excesivamente entrado no mundo das novas tecnoloxas editoriais. As, anda que os
materiais chegan ao ano 1999, a maiora son anteriores a 1990. E isto para
evitar a excesiva correccin lingstica provocada polo lema o que non
est recollido en dicionarios e correctores non vlido, non existe, que
est ocasionando tan graves eivas no noso patrimonio lingstico.
(3) Finalmente, e debido amplitude do corpus que perseguiamos,
foinos de esencial axuda valernos de material recompilado noutros
proxectos2 (xa en formato electrnico), anda que debeu ser completado
ata conseguir o deseo global do noso universo lingstico ideal (idea de
representatividade).

2.

Quixera agradecer o apoio prestado polo Dr. Antn Santamarina, con quen tiven a sorte de traballar durante seis anos no seu equipo de Lexicografa, no Instituto da Lingua Galega. Unha parte importante dos
textos manexados neste corpus proceden do seu proxecto Base de datos lexicogrca do galego moderno.

122

Mara Xess Bugarn Lpez

3.1.2. Tratamento do material do corpus


O respecto lingua dos textos na sa substancia fontica, morfosintctica e lxica foi a norma xeral bsica. As e todo, houbo que sometelos
a unha serie de adaptacins de cara a unicalos e a poder procesalos despois mediante aplicacins informticas. Basicamente as modicacins
efectuadas afectaron correccin de erros tipogrcos; eliminacin de
topnimos, antropnimos, estranxeirismos, etc. a efectos de cmputo;
uniformizacin no uso das grafas b/v, h/, i/y, seguindo criterios etimolxicos; representacin dos pronomes enclticos ou s segundas formas
do artigo unidas a eles; eliminacin do uso do guin en formas compostas cando iso era factible ou sa substitucin por un guin baixo que
soldaba as partes integrantes como unha nica entidade; unin, tamn
con guin baixo, de palabras formantes dun lema nico, etc.
Unha vez que foron uniformizados todos os materiais lingsticos
foi posible o emprego de programas informticos para extraer o lxico
do corpus. Primeiro, con axuda de WordSmith Tools elaborouse a lista de
todas as formas grcas distintas aparecidas no corpus coa ferramenta
WordList.

Despois, coa ferramenta Concord, extraronse todas as concordancias


de cada unha desas formas. Coas concordancias obtivronse os contextos
de uso, fundamentais para a posterior desambiguacin.

O galego fundamental: Dicionario de frecuencias

123

De seguido, toda esa informacin foi adaptada e introducida nunha


base de datos do programa Microsoft Access. Nas diferentes tboas de traballo establecronse os seguintes campos: contexto anterior, forma, contexto
posterior, lema, categora gramatical, tipo de lingua (escrita/oral), rexistro
(coloquial/formal/cientco, etc.) e fonte (documento orixe da forma). Unha
vez que se revisou e corrixiu a transferencia da informacin de Wordsmith
a Access, xa todo estaba preparado para comezar o proceso de lematizacin
manual coa introducin dos datos referentes a lema e a categora nos campos correspondentes.

O proceso de lematizacin, ou adxudicacin dun lema ou forma lxica


nica a cada unha das ocorrencias aparecidas no corpus, foi o ltimo paso
da elaboracin do corpus, xunto coa adxudicacin dunha categora gramatical. Para iso seguimos a tendencia maioritaria neste tipo de traballos
e tomamos a palabra, ou elemento que aparece separado por espazos en
branco, como a unidade de traballo. Para enfrontrmonos aos problemas
derivados de fenmenos coma a polisemia e homografa, a divisin e
agrupacin de cadeas grcas, e a asignacin de palabras a clases debe-

124

Mara Xess Bugarn Lpez

mos establecer previamente unha serie de criterios bsicos que guiasen a


asignacin das ocorrencias aos seus respectivos lemas. A desambiguacin
viuse facilitada por ser este un traballo totalmente manual. A consulta de
todo tipo de obras lexicogrcas, principalmente en linguas romnicas,
axudou na resolucin dalgunhas situacins problemticas.

3.2. Resultados
3.2.0. Introducin
Un corpus informatizado coma este permite distintas vas de consulta:
(a) polo lema:
ABANDONO
s.m.

abandono

66

s.m.

abandonos

s.m.

abandoo

2
suma: 69

(b) pola forma:


ABANDONO
s.m.

abandono

66

v.

abandono

6
suma: 72

125

O galego fundamental: Dicionario de frecuencias

(c) pola categora: listas de substantivos, de adxectivos, de verbos etc.


(d) outras posibilidades: pdense obter listas froito do cruzamento
das distintas variables establecidas no corpus.
3.2.1. O dicionario de frecuencias
A informacin presntase ao posible usuario a travs de das vas
distintas:
(1) Unha lista na que por frecuencia decrecente aparecen os lemas
resultantes do proceso de lematizacin. Cando existe mis dun
lema coa mesma frecuencia hai unha ordenacin secundaria de
carcter alfabtico.
6,28% O (art.)

1,45% NON

0,59% SEU

3,76% E

1,28%

0,58% HABER

3,74% DE

1,19% A (prep.)

0,56% ESTAR

3,09% DO

0,94% EN

0,54% DICIR

2,19% QUE (pron.)

0,83% TER

0,53% FACER

1,94% SER (v.)

0,78% PARA

0,53% ME

1,89% UN

0,71% POR

0,52% MOITO

1,77% QUE (conx.)

0,69% O (pron.)

0,51% MIS (adv.)

1,56% NO

0,64% LLE

0,51% TODO

1,48% SE (pron.)

0,63% IR

0,50% OU (conx.)

(2) Outra lista que incle, seguindo unha orde alfabtica, o lema
coas sas ocorrencias, as como a(s) categora(s) diferenciada(s)
xunto coas cifras tanto da(s) ocorrencia(s) como do total de formas
agrupadas baixo ese lema.

126

Mara Xess Bugarn Lpez

CARO
adx.

cara

23

adx.

caras

11

adx.

carsemo

adx.

carsimas

adx.

carsimo

adx.

carsimos

adx.

caro

54

adx.

caros

11
suma: 72

3.2.2. Outras aproximacins


A pesar de que neste punto rematara a elaboracin do vocabulario de
frecuencias ou, neste caso, dicionario de frecuencias, o feito de traballar
sobre un corpus destas caractersticas permite mltiples posibilidades de
estudo do lxico galego. A continuacin, imos facer unha breve demostracin dalgunhas aproximacins de carcter inicial aos datos que poden
parecer mis relevantes desde o punto de vista da frecuencia:
(1) Abordar os datos de carcter xeral que se extraeron do corpus,
dicir, o nmero de ocorrencias totais, das formas grcas distintas, dos
lemas resultantes, dos hpax, etc.
(2) Extraer os cen lemas mis frecuentes e comentar algns aspectos
desprendidos da sa observacin e da sa comparacin cos cen lemas
mis frecuentes noutras linguas romnicas.
(3) Facer unha aproximacin segundo a categora gramatical. Para
exemplicalo imos traballar coas categoras substantivo, adxectivo, verbo
e adverbio. Procederemos a elaborar a lista dos cen lemas mis frecuentes
de cada categora, acompaada dalgns comentarios xerais.
(4) Facer, por exemplo, unha cala dentro dos substantivos buscando
lemas relacionados con algns campos lxicos.

O galego fundamental: Dicionario de frecuencias

127

3.2.2.1. Algns datos de carcter xeral


Un primeiro achegamento aos datos estatsticos totais proporcionou
a seguinte informacin:
As 2.064.847 ocorrencias que integran o corpus corresponden a
87.273 formas grcas distintas.
Despois de lematizadas esas 87.273 formas grcas distintas, obtivronse un total de 32.529 lemas diferentes.
O nmero de hpax, ou lemas cunha nica ocorrencia, ascende a
10.117, ou sexa, un 31,1%, o que indicara que case un terzo dos lemas ten carcter ocasional.
A suma das ocorrencias correspondentes aos 53 primeiros lemas
en orde de frecuencia representa un 49,98%, o que vn ser case a
metade das ocorrencias do corpus.
Os 1.000 lemas mis frecuentes cobren coas sas ocorrencias o
80,32% do corpus.
3.2.2.2. Os cen primeiros lemas

Da observacin dos cen lemas mis frecuentes no idioma galego pdense tirar, entre outras, as seguintes conclusins:

128

Mara Xess Bugarn Lpez

Os lemas mis usuais en lingua galega son formas curtas, na sa


maiora bislabas.
Os lemas mis frecuentes correspndense coas denominadas palabras gramaticais: o artigo determinado, a conxuncin copulativa
e, e as preposicins de e a, etc.
As primeiras palabras lxicas son verbos: ser, ter, ir, haber, estar,
dicir, facer...
O primeiro substantivo que aparece ano intervalo de tempo.
Outros substantivos frecuentes son: da, casa, tempo, seor, vez,
cousa, home e parte.
Os adxectivos mis frecuentes son grande, galego e bo.
Os adverbios estn a medio camio entre as formas gramaticais e
as lxicas. Os mis frecuentes en orde decrecente son: non, mis,
xa, moito, tamn, ben, as, aqu, despois, agora, onde, al, si, sempre,
a, anda3.
A elaboracin desta lista permitiunos confrontar os datos referidos
ao idioma galego con outros idiomas da Romania. En 1994 Henri Guiter
publicaba o traballo Rang et dispersion des frquences lexicales romanes (Guiter 1994). Nese artigo atpase unha tboa, a nmero 1, na que, en
orde decrecente, aparecen os cen termos mis frecuentes de portugus,
casteln, cataln, francs, provenzal, italiano e romans. Para a correcta
comparacin foi necesario someter a lista galega a unha correccin: as
contraccins e amlgamas foron desdobradas nos seus formantes orixinarios e computronse con cada un dos lemas base correspondentes.
gal.

3.

port.

cast.

cat.

fr.

prov.

it.

rom.

o (art.)

o-a

el - la

el - la

le - la

lou - la

il -la

de

de

de

de

de

de

de

di + da

i (conx.)

que

un

que

el - ea
(pron.)

en

que

tre

avea

un

ser

en

un

et

essere

n (prep.)

a (prep.)

um

que
(conx.)

un

che

un

que
(pron.)

se

se

avoir

stre

un

fi

interesante comprobar que os adverbios mis habituais fan referencia situacin cronolxica ou locativa. Esas referencias revlanse como un motivo habitual en calquera producin lingstica reexo dunha
necesidade de concrecin situacional no tempo ou no espazo.

129

O galego fundamental: Dicionario de frecuencias

gal.

port.

cast.

cat.

fr.

prov.

it.

rom.

ser (v.)

no

ser

ser

il

soun

si

se (pron.)

que
(conx.)

a (prep.)

su

anar

ne

se
(pron.)

in

s (conx.)

10

se (pron.)

com

haber

haver

que
(conx.)

av

non

nu (adv.)

11

non

lhe

con

no

je

dins

avere

la (prep.)

12

por

ter

un

que (pron.) ce (adx.)

pr

con

pe (pron.)

13

con

seu

por

per

se

en

per

al (art.)

14

para

em

yo

en

qui

faire

lo

care
(pron.)

15

ter

para

este

amb

pas (adv.) lou (pron.)

mi

mai (adv.)

16

o (pron.)

me

no

fer

ce (pron.) tout

suo

din

17

lle

dizer

todo

com

en (prep.) mai

quello

ca (conx.)

18

este

por

como

me

dans

coume

gli

eu

19

ir

eu

ms

seu

son

sus

fare

ce (pron.)

20

seu

mais

para

dir

vous

em

tutto

c (conx.)

21

haber

mas

estar

li

pour

mai

ma

acest

22

estar

como

tener

ms

on

me

dire

putea

23

me

estar

ir

hi

plus

vire

tu

24

dicir

ir

ese

tot

nous

dire

piu

cel, cea

25

facer

haver

hacer

tenir

par

moun

io

face

26

moito

meu

otro

ell

me

i (pron.)

mio

pentru

27

mis
(adv.)

ele

poder

ne (pron.) mais

veni

questo

cnd (adv.)

28

todo

ver

pero

si (conx.)

sur

ana

altre

noi

29

ou

fazer

decir

per

tout

bu

come

dar (conx.)

30

como

muito

aquest

le (pron.)

en

egli

ntre

31

ese

todo

ver

poder

pouvoir

toun

ne

32

pero

ja

mi

estar

faire

se (conx.)

potere

tot

33

outro

dar

sin

altre

dire

aquu

vedere

voi

34

el

saber

aquel

aquell

mon

vous

lui

da

35

eu

querer

hombre

ja

comme

quand

vi

vedea

36

xa

outro

ya

veure

avec

pas

volere

prin (prep.)

37

poder (v.)

sem

vida

ho

bien

te

om

38

se (conx.)

poder

dar

saber

lui

i (adv.)

se

cum
(conx.)

39

dar

homem

sobre

voler

en (pron.) u

sapere

mare

40

meu

este

si

quan

tu

iu

poco

veni

41

tamn

esse

cuando

perqu

noun

stare

aa (adv.)

130

Mara Xess Bugarn Lpez

gal.

port.

cast.

cat.

fr.

prov.

it.

rom.

42

vir

quem

mismo

jo

ou

nous

cosa

numai
(adv.)

43

cando

aquele

dos

si

grand

andare

nici
(conx.)

44

saber

casa

nuestro

donar

leur

ounte

venire

dup
(prep.)

45

ver

vir

vez

home

voir

tant

anche

zice

46

porque

bem

mucho

qu

cela

voul

perch

spune

47

ben

nem

grande

cosa

poud

me

ti

48

mesmo

tu

molt

sans

bon

ci

dac

49

ano
tempo

ento

entre

passar

savoir

autre

cosi

trebui

50

despois

palavra

da

senyor

monsieur

entre

quale

su

51

as

olho

querer

deux

tu

senza

dect

52

querer

quando

poco

te

moi

bn

ti

doi

53

pois

onde

muy

ara

notre

teni

tanto

meu

54

nos

algum

tan

tornar

mme

ac

due

unul
(pron.)

55

aquel

ficar

porque

fins
(prep.)

vouloir

sant

dovere

iar

56

dous

mesmo

usted

ni

non

nostre

parlare

tot

57

che

vida

ni

grand

giorno

lua

58

vez

at

uno

sense

tout

tms

parere

acel

59

da

ou

creer

dia

venir

diu

ora

zi

60

levar

vez

primer

meu

trs

amour

trovare

ochi

61

sen

assim

llegar

casa

encore

fal

qualche

nostru

62

bo

deixar

tiempo

tan

petit

long

quando

acum
(adv.)

63

aqu

entrar

mujer

deixar

cop

dare

parte

64

agora

isso

ao

venir

homme

dous

sentire

domn

65

pr

to

algn

dos

quelque

plus

tu

unde

66

onde

primeiro

parecer

mateix

peu

pii

uomo

ns

67

pasar

so

hasta

trobar

devoir

canta

mai

sau

68

casa

tambm

espaol

semblar

falloir

jour

cui

mn

69

pouco

tu

mundo

any

jour

ome

ancora

apoi (adv.)

70

coma

coisa

vivir

arribar

donner

souto

occhio

spre
(prep.)

71

chegar

conhecer

pasar

gran

aussi

lu

guardar

bine (adv.)

72

tempo

dia

casa

bo

autre

aqu

mano

trece

73

galego

dois

despus

pensar

dont

man

parola

loc

131

O galego fundamental: Dicionario de frecuencias

gal.

port.

cast.

cat.

fr.

prov.

it.

rom.

74

entre

ouvir

saber

mig

te

crida

chi

a(i)-ci
(adv.)

75

al

pai

siempre

nos

aller

mstre

grande

atunci
(adv.)

76

algn

pensar

cosa

encara

oui

vii

amare

pn (prep.)

77

si (adv.)

sentir

hablar

ull

rien

quau

mettere

cap

78

nin

passar

desde

mai

quand

jouine

parte

an

79

anda

tempo

sino

parlar

si (adv.)

ri

poi

sub(t)
(prep.)

80

primeiro

corao

donde

tot (adv.)

premier

soulu

quanto

bun

81

sobre
(prep.)

mo

nuevo

aix

mme

vostre

sempre

rmine

82

seor

olhar

tambin

sentir

trouver

car

vecchio

sta

83

chamar

te

slo

entrar

heure

tres

ogni

altul
(pron.)

84

grande

velho

pueblo

pas (adv.)

croire

vers

tempo

vreme

85

falar

ainda

ahora

tant

prendre

encaro

prendere mult

86

tanto

ano

mano

sortir

votre

saupre

dio

pune

87

cousa

hora

mil

hora

moins

rn

signore

singur
(adx.)

88

ata

nada

tres

on

bon

snse

vita

urm

89

parte

pouco

llevar

obrir

celui

blanc

pensare

ncepe

90

deixar

sobre

bien

vegada

temps

ne

primo

lsa

91

home

noite

dejar

posar

chose

uei

tuo

ct

algun

paure

certo

prea

92

noso

paixo

ojo

93

pois

encontrar sempre

alors

plen

solo

via

94

nada

senhor

salir

vida

vie

passa

molto

peste
(prep.)

95

te

grande

quien

aix

toujours

toumba

pmnt

96

quedar

porta

nada

damunt

femme

ansin

voi

uita

97

ti

sim

pensar

mirar

parler

ni

allora

trei

98

sempre

al

aqu

temps

donc

terro

amore

mult

99

medio

aqu

poner

sobre

entre

courre

bene

tot

100

andar

parecer

sentir

entre

jamais

aigo

casa

vorb

tout

Da anlise das distintas listas pdense tirar as seguintes conclusins:


Canto mis frecuente un lema mis posibilidades hai de coincidencia entre as distintas linguas romnicas comparadas.
4.

O artigo manexado incle tres veces a forma tout na columna francesa nas posicins 29, 58 e 92.

132

Mara Xess Bugarn Lpez

Os lemas mis frecuentes son palabras gramaticais. Salientan de


xeito especial os artigos o e un, a conxuncin copulativa e e as preposicins de e a.
As primeiras palabras lxicas en aparecer son verbos. Os mis frecuentes son ser, haber, ter e estar, xusto os mis desemantizados.
Os substantivos comns s oito linguas comparadas son: da,
tempo e home. Os dous primeiros lemas responden necesidade
humana dunha referencia situacional no tempo ou no espazo na
sa producin lingstica (a forma ano rexstrase en seis das linguas comparadas). O terceiro lema aglutina distintas acepcins
que van desde a mis xenrica ser humano ata a mis especca
ser humano adulto de xnero masculino ou cnxuxe de xnero
masculino.
3.2.2.3. Os cen primeiros lemas por categora
(a) Os cen substantivos mis frecuentes:

Se nos achegamos aos datos desde o punto de vista semntico posible establecer unha serie de grupos atendendo a campos nocionais5:
5.

En ocasins algn dos lemas pode aparecer en mis dun grupo xa que a ampla frecuencia est en relacin
directa coa posibilidade de posur varias acepcins.

O galego fundamental: Dicionario de frecuencias

133

Tempo cronolxico: ano, da, tempo, vez, noite, mes, momento, hora,
sculo.
Ser humano: seor, home, muller, xente, neno, mozo, grupo, rapaz,
sociedade, don, persoa, vello, vecio, amigo.
Familia. Este campo est moi relacionado co anterior e case funcionando coma un subcampo: llo, pai, irmn, nai, to. Hai que inclur aqu tamn home esposo, muller esposa, neno llo, mozo
noivo, rapaz llo e vello av.
Espazo e medio fsico: casa, parte, auga, terra, lugar, mar, mundo,
camio, zona, illa, lado, monte, situacin, campo, cidade, sitio.
Outros campos que ocupan un lugar importante nesta listaxe son
os referidos ao corpo humano (ollo, cabeza, corpo, lingua), aos alimentos (auga, vio, pan), s relacins laborais (traballo, obra, producin, sistema, empresa), poltica (pas, estado, lei, pobo, goberno),
aos sentimentos (verdade, amor, medo), relixin (deus, igrexa).
Os campos nocionais documentados permiten armar que o mundo
xira ao redor do ser humano, que se describe a si mesmo fsica e psicoloxicamente, que se sita no espazo e no tempo, e que se organiza socialmente.
(b) Os cen adxectivos mis frecuentes:

134

Mara Xess Bugarn Lpez

Despois de observar os cen adxectivos mis frecuentes pdense facer


as seguintes observacins:
Os adxectivos que teen mocin xenrica son o 61,58%. Os nicos
que non responden ao modelo masculino o / feminino a son: bo,
s e espaol (fem. + -a).
Os adxectivos sintticos poden ser positivos, comparativos ou superlativos. Na relacin obsrvase que, ao igual que aparecen as
formas positivas bo, grande e pequeno, entre as mis frecuentes
tamn estn a ese nivel as sas correspondentes comparativas:
mellor, maior e menor.
Importante tamn o nmero de adxectivos que atopan na mesma lista outro(s) lema(s) co(s) que poden establecer distintos tipos de relacin semntica: grande/pequeno; bo/malo; novo/vello;
maior/menor; alto/baixo; branco/negro/verde; longo/curto; rural/
urbano; claro/escuro; antigo/moderno; distinto/igual; anterior/
posterior; pobre/rico; pblico/privado; actual/histrico; superior/
inferior; morto/vivo; industrial/agrario; semellante/diferente; difcil/doado; galego/espaol.
(c) Os cen verbos mis frecuentes:

O galego fundamental: Dicionario de frecuencias

135

Unha vez examinada a lista de frecuencia pdense tirar as seguintes


observacins:
O verbo copulativo ser ocupa a primeira posicin. A pouca distancia sitase o verbo estar.
Nas primeiras posicins estn aqueles verbos que teen, entre as sas posibles funcins, a de poder desempear o papel
de verbo auxiliar en perfrases: ser, ter, ir, haber, estar, poder, dar,
vir, querer, levar, chegar, deixar, andar, deber, botar, volver, seguir,
empezar~comezar, acabar. Nas ocorrencias do verbo ser ine ademais a voz pasiva.
Moitos dos verbos da listaxe manteen entre si relacins semnticas de oposicin, de complementariedade, etc.: ir/vir; sar/entrar;
vender/comprar; levar/traer; quedar/marchar; nacer/vivir/morrer;
coller/deixar; subir/baixar; empezar~comezar/rematar~acabar;
buscar/atopar; meter/pr/sacar; preguntar/dicir; etc.
(d) Os cen adverbios6 mis frecuentes:

6.

Na lista dos cen adverbios a aparicin do smbolo (+) indica que a palabra remata en mente. Esta solucin
veu motivada por razns de espazo.

136

Mara Xess Bugarn Lpez

Dos adverbios da lista pdense facer algunhas observacins:


O adverbio mis frecuente non. As sas ocorrencias supoen un
23,27% sobre os cen adverbios mis frecuentes, e o 21,89% sobre o
total do corpus.
Contrasta fortemente a alta porcentaxe de aparicin do adverbio de negacin non (29.809) en relacin ao adverbio armativo
si (2.844). Si e non poden actuar como adverbios substitutivos dun
enunciado completo: Vs canda min? Si (ou Non). Con todo,
mentres que se utiliza o adverbio non para indicar o carcter negativo dun predicado (o neno non come ben) ou de calquera dos
elementos (unha vida non fcil), non se utiliza si para indicar o carcter armativo.
O segundo adverbio da lista que destaca sobre o resto polas ocorrencias no corpus o de cantidade mis. Ao seu alto ndice de
aparicin contribe sen dbida o feito de ser o procedemento habitual de formacin do grao comparativo de superioridade.
Dentro dos adverbios con frecuencia superior a 1.000, o grupo mis
numeroso o formado polos adverbios de tempo: xa, despois, agora, sempre, anda, hoxe, entonces, nunca, logo, antes.
Dentro dos adverbios de lugar os predominantes son os que pertencen serie rematada en : aqu, al e a, nesta orde. Das series
en (ac, al), en (ac, al), s se rexistran entre os cen primeiros lemas as formas correspondentes 3 persoa: al, al, pero non
as que indican un maior grao de proximidade: ac, ac.
Dos cen lemas mis frecuentes 26 corresponden a adverbios rematados en -mente. O primeiro en aparecer soamente.
Se eliminamos os adverbios que rematan en mente entraran
na lista os seguintes lemas: endexamais, peor, nada, tras, cerca,
dabondo, embaixo, denantes, canto, detrs, acol, quizabes, cecais,
seguro, acaso, xusto, total, ac, alomenos, preto, recn, decote, amais,
debaixo, encima, lexos7.

7.

Neste traballo non foron eliminados aqueles castelanismos que o autor usa inconscientemente coma se
fose palabra galega: carretera, jueves etc. Estes casos adoitan rexistrarse maioritariamente nos traballos
que recollen material oral, rexistro non-formal.

O galego fundamental: Dicionario de frecuencias

137

3.2.2.4. Algns campos lxicos


Un corpus deste tipo permite tamn o estudo de campos lxicos. Ao
falar dos substantivos despuntaron xa os relacionados co tempo cronolxico, co ser humano e a familia, co espazo e o medio fsico. Vexamos,
por exemplo, o lxico que xorde, con mis de 100 ocorrencias, ao traballar os seguintes campos: os animais e os alimentos.
Os animais: vaca, peixe, besta, can, burro, animal, cabalo, lobo, gando, paxaro, ovella, gato, ave, raposo, porco, boi, galo, galia, egua,
gaivota, becerro, corvo, sardia, cabra, pito. Neste apartado habera que ter en conta as variantes dialectais de etimoloxa distinta
(golpe, cuxo, xato, etc.) con frecuencias inferiores e sumalas para
coecer a realidade.
Os alimentos: auga, vio, pan, peixe, leite, carne, millo, uva, ovo, pataca, [froito], comida, caf, aceite, gran, augardente, azucre, castaa,
sal, caldo, trigo, faria, sardia, pera, maz. Neste campo tamn sera conveniente inclur algns dos elementos do campo anterior
(ave, porco, galo, galia ou becerro).
Unha vez extrados os datos, depurados e ordenados despois de engadir as variantes dialectais con timos distintos, poderase establecer a
maior ou menor frecuencia de uso. Unha lista con esa informacin servira de base para a elaboracin, por exemplo, de exercicios de aprendizaxe
de lxico segundo campos semnticos.

4. conclusin
A travs desta breve exposicin quixemos dar a coecer o Galego fundamental. Dicionario de frecuencias, sen deixar de lado o corpus-base e a
informacin que del se pode extraer. Cando afrontamos o traballo de investigacin o obxectivo que se persegua era, en suma, contribur ao mellor coecemento da vitalidade do lxico da lingua galega, as como poder
establecer un punto de partida slido sobre o que basear a elaboracin de
material didctico nos distintos niveis educativos, a extraccin de datos
tiles para o desenvolvemento de ferramentas de enxeara lingstica e
de tecnoloxas da fala, etc. Se o conseguimos, anda que s fose por encetar novos camios, dariamos por bo o presente labor.

138

139

O CORPUS DE REFERENCIA DO GALEGO ACTUAL (CORGA):


PRESENTE E FUTURO
Eva M Domnguez Noya

Centro Ramn Pieiro para a Investigacin en Humanidades

As posibilidades de recuperacin de informacin nun corpus dado


incremntanse notablemente en consonancia co seu grao de codicacin. Canto mis estruturado e codicado estea este mis informacin
extraemos das buscas. Pnsese que se os textos estn marcados exhaustivamente sempre podemos decidir, como usuarios, se nos interesa toda a
informacin resultante da busca executada ou se pola contra nos limitamos a estudar as diferentes ocorrencias da busca obxecto de estudo. Se o
texto non presenta marcas de ningn tipo ou estas son mnimas teremos
que cinguirnos a buscas moi simples e a informacin que desexamos ou
non a podemos obter ou precisaremos dar moitas voltas para conseguila. Por exemplo, se os textos que integran un corpus non teen asignada
unha rea temtica que os caracterice ser tarefa ardua delimitar os mbitos nos que unha palabra ou expresin se emprega.
Como saben todos os que nalgn momento consultaron o Corpus de
Referencia do Galego Actual (CORGA), este un corpus documental que
en novembro de 2006 consta duns 13 millns de formas, integrado por
distintos tipos de textos xornais, semanarios, revistas, ensaios e textos
de ccin (novela, relato curto e teatro), que abrangue temporalmente
dende o ano 1975 ata a actualidade e que estn codicados no estndar
XML (eXtensible Markup Language). E aqu, cando falamos de codicacin,
refermonos principalmente informacin bibliogrca e estruturacin
do documento. Exemplicando cun texto xornalstico, o XML permtenos
considerar un xornal como un nico documento que est organizado en
noticias, as cales, sa vez, conteen obrigatoriamente un corpo e opcionalmente un titular, resumo e/ou p de foto. A maiores, cada un destes elementos est constitudo por pargrafos (texto comprendido entre
dous puntos e parte) e estes son segmentados en oracins (secuencia
textual separada do resto do texto por un punto, punto e coma, dous pun-

140

Eva M Domnguez Noya

tos, etc.). Esta disposicin detallada habilita a posibilidade de realizar consultas sobre a totalidade do documento (noticia) ou sobre unha unidade
estrutural concreta (titular, resumo, p de foto ou corpo). A codicacin
incle ademais a marcacin de fragmentos que aparecen nunha lingua
distinta do galego as evitamos indexar eses fragmentos e impedimos
que engorden os datos totais do corpus no referente a nmero de palabras
e tamn que se poidan realizar buscas sobre eles, os poemas, as entrevistas, as tboas, as frmulas, etc.
Sobre este conxunto de formas grcas posible facer buscas de palabras ou expresins en xeral, por tipos de texto, pocas, reas temticas
ou calquera combinacin dos parmetros anteriores. Proximamente contamos con poer na rede unha nova versin do CORGA que, ademais de
chegar aos case 20.000.000 de formas, engade un novo sistema de consulta
da nmina de autores e obras que permite buscar que obras ou autores
estn no corpus, saber que nmero de palabras totais e documentos corresponde busca realizada ou que cantidade de palabras contn o CORGA nunha certa rea temtica, perodo de tempo, etc.
Por exemplo, se buscamos unha forma como abreconcertos nos xornais que tean como rea temtica principal economa e poltica, nos resultados da consulta, cando se nos ofrece o nmero de oracins e documentos atopados de todo o corpus, podemos visualizar o nmero de palabras e
documentos que cumpren as condicins esixidas na consulta inicial.
Somos conscientes, sen embargo, de que para facer buscas mis
avanzadas imprescindible que os textos do CORGA estean lematizados
e etiquetados, e levamos xa algns anos traballando nesta direccin, e
aqu, cando falamos de etiquetacin, debemos aclarar que entendemos
esta como o proceso mediante o cal a cada unidade lxica se lle asigna un
lema e unha etiqueta. En concreto, no Centro Ramn Pieiro para a Investigacin en Humanidades desenvlvese paralelamente construcin do
CORGA un proxecto denominado Etiquetador e lematizador do galego actual destinado precisamente a lematizar e etiquetar os textos de CORGA,
ao que internamente coecemos como XIADA, e sobre o que imos centrar
este traballo tal como nos solicitaron os organizadores deste volume.
hora de abordar a construcin dun analizador e etiquetador cmpre
atender as seguintes frontes:
(1) Determinacin dun sistema de etiquetas.
(2) Deseo da estrutura do lexicn e construcin deste.
(3) O preprocesador.
(4) O etiquetador.

O Corpus de Referencia do Galego Actual (CORGA): presente e futuro

141

1. determinacin dun sistema de etiquetas


Se queremos asignarlle s formas de CORGA unha etiqueta, primeiro
deberemos decidir que etiquetas imos empregar, que clases morfolxicas
imos distinguir e que atributos as van caracterizar, e para iso imprescindible delimitar un etiquetario ou tagset.
O etiquetario para o galego foi desenvolvido no marco do proxecto
Construcin, etiquetacin e lematizacin do Corpus de Referencia do Galego Actual como unha ferramenta para a anlise computacional e a
anotacin automtica dos textos do CORGA. Para a elaboracin desta etiquetaxe seguronse as recomendacins de EAGLES (Leech / Wilson 1996)
e os textos bsicos da lingstica galega. As, o sistema de etiquetacin de
XIADA presenta unha estrutura xerrquica na que no primeiro nivel se
identica a categora morfolxica e nun segundo os atributos gramaticais pertinentes que constiten o conxunto bsico de atributos para cada
categora. Esta divisin en dous niveis percbese claramente no formato:
a letra que identica a clase de palabra que pertence o elemento vai en
maiscula e o valor dos atributos represntase con minsculas.
Na construcin do tagset primamos a descricin morfolxica e reducimos a informacin sintctica caracterizacin de determinadas categoras
cuxos elementos integrantes poden funcionar como determinantes ou non
determinantes. Delimitamos, en primeiro lugar, as clases de palabras existentes e a continuacin establecemos os atributos gramaticais pertinentes
que permitisen o recoecemento morfolxico de calquera palabra:

Tipo

d-Determinado
Artigo
(D) 1 i-Indeterm. 2

Adverbio n-Nuclear
(W) 1 m-Modificador
a-Nucleo e
Modificador
r-Relativo
g-Int.-Exctivo 2

Conxuncin c-Coordinante
(C) 1 s-Subordinante 2

Preposicin
(P) 1

Verbo
(V) 1

3
3

Xnero

Nmero

0- Non
aplicable

0-Non
aplicable

Adxectivo
(A) 1

Substantivo c-Comn
(S) 1 p-Propio

Categora

e- Plural

n-Neutro

m- Masculino
f- Feminino s- Singular
a- Masculino p- Plural
e- Feminino a- Singular

Grao

Persoa

s- Superlativo a-Primeira e
Terceira
0-Non
0-Non
aplicable
aplicable

1-Primeira
2-Segunda
c- Comparativo 3-Terceira

e-Pretrito

p-Presente
i-Copretrito
l-Antepretrito
f-Futuro
x-Xerundio

Caso

Tempo verbal
Modo

Posuidor

a-Singular
e Plural

p-Plural

i-Indicativo
s-Subxuntivo
m-Imperativo
f-Infinitivo
s-Singular

b-Acus./Dat./ c-Postpretrito p-Participio


Imp.

l-Acus./Dat.

n-Nominativo
a-Acusativo
d-Dativo
i-Impersoal
p-Preposicional
r-Nom./Prep.

Modo

a-Determinante
e non Determ.

n-Non
Determinante
d-Determinante

142
Eva M Domnguez Noya

5
3
4

Posesivo
(M)
1

Indefinido
(I)
1

c - Cardinal
Numeral
(N)
1 o - Ordinal

t- Tnico
Pronome
(R)
1 a - tono

f- Frmula
Categora
a- Abreviatura
Perifrica
(Z)
1 g- Sigla
s- Smbolo
o- Outros tipos
2

Sinal de
puntuacin
(Q)
1

Interxeccin
(Y)
1

Exclam./ Interr
(G)
1

Relativo
(T)

Demostrativo
(E)
1

O Corpus de Referencia do Galego Actual (CORGA): presente e futuro

143

144

Eva M Domnguez Noya

Como se pode observar no tagset de XIADA que acabamos de reproducir (dispoible en http://corpus.cirp.es/xiada), na primeira columna recllense as categoras gramaticais e as letras coas cales as
denominamos:

Adverbio
Adxectivo
Artigo
Conxuncin
Demostrativo
Exclamativo-Interrogativo
Indenido
Interxeccin
Locucin
Numeral
Posesivo
Preposicin
Pronome
Relativo
Sinal de Puntuacin
Substantivo
Verbo
Categora Perifrica

W
A
D
C
E
G
I
Y
L
N
M
P
R
T
Q
S
V
Z

Nas seguintes columnas recllense os atributos e os valores destes e,


por ltimo, nas las incorprase un nmero que indica a posicin que o
atributo, se pertinente, ocupa dentro da etiqueta nal.
A distribucin dos atributos dentro de cada categora simtrica, de
tal xeito que todos os elementos pertencentes a unha categora dada posen o mesmo nmero de atributos e os seus valores ocupan a mesma
posicin dentro da cadea resultante.
Hai, sen embargo, etiquetas nas que en relacin co grao de especicacin ao que queiramos chegar, ou ben porque a atribucin dun valor
inequvoco sexa imposible, podemos neutralizar o valor dalgn ou de
varios atributos. Por exemplo, nun texto de prensa, atopmonos coa expresin perigos e incertezas existentes, onde non sabemos se o adxectivo
concorda co substantivo masculino perigos, co feminino incertezas ou
cos dous. Nestes casos necesario manter a ambigidade, polo que a palabra existentes se etiqueta como Adxectivo grao non aplica masculino
ou feminino plural (A0ap). En XIADA marcamos esta ambigidade co

O Corpus de Referencia do Galego Actual (CORGA): presente e futuro

145

valor a, que representar o xnero, nmero, persoa, posuidor ou valor


dependendo da clase de palabra e da posicin que ocupe na cadea de
etiquetaxe.
Por outra banda, non todos os elementos pertencentes a unha
mesma categora morfolxica responden positivamente aos atributos
que a caracterizan. As, na categora verbal, o atributo xnero s un
trazo pertinente para a caracterizacin do participio. Para o resto de
elementos do paradigma verbal a aplicacin do atributo xnero non
pertinente. Por este motivo creamos un valor 0 co signicado de Non
aplica.
Considerronse como atributos primordiais os seguintes: tipo, subtipo, xnero, nmero, grao, persoa, caso, tempo verbal, modo, posuidor e
valor. Combinando as clases gramaticais delimitadas e os atributos que
as caracterizan, o noso sistema de etiquetacin presenta un total de 409
etiquetas posibles.
Poderiamos explicar detalladamente a escolla dos valores de cada un
destes atributos e como afectan clase implicada pero o espazo de que
dispoemos non moito e cremos que outras fases do proxecto resultan
tan interesantes ou mis.

2. deseo da estrutura do lexicn e construcin deste


Normalmente os etiquetadores necesitan un lexicn onde almacenar a informacin de etiqueta e lema que lle corresponde a cada palabra.
Ademais, anda que os etiquetadores intentan adiviar a etiqueta dunha
forma que non estea presente no lexicn, canto maior sexa este, mis posibilidades de acerto hai.
hora de afrontar a elaboracin dun recurso lxico e gramatical
calquera destinado a un uso computacional fundamental que o deseo deste cubra todas as necesidades actuais e, ao tempo, contemple
as futuras.
Por unha banda, dado que a introducin e xestin dos datos debe ser
cmoda, consideramos que calquera entrada do lexicn debe ser caracterizada morfoloxicamente desagregndoa en lema1, raz2, subetiqueta3 e

1.

Xeralmente correspndese coa entrada dun dicionario. Por exemplo neno.

2.

Segmento inicial do lema sen desinencia se esta recorrente. Por exemplo nen.

3.

Denicin e caracterizacin morfolxica da forma obxecto de anlise sempre e cando estea completa e
non a enviemos a ningn grupo derivacional.

146

Eva M Domnguez Noya

grupo de derivacin4. Esta estrutura esixiu un estudo formal detallado dos


integrantes de cada unha das clases gramaticais variables para agrupalos
en modelos e deste xeito construr a gramtica formal que nos permitise
analizar e tamn xerar as formas exionadas e conxugadas do galego moderno. Evitamos as, por exemplo, introducir manualmente as 65 formas
pertencentes a calquera verbo e inclumos s as races, asignndolles a
subetiqueta Verbo e envindoos ao grupo de derivacin que corresponda.
Por outra banda, o noso lexicn non s unha base de datos na que
constan os lemas coas respectivas indicacins morfolxicas de clase gramatical, xnero, nmero, tempo, modo, etc., senn que tamn nos proporciona mis informacin sobre cada unha das entradas, informacin non
s morfolxica senn tamn lingstica.
As, en primeiro lugar, o recoecemento e caracterizacin das formas
existentes nos textos reais contemporneos galegos esixe que o lexicn
estea integrado por lemas normativos e non normativos. Se a construcin do lexicn se realizase con suxeicin actual normativa ortogrca
e morfolxica da lingua galega, a etiquetacin e anlise dos textos dun
corpus representativo do galego actual como o CORGA non sera de utilidade para os investigadores posto que quedaran numerosas formas
sen recoecer automaticamente. Pareceunos interesante, en consecuencia, rexistrar na estrutura do lexicn o parmetro da normatividade ou
non dos lemas e das formas. Por que, ademais, das formas? Basicamente,
porque a normatividade do lema non implica a normatividade da forma.
Por exemplo, fosemos, forma totalmente correcta ata xullo de 2003 en que
entrou en vigor a actual normativa, remtese ao lema ser ou ir, normativos, sen embargo, per se, un token que responde negativamente
normativa actual.
A economa lingstica e a reiteracin impennos a obriga de aplicar
este parmetro a algunhas desinencias xa que caracterizan formas dialectais recorrentes nos textos. bastante frecuente, por poer un exemplo,
para a 3 persoa do pretrito de indicativo dos verbos da 2 conxugacin,
a aparicin de formas coa vogal temtica i no sitio da normativa e. Coa
4.

Conxuntos de desinencias para as que se proporcionan uns valores. Por exemplo o grupo G1 consta de:
o: masculino singular
a: feminino singular
os: masculino plural
as: feminino plural
Deste xeito, para todos os substantivos e adxectivos que rematan en -o, fan o feminino en -a e forman
o plural engadindo -s, tipo neno, introducimos s o lema e a raz correspondente, sen necesidade de ter
que inclur completas as formas masculina e feminina cos respectivos plurais.

O Corpus de Referencia do Galego Actual (CORGA): presente e futuro

147

estrutura que empregamos en XIADA a opcin mis rendible a de caracterizar -iu no seu valor de ei3s05 como non normativa no grupo V2 segundo o que se conxugan todos os verbos regulares da 2 conxugacin.
Outro exemplo: os grupos G2 e G3 foron creados para exionar os
substantivos e adxectivos cuxo masculino singular remataba en -n e
facan o feminino en - e -ana respectivamente. A aplicacin da normativa ocial reduce considerablemente o nmero de elementos que van ao
grupo G3 incrementando o G26. Ao igual que suceda cos lemas, debemos
manter as caractersticas dos dous grupos para que o analizador recoeza e caracterice as formas existentes nos textos anteriores normativa
ocial actual pero tamn temos que introducir as modicacins precisas
para que as novas formas normativas sexan recoecidas e analizadas. A
opcin mis intelixente parece ser a caracterizacin das desinencias -ana
no G2 e - no G3, cos respectivos plurais, como non normativas.
interesante e sobre todo til, desde o punto de vista lingstico, diferenciar na estrutura do lexicn mdulos segundo o tipo de lxico que contean e con que poidan ser combinados. Para iso dispuxemos no deseo
da estrutura, e obviamente implementamos na construcin do lexicn,
dun campo mis no que se caracteriza o lema como pertencente ao lxico
comn ou ao tcnico-cientco, especicando neste ltimo o mbito no
que se clasica: administracin, economa, medicina, etc.
Relacionado co punto anterior est a inclusin na estrutura do lexicn
dun indicador que nos marca a procedencia de cada un dos lemas. Nos
textos actuais presntanse formas que non aparecen nos dicionariosvocabularios preceptivos da lingua galega DRAG (1997) e o mis recente
VOLG (2004), ben porque son termos tcnicos para os que se acaba de
propoer unha denominacin, ben porque se documentan cun uso categorial distinto. Non obstante, a sa introducin no lexicn imprescindible para o recoecemento e caracterizacin dos textos. Coa indicacin da
5.

Pretrito de Indicativo, 3 persoa do singular, non aplica xnero.

6.

Na normativa ocial anterior seguan o esquema -n / -ana (as races e lemas destas formas remitanse
en XIADA ao grupo de derivacin G3), mentres que na actual se acomodan ao esquema -n / - (debemos
remitir as races e lemas ao grupo de derivacin G2) as formas seguintes: afgn, alazn, alemn, barregn,
bosquimn, capitn, cataln, ermitn, escribn, gardin, musulmn, run, sancristn, sultn e trun.
O G2 consta das seguintes terminacins, que caracterizamos formalmente como:
n: masculino singular
ns: masculino plural
: feminino singular
s: feminino plural
ana: feminino singular (*)
anas: feminino plural (*)

148

Eva M Domnguez Noya

fonte achegamos datos concretos sobre a localizacin do lema e a abilidade da forma.


Finalmente, polo que respecta aos parmetros de tipo de lxico e fonte, consideraremos que o VOLG (2004), como texto sancionador mis recente e posuidor dun nmero de entradas aceptable, denir os lemas
pertencentes ao lxico comn ou principal do lexicn de XIADA.
Para que a estrutura do lexicn sexa permeable e mis accesible
identicacin e asignacin dos distintos modelos formais que o integran,
inserimos no deseo da estrutura un representante de grupo que serve de
modelo para cada un dos grupos existentes en XIADA. As, o representante de grupo do grupo derivacional G1 neno.
Recapitulando, o lexicn de XIADA, ademais de conter a informacin
morfolxica que permite a identicacin e caracterizacin morfolxica
plena de calquera palabra galega, responde aos parmetros seguintes: indicacin sobre a normativa ocial, mbito lxico e procedencia da forma.
Unha vez deseada a estrutura do lexicn, implementmolo coas entradas do VOLG (2004) e coas 70.000 formas mis frecuentes de CORGA, o
que vn sendo algo mis de 51.000 lemas. Na seguinte tboa podemos ver
o nmero de lemas e races das categoras principais do lemario de Xiada:
CLASE
GRAMATICAL

LEMAS

RACES

FORMAS

Adverbio

1.906

1.916

1.916

Adxectivo

13.574

13.625

44.899

Substantivo

28.806

28.943

62.074

Verbo

6.690

9.113

367.220

Un lexicn non ten por que estar destinado unicamente a etiquetar


e lematizar un texto. Se o sucientemente detallado e complexo pode
servir de punto de partida para outras utilidades como a construcin dun
corrector ortogrco ou un conxugador de verbos.

3. preprocesador
Lingisticamente, unha vez elaborados os modelos formais que van
acoller as races e grupos de derivacin e implementado o lexicn computacional, estamos en disposicin de etiquetar automaticamente calquera texto galego contemporneo. Trtase simplemente de executar o

O Corpus de Referencia do Galego Actual (CORGA): presente e futuro

149

programa que o equipo informtico do proxecto est desenvolvendo para


traballar con arquivos codicados en XML (cfr. http://corpus.cirp.es/xiada), porque ese o formato no que estn os textos de CORGA.
Un preprocesador, en xeral, delimita as distintas unidades lxicas que
hai nun texto. Pode parecer sinxelo pero non tarefa banal segmentar
formas verbais con pronomes enclticos ou separar os formantes dunha
contraccin. Seguimos traballando para que cometa menos erros pero
inevitable que nalgns casos de ambigidades falle de vez en cando. un
traballo informtico pero no que o equipo lingstico participa coa construcin de regras que gobernan o comportamento do preprocesador. Por
exemplo, cando estabamos comprobando o funcionamento das formas
verbais con clticos, hai xa bastante tempo, atopmonos con que para o
token semana propoa unha etiqueta na que o segmentaba en se (raz
verbal), ma (contraccin dos pronomes me mis a) e o ltimo constitunte
formbao o alomorfo do pronome acusativo de terceira persoa na. Vimos
entn a necesidade de construr unha regra que impedise anlises coma
esta, polo que creamos unha na que indicabamos que na mesma secuencia
non pode haber dous clticos de acusativo e, ademais, no, na, nos, nas, pronome tono acusativo de terceira persoa, s ser unha etiqueta posible se
vai encltico a unha forma verbal rematada en ditongo e en ningn outro
caso.
O preprocesador, no noso caso, ademais, despois de delimitar as unidades, asgnalle a cada unha os lemas e etiquetas posibles.
As, a sada do documento preprocesado proporcionaranos o texto
analizado contendo para cada palabra grca ou token todas as posibles
anlises morfolxicas.
Por exemplo, o preprocesador ante un token como polos, no que non
s hai ambigidade morfolxica senn que tamn a segmentacin da
forma en constituntes vara, proporciona as seguintes anlises:
(1) Unha alternativa na que o clasica como substantivo comn
masculino plural cuxo lema polo:
<alternativa>
<constitunte>
<forma>polos</forma>
<etq_lema>
<etiqueta>Scmp</etiqueta>
<lema>polo</lema>
</etq_lema>
</constitunte>
</alternativa>

150

Eva M Domnguez Noya

(2) Noutra alternativa segmntao en dous constituntes denindo


o primeiro como a preposicin por e o segundo como o artigo determinado masculino plural cuxo lema o:
<alternativa>
<constitunte>
<forma>por</forma>
<eta_lema>
<etiqueta>P</etiqueta>
<lema>por</lema>
</eta_lema>
</constitunte>
<constitunte>
<forma>os</forma>
<eta_lema>
<etiqueta>Ddmp</etiqueta>
<lema>o</lema>
</eta_lema>
</constitunte>
</alternativa>

(3) Na ltima alternativa segmntao en pos, 2 persoa do presente


de indicativo dos verbos pr e poer e mais o pronome tono de
acusativo de terceira persoa masculino plural cuxo lema o:
<alternativa>
<constitunte>
<forma>pos</forma>
<eta_lema>
<etiqueta>Vpi2s0</etiqueta>
<lema>poer</lema>
</eta_lema>
<eta_lema>
<etiqueta>Vpi2s0</etiqueta>
<lema>pr</lema>
</eta_lema>
</constitunte>
<constitunte>
<forma>os</forma>
<eta_lema>
<etiqueta>Raa3mp</etiqueta>
<lema>o</lema>
</eta_lema>
</constitunte>
</alternativa>

O Corpus de Referencia do Galego Actual (CORGA): presente e futuro

151

Neste punto teriamos o documento coas etiquetas e lemas posibles.


Dado que para poder facer as buscas nel necesitamos ter a etiqueta correcta da palabra e non todas as posibles, temos das opcins:
(1) Determinar manualmente cal a correcta.
(2) Que un sistema automtico decida cal a correcta.
aqu onde entra en xogo o punto seguinte, o etiquetador, que simplemente escolle a etiqueta e o lema correctos para cada unha das palabras.

4. etiquetador
Antes de que se poida empregar un etiquetador automtico estatstico, como o caso, necesario adestralo desambiguando manualmente
un subconxunto de textos. Obviamente canto maior sexa o volume de
textos que se desambigen man mis probabilidades hai de que acerte
o etiquetador. O noso obxectivo, ademais, que, fronte ao 95/96% de acerto que presentan os etiquetadores existentes para o ingls para o galego
non hai estatsticas, o noso etiquetador alcance un acerto do 99%.
A utilizacin do preprocesador e do etiquetador automtico vainos
resultar til para atender das frontes: por unha banda, revisar as anlises obtidas automaticamente e, pola outra, tomar nota das formas descoecidas para mellorar o seu funcionamento e incrementar o lexicn
computacional.
Esperamos que proximamente sexa posible consultar tanto o lematizador e o etiquetador en rede como un subcorpus de CORGA lematizado
e etiquetado.

152

153

O ARQUIVO DO GALEGO ORAL


E O SEU APROVEITAMENTO LEXICOGRFICO
Francisco Fernndez Rei / Carme Hermida Gulas

Instituto da Lingua Galega (USC)

Desde a sa creacin en 1971, unha das principais lias de investigacin do Instituto da Lingua Galega (ILG) da Universidade de Santiago de
Compostela foi a recolleita sistemtica do galego oral tanto na Galicia
administrativa como nas comarcas estremeiras do Eo-Navia (Asturias), O
Bierzo (Len) e As Portelas (Zamora), onde o galego tamn lingua propia.
Ese material usouse para redactar monografas lxicas ou gramaticais ou para ser cartografado, como ben se pode ver nos volumes editados
do Atlas Lingstico Galego (ALGa), nos de morfoloxa e fontica dos anos
90 e nos volumes lxicos que desde o 2003 se comezaron e publicar e que
en conxunto constituirn unha excelente achega para redactores de dicionarios e doutras obras lexicogrcas.
Cando anda estaba indito, moito deste material oral utilizouse nas
diversas propostas de codicacin morfolxica e lxica realizadas desde
mediados dos anos 70 polo ILG, en solitario ou en colaboracin con outras
entidades, particularmente coa Real Academia Galega. Os paradigmas
verbais da normativa vixente ou os nomes dos das da semana e dos meses do ano, por poer s uns exemplos, son como son en boa parte merc
revelado e posterior interpretacin de fotos do galego oral realizadas
por investigadores do ILG.
Ademais, especialmente desde 1974, diversos membros do Instituto
rexistraron ininterrompidamente etnotextos na prctica totalidade do
dominio lingstico galego, vez que dirixiron traballos acadmicos de
moi diverso tipo onde o material estudado eran mostras orais con unha
ou con mis dunha persoa informante. Estas gravacins, algunhas con
mis de 30 anos de vida, xunto con moitas outras fornecidas por xente
que non do ILG, pero que as depositou al para que estean a disposicin dos investigadores, constiten o esencial do Arquivo do Galego Oral

154

Francisco Fernndez Rei / Carme Hermida Gulas

(AGO). Na xnese deste Arquivo est o labor pioneiro de Constantino Garca, fundador do ILG, e tamn o de Antn Santamarina, que nos animaron
a moitos, cando eramos estudantes universitarios, a recoller e traballar o
galego oral.
Nesta presentacin trataremos en primeiro lugar o estado xeral do
AGO e dos traballos e publicacins que del derivaron; e a seguir daremos
unha mostra do aproveitamento lxico dese material.

1. estado do arquivo do galego oral


O AGO contaba a nais do 2006 con mis de 2.000 horas de gravacins,
con voces duns 7.000 informantes rexistradas na maiora dos 315 concellos de Galicia e tamn en boa parte dos 38 concellos de fala galega de
Asturias, Len e Zamora. Tamn conta con mostras dos concellos cacereos do Val de Xlima (ou Val do Ellas) onde se emprega un falar tambm
essencialmente galego, en palabras de Lindley Cintra (1959: 536).
Dun xeito moi aproximado podemos dicir que un terzo de todo o material do AGO, se cadra algo mis, est transcrito e clasicado por temas;
outro terzo est simplemente odo e clasicado tematicamente, mentres
que do terzo restante s hai rexistro das gravacins, e anda non de todas.
O AGO confrmano actualmente cinco subarquivos: tres de etnotextos, clasicados cronoloxicamente, un de msica popular e outro de
textos nun rexistro formal. Imos describir con mis detalle o estado dos
subarquivos de etnotextos, por seren os de maior interese para o aproveitamento lexicogrco1.

1.1. Subarquivo de etnotextos do Atlas Lingstico Galego


Existe un subarquivo de etnotextos do ALGa, gravados entre novembro de 1974 e maio de 1977 polos investigadores de campo do atlas (Rosario
lvarez Blanco, Francisco Fernndez Rei e Manuel Gonzlez Gonzlez). O
ideal era facer algunha gravacin en cada un dos 167 puntos enquisados,
e de xeito especial nas reas onde se usaban marcadores sociolingsticos como a gheada e o seseo para ter unha mostra oral deses fenmenos;
pero en bastantes sitios non foi posible obter unha mostra oral por seren
reticentes os informantes a deixrense gravar.
Hai que ter en conta que daquela mediados dos 70 o desprestixio
social do galego a nivel popular era practicamente total e a situacin so1.

Unha descricin detallada de cada un dos subarquivos do AGO pode verse en Fernndez Rei (2004a).

O Arquivo do Galego Oral e o seu aproveitamento lexicogrco

155

ciopoltica (derradeiras boqueadas do franquismo e pnico no poder a


que a revolucin portuguesa do 25 de abril do 74 se propagase a Espaa) non invitaba a xente a deixarse gravar por descoecidos, anda que
fose para falar do entroido ou da mata do porco. Outra cousa era falar
e contestar preguntas, sobre todo lxicas, sen que quedase constancia
gravada. E anda as, rexistrronse algn etnotextos excelentes temtica
e lingisticamente.
A este subarquivo pertencen tamn gravacins complementarias dos
puntos enquisados para o ALGa, realizadas entre 1979 e 1983 en lugares
da Terra Ch, do tramo medio do Lrez e do tramo nal do ro Mio, todas
elas de grande interese etnogrco e socioeconmico, parte do lingstico. A maior parte destas gravacins realizronas a comezos dos 80 Rosario lvarez e Francisco Fernndez Rei.
Os textos do subarquivo do ALGa estn transcritos, informatizados e
concordados. Nestes momentos, as das persoas que presentamos este
traballo estamos ultimando a preparacin da edicin deses textos, vez
que estamos a redactar un glosario con todo o material lxico.
As gravacins do ALGa son as mostras orais mis antigas que se conservan no ILG. Con todo, hai algns etnotextos anteriores, mesmo de cando non exista ocialmente o Instituto, uns editados na revista Verba e
outros inditos, pero deles non se conserva a gravacin.
Todos estes textos constiten un documento nico para coecer o estado do galego oral nunha fase en que non exista ningn tipo de ocializacin e ningunha variedade estandarizada e socialmente implantada
que puidese inur no galego popular. A xente falaba, e facao como lle
transmitiran o idioma, coa sa enxebre fontica, enxebre gramtica e
enxebre fraseoloxa, e tamn con moi diversas interferencias do casteln,
sobre todo lxicas.

1.2. Subarquivo de etnotextos dos anos 80


Son unhas 350-400 horas rexistradas entre 1979 e 1991, sobre todo
no perodo 1979-1985. A nais dos 70 e comezos dos 80, antes de que se
implantase e xeneralizase a lingua galega como materia obrigatoria no
ensino non universitario, o Instituto de Ciencias da Educacin da USC encargoulle ILG a organizacin e imparticin de cursos de galego para o
profesorado de Ensino Xeral Bsico. No nivel superior, ademais de traballar con textos literarios e da prensa diaria, acordouse facelo con mostras
orais de diferentes reas lingsticas tiradas dos etnotextos do ALGa, en
papel e en soporte oral. Logo a persoa que imparta o curso faca que mes-

156

Francisco Fernndez Rei / Carme Hermida Gulas

tras e mestres traballasen en grupos con material recolleito na comarca


onde exercan, co n de analizar a fala da zona.
Moitas desas gravacins depositronse no ILG, igual que se depositaron moitas outras feitas entre 1980 e 1985 por alumnado de diferentes
titulacins de Filoloxa que cursaban a materia de Lingstica Romnica
I impartida por Francisco Fernndez Rei, que no seu da supervisou cada
unha das transcricins. Eran uns anos en que s exista unha subseccin
de Filoloxa Galega-Portuguesa e non haba unha licenciatura de Galego, e os que an ser profesores de galego no ensino medio s tian unha
materia de Lingua Galega no 3 ano (logo implantarase en 4 e 5), polo
que se considerou que era un excelente exercicio que o alumnado xese
algn tipo de anlise do galego oral popular para estudar tanto as caractersticas do galego como as diversas interferencias.
Xeralmente os textos dos anos 80 son gravacins dunha soa persoa informante, moitas veces da primeira xeracin, con gran riqueza temtica.
S unha pequena parte deste material est informatizado.

1.3. Subarquivo de etnotextos dos anos 90


Nos anos 90 constituuse no ILG un amplo subarquivo de textos orais,
merc concesin de dous proxectos: un do Ministerio de Educacin e
Ciencia para a creacin dun Arquivo Dialectal da Lingua Galega no perodo
1992-95; e outro da Xunta de Galicia para implementar ese Arquivo no perodo 1996-98. A este material engadiuse outro depositado por xente allea
ILG, particularmente o recollido por estudantes das Facultades de Filoloxa
e Ciencias da Comunicacin da USC para traballos sobre galego oral.
En 1992 os membros do proxecto inicial realizamos unha planicacin
do traballo de campo co moi utpico obxectivo de obtermos en tres anos
unha mostra da maiora das 3.768 parroquias galegas, parte de mostras
do galego das comarcas estremeiras. Tamn queriamos, na medida do posible, ter rexistros de varias xeracins dun mesmo lugar.
En xaneiro do 1999 o subarquivo de etnotextos dos 90 contia unhas
1.200 horas de gravacins, coas voces de 4.434 informantes de diversas xeracins, pertencentes a 271 concellos de Galicia e das comarcas estremeiras de fala galega, a 1.312 parroquias e a mis de 2.000 lugares. A provincia
de Pontevedra a mellor representada, cun varrido parroquia por parroquia en diversas comarcas, sobre todo centro-meridionais.
Parte deste material oral dos anos 90 empregouse especialmente para
redactar memorias de licenciatura sobre unha parroquia (Ho-Cangas,
Loureiro-Cotobade, Viceso-Brion) ou sobre un concello (Forcarei, Frades,

O Arquivo do Galego Oral e o seu aproveitamento lexicogrco

157

San Cosme de Barreiros) ou para redactar traballos de cursos de doutoramento en que se analizaban aspectos da oralidade das parroquias dun
concello (O Grove, A Estrada, Padrn, Vilardevs). Son investigacins xeralmente cunha ampla escolma de textos orais transcritos, sempre con
mostras de diversas xeracins acompaados dun glosario ou dun estudo
fontico e/ou morfolxico ou das interferencias.
Aproximadamente un terzo deste inxente material est transcrito e/
ou comprobado acusticamente para chalo tematicamente, pero s unha
parte das transcricins se informatizaron. E este subarquivo dos 90, anda
que de xeito intermitente, seguiu aumentando con etnotextos rexistrados nos comezos deste milenio.

1.4. Subarquivo de msica popular


Est depositada no ILG unha copia de todo o material sonoro dos sete
volumes do Cancioneiro Popular Galego de Doroth Schubarth e Antn Santamarina, que entre 1984 e 1995 editou a Fundacin Pedro Barri de la Maza.
Son unhas 350 horas de gravacin recollidas en 82 concellos de Galicia e en 13 concellos da franxa estremeira de Asturias, Len e Zamora. A
maior parte do material recolleuno Schubarth entre 1978 e 1983; pero hai
material de diversa procedencia, como cantigas rexistradas por Santamarina en 1968 na Fonsagrada ou cantigas e romances de 1975 procedentes
de gravacins do ALGa.
Schubarth transcribiu as melodas, mentres que Santamarina xou a
transcricin lingstica dos textos, reectindo do xeito mis el posible a
oralidade, con seseos e gheadas, con rotacismos e contraccins e coas interferencias do casteln (e dos galeguismos en cantigas neste idioma), o
que fai que este Cancioneiro sexa un inestimable documento lingstico,
parte do innegable valor de recolleita musical.

1.5. Subarquivo de textos en rexistro formal


Empezouse a formar no ano 1996 e conta actualmente con mis de 100
horas de gravacins. Trtase especialmente de conferencias sobre temas
relacionados coa realidade sociocultural de Galicia, as como presentacins de libros e diversos actos, moitos deles realizados en Santiago de
Compostela.
Unha parte destas gravacins, as que corresponden s conferencias e
mesas redondas do I Congreso Internacional: A Lingua Galega, Historia e
Actualidade organizado polo ILG en setembro do 1996, fornecunola o Ar-

158

Francisco Fernndez Rei / Carme Hermida Gulas

quivo Sonoro de Galicia do Consello da Cultura Galega; pero a maior parte


do material gravmolo os autores deste traballo. Ademais, este subarquivo contn algunas gravacins de emisoras locais de radio que emiten en
galego, dalgunhas televisins locais e algns programas da TVG de grande interese lingstico e etnogrco.

1.6. Arquivo Oral das Linguas Minorizadas


O AGO complemntase cun Arquivo Oral das Linguas Minorizadas
(AOLM), cunhas 150 horas de gravacins en diferentes idiomas (entre eles
o galego) sobre aspectos da problemtica da estandarizacin e da vitalidade etnolingstica das linguas e variedades minorizadas, especialmente do mbito romnico, as como textos en diversos rexistros destas
linguas, particularmente do sardo.
A maiora son gravacins feitas por Francisco Fernndez Rei desde
1996 en moi diferentes territorios da Romania europea, entre as que cmpre salientar conferencias sobre a situacin do aragons, mirands, occitano, esloveno do Friul, friulano e sardo. Algunhas son entrevistas ou ben
lecturas de textos escritos en linguas romnicas minorizadas a cargo de
falantes nativos.
Tamn hai gravacins tiradas da radio, especialmente de nais da dcada de 1980 relativas problemtica do galego de Asturias, xunto con
CDs e casetes comercializados con etnotextos ou ben con msica de raz
e doutro tipo de diferentes linguas romnicas minorizadas. Este arquivo
foise creando coa nalidade de xuntar material sonoro de apoio para as
clases das materias Variedades Romnicas Minorizadas e Sociolingstica Romnica de titulacins de Filoloxa da USC.

1.7. Resultados e publicacins do AGO


Ata o momento tirouse relativamente pouco froito do inxente material do AGO, tendo en conta o moito traballo investido na recolleita por
todo o dominio galego e, sobre todo, o moito traballo de calada e fatigosa
transcricin.
Na dcada de 1990 fxose unha ampla escolma de textos transcritos de
diversas reas dos tres bloques lingsticos do galego, que se usou para
diversos traballos acadmicos e que Antn Santamarina introduciu no
Tesouro Informatizado da Lingua Galega (TILG), de igual xeito que incorporou diversas coleccins de etnotextos dos 90, polo que lxico do AGO
navega entre o inmenso caudal lxico literario e cientco do TILG.

O Arquivo do Galego Oral e o seu aproveitamento lexicogrco

159

Con material dos anos 90 realizronse diversos traballos de investigacin dirixidos por membros do proxecto do AGO, tal como mis arriba se
dixo, vez que profesorado do ILG utiliza etnotextos (ditos e inditos) e
gravacins en rexistro formal para as prcticas de galego oral nas clases
con alumnado de titulacins de Filoloxa e de Ciencias da Comunicacin;
e algns artigos publicados recentemente derivan, en maior ou menor
medida, de material de etnotextos do AGO, como son Fernndez Rei / Hermida Gulas / Tato Plaza (2004) e Fernndez Rei (2004b, 2005, 2007).
Ademais, o material usouse para moi diversas nalidades: hai anos
algunha actriz do Centro Dramtico Galego acuda ILG para escoitar
gravacins de falas occidentais con gheada e seseo para preparar a sa
personaxe, de igual xeito que alumnado universitario acode a consultar
material para traballos academicamente dirixidos ben lingsticos, ben
etnogrcos, como foi neste caso un sobre as costureiras presentado no
2006 na Facultade de Ciencias da Comunicacin.
A publicacin mis salientable (e ata o momento a de maior utilidade
e difusin) feita con material dos tres subarquivos de etnotextos do AGO
foi o audio-libro A nosa fala. Bloques e reas lingsticas do galego, edicin
preparada polos autores deste traballo para o Arquivo Sonoro de Galicia
do Consello da Cultura Galega (Fernndez Rei / Hermida Gulas 1996), do
que, ademais de distriburse en libraras, se xo unha edicin que se lles
regalou s 700 persoas que participaron no congreso dos 25 anos do ILG
en setembro do 1996. Na 2 edicin, de 2003, as tres casetes con tres horas
de gravacin foron substitudas por tres CDs; e no 2004 fxose unha versin electrnica do libro e dos textos orais para consultar libremente en
Internet (www.consellodacultura.org/arquivos/asg/anosafala.php), que
no 2005 tivo mis de 15.000 consultas.
Nesa obra guran textos de diversas pocas e diversas xeracins nos
que se pode apreciar a variedade dialectal do galego e vez se d unha
mostra de como somos e de como estamos no mundo ns outros, os galegos. Como dica Filgueira Valverde no limiar dese audio-libro, os textos
teen non s interese como documento lingstico senn tamn como
testemuos da vida mesma: trxicos unhas veces, festivos outras, intranscendentes outras, pero sempre engaiolantes (Fernndez Rei / Hermida Gulas 1996: 7).
Na transcricin das gravacins de A nosa fala procurouse un compromiso entre a claridade necesaria para que un non lingista poida ler
os textos e o rigor preciso para fornecerlle a un lingista a maior informacin fontica e fonolxica posible. Tomouse como base a normativa
vixente da lingua galega que elaboraron o ILG e a RAG, pero cunha serie

160

Francisco Fernndez Rei / Carme Hermida Gulas

de particularidades relativas abertura das vogais de grao medio, representacin da gheada e do seseo e outros fenmenos relevantes do galego
oral (Fernndez Rei / Hermida Gulas 1996: 11-15).

2. aproveitamento lxico do arquivo do galego oral


Para exemplicar o valor e a importancia dos datos contidos no AGO
centrarmonos nunha comparacin entre a informacin proporcionada
polos textos do subarquivo do ALGa, unha vez concordados e lematizados
e denido o seu lxico, coa proporcionada polos dicionarios mis comns.
Anda que esta informacin se podera confrontar coa includa en calquera obra lexicogrca actual, consideramos que, para que houbera unha
certa nivelacin, o termo da comparacin s podera ser un dicionario que
tivese vocacin xeneralizadora, que pretendese recoller a totalidade do
lxico do idioma con tdalas acepcins que este poida ter.
Na actualidade existen editadas catro obras destas caractersticas: o
Dicionrio da lngua galega de Isaac Alonso Estravs, publicado pola editorial Sotelo Blanco (Estravs 1995); o Gran Diccionario Xerais da Lingua,
coordinado por Xos Mara Carballeira Anllo e publicado por Edicins
Xerais de Galicia (GDXL 2000); o Dicionario de galego coordinado por Xess Domnguez Dono, Anxo Xos Raj Paz e Beatriz Varangas Gonzlez,
da editorial Ir Indo (Ir Indo 2004); e o Gran Dicionario Sculo 21 da lingua
galega, dirixido por Xos Antonio Pena para as editoriais Galaxia e Cumio (GDS XXI 2005).
Dos catro diccionarios, Ir Indo (2004) e GDS XXI (2005) non serven na
sa totalidade para o noso propsito, porque se trata de obras que seleccionan s lxico estndar e prescinden do usado noutros modelos de
lingua. O Estravs (1995), anda sendo acumulativo, est realizado cunha
concepcin lingstica do que o galego que non concorda coa que rexe
este traballo, polo que tampouco resulta lxico o seu emprego como obra
de referencia primaria. Daquela, a comparacin realizarase co GDXL, anda que no relativo informacin gramatical, s acepcins e fraseoloxa
tamn teremos en conta as outras tres obras nomeadas.
A confrontacin da informacin obtida dos textos do ALGa coa proporcionada polo GDXL farmola sobre catro puntos bsicos do artigo
lexicogrco: a entrada ou lema, a informacin gramatical, o signicado
e a fraseoloxa. Nos exemplos usamos exclusivamente os termos lxicos
contidos nunha letra de tamao medio, o R, e prescindimos de palabras
gramaticais como determinantes, preposicins e conxuncins.

O Arquivo do Galego Oral e o seu aproveitamento lexicogrco

161

2.1. Entradas
En funcin da sa relacin co lxico considerado estndar, fundamentalmente o contido no VOLG, as palabras dos textos que non se inclen
no GDXL poden ser variantes ou derivadas dunha forma comn ou ben
lemas totalmente novos.
Entre as variantes fonticas ou morfolxicas dunha forma comn
podemos salientar voces como rastear (<rastrear), rosucitar (<resucitar),
rtolo (<rtulo), robanda (<rebanda), remudo (<remuda), resido (<reso), a
relentn (<a ralent), rar2 (<raer).
Ausentes do GDXL tamn estn formas derivadas doutras comns,
que si teen o seu espazo nesta obra de referencia. Mostras de voces derivadas son a rebolazos, roulada ou rumbante:
rebolazos, a loc. adv. De rebolos, dando voltas: por a escaleir abaixo, un pouco de p, outro
pouc a rebolazos (Calvos-Calvos de Randn3).
roulada s.f. Grupo cunhas caractersticas semellantes: andaban todos na roulada (AmeneiroTeo).
rumbante adx. Rumboso, esplndido, pomposo: non vin fsta tan rumbante coma ela (Campobecerros-Castrelo do Val).

Tamn anotamos palabras que non gardan relacin con ningn dos
outros lemas do dicionario e, xa que logo, son totalmente novas:
raspita s.f. Aparello do cerco, mis pequeno c do cerco de xareta, que se emprega na pesca de
baixura en lugares onde hai pouca auga: raspita tmanse moitos muxes (Fefins-Cambados).
rebisca s.f. Cebo para coller peixes que se atopa no propio ro debaixo das pedras: pa pesca-lo
peixe, hai a rebisca (Friol).
rechinchudo,-a adx. Repoludo, gordo e ancho por demais: i-ra gorda i rechinchuda, de gorda
xa regaou (Calvos-Calvos de Randn).
relento,-a adx. Pousado, lento: o corazn simpre, relento, triste (Mourelle-A Pastoriza).
represar v.t. Reprender, recriminar: quedaron amigos, el non represou a mullr (A Gudia).

No caso de requet (s.m. Barco de motor pequeno que anda cerco


da xareta: hai os requets, que son os barcos ms pequenos) (FensCambados), dubidamos se consideralo entrada totalmente nova ou ben
2.

Neste caso a forma de referencia, raer, non contn o signicado que nos textos ten rar tensar o aparello
para metelo a bordo: rar chammoe ns metlo a brdo, o aparello (Cambados).

3.

Indicamos o lugar e o concello da gravacin, ags cando ambos tean a mesma denominacin.

162

Francisco Fernndez Rei / Carme Hermida Gulas

unha extensin de signicado, que se producira no caso de o nome do


barco estar motivado pola designacin do grupo armado de combatentes
de ideoloxa carlista que loitou en diferentes enfrontamentos armados
dos sculos XIX e XX.

2.2. Usos gramaticais


Entre a nova informacin gramatical proporcionada polos etnotextos
do ALGa pdense salientar os usos adverbiais dos adxectivos rpido, raro
e regular4 e o uso intransitivo de receitar5 e retirar:
rpido, -a adv. 2. Rapidamente, con celeridade: queramos que vir cura rpido (Redondela).
raro,-a adv. 4. Raramente, poucas veces: vllos, sarrns, muxes s veses, alkhn sentolo raro,
tod o qu encontra (Fefins-Cambados).
regular adv. 2. Regular, nin ben nin mal: veo... regular, nada ms qu regular (CabreirosXermade).
receitar v.i. Facer receitas: o mdico cansado de receitar, non saba nin que ll haba facer
(Friamonde-A Estrada).
retirar v.i. 2. Retirar, coller dun fondo: haba anos que a xente retiraba mis, outros anos retiraba menos (Lubin). 3. Parar nunha actividade: s ste astas dz ou s once; logo retiramos
(Caselas-O Rosal).

2.3. Signicados
No campo do signicado onde a contribucin dos textos mis salientable. Entre as novas acepcins detectadas aparecen as seguintes:
rabuar v.i. 1. Tocar un obxecto facendo un rudo semellante que se realiza espetar con forza
as uas: xa don Climente taba rabuando prta (Friamonde-A Estrada).
raiar v.i. 2. Limitar: estn a raiando a con Portugal (Lubin)6.
rebumbio s.f. Importancia, dimensin: vend o rebumbio qu a cousa iba tomando (FriamondeA Estrada).
recaer v.i. Pasar por, acudir a: Vaite mirar a ver se recaeron por al teus irmns (Ameneiro- Teo).
recibir v.i. Comungar, recibir a hostia: fasan unha va cruses resiba, haba comunin (Fefins-Cambados).
reco s.m. Rosada, orballo: o orballo dese, vamos, qu hai pola ma, t ese reco qu hai as

4.

No Estravs (1995) e no Ir Indo (2004) aparece o uso adverbial de rpido e regular.

5.

No Estravs (1995) est recollido este uso.

6.

No GDS XXI (2005) recllese este signicado.

O Arquivo do Galego Oral e o seu aproveitamento lexicogrco

163

(Lubin)7.
reliquia s.f. Obxecto relacionado co culto a un santo ou lugar sagrado que se garda en lembranza dunha visita: unhos santos feitos de masa, ps levaban como reliquias de San Andrs
(Chmparra-Cedeira).
remendar v.t. 2. fig. Curar unha ferida sen moitos coecementos: al un remendeiro, qu asta n
o levaron mdico; remendoull a cabeza (Cabreiros-Xermade).
remendeiro s.m. Curandeiro, mencieiro: levrono non sei pa donde, al un remendeiro, qu asta
n o levaron mdico (Cabreiros-Xermade).
renunciar v.i. Renegar, abxurar: que renunciaban da relighin catlica (Cerdedo)8.
repoerse v.p. Compoerse, amaarse: quedou as todo arruinado. Pro aora foise repoendo
un algo (Cabreiros-Xermade).
resaca s.f. Mar picado e o seu efecto escachar no peirao ou nas pedras do mar ou chocaren
das ondas: ndisa mas a resaca chammose ns mar, cand mar picado (FefinsCambados).
responso s.m. Recitado similar s oracins nos oficios de defuntos: o responso ese que tia entre
San Antonio (Lubin)9.
retraer v.t. Reter, gardar na memoria: a mia memoria vai pasada, non retraio nada xa (Salcidos-A Guarda).
revisar v.t. Inspeccionar: anque non foran cazadores revisronllelas (O Buriz-Guitiriz).
revolver v.t. 2. Toldar: que revlv o ro todo (Caldelas-Tui).
rodeo s.m. Roda, crculo, curro: truxmos o inghiniro aqu. Fixmosll un rodeo (San Xin-O
Rosal).
romeu s.m. 2. Barba de raposo, alga maria: pois ns o romeu chamabmos nha planta, n
esterco (Fefins-Cambados).
rosario s.m. 3. p. ext. Conxunto de cousas iguais que se presentan enfiadas semellando ese obxecto
de culto: rosarios de castaas, cocamos castaas sin pelare lgo despois cunh gulla i fo
formaban un rosario (O Buriz-Guitiriz)10.
run adx. 2. Pobre: o publo run; run pro somos poucos vecios (Sabuguido-Vilario
de Conso).
rula s.f. 1. Aparello elctrico para poxar o peixe: aparatio ltrico que hai, que, chmanlle precisamente a rula (Rinlo-Ribadeo). 2. Lonxa: da rula non teo ms nada que decir (RinloRibadeo).
rumbar v.i. Ruxir, facer rudo: os picos tocaron un no outro, rumbaron (Lindn-Mondoedo).

Nalgns casos non se trata propiamente de novas acepcins, senn


de variacins que non quedan perfectamente recollidas no GDXL:
7.

No Estravs (1995) e no GDS XXI (2005) inclese esta acepcin.

8.

No Estravs (1995) inclese este signicado.

9.

No Estravs (1995) recllese este signicado.

10. No Estravs (1995) documntase esta acepcin.

164

Francisco Fernndez Rei / Carme Hermida Gulas

rabioso,-a adx. Moi picante: xa hai algns que pican, xa hai quen os mte mui grandes, que
se faen rabiosos (Caselas-O Rosal) [fronte a que provoca unha sensacin desagradable moi
intensa].
rapar v.t. Cortrlle-las crinas s bestas bravas: mrcanas tdolos anos, na i-anca, rpanas
(Cerdedo) [fronte a cortarlle a la ou o pelo a un animal].
recra s.f. Alimentacin e coidado dun animal comprado anda cra: ta comprando khaulas
metlicas pa, p recra de coello (Caselas-O Rosal) [fronte accin e efecto de recriar; recriar
= continuar criando un animal, proporcionndolle a alimentacin adecuada, para o seu total
desenvolvemento]11.
rega s.f. 2. fig. Chuvia en tempo de sol continuado: aqu o que faa falta, que vira unha rghia,
porqu isti un calor espantoso (Fornelos-O Rosal) [fronte a accin e efecto de regar ou accin e efecto de mollar ou mollarse]12.

2.4. Fraseoloxa
Tocante fraseoloxa pdese salientar, entre outras, a ausencia no
GDXL de dar resultado, nin de risas nin de veras, polo regular13 e retorcer o
pescozo.

2.5. Informacins varias


Tres novos casos moito mis complexos inciden na importancia de
continuar examinando os textos orais para o arrequentamento das obras
lexicogrcas. Trtase de raio, redondo e resultar.
No primeiro dos casos, o de raio, comprbase que faltan no GDXL, e
tamn nos restantes dicionarios, tres usos diferentes e das expresins
xas:
raio s.m. 1. Lugar dotado con instrumental para someter un corpo a unha radiacin: tia que
pasar ... s raios, a face-la placa (A Chan-Cotobade). 2. Seguido da preposicin de e dun nome,
pondera a este positiva ou negativamente: aquil raio daquel armario empezou a rubir (CalvosCalvos de Randn). 3. Precedido do interrogativo que e seguido dun verbo, intensifica o significado do verbo: que raio querer decir eso da Zocata? (San Xon de Tabagn-O Rosal). Malo
raio + partir, expresin para maldicir: malo raio part s rtor da condicin dar formighas
(Abeln-Salvaterra). Coma raios, intensificador da rapidez ou velocidade dunha accin: os seores albailes, se axustan alghunha bra andan listos coma raios non hai oficial que os colla
(Friamonde-A Estrada).

11. No Ir Indo (2004) recllese totalmente esta acepcin.


12. No Estravs (1995) inclese unha acepcin denida como popular equivalente a bao, molla, chvia.
13. Esta locucin aparece no GDS XXI (2005) como equivalente de comn ou regularmente (s.v. regular).

O Arquivo do Galego Oral e o seu aproveitamento lexicogrco

165

Tocante a redondo obsrvase a ausencia dunha das acepcins que


ten como adxectivo e a falta do uso como adverbio e dunha locucin
adverbial14:
redondo,-a adx. 3. Que non aguzado e ten forma de semicrculo: porque tn a popa, tn s
redonda (Cambados). // adv. 4. Totalmente, completamente: nada, fallou redondo (BonxeOuteiro de Rei). En redondo loc. adv. 1) redor: mellor un quilmetro ou mis en redondo (San Xon de Tabagn-O Rosal); 2) en forma circular: facendo coro, todo en redondo
(Deixebre-Oroso).

Verbo de resultar cmpre indicar que en ningn dos dicionarios analizados se fai mencin da existencia do complexo resulta que, que se emprega no comezo ou continuacin das narracins como frmula focalizadora:
resulta qu o utor da estab qu cun amigho (A Chan-Cotobade).

O mis prximo que documentamos a indicacin que aparece na


ltima acepcin de resultar do GDS XXI (2005) sobre o uso impersoal co
valor de ocorrer algo de repente, de modo imprevisto.
Desde a dcada de 1980 avanzouse moito na elaboracin de obras
lexicogrcas e os dicionarios actuais de uso xeral teen un alto nivel de
calidade15; porn, os exemplos que acabamos de presentar, que son unha
pequena escolma, demostran que hai lxico, usos gramaticais, expresins
xas e signicados que, mesmo sendo de uso xeral e comn, anda non
chegaron s diccionarios do galego moderno.
Xa que logo, a recompilacin de lxico do galego oral como o sinalado,
coas sas acepcins, presntase como un labor necesario para o perfeccionamento de calquera estudo sobre o idioma, pero moi especialmente
das obras lexicogrcas vindeiras.

3. remate
O Arquivo do Galego Oral existe merc xenerosidade de milleiros
de galegofalantes que doaron as sas voces e xenerosidade de moi diversas persoas que percorreron o dominio lingstico galego para facer
gravacins in situ e que algunhas, ademais, realizaron o traballo, moitas
veces ingrato, de transcribilas.
14. No Estravs (1995) recllese o valor adverbial e tamn a locucin adverbial co primeiro signicado.
15. Para os dicionarios posteriores a 1980 pode verse Santamarina (2003c: 32-35).

166

Francisco Fernndez Rei / Carme Hermida Gulas

O obxectivo xeral do proxecto Arquivo do Galego Oral do Instituto da


Lengua Galega da USC construr un corpus de interese multidisciplinar
para estudar a situacin da lingua oral, particularmente as variedades
sociais e xeracionais, e vez contribur a un mellor coecemento da sociedade galega a travs de moi diversas mostras do patrimonio inmaterial.
As metas fundamentais dese proxecto son:
(1) Inventariar e catalogar todo o material dos subarquivos que o
conforman.
(2) Poer en Internet coleccins de etnotextos agrupados tematicamente e atendendo sa distribucin en reas lingsticas.
(3) Redactar unha base de datos lxica do galego oral baseada, fundamentalmente, en etnotextos, que tamn se colocar en Internet.
(4) Actualizar e completar as coleccins de textos e outras gravacins do AGO.
(5) Poer na rede o corpus a travs dun motor de buscas axeitado
s peculiaridades da lingua oral.
Con este corpus pretendemos que se poidan redactar, entre outros
traballos, vocabularios comarcais, lxicos de frecuencias ou estudos sobre a adquisicin do estndar desde o punto de vista xeracional. Ademais,
queremos fornecer material a lingistas que traballen a gramtica ou a
pragmtica do galego, pero tamn a outros investigadores alleos lingstica, particularmente etngrafos, antroplogos, historiadores e socilogos, dada a gran diversidade temtica dos textos do AGO. Proba desta
diversidade son os 18 grandes bloques temticos (algns con moi diferentes subtemas) con que clasicamos o material dos anos 90.
Pretendemos, en n, irlle devolvendo sociedade galega, da maneira mis elaborada posible, un caudal oral que ela xenerosamente nos foi
doando.

167

A FRASEOLOXA COMO FONTE LEXICOGRFICA


Xess Ferro Ruibal

Centro Ramn Pieiro para a Investigacin en Humanidades

Dende os inicios da lexicografa xa houbo repertorios fraseolxicos


autnomos. Anda as, os dicionarios comns sempre incluron cantidades variables de fraseoloxismos que exemplicaban valores semnticos
das palabras que denan. E, para moitos usuarios, os fraseoloxismos que
adornaban os dicionarios foron a primeira experiencia de fraseoloxa denida. Ora ben, se entendmo-la lexicografa como repertorio de voces e
dos valores semnticos desas voces, o acomodo nela dos fraseoloxismos
presenta algns problemas de lindeiros.
Non representan problema ningn para un lexicgrafo as palabras
nicas que s aparecen en combinacin fraseolxica (Vaites, vaites!) ou
en contextos pluriverbais (tralalal en cantigas coma Teu pai non-o ten, /
ta nai non cho d; /de donde che vn? /-Do tralalal). Pero xa teen a sa
dicultade aquelas palabras comns que na combinacin fraseolxica collen un valor semntico especco desa combinacin. Un caso moi simple
o da palabra beira. Defnese normalmente como s.f. Orilla (Rodrguez
1863) e dese substantivo nacen as locucins aa veira junto pegado, andvolle aas veiras le anduvo al rededor cerca, etc. (Cuveiro 1876). Pero
noutras locucins xa aparece unha metfora: facer as beiras rondar, dar
vueltas al rededor de alguno o siguindole continuamente para conseguir
de l alguna cosa: hacer el oso, hacer la rosca del gallo (DRAG 1913-1928),
facerlle as beiras a unha cousa desearla con ansia y hacer indirectamente
los medios para conseguirla ou facerlle as beiras a unha rapaza rondarla, cortejarla, galantearla, hacerle el amor (Eladio Rodrguez 1958-1961).
Como se ve, este novo valor non valor da palabra senn do conxunto
fraseolxico. E nos fraseoloxismos idiomticos o signicado global xa non
resulta da suma dos signicados dos seus compoentes senn que un
valor novo que unicamente se activa no uso conxunto e fraseolxico das
palabras que o forman. Isto impide establecer cal das palabras a por-

168

Xess Ferro Ruibal

tadora da nova carga semntica, a cal dos elementos do conxunto se lle


debe asigna-lo ncleo semntico do fraseoloxismo.
En consecuencia, o fraseoloxismo non vale sempre para exemplica-los usos que o dicionario recolle para esa voz, porque non sempre
doado. E, anda que os lexicgrafos utilizan certas convencins razoables
para alfabetizaren esas unidades, o acomodo da fraseoloxa nun dicionario convencional non sempre satisfactorio. As que, pouco e pouco,
a fraseografa vaise independizando da lexicografa e multiplcanse nas
libreras os dicionarios fraseolxicos, exclusivamente fraseolxicos, que
responden a un corpus diferente e tamn a pautas de dicionarizacin
especcas.
Pero neste traballo eu non vou tratar de fraseografa nin de idiomaticidade. Vou facer algo moi simple que saben tdolos lexicgrafos: s vou
lembrar algns refrns que poen mostra valores semnticos, variantes
ou mesmo palabras que non aparecen nos dicionarios; ou que manteen
vivas palabras enxebres que o contacto de linguas vai substitundo polas
simtricas coas de linguas poderosas. Isto o que quero comentar: que a
fraseoloxa, entendida en sentido amplo, anda unha despensa lxica; e
que algns paremilogos xeron tamn de lexicgrafos. Como ven, todo
cousa sabida.
Cando falo de dicionarios (galegos), limitareime s dicionarios includos no Diccionario de diccionarios de Antn Santamarina (2003b), esa marabillosa ferramenta, insucientemente loada pero masivamente usada,
que nos permite consultar vinteseis obras lexicogrcas de maneira instantnea, cmoda e comparativa. E cando falo de refraneiros, refrome
a dous refraneiros de mediados do sculo XX, un felizmente xa pblico
(Francisco Vzquez Saco 1962) e outro anda indito (Vicente Llpiz 1954a
e 1954b), de dous homes que adoitaban preguntarlles s seus informantes
o signicado daquelas palabras que a eles lles resultaban pouco transparentes. As denicins deles reprodzoas entre comias e na maior parte
dos casos anotarei a localizacin tal e como eles a anotan.
O material non escaso e voume limitar nesta ocasin s palabras
que empezan polas letras comprendidas entre o A e o L.

1. algns valores semnticos que non vexo no dicionario


de dicionarios ou que son moi infrecuentes
Raro o cazador de fraseoloxismos que non se sorprende cunha palabra ou coa acepcin dunha palabra que non lle transparente. Raro

A Fraseoloxa como Fonte Lexicogrca

169

o que, nesa situacin, non pregunta seu informante e non anota a


informacin que d transparencia refrn ou locucin e que converte ese fraseoloxismo en ocasin dunha nota lexicogrca. Un home as
era o comandante Vicente Llpiz Mndez, que encheu o seu refraneiro
de notas lexicogrcas, mis ou menos cannicas, pero abundantsimas.
Poamos un caso: refrn Ben coez Cristo as pousas dos seus amigos,
engdelle o comentario: Pousas: moradas, aposentos, denicin que
non exactamente a mesma que ofrecen Pintos (1865) (Quinta, granja,
lugar; pr. la casa murada) ou Valladares (1884) (Quinta, casa de campo
y recreo. Guimarans linda pousa; / mais Jimonde, sin disputa, / e mais
quentrambas ainda / Santa Crus de Ribadulla) ou Leiras (ca. 1906) (descanso), conceptos que repiten dun xeito ou doutro os posteriores. Para
Llpiz simplemente casa, maiormente se o equivalente latino que
ofrece tecta (Iesus Christus amicorum co[g]nosci[t] tecta suorum). Isto
quere dicir que moitas coleccins fraseolxicas atesouran nas notas s
refrns ou locucins un certo caudal lexicogrco que ofrece acepcins
pouco coecidas de certas palabras, convertndose en cita valiosa para
documentar un determinado valor semntico minoritario. Vexamos algns exemplos.
abafado. Mal abafado mal de origen venreo e inconfesable. Non [h]ai mal abafado que por muller
non vea (Llpiz 1954a: 535,439). Ata o DRAG (1913-1928) non aparece o valor de El que tiene
mal color, inficionado, emponzoado. Se dice que una mano, un pi, otra parte del cuerpo esta
abafada, cuando se halla inflamada por haber tocado en algn reptil insecto venenoso. Eladio
Rodrguez (1958-1961) o que matiza Corrido, avergonzado, insultado, pero o significado de
venreo non o menciona ningun.
abeirarse. Refregarse [unha vaca] coas outras cando est en celo e mesmo montar nelas. Cando a vaca
anda maronda, toda se abeira coas outras (Llpiz 1954a: 1,137). Nos dicionarios aparece esta palabra como
1. Guarecerse; resguardarse de la lluvia o nieve (Acevedo 1932); 2. v. r. Acercarse, aproximarse, irse
hacia la orilla (Eladio Rodrguez 1958-1961), pero non co significado que ten no refrn.
adoar. Pasar la palma de la mano suavemente. Ao que d esmola Dios ca man o adoa (Llpiz 1954a:
Dios, 674,15). Adoar aparece en numerosos dicionarios como 1. Afilar instrumentos cortantes
(Sobreira), 2. Llevar la piel la navaja, cortar bien (Pintos 1865), 3. Perfecionar, alisar, pulir,
redondear los cortes toscamente hechos en la madera (Valladares 1884), formas que repiten os
posteriores. Pero o significado que parece ter nese refrn non figura nos dicionarios.
argabazo. Blas de bosta pegadas pelo das coxas das vacas e das ovellas. A mis boa melecia para
tira-lo argabazo, auga, freganzo e xabn por enriba e por embaixo (Llpiz 1954a: 2,450). Para esta palabra
os dicionarios s repiten unha vaga definicin de Sobreira: Cada uno de los fragmentos que
hacen la suciedad algo gruesa, pero o significado que ten no refrn mis especfico.
arolar. Xaxuar. Cando o mdico arola, o crego chora. Llpiz comenta: No desayuna el mdico, cuando
por gran sanidad en su distrito, gana poco. Y habiendo mucha salud, tampoco hay muchos entierros, rogativas y votos por las dolencias. T. Saavedra, Paradela de Abeleda, Porquera, ref. 1210
(Llpiz 1954a: 508,230).

170

Xess Ferro Ruibal


arolas. Xaxn. Pan en arolas con romeu en frol, volverante cara a boa color. Llpiz explica que pan en
arolas pan en ayunas e localzao en Muras de Eume (Llpiz 1954a: 515,300). Nos dicionarios
arola cuncha de marisco e mesmo existe a frmula Vaite arola!, que equivale a vete a paseo,
djame en paz, no me molestes (Eladio Rodrguez 1958-1961) e que, como moito, pdenos
lembra-la poca na que estar mantido a ostras era ter cara de fame.
arrazada. [Vaca] recastada de vaca do pas cun boi de raza selecta. Vaquia arrazada, filla de casa
pra gasallala (Llpiz 1954a: 1,155). Nos dicionarios aparece arrazar s co valor de escampar, parar
de chover.
asesego. Pausadamente, sosegadamente. Asesego gnase o ceo (var. Con paciencia gnase o ceo) (Llpiz
1954a: Culto religioso, 577,55). Este uso como adverbio non o recolle dicionario ningn.
axe. Ocasin propicia, para mercar ou vender, na feira do gando. O que deixa pasa-lo axe, non se tea
por bo feirante (Llpiz 1954a: 2,15). Os dicionarios dan estes valores: 1. Eixo (Porto 1900-1908);
2. Insulto, desprecio, bochorno, desaire, injuria (Filgueira et al. 1926); 3. interj. (Gro.) voz
que se emplea para meter a las gallinas en el gallinero y al cerdo en la cuadra (Garca Gonzlez
1985).
baceira. Bazo. Cando corpo lle engorda a baceira, cousa boa non lle espera (Llpiz 1954a: 2,453). A
definicin que dan os dicionarios a da enfermidade do bazo.
brea. Plceme, felicitacin. Parto suado, agarda as breas. Dr. A. Vila (Llpiz 1954a: 517,308).
O DRAG (1913-1928) define brea como Vocablo que a continuacin de la frase vaite , significa: vete a paseo, vete al diablo, vete enhoramala. El vaite brea, sase mucho en Santiago y su
comarca. Var: BRIA en su tercera acep., e boria como 1 s. f. Holgorio, algazara, diversin.
2. s. f. Bolsa en la que los cerrajeros llevan sus herramientas. Borear anda hoxe palabra moi
viva en Ferrol co significado de armar barullo. Non me parece posible que Llpiz, que viviu a
adolescencia en Ferrol, fose marrar nesta definicin.
bragada. Parte baixa do ventre, entre as pernas e a cara interna destas. A vaca farta, do seu rabo fai
bragada (Llpiz 1954a: 1,132).
brexeiro. Crego canaveiro teno por brexeiro. Llpiz define canaveiro como esculido, magro e brexeiro
como tunante (Llpiz 1954a: Frailes, curas, 97). Brexeiro s aparece en Carr (1928-1931) como
adj. Lugar bajo, pantanoso y lleno de zarzas y matorral.
cachapa. Recipiente metlico. Mais tolio que unha cachapa de grilos. Llpiz (1954b: 10668) defneo
aqu como bote de hojalata con agujeros. Aparella-la cachapa antes de merca-la vaca facer preparativos para algo que anda non seguro que vaia suceder. Cachapa parece ter aqu o significado
de caldeiro de muxir, anda que non se podera exclu-la acepcin que dan maioritariamente os
dicionarios: s. f. Vaso aplanado de madera que llevan los segadores a la cintura, y que contiene
agua y una piedra para afilar la hoz. En algunas comarcas se utiliza un cuerno de buey o vaca para
el mismo objeto. S Elixio Rivas (1978) recolle outro valor: caxato.
cachazo. Pescozo da vaca. Aplcase tamn, en sentido vulgar e burlesco, xente cando o ten
groso de mis. Carne de vaca vella, bon cachazo saca (Llpiz 1954a). Este valor aparece tamn na
Mezquita e en Ponteareas.
cacholudo. [Boi] de cornos grandes. O boi, cacholudo; e o faco, cascudo (Llpiz 1954a: 1,146).
cagalleira. Diarrea contumaz. Courizas e cagalleiras acaban cas vellas. Couriza sera a defluxin nasal
(Llpiz 1954a: Medicina, 55. Dr. Llopiz Ferrer, Repertorio mdico). O que din os dicionarios resmese
na proposta de Eladio Rodrguez (1958-1961): s. f. Sitio en donde hay muchas cagallas de ganado
lanar y cabro; CAGALLADA. / Conjunto de cagajones que una caballera suelta en cada vez.
camarzo. Achaque de jaqueca. Cabeza de home sano pouco sabe de camarzo (Llpiz 1954a. S. Vicente
de Lobeira). A palabra figura nos dicionarios pero non co significado que lle d Llpiz senn

A Fraseoloxa como Fonte Lexicogrca


co de Chasco, burla o engao. Suceso contrario a lo que se esperaba (Valladares 1896). Levar
camarzo, agotarse la cosecha, llevar una buena baja. Dcese tambin de una persona. Dar un bon
camarzo a unha leira, cavando o sachndola casi toda. Levu un bon camarzo o fruto de unha leira, estrago
a causa del tiempo o del ganado, en Pena de Cabras. Logo lle das bon camarzo, a una cosa, a golpes,
en Mestre (Anbal Otero 1977).
canivs. [Bovino] acanaveirado, fraco coma unha cana. boi canivs a corna lle crez (Llpiz 1954a:
1,128). Nos dicionarios aparece como s. m. Cerdo desmedrado que no crece ni engorda por
mucho que coma pero nunca se refire a un bovino.
carouquexa. Especie de aftas o granulaciones en el paladar o lengua de los nios. Carouquexas
dos nenos, cranse ao solpr co biquio no fontenlo. V. Risco. Notas para un refranero (Ourense, 1953)
(Llpiz 1954a: Medicina, 53). S en Eladio Rodrguez (1958-1961), Franco Grande (1968), Carr
(1928-1931): s. f. Especie de afta o llaguita blanca que se presenta en la mucosa bucal, y especialmente en la lengua de los nios (Eladio Rodrguez 1958-1961).
carracho. [Boi] run, fraco, suxo. boi carracho non lle falta argabazo. Os dicionarios s se refiren
insecto que vive maiormente nos bovinos e nos cans e, figuradamente, persoa pequea, molesta, importuna; miserable etc. Pero que un boi sexa carracho non o di mis ca este refrn.
carrn. Llpiz d boi carrn como sinnimo de boi carracho do refrn anterior (Llpiz 1954a).
chisgar. Enfraquecer por esgotamento. Cada da tres ou catro, chisgan almallo (Llpiz 1954a: 1,137).
Llpiz explica que o refrn alude exceso de cubricins a que se obriga a un boi do posto; que
tamn se aplica figuradamente home mullereiro e acabado por este exceso. Reclleo de E.
Borrs no Seixo, onda Ferrol. O verbo chisgar s aparece nos dicionarios co valor de beber vio
ou pechar un ollo (e mesmo quedar torto). Pero dalgn xeito no ms. de Rodrguez (1855) xa
se ve implcito ese valor no part. chisgado que ten o valor de flaco, consumido, enjuto, seco, etc.
que despois repiten case todos.
choca. Bla de bosta pegada pelo da vaca. vaca fraca non lle faltan chocas e raa (Llpiz 1954a:
1,132).
chorar. Florear. Lio chorado, medio medrado. En S. Simn de la Cuesta, chorimas = flores y chorado =
floreado. Vzquez Saco di que a palabra chorado, en este sentido, est ausente de muchos diccionarios (Vzquez Saco 1962: 1599). Parece intulo Carr (1928-1931) (Plantear. Trazar o esbozar
en lneas generales un asunto), pero o valor de echar flor el lino non aparece ata Rivas (1978):
Florecer, echar la flor (Fondo de Vila): Xa chora o lio, ya empieza a echar la flor el lino. Este
verbo, que slo se usaba ya en relacin con el lino, ha dejado de orse desde que dej de sembrarse
el lino por el ao 1965. En la Edad Media: chor, flor). Tamn o recolle o Glosario de Constantino
Garca Gonzlez (1985) en Novefontes (echar flor el lino).
cibeira. Presebe. Por santa Cecilia, o boi cibeira (Llpiz 1954a: 1,151). Santa Ica o 22 de novembro e nese tempo xa van feitos os traballos agrcolas que precisan bois e estes xa levan un tempo
descansando por gndaras e montes; os fros sucesivos poden facerlle mal gando e por iso se
aconsella recollelo na corte, onda o presebe (cibeira). Este valor de lugar onde se ceba o animal s
parece coecelo Carr (1928-1931). Ntese que cibo e ciballo son nomes da comida do gando.
cobro. Llpiz define o cobro como simple hematoma o una tumidez maligna con obstruccin
de los vasos sanguineos. Puede ser branca o herpes, rubia escarlatina, rosa erisipela, y negra
pstula maligna. O cobro, con que o matars? Con unto sin sal e cinza do lar. /var. lixo do lar en vez de
cinza y en este caso se refiere a las barreduras del fogn) (Llpiz 1954a: Medicina, 58. El Brujo
de Sedes). S recolle esta acepcin como segunda Carr (1972) s. m. Cobro, cobranza. / Enfermedad, afeccin de la piel. Con todo, Llpiz no comentario posterior a un ensalmo teraputico
(59) di que tambin se le llama cobro o cobrn en algunos lugares (Forcarey, Moaa, etc.) a las
inflamaciones producidas por la picadura de bichos venenosos.

171

172

Xess Ferro Ruibal


coita. Coitas e rbeas, manchas que salen en la piel a causa de disgustos recibidos. Coitas e rbeas,
sal na auga, nunha cunquia de bidueiro e limpars o pelexo. El Brujo de Sedes Abon. por M. Abizanda y
San Martn, ref. 6 (Llpiz 1954a: 463,63). Hai unha patoloxa non identificada que consiste nun
tumor do gando vacn que se forma no peito que primeiro anotou Filgueira (1926) e que algns
identifican con carbuncho; pero o refrn fala claramente dunha erupcin cutnea.
confiscante. Que acaba con todo o patrimonio. Fillo de comerciante, paseante; e do paseante, confiscante
(Vzquez Saco 1962: 16744). A palabra non aparece en ningn dicionario pero pode deducirse
sen problemas do valor de confiscar que recollen Eladio Rodrguez (1958-1961) (v. a. Confiscar,
privar, despojar de sus bienes al reo y aplicarlos al fisco o venderlos judicialmente) e Garca
Gonzlez (1985) (v. (Cod.) sacarle los bienes a uno por no pagar los impuestos), porque final
o fisco intervn cando a segunda xeracin xa non ten con qu pagar.
cxegas. Calambres, tambin llamados brecas, cuando son muy agudos; rodela, rtula de la
rodilla (xollo, sollo, xoela o xionllo). Cxegas collo nesta rodela deste meu xollo. Brecas traio, deixo brecas,
diste meu cbado, diste meu xollo. Retahila de los compostores algebristas para curar los calambres
agudos, Moraa, Pontevedra (Llpiz 1954a. Dr. Castro Meizoso: Algunas denominaciones). A breca
aparece como calambre por primeira vez no DRAG (1913-1928).
culabrela. Certa ave de rapina que se mantn de rptiles. Culabrela, culabrela, pon o ollo na portela;
pastorcios gardai ben que ah ven o come res, que nos come a todos tres. Que ave ? S Franco Grande
(1968) e o Carr indito din que culabrela o nome da aguia nalgunhas comarcas. Lembremos, en
cambio, o refrn que Vzquez Saco recolle na Gudia (Se o corvo corvexa, o lobo rastrexa; corvo calado,
lobo de lado) e que nos fai pensar noutra ave, o corvo, de quen di que acompaa o lobo nas sas
correras para aproveitarse das reses que este mata; de a que a presenza do corvo avise os pastores
da proximidade do lobo ou come res (Vzquez Saco 1962: 977).
dapexado. Pexado, animal trabado coa pexa ou acabramo que non lle deixa facer movementos
rpidos nin continuados. Boi dapexado, non se sal do prado (Llpiz 1954a: 1,133). Curiosamente algns dicionarios inclen esta palabra pero co significado contrario de libre, expedito.
debullar. Remoer, segundo Llpiz, en terras de Bande e Lobeira. Non lle tpe-la boca boi que debulla
(Llpiz 1954a: 1,145). O que mis se achega unha das acepcins de Eladio Rodrguez (19581961): Consumir vidamente los manjares de una comida.
escornada. Cornada. boi escorneador nunca lle faltou a sa escornada (Llpiz 1954a). S Garca
Gonzlez (1985) trae esta voz pero co significado de adj. (Caa. Cab. Val. Ped.) dcese de la vaca
a la que le falta un cuerno (VGR, Llpiz 1954a).
esgorriar. Turrar, cornear. Malas vacas te esgorren! antiga expresin de desagrado en Betanzos
segundo Llpiz (1,505). O can ladra e o gato rabua, a vaca esgorra e o furao fura (Llpiz 1954a).
fucieira. Vetillo. boi que macha/malla non lle poas fucieira (Llpiz 1954a).
gaita. Lavativa. Convencionalismos de ant. mencieiros. Cinco gaitas valen o que unha purga Camilo
Carbelle, Colec. de ref. ant. - Remoio, Valle de Arnoya (Llpiz 1954a: 520,335). Este valor non aparece
en ningn dicionario. Algunhas veces teo pensado que a este significado negativo, e non instrumento musical, poden estar aludindo os usos negativos da palabra gaita coma os que recolle Eladio
Rodrguez (1958-1961): estar de mala gaita (estar de mal talante); unha gaita (dcese de lo que constituye un inconveniente o una dificultad); Qu gaita me tras! (con qu encomienda me vienes!).
gatueira. O boi vello a gatueira tira dos regos (Llpiz 1954a: 1,147). S Rivas (1988) recolle esta palabra como s. f. Sitio de gatuas ou uagatos (Fondo de Vila). a Ononis spinosa, tamn chamada
detn-bois que corresponde casteln detiene buey, quiebraarados; portugus resta-boi; cataln afrontacavadors, que algns cientficos denominaron remora aratri, polas sas races profundas e resistentes.
A Enciclopedia Espasa comenta o equivalente refrn casteln da seguinte maneira: Aconseja no
despreciar sistemticamente las cosas antiguas, que veces son mejores que las modernas.

A Fraseoloxa como Fonte Lexicogrca

173

guapa. [Vaca] ben feita. Llpiz recolle Guapes son les vaques como desdn feminino a un piropo.
ngoa / ncoa. Postema que sale en la regin inguinal. Muchas veces se confunde con la fgoa
que es llaga purulenta. Llpiz recllea en Muras de Eume. ngoa branca, Deus te desfaga; ngoa negra,
Deus te detea; ngoa rbea, Deus te consuma (rezuma). // ncoa forca foi a (en) Roma; forca veu e ncoa non.
ncoa forca! e define ncoa como incordio, adenitis (Llpiz 1954a: Medicina, 171). Os dicionarios
definen estas palabras como unha simple rexin corporal.
ixola. Habilidade do feirante para mercar barato, vender caro e desfacerse das maulas. A ixola a
nai do choio (Llpiz 1954a: 2,14).
larchn. Tratante de gando. Ao mis larchn / latarego, mis logo danllun pego (Llpiz 1954a: 2,4).
Podera ser que este valor semntico que anota Llpiz fose unha derivacin feita polos criadores
de gando (sempre rivais dos tratantes de gando) a partir dos significados que para esta palabra son
mis comns: folgazn e tragador de bienes de otros que recolle Anbal Otero.
latrica. Pltica, sermn. Pregaria nun deserto, latrica perdida. Recollido do sacerdote Nicanor Durn
(Llpiz 1954a: Culto religioso, 582,132).
lomba. Lombo. Boi cadeirudo e de lomba ancha, ao seu dono saca da lama (Llpiz 1954a). A palabra lomba
aparece nos dicionarios como corcova, lombo cando ten prominencias pero refrese sempre a
persoas, non s bovinos que, non sendo de raza Holstein, teen diversas prominencias.

2. variantes gramaticais infrecuentes


A fraseoloxa fai ver que a lingua mis verstil e maleable do que en
abstracto parece. No corpus fraseolxico batemos frecuentemente con variantes gramaticais que non guran nos dicionarios. En Home refraneiro,
pouco dieiro o substantivo refraneiro converteuse en adxectivo co valor
de persoa que cre profundamente na verdade dos refrns e que se gua
por eles, concepto que tamn expresa o xa citado Home lueiro non bon
*cosecheiro, que ten esta variante: Home moi luneiro, nin moita meda nin
moito palleiro.
A fraseoloxa deixa ver non s variacins no vocalismo tono (fgoa) e
fenmenos de prtese (afartado, afarto, alapa, apexado, bochar - abochar),
senn tamn usos peculiares do nmero (arroace, aveo), do xnero (galipoto), do seseo (albars, gradisela) e de suxos (cadeirudo, cadriludo, catapoia, entrudio, esquinenza, frontudo, galiqueira, lagartola). A necesidade
de consegui-la rima autoriza a crear variantes novas (deluvn, lucido) e a
propia categora gramatical admite metamorfoses varias: entre a natureza substantiva e adxectiva (vermolo en amarelle, carranco), entre verbo e
adxectivo (encho) e posiblemente entre verbo e substantivo (dizma).
afartado. [Boi] que deixou de comer ou por farto ou por inapetente. O boi afartado fai cama do rabo
(Llpiz 1954a: 1,145). S Porto (1900-1908) o define como adj. ant. Harto, farto, mantenido.
Esta palabra e as das seguintes son mis comns sen ese a inicial que parece prottico.

174

Xess Ferro Ruibal


afarto. V. afartado. O boi afarto, ditase no prado (Llpiz 1954a: 1,145). Porto (1900-1908) recolle esta
palabra como adv. c. ant. Asaz, harto, bastante.
alapar. Comer devorando. Deixa que mexe o boi que dos berros alapou (Llpiz 1954a: 1,139). Esta
palabra aparece en varios dicionarios pero co valor de Esconder, ocultar; s se lle aproxima algo
Garca Gonzlez (1985) cando o define como v. (Lax.) gruir el cerdo cuando tiene hambre. E a
variante alampar aparece por primeira vez en Franco Grande (1968) co valor de Devorar, engullir
(con avidez), valor que ten como comn a forma lapar xa dende Sarmiento.
albars. Llpiz d este refrn: Gafeira, albars e mal de san Antn, tres verbas para un mesme horror. E
engade gafeira, lepra; albars, albarazo o lepra tuberculosa. Mal de san Antn o gangrena (Llpiz
1954a: Medicina, 150). En Sarmiento aparece albaraz como Clase de uvas en Pontevedra. Pero
albarazo xa aparece no DRAG (1913-1928) como s. m. Albarazo. Empeine, postilla, mancha
blanca que sale en el cutis de las personas y en la piel de las caballeras. Especie de lepra. E Eladio
Rodrguez (1958-1961) di: s. m. Lepra tuberculosa. // Especie de empeines que forman en la piel
manchas blancas. // adj. Uva blanca, grande en ramo y racimo, y no muy temprana.
amarelle. Os amarelles, dicir, os narcisos, si que aparecen nos dicionarios pero non vexo o
valor de adxectivo, que aparece no substantivo composto auga amarelle co significado de flores de
narciso en infusin. O pan de bra con auga amarella, fortalez a cervilla e as tripas enche. Cervilla sera a
parte cervical do espiazo humano (Llpiz 1954a: 535,443).
arroace. Arroace na ra, moita sardia. Vzquez Saco (1962: 18019) di: Arroace, variante de arros
(M. Valladares) y arroz (C[arr]. Alvarellos), no registrada en nuestros diccionarios. / Arroace es el
delfn, cuya presencia temen nuestros pescadores porque sus saltos son indicio seguro de tormenta y porque ahuyenta la sardina, a la que es muy aficionado. Var. arroaz (Carr, Voc. Irm[andades].;
Ibez, D.E. [Eladio Rodrguez (1958-1961)]); arros (Vall[adares]., D.E.) y arruaz (D.E.) Se le
llama tambin golfio (D.E.), golfin (D.E.).
aveo. Calquera instrumento de labranza. Pr run traballador non hai aveo que lle vea ben (Vzquez
Saco 1962: 22140). Esta forma singular s figura nalgns dicionarios co valor de Palo algo labrado para bastn; pero o significado que lle d este refrn parece que o reservan para a forma
exclusivamente plural e como palabra de varias comarcas de Lugo.
apexado. Pexado. Boi apexado non pasa o valado (Llpiz 1954a: 1,136). Nos dicionarios s aparece
como participio de apexar con estes valores: 1. Atravesar el ro en barca o barco con el auxilio de
una vara o palo que no sea remo. 2. Tratar de agarrar, atarazar, morder o asir con los dientes.
bochar abochar. Romper a brotar los rboles. Falta en nuestros diccionarios, como bocho
= capullo. Sin: abotoar, abrochar, abotoar, abrollar, abromar, abortar, abrumar, etc. O salgueiro
bochou, a primavera entrou (Vzquez Saco 1962: 19913). Pero, se ben se mira, Anbal Otero recolleu
bocho e bochare en Parrochas.
cadeirudo. [Boi] ancho do tercio posterior. Boi cadeirudo e boas illargas, saca seu dono da lama
(Llpiz 1954a: 1,133). Boi cadeirudo e de lomba ancha ao seu dono saca da lama (Llpiz 1954a: 1,133).
Llpiz explica que sacar da lama significa sacar a algun dunha situacin comprometida. Reclleo
en Campos de Vila (Quiroga).
cadriludo. V. cadeirudo. Boi cadriludo e de costas anchas ao seu dono saca da lama (Llpiz 1954a: 1,133).
O refrn recolle o feito de que o aumento do volume torcico proporciona unha maior resistencia
ante calquera esforzo.
carcaixa. Carcaixa, en Puentedeume, de donde es el refrn, es niebla oscura, hmeda y espesa.
Falta en los diccionarios gallegos. Carcaixa, norte ou nordeste cra (Vzquez Saco 1962: 12844).
Carcaixa, norte pa (Vzquez Saco 1962: 12845). Nos dicionarios aparece a forma carcaxa: o propio DRAG (1913-1928) recolle esa forma e ese mesmo refrn (Carcaxa norte cra) que outros
posteriores repiten.

A Fraseoloxa como Fonte Lexicogrca


carranco. Llpiz define os carrancos como Reumticos que andan arrastrando los pies o piernas,
derrengados, nefrticos. Xa se van os carrancos do balneario, sin sade e sin cartos Contos de Garibaldi, aludiendo a los agistas del Balneario de Cortegada, a los que anualmente serva (Llpiz
1954a: 473,103). Nos dicionarios non aparece esta palabra, anda que si aparecen carrancudo e
carrancholas.
catapoia. Plula. Catapoia dourada, non por iso millorada (Llpiz 1954a: Medicina, 53). Cuveiro (1876)
e Porto (1900-1908) teen catapocia pldora. En latn catapotium xa era a pldora que se enva sen
mastigar mentres que pilula era varias cousas: pelotia, bola, pldora e mesmo cagalla.
deluvn. Deluvn palabra modificada no seu morfema final para consegui-la rima nun fraseoloxismo. Si me encontro no salto, ben me salvo; si vou saltarei, inda me salvarei; pero si vou deluvn, non
teades mentes por min. Que ese deluvn? Vzquez Saco explica que deluvar en la zona de Sarria
es frotar la ropa para lavarla; y en la comarca de Laln se aplica a la operacin de sacar la vaina,
habas, garbanzos, etc., lo que retiene tambin la idea de frotamiento. E engade este comentario:
Curiosa descripcin que hace la pulga de los peligros que corre cuando se intenta cazarla. Se
siente perdida si va deluvn, palabra procedente de deluvar = frotar suavemente, como los nios
frotan los ojos al despertarse, ou Frotar la ropa cuando se lava, estregar el lino para quitarle las
arestas etc. (Vzquez Saco 1962: 20471).
dizma. Dizma para a igrexa, anque non quede pelexa. Dizma lo mismo que desma, diezmo de la Iglesia (Llpiz 1954a: 578,75). Desma aparece en Carr (1928-1931) pero dizma, substantivo (como
parece consideralo Llpiz), non aparece en ningn dicionario. Pero ben podera ser imperativo do
verbo dizmar, que, ese si, aparece nos dicionarios.
encho. Soalleiras, mgoas e ceas teen as covas enchas. Llpiz rexstrao en Forcarei (Llpiz 1954a:
528,385). Este inusual adxectivo aparece en Cuveiro (1876), Porto (1900-1908) e Filgueira (1926),
pero s como substantivo co valor de s.f. Enmienda, compensacin, resarcimiento.
entrudio = antroido. Entrudio (antroido) lacazn come a carne e deixa o pan (Vzquez Saco 1962: 7198).
esquinenza. Llpiz defneo como anginas, glndulas infartadas. Brtema a rente o chan, esquinenzas dan. Achanda a brtema? Centinelas con esquinenzas. (Dicen en los cuarteles de Galicia que los
centinelas en las noches de niebla baja acaban con anginas). Os das de brtema cllense as esquinenzas
(Llpiz 1954a: Medicina, 164). Valladares (1884) o primeiro que rexistra esquinncia como com.
Angina en los animales, especialmente caballeras. Despois del recollen todos a forma esquinencia,
pero s Anbal Otero (1977) matiza algo mis cando di: f. fig. y fam. Parece unha esquinencia, un
nio raqutico. Est coma unha esquinencia, un viejo seco.
estrame. Estrume. Na corte, estrame nova e vio cova (Llpiz 1954a).
estreveira. Parte da corte onde se moxe a vaca. A vaca de boa teta vndese na estreveira (Llpiz 1954a:
1,156). A vaca de boa teta vese na estreveira (Llpiz 1954a: 1,157). Sendo estreveira o lugar da corte onde
se moxen as vacas, a vaca que boa encher al a canada do leite.
fgoa. Chaga infectada. Boi con lagartia, manta queimada na fgoa (Llpiz 1954a: 1,155). A fgoa
designa xenericamente unha chaga infectada, dado que este refrn a refire lagartia (enfermidade
que carcome a pezua da vaca) e dado que Valladares (1884) (e outros posteriores a el) a describen
como Especie de heridas, llagas, que se forman en la piel, al tiempo de salir las viruelas locas,
mas grandes que las de estas, que dan mas trabajo y desaparecen tambien mas tarde. Comentando a palabra ngoa, Llpiz matiza que a fgoa llaga purulenta.
frontudo. [Boi] de grandes cornos. Boi, frontudo; e cabalo, cascudo. Indica as cualidades que se prefiren nos animais dunha e da outra especie (Llpiz 1954a) (Eladio Rodrguez 1958-1961: boi).
galipoto. Cualquier mal venreo. Galipoto malo, sualo (Llpiz 1954a: Medicina, 489,161). O que
traen algns dicionarios galipota (Mal glico, enfermedad venrea dende Filgueira 1926) pero
temos que prescindir da acepcin de alquitrn, que s recolle Leiras (ca. 1906) e que nos fai

175

176

Xess Ferro Ruibal


lembra-lo galipote con que na Costa da Morte denominaban os marieiros o chapapote do Prestige
do 2002. En calquera caso galipoto aqu claramente masculino.
galiqueira. Dolencia venrea. Non [h]ai galiqueira que non vea por bragueta. Dr. Arechaga (Llpiz
1954a: 535,439). Esta denominacin do mal glico non aparece nos dicionarios. Lmbrese no apartado anterior a palabra galipoto.
gradisela. Cando a gaivota anda gradisela, mal pra ns e fame pra ela (Vzquez Saco 1962: 12610).
Pode se-la gradicela que Anbal Otero recolle en Marn e Garca Gonzlez (1985) no Grove co
significado de estrela de mar, se temos en conta que son zonas de seseo. Vzquez Saco (1962)
comenta que Ni gradisela, ni gravisela figuran en nuestros diccionarios pero gravisela figura en
Franco Grande (1968) e Carr (1972) como semilla en germinacin.
lagartola. Enfermidade que carcome a pezua da vaca. Vaca con lagartola, tarrn queimado taxoula
(Llpiz 1954a: 1,155). Garca Gonzlez (1985) recolle lagartia e lagartixa. Llpiz explica que outro
remedio dos albitares para as chagas dos cascos consista en aplicar un terrn con cspede fresco
e as sas races sobre a chaga enconada. sabido que outro tratamento tradicional para as infeccins e feridas da pezua (necrobacilose podal) consista en cortar todo arredor da pata enferma
un terrn de herba que logo poan a secar: segundo a secando a herba, a curando a pata.
latarengo. Ladrn de gando. Llpiz (1956) reclleo como adxectivo: xente latarenga. Llpiz recolle
as voces latarego e latarengo co significado xeral de tratante en Sarria; noutro momento, recolle
de Noriega Varela xente latarenga, co mesmo significado: feriantes, chalanes. Pero cando explica
o refrn O que vacas non ten e vende xatios, de algures lle vn, matiza o concepto de latarengo como
ladrn de ganado (e faino equivaler cast. cuatrero). Lence Santar (1938-1941: 37) escribe, sen
dar mis explicacins, que en Riotorto chaman lataregos s vecios dEspasande de Abaixo e
sabido que Espasande de Baixo unha das parroquias de Riotorto. Con todo, inicialmente a
voz deba ter un significado neutro, porque en Ribarteme Llpiz recolleu Latarego son que merco e
vendo, nin gano nin perdo (Llpiz 1954a: 2,10). Xente latarenga, sexa pobre sexa rica, atpase de feira en feira
(Llpiz 1956: 313,689). O ms. de Rodrguez (1855) xa dica que latarego era Voz corrompida de
Laitariegos, montaa de Asturias donde viven los ganaderos. ben posible que haxa aqu unha
evolucin semntica de tipo metonmico.
lucido. [Boi] de boa calidade. V. lucido. Boi lucido, nunca ten fasto (Llpiz 1954a: 1,134). Posiblemente sexa unha creacin pedida pola rima, porque a mesma fonte cita Boi lucido, non coez fasto.

3. palabras que non encontro no dicionario de dicionarios


ababol. Ababoles, flores o simientes de amapola u otra pap[aver]cea. Tambien se emplean las
hojas como emoliente. Collizo e freumn, pese [sic] mol con auga dababol. Auga dababol cocimiento de simiente de amapola o adormidera (Llpiz 1954a: Medicina, 65. M Pouso. La Vega del
Bollo). Cando o collizo te colla, ferve ababoles y enxauga (Ababoles flores o simientes de amapola u otra
pap[aver]cea. Tambien se emplean las hojas como emoliente) (Llpiz 1954a Ibidem; Dr. Llpiz
Ferrer Repertorio mdico).
abregoar. Expulsa-las secundinas. Nove follas de edreira fan abregoar s femias (Llpiz 1954a: 2,516).
Llpiz explica que as fregas se deben dar coa infusin das hedras no ventre. Ignoro se esta palabra
ter algo que ver co adxectivo abregada que unicamente recolle Anbal Otero con esta definicin
Defendida, hablando del agua de riego. Trago a i-auga abregada naquela lameira; tem auga pra andar
abregada todo o ano (porque la fuente es de l y nadie se la quita). Vale de Matos.
argua. Cornezuelo del centeno que entre varias de sus virtudes teraputicas tiene la de secante.
Unto de porco e po darguas o fogo negral mailo vermello tira (Llpiz 1954a: Medicina, 156).

A Fraseoloxa como Fonte Lexicogrca


asobardo. Comida excesiva. Repdeo traino o asobardo (Llpiz 1954a: 522,349). Ata Eladio Rodrguez (1958-1961) non figura sobardar (Rebasar. Rebordar, salirse alguna cosa de los limites que
la contienen. Sobrepasar).
barbonda. Especie de reuma articular propia de comarcas muy hmedas. Porque es muy difcil
de curar o mitigar la reuma crnica o aguda. En las regiones hmedas existe la barbonda o reuma
articular de transicin, que se cura cambiando de clima. Dor de barbonda, chuvia porta. Pra tira-la
barbonda, unto das cobras. Derreira vella, a morte a leva (Llpiz 1954a: 472,103). Llpiz recolle esta
palabra en Negreira e tamn do Dr. Casares Gil (1882) de quen parece tira-la noticia de que el
unto de cobra (culebra) no faltaba en el botiqun de los mencieiros, boticas rurales y antros de
meigos y hasta se venda publicamente en las ferias.
benefe. Violeta o alhel blanco, tambin conocido en Gal. por herba goubeiras y gayos. Parece
localizalo na Gudia. O que se cura con benefes xa non vai ao mstre (Llpiz 1954a: 505,218).
boeira (estrela). Planeta Venus, segundo Llpiz, por terras de Lourenz. Estrela boeira, vaite deitar
que os vosos boeiros vanse cear (Llpiz 1954a: 1,142). Supoo que a relacin cos bois (ou cos pastores:
boieiros) est no feito de se-la primeira estrela que se ve solpor e a ltima que desaparece mencer
(Llpiz 1954a).
couriza. Defluxin nasal. Courizas e cagalleiras acaban cas vellas (Llpiz 1954a: Medicina, 55. Dr.
Llopiz Ferrer, Repertorio mdico).
culebrn. Persona mala. O que mata un culebrn, ten cen anos de perdn (Vzquez Saco 1962: 821).
endria. Endrias falta en nuestos diccionarios, aunque registran endrino. Ano de moitas endrias,
ano de poucas farias (Vzquez Saco 1962: 1084). o froito do endrio (Prunus spinosa).
defrouxeira. Correnza, diarrea. Si es de pujos se llama defrouxeira; si con cmaras, reeira, correnza
y colica. Vulgarmente se le llama cagalleira cagalleira y a la infantil lixo y codo. Correnzas por maio, sade
pra todo o ano. Froita verde pola correnza se perde. Se negra a defrouxeira, inda mis a cagalleira. Llpiz
comenta neste caso: diferencia entre la diarrea comn y la aguda o colerina, furria, furrica, cagalleira
(Llpiz 1954a: Medicina, 76) .
escurrutar. Trucar, embestir. O que anda cos bois, a escurrutar deprende (Llpiz 1954a: 1,148). O mis
parecido escurruxar que figura no Apndice de Eladio Rodrguez (1958-1961) como v. Espantar,
ahuyentar (Lemos).
esmancarse. Desconxuntarse [unha articulacin]. A quen co demo anda, o boi se lle esmanca (Vzquez
Saco 1962). O run boi na corte folgando sesmanca (Llpiz 1954a: 1,150).
falamenta. Chchara mercantil do feirante. Non se fai boa feira sin cartos nin falamenta (Llpiz 1954a:
2,13)1.
farturado. Suficientemente alimentado. No inverno mormente o gado ha de estar ben alimentado / farto /
farturado (Llpiz 1954a: 2,89). Pouco gado e ben farturado (Llpiz 1954a: 2,94). Lmbrense paralelos
coma No inverno o gando ha de estar ben mantido (Zamora Mosquera 1972: 149), No inverno sobre todo o
gando ha de estar ben comido (Carr Aldao 1926: 35.7, Vzquez Saco 1962).
feirada. Conxunto das operacins econmicas realizadas por unha persoa nunha feira. Unha boa
feirada cobre moitas malas (Llpiz 1954a: 2,17).
feirado. Feira. Si vas a feirado, ou vai enganar ou volve enganado (Llpiz 1954a: 2,21).
fogo negral. Absceso producido por un hematoma supuroso. Unto de porco e po darguas o fogo negral
mailo vermello tira (Llpiz 1954a: Medicina, 158).
fogo vermello / aburante. Escarlatina. Unto de porco e po darguas o fogo negral mailo vermello tira

1.

Llpiz: Non faise ba feira.

177

178

Xess Ferro Ruibal


(Llpiz 1954a: Medicina, 156). Carr (1928-1931): Fogo ardente Erupcin cutnea. Eladio Rodrguez (1958-1961) fala do Fogo ardente, el fogo de San Antn. Fogo de San Antn, enfermedad epidmica que hizo grandes estragos en los siglos XI al XVI y que consista en un ardor cutneo abrasador
y en dolores intolerables, acompaados de una especie de gangrena generalmente mortal. A veces
ennegreca, secaba la piel, extendase por todo el cuerpo y terminaba por hacer desprenderse las
carnes y los huesos. Repteo sintetizando Franco Grande (1968).
herbado. Prado. Cal o herbado, tal o gado (Llpiz 1954a: 2,95). Llpiz reclleo de C. Agrasar
(Agrarismos, Herbn).
larpelo. Larpelo es en la comarca de Samos, lonja delgada de tocino. Falta en nuestros Diccionarios. Larpelo cocido, larpelo comido (Vzquez Saco 1962: 10597). Anda que parece evoca-lo lardo,
este normalmente a parte gorda do toucio, mentres que o larpelo a delgada.
lourado. Color de piel melado. Boi marelo lourado, primeiro morto que ampeado. Aplcase pelaxe do
gando vacn (Llpiz 1954a: 1,134).
luareiro. Que anda con las fases de la luna. Home luareiro, nin boa palla nin bon palleiro (Vzquez
Saco 1962: 11219).
lueiro. El que anda siempre mirando a la luna para guiarse por sus fases. Home lueiro non bon
*cosecheiro (Vzquez Saco 1962: 11220). V. na epgrafe 3 a entrada luareiro.

4. palabras xa pouco frecuentes ou hibernadas


O refraneiro, como se ve, mantn activas algunhas palabras que xa
son pouco frecuentes no uso e mesmo nos dicionarios. Ben mirado, o feito de que un paremigrafo anote a denicin dunha palabra xa indica
que el sospeita que pode haber lectores que descoezan o signicado da
tal palabra, e que de a resulte que para eles o refrn sexa opaco. Pero
neste apartado quero comentar algunhas palabras que simplemente van
quedando desprazadas por outras que resultan simtricas do casteln ou
doutras linguas, porque a homologacin terminolxica non sempre privilexia as formas diverxentes, nin sempre ten a debida preocupacin por
protexe-la variedade.
anazar. Llpiz explica que anazar bater, axitar, no folklore de Lourenz. O que anaza a leite, nauga
a converte (Llpiz 1954a: 1,148). Sol e auga, tempo da anazada. Anazada o leite callado ou requeixo
na fala dos vaqueiros de Alzada (Llpiz 1954a: 2,86). Xa Sarmiento dica que anazar mover y
revolver [un]a cosa para que se condense o trabe, y tambin para que se liquide o disuelva, o para
que se incorporen cuando son muchas cosas, como Bater ou anazar obos.
aprovecer. Noutros casos o fraseoloxismo parece insuflarlle nova vida a unha palabra que si
recollen os dicionarios pero que xa pareca un fsil. Tal o caso do verbo aprovecer. Para Cuveiro
era Aprovechar, hacer progresos; para Porto (1900-1908), 1. Hacer progresos, adelantar,
medrar, aprovechar, crecer, elevarse, desarrollarse. 2. ant. Propagarse, extenderse, multiplicarse,
difundirse; para Carr (1928-1931), v. n. Adelantar, hacer progresos. Vase arrequecer; para
Acevedo (1932) Cast. ant.: Aprovechar, hacer progresos. s. por los viejos de la montaa
del Navia al Eo y en gall. F.; para Eladio Rodrguez (1958-1961) 1. Aprovecer, aprovechar,

A Fraseoloxa como Fonte Lexicogrca


adelantar, hacer progresos. 2. Cundir, propagarse, difundirse, no Apndice do Eladio Rodrguez (1958-1961), v. Aparecer sbitamente (Caurel). Os posteriores ou non o recollen xa ou
repiten o dito. Ben, pois Llpiz recolle a locucin aprovecer como a leite fervendo (Llpiz 1954a:
1,112).
arnelas. Raigones fuertes de antiguas muelas. Mais val arnelas que mas podremias. L. F. Rev.
A.N.T. Cir, 1909 (Llpiz 1954a: 471,99).
aviseda. Umbra. Na abiseda o zuruxn medra. Este refrn contraponse a aqueloutro que di que
Onde entra o sol non entra o mdico. Llpiz reclleo en Monforte (Llpiz 1954a: 533,413). Aparece por
primeira vez en Eladio Rodrguez (1958-1961).
barandal. Terraza abalconada. Barandal ao meuda, aba a vida. Prez Lama, ref. 1566 (Llpiz
1954a: 536,452).
bochechar. Enjuagarse la boca, buchear. Bochecha a boca co asento fervido e o dr de mas remargarido
(Llpiz 1954a: 471,99).
cegallo. Cegarrita, persona con poca vista. Fel do barbo, cralle a vista aos cegallos (Llpiz 1954a:
514,282).
cercenar. Florea-lo pan. Coma espendoar. Cando o pan cercena, *ablanda a masa na artesa. Cercena: el
hecho de florecer el pan en la tierra. Variante de cenceno (ver valor) (Vzquez Saco 1962: 17691).
Variante de cenceno que Carr y Dicc. Enc. [Eladio Rodrguez (1958-1961)] slo aplican a la flor
del maz. Florecer el maz tamn o significado que o Glosario de Constantino Garca (1985)
recolle en catro lugares da provincia da Corua. Vzquez Saco (1962) explica que En esa poca
[cando o millo florea] hay que dejar la masa un poco dura, porque ablanda.
citra. Lacra o cicatriz. Cura a fgoa, mais deixa a citra. (Llpiz 1954a: 468,86). Valladares (1884)
defina como Especie de marca, seal, abolladura, que hace un objeto en otro y aun la mano del
hombre. A palabra chega a Carr (1928-1931) pero xa non a Garca Gonzlez (1985).
cobra. Accin de cobrar. Fun s cobras e salronme lagartos. Fu a cobrar mis cuentas y no logr
mi propsito. Xoga coa polisemia da palabra cobras (Vzquez Saco 1962: 5986). Aparece por
primeira vez en Eladio Rodrguez (1958-1961).
cochicha / cochincha. Estomatitis, gengivitis, especie de aftas benignas que se presentan a
los nios en la lactancia. Recibe adems los nombres de boubas, buas, carouxeiras y srsaro. Se haca
respirar a los enfermos, sobre agua previamente pasada por el po o piln de los cerdos. Cochicha,
cochicha, vaite deiqu que o prco e a prca comen de t. // Cochincha cochincha, vaite de aqu que prcos e prcas
comen de ti (Celanova). Cochincha cochincha, vaite de eh que os nenos do barrio non son para t (El habla en Cadones, Bande). Enxunlla de galia tira as cuchichas. Cuchichas en el Valle de Monterrey son las pertidas
inflamadas (Llpiz 1954a: 60). S Carr (1972) recolle a acepcin de papera, partida.
coitas. Manchas oscuras en la piel, producidas por disgustos. A pernina (o bracio, o corpio) de (F.
de T.) moi lastimosia est, de coitas e rbeas e nacidas bravas. Si eres branca Dios te parta, si eres negra Dios te
fenda, si eres rubia, Dios te confunda. Salmio, Reiriz - Orense (Llpiz 1954a: 463,63).
coto. De coto escribiu Sarmiento isto cando definiu cadabullo: Lo ltimo que queda de un tizn
(por otro nombre coto) y en general significa un garabullo, un zoquete, un cabo de palo, y creo,
del que sirve para alumbrar y quemar. En Valladares (1896) dise Adicin: Pedazo de cigarro, o
pitillo. Pedazo inservible de madera. Non volve aparecer ata Carr (1972), que cita Llpiz cabo
de vela explicando un refrn que recolle dunha fbrica de cera: Con moitos cotos faise un brandn
(Llpiz 1954a: Culto religioso, 577,54).
cotoluva. Variante de cotova, cogujada. Cotoluva, va, va, canto mis alta, mis asuba. El refrn
imita el canto del ave. Cotuliva (Vzquez Saco 1962: 14269). Aparece por primeira vez en Rivas
(1978): f. Calandria, cogujada, ave canora parecida a la alondra (Fondo de Vila y Estevesios). En

179

180

Xess Ferro Ruibal


Fondo de Vila se dice ms cotova. En Estevesios se dice: Canta a cotoluva, rompe o da, que alude
a sus hbitos maaneros; en Mayo se oye su canto areo casi imperceptible, ya por las cuatro y
media. A este hbito aluden tambin otras lenguas, como el I.: To rise with the lark. En realidad,
es una variedad de laverca, pero que habita ms por los sembrados, y la laverca por el monte de
carrasco rastrero, que en Fondo de Vila llaman carpaza o carpazo.
cuxiga. Contraveneno, antdoto, triaca. Contra a pezoa malina, cuxiga. Pezoa malina pstula
de aspecto poco confiable; picadura de alimaa venenosa. Dr. R. Segade, Mellid (Llpiz 1954a:
519,324).
defumeira. Fumigacin, sahumerio, desinfeccin por ahumamiento. Defumeira pide o ban onde
morreu a enferma. Gmez Durn, Pract. mdico pop. (Llpiz 1954a: 469,92).
derreira 1. Amalar da derreira enfermar del rin. Si non queres amalar da derreira non conteas a
mexarreira (Llpiz 1954a: 511,260).
derreira 2. Reuma crnica o aguda. Porque es muy difcil de curar o mitigar la reuma crnica
o aguda. En las regiones hmedas existe la barbonda o reuma articular de transicin, que se cura
cambiando de clima. Derreira vella, a morte a leva (Llpiz 1954a: 472,103).
derreo. Mal do derreo nefritis o reuma. Pra-o mal do derreo, caldo de cogumelos. M. Saavedra Ascariz,
Santiago, ref. 1212 (Llpiz 1954a: 473,103). Dor derreado nefrite. Door derreado trai a morte no rabo.
Dr. Blak, Corua, Folklore de medicina).
enfigoar. Afistolarse una llaga. Man piedosa, a chaga enfigoa. Escusado en hacer dao al paciente, la llaga no es tratada con la debida energa. Dr. Garca Durn, Pract. med. pop. (Llpiz
1954a: 468,87).
escornn. Corneador. Boi escornn recibe cornadas. Acevedo (1932) o nico que recolle a palabra
escornn e defnea como Que tiene condicin de topar (Llpiz 1954a) .
esfarnar. Florear, purgarse de la flor, expulsar el pendn; espendoar, en Aguada. Pr pan esfarnar,
o cabelo temblar (Vzquez Saco 1962: 1890).
esforricar. Defecar. solpor esforrica/cgase o boi na teir (Llpiz 1954a: 1,130).
esmechadela. Descalabradura. Es trmino irnico. Despois da esmechadela, untal-a cabeza. Asieumedre, L. F., Tio Marcos da Portela 1916 (Llpiz 1954a: 473,104).
esmexarse. Evacuar orina sin sentirlo. A que caga raleiro e sin querer sesmexa, por prene se tea.
Rafaela Gutierrez, prof. partos - Vigo (Llpiz 1954a: 520,333).
faramalla. A lei de Dios non quer faramallas. Faramalla: trampa, enredo (Llpiz 1954a: Dios: 674,8).
Se lle habemos facer caso s fontes escritas, esta ten tdalas trazas de ser unha palabra hibernada.
Llpiz recolle o refrn de Bernardino Armesto e dtao en 1834 pero nos dicionarios non aparece
ata Anbal Otero (1977), que o define como Charla artificial, encaminada a engaar, e en Eladio
Rodrguez (1958-1961), que o define as: s. f. 1. Faramalla, charla artificiosa encaminada a engaar a uno. 2. Fachenda, bambolla, boato excesivo de ms apariencia que realidad. 3. Trapisonda,
embrollo, confusin, maraa. En esta acep. tambin se dice faramallada. Repteno despois Franco
Grande (1968) e Carr (1928-1931). curiosa a informacin que ofrece o TILG: s aparece 11
veces, das que das son textos de 18232 e de 1853 e outras tres dos ltimos once anos; dos ltimos

2.

Facer vnculos e casas. Recordade, que inda tempo, Non vos metades en chanzas, que os valentes e o
bon vio, Como dicen, logo acaban. Qu ha de darvos ese crego? Qu caudillo o que vos manda? Un
escribano? vergonza E que haxa quen tras del vaia. Pode que tea valor, Como tamn faramalla, Pero n
un escribano Sin opinin e sin fama. De esta xente solo salen Enredos, preitos e trampas. Foron a peste
da terra E os ladrs da xente honrada. Queredes saber por qu Contra as leises se levanta? Porque antes a
escribana De Burn daba ganancias. (Poema s insurrectos de Burn (23.1.1823)).

A Fraseoloxa como Fonte Lexicogrca


vinte anos o TILG ofrcenos tres citas e o CORGA, do CIRP, ofrcenos outras tres. Isto fainos
pensar nunha palabra que esmoreca pero que est recuperando a literatura actual.
farn. Preguiceiro, que traballa pouco. boi farn, pouco lle presta o ferrn (Llpiz 1954a: 1,129).
Ntese que farona un dos varios nomes populares da preguiza.
feira franca. Feira boa. O mintir non paga e fai feira franca (Llpiz 1954a: 2,15). Parece ser refrn
de Noia. Haber que lembrar aqu a 6 acepcin que de franco d Eladio Rodrguez (1958-1961):
Aplcase a las cosas exceptuadas de derechos y contribuciones, y a los lugares y puertos que
gozan de esa exencin.
ferradela. Mordida. Ferradela de lozarra, percura a campa. Ferradela de sorropin, percura o queixn. Lozarra alacrau, escncere. Rio Caldo, Orense. Son especies distintas aunque ambos nombres lozarra y
soropion entran en la misma leyenda. Segun el portugus Alvaro de Acevedo, el sorropion parece ser
la cecilia o vbora de los prados. El alacrn, arcnido scorpio, por otros nombres vulgares, besta dos
penedos, cancaro, cncere, escacer, lacrau, lacraio, lescncere, rabo torto, rapapedras, rascalzo y zbaro, sorropin
(Llpiz 1954a: Zoologa, 1006,1).
fianza (venta a). Venda con pago aprazado. Venta ao contado, dieiro gardo; venta a fianza, dieiro
balanza (Llpiz 1954a: 2,23). refrn de Ourense. S Eladio Rodrguez (1958-1961) recolle
indirectamente esta acepcin: 2. Obligacin que uno hace para seguridad de un pago o contrato.
3. Fianza, prenda que asegura el cumplimiento de una obligacin, especialmente si es dinero, que
se deposita y consigna.
freumn. Nombre genrico del flemn de encas, pero ms vulgarmente llamado collizo y colleitizo y boloardo cuando es de gran tamao; niva se llamaba en el s. XVII. Cocemento de ababois, bos
son pra os freums (Llpiz 1954a: Medicina, 65. Dr. Andrade Herborstica gall.). Collizo flemn en las
encas. Auga dababol cocimiento de simiente de amapola o adormidera (Llpiz 1954a: Medicina
65. M Pouso. La Vega del Bollo). Collizo e freumn, pese [sic] mol con auga dababol. Auga dababol
V. 2. s.v. ababol. Boloardo xa aparece en Rodrguez (1863). Freumn unha interesante evolucin
semiculta do latn phlegmon, -nis, relacionado co grego e que queda varrida polo
cultismo normativo flegmn que ningun di.
galero. Sombreiro. Home de capa e galero o que eu quero. La voz galero en el sentido expresado ha
casi desaparecido del habla vulgar. La usan de vez en cuando los ancianos. Se pone en boca de
las mozas casaderas. Era el hombre a quien tenan por noble y formal, cuyo matrimonio era por
lo tanto conveniente (Vzquez Saco 1962: 11180). Probablemente desapareceu por pensarse
que, rematando en -ero, era un castelanismo, cando, se ben se mira, a palabra latina galerum que
xa significaba precisamente sombreiro. S a traen Valladares (1884), Filgueira (1926), Carr
(1928-1931) e Ibez (1950).
gallardo. Lucido e de bo aspecto. Si queres ao boi gallardo, lvao ao lameiro entre febreiro e maio (Llpiz
1954a: 1,153). Fronte s anteriores lexicgrafos que dan a gallardo o significado de Que tiene
los cuernos largos o a lo alto, Eladio Rodrguez (1958-1961) define como Airoso, gentil. Bravo,
bizarro, valiente.
gandarn. Monte con vexetacin pobre ou devesa con monte sen moita costa. Acabada a labor,
bois gandarn (Llpiz 1954a: 1,142). Franco Grande (1968), Carr (1928-1931) e Ibez (1950)
renen estes significados para gandarn: s. m. 1. Monte alto que se eleva al final de una gndara.
2. Cumbre que a veces separa dos parroquias.
landra. Anginas malignas, crup, garrotillo, difteria. Morre o vello cas caimbras e os novos cas landras
(Llpiz 1954a: Medicina, 64. O.L. Boado, Md. Orense). Cuveiro (1876) o primeiro que trae
unha acepcin parecida pero que sita noutra parte do corpo Tumor del tamao de una bellota
que se forma en las glndulas, los sobacos, etc., que non reaparece ata Eladio Rodrguez (19581961) (Glndula o quiste del tamao de una bellota, que suele formarse en el cuello, los sobacos,

181

182

Xess Ferro Ruibal


las ingles, etc.), que reproduce Franco Grande (1968); Carr (1972) di simplemente Glndula,
rgano que sirve para la secrecin de humores. Var. Glanda e reaparece en Garca Gonzlez
(1985): Fes: 2. ganglio inflamado en la base del cuello.
lzaro. Lepra febril. Lzaro, fogo salvaxe, eiqu te pillo, eiqu te mato. Frmula ensalmista de Mondoedo. Fogo salvaxe sarpullido pernicioso (Llpiz 1954a: 523,354).
lecer. Buen humor. Deitarse cedo e cedo derguer, d sade, forza e lecer.Prevenciones medicas, Dr.
Llopiz Ferrer, ref. 758 (Llpiz 1954a: 469,93).
louba. Loa, honor. Aparece na loc. en louva de /na louva de. En louba de san Lois, abogado da teriza,
Padre Noso, Ave Mara. Dr. C. Pelliteiro, El curanderismo (Llpiz 1954a: 529,394). Na louba de san Lois,
que me tire ista teriz, e non deixe nada eiqu. H. Gallego Arceste, Carballio (Llpiz 1954a: 529,394).
Na louba de san Gonzalo, pra que torne o pe ao seu estado. Invocacin a san Gonzalo de Amarante, curador de pes abertos ou desfiados (Llpiz 1954a: 518,320). Na louba de san Tom, desadormenta o meu
p. Lo dicen las madres a los nios cuando se les duerme un pie. Castromil de Orense (Llpiz
1954a: 518,320). En louba de San Silvestre pra que toda meicia empreste. Sofisma mdico farmacutico.
Abon. Dr. Punn (Llpiz 1954a: 507,221).

183

NOVOS CRITERIOS PARA A ELABORACIN


DUN DICIONARIO DE NEOLOXISMOS
Ana Beln Crespo Bastos / Xos Mara Gmez Clemente

Observatorio de Neoloxa (Universidade de Vigo)

0. introducin
Froito dos traballos do Observatorio de Neoloxa da Universidade de
Vigo1, en 2005 publicamos unha obra lexicogrca que denominamos Novas palabras galegas (Lpez Fernndez et alii 2005) e que reecta a vitalidade (Cabr 2000, Gmez Clemente / Rodrguez Guerra 2003a) na creacin
de palabras que tia a lingua galega. Nun anterior artigo xemos unha
pequena descricin desta obra (Gestido de la Torre / Gmez Clemente
2003). Recollanse nela creacins lxicas que non estaban nos dicionarios
galegos e que cumpran, polo tanto, un criterio de exclusin lexicogrca.
Os criterios utilizados naquela obra deben ser revisados e ampliados e a
informacin fornecida completada. Nesta contribucin pretendemos:
(a) matizar os criterios de identicacin de neoloxismos utilizados
nos traballos do Observatorio de Neoloxa,
(b) describir unha serie de marcas, algunhas derivadas do criterio
de identicacin e outras complementarias, que debern ser empregadas en futuras edicins do devandito dicionario2, e

1.

Este proxecto comezou en 1998. Nestes momentos faise unha avaliacin dunha serie de fontes en Internet: www.vieiros.com; www.galicia-hoxe.com; www.canalciencia.com; www.anosaterra.com. En setembro de
2006, comezouse a analizar un blog, concretamente o chamado Brtemas de Manuel Bragado. Na base de
datos, neste momento, estn almacenados un total de 12.000 neoloxismos revisados.

2.

Comprbense as marcas nos dicionarios de novas palabras do cataln (Observatori de Neologia 1998) e do
italiano (Adamo / Della Valle 2003). O primeiro utiliza principalmente marcas lexicogrcas (sobre o corpus de exclusin). O segundo incle tamn informacin morfolxica e sintctica sobre os procedementos
de formacin e identica os formantes.

184

Ana Beln Crespo Bastos / Xos Mara Gmez Clemente

(c) salientar a importancia que teen as novas tecnoloxas para a


elaboracin de produtos lexicogrcos, concretamente os extractores semiautomticos de neoloxismos para a redaccin de dicionarios de novas palabras.

1. o concepto de neoloxismo e a sa identificacin


As denicins de neoloxismo poden ser variadas, pero todas estn centradas no feito de unha unidade ser considerada como nova nun sistema
lingstico determinado. Cabr (1993: 444) arma que o neoloxismo se pode
denir como unha unidade lxica de formacin recente, unha acepcin nova
dun termo xa existente ou, nalmente, un termo emprestado hai pouco
dun sistema lingstico estranxeiro; Rey (1976: 4) defneo como une unit
nouvelle, de nature lexicale, dans un code linguistique dni, e Boulanger
(1989: 40) entende que [o neoloxismo o] resultado tanxible da operacin
de produccin lingstica indita [...], dicir, a unidade nova capaz de encher
cada baleiro detectado introducndose no uso corrente ou socioprofesional.
A novidade que nos referiamos establcese basicamente con respecto a un
criterio temporal (unha unidade nova se apareceu recentemente nunha
lingua), anda que tamn pode referirse ausencia desa palabra nun grupo
de dicionarios ou opinin sobre esa novidade que teen os falantes.
Estas tres consideracins dan lugar a distintos criterios de identicacin de neoloxismos:
1. O criterio lexicogrco
O criterio lexicogrco de identicacin est baseado na comprobacin
sistemtica da aparicin da unidade lxica nunha serie de dicionarios: as
que non se rexistran neles son consideradas como neoloxismos lexicogrcos. Este criterio, que vez dene o carcter do concepto neoloxismo,
presenta certos problemas. Xa Corbeil (1971: 135-136) armaba que un dicionario nunca pode recoller todas as palabras dunha lingua3 e polo tanto
o carcter neolxico dunha unidade establecido con este criterio pode ser
posto en dbida4. Ademais, os lexicgrafos, cando elaboran as sas obras,
3.

Este feito agrvase pola relativa limitacin no nmero de entradas dos dicionarios utilizados no corpus de
exclusin: VOLG (45.000), GDXL (95.000) e GDS XXI (80.000).

4.

signicativo ver como os dicionarios, especialmente os acadmicos, son pouco permeables introducin
de palabras de uso frecuente. As gramticas rexistran anda con menor frecuencia novos formantes que
poderan ser repertoriados nunha determinada lingua. Vxase Freixa / Sol (2003), que nos fornece datos
moi signicativos sobre a relacin da neoloxa catal cos dicionarios normativos nesa lingua.

Novos criterios para a elaboracin dun dicionario de neoloxismos

185

rxense por unha serie de normas que son mis ou menos permeables s
novas creacins lxicas, dependendo do tipo de dicionario que se elabore,
da ideoloxa, da tradicin, etc. Malia constatarmos estes feitos, o criterio
de exclusin lexicogrca ten unha vantaxe, que a da obxectividade na
obtencin dos datos e, dende logo, a facilidade de aplicacin.
2. O criterio temporal, a frecuencia e o criterio psicolxico-pragmtico
Estes tres criterios deben ser considerados conxuntamente porque estn estreitamente relacionados.
a) Criterio temporal e criterio da frecuencia
O criterio temporal basase na constatacin de que unha unidade
lxica leva pouco tempo instalada nunha determinada lingua (velaqu a
cerna do concepto de neoloxismo). Comprbase coas datas de aparicin
dunha palabra nun dicionario ou nun corpus textual para a atribucin
dunha terica primeira ocorrencia nunha determinada lingua. Con respecto a isto temos que dicir que:
Os dicionarios galegos non inclen ningunha referencia a unha
posible datacin da palabra na lingua.
As datas que se poden extraer dos corpora textuais galegos, CORGA e TILG, e da base de datos do Observatorio de Neoloxa deben
ser utilizadas da seguinte maneira para establecer o criterio de
novidade:
Data da primeira ocorrencia. Neste sentido mis til
o TILG por comezar os seus rexistros en 1612. O CORGA
comeza a recoller os de 1975 e a base de datos do Observatorio comeza en 1998. Se consignamos esta primeira
data, temos un dato obxectivo, pero hai que recoecer
que non tarefa doada interpretar cando unha unidade lxica deixa de ser un neoloxismo, cantos anos teen
que pasar para que unha palabra xa non sexa considerada nova (estamos a falar de unidades lxicas non rexistradas en dicionarios). Quizais non haxa unha fronteira
obxectiva, anda que podemos entender que descentralizador, por exemplo, rexistrada en 1977 no CORGA xa non
un neoloxismo. Pero, unha palabra moi utilizada como
represaliar, que se rexistra en 2001 tamn nesa base de
datos, non nos dicionarios, ou non un neoloxismo

186

Ana Beln Crespo Bastos / Xos Mara Gmez Clemente

despois de 5 anos? Quizais o nico razoable sexa deixar


a data da primeira ocorrencia para que sexa o usuario do
dicionario de neoloxismos quen a interprete.
Frecuencia e dispersin temporal. A anlise destes parmetros leva a considerar que unha unidade, mesmo que
se rexistre en data moi recuada, ter un maior carcter
neolxico (a) se ten unha baixa frecuencia, e (b) se, mesmo
tendo unha frecuencia relativamente alta, a sa dispersin temporal limitada. A baixa frecuencia dunha unidade contribe en certa maneira a aumentar o seu carcter
neolxico porque a pouca difusin pode ser un indicador
de que non tivo aceptacin entre os falantes. Tamn poida
que unha unidade tivese unha frecuencia alta durante un
tempo pero despois desaparecese. Isto indica que pode ter
un maior carcter neolxico para os falantes que a volven
recuperar pasado un tempo.
b) Criterio psicolxico-pragmtico
Falamos antes da dependencia que ten o criterio temporal da percepcin sobre a novidade dunha palabra que teen os usuarios da lingua.
Alain Rey, cando fala do neoloxismo5, di que imposible consideralo in
abstracto como un elemento novo dentro dun sistema, independente do
funcionamento concreto da lingua. Os neoloxismos defnense en relacin cun modelo de comunicacin determinado e, polo tanto, unha forma
funcional limitada na sa funcin a un subsistema (dialecto, sociolecto)
pode pasar a outro subsistema, no que ser percibido como neoloxismo.
dicir, un neoloxismo tamn pode ser aquela unidade que ben por moda,
por unha intervencin institucional ou por outras causas pasa dun grupo
de falantes a outro, ou dun rexistro de lingua a outro, independentemente da sa novidade obxectiva.
Para este autor, basear a neoloxa en criterios cronolxicos ou lexicogrcos presupn unha visin parcial dos fenmenos neolxicos; daque5.

Rey (1976: 17) defneo as: Le nologisme est une unit du lexique, mot, lexie ou syntagme, dont la forme
signiante ou la relation signiant-signi, caractrise para un fonctionnement effectif dans un modle
de communication dtermin [novidade funcional], ntait pas ralise au stade inmdiatement antrieur du code de la langue [sincrona]. Cette nouveaut, qui doit tre apprcie par rapport une dnition
prcise et empirique du code [novidade pragmtica], correspond en gnral un sentiment spcique
chez les locuteurs [xuzo colectivo]. Selon le modle de code choisi, on distinguira donc des nologismes en
synchronie large et troite, des nologismes pour la langue dans son ensemble ou pour un usage dtermin, des nologismes dans un contexte thmatique spcialis (technique et science) ou non spcialis.

Novos criterios para a elaboracin dun dicionario de neoloxismos

187

la, fala do concepto de impresin neolxica, ou percepcin da neoloxa


por parte dos falantes, que debe estar baseada nun xuzo colectivo que
supere os diferentes niveis de competencia que teen os falantes. Este
concepto de impresin neolxica, difcil de cuanticar, o que condiciona
o criterio temporal, como antes dixemos6.
c) O concepto de calidade neolxica
parte dos criterios citados, necesario tamn falar da calidade neolxica (CN) dunha unidade lxica, un concepto gradual que nos permite
comprobar a novidade dunha palabra nun sistema lingstico determinado, baseado principalmente no proceso polo cal se converteu en neoloxismo
(Cabr et al. 2004). Neste traballo utilizamos a metodoloxa empregada polos
autores do artigo citado para establecermos, cos nosos datos, os graos de calidade neolxica que deberan logo ser reectidos nunha obra lexicogrca
dedicada s novas palabras. Basicamente, a CN est baseada en criterios
morfolxicos, na anlise dos compoentes dunha palabra e na sa relacin
coas gramticas e os dicionarios.
Presentamos os principais procesos de creacin de novas palabras e a
CN asociada a cada un deles.
a) Derivacin por prexacin
Se a base e mais o prexo estn repertoriados no corpus
lexicogrco de exclusin e nas gramticas: CN 0.
Se existe o prexo e non a base: +CN 1.
Se non se rexistra o prexo e si a base: +CN 2.
Se non se rexistra nin o prexo nin a base: +CN 3.
Se se altera algunha regra gramatical: +CN 4.
b) Derivacin por suxacin
A base e o suxo estn repertoriadas no corpus de exclusin e nas gramticas: CN 0.
A base non est repertoriada e o suxo si: +CN 1.
A base est repertoriada e o suxo non: +CN 2.
Nin a base nin o suxo estn repertoriados: +CN 3.

6.

Vxase tamn Gardin et al. (1974) e obsrvese a sa metodoloxa baseada en enquisas a un nmero determinado de falantes.

188

Ana Beln Crespo Bastos e Xos Mara Gmez Clemente

c) Composicin patrimonial7
Se os dous elementos que forman o composto estn repertoriados no corpus de exclusin: CN 0.
Se s aparece unha das bases que forman o composto: +CN 1.
Se non aparece ningn elemento repertoriado: +CN 2.
d) Composicin culta8
Os dous formantes estn repertoriados: CN 0.
Un dos formantes non est repertoriado: +CN 1.
Ningn dos formantes est repertoriado: +CN 2.
e) Composicin hbrida9
Se aparecen repertoriadas as bases e mais os formantes:
CN 0.
Se non aparecen repertoriadas as bases: +CN 1.
Se non aparecen repertoriados os formantes: +CN 2.
Se non aparecen nin as bases nin os formantes: +CN 3.
f) Emprstitos10
Se un emprstito est adaptado (A), a CN menor porque
se entende que leva mis tempo na lingua: CN 0.
Se un prstamo est sen adaptar (SA): +CN 1.
Se o emprstito non est repertoriado na lingua orixinal
(LO): +CN 2.

7.

Na composicin patrimonial integramos aquelas palabras que estn formadas por unin de lexemas simples autnomos da lingua e que manteen distinto grao de autonoma.

8.

Entendemos por composicin culta o procedemento polo cal se unen dous formantes de orixe grecolatina.
Os exemplos rexistrados corresponden a neoloxa terminolxica. Non hai unha relacin exhaustiva de
formantes cultos nos dicionarios e gramticas galegas. Isto leva a que se consideren neoloxismos lexicogrcos unidades que poida que estean recollidas en dicionarios especializados que non forman parte do
noso corpus de exclusin e en obras dedicadas ao estudo terico-prctico da terminoloxa.

9.

Por composicin hbrida entendemos a combinacin de temas grecolatinos, ou truncacins de palabras


modernas, cunha palabra moderna.

10. Vxanse os traballos de Rodrguez Ro (1998, 2003) para unha completa relacin dos procedementos de
adaptacin de emprstitos ao galego.

Novos criterios para a elaboracin dun dicionario de neoloxismos

189

2. marcas nos dicionarios de neoloxismos


Entendemos que nunha obra lexicogrca que se poida denir como
un repertorio de novas palabras deben inclurse unha serie de marcas
que lle permitan ao usuario avaliar o grao de neoloxicidade das unidades lxicas extradas cun criterio lexicogrco. Describiremos primeiro as
marcas utilizadas no dicionario de Novas palabras galegas; a seguir, falaremos das novas marcas que seran necesarias en obras desta clase.

2.1. O Dicionario de novas palabras (2005)


O criterio utilizado para facer a escolla das entradas desta obra foi,
como se dixo, o lexicogrco: incluronse as palabras que non estaban no
corpo de exclusin descrito. As marcas utilizadas foron as seguintes:
a) Lexicogrcas
(1) O corpus de exclusin lexicogrca utilizado ata o ano 2000 foi o
seguinte:
VOLG (versin provisional 1989 // Corrixe 1.0-1.2).- realmente o
documento mis importante de todo o corpus de exclusin. Establece o lxico normativo e est realizado por unha institucin que
ten autoridade lingstica, derivada da Academia. Non serve para
a anlise da neoloxa semntica.
DRAG (1997).- Non ten un nmero elevado de entradas (aproximadamente 25.000), pero ten a vantaxe de ser a nica obra lexicogrca que ten un carcter normativo recoecido e serve para analizar
a neoloxa semntica.
(2) A partir do ano 2000 utilizouse o GDXL, que recolle un nmero moi
elevado de entradas (95.000).
b) Textuais.- Fixronse comprobacins adicionais en Internet para
avaliar a difusin das entradas que aparecan na base de datos.
c) Temporais.- Indicronse as datacins mis antigas rexistradas no
CORGA e na nosa base de datos de neoloxismos.
Das 1.166 entradas que aparecan neste dicionario, 199 estaban presentes
no GDXL, que se utilizou como parte do corpus de exclusin, anda que tar-

190

Ana Beln Crespo Bastos e Xos Mara Gmez Clemente

diamente. A marca GX00 apareceu en cada unha desas entradas para indicar
que estaban nese dicionario. En 2005 incorporamos ao corpus de exclusin
lexicogrca o GDS XXI. O emprego desta obra cando redactamos o dicionario de neoloxismos implicara exclur 550 das sas entradas. Este dato mostra
que a ltima obra citada se elaborou cun criterio aberto aceptacin de novas unidades lxicas que non tiveran entrada noutros dicionarios.

2.2. Novas marcas nos dicionarios de neoloxismos


Na redaccin dun novo dicionario de neoloxismos cremos que se debera inclur unha serie de informacins complementarias que teen que
ver coa pequena revisin do noso concepto de neoloxismo que comentamos ao principio deste traballo.
Propoemos a inclusin das seguintes marcas que dependen dos criterios descritos anteriormente11.
(a) Marcas temporais
En realidade, como comentamos, xa inclumos unha marca temporal
no dicionario de 2005, pero agora propoemos a sa comprobacin sistemtica en calquera fonte posible. Este criterio o que mis se achega
denicin que dan os autores que tratan sobre o concepto de neoloxismo.
Entndese, en principio, que unha unidade neolxica se aparece nunha
poca recente; non o se antiga. Consideramos que a nica marca que
se pode inclur a da data da primeira documentacin porque non podemos poer un lmite a partir do cal unha unidade deixa de ser neoloxismo
(ags que entre nun dicionario).
Fixemos unha datacin das unidades que estaban rexistradas no
CORGA. Este corpus permite obter unha data aproximada da primeira
ocorrencia da unidade que analizamos. Das 841 unidades rexistradas,
462 aparecen datadas neste corpus textual. A datacin mis antiga 1975
para a palabra centro-esquerda e a mis nova para a palabra situacionismo de 2003. Entre estas das datas aparecen, entre outros, os seguintes
exemplos:
[1975-1980] fraguismo, elitista, seguidista, casteln-falante, apartidista, atomizacin, reapropiacin, minorizar, globalizador, departamental.

11. Para exemplicar esta informacin xemos unha comprobacin sobre 841 candidatos a neoloxismos do
ano 2005, non rexistrados no corpus de exclusin lexicogrco, con 1334 ocorrencias.

Novos criterios para a elaboracin dun dicionario de neoloxismos

191

[1980-1990] on-line, modelizacin, privacidade, submundo, gay, profesionalizacin, sociopedagxico, arbitrismo, impasse, corresponsabilidade.
[1990-2000] peonalizacin, xenocida, microrrede, aeroxerador, comps, e-mail, chat, recompilatorio, plurinacionalidade, risoterapia.
[2000-2003] alterglobalizacin, xogabilidade, jazzstico, pangaleguismo, eurobarmetro, punch,
supervendas, router, teledermatoloxa, e-learning.

Como exemplos tirados da base de datos do Observatorio de Neoloxa


podemos citar as de datacin mis antiga:
[1997] deconstruccion, mercadeo, intramuros, medio ambiente.

(b) Marcas de frecuencia absoluta e dispersin temporal


(1) En principio, entendemos que se unha unidade frecuente, o seu
carcter neolxico menos evidente por repetida e, teoricamente, coecida. Se a unidade moi pouco frecuente, sucede inversa:
- Frecuencia alta:
competencial 91, corresponsabilidade 64, departamental 58, planeamento 54, vertebracin 52,
perigosidade 40, fraguismo 36.

- Frecuencia baixa:
antiobreiro -a 2, apartidista 2, seguidista 5, potenciador -a 4, antinacionalista 17.

(2) Se unha unidade ten unha dispersin temporal ampla, o seu carcter neolxico menor. Se as ocorrencias estn moi concentradas nuns
determinados anos, pdese considerar que mis neolxica:
- Ocorrencias dispersas:
planeamento 54: [1975-1984] 15; [1985-1994] 3; [1995-2004] 36.

- Ocorrencias concentradas:
departamental 58: [1975-1984] 1; [1985-1994] 3; [1995-2004] 54.
perigosidade 40: [1975-1984] 1; [1985-1994] 7; [1995-2004] 32.
plurinacional 51: [1975-1984] 8; [1985-1994] 5; [1995-2004] 38.

192

Ana Beln Crespo Bastos e Xos Mara Gmez Clemente

Departamental aparece en 1977 pero rexistra 54 das sas ocorrencias


a partir de 1995. O seu carcter neolxico evidente porque a meirande
parte dos seus rexistros se dan nos ltimos 10 anos. Perigosidade, da mesma maneira, aparece por primeira vez en 1977, pero concentra as sas
ocorrencias a partir de 1995. No caso de plurinacional rexstranse 8 casos
entre 1975 e 1979 e o seguinte rexistro xa de 1993. Entre 1993 e 2004 rexstranse 43 das 51 ocorrencias.
(c) Marcas lingsticas
parte das anteriores marcas, deberemos establecer que graos de
novidade, ou calidade neolxica (CN), teen as palabras segundo sexa o
procedemento utilizado para formalas. A calidade neolxica, como indicamos, establcese en relacin coas gramticas e dicionarios. Analizamos
os seguintes casos:
Derivacin por prexacin:
0 [pref + base]. O prexo e mais a base estn repertoriados no
corpus de exclusin e nas gramticas. A sa CN baixa. As
ocorre en multirreincidencia, deslocalizacin, precampaa,
codecisin, teleformacin, telecaza, dedocracia, maocracia.
1 [pref + ]. O prexo est repertoriado; a base non. Maior
grao de CN: antiviral, contraopa, insostibilidade, reubicacin12.
2 [ + base]. O prexo non est repertoriado; a base si. Grao
de CN maior, xa que a aparicin dun novo prexo nunha
lingua un fenmeno neolxico importante. Inclumos
aqu os casos de neo-, que decidimos considerar prexo
pola sa ampla rendibilidade. Ex. neocolonia, neoconservador, neoliberal, neolicenciado.
3 [ + ]. Nin a base nin o prexo estn repertoriados. Grao
de CN maior (non hai casos).
4 Alteracin de regras gramaticais: [pref + substantivo =
adxectivo]: [O alcalde nacionalista cualicado de] antiobreiro, programa anticontaminacin, mina antipersoa. Neste caso anti- non se comporta coma os outros prexos xa
que produce transcategorizacin.
12. Non se descarta nos dous ltimos exemplos a sa dependencia do casteln.

Novos criterios para a elaboracin dun dicionario de neoloxismos

193

Derivacin por suxacin:


0 [base + suf]. A base e o suxo estn repertoriados. En principio, a CN da unidade baixa porque, anda que a impresin inicial sexa de novidade, os falantes poden identicar
cada un dos compoentes da nova palabra: anecdotario,
conservacionista, comunicacional, condutual, conceptualidade, parabenizar.
1 [ + suf]. A base non est repertoriada e o suxo si. A CN
maior. Rexstranse casos con bases que son nomes propios,
de marcas comerciais, prstamos e tamn de verbos, non
rexistrados, derivados de substantivos. Ex.: mundializacin,
acebeiro, nominacin, toyotismo, titulizacin, chateo, frontepopulista, blogueiro.
2 [base + ]. A base est repertoriada e o suxo non. Poden aparecer casos como a terminacin -ing do ingls que
nalgns casos funciona como suxo. Non rexistramos ocorrencias en 2005.
3 [ + ]. Nin a base nin o suxo estn repertoriados. Non
se rexistran exemplos.
Composicin patrimonial:
0 [base + base]. As das bases estn repertoriadas. A CN
baixa. Videochamada, videoconferencia, vdeoconsola, videocreacin, escoitacontos, poema-imaxe, cd-libro.
1 [ + base] ou [base +]. Unha das bases non est repertoriada. Os exemplos que rexistramos teen un elemento
emprestado do ingls: blogmillo, blognovelado, netartista.
2 [ + ]. Non se rexistran exemplos.
Composicin culta13:
0 [fprex + fsuf]. Rexstranse os dous formantes cultos: homofbico.

13. Lmbrese o comentado antes sobre a presenza de neoloxismos terminolxicos na nosa base que deberan
ser tratados dunha forma diferente pola sa escasa aparicin nos dicionarios. Ademais, as gramticas
tampouco recollen exhaustivamente os formantes cultos que funcionan na creacin de unidades de valor
especializado.

194

Ana Beln Crespo Bastos e Xos Mara Gmez Clemente

1 [fprex + ] [ + fsuf]. Un dos formantes non est recollido


no corpus de exclusin: dislipemia, cloroquina.
2 [ + ]. Non se rexistran exemplos.
Composicin hbrida:
0 [fprex + base] ou [base + fsuf]. Os dous elementos compositivos estn repertoriados: aeroxerador, agrogandeiro,
chupptero, ecoeconoma, eurocidadn, euroconstitucin,
feminicidio, metrosexual, teleoperador.
1 [fpref + ] ou [ + fsuf]. Non est repertoriada a base, normalmente un prstamo adaptado ou sen adaptar: audioblog, ultrabinico.
2 [ + base] ou [base + ]. Non se rexistra a forma prexada
ou suxada no corpus: alterglobalizacin, cibercaf, cibersociedade, e-administracin, e-ciencia, e-comercio, e-DNI .
3 [ + ]. Ningn elemento compositivo est repertoriado.
Porn, o caso que rexistramos, altermundializacin, produce unha impresin neolxica baixa pola presenza de mundo, mundial.
Prstamos:
0 (A). Como comentamos, os prstamos adaptados por importacin ou calco, teen, en principio, unha CN baixa: privacidade, prking, rnking, computerizar, comps.
1 (SA). Os prstamos sen adaptar teen unha CN maior,
anda que moitos deles xa estn na lingua coti de moitos
falantes e, xa que logo, producen unha impresin neolxica
baixa: boom, hacker, driver.
2 (LO). Non se rexistran na lingua orixinal, onde funcionan como neoloxismos puros: godcasting, imode, blog, cromakey, book-crossing.

conclusins
O criterio lexicogrco forncenos dunha maneira sistemtica candidatos a neoloxismos. A consideracin dunha palabra como neoloxismo
lexicogrco debe ser matizada coa aplicacin doutros criterios. Os dicio-

Novos criterios para a elaboracin dun dicionario de neoloxismos

195

narios de neoloxismos deben presentarlle ao usuario a maior informacin posible sobre a cronoloxa, a frecuencia (a absoluta e a dispersin
temporal) e os procedementos de formacin das novas unidades, de maneira que poidan estes datos servirlle para formar o seu xuzo sobre a
calidade neolxica dunha palabra. En futuras ampliacins da nosa obra
de 2005 introduciremos esta informacin e esperamos que sexa til para
a comprensin do concepto de neoloxismo.

196

197

A INVESTIGACIN EN LEXICOGRAFA E TERMINOLOXA


NO CORPUS LINGSTICO DA UNIVERSIDADE DE VIGO
(CLUVI) E NO CORPUS TCNICO DO GALEGO (CTG)*
Xavier Gmez Guinovart

Seminario de Lingstica Informtica (Universidade de Vigo)

1. introducin
Neste artigo presentamos os traballos en lexicografa e terminoloxa
a partir de crpora que se estn a desenvolver na Universidade de Vigo
por parte dos equipos de investigacin do Seminario de Lingstica Informtica e do Observatorio de Neoloxa, que realizan un labor conxunto
orientado creacin de recursos para a lingua galega no marco do grupo
TALG (Tecnoloxas e Aplicacins da Lingua Galega). Neste traballo explicaremos as caractersticas dos crpora CLUVI e CTG, que constiten a fonte
destes traballos, a metodoloxa seguida para a elaboracin do Dicionario
CLUVI Ingls-Galego e do Banco de Datos Terminolxico da Universidade
de Vigo, as como os resultados obtidos ata o momento e as tarefas que
estamos a realizar e que temos en perspectiva.

2. corpus lingstico da universidade de vigo


O Corpus Lingstico da Universidade de Vigo (CLUVI) un conxunto
de crpora textuais de traducins en mbitos especcos da lingua galega contempornea, accesibles para consulta na web desde setembro
de 2003 no enderezo http://sli.uvigo.es/CLUVI/. Cunha extensin actual
total superior aos 20 millns de palabras, o CLUVI est formado por seis
*

Este traballo foi nanciado polo Ministerio de Educacin y Ciencia e o Fondo Europeo de Desenvolvemento Rexional (FEDER), dentro do proxecto Deseo e implementacion dun servidor de recursos integrados
para o desenvolvemento de tecnoloxas da lingua galega (RILG) do Plan Nacional de I+D+I, 2006-2009 (ref.
HUM2006-11125-C02-01/FILO), proxecto coordinado da Universidade de Vigo (Seminario de Lingstica Informtica e Observatorio de Neoloxa) e da Universidade de Santiago de Compostela (Instituto da Lingua
Galega).

198

Xavier Gmez Guinovart

crpora paralelos principais pertencentes a catro rexistros especializados


(dos mbitos xurdico-administrativo, literario, da informtica e de divulgacin cientca) e a cinco combinacins lingsticas diferentes (bilinge
galego-espaol, bilinge ingls-galego, bilinge francs-galego, tetralinge ingls-galego-francs-espaol e tetralinge espaol-galego-catalneuskara). Estes seis crpora, cos datos actuais sobre a sa extensin, son o
Corpus Lega de textos xurdico-administrativos galego-espaol (6.329.655
palabras), o Corpus Unesco de divulgacin cientca ingls-galego-francsespaol (3.724.620 palabras), o Corpus Logaliza de localizacin de software
ingls-galego (1.979.687 palabras), o Corpus Tectra de textos literarios ingls-galego (1.476.020 palabras), o Corpus Fega de textos literarios francsgalego (1.267.119 palabras) e o Corpus Consumer espaol-galego-catalneuskara de informacin sobre consumo (5.586.431 palabras) (gura 1).

Figura 1. Composicin do Corpus CLUVI

O corpus xurdico Lega galego-espaol contn material textual bilinge de dous mbitos especializados da linguaxe xurdica moi prximos, mais ben diferenciados: por unha banda, o mbito administrativo,
representado por 30 exemplares do Diario Ocial de Galicia publicados
entre 2000 e 2005; e pola outra banda, o mbito lexislativo, representado
por un conxunto de 62 textos publicados entre 1978 e 2007 con lexislacin
diversa de mbito estatal (publicada no Boletn Ocial del Estado) e supraestatal (Constitucin Europea). Mis concretamente, as leis e regulamentos publicados no BOE pertencen a distintos eidos dentro do mbito
lexislativo: ao eido xudicial, ao mbito da Constitucin e dos Estatutos,
ao eido econmico, ao eido social, ao Dereito ambiental, ao Dereito informtico e ao mbito relacionado con sectores especcos (universidades, pesca, circulacin, etc.). Os textos que proveen do DOG suman un

A investigacin en lexicografa e terminoloxa no Corpus Lingstico da Universidade...

199

total de 2.394.407 palabras, mentres que os textos lexislativos, procedentes


maioritariamente do BOE, representan un total de 3.935.248 palabras. Por
outra parte, o Corpus Logaliza de localizacin de software ingls-galego
contn a localizacin ao galego do paquete omtico OpenOfce, do sistema operativo Windows XP de Microsoft e do escritorio Gnome para Linux.
O Corpus Unesco ingls-galego-francs-espaol de divulgacin cientca est constitudo por 32 exemplares ntegros da revista mensual The
Unesco Courier / O Correo da Unesco / El Correo de la Unesco / Le Courier
de l Unesco publicados entre 1998 e 2001. O Corpus Consumer espaol-galego-cataln-euskara de informacin sobre consumo incle 1.036 artigos
da revista Consumer Eroski publicados entre 1998 e 2005. Finalmente, o
corpus literario Tectra ingls-galego recompila 36 textos literarios en lingua inglesa coas sas traducins para o galego; e o corpus literario Fega
francs-galego, 24 textos literarios en lingua francesa coas sas traducins para o galego. Os crpora Tectra ingls-portugus (735.529 palabras),
e ingls-espaol (122.251 palabras), anda en desenvolvemento, inclen
os textos literarios bilinges do Tectra ingls-galego na sa traducin ao
portugus e ao espaol.
O CLUVI incle tamn outros cinco crpora paralelos en distintas fases de elaboracin: o Corpus Egal de economa galego-espaol (718.642
palabras), o Corpus Palop de literatura poscolonial portugus-espaol
(566.590 palabras), o Corpus literario Dega alemn-galego (76.364 palabras),
o Corpus Veiga de subtitulacin ingls-galego (71.618 palabras) e o Corpus
Turigal de turismo portugus-ingls (373.126 palabras), este ltimo anda
non dispoible publicamente na web. Cmpre salientar que a travs da
interface do CLUVI se pode acceder tamn consulta do Corpus Lege-Bi
euskara-espaol de textos xurdico-administrativos (2.384.053 palabras)
desenvolvido polo grupo DELi da Universidade de Deusto.
O aliamento dos textos paralelos almacnase no CLUVI nunha adaptacin do formato TMX (Translation Memory eXchange), o estndar para
a codicacin en XML de memorias de traducin, independentemente da
aplicacin utilizada. O concepto de memoria de traducin est relacionado coa traducin asistida por ordenador e, mis concretamente, cos escritorios de traducin como Trados, DjVu, SDLX, Transit ou Passolo (este
ltimo orientado localizacin de software). Estes asistentes informticos para a traducin integran nun nico produto un procesador de textos
especialmente deseado para traducir, un conxunto de dicionarios bilinges, ferramentas para a xestin terminolxica (creacin e mantemento de glosarios, consulta automtica de glosarios durante a traducin,
extraccin automtica de terminoloxa...), e unha utilidade de memoria

200

Xavier Gmez Guinovart

de traducin. A memoria de traducin unha base de datos onde se almacenan a versin orixinal e traducida de cada unha das frases que se
traducen no marco da aplicacin. Cando se est a traducir unha frase, o
programa detecta automaticamente se esa mesma frase ou outra similar
xa foi traducida con anterioridade, co obxecto de que se poida reutilizar a
traducin sen necesidade de reescribila completamente, facendo as modicacins que se consideren mis axeitadas. En 1997 a industria creou e
impulsou o estndar TMX para permitir o intercambio de memorias de
traducin entre os distintos programas de traducin asistida. Con certas
diferenzas, un corpus paralelo aliado equivale a unha memoria de traducin e, na prctica, existe un nmero considerable de crpora paralelos
aliados codicados en TMX, coa vantaxe adicional de que os crpora as
etiquetados poden ser empregados como memorias de traducin para
alimentar os programas de traducin asistida. A xeito de ilustracin das
caractersticas xerais deste formato, amsase a seguir o aliamento ingls-galego en TMX simplicado das tres primeiras frases de A Perla de
Steinbeck, no orixinal ingls e mais na sa traducin ao galego. Obsrvese que, no formato TMX, tanto o orixinal, coma a sa traducin, coma a
informacin sobre os aliamentos, est todo includo nun nico cheiro.
Nos cheiros TMX, os segmentos orixinais e traducidos discorren literalmente en paralelo, rodeados por etiquetas que explicitan a sa adscricin
lingstica e as sas equivalencias.
<?xml version=1.0 ?>
<!DOCTYPE tmx SYSTEM tmx14simp.dtd>
<tmx version=1.4>
<header creationtool=TRANS Suite 2000 creationtoolversion=1.4.2 segtype=sentence otmf=CTMTS2000 adminlang=gl srclang=en datatype=empty>
</header>
<body>
<tu>
<tuv xml:lang=en>
<seg>In the town they tell the story of the great pearl --how it was found and how it was lost
again.</seg>
</tuv>
<tuv xml:lang=gl>
<seg>Na cidade cntase a historia da gran perla, de como foi atopada e de como foi perdida de
novo.</seg>
</tuv>
</tu>

A investigacin en lexicografa e terminoloxa no Corpus Lingstico da Universidade...

201

<tu>
<tuv xml:lang=en>
<seg>They tell of Kino, the fisherman, and of his wife, Juana, and of the baby, Coyotito.</
seg>
</tuv>
<tuv xml:lang=gl>
<seg>Flase de Kino, o pescador, e da sa muller, Juana, e do neno, Coyotito.</seg>
</tuv>
</tu>
<tu>
<tuv xml:lang=en>
<seg>And because the story has been told so often, it has taken root in every mans mind.</
seg>
</tuv>
<tuv xml:lang=gl>
<seg>E como a historia foi contada tan a mido, acabou por botar races na mente de cada
home.</seg>
</tuv>
</tu>
</body>
</tmx>

A unidade bsica de segmentacin para o aliamento dos bitextos


do corpus CLUVI a frase ortogrca do texto orixinal. Xa que logo, a correspondencia entre o texto orixinal e a traducin vai ser sempre do tipo
1:n. Con frecuencia, a unha frase do orixinal correspndelle unha frase da
traducin (1:1). Porn, danse tamn casos nos que unha frase do orixinal
non se traduce (1:0), ou nos que a unha frase do orixinal lle corresponde na traducin media frase (1:1/2) ou das frases (1:2), ou mesmo nos
que unha frase da traducin non se corresponde con ningunha frase do
orixinal (0:1). Aln diso, a traducin implica s veces desprazamentos de
frases enteiras, ou movementos de fragmentos de frases do orixinal a
outras frases na traducin. Estes movementos reordnanse na seccin de
textos traducidos dos corpus paralelos do CLUVI para cumprir o requisito do aliamento 1:n, que preserva a integridade e a orde das unidades
de traducin do texto orixinal. Este criterio crucial cando se aplica ao
procesamento de crpora plurilinges de mis de das linguas, debido
a que as frases do orixinal son as que, actuando a modo de intermediarias, nos permiten estabelecer as correspondencias entre as frases equivalentes das distintas linguas. A especicacin TMX non ten en conta a

202

Xavier Gmez Guinovart

codicacin destes aspectos das traducins, xa que foi deseada para o


almacenamento e intercambio de memorias de traducin, e non para a
representacin de segmentos equivalentes en crpora paralelos. O sistema de codicacin do CLUVI est baseado no TMX, e utiliza unha versin
adaptada dalgunhas das etiquetas que forman parte da especicacin
TMX 1.4b (Savourel 2005) para representar as correspondencias que non
son 1:1 (por omisin ou por adicin) e os reordenamentos codicados no
corpus paralelo.
A ferramenta de busca e visualizacin a travs dunha interface web
de consulta, deseada na linguaxe de programacin PHP polo SLI, est
concibida para realizar buscas bilinges en textos etiquetados conformes co formato TMX, includas as especicacins usadas no CLUVI para
as omisins, as insercins e os reordenamentos. Esta aplicacin PHP permite facer buscas simples e complexas (con comodns) de palabras illadas ou de secuencias de palabras, e observar as equivalencias bilinges
dos termos pescudados nos seus contextos de uso en traducins reais e
documentadas. Os termos buscados poden corresponder a calquera das
das linguas da traducin, sendo posible tamn realizar consultas autenticamente bilinges, isto , consultas a partir de dous termos, un de cada
lingua, ou mesmo consultas tetralinges, nos casos do corpus Unesco e
do corpus Consumer.

3. dicionario cluvi ingls-galego


O Dicionario CLUVI Ingls-Galego (CLIG) un dicionario baseado na
coleccin de textos ingleses traducidos ao galego que forma parte do Corpus CLUVI e constite, ao noso entender, o primeiro dicionario baseado en
crpora da lexicografa galega. Todas as palabras inglesas que aparecen
nas sas entradas estn documentadas nos textos en ingls traducidos
ao galego recompilados no CLUVI. Aln diso, todas as traducins galegas
recollidas no dicionario para esas palabras son traducins reais identicadas nas versins galegas dos textos ingleses do corpus. Finalmente,
para cada traducin identicada, o dicionario fornece un exemplo real do
seu uso tal como est documentado no corpus.
Desde o ano 2005 est dispoible na web, no enderezo http://sli.uvigo.
es/CLIG/, a primeira edicin deste dicionario, que na sa versin 1.5 (2006)
alcanza as 6.677 entradas e 10.807 traducins. Anda que as entradas desta
primeira edicin estn redactadas s na direccin de traducin ingls-galego, o sistema de busca implementado permite recuperar tamn as entra-

A investigacin en lexicografa e terminoloxa no Corpus Lingstico da Universidade...

203

das a partir das sas traducins ao galego. Nestes momentos, o SLI esta a
completar a segunda edicin do dicionario, cuxa publicacin est prevista
para o ltimo cuarto de 2008. Esta segunda edicin no prelo incorpora ao
dicionario un maior nmero de entradas e equivalencias tiradas do corpus (ao redor de 20.000 entradas e 40.000 traducins), ao tempo que ampla
os datos lexicogrcos contidos nas entradas con informacin sobre os
americanismos do ingls e con notas de interese gramatical, tradutolxico
e normativo, co obxectivo de que a ferramenta resultante poida ser realmente til tanto na docencia do ingls como na traducin ingls-galego.
A extraccin de lxico bilinge a partir do corpus Tectra, que serviu de
base xeracin do dicionario tivo lugar en catro fases: anotacin do corpus
coas equivalencias de traducin entre frases, preparacin do corpus para
a extraccin (fase de preedicin), extraccin lxica bilinge automtica,
e edicin manual dos resultados da extraccin (fase de postedicin). O
problema central da extraccin automtica de lxico bilinge consiste en
converter un corpus paralelo anotado cos aliamentos a nivel de oracin
(isto , coas equivalencias oracionais de traducin) nun corpus etiquetado paralelo cos aliamentos a nivel de palabra (isto , coas equivalencias
lxicas de traducin). Para acadar esta tarefa, existen diversos algoritmos
baseados principalmente en medidas estatsticas relacionadas coa asociacin mutua ou coa coaparicin dos elementos lxicos nas frases bilinges
aliadas (Och / Ney 2003). Todos estes algoritmos presentan unha marxe
de erro considerable nos resultados (Tiedemann 2003) por mor da natureza
intrinsecamente non literal da traducin e doutras dicultades relacionadas coas caractersticas dos crpora, como a distancia lingstica entre
as linguas implicadas, o tipo de textos ou o estilo da traducin. Para tentar superar as limitacins da extraccin lxica baseada unicamente nos
aliamentos oracionais, codicamos no corpus paralelo a informacin
tradutolxica sobre asimetras de traducin (aliamentos non biunvocos
e alteracins de orde na traducin), e preeditamos o corpus mediante a
eliminacin de diversos elementos que posen unha incidencia directa
nos erros da extraccin (segmentos de texto marcados como omisins
ou adicins, signos de puntuacin ags os guins de unin de palabras
compostas, dxitos e palabras gramaticais cun alto ndice de frecuencia).
A partir da versin preeditada do corpus paralelo, realizouse a extraccin
lxica bilinge automtica utilizando como ferramenta o programa de aliamento lxico NATools (Simes / Almeida 2003). Este programa calcula
o ndice de correlacin entre as coaparicins dos elementos lxicos nas
oracins bilinges aliadas e ofrece como sada da extraccin un dicionario probabilstico ingls-galego consistente nunha lista bilinge de todas

204

Xavier Gmez Guinovart

as palabras distintas que aparecen nos textos en ingls do corpus, cada


unha delas acompaada da sa frecuencia absoluta no corpus e de ata
oito palabras en galego consideradas polo aliador como traducins mis
probables. Para cada palabra galega do lxico bilinge xerado indcase un
ndice estimativo da correlacin entre a sa presenza nunha frase e a presenza da palabra inglesa orixinal na frase aliada correspondente, dicir,
un estimativo da probabilidade de coaparicin dos dous elementos lxicos
(o ingls e o galego) nunha mesma unidade oracional de traducin. Por ltimo, e coa nalidade de mellorar a calidade dos resultados do programa,
elaboramos un ltro de abilidade para eliminar do dicionario bilinge
probabilstico xerado os candidatos de traducin menos ables. Os estatsticos que se comproban na peneira do dicionario posterior extraccin
lxica son a frecuencia absoluta do lema e a probabilidade da sa traducin mis probable. O valor concreto destes dous estatsticos un heurstico calculado a partir da avaliacin dos resultados en bruto do programa
(Gmez Guinovart / Sacau 2005).
O dicionario probabilstico resultante da aplicacin do ltro de abilidade extraccin lxica automtica ten que ser editado manualmente co
obxectivo de mellorar a sa precisin, eliminando as traducins errneas
que pasaran o primeiro ltrado automtico, e engadindo correspondencias correctas documentadas no CLUVI, pero que non aparecen no dicionario xerado, ben por non formar parte do conxunto de traducins elixido
(isto , das seleccionadas polo aliador NATools como primeira ou segunda opcin), ben por seren palabras gramaticais frecuentes eliminadas no
proceso de preedicin do corpus. Nesta fase de postedicin do dicionario, engadronse as categoras gramaticais correspondentes palabra de
orixe, as como un exemplo para cada traducin coa sa referencia tirada
do CLUVI. A primeira versin da primeira edicin do Dicionario CLIG (a
versin 1.0), que recolla un total de 5.324 entradas e 7.998 traducins, publicouse na web en maio de 2005. Nas versins posteriores a esta primeira edicin, fronse engadindo paulatinamente os lemas documentados
nos textos paralelos ingls-galego do CLUVI (principalmente, nos crpora
Tectra e Unesco, pero tamn nos crpora Logaliza e Veiga) que constaban
en diversos vocabularios bsicos da lingua inglesa mais que, por diversas
razns, non aparecan anda recollidos como entradas do dicionario, ata
chegar listaxe da segunda edicin (2008, no prelo) que alcanza as 20.000
entradas e 40.000 traducins.
O Dicionario CLIG est almacenado nun formato interno codicado en
XML, consonte o cal cada entrada do dicionario incle ademais do lema en
ingls un conxunto de informacins tradutolxicas agrupadas en funcin

A investigacin en lexicografa e terminoloxa no Corpus Lingstico da Universidade...

205

das posibles categoras gramaticais do lema. Cada un destes conxuntos


(denominados super_cat na codicacin utilizada) pode conter unha ou
mis acepcins, dependendo da polisemia de cada lema en cada categora
gramatical. A informacin agrupada en cada acepcin incle a traducin
ao galego, un exemplo de uso documentado no CLUVI e, opcionalmente, a
expresin plurilexemtica da que forma parte o lema cando o caso. Por
ltimo, cada exemplo consta dun fragmento textual do corpus Tectra en
ingls, a sa traducin ao galego e a referencia da obra na que se documenta o exemplo. De maneira opcional, as entradas poden inclur informacin sobre os americanismos do ingls e notas entrada; e as acepcins
poden conter notas normativas ou de traducin. Deste xeito, cada entrada
do dicionario pode inclur unha ou mis categoras gramaticais cunha traducin ou mis, sendo codicada internamente en XML, como se ilustra a
seguir mediante un exemplo:
<entrada>
<lema>annexe</lema>
<super_cat>
<categoria>noun</categoria>
<acepcion>
<traducion>anexo</traducion>
<exemplo>
<en>The Caf sur la Rue opened its Internet @annexe# last October_a kind of high-tech
office with a dozen computers.</en>
<gl>O Caf sur la rue dotouse do seu @anexo# virtual en 1998: unha oficina equipada cuns
dez ordenadores.</gl>
<fonte>C04 (1300)</fonte>
</exemplo>
</acepcion>
</super_cat>
<super_cat>
<categoria>transitive verb</categoria>
<acepcion>
<traducion>anexar</traducion>
<exemplo>
<en>Jordan @annexes# the West Bank, while Egypt rules the Gaza Strip.</en>
<gl>Xordania @anexa# Cisxordania, Exipto administra a Franxa de Gaza.</gl>
<fonte>C14 (1542)</fonte>
</exemplo>
</acepcion>
</super_cat>
</entrada>

206

Xavier Gmez Guinovart

Este formato interno pdese consultar e converter a distintos formatos de presentacin de acordo cos requisitos lexicogrcos precisos en
cada caso. As, na versin para a web do dicionario, o dicionario en XML
procesado mediante un programa en PHP que permite a consulta interactiva do dicionario e a presentacin dinmica dos resultados xerados
en HTML para a sa visualizacin, como se pode comprobar realizando a
consulta da calquera palabra inglesa na web do dicionario (http://sli.uvigo.es/CLIG/). Tamn se poden xerar presentacins das entradas aplicando follas de estilo XSL directamente sobre o formato XML, con resultados
como o que se mostra a continuacin:
annexe noun
anexo The Caf sur la Rue opened its Internet annexe last October_a kind of high-tech office with a dozen
computers. O Caf sur la rue dotouse do seu anexo virtual en 1998: unha oficina equipada cuns
dez ordenadores. [C04 (1300)]
transitive verb
anexar Jordan annexes the West Bank, while Egypt rules the Gaza Strip. Xordania anexa Cisxordania,
Exipto administra a Franxa de Gaza. [C14 (1542)]

Neste exemplo de presentacin impresa, as distintas categoras dunha entrada introdcense mediante o cadrado, as acepcins inician pargrafo e van subliadas, mentres que os exemplos van precedidos dun
tringulo e, nun corpo de letra mis pequeno, conteen a frase en ingls
en cursiva, a sa traducin ao galego en redonda, e levan ao nal entre
corchetes a referencia bibliogrca abreviada da fonte (obra e nmero de
frase). Nos restantes exemplos, ilustramos diferentes tipos de informacin lexicogrca codicada no dicionario: fraseoloxa, americanismos,
notas s entradas e notas s acepcins. Todos os exemplos forman parte
da segunda edicin do dicionario:
angel noun
anxo Prue, a perfect angel with the others, and sometimes now, at night especially, she took ones breath away
with her beauty. Prue era un verdadeiro anxo cos outros, e s veces, sobre todo polas noites, estaba
tan fermosa que lle cortaba a un a respiracin. [CAR (766) ]
guardian angel anxo da garda Whats more, the trains guardian angels bent over backwards trying
to prevent it from turning into a dragon. Polo demais, os anxos da garda do tren trataban por tdolos
medios de impedir que se transformase nun dragn. [C30 (1258)]
amphitheatre ( amphitheater) noun
anfiteatro Passing through the ravine, they came to a hollow, like a small amphitheatre, surrounded by perpendicular precipices, over the brinks of which impending trees shot their branches, so that you only caught glimpses
of the azure sky and the bright evening cloud. Pasaron a travs do desfiladeiro e chegaron ata un val,

A investigacin en lexicografa e terminoloxa no Corpus Lingstico da Universidade...

207

que era coma un pequeno anfiteatro, rodeado de precipicios verticais, con rbores prximas
bordo, que proxectaban as sas plas, polo que a penas se poda albisca-lo azul do ceo e as nubes
brillantes da noitia. [RIP (81)]
actual adverb O ingls actual nunca debe traducirse polo galego actual. Para este significado, o
ingls emprega ou ben current ou present.
real And yet was he to accuse Miss Daisy Miller of actual or potential inconduite, as they said at Geneva?
E sen embargo, a el acusar a Miss Daisy Miller de inconduite real ou potencial, como dican en
Xenebra? [DAI (216) ]
autntico At most, by an alms given to a beggar whose blessing he fled from, he might hope wearily to win for
himself some measure of actual grace. Todo o mis, ao dar unha esmola a un mendigo de cuxa benzn
fuxira, podera agardar, con canseira, conseguir certa medida de autntica gracia. [RET (2146) ]
verdadeiro The tortures endured, however, were indubitably quite equal for the time, to those of actual sepulture. Con todo, as torturas sufridas naqueles momentos foran indubidablemente iguais s dun
verdadeiro enterro. [BUR (249)]
ache noun
dor A diferenza entre ache e pain consiste en que a primeira refrese a unha dor intensa e xeralizada (a cabeza, a espalda, as moas) mentres que a segunda supn unha dor mis localizada, p.ex.,
nun brazo. He felt only an ache of soul and body, his whole being, memory, will, understanding, flesh, benumbed and weary. Senta soamente dor de corpo e alma: todo o seu ser, memoria, vontade, intelecto,
carne, atordoado e canso. [ RET (2751) ]
pena They sat with bowed heads, dead to all things but the ache at their hearts. Estaban sentados coa
cabeza gacha, insensibles a todo ags pena dos seus corazns. [LEG (668)]
intransitive verb
doer Her head began to ache, and the lights on the altar swayed before her eyes. Empezoulle a doe-la cabeza, e a notar como as luces do altar oscilaban ante os seus ollos. [ESP (953)]

4. corpus tcnico do galego


O Corpus Tcnico do Galego (CTG) unha coleccin de crpora do galego contemporneo composta de textos monolinges especializados nos
eidos do dereito, da informtica, da economa, das ciencias ambientais, da
socioloxa e da medicina, dispoible desde 2006 para libre consulta no enderezo http://sli.uvigo.es/CTG/. Cunha extensin actual duns 12 millns
de palabras, o CTG est constitudo polo Corpus Galex de textos xurdicoadministrativos en galego (2.516.846 palabras), o Corpus Xiga de textos de
informtica e telecomunicacins en galego (2.027.816 palabras), o Corpus
Auga de textos de ecoloxa e ciencias ambientais en galego (2.349.362 palabras), o Corpus Achega de textos de economa en galego (2.055.837 palabras), o Corpus Sogal de textos de socioloxa en galego (2.442.765 palabras) e
o Corpus Medigal de textos de medicina en galego (en fase de construcin)
(gura 2).

208

Xavier Gmez Guinovart

Figura 2. Composicin do Corpus CTG

O corpus de dereito Galex recompila 72 textos lexislativos (leis, decretos, regulamentos) de mbito autonmico, estatal e supraestatal, publicados entre 1998 e 2006. O corpus de informtica Xiga contn 2450 textos
sobre informtica publicados entre 1997 e 2007, tirados de manuais, axudas, mens e mensaxes de programas (Proxecto Xis, Trasno, OpenOfce,
Windows); de textos acadmicos e de divulgacin (Galipedia, servizos informticos universitarios, artigos en libros e revistas cientcas); dos medios de comunicacin especializados (Dxitos, Fwwwrando-Vieiros, Cdigo
Cero, Ocano Internet-Galicia Hoxe), e de roldas, foros, grupos de novas
e blogues. O corpus de economa Achega consta de 210 textos de economa publicados entre 2000 e 2007, tirados de convenios colectivos (banca,
caixas de aforro, seguros), lexislacin, libros, artigos (Revista Galega de
Economa, Terra e Tempo), informes (Instituto Universitario de Estudos
e Desenvolvemento de Galicia/IDEGA) e traballos acadmicos (teses de
doutoramento, actas de congresos). O corpus Auga de ecoloxa e ciencias
ambientais recolle 853 textos de ecoloxa publicados entre 1999 e 2007, e
est formado por lexislacin ambiental, libros, artigos, teses e traballos
acadmicos, informes e guas, de fontes como a Federacin Ecoloxista
Galega, a Coordinadora para o Estudo dos Mamferos Marios/CEMMA,
a Asociacin para a Defensa Ecolxica de Galiza/ADEGA, a Sociedade
Galega de Historia Natural, a Consellara de Medio Ambiente e a propia
Universidade de Vigo. Por ltimo, o corpus de socioloxa componse de 569
textos publicados entre 2000 e 2007 correspondentes a informes, artigos
acadmicos e de opinin, e procedentes de diversas fontes, como a Xunta
de Galicia, o Instituto Galego de Estatstica, o Consello Econmico e Social
de Galicia, Altermundo.org, o Proxecto Galicia 2010, o Observatorio Galego
dos Medios e a revista Andaina.

A investigacin en lexicografa e terminoloxa no Corpus Lingstico da Universidade...

209

O CTG est almacenado no formato XML, anotado con informacin


bibliogrca e temtica, e segmentado en frases. A aplicacin desenvolvida en PHP que realiza as buscas no CTG a travs da interface web pblica permite facer consultas de palabras ou grupos de palabras, utilizar
comodns para efectuar buscas complexas, e especicar o subconxunto
especco do corpus ao que se desexa cinguir a pescuda. Na actualidade,
o CTG est a ser anotado con informacin sobre o lema e a categora morfosintctica das palabras. O conxunto de etiquetas utilizado para indicar
as categoras das palabras basase nas etiquetas propostas polo grupo
Eagles (Leech / Wilson 1996) para a anotacin morfosintctica de lxicos
e crpora para todas as linguas europeas. Velaqu, a xeito de exemplo, un
fragmento tirado do CTG na sa versin anotada e sen anotar1:
<frase>Galicia a primeira Comunidade Autnoma pesqueira do Estado espaol, o sector pesqueiro representa o 8% do PIB e o 5% da poboacin activa, estas cifras a pesar de estar en
consonancia coa importancia do litoral a nivel mundial, o 40% da poboacin do mundo vive
nas zonas costeiras, presenta unhas cifras moi por enriba de calquera dos outros pases comunitarios.</frase>
<frase>Galicia/Galicia_NP00000 /ser_VIP3S00 a/o_AFS primeira/primeiro_NO0FS Comunidade/Comunidade_NCFS000 Autnoma/Autnomo_A0FS0 pesqueira/pesqueira_A0FS0
do/de_SPS00 ~/o_AMS Estado/estado_NCMS000 espaol/espaol_A0MS0 ,/,_Fc o/o_AMS
sector/sector_NCMS000 pesqueiro/pesqueiro_A0MS0 representa/representar_VIP3S00 o/o_
AMS 8/8_Z %/%_Ft do/de_SPS00 ~/o_AMS PIB/PIB_NCMS000 e/e_CC o/o_AMS 5/5_Z
%/%_Ft da/de_SPS00 ~/o_AFS poboacin/poboacin_NCFS000 activa/activo_A0FS0 ,/,_Fc
estas/este_DFP0 cifras/cifra_NCFP000 a pesar de/a pesar de_CS estar/estar_VN00000 en consonancia/en consonancia_R0 coa/con_SPS00 ~/o_AFS importancia/importancia_NCFS000
do/de_SPS00 ~/o_AMS litoral/litoral_A0CS0 a/a_SPS00 nivel/nivel_NCMS000 mundial/
mundial_A0CS0 ,/,_Fc o/o_AMS 40/40_Z %/%_Ft da/de_SPS00 ~/o_AFS0 poboacin/poboacin_NCFS000 do/de_SPS00 ~/o_AMS mundo/mundo_NCMS000 vive/vivir_VIP3S00
nas/en_SPS00 ~/o_AFP zonas/zona_NCFP000 costeiras/costeiro_A0FP0 ,/,_Fc presenta/
presentar_VIP3S00 unhas/un_IFP0 cifras/cifra_NCFP000 moi/moi_R0 por/por_SPS00 enriba/enriba_R0 de/de_SPS00 calquera/calquera_INS0 dos/de_SPS00 ~/o_AMP outros/outro_
IMP0 pases/pas_NCMP000 comunitarios/comunitario_A0MP0 ./._Fp </frase>

5. banco de datos terminolxico da universidade de vigo


O Banco de Datos Terminolxico da Universidade de Vigo (TUVI) unha
base de datos terminolxica baseada nos textos de especialidade mono1.

Fragmento includo na seccin de ecoloxa e ciencias ambientais do CTG e pertencente tese de doutoramento de Alfredo Lpez Fernndez, Estatus dos pequenos cetceos da plataforma de Galicia, dirixida por
ngel Guerra Sierra e Graham J. Pierce, e presentada na Facultade de Bioloxa da Universidade de Santiago
de Compostela en 2003.

210

Xavier Gmez Guinovart

linges e paralelos recompilados nos crpora da Universidade de Vigo,


isto , no Corpus Lingstico da Universidade de Vigo (CLUVI) e no Corpus
Tcnico de Galego (CTG). Esta base de datos terminolxica, de libre acceso
na web no enderezo http://sli.uvigo.es/TUVI, est mantida polo Seminario de Lingstica Informtica e polo Observatorio de Neoloxa da Universidade de Vigo e conta, na actualidade, con 5.625 termos documentados
nos crpora CLUVI e CTG pertencentes aos mbitos do dereito (1411 entradas bilinges e monolinges), da socioloxa (954 entradas tetralinges
e monolinges), da economa (1163 entradas monolinges) e da ecoloxa
(1324 entradas monolinges). Todos os termos includos no TUVI estn
documentados nos crpora, estando en fase de realizacin os inventarios
terminolxicos dos eidos da informtica e da medicina. A gura 3 representa en forma grca o proceso de baleirado terminolxico dos textos
que se segue para a elaboracin da base de datos terminolxica a partir
dos crpora da Universidade de Vigo utilizados como fonte.

Figura 3. Fontes do Banco de Datos Terminolxico TUVI.

Neste proceso de baleirado, a identicacin no corpus das unidades


terminolxicas dun dominio realzase en das fases. Na primeira fase,
analzanse as palabras e as secuencias de ata catro palabras mis frecuentes no corpus da especialidade. Mediante a revisin humana destas
combinacins lxicas de maior frecuencia posible identicar os termos
mis prominentes nun mbito. Por exemplo, analizando o Corpus Auga
de ecoloxa e ciencias ambientais, pdense detectar termos frecuentes
neste mbito como residuos (5.900 veces no corpus), especies (2.464 veces),
impacto ambiental (903 veces), avaliacin ambiental (508 veces), calidade
do aire (274 veces), plan de xestin (223 veces), organismos modicados xe-

A investigacin en lexicografa e terminoloxa no Corpus Lingstico da Universidade...

211

neticamente (214 veces), avaliacin de impacto ambiental (247 veces) ou


gases de efecto invernadoiro (220 veces). Nesta primeira fase de baleirado,
ademais das listas das frecuencias absolutas no corpus das combinacins
lxicas analizadas, analzanse tamn as atraccins lxicas mediante o sistema estatstico Senta de extraccin de candidatos a termos plurilxicos,
que calcula o grao de asociacin entre unidades textuais contigua mediante un modelo probabilstico coecido como expectacin mutua (Dias
/ Guillor / Lopes 2000).
Os resultados revisados da extraccin estatstica compltanse, na segunda fase da identicacin das unidades terminolxicas, comprobando
a existencia no corpus dos termos recompilados no material bibliogrco
de referencia ausentes da lista elaborada durante a primeira fase. Deste xeito, a seleccin das entradas do TUVI incle, ao carn das unidades
terminolxicas mis frecuentes no corpus e das que presentan un maior
grao de asociacin, os termos que, malia teren unha escasa frecuencia no
corpus e/ou un baixo ndice de asociacin, son considerados fundamentais polo feito de estaren censados nun traballo terminolxico de referencia no mbito de estudo.
No TUVI a informacin terminolxica est estruturada ao redor dos
conceptos. Cada cha do TUVI incle toda a informacin relativa a un
concepto, expresado cun termo galego do que se poden recoller tamn variantes, tanto intralingsticas (termos sinnimos, variantes ortogrcas
ou variantes dialectais) coma interlingsticas (traducins ou, con maior
propiedade, equivalencias). A informacin recollida para cada variante
(inclundo a variante comn ou non marcada) incle o lema do termo, a
sa categora gramatical, a sa denicin e un contexto de uso documentado no corpus. As chas ou conceptos da base de datos estn agrupadas
segundo o seu campo temtico, dentro da pla correspondente dunha
rbore conceptual xerarquizada da materia. Aln diso, os conceptos da
base de datos constiten unha rede lxico-semntica pola que se pode
navegar, e onde os ns conceptuais interrelacionan entre si en funcin
das relacins semnticas (antonimia, hiperonimia, holonimia, etc.) que
se establecen entre eles.
Formalmente, o TUVI almacnase internamente nunha estrutura
XML que se ilustra deseguido mediante un exemplo simplicado da cha para o concepto que recolle os termos gas invernadoiro e gas de efecto invernadoiro:

212

Xavier Gmez Guinovart


<cc>
<ic>666406</ic>
<rs tipo-rs=caus>66673</rs>
<rs tipo-rs=hipo>666405</rs>
<ct st=Text>AUGA.3.2.3.3</ct>
<lg xml:lang=gl>
<var tipo=com>
<lema>gas de efecto invernadoiro</lema>
<cat valor=m></cat>
<ex>
<texto_ex>l) Tonelada equivalente de dixido de carbono: unha tonelada mtrica de dixido de
carbono (CO2) ou unha cantidade de calquera outro |gas de efecto invernadoiro# recollido no
anexo II cun potencial equivalente de quentamento do planeta.</texto_ex>
<fonte_ex>
<obra>A1018</obra>
<num>50618</num>
</fonte_ex>
</ex>
<frec>
<fab>5</fab>
<vcorpus>20.09.06</vcorpus>
<palcorpus>1604417</palcorpus>
</frec>
</var>
<var tipo=morf >
<lema>gas invernadoiro</lema>
<cat valor=m></cat>
<ex>
<texto_ex>O dixido de carbono ( C O2) o principal |gas invernadoiro# e emtese, de forma
inevitbel, ao queimarmos combustbeis fseis (carbn, petrleo e gas).</texto_ex>
<fonte_ex>
<obra>A031</obra>
<num>477</num>
</fonte_ex>
</ex>
<frec>
<fab>1</fab>
<vcorpus>20.09.06</vcorpus>
<palcorpus>1604417</palcorpus>
</frec>
</var>
</lg>
</cc>

A investigacin en lexicografa e terminoloxa no Corpus Lingstico da Universidade...

213

Nesta estrutura de cha terminolxica, cada concepto (etiquetado


como cc) est indexado mediante o seu ndice conceptual (ic), un nmero
nico que identica como un conxunto toda a informacin terminolxica
contida nunha cha. No exemplo, o ndice conceptual da cha o 666406.
Un concepto pode establecer relacins semnticas (rs) con outros conceptos da base de datos. No exemplo, o concepto correspondente a esta cha
establece unha relacin de causa-efecto co concepto correspondente ao
ndice conceptual 66673 (o da cha terminolxica que recolle o concepto
correspondente ao termo efecto invernadoiro) e unha relacin de hiponimia co concepto 666405 (gas).Cada concepto est asignado a unha pla
da rbore conceptual correspondente sa especialidade. No exemplo,
o concepto 666406 est asignado ao campo temtico dos gases contaminantes, que comparte con conceptos relacionados cos termos monxido
de carbono e gas de vertedoiro, entre outros. A cha para cada concepto
pode conter informacin sobre un ou mis termos sinnimos, nunha soa
lingua ou en mis dunha lingua. A informacin terminolxica relativa a
cada lingua est agrupada dentro da etiqueta lg especicada mediante
un atributo xml:lang que adopta o valor do cdigo ISO de das letras da
lingua en cuestin. Cada un dos termos nunha lingua representa unha
variante lingstica do concepto nesa lingua, podndose tratar dunha variante comn, dunha variante por sinonimia, dunha variante (orto)grca
ou dunha variante dialectal. Toda a informacin relativa a unha variante
est contida dentro da etiqueta var, especicada mediante un atributo
tipo que adopta o valor correspondente ao tipo concreto de variante. No
exemplo, a informacin relativa ao galego contn das variantes, a variante comn e unha variante morfolxica desta. Cada variante incle o
lema para o termo, a sa categora gramatical e un contexto de uso documentado no corpus. No exemplo, a primeira variante para o galego, que
de tipo sinonmico, para o lema gas de efecto invernadoiro, de categora
m (substantivo masculino). Os datos sobre o exemplo estn separados en
das partes: o (con)texto seleccionado (indicado coa etiqueta texto_ex) e
a fonte do exemplo que, sa vez, se divide en obra e nmero de frase. Os
datos sobre a frecuencia de uso inclen a frecuencia absoluta do termo
(etiqueta fab) e a versin (vcorpus) e o tamao (palcorpus) do corpus no
momento do recoller esta informacin.
Como se explicou con anterioridade, este formato XML interno pdese
converter a distintos formatos lexicogrcos de presentacin en funcin das
necesidades. As, na ferramenta de consulta na web, a base de datos terminolxica procesada por un programa informtico en PHP que presenta os
resultados da consulta en forma de tboa, como se mostra a continuacin:

214

Xavier Gmez Guinovart

Ref. 666406
Campo temtico:

<AUGA.3.2.3.3/3.2.3.3. Gases contaminantes>

Relacins semnticas:

[caus => 66673] [hipo => 666405]

Termo GL:

gas de efecto invernadoiro

Categora:

Variante:

com

Frecuencia relativa:

3.11639679709

Contexto de uso:

l) Tonelada equivalente de dixido de carbono: unha tonelada mtrica


de dixido de carbono (CO2) ou unha cantidade de calquera outro gas
de efecto invernadoiro recollido no anexo II cun potencial equivalente de
quentamento do planeta. [A1018]

Ver contextos no CTG:

Procurar mis exemplos (algn dos exemplos do termo no corpus poden


non corresponder ao concepto da ficha)

Termo GL:

gas invernadoiro

Categora:

Variante:

morf

Frecuencia relativa:

0.623279359418

Contexto de uso:

O dixido de carbono ( CO2) o principal gas invernadoiro e emtese, de


forma inevitbel, ao queimarmos combustbeis fseis (carbn, petrleo
e gas). [A031]

Ver contextos no CTG:

Procurar mis exemplos (algn dos exemplos do termo no corpus poden


non corresponder ao concepto da ficha)

As relacins semnticas entre termos codicados no TUVI son as de


antonimia (esfera pblica/esfera privada), hiponimia (educacin primaria/educacin), hiperonimia (explotacin/escravitude), secuencialidade
temporal anterior (adolescencia/xuventude), secuencialidade temporal
posterior (eleccins/campaa electoral), axente (debedor/dbeda), produto (emigracin/emigrante), causa (medios de comunicacin/comunicacin), efecto (quecemento do planeta/contaminacin), instrumento (lei/
xustiza), n (sade/medicina), meronimia (folklore/cultura) e holonimia
(ideoloxa/crenza). A travs dos enlaces da presentacin web das chas
posible percorrer os nodos conceptuais seguindo as relacins semnticas
indicadas. O TUVI pode concibirse, logo, como unha rede lxico-semntica a dous niveis formada por ns conceptuais que interrelacionan entre si
en funcin da sa clasicacin temtica e das sas relacins semnticas
(gura 4).

A investigacin en lexicografa e terminoloxa no Corpus Lingstico da Universidade...

215

Figura 4. Relacins semnticas entre ns do TUVI

6. perspectivas
Nestes momentos, os nosos esforzos de investigacin no eido da lexicografa e a terminoloxa baseadas en crpora estn centrados na ampliacin dos crpora CLUVI e CTG (que supn a incorporacin de novos textos,
de novos campos especializados e de mis informacin lingstica), na segunda edicin do Dicionario CLUVI Ingls-Galego, e na extensin da informacin terminolxica do TUVI aos mbitos da informtica e da medicina.
Simultaneamente, estamos a traballar xunto co Instituto da Lingua
Galega da Universidade de Santiago de Compostela no proxecto RILG
(Recursos Integrados para o desenvolvemento de tecnoloxas da Lingua
Galega), un proxecto encamiado a ofrecer un portal web de servizos
lingsticos do galego desde o que se poida acceder de xeito conxunto
aos bancos textuais e aos dicionarios desenvolvidos polo Seminario de
Lingstica Informtica e o Observatorio de Neoloxa da Universidade de
Vigo e polo Instituto da Lingua Galega. Os recursos que se pretende integrar neste servizo inclen o Tesouro Informatizado da Lingua Galega
(TILG), o Tesouro Medieval Informatizado da Lingua Galega (TMILG), o Corpus CLUVI, o Corpus Tcnico do Galego (CTG), o Dicionario de Dicionarios

216

Xavier Gmez Guinovart

(DD) (Santamarina 2003b), o Dicionario de Dicionarios do Galego Medieval


(DDGM) (Gonzlez Seoane 2006), o Dicionario CLUVI Ingls-Galego (CLIG), o
Banco de Datos Terminolxico TUVI e a Neoloteca da Universidade de Vigo
(Gmez Clemente / Rodrguez Guerra 2003b; Lpez Fernndez et al. 2005)
(gura 5). Esperamos poder ofrecer os primeiros resultados deste importante proxecto durante o ano 2008.

Figura 5. Integracin de recursos no Proxecto RILG

217

UN CORPUS PARA O ESTUDO DO GALEGO MEDIEVAL: O


TMILG (TESOURO MEDIEVAL INFORMATIZADO
DA LINGUA GALEGA)
Paulo Martnez Lema

Instituto da Lingua Galega. USC

1. o tmilg como proxecto: obxectivos, plantel e previsins


de futuro
O TMILG (Tesouro Medieval Informatizado da Lingua Galega) constite hoxe por hoxe o nico buscador on-line dispoible para a lingua galega no seu estadio medieval, se ben debe enmarcarse dentro dun proxecto moito mis amplo e ambicioso, o Tesouro Medieval Galego-Portugus
(TMGP), que pretende pr a disposicin do usuario a inmensa masa textual producida en Galiza e Portugal ao longo da Idade Media. Os criterios
organizadores deste corpus son basicamente o glotolxico e o xeogrco,
e a interaccin dos mesmos a que nos permite establecer cinco subcrpora diferenciados: marxe do TMILG propiamente dito, temos que falar
do TMILC-G (textos galegos en lingua castel, que nun futuro constituirn
o Corpus Histrico do Casteln de Galicia ou CHCG), do TMILL-G (textos
galegos en lingua latina), o TMILP (textos portugueses en lingua portuguesa) e nalmente o TMILL-P (textos portugueses en lingua latina). O
propio procesamento de textos para o TMILG, moitos dos cales estn total
ou parcialmente redactados en latn (no caso dos mis temperns) e en
casteln (nos dos mis serodios), permite ir construndo de xeito progresivo e simultneo estes crpora, dndolle sempre especial preeminencia ao
TMILP por razns lingsticas e histricas evidentes. Neste sentido, estn
abertas senllas e frutferas vas de colaboracin cos equipos dos profesores portugueses Maria Francisca Xavier (Universidade Nova de Lisboa) e
Joo Malaca Casteleiro (Academia das Cincias de Lisboa).
O TMILG naceu no seo do Instituto da Lingua Galega no ano 1992, se
ben algns dos membros do equipo inicial traballan hoxe noutras universidades galegas. O desenvolvemento deste proxecto implica labores
diversos que van do arrequentamento e diversicacin do corpus (in-

218

Paulo Martnez Lema

corporacin de novas fontes) ao procesamento e revisin minuciosa dos


textos de acordo cunhas pautas previamente establecidas e sometidas
a unha constante actualizacin por parte do grupo. Tendo isto en conta, non debe estraar que no TMILG participasen e participen persoas de
extraccins e condicins diversas: bolseiros, contratados, investigadores
da Universidade de Santiago de Compostela e mesmo voluntarios procedentes principalmente dos derradeiros cursos da titulacin de Filoloxa
Galega, as como dos distintos programas de doutoramento directa ou
indirectamente relacionados coa lingua galega medieval.
O proxecto realzase desde as sas orixes baixo a direccin de Xavier
Varela Barreiro, se ben na actualidade conta con dous bolseiros responsables de cadansa seccin: Ricardo Gutirrez Pichel (fontes documentais e
edicin de textos) e Paulo Martnez Lema (codicacin do corpus). Tamn
guran a da de hoxe como bolseiros Roco Dourado Fernndez, Luca
Doval, Iria Prez Mario e Iago Santiso Fernndez, encargados principalmente da revisin e correccin das coleccins documentais asignadas en
cada caso e en funcin das necesidades mis inmediatas do proxecto.
xusto recoecer que o TMILG non sera un proxecto posible nin viable
sen o apoio de distintas institucins, entre as cales hai que salientar a propia Universidade de Santiago de Compostela, que xa desde as orixes cedeu
un local de traballo axeitado no Instituto da Lingua Galega, as como o propio persoal investigador. A nivel estritamente econmico cmpre destacar
as achegas da Secretara Xeral de Poltica Lingstica, que veu prestando
apoio neste sentido tamn desde as fases mis embrionarias do TMILG.
O TMILG foi posto en rede por vez primeira no ano 2004 contando coa
axuda tcnica e informtica do Centro Ramn Pieiro (CIRP), que o tivo
accesible no seu servidor at setembro do ano 2006. Ao longo dese perodo rexistrronse varios centos de usuarios regulares, concretndose
mis de 23.000 consultas en pouco menos de 4.500 sesins, dato que deixa
constancia do interese e utilidade (para investigadores principalmente,
mais non s) dun produto coma o TMILG. En decembro de 2007 o buscador
trasladouse pxina web do ILG (http://ilg.usc.es/tmilg/), incorporando
nesta nova versin novos modos de busca, de asociacins grcas e de
clculo de estatsticas. Desde o mes de febreiro de 2008, esta nova versin
do buscador vn funcionando de xeito ininterrompido e serviu xa para
a realizacin dun elevado nmero de procuras, o cal d boa conta da importancia que unha ferramenta deste tipo ten hoxe por hoxe para os investigadores.
As expectativas de futuro do TMILG son certamente prometedoras,
sobre todo no tocante multiplicidade de proxectos que, directa ou in-

Un corpus para o estudo do galego medieval: o TMILG

219

directamente, derivan del. No terreo estritamente lexicogrco botronse a andar o Dicionario Histrico da Lingua Galega e mais o Dicionario
Medieval Galego-Portugus, este ltimo en colaboracin con equipos da
Universidade Nova de Lisboa. Tamn se est a traballar na Dialectoloxa
Medieval Galego-Portuguesa, no Inventario Toponmico da Galiza Medieval (ITGM), que se pode consultar xa no seguinte enderezo web: http://ilg.
usc.es/itgm/, na Gramtica Histrica da Lingua Galega e na edicin paleogrca de distintas obras medievais xa incorporadas ao TMILG, mais que
nalgns casos reclaman unha lectura mis actualizada ou, cando menos,
mis axeitada s esixencias que presentan actualmente os estudos de
lingstica histrica. Algunhas desas obras, en fase avanzada de transcricin, son o Tratado de Albeitaria, os Miragres de Santiago e as Cantigas de
Santa Mara. Todo isto sen esquecer que o TMILG, xunto co TILG, os dous
Dicionarios de Dicionarios (o medieval e mais o moderno) e o Seminario
de Lingstica Informtica da Universidade de Vigo, participar na construcin dunha plataforma de recursos informticos para a investigacin
da lingua galega (RILG), co patrocinio do Ministerio de Educacin e Ciencia e da Consellara de Innovacin e Industria da Xunta de Galicia.

2. o corpus do tmilg: estrutura e caractersticas


2.1. Xneros textuais
O corpus do TMILG abrangue a da de hoxe uns 16.000 documentos,
distribudos sa vez nun total de 82 obras e representativos das tres
grandes categoras en que se articula a producin textual da Galiza medieval: a prosa notarial, a prosa non notarial e a poesa (verso). Mais, tal e
como comprobamos nesta grca, o peso cuantitativo de cada unha delas
moi desigual:

220

Paulo Martnez Lema

PROSAeEverso
VERSOna
NAdocumentacin
DOCUMENTACIN DO
prosa
do TMILG
tmilg
80
80

70
70
60
60
50
50
40
40
30
30
20
20
10
10
00

Pr osanotarial
notar ial
Prosa

Pr
osanon
nonnotar
ial
Prosa
notarial

Ver
so
Verso

Dos tres grupos que vimos de mencionar, o que maior volume de


texto achega sen dbida a prosa notarial, que constite por si soa case
un 80% do total. Esta abundancia cuantitativa ten o seu correlato nunha
grande riqueza de subtipos textuais, se ben esa diversidade pode reducirse en ltima instancia a cinco grandes grupos (Vzquez Bertomeu 2001).
Eses grupos son os seguintes:
(a) documentos referentes adquisicin e xestin do patrimonio:
neste grupo, quizais o mis amplo e variado, inclumos vendas, traspasamentos, desembargos, aforamentos, arrendamentos, alugueiros, nominacins, almoedas, doazns, concambias... Cmpre lembrar que moitos
destes tipos presentan sa vez subtipos especcos, como ocorre p.ex.
nos aforamentos ou contratos forais, categora moi ampla que pode xebrarse en subconxuntos textuais mis reducidos como os traspasamentos de foro, o subaforamento ou a renovacin de foro, entre outros;
(b) documentos relativos ao mundo mercantil e s transaccins comerciais: gardas, peoramentos, anzas... formaran este segundo subconxunto textual;
(c) documentos administrativos: memoriais, inventarios de bens,
apeos, relacins...
(d) documentos pertencentes ao mbito familiar e domstico: nesta categora inclumos textos como as mandas, testamentos, codicilos, dotes...
(e) escritos de tipo xeral: testemuos, procurazns, poderes, avinzas,
sentenzas, renunciamentos e quitazns, albals, outorgamentos, demandas, frontas...

221

Un corpus para o estudo do galego medieval: o TMILG

A estas cinco categoras xerais podemos engadir anda outras das representadas por documentos de caractersticas temticas bastante peculiares, mais que veen especicamente singularizados polo contexto institucional en que se xeraron. Refermonos, por un lado, aos documentos reais
(privilexios, acoutamentos, mandatos, ordenanzas...), e, polo outro, aos documentos eclesisticos e especialmente aos monsticos (cartas de irmandade, decretos de anexin, repartimentos, restauracins monsticas...).
Desde o punto de vista dos focos xeradores de documentacin, o
TMILG permtelle ao usuario acceder documentacin elaborada tanto
nos ncleos eclesisticos (catedrais, mosteiros, parroquias, snodos) como
nos civs (concellos, universidades, documentos de carcter privado e
outros textos de natureza diversa). Porn, o primeiro grupo, o da prosa
notarial relixiosa e mis concretamente a redactada nos mosteiros, a que
goza dunha maior presenza numrica dentro do corpus. Neste sentido,
estn xa incorporadas ao TMILG un total de 32 coleccins documentais
procedentes de diversos mosteiros, dos cales 12 radican na provincia de
Lugo, 9 na da Corua, 7 na de Ourense e 4 na de Pontevedra. Ademais,
estn xa revisadas, preparadas e listas para a sa inminente inclusin
varias coleccins diplomticas de mosteiros pertencentes aos territorios
galegfonos de Asturias, Zamora e Len. Estas coleccins suman un total de 5 obras, o que converte a Galiza exterior nunha rea xeogrca e
lingstica xa notablemente representada no TMILG. Porn, o constante
traballo de enriquecemento das fontes bibliogrcas e de procesamento
dos textos extrados delas fai que estas cifras sexan sempre provisionais
e susceptibles de actualizacins peridicas1.
Mosteiro

1.

Concello

Provincia

San Antonio de Toques

Toques

A Corua

San Clodio do Ribeiro

Leiro

Ourense

San Martn de Castaeira

Puebla de Sanabria

Zamora

San Martio de Vilourente

Mondoedo

Lugo

San Miguel da Colleira

O Vicedo

Lugo

San Miguel de Bveda

Amoeiro

Ourense

necesario deixar clara esta circunstancia, pois, por poer unicamente un exemplo, as cifras relativas
provincia da Corua poderan engrosarse grazas aos textos procedentes de mosteiros como San Martio de Cnduas (Ponteceso) ou San Cristovo de Dorme (Boimorto), ou incluso con documentos serodios
(nais do s. XV) que nos relatan procesos de reforma monstica que afectaron a cenobios como o de San
Mamede de Seavia (Coristanco). Ao tratrense de obras anda en proceso de revisin e conteren total ou
maioritariamente textos en latn e/ou en casteln non foron tidas en conta neste cmputo.

222

Paulo Martnez Lema

Mosteiro

Emprazamento

Provincia

San Paio de Antealtares

Santiago de Compostela

A Corua

San Pedro de Montes

Ponferrada

Len

San Pedro de Ramirs

Ramirs

Ourense

San Pedro de Rocas

Esgos

Ourense

San Pedro de Soandres

A Laracha

A Corua

San Pedro de Vilanova de Dozn

Dozn

Pontevedra

San Salvador de Bergondo

Bergondo

A Corua

San Salvador de Celanova

Celanova

Ourense

San Salvador de Lourenz

Lourenz

Lugo

San Salvador de Pedroso

Narn

A Corua

San Salvador de Sobrado de Trives

Trives

Ourense

San Salvador de Vilar de Donas

Palas de Rei

Lugo

San Salvador e San Nicols de Cins

Oza dos Ros

A Corua

San Vicenzo de Pombeiro

Pantn

Lugo

San Xon de Caaveiro

A Capela

A Corua

San Xurxo de Codeseda

A Estrada

Pontevedra

Santa Clara de Santiago

Santiago de Compostela

A Corua

Santa Mara de Belvs

Santiago de Compostela

A Corua

Santa Mara de Carracedo

Cacabelos

Len

Santa Mara de Castro de Rei de Lemos

Paradela

Lugo

Santa Mara de Ferreira de Pallares

Guntn

Lugo

Santa Mara de Ferreira de Pantn

Pantn

Lugo

Santa Mara de Oseira

San Cristovo de Cea

Ourense

Santa Mara de Valdeflores

Viveiro

Lugo

Santa Mara de Vilanova dos Oscos

Vilanova dos Oscos

Asturias

Santa Mara do Camio

Pontevedra

Pontevedra

Santiago de Ermelo

Bueu

Pontevedra

Santiago de Mens

Malpica

A Corua

Santo Domingo de Viveiro

Viveiro

Lugo

Santo Estevo de Chouzn

Carballedo

Lugo

Santo Estevo de Ribas de Sil

Nogueira de Ramun

Ourense

Santos Xusto e Pastor de Toxos Outos

Lousame

A Corua

Veiga de Espiareda

Veiga de Espiareda

Len

Un corpus para o estudo do galego medieval: o TMILG

223

No seguinte grco podemos observar mis detalladamente a relacin porcentual existente entre as distintas procedencias xeogrcas da
documentacin cenobtica do TMILG, tomando como referencia o marco
administrativo actual. Deste xeito podemos observar algns datos bastante congruentes tanto co decorrer da historia medieval galega como,
mis especicamente, coas tendencias xeogrcas dos asentamentos
monsticos no Noroeste peninsular: por exemplo, comprobamos que a
provincia que maior cantidade de coleccins documentais achega Lugo,
e mis en concreto a sa rea meridional, que, xunto cos territorios mis
setentrionais da provincia de Ourense artellados ao redor do ro Mio,
constite unha rea especialmente rica no que a institucins monsticas
se rere: a Ribeira Sacra. Por outra banda, resulta cando menos rechamante a precariedade documental que presenta a provincia de Pontevedra (4
coleccins), superada de feito polos territorios galegfonos hoxe administrativamente asturianos e casteln-leoneses (5 coleccins). A provincia
da Corua, pola sa banda, proporcinalle ao TMILG 9 coleccins documentais, se ben hai que ter en conta o considerable peso cuantitativo e
cualitativo que teen os mosteiros radicados en Santiago de Compostela,
capital eclesistica de extraordinaria relevancia neste sentido.
COLECCINS DOCUMENTAIS MONSTICAS NO TMILG

No que se rere ao outro grande bloque de prosa notarial, o constitudo polos textos civs, domina claramente a documentacin de tipo particular, sendo xa moito menos numerosa a procedente doutros mbitos
como o universitario e o municipal (soamente os concellos de Santiago,
Noia, Pontevedra, Ourense e A Corua achegan producin textual relevante ao TMILG).

224

Paulo Martnez Lema

O segundo grupo en importancia cuantitativa o da prosa non notarial, que comprende aproximadamente o 15% do total dos textos. A prosa
non notarial est representada por obras ou fragmentos de obras pertencentes a cinco grandes bloques temticos ben coecidos e delimitados:
(a) prosa literaria: pertencen ao xnero da narrativa extensa a Crnica
Troiana (CT), a Historia Troiana (HT) e mais o fragmento conservado do
Livro de Tristan (LT);
(b) prosa histrica: como sabemos, a historiografa medieval coecida en lingua galega ntrese exclusivamente de traducins de orixinais
procedentes doutros mbitos lingsticos, nomeadamente o casteln.
Soamente dispomos de tres textos que renan as caractersticas denitorias deste xnero: a Xeral Historia (XH), a Crnica Xeral e Crnica de Castela (TC) e mais a Crnica de Santa Mara de Iria (CI);
(c) prosa relixiosa: no TMILG rexstranse tan s das obras deste tipo,
os Miragres de Santiago (MS) e un fragmento do tratado Sobre a simona
(SaS). Descoecemos, cando menos a da de hoxe, obras prossticas galegas medievais pertencentes ao xnero da haxiografa, a catequstica ou o
sermn, por exemplo;
(d) prosa tcnica: no noso corpus inclense das obras que, polo seu
carcter descritivo e directivo, poden clasicarse sen maiores problemas
dentro desta categora, se ben cada unha delas desenvolve temticas moi
afastadas entre si. Por unha banda, a Arte de Trobar (AT) inscrbese dentro
do mbito da teora potica e, a un nivel mis amplo, no mundo das ciencias sociais e humanas; en cambio, o Tratado de Albeitaria (TA) cntrase
no terreo da veterinaria e, xa que logo, pode considerarse un manual de
ciencias aplicadas, o nico existente a da de hoxe na nosa tradicin prosstica medieval;
(e) prosa xurdica: anda carecendo de tratados xurdicos propiamente ditos, a prosa galega medieval si conta cun amplo repertorio de ordenamentos e cdigos legais, todos eles xa dispoibles no TMILG: refermonos
aos fragmentos conservados do Foro Xuzgo (FX), Flores de Dereito (FD),
Foro Real (FR), Glosas de Textos Legais (GTL) e o Ordenamento de Alcal de
Henares (OA), as como a versin completa conservada dos Foros de Castelo Rodrigo (FCR). A todas estas obras hai que engadir anda os distintos
fragmentos das sete Partidas de Afonso X, na sa traducin ao galego.

Un corpus para o estudo do galego medieval: o TMILG

225

Finalmente, os textos en verso (todos eles pertencentes ao subxnero


lrico nas sas distintas variantes), a pesar da sa innegable relevancia
cualitativa dentro da producin escrita galega medieval, son os menos
numerosos do noso corpus textual e supoen aproximadamente un 5%
do mesmo. Este conxunto pode dividirse sa vez en dous grupos ben
coecidos e en cuxa caracterizacin interveen o factor cronolxico e a
tradicin esttica na que se inscriben os textos:
(a) lrica trobadoresca, que abrangue grosso modo as derradeiras dcadas do s. XII, a totalidade do s. XIII e a primeira metade do s. XIV. No TMILG
podemos consultar os distintos subxneros da vertente profana, maioritariamente agrupados baixo as siglas LP (Lrica Profana), con excepcins
como o descort plurilinge de Raimbaut de Vaqueiras (DPRV), xoia potica
que incle unha estrofa en galego, ou o texto Us Castellans (UC) de Raimn Vidal de Besal. Completan este inxente corpus potico as Cantigas
de Santa Mara (CSM), tanto as narrativas como as propiamente lricas ou
de loor, e mais a Cantiga de Valcavado (CV), as das nicas mostras poticas de temtica estritamente relixiosa con que conta a nosa tradicin
literaria medieval;
(b) lrica da decadencia (CGC), ou, atendendo denominacin mis
comunmente aceptada e empregada, escola galego-castel, que se desenvolve ao longo dos sculos XIV e XV.
Deste xeito, no TMILG encontramos perfectamente representadas as
diversas parcelas textuais cultivadas na Galiza medieval, quer no terreo
da prosa, quer no do verso. Con todo, e tal como pode observarse no cadro seguinte, (elaborado a partir do modelo de codicacin do CORDE exposto en RAE 2001), non deixa de ser considerable o nmero de xneros e
subxneros que non contaron co debido desenvolvemento e para os que,
en consecuencia, carecemos de obras representativas. Mais esta situacin
est suxeita en todo caso s alteracins que poderan derivar da descuberta e difusin de textos at o de agora inditos.

226

Paulo Martnez Lema

PROSA
Breve
Extensa

Narrativa

Novela (CT, HT, FT)

Ciencias sociais e humanas Literatura (AT)


Ciencias aplicadas Veterinaria (TA)

Ciencia e tcnica
Sociedade
Relixin

Textos bblicos e glosas


Haxiografa
Mstica e asctica
Catequstica
Sermns
Outros (MS, SS)

Historia

Historiografa (TC, GE, CI)


Biografa

Dereito

Ordenamentos e cdigos legais (FX, FD, FR, GTL, OA, Partidas)


Tratados xurdicos
Outros Prosa notarial

Lrica
Teatro
Didctica
VERSO
Narrativa

Tradicional
Culta

pica
Relixiosa (CSM-cantigas narrativas)
Didctica

Lrica

Tradicional
Culta

Individual (CSM-cantigas de loor)


Obras colectivas (LP, CGC, DPRV, UC)
Outros

Dramtica

2.2. Cronoloxa e glotoloxa dos textos


Desde o punto de vista da cronoloxa, o corpus do TMILG cobre un perodo amplsimo como o comprendido entre os sculos VIII (ano 700) e
XVII (ano 1600). Neste sentido, o documento mis antigo co que contamos
a da de hoxe no noso corpus unha doazn procedente do mosteiro de
Santa Mara de Sobrado dos Monxes, datada no ano 787 e editada por Lpez Ferreiro no seu Galicia Histrica (captulo 113) (Lpez Ferreiro 1901:

Un corpus para o estudo do galego medieval: o TMILG

227

626-627). Anda que no TMILG podemos encontrar representadas diversas


linguas, o certo que soamente o galego / galego-portugus, o latn e o
casteln teen verdadeira presenza como linguas vehiculares preferentes dos textos. Deste xeito, por volta de 9.000 dos documentos consultables (un 56% do total) estn escritos en idioma galego, fronte aos aproximadamente 4.500 (un 28%) redactados en latn e os escasos 2.500 (o 15%
restante) para os que se escolleu a lingua latina.

3. microestrutura do tmilg: o procesamento dos textos


Unha das fases de maior relevancia do proceso de tratamento dos textos consiste na previa etiquetaxe dos mesmos, aplicndolles un encabezamento no que se fan constar distintos tems informativos, como son:
(a) o rexesto: inclese o rexesto literal redactado polo editor para cada
documento, mais prescindindo de informacins complementarias como
a cota arquivstica ou os detalles codicolxicos, por exemplo;
(b) o ttulo da obra: como puidemos comprobar nas epgrafes precedentes, no TMILG combnase o ttulo extenso da obra (regularizado e traducido sempre ao galego) cun ttulo en clave formado xeralmente a partir
das iniciais daquel (p.ex., Historia Xeral = HX);
(c) a informacin autorial, i. e., o nome do autor de cada documento:
neste punto faise constar, en primeiro lugar, o nome do autor con todos
os seus posbeis atributos tal e como guran no texto (p. ex., Johannes
Petri, notarius concilii Noye juratus), mentres que nun segundo momento
rexistramos unicamente a cadea antroponmica illada, sen ningn tipo
de informacin complementaria (Johannes Petri). Contmplase tamn a
posibilidade da autora mltiple coas sas diversas variantes, entre as cales salientan como mis habituais a presenza dun notario e dun escribn
ao seu servizo (caso no que gura sempre en primeiro lugar o nome do
notario), a participacin de varios notarios ao mesmo nivel na xnese do
documento, etc. Todas estas opcins contan cun sistema de codicacin
especco dentro da etiqueta Autora;
(d) informacin cronolxica: sinlanse o sculo e o ano ou rango de
anos concreto no que foi redactado cada documento. Tamn xemos
constar o ano no que o documento en cuestin foi copiado ou trasladado,
informacin que explica moitas das distorsins lxicas, grcas ou doutro tipo observables nos textos;

228

Paulo Martnez Lema

(e) natureza do texto, i.e., se o documento en cuestin un orixinal,


unha copia, un traslado, un rexesto, unha traducin...
(f) informacin lingstica: indcase a lingua do texto mediante unha serie de claves numricas especcas, e nos documentos traducidos exprsase
ademais a lingua na que foi redactado o orixinal.
Na revisin do material textual ponse especial atencin en illar, mediante os marcadores oportunamente establecidos, aqueles treitos, captulos ou mesmo textos enteiros escritos en linguas distintas do galego.
Deste xeito, o corpus do TMILG pode dividirse en varios subconxuntos
desde o punto de vista glotolxico, un dos cales precisamente o dos documentos hbridos. O TMILG, como xa indicamos, abrangue desde textos
moi temperns, con fortsima presenza do latn, at textos moi serodios,
nos que o casteln consegue hexemonizar xa a prctica escrita. Fica polo
medio unha importante masa textual ao longo da cal imos asistindo
progresiva emerxencia e consolidacin do romance galego-portugus
como lingua escrita, sempre en tensin coa tradicin escrituraria latina
precedente e coa paulatina intromisin do casteln a partir do s. XIV. Xa
que logo, a porcentaxe de textos hbridos resulta considerable, e o TMILG
permtenos explotar as potencialidades que esta realidade lle ofrece ao
investigador en eidos moi diversos que van desde a lexicografa sociolingstica, pasando pola fraseoloxa ou a onomstica. Por exemplo, nun
documento pertencente coleccin da Casa de Altamira e datable nas
primeiras dcadas do s. XVI, Gutierre de Hevia, alcaide das fortalezas de
Navia e Burn polo Conde de Altamira, quixase do maltrato que recibe
por parte do seu seor. A protesta formlase nun perfecto casteln, mais
nun determinado momento Gutierre de Hevia opta pola expresividade
dun dito autctono na lingua do pas:
Por ierto no fuera mucho que onbre tan maltratado desesperara en algo de lo que
arriba digo porque ay un enxenplo en Galizia que dize el can con rabia en seo dono traba.

Noutras ocasins, a irrupcin do discurso oral nos documentos ilustra


aspectos mis ldicos da lingua da poca. Nun requirimento feito pola
abadesa de San Miguel de Bveda en 1467 mencinase o xudeu Abran de
Len, recadador dos Condes de Ribadavia, e dsenos que quando se partira de ali que disera o dito judio: como agora enganei a seora abadesa
con un rabo de pescado!;
(g) informacin xeogrca: nesta etiqueta indcase a demarcacin ou
demarcacins onde exerca o seu labor o notario responsable da creacin
do documento. Cando se descoece tal dato, gura tan s o lugar con-

Un corpus para o estudo do galego medieval: o TMILG

229

creto no que foi redactado o texto. Este apartado, como se comprender,


resulta de especial interese para os historiadores e para os toponimistas,
pois sempre se procura representar a forma lingstica exacta coa que
aparece nomeada no documento esa referencia xeogrca concreta, as
como, na medida do posible, contextualizala dentro dos parmetros administrativos que lle corresponderan na actualidade (provincia, concello,
freguesa...). Por outra banda, cmpre lembrar que a vinculacin dun notario cunha determinada xeografa ou xurisidicin pode levar aparellado
o emprego duns hbitos escriturais particulares a nivel lxico, grco e/
ou morfosintctico. Por tanto, o estudo desas relacins pode ser de grande utilidade para ir artellando un modelo de dialectoloxa medieval do
romance galego-portugus;
(h) tipoloxa documental do texto: sinlase se o documento en cuestin responde s caractersticas temticas e/ou estruturais dun contrato
de aforamento, dunha doazn, dunha venda... Co n de ir creando un repertorio amplo e representativo faise constar sempre o nome que se lle
d no texto accin xurdica da que este emana, mais tamn as construcins sintcticas (moitas veces fosilizadas e convertidas en verdadeiras
frmulas ou lexas complexas asociadas a unha tipoloxa textual concreta) utilizadas para expresar a natureza da dita accin. Por exemplo, a tipoloxa doazn aparece representada nesta etiqueta por substantivos como
doaon, dationem, donationem, scripturam testamenti et donationis... e
por frases verbais como dono et concedo, concedo et offero, do et offero, do
et dono et offero... nas que se observan as distintas posibilidades combinatorias duns elementos lxicos mis ou menos constantes e recorrentes,
e desde logo moi ligados semanticamente accin que xera e xustica o
documento en cuestin. Neste sentido, tamn se observa unha notable
riqueza nos testamentos e mandas testamentarias: substantivos transparentes como testamentum, mandatione, manda, ordinatione ou codeilo (coas mltiples variantes grcas existentes en cada caso) conviven
no corpo do documento con frmulas como uolo ut omnia mea ordinata
remaneant, ordino et fao meu testamento, etc. En denitiva, este apartado do encabezamento ofrece unhas posibilidades nada desprezables no
estudo do lxico medieval e da sa vinculacin semntica mis ou menos
sistemtica a unhas determinadas accins xurdicas.
Por outra banda, no estado actual dos traballos do TMILG, a variedade documental novidosa en relacin s clasicacins cannicas de historiadores e palegrafos signicativa, como tamn o a nomenclatura
empregada para identicar cada un deses tipos, unha nomenclatura que
en galego moitas veces debedora da tradicin castel. Deste xeito, o pro-

230

Paulo Martnez Lema

cesamento de documentacin para o TMILG permtenos rescatar termos


at o de agora ausentes dos manuais e dicionarios ao uso, cando menos
cos matices semnticos cos que concorren na nosa documentacin medieval. Por exemplo, adoita denominarse deslinde ao documento no que
se establecen os lindes dunha propiedade, herdade, freguesa ou couto.
Tamn recibe este nome, mediante un proceso metonmico doadamente
explicable, a propia marca ou sinal divisorio utilizado no deslindamento
(GDXL, s.v. deslinde). Porn, nos textos medievais comparece un fermoso
sinnimo de deslindar, como devisar (coas sas mltiples variantes grcas). Ramn Lorenzo (1968, s.v. deuisar) rexistra xa este verbo, nas sas
formas participiais, en documentos da segunda metade do s. XIII: assj
como estam marcadas et deuisadas... assi como jaz deuisada (1259), per
terminos deuissados (1274). Na nosa lexicografa moderna, Eladio Rodrguez atesta as formas devisar e divisar co signicado Divisar, sealar, referir, dividir, e non debemos esquecer que o portugus moderno conserva
a forma devisar co signicado Ordenar, planejar, construir de acordo com
um plano (Houaiss 2001, s.v. devisar). Porn, nin o galego nin o portugus
pareceron conservar o derivado suxal devisaon, anda recollido por Viterbo (1798-1799) coa variante divisaom (separao, divisa, termo, limite,
partilha) nun documento bracarense de 1501 e relativamente abondosa
nos nosos textos antigos: as, na coleccin do mosteiro de San Salvador de
Celanova encontramos o termo devisaiones xa nun documento en casteln con data de 1293 (los marcos et las devisaiones)2, e nun texto algo
posterior, concretamente de 1332, flasenos da delimitacin duns lugares
per marcos et deuisaes ertas.
Anda habera que engadir que o proceso de revisin de textos nos permite tamn identicar certos subtipos textuais caracterizados por matices xurdicos, estruturais e/ou mesmo lingsticos que os diferencian do
tipo textual mis xenrico no que se incardinan. Por exemplo, ben coecido o tipo textual foro/aforamento, mais na documentacin do noso corpus poden recoecerse subcategoras moi concretas e con entidade ben
denida, como a cesin de foro, a conrmacin de foro, a demisin de foro,
a devolucin de foro, o traspasamento de foro, o subaforo, o nomeamento
de foreiros, etc. Nun documento procedente tamn do mosteiro de San
Salvador de Celanova datado en 1426, un tal Loureno Miguelles, clerigo
capellan do moesteiro de San Salvador dArnoya, traspasa unhas herdades que el mesmo tia aforadas polo devandito mosteiro, e exprsao nos
2.

Curiosamente, o CORDE non d ningunha ocorrencia do derivado devisaion / divisaion para o casteln,
nin na poca medieval nin na moderna, o que parece rearmar mis anda a singularidade desta forma.

Un corpus para o estudo do galego medieval: o TMILG

231

seguintes termos: parto et demito et traspaso. Estas escollas lxicas entroncan o traspasamento de foro con outros tipos documentais profusamente representados no TMILG como son a demitizn ou a renuncia;
(i) informacin editorial: neste derradeiro apartado do encabezamento
rexstrase a pxina da obra na que comeza o documento, as como o rango
de pxinas que abrangue. Asemade, faise constar tamn o captulo da edicin co que se corresponde cada documento.
Este encabezamento veu funcionando, con certos reaxustes puntuais,
ao longo destes case 20 anos de vida do TMILG, mais na actualidade o
grupo de investigacin est a desenvolver un novo e mis ambicioso etiquetario (DTD) mediante o que se recolla toda a informacin pertinente
non s de cada documento en particular, senn tamn do conxunto da
obra ou volume no que se recolle. Os tems informativos contemplados
nese novo encabezamento son esencialmente os mesmos aos que se veu
recorrendo at o de agora, pero moito mis matizados e detallados. Ademais, incorporarase toda a informacin de tipo arquivstico e codicolxico
existente para cada documento e moitas veces accesible xa a travs das
propias edicins dos textos.
Xa dentro do documento en si, e nunha segunda e mis fonda fase de
revisin, mrcanse tamn, mediante os indicadores previamente convidos, todos e cada un dos elementos onomsticos: topnimos, antropnimos, ttulos de obras, nomes de das e de meses, nomes de institucins...
Esta prctica a que permite desenvolver proxectos como o xa mencionado Inventario Toponmico da Galiza Medieval, que esixe un laborioso proceso previo de illamento, clasicacin e identicacin dos topnimos de
cada documento que contribuu a asentar unha metodoloxa de traballo
xa ensaiada con xito nalgns traballos de doutoramento desenvolvidos
por bolseiros do TMILG.
Como exemplo deste proceso de tratamento e etiquetaxe dos textos
para o TMILG presentamos un documento pontevedrs do s. XV, pertencente a unha tipoloxa documental inslita at o de agora, o contrabto de
perdon. O contido do escrito certamente pintoresco, como tamn o son
os termos e o lxico empregados: Pedro de Montes, natural do mosteiro de
Aciveiro, compromtese a perdoar todo mal, dano, pecado et copulaon
et adulterio que a sa muller, Tareixa de Montes, cometera e puidera
cometer at o 1 de abril seguinte, data na que ambos os dous deberan
reencontrarse para faser maridana segundo que manda Deus et Santa
Iglesia. Xa que logo, o interese do documento desborda os aspectos meramente lingsticos para converterse nunha peza de indubidable valor
histrico e sociolxico.

232

Paulo Martnez Lema

[Rexesto do documento] [Pero de Montes, natural do mosteiro de Santa Maria de


Acibeiro, perdoa sa muller Teresa de Montes por ter abandonado o domicilio familiar e cometido adulterio, a condicin que volte con el antes do prximo mes de abril]
[Acrnimo do ttulo] [MNP]
[Ttulo estandarizado] [Minutario Notarial de Pontevedra3]
[Volume] [-]
[Nome do autor (completo)] [Annimo]
[Nome do autor (abreviado)] [Annimo]
[Sculo] [15]
[Ano de redaccin do documento] [1434]
[Ano de redaccin do orixinal] [-]
[Mes de redaccin do documento] [11 (= novembro)]>
[Orixinalidade] [O]
[Lingua do documento orixinal] [-]
[Lingua do documento] [1 (= galego)]
[Referencia xeogrfica] [Pontevedra]
[Xeracin trobadoresca] [-]
[Poesa / prosa (1 = prosa)] [1 (= prosa)]
[Xnero] [15 (= prosa notarial)]
[Tipoloxa documental] [Perdn (contrabto de perdn)]
[Pxina de inicio] [150]
[Rango de pxinas] [150-151]
[Captulo ou nmero de documento (na edicin de referencia)] [110]
O primeiro dia do mes de novembro. Sabean todos que eu Pero de Montes, natural do
moesteiro de Santa Maria dAsiveiro que soo presente, quero et outorgo que por quanto
vos Tareija de Montes ma moller, filla de Juan Branco et de Moor Gomes sua moller, que
sodes absente, vos absentastes de ma casa et poder sen meu mandado et lienia a
outra parte a donde vos quisestes, por lo qual vos non queredes tornar a mia casa et
poder, nen eso mesmo non ousades de andar seguramente por la terra donde sodes
natural, nen pareser ante m nen lugar donde eu de vos aja notiia et parte et vos posa
costrenjer por rigor de dereito, reeando vos que por lo dito absentamento que asy fezestes que eu vos queira demandar et acusar por rason que avedes cometido pecado de
adulterio; por ende eu o dito Pero de Montes que asi soo presente, non costrengudo por
fora nen por engano rescebido, mas de ma livre et propia voontade et por lo amor de
Deus, perdoo a vos a dita de Montes ma moller, que sodes absente asi como se fosedes
presente, todo erro et mal et dano et interese que eu resebese et ouvese por rason do
dito absentamento que asi fezestes, et eso mesmo todo pecado de adulterio que vos
fezesedes et cometesedes et fezestes et cometestes des lo tenpo que sodes ma moller
et comigo casastes ata este presente dia et que fezerdes et cometerdes, o que Deus non
queira, desde oje que esta carta he feita ata o primeiro dia do mes de abril primeiro
que ven, que seera en este ano primeiro que verra de mill et quatroentos et trinta et
cinco anos, et qualquer copulaon que fezesedes ou fezestes ou feserdes ata o dito
3.

Rodrguez Gonzlez / Armas Castro (1992).

Un corpus para o estudo do galego medieval: o TMILG

233

dia con qualquer persona en meu perjuiso. Et para esto asi seer mas firme, vos a dita
Tareija de Montes ata o dito primeiro dia de abril avedes de vir aa iglesia de San Migell de
Carvalleda, et desde que ende fordes fasermo a saber para que vos et eu falemos en hu
seguramente et conertandonos para <P 151> que en hun faamos nosa vivenda, asi
como por Deus et por dereito somos obligados de nos faser maridana segundo que
manda Deus et Santa Iglesia, et non nos et eu como dito he de boo vos perdoo et dou
por livre et quita, para qui et por ante Deus, de todo mal, dano, pecado et copulaon
et adulterio que vos cometestes et fezestes et cometerdes et feserdes en meu perjuiso
ata o dito primeiro dia de abril, et prometo et outorgo aa boa fe de Deus et sen mao
engno et por juramento que ende fao en este sinal de crus en lugar de santos avangeos,
que eu que vos lo tea et conpra et agarde asi, et que en publico nen en scondido vos
non bea nen pase, por min nen por outro, contra elo nen contra parte delo, et demais
~
concertandonos ena
dita vivenda que, sen enbargo do sobre dito, vos faa maridana
do corpo et do aver ben et lealmente asi como marido a moller et por la via et forma
que manda Deus et Santa Iglesia, et non no teendo et conprindo en todo asi et yndo et
pasando contra elo, que eu seja enfames et fe perjuro, et me costamio de non ser de tal
pecado asolto salvo por noso seor o papa; et demais que eu de et page por pena en nome
de interese a vos a dita Maria de Montes dosentos froliins de ouro do cuo de Aragon, et
apena pagada ou non que senpre este contrabto este firme, sobre lo qual renunio as
leis do dereito, dolo, engano, medo, fora, endusimento et a todas las outras et dereitos
canonicos et cevils et impereaas et reaas de que me eu ou outro por min pudeiramos
ajudar para contra esto que dito he vir, que quero et outorgo que me non vallan nen
sejamos sobrelo nen sobre parte dlelo oydos nen resebidos en juiso nen fora del; et
por que esto seja erto outorgey ende este contrabto de perdon ante o notario et testemoyas de juso scriptas. Que foi outorgado na villa de Pontevedra, ano, dias, mes sobre
~
ditos. Testemoyas que foron presentes, Afonso Soares caldeirerio morador ena
dita villa
et Garia Corto et Gomes Ares moradores en Ribadavia et Gil Martines clrigo de San Justo
de Avion et outros. <P 152>

4. algunhas conclusins
O TMILG, ao longo dos seus case catro anos en rede, converteuse nunha ferramenta indispensable para achegarse s mltiples vertentes da
cultura galega medieval, con especial relevancia das dimensins lingstica e histrica. Isto as grazas ao abondoso material textual que constite o corpus base, mais tamn sa diversidade xenrica e, en certo xeito,
lingstica, o cal posibilita unha achega multidisciplinar a un perodo da
nosa historia especialmente rico e anda non totalmente explotado en
todas as sas innitas posibilidades.

234

235

bUSCatermos:
BANCO DE DATOS TERMINOLXICO MULTILINGE
Xusto Rodrguez Ro

Servizo de Normalizacin Lingstica


(Universidade de Santiago de Compostela)

Este traballo ten por obxecto presentar o bUSCatermos e mais o Banco de Datos Terminolxico (BDT) do Servizo de Normalizacin Lingstica
da USC, intentando destacar tamn algunhas das utilidades que pode ter
para o traballo lexicogrco.
bUSCatermos non mis ca a parte visible do BDT: unha interface que
permite realizar consultas no corpus de informacin dese banco a travs
de Internet. Xa que logo, o verdadeiramente relevante a cantidade e o
tipo de informacin que se compila neste e a forma en que se organiza.
Actualmente, o BDT agrupa informacin procedente de tres tipos de
fontes:
(1) A producin terminolxica sistemtica elaborada polo SNL.
Componse de tres tipos de repertorios: vocabularios (abranguen grandes reas de especialidade e compilan un nmero de conceptos relativamente alto, normalmente entre 4.000 e 5.000), lxicos (atenden a mbitos
especializados mis restrinxidos, e oscilan entre os 1.000 e os 3.000 conceptos) e termos esenciais (produtos pensados especicamente para o alumnado que se limitan a recoller e divulgar terminoloxa relevante dentro
dos plans de estudo de diferentes titulacins).
(2) A producin terminolxica puntual desta mesma entidade.
Consta de varios milleiros de chas en que se recolle e se xustica a
resposta a consultas formuladas sobre termos concretos das mis diversas reas de especialidade.

236

Xusto Rodrguez Ro

(3) Un conxunto de dicionarios e vocabularios tcnicos1 que tratan


reas de interese para a comunidade da USC e que teen o galego entre
as sas linguas de traballo.
Todo este conxunto de materiais intgrase nunha base de datos, reelabrase, compltase e analzase desde o punto de vista da sa calidade
lingstica, de tal forma que o produto resultante cualitativamente diferente pensamos que para mellor suma das partes que o compoen.
E sobre el onde bUSCatermos realiza as consultas que lle formulan os
usuarios.
O seguinte esquema reproduce de xeito visual o proceso que acabamos de describir:
Vocabularios do SNL

Outros dicionarios e
vocabularios especializados

Traballo terminolxico
puntual do SNL

DIXITALIZACIN e INTEGRACIN

FUSIN e REELABORACIN

Banco de datos terminolxicos

bUSCatermos

O labor mis custoso2 de toda esta secuencia indubidablemente a reelaboracin dos materiais, pero parecanos evidente a necesidade de abordala,
tendo en conta o obxectivo que pretendemos acadar. Se o que intentamos
proporcionarlles a todos os membros da comunidade da USC3 unha ferramenta que lles axude a mellorar a calidade dos textos tcnicos que elaboran,
1.

A escolla destes repertorios non se fai de xeito aleatorio, senn que previamente deben cumprir unha
serie de condicins: (1) deben centrarse en reas estudadas dentro dalgunha titulacin impartida na USC;
(2) deben acadar un grao de calidade mnimo que as faga aproveitables como fontes de consulta; (3) os
autores deben autorizar explicitamente a sa utilizacin e inclusin no BDT, e (4) debe tratarse de produtos elaborados sen vocacin comercial (que se distriburon gratuitamente, que son accesibles de balde a
travs de Internet) ou que xa remataron a sa vida comercial til (traballos esgotados, de acceso moi
difcil).

2.

Non s custoso, senn que tamn se pode entender como inacabable, xa que cada vez que se engade un
novo repertorio ao Banco cumprira reelaboralo tendo en conta as posibles coincidencias e contradicins
con todo o material preexistente.

3.

bUSCatermos accesible desde calquera ordenador conectado rede informtica desta institucin.

bUSCatermos: Banco de Datos Terminolxico Multilinge

237

facilitndolles a busca de terminoloxa precisa e adecuada e orientndoos


sobre o seu emprego, tiamos que ir mis al da simple acumulacin de
materiais terminogrcos. E tiamos que facelo porque non inslito que
os diferentes dicionarios ou vocabularios recomenden solucins diferentes
ou anda contraditorias para a mesma cuestin terminolxica; polo que
esa vocacin orientadora do uso non se podera desenvolver a travs dunha
compilacin do tipo dun dicionario de dicionarios especializados.
Ese labor de reelaboracin do material recollido concrtase fundamentalmente en tres accins:
(1) Reestrutrase para intentar presentalo segundo un enfoque
onomasiolxico.
Os dicionarios que seguen pautas semasiolxicas agrupan baixo unha
mesma denominacin (o lema) todos os conceptos que son representados por ela (as acepcins). Pero os traballos terminogrcos deben tomar
como unidade bsica o concepto, vinculando a el todas as designacins
que poida recibir nunha lingua.
Por exemplo, o Diccionario galego de termos mdicos (DGTM) incle
dentro da entrada adaptacin oito acepcins diferentes:
adaptacin s.f. 1. Acto ou efecto de adaptar. 2. Acomodacin. 3. Adquisicin das modificacins que permiten que un organismo viva nun novo ambiente ou en condicins
novas. 4. Proceso dinmico no que os pensamentos, sentimentos, comportamento e
mecanismos biofisiolxicos cambian para axustarse s cambios do ambiente. 5. Axuste
da pupila do ollo s variacins da intensidade da luz. 6. Inmunizacin. 7. En odontoloxa, axuste axeitado dunha dentadura, grao de proximidade e entrelazamento de material de restauracin dunha preparacin dental ou axuste exacto de bandas s dentes.
8. Diminucin da frecuencia de impulsos na actividade reflexa cando se repiten varias
veces os estmulos sensoriais.

Trasladada esta informacin ao BDT, produce 6 chas terminolxicas:


unha por cada un dos conceptos que describe cada acepcin excludas
as das primeiras, que se poden entender como propias da linguaxe non
especializada.
(2) Compltase a informacin obtida das fontes compiladas.
Normalmente, engdese aquilo que consideramos mis til para quen
consulta: denominacins equivalentes noutras linguas, denominacins
inadecuadas de uso habitual, indicacin da rea temtica, denicins
(3) Analzase a denominacin galega que se aconsellaba na fonte
compilada.
Isto especialmente importante nos casos en que varias fontes propoen denominacins diferentes ou contraditorias para un mesmo con-

238

Xusto Rodrguez Ro

cepto. Neses casos facemos unha valoracin crtica que pode levarnos a
preferir unha delas, a inclulas todas como sinnimas ou a propor unha
alternativa diferente, xusticamos e argumentamos a decisin adoptada e outorgmoslles unha marca de valoracin4.
Tendo en conta todo o devandito, evidente que o lexicgrafo non
pode recorrer ao bUSCatermos da mesma forma ca a un corpus xa que
a maior parte da informacin non procede de usos reais documentados
senn de fontes secundarias, a un dicionario de dicionarios a informacin destas fontes secundarias non se conserva no seu estado orixinal
ou a un dicionario descritivo existe unha vontade orientadora do uso
explicitamente declarada.
Pero anda as, pode ser un material interesante para tirar del informacin de cara a traballos de lexicografa especializada, ou para as
entradas e acepcins especializadas presentes nas obras lexicogrcas
xerais.
Por exemplo, as mis de 50.000 denicins5 de conceptos pertencentes
a mbitos temticos moi diversos poden ser tiles no proceso de elaboracin de dicionarios monolinges, tanto xerais como especializados.
Para traballos lexicogrcos bilinges ou multilinges poderase tirar
partido do feito de que para a maiora dos conceptos descritos se ofrezan
denominacins en mis dun idioma. As, existen equivalentes castelns
para preto de 70.000 deles, ingleses para mis de 30.000, portugueses para
preto de 20.000, franceses para case 13.000, e cantidades menores para o
alemn, o italiano ou o cataln.
Os autores de produtos con vocacin correctiva (dicionarios de dbidas, dicionarios que inclen no corpus de entradas formas incorrectas)
poderan obter datos relevantes dos mis de 2.000 rexistros en que a informacin ofrecida para un concepto incle unha denominacin problemtica. Empregamos esta categora para referirnos a aquelas que, sendo moi
frecuentes no uso real, consideramos que deben evitarse por non seren
adecuadas para designar ese concepto.
E nalmente, tamn poden ter interese os varios miles de propostas
denominativas neolxicas, realizadas polo persoal do SNL co n de resolver as cuestins terminolxicas que van xurdindo de forma puntual
vinculadas ao labor de asesoramento lingstico. En concreto, produtos
4.

Esas marcas, que abranguen desde o grao 1 (termos normativos) ata o grao 5 (termos por resolver), asgnanse segundo uns criterios que se detallan en http://www4.usc.es/buscatermos/Caracteristicas.htm.

5.

Estas denicins poden proceder dos traballos que se foron compilando ou ben ser elaboradas polo persoal do SNL ou polos especialistas da USC que colaboran con ns.

bUSCatermos: Banco de Datos Terminolxico Multilinge

239

como dicionarios descritivos, dicionarios de neoloxismos ou dicionarios


de dbidas poderan reutilizar con proveito eses materiais.
En resumo, anda que a utilidade que para o traballo lexicogrco
pode ter a parella bUSCatermos/BDT non pode compararse de fontes
documentais primarias, como os crpora, non deixa de ser un recurso
interesante do que se podera tirar informacin relevante para a elaboracin de diferentes produtos lexicogrcos. Agardemos que nun futuro
prximo un bUSCatermos aberto consulta libre poida amosar na prctica estas potencialidades.

240

241

O DICIONRIO DO PORTUGUS MEDIEVAL.


FONTES, CONCEPO E METODOLOGIA
Maria Francisca Xavier

Centro de Lingustica (Universidade Nova de Lisboa)

O projecto de construo de um Dicionrio do Portugus Medieval


(DPM) teve incio h j alguns anos. Antes, porm, em 1992-93, um grupo de linguistas da Universidade Nova de Lisboa deniu como objectivo
desenvolver estudos lingusticos diacrnicos, os quais dariam origem a
uma Gramtica, e viriam a ser complementados por um Dicionrio, tendo
por base textos dos primeiros tempos da histria da lngua portuguesa.
Iniciou-se, ento, a seleco e informatizao de edies publicadas dos
textos mais antigos representativos do portugus medieval sculos XII a
XVI, sendo criado o Corpus Informatizado do Portugus Medieval (CIPM),
parcialmente disponvel na Internet (http://cipm.fcsh.unl.pt/) desde 2001.
Aumentado sucessivamente, o corpus tem vindo a incorporar, para alm
de edies publicadas, tambm edies inditas, algumas realizadas no
mbito de dissertaes, diversas disponibilizadas para o CIPM pelos prprios editores j em formato digital.
Em 2003-04 foi concebido o primeiro esboo de projecto para um Dicionrio do Portugus Medieval. A preparao deste projecto implicou, tambm, proceder a um novo levantamento de fontes primrias editadas,
ainda no publicadas, tendo sido consultados para este efeito especialistas do perodo medieval portugus, de diferentes reas, nomeadamente
de lingustica, literatura, cultura e histria, o que permitiu tomar decises
sobre o alargamento do CIPM de forma a cobrir um maior nmero de temas diferenciados.
Para servir de fonte do dicionrio foi, ento, constitudo um corpus
que integra textos de diferentes tipos (documentos notariais e particulares, documentos rgios, administrativos, textos didctico-moralsticos,
narrativos e poticos)1. A diversidade tipolgica dos textos seleccionados
1.

A constituio do corpus textual apresentada no nal.

242

Maria Francisca Xavier

vai permitir estudar e descrever uma quantidade signicativa de vocabulrio com vista elaborao do primeiro dicionrio. Este ser ainda necessariamente pequeno, porque foi planeado para ser realizado no prazo
apertado de cinco anos, por uma pequena equipa, integrando uma doutorada e cinco estudantes de ps-graduao em Lingustica2.
Maria de Lourdes Crispim e eu prpria, ambas do Centro de Lingustica da Universidade Nova de Lisboa, em colaborao com o Prof. Joo Malaca Casteleiro, do Instituto de Lexicologia e Lexicograa da Academia de
Cincias de Lisboa (ILL-ACL)3, estabelecemos os objectivos do projecto, a
sua concepo e o manual de redaco, assegurando tambm o acompanhamento regular e a reviso do trabalho dos outros membros da equipa,
bem como as reunies com consultores do projecto.
Pretende-se com a realizao deste dicionrio cumprir trs objectivos
principais: contribuir para o preenchimento da lacuna da dicionarstica
portuguesa relativa ao perodo medieval, formar jovens investigadores
que podero vir a dar continuidade ao estudo da lngua portuguesa histrica e elaborao de outros dicionrios e, ainda, facilitar a leitura dos
textos daquele perodo a estudiosos de outras reas e, em particular, a
estudantes, tanto do ensino superior como do secundrio.
O projecto de elaborao deste Dicionrio do Portugus Medieval assenta numa concepo de carcter prospectivo, em que vai sendo descrita a
histria da origem e da evoluo dos elementos lexicais atestados em corpora escritos ao longo dos primeiros sculos da histria da lngua, desde
o sculo XII at nal do sculo XV. Nesta perspectiva, so aplicados dois
critrios que funcionam como pilares do processo de elaborao do DPM:
exaustividade e sistematicidade.
A deciso sobre a adopo do critrio de exaustividade uma consequncia da conjugao de duas outras decises tomadas neste projecto
a constituio do corpus textual informatizado, o qual inclui exclusivamente fontes primrias, textos representativos de domnios scio-culturais e histricos da poca em estudo, e a acessibilidade ao corpus com o
auxlio de ferramentas informticas, permitindo e facilitando a extraco
2.

A partir de nais de 2004, a equipa integra quatro bolseiros nanciados directamente pela Fundao para
a Cincia e a Tecnologia do Ministrio da Cincia, Tecnologia e Ensino Superior, nomeadamente a doutora
Maria Alexandra Fiis, a mestre Maria de Ftima Martins e os mestrandos Joo Loureiro e Raquel Oliveira.
Tambm alguns tarefeiros nanciados pelo Centro de Lingustica da UNL tm ocupado muitas horas com
este trabalho, o mestre Miguel Gonalves e, alternadamente, os mestrandos Sandro Dias e Ana Esprito
Santo.

3.

Atravs desta colaborao est prevista a integrao do Dicionrio do Portugus Medieval na triologia de
dicionrios do ILL-ACL.

O Dicionrio do Portugus Medieval. Fontes, concepao e metodologia

243

automtica, contextualizada, quanticada e localizada de todas as formas/variantes dos vocbulos existentes nos textos.
Deste modo, o Dicionrio do Portugus Medieval, elaborado a partir
de um corpus informatizado de textos medievais de diferentes gneros e
de diversas temticas, comportar todos os vocbulos que ocorrem nesses textos. Ser, ento, um dicionrio exaustivo no da lngua portuguesa medieval, mas da lngua que est documentada nas fontes textuais
utilizadas.
O critrio de sistematicidade na elaborao dos artigos do dicionrio, constitui um requisito metodolgico fundamental em todas as fases
previstas para a progresso consistente do projecto, sendo este tambm
facilitado pela possibilidade de utilizao de ferramentas informticas
(lematizadores, sistemas de concordncias, dicionrios electrnicos e etiquetadores ou outros).
A elaborao do DPM segue de perto, embora com adaptaes, a metodologia j utilizada no desenvolvimento do Dicionrio de Verbos do Portugus Medieval (DVPM), concebido por uma equipa de linguistas, tambm
do Centro de Lingustica da Universidade Nova de Lisboa, constituda
inicialmente por Maria Francisca Xavier, Maria da Graa Vicente, Maria
de Lourdes Crispim, Maria Teresa Brocardo e Antnio Emiliano, tendo os
dois ltimos colaborado at 1997. A equipa que realiza a investigao e as
tarefas para o desenvolvimento do DVPM tem contado com a colaborao
de diversos estudantes universitrios dos trs ciclos de formao, de diferentes reas, nomeadamente Lingustica, Clssicas, Estudos Portugueses
e Histria.
Deste trabalho resultou uma primeira publicao, intitulada Dicionrio de Verbos Portugueses do Sculo 13 (DVPM 1999), e uma segunda,
publicada em papel e na Internet, o Dicionrio de Verbos do Portugus
Medieval. Sculos 12 e 13/14 (DVPM 2003), ambas organizadas por Maria
Francisca Xavier, Maria da Graa Vicente e Maria de Lourdes Crispim.
Pretendeu-se com aquelas publicaes mostrar o trabalho realizado e
solicitar crticas, sugestes e colaboraes que contribussem tanto para
melhorar o que estava feito como para dar continuidade ao projecto.
As duas publicaes referidas acima do conta do trabalho desenvolvido em duas fases sucessivas, que correspondem ao tratamento lexical
morfolgico, sintctico e semntico dos verbos atestados em dois corpora textuais complementares.
O corpus inicial que serviu de base ao DVPM era constitudo pelo seguinte conjunto de textos no literrios do sculo XIII:

244

Maria Francisca Xavier

NT - Notcia de Torto (1214?), editado por Lus F. Lindley Cintra.


TL e TT - Testamento de D. Afonso II (TL e TT) (1214), editado por Pe. Avelino Jesus da Costa
(dois manuscritos).
HGP - 61 documentos notariais da Galiza e do Noroeste de Portugal (1262 a 1300), editados por
Clarinda de Azevedo Maia.
CA - 34 documentos portugueses da Chancelaria de D. Afonso III (1255), editados por Lus F.
Duarte.
TP - Tempos dos Preitos (1280?), editados por Jos de Azevedo Ferreira.
FR - Foro Real de Afonso X (1280?), editado por Jos de Azevedo Ferreira.
FG - Foros de Garvo, (1280?), editados por M. Helena Garvo.
CHP - 68 documentos notariais (s.d. e 1260 a 1300), editados por Ana Maria Martins.

Neste corpus, perfazendo um total de 134.332 palavras, foram identicados, analisados e introduzidos na base de dados online do DVPM os 578
verbos que foram apresentados na publicao de 1999.
O corpus textual seguinte constituiu a segunda fonte do DVPM. Totalizando 171.000 palavras, o corpus incluiu, para alm dos textos do corpus
inicial, dois do sculo XII, mais alguns do sculo XIII e sete textos, de que
no h certeza se so do sculo XIII ou do sculo XIV, editados a partir de
cpias do sculo XV, como se indica na relao dos textos que se apresenta abaixo:
DN - 2 documentos notariais (2 metade do sculo XII), editados por Ana Maria Martins.
DN - 6 documentos notariais (s.d. ou datados entre 1243 a 1274), editados por Ana Maria Martins.
TOX 23 documentos notariais (s.d. ou datados entre 1269 e 1300), editados por Stephen
Parkinson.
TP Tempos dos Preitos (1280?), editados por Jos de Azevedo Ferreira.
VS 7 Vidas de Santos de um Manuscrito Alcobacense (sculo XIII ou XIV, cpias do sculo
XV), editados por Ivo Castro et alii.

No segundo corpus foram encontrados mais 212 verbos do que no anterior, totalizando 790 os verbos que constituram o DVPM publicado em
2003.
Durante a segunda fase de desenvolvimento do Dicionrio de Verbos,
para alm da elaborao das chas daqueles 212 verbos, foram ainda revistos os verbos anteriormente estudados, tendo sido introduzida informao complementar nas entradas daqueles que se encontram atestados
tambm nos textos que no faziam parte do corpus inicial mais formas
verbais (com variantes grcas) e respectivas classicaes morfolgicas,
mais acepes, mais contextos gramaticais e correspondentes abonaes.

O Dicionrio do Portugus Medieval. Fontes, concepao e metodologia

245

Desde 2003, vo sendo publicadas na Internet as chas criadas e as revises das chas dos verbos dos sucessivos corpora que vo sendo acrescentados como fontes para o DVPM.
Deste modo, a experincia de anos obtida no processo de desenvolvimento do Dicionrio de Verbos permitiu consolidar a metodologia a seguir na elaborao do Dicionrio do Portugus Medieval.
A partir do corpus textual total, foram constitudos dois corpora, um
com textos dos sculos XII, XIII e XIII/XIV, o outro com os textos dos sculos XIV e XV. O estudo do lxico de um e de outro corpus corresponde a
duas fases sequenciais do projecto, programadas para levar a cabo a elaborao das chas do dicionrio. A primeira fase teve incio em nais de
2004 e terminou em nais de 2006, a segunda fase iniciou-se em princpios
de 2007, estando previsto o seu trmino em nais de 2008.
Tratando-se de um projecto de dicionrio exaustivo e sistemtico, as
duas fases do projecto compreendem passos idnticos, sendo que a segunda envolve ainda outros que complementam ou revem os primeiros.
Ambas as fases tm em comum os seguintes passos:
(a) Preparao dos dados
- extraco da listagem automtica das palavras do corpus
- lematizao
- agrupamento das variantes grcas
- extraco de concordncias das formas grcas atestadas
no corpus
(b) Identicao das unidades lexicais
- seleco das vedetas dos artigos
- agrupamento das variantes grcas e remisso para o artigo da cabea
- incluso da etimologia, origem das palavras e/ou sua
formao
(c) Anlise lingustica das unidades lexicais
- classicao gramatical
- determinao e denio dos signicados
- seleco das abonaes

246

Maria Francisca Xavier

No DPM, as chas lexicogrcas vo sendo criadas de acordo com a


estrutura seguinte:
(i) A vedeta, ou cabea do artigo, entendida como uma representao
abstracta, corresponde a uma forma grca que obedece a critrios lingusticos e de funcionalidade tal como tem sido prtica na elaborao dos
artigos do Dicionrio de Verbos. Assim, a vedeta dever ter a forma grca
mais prxima da forma ortogrca actual, quando esta exista, o que leva
a aplicar, com frequncia, as seguintes regras de supresso e de substituio de grafemas j utilizadas para as vedetas do DVPM:
- <h> com funo de marcao de hiato eliminado
- grafemas duplos, iniciais ou internos, com o mesmo valor fontico
dos correspondentes simples
grafemas simples
- <j> ou <y> com valor de vogal ou semi-vogal
<i>
- <i>, <gi> ou <y> com valor de sibilante vozeada palatal
<j>
- <u> com valor consonntico
<v>
- <ll> ou <l> com valor de lquida palatal
<lh>
- <n> ou <gn> com valor de nasal palatal
<nh>
- <n> ou <~> representando a nasalao da vogal antes de oclusiva
labial
<m>
- <~> representando a nasalao da vogal antes de consoante no labial
<n>
- <> antes de <e> ou <i>
<c>
- <s> intervoclico com valor de surda
<ss>
- <r> intervoclico com valor de mltipla
<rr>
A aplicao destas regras e a deciso sobre qual deve ser a forma grca nal das cabeas dos artigos tm de ser revistas medida que mais
variantes grcas vo sendo registadas e a informao sobre as etimologias durante a segunda fase vai sendo validada.
(ii) A classicao gramatical das palavras do DPM. Os verbos so
apresentados, como habitualmente, na forma de innitivo e indicada a
subclasse a que pertencem. Os paradigmas exionais verbais constaro
de um anexo. Os nomes e os adjectivos so registados na forma masculina, seguida da exo feminina. No plural so registadas unicamente
as palavras que so sempre plural. Todas as palavras de todas as classes
devero ser classicadas de acordo com a terminologia corrente, as variveis: verbos, nomes, adjectivos e pronomes, e as invariveis: advrbios,
conjunes, e preposies.

O Dicionrio do Portugus Medieval. Fontes, concepao e metodologia

247

(iii) A etimologia dever indicar a origem das palavras, assim como os


elementos da sua formao quando esta se vericou j no portugus.
(iv) As acepes que pode ter a entrada do dicionrio sero dadas por
um equivalente actual, quando este exista, e/ou por breves descries dos
signicados da vedeta. As expresses multipalavra ou lexias complexas
so includas nas entradas lexicais, seguidas do seu signicado.
(v) As abonaes so excertos extrados das concordncias, que ilustram as acepes das entradas lexicais, sendo sempre escolhida a abonao mais antiga e a ltima que se encontra atestada no corpus. Sempre que as abonaes cronologicamente relevantes no so muito claras,
acrescenta-se outra que possa contribuir para ilustrar a acepo. Estas
esto identicadas com a data ou o sculo, quando a data desconhecida,
e tambm com a sigla do texto de onde foram extradas.
(vi) As remisses entre vedetas correspondem a duas situaes: (a)
as cabeas morfolgica e funcionalmente equivalentes correspondem
a variantes grcas que remetem para a cabea da variante idntica ou
mais prxima da forma actual, sendo esta que contm a descrio das
acepes e as abonaes respectivas; (b) as cabeas morfolgica e semanticamente semelhantes, cujas entradas lexicais apresentam acepes e
descries diferentes remetem umas para as outras, mas todas incluem a
sua prpria informao e as respectivas abonaes.
Os artigos do dicionrio vo sendo redigidos pelos membros da equipa a quem so distribudos por letras. Em Janeiro de 2007, inicia-se o estudo do lxico do corpus constitudo por textos dos sculos XIV e XV e todas
as tarefas se desenvolvem pela ordem anteriormente denida. So ento
redigidos mais verbetes, assim como revista e complementada a informao daqueles que foram criados a partir do corpus anterior, sempre
que sejam identicados dados a considerar. Vejam-se alguns exemplos
de artigos do DPM:
abade s. m. (Do lat. ecl. abbate-). Abade, superior de um mosteiro ou abadia; sacerdote [sc. 12
DN002] Noticia de auer que deuen a dar a petro abade In palmazianos super uno casal de afonso rodrigiz.
vij Morabetinos. [1500 HGP090] e nos, o dicto seor abbade & prior & cbento, obligamos os bens do dicto
noso mosteyro de vos defenderemos a dereito c este dicto foro. (Var. abaade, abade, abate, abbade, abbas,
abbat, habade). Fem. abadessa.
abarregado, a adj. (Do part. pas. de abarregar). Abarregado, que se amancebou [1489 TC] Item
saiba da pessoa de que estado he se he casada se solteira se abarregada e eso mesmo per que mester uiue.
homezio s. m. (Do lat. homicidiu-). Homicdio, morte de um ser humano por aco de outrem;
assassinato [1214 NT] E super sa aiuda oue testifigo c Petro Gomez, omezio qveli custou maes ka C morabitinos. (Var. homezio, omezio, umezio, omezyo, omizio, omizyo, oomezio, oomezyo).

248

Maria Francisca Xavier

tafularia s. f. (De taful + -aria). 1. Vcio ou prtica do jogo [1264-1284 CSM214] Ca se Deus deu
aas gentes jogos pera alegria / averen, todo o tornan elas en tafuraria, / e daquesta guisa queren gar. 2. Casa
de jogo [1264-1284 CSM174] E pois l ouve dito, logo sayu da tafuraria / e fillouss a chorar muito, [sc.
13 CEM251] Ainda eu outras manhas havia, / per que eu nom posso j muito valer: / nunca vos entro na
tafularia / que lhi nom haja algum preita volver. / Porque hei eu pois em gram coita seer? / fugir e guarir na
putaria. (Var. tafularia, tafuraria).

Em 2009, dever terminar a reviso nal dos verbetes e das remisses


internas ao dicionrio, ser preparado o anexo de morfologia verbal e nalizada a introduo. Sendo assim, em nais de 2009 dever estar publicado este Dicionrio do Portugus Medieval, procurando dar cumprimento aos objectivos formulados inicialmente.

O Dicionrio do Portugus Medieval. Fontes, concepao e metodologia

249

apndice
o corpus informatizado do portugus medieval (cipm)
Construdo a partir de textos j editados, o corpus respeita os critrios
de cada editor, embora, desde o incio, tenha sido necessria uma adaptao das solues grcas das intervenes editoriais (itlicos, sublinhados, uso de parnteses ou barras) em funo da necessidade de uniformizao exigida pela utilizao de diferentes suportes lgicos (DVPM 1999) e
de coerncia de notao interna do corpus.
1. Sculo XII
DN = 2 textos notariais (2 metade do sculo XII), in Ana Maria Martins
(ed.) (2000): Documentos notariais dos sculos XII a XVI. Edio digitalizada, cedida pela editora.
- Finto dos casais de Eligoo
- Notcia de haver
DP = 4 documentos privados (2 metade do sculo XII), in Jos Antnio
Souto Cabo (ed.) (2003): Nas origens da expresso escrita galego-portuguesa. Documentos do sculo XII. Braga: Universidade do Minho.
Edio digitalizada, cedida pelo editor.
- Pacto de Gomes Pais e Ramiro Pais (ca. 1173)
- Carta de foro da Benfeita
- Nomina de Pedro Viegas (1184)
- Escrito de Paio Soares
2. Sculo XIII
NT = Notcia de Torto (ca. 1214), in Lus Filipe Lindley Cintra (1990): Sobre
o mais antigo texto no-literrio portugus: a Notcia de Torto (leitura
crtica, data, redaco e comentrio lingustico), Boletim de Filologia
31, 21-77 (texto crtico, pp. 37-41). Edio digitalizada para o CIPM.
TL e TT = Testamento de D. Afonso II (1214), in Pe. Avelino Jesus da Costa
(1979): Os mais antigos documentos escritos em portugus, Revista
Portuguesa de Histria 17, 307-321 (dois manuscritos: Lisboa e Toledo).
Edio digitalizada para o CIPM.
CA = 34 documentos portugueses da Chancelaria de D. Afonso III (12551279), in Luiz Fagundes Duarte (1986): Os documentos em portugus da
Chancelaria de D. Afonso III (Edio). Dissertao de Mestrado. Lisboa:
FLUL, 68-295. Edio digitalizada para o CIPM.

250

Maria Francisca Xavier

DN = 73 textos notariais (sem data ou datados entre 1214 e 1300), in Ana


Maria Martins (ed.) (2000): Documentos notariais dos sculos XII a XVI.
Edio digitalizada, cedida pela editora.
CHP = 2 textos notariais (1275, 1278), in Ana Maria Martins (ed.) (1994): Clticos na histria do portugus. Apndice documental. Vol. 2. Dissertao
de Doutoramento, Lisboa. Edio digitalizada, cedida pela editora.
HGP = 61 textos notariais da Galiza e do Noroeste de Portugal (1262-1300),
in Clarinda de Azevedo Maia (1986): Histria do galego-portugus.
Coimbra: INIC, 19-295. Edio digitalizada para o CIPM.
FG = 6 foros de Garvo (1267-1280), in Maria Helena Garvo (ed.) (1992):
Foros de Garvo. Edio e estudo lingustico. Dissertao de Mestrado.
Lisboa: FLUL, 65-99. Edio digitalizada, cedida pela editora.
TOX = 21 textos notariais (sem data ou datados entre 1269 e 1300), in Stephen Parkinson (ed.): Arquivo de Textos Notariais em Portugus Antigo. Oxford. Edio digitalizada, cedida pelo editor.
FR = Foro Real (1280?), in Jos de Azevedo Ferreira (ed.) (1987): Afonso X.
Foro Real. Lisboa: INIC, 125-309.
TP = Tempos dos Preitos (1280?), in Jos de Azevedo Ferreira (ed.), in Jean
Roudil (1986): Summa de los Nueve Tiempos de los Pleitos. dition et
tude dune variation sur un thme. Paris: Klincksieck, 151-169.
CS = 1 documento dos Costumes de Santarm (1294), in Maria Celeste Matias Rodrigues (1992): Dos costumes de Santarm. Dissertao de Mestrado. Lisboa: FLUL, 160-251. Edio digitalizada, cedida pela editora.
CAmi = 513 cantigas de amigo (sem data ou datados entre 1220-1300), in
Rip Cohen (ed.) (2003): 500 cantigas de amigo. Porto: Campo das Letras.
Edio digitalizada, cedida pelo editor.
CAmo = 517 cantigas de amor (sem data), in Mercedes Brea (coord.) (1996):
Lrica profana galego-portuguesa. Santiago de Compostela: Centro Ramn Pieiro. Edio digitalizada in Base de Datos en lia da Lrica Profana Galego-Portuguesa do Centro Ramn Pieiro (www.cirp.es).
CSM = 419 cantigas de Santa Maria (datadas entre 1270 e 1282), in Walter Mettmann (ed.) (1981): Afonso X, o Sbio. Cantigas de Santa Maria.
Vigo: Edicins Xerais de Galicia. Edio digitalizada cedida por Xavier
Varela, Tesouro Medieval Informatizado da Lingua Galega.
CEM = 403 cantigas de escrnio e maldizer (sem data), in Graa Videira
Lopes (2002): Cantigas de escrnio e maldizer dos trovadores e jograis
galego-portugueses. Lisboa: Estampa. Edio digitalizada, cedida pela
editora.

O Dicionrio do Portugus Medieval. Fontes, concepao e metodologia

251

3. Sculos XIII/XIV
CAmo = 159 cantigas de amor (sem data), in Mercedes Brea (coord.) (1996):
Lrica profana galego-portuguesa. Santiago de Compostela: Centro Ramn Pieiro. Edio digitalizada in Base de Datos en lia da Lrica Profana Galego-Portuguesa do Centro Ramn Pieiro (www.cirp.es).
CEM = 69 cantigas de escrnio e maldizer, in Graa Videira Lopes (2002):
Cantigas de escrnio e maldizer dos trovadores e jograis galego-portugueses. Lisboa: Estampa. Edio digitalizada, cedida pela editora.
VS = 7 vidas de santos de um manuscrito alcobacense (sem data; cpias
do sculo XV), in Ivo Castro et alii (eds.) (1985): Vidas de santos de um
manuscrito alcobacense (Cod. Alc. cclxvi / antt 2274). Lisboa: INIC, 16-52,
59-83. Edio digitalizada para o CIPM.
4. Sculo XIV
CAmo = 20 cantigas de amor (sem data), in Mercedes Brea (coord.) (1996):
Lrica profana galego-portuguesa. Santiago de Compostela: Centro Ramn Pieiro. Edio digitalizada in Base de Datos en lia da Lrica Profana Galego-Portuguesa do Centro Ramn Pieiro (www.cirp.es).
CEM = 2 cantigas de escrnio e maldizer, in Graa Videira Lopes (2002):
Cantigas de escrnio e maldizer dos trovadores e jograis galego-portugueses. Lisboa: Estampa. Edio digitalizada, cedida pela editora.
HGP = 62 textos notariais da Galiza e do Noroeste de Portugal (1301-1399),
in Clarinda de Azevedo Maia (1986): Histria do galego-portugus.
Coimbra: INIC, 19-295. Edio digitalizada para o CIPM.
DN = 79 textos notariais (sem data ou datados entre 1304 e 1397), in Ana
Maria Martins (ed.) (2000): Documentos notariais dos sculos XII a XVI.
Edio digitalizada, cedida pela editora.
TOX = 15 textos notariais (sem data ou datados entre 1309 e 1336), in Stephen Parkinson (ed.): Arquivo de Textos Notariais em Portugus Antigo. Oxford. Edio digitalizada, cedida pelo editor.
CS = 3 documentos dos Costumes de Santarm ((1340-1360), in Maria Celeste Matias Rodrigues (1992): Dos costumes de Santarm. Dissertao
de Mestrado. Lisboa: FLUL, 160-251. Edio digitalizada, cedida pela editora.
FG = 1 foro de Garvo (sem data), in Maria Helena Garvo (ed.) (1992): Foros de Garvo. Edio e estudo lingustico. Dissertao de Mestrado.
Lisboa: FLUL, 65-99. Edio digitalizada, cedida pela editora.

252

Maria Francisca Xavier

PP = Afonso X. Primeyra Partida (ca. 1350), in Jos de Azevedo Ferreira


(1980): Alphonse X. Primeyra partida. Braga: INIC, 3-580. Edio digitalizada para o CIPM, nanciada pelo editor.
CGE = Crnica Geral de Espanha de 1344 (sd), in Lus Filipe Lindley Cintra
(ed.) (1951): Crnica geral de Espanha de 1344. Lisboa: INCM. Edio digitalizada para o CIPM.
CAXL = Crnica de Afonso X (manuscrito L) (sem data), in Lus Filipe Lindley Cintra (ed.) (1951): Crnica geral de Espanha de 1344. Lisboa: INCM.
Edio digitalizada para o CIPM.
CAXP = Crnica de Afonso X (manuscrito P) (sem data), in Lus Filipe Lindley Cintra (ed.) (1951): Crnica geral de Espanha de 1344. Lisboa: INCM.
Edio digitalizada para o CIPM.
CDA = Chancelarias Portuguesas de D. Afonso IV, vols. 1, 2 e 3 (30 Textos
seleccionados), in Joo J. Alves Dias (ed.) (1990-1992): Chancelarias portuguesas de D. Afonso IV. Lisboa: INIC. Edio digitalizada, cedida pelo
editor.
AT = Arte de Trovar (sem data), in Giuseppe Tavani (ed.) (1999): Arte de
trovar do Cancioneiro da Biblioteca Nacional de Lisboa. Lisboa: Colibri.
Edio digitalizada para o CIPM.
NLL = Narrativas dos Livros de Linhagens, in Jos Mattoso (1983): Narrativas dos Livros de linhagens. Lisboa: INCM. Edio digitalizada para
o CIPM.
LM = Livro de Montaria de Joo I (sem data), in Adelino de Almeida Calado (ed.) (no prelo). Edio digitalizada, cedida pelo editor, atravs de
Telmo Verdelho.
CI = Corte Imperial (annima dos ns do sc. XIV), in Adelino de Almeida
Calado (ed.) (2000): Corte enperial. Aveiro: Universidade. Edio digitalizada, cedida pelo editor, atravs de Telmo Verdelho.
5. Sculo XV
HGP = 42 textos notariais da Galiza e do Noroeste de Portugal (1401-1497),
in Clarinda de Azevedo Maia (1986): Histria do galego-portugus.
Coimbra: INIC, 19-295. Edio digitalizada para o CIPM.
DN = 46 textos notariais (sem data ou datados entre 1402 e 1499), in Ana
Maria Martins (ed.) (2000): Documentos notariais dos sculos XII a XVI.
Edio digitalizada, cedida pela editora.
LC = Leal Conselheiro (1437-38), in Joseph M. Piel (ed.) (1942): Leal Conselheiro. Lisboa: Livraria Bertrand. Edio digitalizada para o CIPM, revista por Joo Dionsio e Sandra lvarez.

O Dicionrio do Portugus Medieval. Fontes, concepao e metodologia

253

LEBC = Livro da Ensinana de Bem Cavalgar Toda Sela (sem data), in Joseph M. Piel (ed.) (1944): Livro da ensinana de bem cavalgar toda sela.
Lisboa: Livraria Bertrand. Edio digitalizada para o CIPM, revista por
Joo Dionsio.
CP = Castelo Perigoso (sem data), in Joo Antnio Santana Neto (ed.)
(1997): Duas leituras do tratado asctico-mstico Castelo Perigoso. Dissertao de Doutoramento. So Paulo: Faculdade de Filosoa, Letras e
Cincias Humanas, USP. Edio digitalizada cedida pelo editor e revista por Irene Nunes.
DSG = Demanda do Santo Graal (sem data), in Irene Freire Nunes (2001):
A demanda do Santo Graal. Edio digitalizada para o CIPM com base
na edio publicada pela Imprensa Nacional-Casa da Moeda (Lisboa,
1995), revista pela editora.
LVT = Livro das Tres Vertudes (sem data), Maria de Lourdes Crispim (ed.).
Verso paradiplomtica digitalizada, cedida pela editora.
OE = Orto do Esposo (sem data), in Bertil Maler (ed.) (1956): Orto do Esposo.
Rio de Janeiro: Ministrio da Educao e Cultura, Instituto Nacional do
Livro. Edio digitalizada para o CIPM.
CPVC = Carta de Pro Vaz de Caminha, in M. V. Guerreiro / E. B. Nunes
(eds.) (1974): Carta a el-rey dom Manuel sobre o achamento do Brasil.
Lisboa: INCM. Edio digitalizada para o CIPM.
HRP = Histria dos Reis de Portugal (sem data), in Lus Filipe Lindley Cintra (ed.) (1951): Crnica geral de Espanha de 1344. Lisboa: INCM. Edio
digitalizada para o CIPM.
ZPM = Crnica do Conde D. Pedro de Meneses (sem data), in Maria Teresa Brocardo (ed.) (1994): Crnica do Conde D. Pedro de Meneses. Dissertao de Doutoramento. Lisboa: FCSH, 333-693. Edio digitalizada,
cedida pela editora.
CDF = Crnica de D. Fernando, in Giuliano Macchi (ed.) (1975): Ferno Lopes. Cronica de D. Fernando. Lisboa: INCM. Edio digitalizada para o
CIPM.
CDJI1 = Crnica de D. Joo I, parte 1, in Ferno Lopes (1945): Crnica de D.
Joo I. Porto: Livraria Civilizao (segundo o cdice n 352 do Arquivo
Nacional da Torre do Tombo). Edio digitalizada para o CIPM.
CDJI2 = Crnica de D. Joo I, parte 2, in Ferno Lopes (1949): Crnica de D.
Joo Primeiro. Porto: Livraria Civilizao. Edio digitalizada para o
CIPM.
CDPI = Crnica de D. Pedro I, in Damio Peres (ed.) (1965): Ferno Lopes.
Crnica de D. Pedro I. Porto: Livraria Civilizao. Edio digitalizada e
revista por Jos Barbosa Machado, cedida pelo revisor.

254

Maria Francisca Xavier

TC = Tratado da Conssom (1489), in Jos Barbosa Machado (ed.) (2003):


Tratado de Conssom. Vol I. Chaves: Universidade de Trs-os-Montes e
Alto Douro. Edio digitalizada, cedida pelo editor.
PMP = Penitencial de Martim Prez, in Mrio Martins (ed.) (1957): Penitencial de Martim Prez. Edio digitalizada e revista por Jos Barbosa
Machado, cedida pelo revisor.
S = Sacramental, de Cremente Sanchez de Vercial (1488), in Jos Barbosa
Machado (ed.) (2005): Clemente Snchez de Vercial. Sacramental. Minho: Pena Perfeita. Edio digitalizada, cedida pelo editor.
VDT = Vida de D. Telo, in Aires Augusto Nascimento (ed.) (1998): Hagiograa de Santa Cruz de Coimbra. Lisboa: Colibri, 273-286. Edio digitalizada, cedida por Jos Barbosa Machado.
VST = Vida de So Teotnio, traduo quatrocentista da vida de S. Teotnio. Edio digitalizada e revista por Deolinda Rodrigues Cabrera,
cedida por Jos Barbosa Machado.
LHB = Livro das Histrias da Bblia (sem data), in J. Mendes de Castro (ed.)
(1998): Bblia de Lamego. Vol. I e II. Lamego. Edio digitalizada, cedida
por Jos Barbosa Machado.
Cat = Catecismo (sem data), in Elsa Branco da Silva (ed.) (2001): O catecismo pequeno de Dom Diogo Ortiz. Lisboa: Colibri. Edio digitalizada,
cedida pela editora.

255

III. A LEXICOGRAFA ACADMICA

256

257

O NOVO DICIONARIO DA REAL ACADEMIA GALEGA


Manuel Gonzlez Gonzlez

Real Academia Galega / Universidade de Santiago de Compostela

1. introducin
Cando en 1905 a Asociacin Iniciadora y Protectora de la Academia
Gallega de La Habana impulsou a creacin da RAG, encomendoulle como
unha das principais tarefas a de realizar o dicionario da lingua galega.
Neste momento xa se coecan algns dicionarios do galego, todos eles
de carcter bilinge, que no fondo tian sempre como punto de referencia
o casteln. Pero nin o dicionario de F. J. Rodrguez (1863), nin o de Cuveiro
(1876), nin o de Valladares (1884) podan considerarse obras de referencia
nin sequera cos criterios lexicogrcos pouco esixentes da poca, anda
que hai que recoecer que a obra de Valladares supuxo un adianto considerable con respecto s das anteriores. En realidade, no nico aspecto en
que os lexicgrafos do XIX superaron o labor realizado no XVIII polos seus
antecesores Sarmiento e Sobreira, foi en darlles s sas obras un formato
mis prximo ao que hoxe consideramos un dicionario. Coa vontade de
dar un paso cualitativo dentro da lexicografa galega comezaron os traballos do Diccionario da RAG cun fervor realmente admirable. Para a sa
realizacin pediuse a colaboracin de todos os acadmicos da institucin
e daquelas persoas que naquel momento estaban en posesin dalgunha
recolla lxica galega ou con ganas de levala a cabo. Desde aquela houbo
diversas contribucins importantes no campo da lexicografa galega, que
non este o momento de examinar nin de valorar. Foi no 1990 cando se
deron os pasos mis rmes no aspecto metodolxico na lexicografa monolinge, coa publicacin por parte do Instituto da Lingua Galega e a Real
Academia Galega do Diccionario da lingua galega (ILG/RAG 1990), Anda
que contaba s con 12.000 entradas, supuxo un avance decisivo en aspectos metodolxicos tan importantes como:

258

Manuel Gonzlez Gonzlez

(a) o coidado na redaccin das denicins, que se realizan facendo uso


unicamente das palabras que guran como entradas no propio dicionario, e que evitan en todo momento a circularidade, tan frecuente nalgns
traballos lexicogrcos;
(b) a precisin nas indicacins categoriais, particularmente nos verbos, que se traduce non s nas anotacins de tipo gramatical, senn tamn na propia organizacin das denicins;
(c) a incorporacin de exemplos a cada unha das acepcins recollidas;
(d) a indicacin para cada unha das acepcins dos sinnimos, antnimos e palabras prximas semanticamente.
Probablemente a obra mis able e mis acabada de toda a historia da
lexicografa galega, pese ao nmero relativamente reducido de entradas,
xa que unicamente conta con 25.000 lemas, sexa o DRAG (1997). un dicionario de uso, pero coa restricin do seu carcter normativo, o que explica
que un nmero considerable de palabras empregadas habitualmente no
galego non aparezan recollidas, por seren voces espurias innecesarias ou
por teren un marcado carcter dialectal. Anda as, pola alta frecuencia
de uso que presentan, dselles cabida a algunhas destas palabras non
recomendables, pero van sempre precedidas dun asterisco, e desde elas
remtese para a forma galega considerada mis correcta.
O carcter mis novidoso desta obra a sistematicidade e modernidade da tcnica lexicogrca na microestrutura das entradas. Cada artigo
presenta unha informacin estruturada de tipo fontico (cando pertinente), gramatical, lxico, nivel de lingua, mbito de especialidade, etc.
A incorporacin do principio lexicogrco de que toda denicin debe
poder substitur o termo denido nun contexto dado levou a preocuparse
de que a perfrase da denicin tea unha forma tal que poida desempear a funcin sintctica propia da palabra denida, as como separacin
entre o ncleo e o contorno da denicin. esta a primeira obra de lexicografa galega en que se segue este principio de maneira sistemtica.
Cada unha das acepcins leva un ou varios exemplos de uso que, amais
de proporcionar ao usuario un modelo de utilizacin concreta da palabra dentro dun enunciado, acta tamn de elemento de contraste para
someter a proba a correccin e adecuacin da denicin. Na seleccin de
exemplos tvose especial coidado por evitar o clasismo, o sexismo e, en
xeral, a transmisin de ideas non acordes cos principios de igualdade de
todos os seres humanos, de convivencia democrtica e de respecto pola
natureza. O mesmo ca no dicionario de 1990, tamn neste se indica para
cada acepcin os sinnimos, antnimos e outros termos que presentan

O novo Dicionario da Real Academia Galega

259

unha estreita anidade semntica. Cada artigo crrase coas locucins,


frases feitas e modismos nos que aparece o lema da entrada como palabra base1. Neste momento a Real Academia Galega est traballando nun
novo dicionario das mesmas caractersticas tcnicas ca o anterior, pero de
50.000 entradas, e del do que imos falar.

2. o drag, dicionario normativo


Vimos xa que o primeiro encargo que se lle xo RAG foi a elaboracin dun dicionario da lingua galega, que recolla a riqueza lxica da
nosa lingua, anda en boa parte non recompilada, pero tamn que sirva
de orientacin para a sa escrita. O DRAG debe ser, pois, un dicionario de
lingua, no que se atope aquela parte do lxico que comn maior parte
dos falantes e que estes utilizan nas sas interrelacins habituais, pero
tamn un dicionario normativo ao que o usuario poida acudir para saber
se a forma, o contido, ou as caractersticas gramaticais dunha determinada voz pertencen ao que se considera bo galego ou non. Debe ser, pois, un
dicionario que oriente sobre o uso correcto:
(a) na forma das palabras, tanto na sa vertente escrita (se unha palabra se escribe con b ou v, con h ou sen h, etc.), como na sa vertente oral
(se unha palabra se pronuncia con e aberto ou pechado, con s ou con x,
etc.). Por iso debe advertir, nos casos en que un grafema poida representar
mis dun fonema, a cal dos fonemas representa en cada caso concreto;
(b) nos signicados;
(c) nas caractersticas morfosintcticas;
(d) no rexistro.

3. as fontes para a elaboracin do drag


Os primeiros dicionarios da lingua galega foron realizados por afeccionados que pacientemente an apuntando as palabras que escoitaban
no seu lugar de nacemento, no lugar onde vivan ou nos lugares que visitaban. Nalgns casos incorporaron algns datos extrados de textos escritos, literarios ou non, pero en todo caso non se baseaban nun conxunto
de textos orais ou escritos que puidesen ser considerados como represen1.

Para a anlise mis polo mido das caractersticas desta obra pode verse Gonzlez Gonzlez (1996).

260

Manuel Gonzlez Gonzlez

tativos do conxunto da realidade lingstica dun determinado momento.


Hoxe non se entende a elaboracin dun dicionario de lingua sen un corpus que lle sirva de base.
A informacin do DRAG est elaborada a partir de tres tipos principais
de fontes:
(a) Obras lexicogrcas anteriores (dicionarios, vocabularios, lxicos);
(b) Corpus representativo da lingua escrita do galego moderno;
(c) Corpus representativo da lingua oral do galego actual.

3.1. Os dicionarios e obras lexicogrcas anteriores


Pdese dicir que dalgunha maneira o DRAG debedor de todas cantas obras lexicogrcas foron realizadas con anterioridade sa elaboracin, porque todas elas foron tidas en conta, mesmo en moitos casos
para rexeitar a sa informacin. Pero permtaseme sinalar algunhas das
obras histricas mis signicativas: toda a informacin lxica contida nas
obras de Sarmiento (1970, 1973, 1975, 1986, 1999) e de Sobreira (cfr. Pensado
1974), a Traduccin de algunas voces, frases y locuciones gallegas, especialmente de agricultura al castellano atribuda a Reguera y Pardias (18401858), os dicionarios e vocabularios de F. J. Rodrguez (1863), Juan Manuel
Pintos (1865), Juan Cuveiro Piol (1876), Marcial Valladares (1884) (cos suplementos de 1896 a 1902), Francisco Porto Rey (1900-1908), Leiras Pulpeiro
(ca. 1906) (cfr. Prez Pascual / Tato Garca 1986), Payzal (cfr. Ferreiro 1994),
DRAG (1913-1928), X. F. Filgueira Valverde et alii (1926), Leandro Carr Alvarellos (1928-1931), Acevedo y Huelves / Fernndez y Fernndez (1932), Anbal Otero (1949-1977, 1967, 1977), Eladio Rodrguez (1958-1961) (co apndice),
Franco Grande (1968), Ros Panisse (1977, 1983), Elixio Rivas (1978, 1988, 1996,
1997a, 1997b, 1997c, 1998a, 1998b, 2003), Constantino Garca Gonzlez (1974,
1985), Francisco Romero Lema (2000), etc.
Hoxe, a maiora destas obras estn recollidas no Diccionario de diccionarios (Santamarina 2003b), que nos ltimos anos nos facilitou moito o
traballo, xa que permite unha consulta moito mis cmoda da informacin sobre unha palabra nos distintos dicionarios, facilita o seguimento
histrico das voces nas obras lexicogrcas (copias, malas lecturas, malas interpretacins...), e supn un aforro de tempo importantsimo para a
consulta das fontes lexicogrcas que incorpora.

O novo Dicionario da Real Academia Galega

261

3.2. O Tesouro Lexicogrco da Lingua Galega


O Tesouro Lexicogrco da Lingua Galega un amplo conxunto de
chas lxicas con voces recollidas especialmente da lingua oral, posto
en marcha a nais dos anos sesenta por Constantino Garca no Departamento de Filoloxa Romnica da Universidade de Santiago, e que despois,
cando se creou o Instituto da Lingua Galega, pasou a esta institucin. Este
cheiro contn voces procedentes de:
(a) teses de doutoramento e memorias de licenciatura realizadas sobre falas de distintos puntos de Galicia ou ben sobre elementos da cultura
material ou espiritual de Galicia;
(b) enquisas realizadas por alumnos das materias que imparta o Departamento de Filoloxa Romnica e por outros colaboradores que achegaban informacin mis ou menos ocasional;
(c) gravacins de textos orais.
Como cabera esperar pola formacin dos seus recolectores, esta informacin non ofrece toda o mesmo nivel de abilidade. Non teen o
mesmo valor os datos proporcionados por un doutor, especialista en lingstica, que os achegados por un alumno ou por un afeccionado que, anda poendo toda a sa mellor vontade, non sempre posen a formacin
acadmica suciente para transmitir con precisin aquilo que escoitaron
ou coidaron escoitar. Esta a razn que levou a clasicar a informacin
do cheiro en tres tipos de chas, de distintas cores, segundo o nivel de
conanza que ofrecesen:
(a) a informacin procedente de teses ou memorias de licenciatura
ou de traballos contrastados cienticamente recllese en chas de cor
branca;
(b) a procedente de enquisas de alumnos ou colaboradores, en chas
de cor amarela;
(c) a informacin procedente da transcricin de gravacins de textos
orais, en chas de cor azul.
O soporte desta informacin en chas de papel limita o seu aproveitamento. Sera moi difcil, por exemplo, coecer todos os sinnimos que aparecen para bidueiro, porque esixira percorrer todas as chas contidas en
cada un dos centos de caixns que integran o cheiro. Por iso se intentou a
informatizacin deste cheiro nunha base de datos con nove campos:

262

Manuel Gonzlez Gonzlez

(a) forma dialectal


(b) forma normativa
(c) equivalencia en casteln
(d) categora gramatical
(e) campo nocional
(f) exemplo
(g) lugar de recollida
(h) notas
(i) fonte
Para o campo nocional, deseouse un modelo no que o universo se
estrutura en dez campos; cada un destes subdvidese noutros dez, e cada
un destes de novo noutros dez, etc.:
1. Ceo e atmosfera
2. Terra
3. Plantas
3.1. A vida vexetal en xeral
3.2. rbores
3.2.1. Xeneralidades
3.2.2. rbores madeirables
3.2.3. rbores froiteiras
etc.

3.3. O Tesouro Informatizado da Lingua Galega (TILG)


unha base de datos do lxico contido nun corpus do galego moderno. Trtase dun proxecto dirixido por Antn Santamarina, no Instituto da
Lingua Galega, cunha nalidade principalmente lexicogrca. Contn ao
redor de 11 millns de rexistros, e abrangue o mbito temporal comprendido entre o ano 1671 e a actualidade.
O corpus est integrado por:
- textos literarios
- textos xornalsticos
- textos de carcter tcnico e cientco
- textos de literatura oral
- textos orais sen carcter literario

O novo Dicionario da Real Academia Galega

263

Coa nalidade de facilitar o seu tratamento, os textos foron sometidos a


un proceso de normalizacin e uniformizacin ortogrca. Por exemplo:
(a) Reducronse a nh as diversas formas para representar a consoante
nasal velar en posicin intervoclica: unha, un-a, un-ha, umha > unha;
(b) Regularizouse o uso de b e v, segundo os criterios ortogrcos do
galego actual: av, ab > av;
(c) Regularizouse o emprego de h, segundo a ortografa vixente na actualidade: hoso, so > so:
(d) Modicouse o uso do acento grco seguindo os criterios de acentuacin das normas ortogrcas actuais: canti, cantei > cantei; prtega,
prtega > prtega.
O proceso de regularizacin do texto facilita o traballo de lematizacin, pero ten dous inconvenientes de certa importancia: non permite
facer un seguimento da evolucin da ortografa a travs dos textos que
contn, e esixe ter que acudir sistematicamente s fontes para comprobar a ortografa cando se quere facer unha cita textual.
Esta base de datos ofrcenos para calquera voz as concordancias, o
seu lema e a categora gramatical que pertence.

3.4. Corpus de Referencia do Galego Actual (CORGA)


O Corpus de Referencia do Galego Actual foi elaborado no Centro Ramn Piiro para a Investigacin en Humanidades, e est dirixido por
Guillermo Rojo.
O CORGA contn unha coleccin de documentos en formato electrnico, na que estn representados os diferentes tipos de textos da lingua
galega actual. Abrangue o mbito cronolxico comprendido entre o ano
1975 e a actualidade. Trtase, pois, dun corpus referido exclusivamente ao
galego actual ou recente.
un corpus que pretende ser equilibrado, con representacin proporcional de textos de distintos xneros, de distintas reas temticas e de
distintos anos. As grandes reas temticas en que se clasican os textos
son:
- Economa e poltica
- Cultura e artes
- Ciencias sociais
- Ciencia e tecnoloxa

264

Manuel Gonzlez Gonzlez

- Ficcin
- Outros
Na constitucin temtica do corpus tivronse en conta non s as
reas temticas, senn tamn as subreas. Por exemplo, na rea temtica
Economa e poltica, estn representadas as subreas de:
- Poltica
- Desenvolvemento e infraestruturas
- Emprego, traballo, industria
- Sector servizos
- Explotacin primaria
- Economa, facenda, bolsa
- Ordenacin sanitaria
- Xustiza, lexislacin, dereito
- Asuntos sociais
- Ordenacin acadmica
As buscas e concordancias pdense realizar sobre o conxunto do corpus, ou ben restrinxilas a unha ou varias reas temticas. O usuario pode
seleccionar tamn o perodo cronolxico que sexa do seu interese:
- 1975-1979
- 1980-1984
- 1985-1989
- 1990-1994
- 1995-1999
- 2000-2004
Deste corpus existen das versins en lia. A primeira contn 17.5 millns de formas, e est dispoible no enderezo http://corpus.cirp.es/corga.
A segunda, sobre a que anda se est a traballar, contn neste momento
13.3 millns de formas, e est dispoible no enderezo http://corpus.cirp.
es/corgaxml2.
A segunda versin en .xml creouse para posibilitar un sistema de recuperacin de informacin mis exible e efectivo, e obrigou a unha codicacin e deseo dunha estrutura formal que dea conta da disposicin
2.

No momento da publicacin o volume de formas incrementouse xa notablemente. A situacin actual pdese consultar na pxina do Centro Ramn Pieiro para a Investigacin en Humanidades (www.cirp.es).

O novo Dicionario da Real Academia Galega

265

interna caracterstica de cada un dos grandes tipos de textos (xornalsticos, ensaio, novela...).
Estase ultimando unha ferramenta de anlise gramatical automtica
e de desambiguacin, que permitir a lematizacin automtica, a actualizacin da base cun custo econmico baixo, e buscas secuenciais por categoras (por exemplo, verbo tirar + preposicin).

3.5. O Atlas Lingstico Galego (ALGa)


O Atlas Lingstico Galego proporciona valiossima informacin sobre
a realidade lxica do galego actual, co valor engadido de que permite a
sa localizacin xeogrca e examinar a extensin no territorio dunha
voz cun signicado determinado.
Neste momento lvanse publicados 5 volumes desta obra, pero para
o DRAG xronse tamn con frecuencia consultas sobre os cadernos para
documentar determinados signicados de voces populares.

3.6. O Arquivo do Galego Oral


Outra fonte de procedencia oral con certo interese para o DRAG o
Arquivo do Galego Oral, proxecto dirixido por Francisco Fernndez Rei, no
ILG, e que contn gravacins de mis de 2.000 puntos de todo o territorio
de fala galega. Neste momento anda non est transcrito todo o material
contido nas gravacins.
Anda que a sa nalidade non puramente lexicogrca, as sas
concordancias son utilsimas para coecer o uso das palabras, para examinar os contextos de utilizacin e para ver o seu valor real.

3.7. O Tesouro Fraseolxico Galego (TFG)


Nos dicionarios actuais, cada vez se lle ofrece maior importancia
fraseoloxa, e para atender este aspecto resultou de axuda inestimable
o proxecto, dirixido por Xess Ferro Ruibal no Centro Ramn Pieiro, que
leva por ttulo Tesouro Fraseolxico Galego.
O TFG sobrepasa neste momento as trescentas mil entradas, con datos que van desde mediados do sculo XVIII ata hoxe, pero con predominio dos correspondentes aos ltimos oitenta anos.
Por seren os fraseoloxismos unidades cunha estrutura mis ou menos
xada, cun signicado que, na maior parte dos casos, non a suma dos
signicados das palabras que as integran, entndese facilmente que cada

266

Manuel Gonzlez Gonzlez

vez se lles dea unha maior importancia nos dicionarios modernos. Tense
dito moitas veces que non se coece en profundidade unha lingua ata
que non se coecen ben os seus fraseoloxismos. Pero, ademais, as como
no lxico dunha lingua se reicte dalgunha maneira a historia e as experiencias dos pobos, a fraseoloxa revlanos por veces dun xeito moi transparente a maneira particular de ver a realidade de cada sociedade ou de
cada cultura.

4. a macroestrutura do drag
4.1. As entradas
O Dicionario da Real Academia Galega contn ao redor de cincuenta
mil artigos lexicogrcos, e as sas entradas estn baseadas no Vocabulario ortogrco da lingua galega (VOLG), con algns engadidos:
(a) Considerouse conveniente completar algunha familia de palabras
que no VOLG apareca unicamente cos seus membros mis relevantes.
(b) Introducronse algunhas voces non includas no VOLG, xeralmente
pertencentes a linguas de especialidade, pero que presentan certo uso.
(c) Completouse algunha serie de palabras que constiten un conxunto completo claramente delimitado, e que por algunha razn quedou incompleta no VOLG.
O VOLG unha proposta de vocabulario normalizado da lingua galega.
A primeira edicin provisoria sau no ano 1990, en edicin non venal, e a
primeira edicin ocial do ano 2004. Actualmente pdese consultar na
pxina da RAG a versin en lia deste vocabulario (www.realacademiagalega.org). Esta versin en lia presenta xa algunhas correccins e novidades con respecto editada en papel. A realizacin desta proposta de vocabulario normalizado da lingua galega esixiu realizar unha seleccin de
formas dialectais dentro do propio galego, levar a cabo unha depuracin
de castelanismos e de voces espurias innecesarias, facer unha proposta de
ortografa, acentuacin e morfoloxa correctas, e, en certa medida, afrontar tamn o problema de actualizacin e modernizacin do lxico.
Foi necesario, en primeiro lugar, facer unha seleccin de formas dialectais. Por poer un exemplo que sexa claramente comprensible, para designar a rbore betulla, de entre un gran nmero de formas existentes (bidueiro,
bedueiro, bidoeiro, bidoeira, budueira, abedoeira, abedueiro..., bedugo, bedulo,

O novo Dicionario da Real Academia Galega

267

dulo, bdalo, bido, budio...) foi necesario escoller unha delas, neste caso bidueiro, para a norma estndar. Evidentemente, as escollas non poden ser
feitas de xeito arbitrario, senn seguindo unha serie de criterios da maneira
mis coherente posible. Os principais criterios seguidos no VOLG para a seleccin dialectal foron: a autenticidade da forma, a extensin xeogrca, a
tradicin literaria e a coherencia interna dentro da mesma familia.
O VOLG signicou un avance extraordinario tamn na depuracin de
castelanismos e voces espurias innecesarias. O prstamo lingstico pode
ser necesario en certos casos, cando designa unha realidade nova, pero
debe evitarse que unha voz fornea retire da circulacin outra galega que
designe o mesmo concepto. Por iso se excluron castelanismos moi introducidos, como por exemplo abonar, para restitur no seu lugar a forma
patrimonial galega aboar; ou lusismos con certa implantacin literaria,
como aceitona, anceio ou saudade, para darlles prioridade s voces propiamente galegas oliva, ansia ou devezo, e soidade.
O VOLG unha proposta de ortografa correcta para a lingua galega.
Na tradicin escrita do galego moderno existen tendencias grcas alleas
historia e evolucin da propia lingua. Son frecuentes grafas debedoras do casteln como *acibro, *trebo, *barrer, e hai grafas que s se explican baixo a inuencia do portugus, como por exemplo *povo. Todas elas
foron restitudas forma ortogrca mis acorde cos criterios grcos do
galego: acivro, trevo, varrer, pobo.
A presin do casteln, e a penetracin dun gran nmero de cultismos
a travs desta lingua, introduciu nos falantes galegos un alto nmero de
acentuacins antietimolxicas, que foi necesario corrixir na proposta normativa do lxico galego: fronte s realizacins populares, introducidas a
travs do casteln, do tipo *smose, *dicese, *atmsfera, *isobara, *fotolise,
*monolito..., propuxronse as formas con acentuacin mis etimolxica
osmose, diocese, atmosfera, isbara, fotlise, monlito...
No VOLG tamn se fai unha proposta de morfoloxa correcta para a
lingua galega: indcase o xnero correcto de cada substantivo (condnanse, por exemplo, usos como *o fraude, *o sndrome, fronte s formas recomendadas a fraude, a sndrome), indcase o rxime de cada verbo, do que
aparecen usos incorrectos debidos interferencia co casteln (quecer (i) /
quentar, adormecer (i) / adormentar, amarelecer (i) / amarelar).
Naqueles casos en que a formacin do feminino ou do plural pode ser
problemtica, tamn se informa sobre este particular: afgn / f: afg, pero
cachn / f: cachana.
Outra funcin que tivo que cumprir o VOLG a de actualizacin e modernizacin do lxico. O galego, debido s especiais circunstancias hist-

268

Manuel Gonzlez Gonzlez

ricas que lle tocou sufrir, quedando circunscrito practicamente ao mundo


agrcola e marieiro, desenvolveu un lxico rico para estes mbitos, pero
non se adaptou lexicamente a aquelas reas nas que non era lingua de
uso habitual (ciencia, administracin, tecnoloxa...). Foi necesario, xa que
logo, facer un esforzo para capacitar a lingua para as novas necesidades
da sociedade actual, actualizando o seu lxico mediante distintos procedementos:
(a) Prstamo doutra lingua: xenismos (khmer), prstamos integrados
(bist, chal, estndar);
(b) Cultismo latino ou grego: elipse, mettese...;
(c) Revitalizacin de arcasmos: ousia, doazn, xaxuar, taxa...;
(d) Calco: autoestrada, altofalante...;
(e) Creacin autctona: mostraxe, lastro, beirarra, rede de sumidoiros...

4.2. Algns problemas referidos macroestrutura


Os autores de calquera dicionario moderno, hora de decidiren a sa
macroestrutura, teen que tomar unha serie de decisins sobre problemas como: qu unidades terminolxicas introducir, o tratamento dos
homnimos, o tratamento de formas morfoloxicamente irregulares, qu
facer coas lexas compostas e as frases feitas, qu papel se lles vai dar s
palabras non normativas, etc. Vexamos cal o comportamento do DRAG
con respecto a estas cuestins.
4.2.1. O tratamento da terminoloxa
Dilucidar qu unidades terminolxicas deben ser introducidas nun
dicionario xeral dunha lingua un asunto longamente discutido. Nunca coma hoxe houbo tanta osmose entre as linguas de especialidade e a
lingua comn, no que se rere ao lxico. Isto unha consecuencia lxica
do aumento do nivel cultural das sociedades modernas e da democratizacin do coecemento. Un termo coma o rato dun ordenador, que hai ben
poucos anos pertenca lingua de especialidade da informtica, hoxe
debe considerarse unha voz xa integrada na lingua habitual de calquera
persoa. De maneira xeral, podemos dicir que nun dicionario de lingua deben ter cabida os termos, en canto unidades lxicas, que non pertenzan a
un nivel altamente especializado.
Un problema especial presntao o tratamento dos smbolos. Dentro das unidades de coecemento especializado, temos unidades lin-

O novo Dicionario da Real Academia Galega

269

gsticas (lxicas, fraseolxicas e oracionais), pero encontramos tamn


unidades non lingsticas (smbolos, frmulas, nomenclaturas, iconografa). Debemos preguntarnos, pois, qu facemos, por exemplo, cos
smbolos qumicos. Deben ter cabida no dicionario os smbolos H (que
representa o hidrxeno) ou O (que representa o osxeno)? En realidade,
os smbolos son unidades non lingsticas de coecemento especializado, semellantes en certo modo s iconas; pensemos por exemplo no
que simboliza

E, se lle damos cabida no dicionario a H ou a O, debemos preguntarnos


tamn por qu non facemos o mesmo con, por exemplo, H2SO4, que representa o cido sulfrico.
O tratamento que os dicionarios lles dispensan aos smbolos qumicos dire radicalmente duns a outros. Hai dicionarios que os acollen e
outros que se negan a darlles cabida (por exemplo, un tan coecido como
o Vocabolario della lingua italiana de Zingarelli). No DRAG optamos por
darlles cabida a algns por razns de tipo prctico, pero sen estarmos convencidos da sa inclusin desde un punto de vista terico.
4.2.2. Tratamento dos homnimos. O problema da homonimia e da polisemia
En realidade, desde o punto de vista sincrnico, un signo lingstico
unha unidade dotada dunha expresin fnica e un contido semntico. Deste xeito, cada acepcin dunha voz (ou mellor, cada invariante signicativa) constituira un signo lingstico distinto, e poderase pensar
nunha entrada distinta para cada relacin signicante-signicado. Pero
esta unha prctica pouco seguida ata agora na lexicografa, por unha
razn moi simple, porque todos temos conciencia de que diversos signicados poden ser asignados a un mesmo signicante, e de que entre estes
signicados existe moitas veces unha relacin especial (de proximidade
semntica, de derivacin xentica entre un e outro, etc.).
Nas obras lexicogrcas habitualmente vense agrupando baixo un
mesmo lema os casos de polisemia, e sepranse en lemas distintos os casos de homonimia. O problema est daquela en distinguir entre homonimia e polisemia. As diferencias entre homonimia e polisemia non sempre

270

Manuel Gonzlez Gonzlez

estn claras, e non todos os lingistas seguen os mesmos criterios para


diferenciar unha doutra. Os criterios mis frecuentes de distincin son:
(a) O etimolxico: considranse casos de polisemia aqueles en que os
distintos signicados que se asignan a un nico signicante derivan dun
mesmo timo; e considranse casos de homonimia aqueles en que os distintos signicados que se corresponden cun mesmo signicante derivan
de timos distintos.
(b) Outras veces acdese conciencia dos falantes, para dirimir se estamos ante un caso de homonimia ou de polisemia.
(c) Tamn con frecuencia se botou man de criterios semnticos, considerando, por exemplo, casos de polisemia aquelas acepcins que pertencen a un mesmo campo semntico, e casos de homonimia os demais.
No DRAG sguese un criterio historicista, baseado na etimoloxa:
sacha1 s.f. Ferramenta agrcola utilizada para sachar, que vara de forma e de tamao segundo os
lugares. Colleu a sacha e foi cara leira. SIN. sacho.
sacha2 s.f. 1. Accin de sachar. Xa logo empezaban coa sacha do millo. A sacha un labor pesado. SIN.
cava1, sachada, sachadura. 2. poca en que se realiza este labor. Creo que ocorreu pola sacha das
patacas. SIN. sachega.

No caso de sacha1 estamos ante unha formacin a partir de sacho, que


procede do lat. SARCULUM; en cambio, no caso de sacha2 encontrmonos
diante dun substantivo deverbal, formado a partir do verbo sachar.
4.2.3. Tratamento de formas morfoloxicamente irregulares
Anda que como cabeza de artigo lexicogrco guran unicamente
os lemas (as formas do masculino singular no caso dos substantivos e
adxectivos, e o innitivo no caso dos verbos), hai veces en que se incorporan como entradas tamn outras formas que son morfoloxicamente
irregulares, co n de facilitar o uso do dicionario a persoas que non teen
un coecemento profundo da lingua. Nestes casos non se ofrece a informacin lexicogrca da voz, e remtese para o seu lema correspondente:
poetisa s.f. V. poeta.
poeta s.m. (f. poetisa) Persoa que escribe poesa. OBS. Tende a utilizarse a forma poeta como
feminina, en lugar de poetisa. Curros Enrquez un poeta do sculo XIX. A gran poetisa galega Rosala
de Castro.

O novo Dicionario da Real Academia Galega

271

Esta prctica non se leva a cabo cando a forma irregular cadra xusto
ao lado do lema, porque neste caso o usuario, ao buscar a forma irregular,
encontra xa facilmente o lema correspondente. Isto ocorre, por exemplo,
con actriz, que non gura como entrada porque caera xustamente despois de actor.
Hai un caso especial no que se lle d cabida forma morfoloxicamente irregular mesmo que alfabeticamente lle cadre xusto ao lado do seu
lema: cando a forma do feminino ten algunha acepcin distinta que non
pose a forma masculina:
duque s.m. (f. duquesa) Nobre do mis alto rango, despois do prncipe e inmediatamente superior ao marqus. Fomos visitar o pazo dos duques de Alba.
duquesa s.f. 1. V. duque. 2. Muller do duque. Acudiu a duquesa en representacin do seu marido.

4.2.4. O tratamento das locucins


As lexas compostas e as locucins non guran como entradas. Incorpranse ao elemento constitunte que se considera mis importante
semanticamente:
carrada s.f. 1. Carga que leva un carro dunha soa vez. Trouxeron unha carrada de toxo do monte. 2.
Cada unha das viaxes que se fai cando se carrexa algo. De volta da segunda carrada foi montado no carro.
3. Gran cantidade ou gran nmero [de algo que se expresa]. A onde vas con esa carrada de libros?
SIN. carrado, carretada. A carradas. En gran abundancia. Haba mazs a carradas.

Cando non existe un elemento semntico dominante, asgnase ao primeiro, e remtese desde o outro:
posesorio -a adx. Relativo ou pertencente posesin. A lei esixa o transcurso dun prazo posesorio de
dez anos. Xuzo posesorio. V. xuzo.

Pode darse o caso de que o elemento principal constitutivo da lexa


composta ou da locucin non gure como entrada do dicionario. Cando
isto ocorre dselle cabida como entrada lexa composta ou locucin. Por
exemplo, a voz cabaleirola non gura como entrada do dicionario, porque
non ten uso fra da locucin adverbial s cabaleirolas, e por iso gura esta
como entrada:
cabaleirolas, s loc. adv. Escarranchado sobre os ombreiros ou o lombo. O mis pequeno levbao o
pai s cabaleirolas. SIN. a cabalo, s cabalias, ao cabalete. CF. ao carrelo, ao lombo.

272

Manuel Gonzlez Gonzlez

4.2.5. As palabras non normativas


O DRAG debe ser e un dicionario normativo, que orienta sobre o uso
correcto do lxico do galego; por iso non deben gurar nel as voces non
normativas. Pero debe ser tamn un dicionario didctico, e que lle proporcione ao usuario a informacin que busca da maneira mis fcil posible.
Esta a razn que explica a presenza dalgunhas voces non normativas,
pero que teen certa vitalidade no uso. Dentro das voces non normativas,
distnguense dous casos:
(a) O das formas das que non hai dbida de que son galegas, pero que
estn marcadas cun forte carcter dialectal. Neste caso, despois da entrada, remtese para a forma mis recomendable, precedida do smbolo :
zarrar v.t., i. e p.
zarreta s.f.

cerrar.

cerreta.

zarrote s.m.

cerrote.

zarrulo s.m.

cerrulo.

zarrume s.m.

cerrume

zarcear v.i.

zarzallar.

zarcelo s.m.

sarcelo.

(b) O das formas que son incorrectas en galego, que van marcadas cun
asterisco, e desde as cales se remite para a forma normativa galega:
*almidn s.m. amidn.

5. a microestrutura
Que contn e como se organiza un artigo lexicogrco no DRAG? O
DRAG ofrece informacin sobre a forma grca do lema; informacin
gramatical; informacin sobre a pronunciacin (s nos casos conitivos);
informacin diastrtica e diafsica; informacin tecnolectal; informacin
sobre o carcter da acepcin (g., por ext.); a denicin de cada acepcin;
observacins referidas acepcin; exemplos; sinnimos, antnimos e palabras prximas semanticamente; unidades pluriverbais nas que ocupa
un lugar central a entrada, e observacins referidas ao enunciado.

O novo Dicionario da Real Academia Galega

273

5.1. O lema
O lema a forma non marcada: a do masculino singular, no caso dos
substantivos e adxectivos; e a do innitivo, no caso dos verbos. Encabeza
sempre o artigo, e encabeza o pargrafo que contn este. Aparece sempre marcado tipogracamente dunha maneira que se faga mis visible
e que destaque sobre o resto da informacin, para xebrar con claridade a
informacin pertencente a un artigo da dos contiguos, e sobre todo, dado
que os artigos estn dispostos segundo a orde alfabtica dos lemas que
lle serven de entrada, para facilitarlle a busca ao usuario. No DRAG o lema
aparece marcado tipogracamente en letra grosa.

5.2. Informacin gramatical


A informacin gramatical, deixando parte a informacin implcita no sistema de denicin de cada acepcin, ofrcese por distintos
procedementos:
(a) Un deles, sistemtico, proporciona para cada lema informacin sobre a categora gramatical, xnero, nmero, rxime verbal, etc. Esta informacin precede a denicin de cada acepcin, e vai sempre en caracteres
itlicos, como se pode ver nos exemplos seguintes:
fachuzo s.m. Presa de palla atada que se acende para alumar. Levaban os fachuzos por se os colla
a noite no camio. SIN. facha1, fachico, facho, fachn, fachuco, palluzo.
azougar v.t. 1. Cubrir con azougue. Azougan o vidro pola sa cara posterior para convertelo en espello.
// v.p. 2. Med. Contraer unha doenza caracterizada por un tremor continuo, causada pola
absorcin de vapores de azougue. Moitos mineiros azougbanse e morran. 3. fig. Mostrarse moi
inquieto e axitado ou estar en continuo movemento. Polas noites azougbase no leito por mor dos
pesadelos.

(b) Informacin sobre a formacin de femininos e plurais irregulares,


que se ofrece entre parnteses, despois da categora gramatical:
anorak s.m. (pl. anoraks) Chaqueta impermeable con carapucha, que se usa para protexer do
fro e da chuvia. Un anorak de plumas.

(c) Informacin gramatical complementaria, que vai introducida polo


sinalizador OBS., onde poden encontrarse observacins de carcter gramatical de carcter moi variado: irregularidades na conxugacin verbal,
rexencias verbais, obrigatoriedade do uso do artigo, etc.

274

Manuel Gonzlez Gonzlez

- Informacin sobre as irregularidades verbais:


fuxir v.i. 1. Afastarse rapidamente de algo ou algun, polo xeral para evitar unha ameaza ou
perigo. Nos tempos da guerra moitos fuxan para o monte. Os lobos foxen do lume. 2. Sar dun lugar
onde se est preso por medios ilcitos. Onte noite fuxiron varios presos. SIN. escapar. CF.
evadirse. OBS. Verbo con alternancia voclica no pres. indic.: fuxo, foxes, foxe, fuximos,
fuxides, foxen.

- Informacin sintagmtica: obrigatoriedade de uso de artigo,


rexencias verbais...:
ambos .as indef. Un e mais o outro, os dous. Hai s das solucins, ambas con poucas probabilidades
de xito. OBS. Cando vai modificando un substantivo, vai acompaado do artigo e pdese
utilizar contrado coa segunda forma, dando como resultado as formas mbolos e mbalas.
Ambas as partes estaban de acordo. mbalas partes estaban de acordo. Ambos a dous. Os dous.
Ambos a dous candidatos teen as mesmas posibilidades. SIN. ambos os dous. / Ambos os dous.
Ambos a dous. Ambos os dous merecan ganar.
tirar v.t. 14. Botar por terra [algo], facer caer ao chan. O temporal tirou o valado da horta. OBS.
Emprgase tamn seguido da preposicin con. Tirou con el do cabalo embaixo.

(d) s veces a informacin sintagmtica sobre rexencia de certas preposicins vai indicada entre parnteses a continuacin da entrada e co
mesmo tipo de letra da entrada:
carecente (de) adx. Que ten ou amosa algunha carencia. Carecente de estmulos e ilusins e
invadida pola nostalxia decidiu regresar sa vila natal. SIN. carecedor, carente.

5.3. Informacin fontica


No DRAG non se ofrece a transcricin fontica de cada lema, pero si se
proporciona informacin fontica sobre aqueles aspectos que poden ofrecer dicultade: a realizacin do timbre das vogais tnicas de grao medio
e, o (especialmente cando existen voces homgrafas que se distinguen
unicamente polo timbre destas vogais), a pronunciacin de grafemas que
poden representar realidades fonolxicas distintas, a pronunciacin de
estanxeirismos:
(a) Informacin sobre o timbre da vogal tnica cando necesario:
pega [] s.f. 1. Pau ou corda que se lles pon s vacas, cabalos, etc. para que non fuxan
cando estn ceibos. Pxolle unha pga ao cabalo mentres paca. SIN. cadarme, pexa, piega, solta, soltadoiro, traba. 2. fig. Cousa que impide o desenvolvemento normal ou a realizacin

O novo Dicionario da Real Academia Galega

275

dunha accin. Non puxo ningunha pga polo cambio de da. SIN. dificultade, impedimento,
inconveniente, obstculo, pexa, traba.

(b) Pronunciacin do grafema x:


anorexia [ks] s.f. Med. Diminucin ou perda do apetito. Pesa soamente trinta quilos porque sofre
anorexia. CF. inapetencia. Anorexia nerviosa. Psiq. Sndrome caracterizada pola reducin voluntaria e extrema da alimentacin acompaada de vmitos, que orixina adelgazamento e outras alteracins. A anorexia nerviosa mis habitual en mulleres novas.

(c) Transcricin de estranxeirismos:


jeep [] s.m.(pl. jeeps) Coche pequeno de orixe americana capaz de andar por terreos
difciles, orixinariamente utilizado polo exrcito. Alugamos un jeep para ir polo monte.

5.4. Informacin diastrtica, diafsica e diacrnica


Dentro de calquera lingua existen variedades propias de distintos estratos sociais, de distintos rexistros, e mesmo usos que son considerados
xa anticuados. Isto ocorre no plano fontico e no morfosintctico, pero
especialmente visible no lxico. Por iso, con frecuencia, hai certas entradas ou determinadas acepcins do dicionario que van marcadas con
etiquetas como: mis culto, menos culto, fam., pop, ant., etc.:
amolar v.p. 3. Sufrir molestia ou fasto. Que se amole e o faga anda que non lle guste! SIN. amocar(se),
enfastiar(se), foder(se) (vulg.).
ampola s.f. 1. Lesin cutnea producida por un levantamento da epiderme, que contn un lquido
seroso. Os zapatos fixronlle ampolas. SIN. bocha, bchega, boza1, flictena (mis culto), vexiga,
vincha, vinchoca.

5.5. Informacin tecnolectal


Tamn se ofrece informacin tecnolectal, na que se indica a lingua de
especialidade que pertence unha determinada voz ou unha acepcin
concreta desa voz. Esta informacin transmtese por medio de etiquetas,
tales como Zool., Bot., Biol...., que van situadas en letra itlica inmediatamente antes da denicin da acepcin.
ampere s.m. Fs. Unidade de intensidade de corrente elctrica do sistema internacional. O seu
smbolo A.
amperio. Un limitador de 15 amperes.
anacruse s.f. 1. Lit. Na mtrica clsica, slaba que est diante da que inicia o primeiro p completo.
Na mtrica grecolatina considrase que a slaba en anacruse non forma parte do metro. 2. Lit. Na mtrica mo-

276

Manuel Gonzlez Gonzlez


derna, slaba ou slabas tonas que preceden o primeiro acento dun verso. Un verso con das slabas
en anacruse. 3. Ms. Nota ou grupo de notas dunha meloda que preceden o primeiro tempo forte.
Unha meloda que comeza en anacruse.

5.6. Informacin sobre a natureza da acepcin (ext., g.)


anaerobio -a adx. 1. Biol. [Organismo] que capaz de vivir sen a presenza de osxeno no aire.
Bacteria anaerobia. 2. Propio dos microorganismos anaerobios. Respiracin anaerobia. 3. ext. [Motor,
propulsor] que pode funcionar sen aire. Os propulsores anaerobios funcionan fra da atmosfera. // s.m. 4.
Biol. Microorganismo anaerobio. Unha infeccin producida por anaerobios. O xerme que produce o botulismo
un anaerobio. ANT. aerobio.
anatematizar v.t. 1. Pronunciar ou lanzar un anatema unha autoridade eclesistica contra [algun]. Anatematizrono por herexe. CF. excomungar. 2. fig. Reprobar enerxicamente ou condenar
moralmente. Anatematizou a sa ideoloxa e comportamento.
carburar v.i. 3. fig. e pop. Funcionar. A televisin non carbura, non sei qu lle pasa. 4. fig. e pop. Razoar.
Ti non carburas.

5.7. A denicin
5.7.1. Que a denicin?
A denicin consiste en facer corresponder unha unidade lxica,
descoecida ou mal coecida, cunha serie de unidades pertencentes ao
mesmo sistema lingstico, organizadas segundo as estruturas sintagmticas deste sistema, e que sexa capaz de remitir ao mesmo signicado
e de determinar no usuario do dicionario a elaboracin conceptual deste
signicado.
5.7.1.1. Denicins propias / denicins impropias
xa clsica a distincin entre denicins propias e denicins impropias, anda que en realidade estas ltimas non son verdadeiras denicins.
As denicins impropias estn formuladas en metalingua de signo, e
non se deixan someter lei da sinonimia. Non son verdadeiras denicins (qu signica a palabra), senn explicacins (cmo e para qu se
emprega a palabra). As palabras s que se aplica este tipo de denicin
interxeccins e palabras gramaticais (preposicins, conxuncins, pronomes, artigos e certos adverbios, adxectivos e verbos) son realmente
indenibles:

O novo Dicionario da Real Academia Galega

277

lle, lles pron. pers. Formas tonas de terceira persoa singular e plural respectivamente, en funcin
de complemento indirecto. Fxenlles pedir perdn. Non lles soubo contestar. OBS. lle e lles contraen cos
pronomes persoais o, a, os, as e lo, la, los, las dando lugar s formas llo, lla, llos, llas e llelo, llela, llelos,
llelas, respectivamente.

As denicins propias son as verdadeiras denicins lexicogrcas,


estn formuladas en metalingua de contido e nelas rexe o principio de
substituibilidade entre denido e denidor (son as denicins que corresponden a todos os nomes e inmensa maiora dos adxectivos, verbos
e adverbios).
A lexicloga e lexicgrafa J. Rey-Debove (1967), nunha das clasicacins mis aceptadas das denicins propias, distingue entre denicin
substancial e denicin relacional. Na denicin substancial a anlise
smica incide na substancia do denido. A denicin relacional incide na
relacin do denido con outra palabra do enunciado.
5.7.1.1.1. A denicin substancial
Hai un caso, que podemos considerar atpico, de denicin substancial: o dos enunciados denitorios ordinarios, sistema seguido por
exemplo no Cobuild. un tipo especial de denicin que, basendose en
situacins comunicativas, exhibe unha serie de notas que permiten ao
usuario do dicionario identicar a palabra cun signicado determinado.
Seran denicins do tipo:
chover: cando cae auga e imos co paraugas aberto, dicimos que chove.
preservar: se preservas algunha cousa, tomas medidas para conservala ou protexela para que non
se estrague, non se perda ou non a rouben.

Este tipo de informacin til cando se trata de palabras referidas


esfera da vida da que o usuario ten experiencia, pero resulta pouco prctica ou inservible cando se rere a conceptos sobre os que o usuario non
ten experiencia.
No DRAG seguimos outro tipo de denicin substancial, mis coecido e mis utilizado na tradicin lexicogrca, que se basea na anlise
tradicional aristotlica do concepto do denido polo xnero prximo e
a diferenza especca. O xnero prximo denomnase inclunte. Corresponde co que Ignacio Bosque (1982) denomina denicin hiperonmica.
A denicin substancial unha resposta directa pregunta: Que o
denido? Esta resposta presntase conceptualmente baixo tres formas:

278

Manuel Gonzlez Gonzlez

(a) o denido tal cousa


(b) o denido non tal cousa
(c) o denido o contrario ou a ausencia de tal cousa.
As tres formas de denicin conceptual aparecen no noso dicionario.
Por iso, anda que sexa brevemente, imos ver algunha das caractersticas
da inclusin, da exclusin e da inclusin negativa.
a) A inclusin
O inclunte a expresin do concepto clasicador, e pertence mesma
categora gramatical ca o denido. Semanticamente, todo o semema do
inclunte est contido no denido, como por exemplo cabaleiro = home
a cabalo.
A maiora das definicins do DRAG presentan unha relacin de
inclusin:
la2 s.f. 1. Pelo da ovella ou do carneiro. Raparlles a la s ovellas. 2. ext. Pelo dalgn outro animal,
semellante la. A la dos camelos. 3. Fo de la. Mercamos unhas madeixas de la para facerlle unha mantia ao
beb. 4. Tecido de la. Un xersei de la. Un colchn de la. Un abrigo de la. Baraza de la. V. baraza.
lacar v.t. Cubrir con laca [un moble ou outro obxecto]. Ela mesma lacou os mobles do saln.

b) A exclusin
O procedemento da exclusin consiste en denir unha palabra negando o seu oposto (por exemplo, abandonar = non continuar). Neste
caso non se trata dun estudo interno do semema do denido, senn dun
estudo externo que supn a existencia e o coecemento de parellas de
contrarios. Isto o que atopamos en denicins como as seguintes:
abandonar v.t.. 3. Non continuar con [algo]. Abandonaron os seus plans de ataque. Os guerrilleiros
abandonaron a loita. // v.p. 4. Non coidar de si. Dun tempo para ac abandonouse de tal xeito que parece
un farrapeiro. SIN. desleixarse.
lizquente adx. Nin fro nin quente. Non me gusta o leite lizquente, quroo fervendo. SIN. morno,
temperado, tpedo.
amuar v.i. 4. Non responder ao que preguntan, baixando a cabeza. Por mis que lle preguntaban, non
conseguan nada, ela amuaba.

c) A inclusin negativa
Neste tipo de denicin existe un inclunte que serve para negar o exclunte. Trtase, pois, dunha negacin semntica, non dunha negacin
sintctica. o que aparece en:

O novo Dicionario da Real Academia Galega

279

impericia s.f. Falta de pericia. A impericia da tripulacin provocou o afundimento do barco. ANT. destreza, pericia. CF. inhabilidade.
avitaminose s.f. Med. Carencia ou deficiencia de vitaminas, que pode causar enfermidades. O escorbuto
unha das numerosas enfermidades provocadas por avitaminose.

5.7.1.1.2. A denicin relacional


A denicin relacional non enva s substancia do denido, senn
relacin entre o denido cualicador e outra palabra cualicada. S concerne ao adxectivo e ao adverbio.
Para o adxectivo esta relacin exprsase:
(a) por un relativo:
anoxadizo a adx. Que se anoxa facilmente. che moi anoxadizo pero axia lle pasa. SIN. asaadizo.

(b) ou por unha preposicin:


anfractuoso -a adx. Con moitas irregularidades. Relevo anfractuoso.

Para o adverbio exprsase sempre por unha preposicin:


atentamente adv. 1. Con atencin ou cortesa. Observaba atentamente os costumes dos habitantes da
zona.

5.7.1.2. O principio de substituibilidade e a separacin do ncleo e o


contorno
Nas denicins do DRAG procurouse aplicar o principio de substituibilidade. Se o enunciado denidor pode substitur o termo denido nun
enunciado de fala sen que se altere o sentido obxectivo deste, o enunciado denidor ser vlido. Isto implica que entre denido e deniente debe
existir unha identidade categorial.
O principio de substituibilidade obrigou separacin do ncleo da
denicin do seu contorno. O contorno vai marcado entre corchetes, tal
como pode verse nos seguintes artigos do DRAG:
anaerobio -a adx. 1. Biol. [Organismo] que capaz de vivir sen a presenza de osxeno no aire.
Bacteria anaerobia. 2. Propio dos microorganismos anaerobios. Respiracin anaerobia. 3. ext. [Motor,

280

Manuel Gonzlez Gonzlez


propulsor] que pode funcionar sen aire. Os propulsores anaerobios funcionan fra da atmosfera. ANT.
aerobio.
ampolar v.t. 1. Producir unha ou mis ampolas en [unha parte do corpo]. Os zapatos novos ampolronlle os ps. // v.p. 2. [Parte do corpo] sufrir a formacin dunha ou mis ampolas. Ampolronseme
as mans de tanto traballar.
anatematizar v.t. 1. Pronunciar ou lanzar un anatema unha autoridade eclesistica contra [algun]. Anatematizrono por herexe. CF. excomungar. 2. fig. Reprobar enerxicamente ou condenar
moralmente. Anatematizou a sa ideoloxa e comportamento.

5.8. A ordenacin das acepcins


Existen tres criterios principais de ordenacin das acepcins:
(a) lxico: unha acepcin debe anteceder a outra que deriva dela;
(b) histrico: a orde das acepcins segue a orde de documentacin
histrica;
(c) frecuencia: as acepcins deben ordenarse por frecuencia de uso.
No DRAG procurouse combinar a frecuencia de uso coa ordenacin
lxica, pero estes criterios sempre se subordinan clasicacin por categora gramatical, tal como se pode observar nos seguintes exemplos:
amarelo -a adx. 1. Que ten a cor entre verde e laranxa, coma a do ouro, o limn maduro, etc. Mercou
unha camisa amarela. Aos actores supersticiosos non lles gusta a cor amarela. 2. [persoa] Falto de cor. Atopeino
amarelo, apoucado, fraco..., debe estar enfermo. SIN. esbrancuxado, plido. // s.m. 3. A cor amarela. Pintaron o cuarto de amarelo. Febre amarela. V. febre. / Raza amarela. V. raza. SIN. marelo.
amolar v.t. 1. Causar molestia ou fasto. Amlame ter que levantarme todos os das s sete. SIN. amargar,
molestar. Que perdeu o Celta, dis?, non me amoles! 2. Facer fo a [unha ferramenta]. Amolou os foucios
na moa. SIN. afiar, aguzar. // v.p. 3. Sufrir molestia ou fasto. Que se amole e o faga anda que non lle
guste! SIN. amocar(se), enfastiar(se), foder(se) (vulg.).

5.9 Os exemplos
Todas as acepcins levan un ou varios exemplos, que contriban a:
(a) aclarar mis o signicado, ofrecendo trazos do signicado que non
son substanciais, pero si habituais;

O novo Dicionario da Real Academia Galega

281

(b) ilustrar sobre o uso;


(c) ver o comportamento sintagmtico, e ofrecer as colocacins mis
frecuentes;
(d) dar a coecer aspectos da cultura propia, tal como se pode observar
por exemplo en:
trasgar v.t. Colocarlle a trasga a [un animal]. Antes de muxir a vaca trsgaa para que non te manque.
noitevella s.f. Noite do trinta e un de decembro ao un de xaneiro. En noitevella moita xente sae despois
de cear para celebrar a entrada do ano novo. SIN. fin de ano.

5.10. A rede de relacins lxicas


Cada acepcin vai seguida dos sinnimos, antnimos e voces de sentido prximo, por esta orde. Os sinnimos van precedidos polo marcador
SIN., os antnimos por ANT., e as voces de sentido prximo por CF.
atoar v.t. 1. Cerrar [un conduto] nalgn punto e impedir ou dificultar o paso dun fludo. O po atoou
o tubo do gas. SIN. atascar, atrancar, obstrur, trancar. ANT. desatascar, desatoar. CF. cangar,
tapar. 2. Cubrir de terra ou doutra cousa semellante. Atoou as brasas para que non prendesen lume. //
v.p. 3. [Un conduto] quedar parcial ou totalmente cerrado por acumularse unha materia no seu
interior. Atoouse a canle da auga. SIN. atascarse, atrancarse, obstrurse, trancarse. ANT. desatascarse, desatoarse, desatrancarse. 4. Quedar cuberto de terra ou doutra cousa semellante.
Atoouse ata os xeonllos na neve. SIN. atur(se). ANT. desatur(se).

Como pode observarse tamn no exemplo anterior, cando un sinnimo ou antnimo o de todas as acepcins, vai ao nal de todo, precedido
do smbolo .

5.11. As unidades pluriverbais


As unidades pluriverbais (locucins e todo tipo de fraseoloxismos)
van ao nal do artigo, despois das acepcins, ordenadas alfabeticamente,
co signicado e exemplo. Van precedidas do smbolo :
pau s.m. 1. Calquera anaco de madeira longo e delgado. Cun pau e unha xesta fixo unha vasoira. Pau da
luz. Pau do telfono. 2. Mar. Poste de madeira ou de ferro, colocado en posicin vertical nun barco, que
sostn as velas e, nas embarcacins modernas, as antenas de radio, os focos, etc. O forte vento rompeu o
pau do veleiro. SIN. mastro. 3. Materia compacta e dura que est debaixo da casca das rbores e doutras
plantas. Uns zocos con sola de pau. SIN. madeira1. 4. Cada unha das series de naipes que ten a baralla.
Os paus da baralla son: ouros, copas, espadas e bastos. 5. Dep. Instrumento con que se golpea a pelota en
determinados deportes, como o golf, o bisbol, etc. Xogaba ao golf cuns paus de seu av. 6. Golpe dado
cun pau ou con outro obxecto semellante. Como non cales, vas levar un pau. Ti o que ests buscando son uns

282

Manuel Gonzlez Gonzlez


paus. 7. col. Desgraza ou suceso adverso. Para a familia foi un pau que a filla tivese que abandonar o pas. 8.
Trazo vertical ou case vertical, na escritura. Comezan por facer uns paus. O pau do d. 9. Herld. Peza que
se coloca verticalmente na metade do escudo e que, cando unha soa, ocupa a terceira parte deste.
Destacaba a cor vermella do pau do escudo. A darlle cun pau. En abundancia. Haba peixe a darlle cun
pau. / A paus. De maneira violenta. Remataron a discusin a paus. / Arado de pau. V. arado. /
Culler de pau. V. culler. / Dar paus de cego. Facer algo de maneira irreflexiva e sen saber se se vai
obter algn resultado. Vai pola vida dando paus de cego. / Pata de pau. V. pata. / Pau brasil. V. brasil2.
/ Pau de ferro. Pauferro. Fixeron un buraco na terra co pau de ferro para chantar as estacas. / Pau de San
Gregorio. Arbusto ou rbore de pequeno tamao da familia das rosceas (Prunus padus), de tronco
delgado, follas ovais, oblongas e lixeiramente dentadas, flores brancas moi aromticas reunidas en
acios e froito en drupa. O pau de San Gregorio cultvase como planta ornamental. / Pau maior. Mar. Pau
mis alto dunha embarcacin e que sostn a vela principal. O pau maior paralelo ao trinquete. / Peixe
pau. V. peixe. / Teso coma un pau. Cheo de arrogancia. Nin mirou para min, a teso coma un pau.

6. respecto aos dereitos


Hai un aspecto non sucientemente traballado nos dicionarios, e particularmente nos dicionarios de institucins que teen entre os seus cometidos o de orientar sobre o uso correcto do idioma, ou que posen un
forte ascendente social por gozaren dun alto prestixio. En todos os dicionarios, pero especialmente nos destas institucins, ha de procurarse non
dar cabida s denicins lexicogrcas subxectivas, fomentar o respecto
polos dereitos humanos, respectar escrupulosamente todos os pobos e
culturas, e eliminar os elementos que impliquen manifestacin sexista,
directa ou indirecta. Ns procuramos camiar por este sendeiro, anda recoecendo que necesario seguir traballando para conseguir que o dicionario non s sexa un modelo de correccin lingstica, senn tamn, na
medida do posible, de correccin social, e que os principios democrticos
de respecto a todas as culturas e de igualdade entre todas as persoas se
vexan plasmados nidiamente no contido da obra.

7. tipografa, convencins, smbolos, abreviaturas, etc.


7.1. A tipografa
O coecemento da tipografa e convencins son fundamentais para
manexar o dicionario. A tipografa e as convencins son elementos
signicativos importantes que forman parte da metalingua das obras
lexicogrcas.
Respecto aos tipos de letra, a estrutura do dicionario totalmente rxida: a entrada vai sempre en letra grosa dun corpo lixeiramente maior ca

O novo Dicionario da Real Academia Galega

283

o resto da informacin includa no artigo lexicogrco, a categora en


cursiva, a denicin da acepcin en redonda, os exemplos en cursiva, as
locucins e fraseoloxismos en grosa; os sinnimos, antnimos e voces relacionadas, en grosa itlica; e as observacins van cunha letra de corpo
mis pequeno.

7.2. Smbolos e marcas tipogrcas


//

separa acepcins en que a entrada ten distinta categora


gramatical ou distinto xnero ou nmero;
/
separa as locucins, frases feitas, expresins, sintagmas,
etc.;
marca que a palabra que vn a continuacin se prere da
entrada, sen ser esta incorrecta;
marca que a palabra que vn a continuacin un sinnimo
ou unha variante da entrada, que non se recomenda pero
que se acepta;
*
marca as formas que se consideran incorrectas;

indica que a informacin que se ofrece a continuacin vlida para todas as acepcins da entrada;

introduce as locucins, frases feitas, expresins, etc.;


[]
marcan o contorno da denicin e a informacin fontica
do lema;
()
marcan rexencia de preposicin, nome cientco de animais e plantas, elementos opcionais da fraseoloxa;
1,2,3...
emprganse para diferenciar as entradas nas palabras homgrafas;
1,2,3... emprganse para separar acepcins.

7.3. Abreviaturas
Non necesario insistir na importancia que nunha obra como un dicionario ten a economa de espazo. Por iso, en poucas obras se fai un uso
tan profuso das abreviaturas. A maiora delas estn destinadas a facilitar
informacin sobre o uso, informacin gramatical, informacin tecnolectal e informacin sobre as redes lxicas. Velaqu as mis utilizadas no
DRAG para cada un destes grupos.

284

Manuel Gonzlez Gonzlez

7.3.1. Informacin de uso (diafsica, diastrtica, diacrnica)


ant.
col.
desus.
fam.
lit.
pex.
pop.
prop.
vulg.

anticuado ou antigo
coloquial
desusado
familiar
literario
pexorativo
popular
propio
vulgar

7.3.2. Informacin gramatical


abs.
adv.
adx.
art.
art. det.
art. indet.
contr.
conx.
dem.
exclam.
f.
fut.
fut. pret.
i.
imperat.
imperf.
indef.
indic.
inf.
inf. conxug.
interrog.
interx.
irreg.
loc.
loc. adv.
loc. adx.

absoluto (verbo)
adverbio
adxectivo
artigo
artigo determinado
artigo indeterminado
contraccin
conxuncin
demostrativo
exclamativo
feminino
futuro
futuro do pretrito
intransitivo
imperativo
imperfecto
indenido
indicativo
innitivo
innitivo conxugado
interrogativo
interxeccin
irregular
locucin
locucin adverbial
locucin adxectiva

O novo Dicionario da Real Academia Galega

loc. conx.
loc. lat.
loc. prep.
loc. s.
loc. s. lat.
m.
n.
num.
num. card.
num. ord.
p.
part.
perf.
pl.
plusc.
pos.
pref.
prep.
pres.
pret.
pron.
pron. pers.
rel.
s.
sing.
subx.
t.
v.
xer.

locucin conxuntiva
locucin latina
locucin preposicional
locucin substantiva
locucin substantiva latina
masculino
neutro
numeral
numeral cardinal
numeral ordinal
pronominal
participio
perfecto
plural
pluscuamperfecto
posesivo
prexo
preposicin
presente
pretrito
pronome
pronome persoal
relativo
substantivo
singular
subxuntivo
transitivo
verbo
xerundio

7.3.3. Tecnolectos
Aeron.
Agr.
Anat.
Antig.
Antrop.
Arqueol.
Arquit.
Art.

Aeronutica
Agricultura
Anatoma
Antigidade clsica
Antropoloxa
Arqueoloxa
Arquitectura
Arte

285

286

Manuel Gonzlez Gonzlez

Astrol.
Astron.
Bibliol.
Biol.
Bioqum.
Bot.
Catol.
Cinem.
Cir.
Dep.
Der.
Econ.
Electr.
Electrn.
Enxe.
Farm.
Filos.
Fs.
Fon.
Fot.
Gram.
Herld.
Hist.
Impr.
Inform.
Ling.
Lit.
Mar.
Mat.
Mec.
Med.
Metal.
Meteor.
Mtr.
Micol.
Mil.
Miner.
Mit.
Ms.
pt.

Astroloxa
Astronoma
Bliblioloxa
Bioloxa
Bioqumica
Botnica
Catolicismo
Cinematografa
Cirurxa
Deportes
Dereito
Economa
Electricidade
Electrnica
Enxeera
Farmacia
Filosofa
Fsica
Fontica e Fonoloxa
Fotografa
Gramtica
Herldica
Historia
Imprenta
Informtica
Lingstica
Literatura
Martimo
Matemticas
Mecnica
Medicina
Metalurxia
Meteoroloxa
Mtrica
Micoloxa
Milicia
Mineraloxa
Mitoloxa
Msica
ptica

O novo Dicionario da Real Academia Galega

Paleogr.
Petrogr.
Pint.
Pol.
Psic.
Psiq.
Qum.
Radiod.
Relix.
Ret.
Silv.
Sociol.
Taurom.
Telecom.
Teol.
Tip.
Top.
Vet.
Xent.
Xeogr.
Xeol.
Xeom.
Zool.

Paleografa
Petrografa
Pintura
Poltica
Psicoloxa
Psiquiatra
Qumica
Radiodifusin
Relixin
Retrica
Silvicultura
Socioloxa
Tauromaquia
Telecomunicacins
Teoloxa
Tipografa
Topografa
Veterinaria
Xentica
Xeografa
Xeoloxa
Xeometra
Zooloxa

7.3.4. Rede lxica


ANT.
CF.
SIN.

antnimo
comprese
sinnimo

7.3.5. Outras
ac.
a. C.
d. C.
ex.
ext.
obs.
sc.
V.

acepcin
antes de Cristo
despois de Cristo
exemplo
extensin
observacin
sculo
vxase

287

288

289

LA ACTIVIDAD LEXICOGRFICA DEL INSTITUT


DESTUDIS CATALANS. PASADO, PRESENTE Y FUTURO
Joaquim Rafel i Fontanals

Universitat de Barcelona / Institut d Estudis Catalans

Comenzar diciendo, para aquellos que no conozcan bien la naturaleza de esta institucin, que el Institut dEstudis Catalans es una corporacin acadmica, cientca y cultural que tiene por objeto la alta investigacin cientca, principalmente la de todos los aspectos de la cultura
catalana. Fue creado en 1907 por un acuerdo de la Diputacin Provincial
de Barcelona, ms tarde bajo la tutela de la Mancomunitat de Catalunya, y, despus de un primer perodo oreciente y de una existencia agitada a merced de los avatares por los que ha pasado el pas durante el
segundo y tercer cuarto del siglo XX, actualmente su situacin legal se
basa en un Real Decreto del ao 1976. De acuerdo con los estatutos vigentes sus nalidades son:
(a) ocuparse del estudio de la lengua catalana, establecer su normativa y velar para que su proceso de normalizacin sea coherente en todo su
mbito lingstico;
(b) contribuir a la planicacin, la coordinacin, la realizacin y la
difusin de la investigacin en las distintas reas de la ciencia y de la
tecnologa, y
(c) impulsar con las actividades que le son propias el progreso y el desarrollo de la sociedad y realizar, cuando corresponda, trabajos de asesoramiento de los poderes pblicos y otras instituciones.
La corporacin se halla estructurada en cinco secciones temticas: la
Histrico-Arqueolgica, la de Ciencias Biolgicas, la de Ciencias y Tecnologa, la Filolgica y la de Filosofa y Ciencias Sociales. La funcin normativa con relacin a la lengua es competencia del conjunto de la institucin,
pero tanto esta funcin especca como el resto de trabajos relacionados
con la lengua conciernen especialmente a su Seccin Filolgica.

290

Joaquim Rafel i Fontanals

La idea del diccionario est vinculada a la Seccin Filolgica desde antes de su creacin; en la memoria presentada a la Diputacin de Barcelona para promover la ampliacin del Institut dEstudis Catalans con dos
nuevas secciones, Enric Prat de la Riba menciona el diccionario como la
misin de la propuesta Seccin Filolgica, a la cual denomina tambin
Academia de la Lengua Catalana:
Perx, al costat de la secci histrich-arqueolgica ja existent y de la secci de ciencies, haura de
constituirse la secci filolgica, s a dir, lAcademia de la Llengua Catalana. Els catalans que han
fet de lestudi daquesta llengua el centre de totes les seves activitats, suniren als poetes y prosadors que ab la seva producci literaria lhan refeta y salvada. La seva missi sera fer el diccionari
de la nostra llengua, magna empresa en que trobaren la col-laboraci entusiasta, amorosa, de
tots els catalans, pera inventariar la llengua; de les altres seccions de lInstitut pera definicions,
descripcions, historia de mots, gravats, etz. (Prat de la Riba 1910: 46).

Por otra parte, en el acuerdo de ampliacin del Institut se menciona


explcitamente la elaboracin del diccionario como uno de los cometidos
de la nueva seccin:
La missi de la Secci Filolgica o institut filolgic, ser estudiar cientficament la nostra llengua,
inventariar el seu lxic, fer-nel diccionari y fomentar el seu s y imperi dins y fra de la nostra
terra (IEC 1911: 26).

Observemos que la misin encargada a la Seccin Filolgica no se limita sin embargo a la confeccin del diccionario de la lengua, sino que se
extiende tambin a su estudio cientco y a aspectos de carcter social,
con lo cual esta institucin queda congurada no como una academia
que tiene estrictamente como objetivo jar un modelo de lengua, sino
que tambin le son encargados el estudio de la lengua y el fomento del
uso lingstico.
Cmo ha llevado a cabo la Seccin Filolgica del Institut dEstudis
Catalans esta misin, especialmente en el aspecto lexicogrco, que es el
que nos interesa ahora? La actividad del Institut dEstudis Catalans en sus
distintos campos de actuacin ha estado fuertemente condicionada a lo
largo de su historia por diversos factores de naturaleza muy distinta, unos
de orden externo y otros de orden interno. Con la denominacin genrica
de factores de orden externo me reero a la situacin poltica y social a
lo largo del siglo XX, que, llegando al extremo de reducir la institucin a
la clandestinidad durante una buena parte de su existencia, ha impedido
que cumpliera en el momento debido los principales objetivos para los
que fue creada. Con la denominacin de factores de orden interno me

La actividad lexicogrca del Institut dEstudis Catalans. Pasado, presente y futuro

291

reero a los inherentes a la mayor parte de las instituciones acadmicas, ligados a la dicultad para llegar a acuerdos sobre todo a causa de
las diferencias de criterios en algunas cuestiones fundamentales o para
planicar adecuadamente acciones coherentes y viables (Rafel 1996). La
combinacin de estos factores de naturaleza diversa permite distinguir
diferentes perodos, condicionados por los acontecimientos y caracterizados por la naturaleza de las actividades llevadas a cabo.
Un breve perodo inicial, que podemos establecer entre 1911 y 1918, se
caracteriza por una actividad importante en el seno de la Seccin Filolgica. Sabemos, sobre todo a travs de las notas que Antoni M. Alcover publicaba en el Butllet del Diccionari de la Llengua Catalana, que en las primeras reuniones de esta institucin se discutieron los planes de actuacin
para alcanzar los objetivos jados. Podemos deducir que las discusiones
se centraron en el modelo de diccionario que haca falta y, en denitiva,
en el modelo de lengua que haba de ser objeto de las deliberaciones y de
la labor de la Seccin. El resultado fue que, a parte de trazar un plan de publicaciones diversas, la Seccin acord adoptar el proyecto de diccionario
que Alcover haba promovido desde 1901, que menciona como nuestro
diccionario y el Diccionario gordo de nuestra lengua, y al mismo tiempo acuerda la publicacin de un diccionario cataln provisional, basado
en la lengua escrita, dando escasa cabida a las variantes dialectales, el
cual haba de reejar las palabras ms obvias y corrientes de la lengua
literaria; segn Alcover, la direccin de este ltimo diccionario haba sido
encargada a l mismo y a Pompeu Fabra. El texto publicado por Alcover
contiene varios elementos que creo que son realmente signicativos para
comprender la problemtica que nos ocupa:
Tamb acord la Secci Filolgica publicar un Diccionari catal provisional, propiament del llenguatge
escrit, sense aficarse gayre dins les variedats i opulencia lexica dels diferents dialectes catalans, tant
vitencs, gracies a Deu, a Catalunya espanyola i a Catalunya francesa, a les Balears i an el Reyne
de Valencia, aix es, un Diccionari aont sincloguen gran part dels mots que surten per tot arreu
dins els autors i dems monuments escrits antics i moderns i que nos troben desgraciadament
dins cap dels Diccionaris catalans actuals. Naturalment aix no ha desser el nostre Diccionari que
tantes vegades hem proms, que fa tants danys quel preparam, quens costa tants i tants i tants
de sacrificis, per el qual ens han enviades miles i miles de cdules quumplen tants de calaixos de
la nostra Calaixera. El Diccionari aix com el bosquetjrem dins la Lletra de convit, aix com hem dit
tantes de vegades que seria, aix com el somiam des de lany 1901, ha desser lobra-capital de la
Secci Filolgica; an aqueixa obra estem abocats nosaltres i una partida damics fa tants danys,
i hi seguirem abocats i shi abocarn tots els elements de la Secci Filolgica i tots els que dita
Secci puga moure i desxondir per tot arreu. Per aqueixa obra envirem lany 1908 a Alemanya els
tres pensionats de la Diputaci, En Griera, En Montoliu i En Barnils, que ja han fets an aquelles
Universidats els estudis filolgics queren del cas, i ara se posaran a la tasca cent voltes gloriosa del
Diccionari gros de la nostra llengua, aont sha daplegar tota la llengua catalana, lantiga, la moderna,

292

Joaquim Rafel i Fontanals


lescrita i la vivent, les formes literries i totes quantes formes dialectals se balluguin i poguem
aglapir en tot Catalunya dEspanya i de Frana, en tot el Reyne de Valencia, en totes les Balears,
fins a Alguer de Sardenya. Pero com per enllestir tal Diccionari se necessitarn molts danys, i no
es cosa destarmos sense un que duga almenys lo ms obvi i corrent de la llengua literaria, per
aix la Secci Filolgica acord dins el juliol fer tal Diccionari catal provisional, encarregantsen
principalment En Pompeu Fabra i Mn. Alcover (Alcover 1911: 369-370).

En estas decisiones hemos de ver probablemente una solucin de


compromiso, un intento de dar satisfaccin a dos posiciones distintas representadas respectivamente por Alcover (diccionario que recoja las ms
diversas variantes de las palabras de la lengua) y por Fabra (diccionario de
la unicacin y de la puricacin de la lengua).
A parte de estos dos proyectos, en el momento inicial la Seccin Filolgica trabaja tambin en la preparacin y edicin del inventario lexicogrco de Mari Aguil, que el Institut haba adquirido ltimamente. Aguil
(1825-1897) fue un poeta, llogo y bibliotecario que recopil a lo largo de
su vida un extenso repertorio de citas de textos medievales. La publicacin de este repertorio, con el nombre de Diccionari Aguil, se lleva a cabo,
a cargo de Pompeu Fabra y de Manuel de Montoliu, en ocho volmenes,
entre 1915 y 1934 (Aguil 1915-1934).
Sin embargo, la realizacin ms emblemtica de este perodo es el
Diccionari Ortogrc (Fabra 1917), que aparece el ao 1917 redactat sota
la direcci de Pompeu Fabra. La publicacin de esta obra es un hecho de
gran trascendencia; por una parte representa la consolidacin de las normas ortogrcas que haban sido aprobadas y proclamadas en 1913, puesto que al principio del libro se publica por primera vez su versin denitiva, tal como hoy las conocemos; por otra parte, representa la jacin de
la forma de las palabras consideradas ms necesarias para la expresin
corriente, puesto que responde a una clara voluntad normativa.
En 1918 se produce la ruptura de Antoni M. Alcover con el Institut.
Alcover regresa a Mallorca llevando consigo el proyecto de diccionario
comprensivo de toda la lengua, con los materiales recogidos hasta el momento, que aos ms tarde, entre 1926 y 1962, vern la luz de la mano de
Francesc de Borja Moll en los diez volmenes del Diccionari catal-valenci-balear (DCVB).
El perodo que va de 1918 a 1923 se caracteriza por una gran actividad
interna. Sabemos que durante estos aos se llevaba a cabo un vaciado de
textos antiguos que haba de ser la base de un Diccionari del catal antic.
El resto de trabajos se agrupan en torno a dos objetivos bien diferentes
que responden en cierta manera a los dos ideales contrapuestos a que
hemos hecho ya referencia. Por una parte, contina la recopilacin de da-

La actividad lexicogrca del Institut dEstudis Catalans. Pasado, presente y futuro

293

tos de la lengua viva iniciada en el perodo anterior; desde este punto de


vista, dicha actividad puede ser considerada como la continuacin de los
ideales de Alcover, como l mismo reconoce en una de las crnicas que
publicaba en el Butllet del Diccionari de la Llengua Catalana:
El pla dels Drs. Barnils i Griera, que era el mateix pla meu, per renovellat, era com el meu, diametralment contrari an el Diccionari que aquells Caporals volen, lo Diccionari exclusivament barcelon,
de la llengua xinxoram de Barcelona, lo tema suprem i intangible dEn Fabra, que lha batejada ab
lo pedantssim i falsssim nom de Catal Normal o Llengua Literria (Alcover 1920: 165).

Por otra parte, se inician los trabajos de redaccin de un diccionario de


carcter normativo, dirigido por Pompeu Fabra, que se convierte en la labor
primordial de la Seccin Filolgica de estos aos durante una buena parte
de sus sesiones. Este diccionario fue designado con diversos nombres, entre
los cuales el que se us con ms frecuencia es el de Diccionari de la llengua
literria. No lleg a ultimarse, pero estuvo a punto de iniciarse su publicacin: se han conservado unas pruebas de los dos primeros pliegos impresos
(hasta la palabra alabarda), y las galeradas corregidas correspondientes a
dos pliegos ms (hasta la palabra aquedar-se) (Rafel 1996: 230 n. 36).
En sntesis, por la informacin que poseemos de esta poca, parece
que los trabajos lexicogrcos del Institut constituan un programa organizado que utiliz el nombre de Diccionari general de la llengua catalana
para englobar diversas actividades destinadas a dar lugar a tres diccionarios distintos: el Diccionari del catal antic, el Tresor de la llengua catalana
o Diccionari dels dialectes y el Diccionari de la llengua literria, de carcter
normativo.
En 1923, el advenimiento del directorio militar que dio lugar a la dictadura de Primo de Rivera altera profundamente el plan de trabajo establecido en el perodo anterior. Ignorado ocialmente el Institut y sin
subvenciones, algunos de sus proyectos son asumidos por la Diputacin
de Barcelona, en un Servicio de Investigaciones Filolgicas creado por dicha institucin, y algunas publicaciones pasan al mecenazgo privado; los
trabajos que continan bajo la nueva organizacin ocial son sobre todo
los correspondientes al Diccionari dels dialectes catalans y al Atlas lingstic de Catalunya, controlados por A. Griera.
Al margen de la organizacin ocial promovida por el nuevo poder
poltico, Pompeu Fabra inicia personalmente la redaccin de un nuevo
diccionario, siguiendo de cerca la parte redactada del Diccionari de la llengua literria y teniendo a la vista los materiales preparados para su redaccin, especialmente los cheros con el vaciado de los textos literarios.

294

Joaquim Rafel i Fontanals

En el ao 1932 se publica esta obra, con el ttulo de Diccionari general de


la llengua catalana (DGLC) y con el nombre de Fabra como autor, por una
editorial privada (Lpez Llauss, editor). Su aparicin se produce, pues, al
inicio de la poca republicana, cuando se comienzan a recuperar las instituciones catalanas y cuando la lengua vuelve a ocupar el espacio social
propio, unas circunstancias en las cuales el diccionario prest un servicio
muy importante a la sociedad y a la cultura catalanas. Entre el comienzo
de la redaccin (1923) y la publicacin total de la obra (se haba iniciado
la aparicin en fascculos en noviembre de 1931), transcurren nueve aos;
la dedicacin preferente de Fabra a la redaccin del diccionario, gracias al
mecenazgo de Francesc Camb, y el hecho de no tener que someterse al
complejo trmite de la sancin acadmica permitieron la elaboracin y la
publicacin de la obra en un plazo tan breve. A pesar de no tratarse propiamente del diccionario acadmico, por su naturaleza y por las circunstancias en que fue elaborada, esta obra ha sido considerada siempre por el
Institut y por la poblacin en general el diccionario de referencia normativa del cataln. Nos encontramos, pues, ante un fenmeno singular en que
la labor individual de una persona se superpone a la labor colectiva de una
institucin y acaba siendo reconocida por esta como propia.
Despus de la institucin de la Generalitat de Catalunya (1931) y de la
aprobacin del Estatuto de Catalua (1932), se inicia un perodo favorable
al desarrollo de la lengua y de la cultura catalanas. En este nuevo contexto
social, el Institut reanuda de manera progresiva sus actividades. La actividad lexicogrca de la institucin no es, sin embargo, la que podramos
esperar en estas circunstancias, probablemente debido en gran parte a
las diferencias de criterio y a las discrepancias ideolgicas entre Pompeu
Fabra por una parte y Antoni Griera y Manuel de Montoliu por otra.
Pasando por alto muchos detalles, podemos decir que no es hasta despus de la expulsin de Griera del Institut (1935), como consecuencia de
haber publicado por su cuenta el primer volumen del Tresor de la llengua,
de les tradicions i de la cultura popular de Catalunya (Griera 1935-1947),
utilizando los materiales reunidos en el Institut para el Diccionari dels
dialectes, cuando Fabra presenta un plan de reestructuracin de las Ocinas Lexicogrcas per a emprendre tan aviat com es pugui la reedici
del Diccionari general de la llengua catalana. A partir de este momento
son frecuentes en las actas las alusiones a los trabajos sobre el Diccionari
general. Es justamente a partir de 1935 cuando podemos observar indicios
de un plan para ejecutar un proyecto concreto de diccionario; as lo conrma una referencia de R. Aramon a esta poca en que l mismo comenzaba a colaborar con el Institut:

La actividad lexicogrca del Institut dEstudis Catalans. Pasado, presente y futuro

295

Les Oficines Lexicogrfiques, que havien pogut continuar actives durant la Dictadura b que sota
un altre nom, com a servei de la Diputaci, reprenen llur lligam amb la Secci Filolgica i es veuen
reforades amb lingrs de nous collaboradors, com Joan Coromines i el qui us parla, que vnen
a fer costat als antics Manuel de Montoliu, Josep M. Casas i Homs i Francesc Torres, als quals
suneix, ja comenada la guerra, Josep Miracle. Tots plegats, sota la direcci de Fabra, intensifiquen la replega de materials, amb lesperana de poder comenar aviat la redacci del Diccionari
de lInstitut (Aramon 1982: 36).

Pero la evolucin de los acontecimientos polticos y el desarrollo


y desenlace de la guerra civil interrumpieron las actividades del Institut
dEstudis Catalans. La conclusin que se impone despus de un anlisis detallado de los hechos (Rafel 1996) es que hasta el nal de esta etapa y antes
del largo perodo de clandestinidad que seguir, la historia del Institut y de
la Seccin Filolgica se ha caracterizado por diversos intentos de cumplir un
mandato fundacional; estos intentos han resultado siempre frustrados en
parte por la falta de unos objetivos claros, reconocidos institucionalmente
y aceptados por todos sus miembros, y en parte por las circunstancias polticas desfavorables que han sacudido la sociedad catalana a lo largo del
siglo XX.
A partir de 1939, el inicio de la dictadura franquista signica para el
Institut el exilio de una parte importante de sus miembros ms relevantes y la desaparicin ocial de la institucin; slo algunos acadmicos
que quedaron en el pas se reunieron de manera clandestina y llevaron a
cabo actividades resistenciales.
Por lo que respecta a la actividad lexicogrca, el hito ms importante
de todo este largo perodo es la publicacin (1954) de la segunda edicin
del DGLC de Pompeu Fabra, revisada por la Seccin Filolgica, con un prlogo de Carles Riba, presidente de la Seccin; en 1962 se reedita la obra
y en aos sucesivos irn apareciendo nuevas ediciones o reimpresiones.
Por lo dems, durante la larga etapa de clandestinidad la actividad lexicogrca de la Seccin Filolgica se limita a la aprobacin de algunas listas
de palabras nuevas que se difunden de manera ociosa hasta que van
incorporndose al diccionario Fabra a partir de la cuarta edicin (1966) y,
en forma de apndice, a partir de la quinta (1968).
En el ao 1976, en plena transicin poltica, un Real Decreto restablece
la existencia ocial del Institut dEstudis Catalans y aprueba unos nuevos
estatutos para la entidad; el Institut deja de ser con ello una institucin
clandestina despus de casi cuarenta aos.
Al nal de una fase de lenta recuperacin de la normalidad corporativa
la sede social del Institut no podr ser ocupada hasta en 1982, el ao 1983
la Seccin Filolgica se plantea la manera ms adecuada de organizar la

296

Joaquim Rafel i Fontanals

actividad lexicogrca despus de un tiempo de interrupcin tan dilatado


y acuerda la realizacin de un proyecto basado en los principios metodolgicos que la lexicografa moderna haba propugnado en los ltimos aos.
El proyecto, que recibi el nombre de Diccionari del catal contemporani,
pretenda asumir los avances producidos en la lingstica y aplicar las posibilidades de la tecnologa moderna en el tratamiento de la informacin;
su objetivo general era la redaccin de un diccionario descriptivo del cataln sobre la base de un corpus textual sucientemente representativo de
la lengua. De acuerdo con ello, el proyecto se estructur en dos fases sucesivas: la constitucin de un corpus textual informatizado y la redaccin de
un diccionario basado fundamentalmente en dicho corpus. Al margen de
este proyecto concebido como una realizacin a trmino medio, la Seccin
Filolgica se planteaba tambin cmo acometer las nuevas ediciones o actualizaciones del diccionario que tena an carcter normativo, pero que
estaba claramente desfasado: el de Pompeu Fabra.
A partir de este momento podemos considerar que el Institut ha tenido
una actividad importante en el campo lexicogrco. Si damos un rpido
repaso a los principales acontecimientos posteriores, podemos destacar de
una manera esquemtica los siguientes hechos, por orden cronolgico:
(a) El ao 1985 el Institut se dota de una infraestructura informtica
adecuada y se inician los trabajos de constitucin del Corpus Textual Informatitzat de la Llengua Catalana (CTILC).
(b) El ao 1992 el Institut acuerda dar prioridad a la publicacin con
carcter urgente de un diccionario normativo elaborado sobre la base del
Diccionari general de la llengua catalana de Pompeu Fabra debidamente
actualizado.
(c) El ao 1995 se publica el Diccionari de la llengua catalana, resultado
de la ejecucin del acuerdo anterior (DIEC).
(d) El ao 1997 nalizan los trabajos de constitucin del CTILC.
(e) El ao 1997 se inicia la preparacin de una segunda edicin revisada y ampliada del Diccionari de la llengua catalana.
(f) El ao 1998 se inician los trabajos del Diccionari descriptiu de la llengua
catalana, segunda fase del proyecto Diccionari del catal contemporani.
(g) El ao 2001 se publica el Diccionari manual de la llengua catalana (IEC 2001).
(h) El ao 2005 se pone a disposicin del pblico por va electrnica
(Internet) la parte redactada del Diccionari descriptiu de la llengua catalana (DDLC).
(i) El ao 2007 se publica la segunda edicin del Diccionari de la llengua catalana.

La actividad lexicogrca del Institut dEstudis Catalans. Pasado, presente y futuro

297

El conjunto de estas actuaciones responde, en el mbito del lxico, a


dos de los objetivos estatutarios del Institut dEstudis Catalans: el establecimiento de la normativa y el estudio de la lengua; con ellas la institucin
por una parte ejerce la estricta funcin de academia de la lengua, y por otra
parte analiza las propiedades de las unidades lxicas a partir de su uso real.
Voy a resumir brevemente las lneas generales de estas actuaciones.

1. el diccionari de la llengua catalana


Esta obra responde a la constatacin de que, una vez recuperada la
normalidad de actuacin de la institucin acadmica, la sociedad reclamaba con urgencia un diccionario actualizado que sirviera de referencia
normativa. La solucin adoptada por el Institut fue la de elaborar un diccionario a partir del DGLC de Fabra (1932), sin alterar fundamentalmente
los criterios lexicogrcos ni la base lxica, pero amplindolo y actualizndolo. Desde la publicacin de esta obra las necesidades comunicativas
haban cambiado mucho y se haba dado lugar a un nmero importante de palabras o de acepciones nuevas, que en buena parte haban sido
recogidas por los diccionarios publicados en los ltimos aos fuera del
mbito acadmico, sobre todo por el Diccionari de la llengua catalana de
Enciclopdia Catalana (DLC 1982), que recoga las aportaciones lxicas de
la Gran Enciclopdia Catalana (GEC 1969-1980). Ello dio lugar a un nmero importante de actuaciones en la nomenclatura del diccionario (adiciones, supresiones, modicaciones), que fueron objeto de publicacin
aparte por el mismo Institut (IEC 1997). En la confeccin de este nuevo
diccionario fueron aplicados una serie de criterios previamente discutidos y aprobados por la Seccin Filolgica; estos criterios se reeren tanto
a distintos aspectos de las entradas, como al contenido y estructura de los
artculos, y fueron tambin dados a conocer pblicamente (IEC 1996). La
aplicacin, sin embargo, de algunos de estos criterios, relativos sobre todo
a la coherencia interna del diccionario y a ciertos aspectos de las deniciones, y una revisin sistemtica y exhaustiva del lxico de especialidad,
fueron dejados para una segunda edicin, para no demorar demasiado la
publicacin de la obra. En cifras redondas, este diccionario contiene 67.000
entradas, 16.500 subentradas y 120.000 acepciones, lo cual representa, respecto del diccionario Fabra, un incremento de 17.000 entradas, 8.000 subentradas y 30.000 acepciones (Cabr / Bozzo / Santamara 1996).
Despus de la publicacin del Diccionari de la llengua catalana, la Seccin Filolgica percibi la necesidad de publicar una obra no tan amplia

298

Joaquim Rafel i Fontanals

como esta, centrada ms en el lxico comn, sin tantas palabras especializadas, destinado a un usuario con unas necesidades ms elementales,
til para la escuela, etc.; as, el ao 1997 tom el acuerdo de publicar un
diccionario abreviado con el nombre de Diccionari manual de la llengua
catalana. Este diccionario, que aparece en el ao 2001 (IEC 2001), no es, sin
embargo, una mera versin abreviada del anterior, sino que en su elaboracin se aplican una serie de acciones encaminadas a hacer de l una
obra ms manejable y comprensible para el pblico a que va destinada.
Por otra parte, por el hecho de ser preparado cuando los trabajos de la segunda edicin del diccionario normativo estaban ya bastante avanzados,
se pudo beneciar de las innovaciones que ya se haban introducido o
que se haba decidido introducir.
Por otra parte, recin terminada la primera edicin del Diccionari de
la llengua catalana, se comienza, de hecho, su revisin; sin embargo, los
trabajos sistemticos de preparacin de la segunda edicin de la obra no
comienzan hasta 1997. El conjunto de actuaciones previstas se estructur
en cuatro grandes apartados:
(1) Aplicacin de criterios lexicogrcos.
(2) Revisin del lxico de especialidad:
(a) Revisin de la nomenclatura.
(b) Revisin de las deniciones.
(3) Tratamiento de las propuestas de enmienda.
(4) Revisin del lxico comn.
Los criterios a los que se reere el primer apartado son los siguientes:
(1) Numeracin de las acepciones y de las subacepciones.
(2) Ordenacin de las acepciones.
(3) Regularizacin de grupos semnticos y morfolgicos.
(4) Supresin del punto y coma como separador de acepciones.
(5) Acepciones y subacepciones constituidas por ejemplos sin denicin.
(6) Entrada de ajos.
(7) Entrada de gentilicios.
(8) Distribucin de cdigos de categora gramatical.
(9) Tratamiento de los verbos pronominales.
(10) Modicacin de deniciones impropias.
(11) Regularizacin de las remisiones.
(12) Tratamiento de las marcas valorativas.
(13) Marcaje de dialectalismos.

La actividad lexicogrca del Institut dEstudis Catalans. Pasado, presente y futuro

299

Entre estos criterios hay algunos que ya estaba previsto aplicarlos en


la primera edicin del diccionario, pero de hecho no se aplicaron porque
se dio prioridad a la publicacin de la obra en un plazo determinado. El
resto fueron discutidos y aprobados especcamente para la segunda
edicin.
El segundo apartado (Revisin del lxico de especialidad) es el ms complejo, el que ha costado ms esfuerzos y el que ha tenido un perodo de ejecucin ms largo. Esta complejidad y esta dicultad se deben a factores de
naturaleza distinta; entre ellos podemos citar el gran nmero de trminos a
considerar, la dicultad de establecer el grado de especializacin a la hora de
seleccionar las entradas y las subentradas, la dicultad de encontrar el tipo
de denicin que satisfaga a la vez la exigencia cientca del especialista y
la claridad y simplicidad necesarias en un diccionario general, la coordinacin entre reas anes, la relacin personal con los especialistas teniendo
en cuenta la especicidad de cada rea y de cada persona. Se han distinguido 76 reas de especialidad y han intervenido en la revisin 120 especialistas. Por lo que respecta a los datos cuantitativos del lxico especializado, el
examen de 43.356 entradas originarias ha dado lugar a 1.948 altas, 778 bajas
y 218 cambios de grafa; el examen de 8.410 subentradas originarias ha dado
lugar a 1.645 incorporaciones, 564 bajas y 706 modicaciones, y sobre las
61.262 acepciones de especialidad originarias se han aadido 2.652 y se han
modicado 28.758. Adems, se ha incorporado la marca de rea temtica a
5.000 acepciones que no la tenan y se ha suprimido esta marca en 2.000.
El tercer apartado (Tratamiento de las propuestas de enmienda) tuvo
como objetivo analizar y dar solucin a todas las sugerencias hechas directa o indirectamente, sea a travs de publicaciones de diversa ndole,
especializadas o generales, sea a travs de comunicaciones escritas o de
manifestaciones verbales tanto de fuera de la institucin como por parte
de los acadmicos; tambin se recogen en l los resultados de una lectura
sistemtica de la obra que se llev a cabo por parte del propio equipo de
redactores inmediatamente despus de la publicacin de la primera edicin. Dentro de este apartado se han analizado 6.941 propuestas de lxico
comn; de estas, 3.690 han dado lugar a algn tipo de modicacin y las
3.251 restantes no han originado ninguna modicacin.
El cuarto y ltimo apartado se reere a la Revisin del lxico comn, que
se dividi en dos subapartados: la revisin de la nomenclatura y la revisin
del contenido de los artculos. Por lo que respecta a la nomenclatura, se
estudiaron detenidamente 1.800 casos de propuestas de incorporacin de
nuevas entradas, y, despus de un proceso complejo de estudio por la Comisin de Lexicografa y presentacin y aprobacin en el plenario de la Seccin

300

Joaquim Rafel i Fontanals

Filolgica, fueron incorporadas 488 entradas y 84 subentradas nuevas; por


otra parte, a partir del estudio y valoracin de 153 casos de propuestas de
supresin, fueron suprimidas 41 entradas. En cuanto a la revisin sistemtica de los artculos de lxico comn o con alguna acepcin de lxico comn,
se llev a cabo mediante una lectura por parte de personal competente; su
objetivo ha sido la mejora de aquellos aspectos que escapaban a las actuaciones generales previstas, como pueden ser cuestiones relativas a la expresin de la categora gramatical, la redaccin de las deniciones, la naturaleza de los ejemplos, los casos de circularidad maniestamente perturbadora
y la coherencia general del diccionario. Hay que decir que con ello no se ha
pretendido una reforma profunda de los materiales lexicogrcos ni de la
estructura del diccionario, en su mayor parte procedente del diccionario de
Fabra y compartidos por muchos diccionarios, porque la labor habra superado la naturaleza de los objetivos establecidos en su momento para la preparacin de esta segunda edicin del diccionario normativo. Esta revisin
ha dado lugar, con todo, a unas 7.000 intervenciones sobre un total de 31.762
artculos de lxico comn o con alguna acepcin de lxico comn.
Despus de todas las actuaciones previstas para esta segunda edicin,
las diferencias estadsticas generales son las siguientes:
Primera Edicin

Segunda Edicin

Diferencia

Entradas

67.566

69.988

2.422

Subentradas

17.000

17.343

343

Acepciones

103.000

115.117

12.117

Ejemplos

44.000

50.064

6.064

Una vez terminados los trabajos de revisin y actualizacin, la segunda edicin del diccionario fue raticada por la Seccin Filolgica en febrero de 2006 y en estos momentos ha pasado en el proceso de publicacin.
El libro vi la luz en 2007.

2. el diccionari del catal contemporani (dcc)


Como ya he avanzado, con este nombre designamos un proyecto complejo que tiene su origen en el deseo de la Seccin Filolgica de que los
trabajos que iba a emprender en un nuevo perodo de su historia no fueran insensibles a los avances cientcos, metodolgicos y tecnolgicos que
haban tenido lugar durante el largo tiempo de inactividad forzada. Este
proyecto est estructurado en dos fases sucesivas: la primera corresponde

La actividad lexicogrca del Institut dEstudis Catalans. Pasado, presente y futuro

301

a la creacin de recursos lingsticos y la segunda a la elaboracin de un


diccionario descriptivo, el DDLC, sobre la base de los recursos constituidos.

2.1. Primera fase: Creacin de recursos lingsticos


Aunque en un principio, en la primera fase del proyecto DCC, se haba
pretendido nicamente la constitucin de un corpus textual, ms tarde
se vio la oportunidad de formar tambin un corpus con los diccionarios
principales de la misma poca que cubra el primero con el n de poder
obtener fcilmente la informacin contenida en ellos. As pues, durante
esta primera fase del proyecto, que se halla totalmente terminada, se ha
constituido por una parte el Corpus Textual Informatitzat de la Llengua
Catalana (CTILC) y por otra parte la Base de Dades Lexicogrca (BDLex).
2.1.1. Caractersticas principales del CTILC
Desde el punto de vista cronolgico, el CTILC se extiende desde 1832
hasta 1988; abarca, pues, textos de ms de 150 aos de la historia de la lengua catalana escrita entre los siglos XIX y XX. La fecha de origen viene determinada por el inicio de la recuperacin del uso literario de la lengua en
la poca contempornea y la fecha nal por el momento en que se ultim
la seleccin de los textos que iban a formar parte del corpus. Desde el punto
de vista tipolgico, el CTILC incluye textos de carcter literario y textos de
carcter no literario. Cada uno de estos dos tipos ha sido dividido en otros,
que han permitido una seleccin equilibrada de los textos a tener en cuenta no slo para cada tipo de lengua (literaria o no literaria), sino para cada
subtipo (los cuatro gneros tradicionales: Narrativa, Poesa, Teatro y Ensayo, para la lengua literaria, y diez grupos temticos o funcionales distintos
para la lengua no literaria: Filosofa; Religin y Teologa; Ciencias Sociales;
Prensa; Ciencias Puras y Naturales; Ciencias Aplicadas; Bellas Artes, Ocio y
Deportes; Lengua y Literatura; Historia y Geografa, y Correspondencia). La
extensin total del corpus es de 52.371.944 ocurrencias o palabras del texto,
que se reparten en 23.105.591 (44%) correspondientes a la lengua literaria
y 29.266.353 (56%) correspondientes a la lengua no literaria. En las guras
1 y 2 puede verse la reparticin del texto literario entre los cuatro grupos
tipolgicos considerados en la lengua literaria y los diez grupos tipolgicos correspondientes a la lengua no literaria, respectivamente. El nmero
de obras o textos distintos, de extensin muy diversa, que corresponden a
este volumen de texto es de 3.299, de las cuales 1.011 corresponden a textos
literarios y 2.288 a textos no literarios.

302

Joaquim Rafel i Fontanals

Figura 1. Reparticin del texto literario entre sus cuatro grupos tipolgicos

Figura 2. Reparticin del texto no literario entre sus diez grupos tipolgicos

Una de las preocupaciones principales a la hora de concebir el CTILC


fue que tuviera la mxima representatividad, es decir, que el conjunto de
textos tomados en consideracin reejara de la mejor manera posible la
lengua escrita utilizada en el perodo de tiempo que abarca; para conseguir este objetivo, en el momento de la seleccin se puso especial empeo en lograr el mximo equilibrio entre los distintos tipos de texto que
las necesidades de la comunicacin escrita esttica o funcional haban
producido a lo largo del mbito cronolgico del CTILC. Para ello, adems
de la divisin tipolgica a que me he referido hace un momento, se establecieron tambin unos grupos cronolgicos que tienen una extensin de
diez aos en la parte ms antigua (hasta 1913) y de cinco aos a partir de
1914. Durante el proceso de seleccin de los textos se intent que dentro
de cada uno de los 23 grupos cronolgicos que resultan de esta divisin se

La actividad lexicogrca del Institut dEstudis Catalans. Pasado, presente y futuro

303

hallara representado cada uno de los subtipos establecidos de una manera aproximadamente proporcional al volumen de texto producido en
aquel perodo. Hay que decir todava que, por lo que se reere a la lengua
no literaria, la mayor parte de las reas temticas o funcionales han sido
divididas en un nmero variable de subreas, hasta un mximo de diez,
y se han seleccionado textos de cada una de ellas; por lo que respecta a
los textos literarios, sin necesidad de subdividir los gneros de una manera sistemtica, se tuvieron en cuenta diferencias de carcter temtico
o de otra naturaleza (por ejemplo, narrativa imaginativa, libros de viajes,
memorias; teatro costumbrista o clsico; poesa religiosa o profana, etc.).
Con estas medidas se intent lograr el mximo equilibrio entre las ms
variadas manifestaciones de la lengua escrita.
Una caracterstica destacada del CTILC es que se trata de un corpus totalmente lematizado; en l se ha llevado a cabo una operacin de anlisis
lingstico en virtud de la cual se ha categorizado gramaticalmente cada
una de las ocurrencias de cada forma grca y se ha asociado a una unidad lxica de referencia; con ello se cubren dos objetivos: por una parte
se desambiguan formas grcas que corresponden a formas gramaticales
distintas (de una misma serie exiva o de series exivas correspondientes
a lemas distintos) y por otra parte, como consecuencia de la misma operacin, se relacionan entre ellas las distintas formas de una serie exiva, las
cuales quedan asociadas a un mismo lema. El CTILC, por el hecho de estar
completamente lematizado, tiene un elevado nivel de funcionalidad; realizando una consulta a partir de un lema obtenemos informacin sobre todas las formas de exin correspondientes, con las posibles variantes grcas o formales que aparecen en textos de diferentes pocas, y tambin a
las eventuales formas derivadas mediante ajos apreciativos o intensivos,
para las cuales, siguiendo criterios lingsticos, no se ha creado un lema
propio, sino que se han asociado al lema correspondiente a su base lxica.
El nmero de lemas a que ha dado lugar esta operacin es de 149.185, que
corresponden a 678.386 formas gramaticales y a 51.253.680 ocurrencias del
texto (el total de ocurrencias del corpus menos los nombres propios).
El CTILC fue constituido entre los aos 1985 y 1997; podemos considerarlo, pues, un trabajo pionero en nuestras latitudes. Una vez terminado,
dispone de un sistema de consulta y explotacin concebido especialmente para su utilizacin con nalidades lexicogrcas, pero que es tambin
til para cualquier tipo de estudio que se pretenda elaborar a partir de datos empricos. En este momento el CTILC se puede consultar pblicamente por Internet a travs de la web del Institut dEstudis Catalans; el procedimiento de consulta permite obtener una serie de contextos relativos

304

Joaquim Rafel i Fontanals

a un lema determinado. Como actividad vinculada a la elaboracin del


CTILC, fue publicado entre los aos 1996 y 1998 un diccionario de frecuencias en tres volmenes impresos y dos CD-ROM, que incluye la totalidad
de los datos lxicos y estadsticos del corpus (Rafel 1996-1998).
2.1.2. Caractersticas principales de la BDLex
La Base de Dades Lexicogrca (BDLex) contiene debidamente informatizados y cargados en una base de datos los 13 diccionarios catalanes
que han sido considerados ms signicativos de los siglos XIX y XX; fue
creada con el n de facilitar el acceso rpido y sistemtico a la informacin que contienen estas obras y obtener el mximo rendimiento de las
consultas. Fue concebida, como ya he apuntado, como un recurso complementario dentro del proyecto general; ms adelante concretar cual
es la utilizacin especca que se le da en la elaboracin del diccionario
descriptivo. Est formada por los diccionarios siguientes:
CORPUS LEXICOGRFICO DE LA BDLEX
DMFC

Febrer i Cardona, A.: Diccionri menorqu espal francs y llat. [Manuscrito,


principios siglo XIX]

DEBJ

Esteve, J. / J. Bellvitges / A. Jugl (1803-1805): Diccionario catalan-castellano-latino

DLCL

Labrnia, P. (1839-1840): Diccionari de la llengua catalana: ab la correspondencia castellana


y llatina

DMCF

Figuera, P. A. (1840): Diccionari mallorqui-castella

DVCE

Escrig, J. (1851): Diccionario valenciano-castellano

NDMA

Amengual, J. J. (1858): Nuevo diccionario mallorquin-castellano-latin

DMCT

[Tarong i Corts, J.] (1878): Diccionari mallorqu-castell. [Inacabado]

DGMG

Mart i Gadea, J. (1891): Novsimo diccionario general valenciano-castellano

DCVB

Alcover, A. / F. de B. Moll (1926-1962): Diccionari Catal-Valenci-Balear

DPCV

Valls, E. [1927]: Pallas: diccionari catal-castell-francs: amb vocabularis castell-catal


francs-catal

DGLC

Fabra, P. (1932) Diccionari general de la llengua catalana

DGFP

Ferrer Pastor, F. (1985): Diccionari general

DIEC

Institut dEstudis Catalans (1995): Diccionari de la llengua catalana

La informacin que contienen estos diccionarios fue trasladada a soporte informtico y el texto fue tratado de modo que permite la reproduccin de los originales siguiendo los criterios tipogrcos de cada uno. Los
diferentes elementos que conguran la estructura de los distintos diccio-

La actividad lexicogrca del Institut dEstudis Catalans. Pasado, presente y futuro

305

narios han sido identicados sistemticamente y codicados de manera


adecuada de tal forma que una vez incorporados a la base de datos pueden
ser objeto de consultas orientadas selectivamente y pueden ser relacionados entre ellos. Otro aspecto importante del proceso de informatizacin
ha sido lo que hemos llamado normalizacin de las entradas, que, en sntesis, por una parte permite acceder a travs de una forma normalizada a
las variantes que contienen algunos de estos diccionarios, y por otra parte
establece vnculos lgicos entre entradas que pueden considerarse variantes (generalmente grcas) asociables entre ellas, pero que en el diccionario de que se trata aparecen sin ningn vnculo asociativo explcito.

2.2. Segunda fase: Elaboracin de un diccionario descriptivo


El objetivo de la segunda fase del proyecto DCC, que se encuentra en
proceso de realizacin, es la elaboracin de un diccionario descriptivo de
la lengua catalana contempornea a partir, principalmente, del anlisis
y de la explotacin de CTILC. Entendemos aqu por diccionario descriptivo
aquella obra lexicogrca que tiene por objeto la denicin de las unidades lxicas de la lengua desde el punto de vista de su contenido y de su
utilizacin real, sin restricciones basadas en criterios prescriptivos.
Una de las justicaciones de la elaboracin de un diccionario descriptivo de estas caractersticas por parte de una academia de la lengua
es la creencia de que las prescripciones lingsticas estarn tanto mejor
fundamentadas cuanto mejor se conozca la lengua en su realidad fctica; en el caso del Institut dEstudis Catalans la justicacin es doble por
cuanto entre sus misiones estatutarias, como hemos visto, tiene no slo
el establecimiento de la normativa lingstica, sino tambin ocuparse
del estudio de la lengua. Con la elaboracin de un diccionario descriptivo
de estas caractersticas el Institut dEstudis Catalans no slo produce una
obra concebida de acuerdo con los principios ms generalmente asumidos
por la lexicografa contempornea, sino que se dota de un instrumento
muy valioso a la hora de ejercer su actividad como institucin acadmica
encargada del establecimiento y de la actualizacin de la normativa de la
lengua catalana.
2.2.1. Caractersticas generales del DDLC
Sin pretender ser un diccionario terico, el Diccionari descriptiu de la
llengua catalana comparte con estos alguna de sus caractersticas: no
tiene un carcter pragmtico ni una nalidad pedaggica, es concebido

306

Joaquim Rafel i Fontanals

como el resultado de una investigacin especca, su realizacin persigue el mximo rigor cientco, su formulacin aspira a un alto grado de
explicitud y utiliza una cierta formalizacin en su lenguaje y en su presentacin. Como consecuencia de ello, sus usuarios ideales son los profesionales de la lengua; sin embargo, esta obra lexicogrca no pretende dirigirse solamente a especialistas, sino que, adems de ser til para
estos, aspira a estar al alcance de cualquier lector medianamente culto
interesado por los problemas de la lengua en cuanto que usuario: se pretende, pues, presentar el contenido del diccionario combinando el rigor
en el tratamiento de la informacin con la claridad expositiva y con la
facilidad de interpretacin.
La elaboracin de un diccionario descriptivo por una academia de
la lengua puede parecer una contradiccin, puesto que este diccionario
contiene palabras, acepciones o estructuras sintcticas que no son reconocidas por la normativa vigente, a pesar de encontrarse documentadas
en los textos; por una parte, este diccionario puede ser considerado ms
cientco que el normativo, porque intenta dar cuenta de una manera
sistemtica de la realidad de la lengua a partir de datos empricos, pero
por otra parte puede ser visto como un peligro para el uso lingstico
considerado correcto. En el caso que nos ocupa, este tema se debati
ampliamente en el seno de la Seccin Filolgica, la cual decidi que se
identicara con una marca visible todos aquellos elementos (entrada,
categora, acepcin, patrn sintctico, etc.) que no gozaran de sancin
normativa en el momento de divulgarlos.
En el aspecto material, tanto desde el punto de vista del proceso
de redaccin como en sus resultados nales, el proyecto de diccionario
descriptivo, como ya he dicho, pretende incorporar los ltimos avances
metodolgicos y tecnolgicos que se han producido en el campo de la
lexicografa. Como consecuencia de ello tiene las caractersticas de un
diccionario electrnico, en forma de base de datos multifuncional que
permite utilizaciones diversas, tanto relacionadas con la investigacin
como con la difusin de la obra; si nos centramos en la difusin, permite
las ms variadas posibilidades: por una parte, puede ser divulgado por
va electrnica a travs de Internet y, por otra parte, puede servir de base
para diversidad de publicaciones, sea en papel, sea en cualquiera de los
soportes electrnicos disponibles.
Una de las caractersticas ms destacadas del DDLC, que conforma
todo el diccionario, es el hecho de utilizar el CTILC como base fundamental y fuente exclusiva; se trata, pues, en sentido estricto, de un diccionario
basado en corpus. No es este el momento ni el lugar de detallar las venta-

La actividad lexicogrca del Institut dEstudis Catalans. Pasado, presente y futuro

307

jas de este procedimiento; slo destacar el hecho de que de acuerdo con


este principio metodolgico, basado en datos empricos, se establece no
slo la nomenclatura del diccionario, sino los signicados de las unidades
lxicas a partir del uso que realmente se ha hecho de ellas, en vez de utilizar mtodos apriorsticos (basados en los diccionarios preexistentes) o
intuitivos (basados en la conciencia lingstica del lexicgrafo); la aplicacin de este mtodo permite la utilizacin de datos de carcter estadstico
que pueden llegar a tener una gran importancia tanto en la jacin de la
nomenclatura como en aspectos internos de la estructura del diccionario;
permite tambin la ejemplicacin a travs de testimonios de uso refrendados por una cita y una referencia concretas, con lo cual podemos, si es
necesario, situar en el tiempo un determinado uso o signicado. Como
consecuencia de la utilizacin de un corpus como punto de referencia
para su elaboracin, el DDLC incluye una informacin exhaustiva y sistemtica sobre las estructuras sintcticas de que pueden formar parte, en
sus distintas acepciones, las unidades lxicas tratadas, y tambin sobre
las coocurrencias ms frecuentes.
Este mtodo y este procedimiento, como a nadie se le oculta, tiene,
sin embargo, sus detractores, que deenden otros modos de proceder en
la prctica lexicogrca, temiendo que un sistema como este desvirte
los logros de la lexicografa tradicional. Justamente, saliendo en cierto
modo al paso de este tipo de objecin, el DDLC no slo no deja de tener
en cuenta lo que la tradicin lexicogrca ha dado de s en la lexicografa
catalana, sino que incorpora todos los datos relativos al signicado que
aparecen en los principales diccionarios y que no se han vericado en el
corpus; pero ello se hace fuera del cuerpo principal del artculo y dejando
constancia de qu diccionario o qu diccionarios aportan la informacin
correspondiente. No se entremezclan, pues, la informacin procedente
del anlisis del corpus, que determina el ncleo fundamental del artculo,
con la que procede de los diccionarios y no tiene un reejo en el corpus.
No hace falta que haga notar que el hecho de contar con la BDLex, que he
mencionado ms arriba entre los recursos lingsticos disponibles, facilita enormemente la inclusin de esta informacin.
Por lo que respecta a la nomenclatura, la del DDLC tiene un carcter
complejo, en el sentido de que no todas las unidades lxicas que encabezan un artculo son descritas en l, sino en otro artculo encabezado por
un elemento distinto. As, pues, la nomenclatura del DDLC est formada
por unos elementos de rango general (caracterizados por una descripcin
lexicogrca propiamente dicha) y por otros elementos de rango subsidiario (caracterizados por remitir a otros artculos); estos elementos sub-

308

Joaquim Rafel i Fontanals

sidiarios, controlados sistemticamente, corresponden a dos tipos: (a) los


derivados formados a partir de alguno de los siete procesos de derivacin
sistemtica establecidos en los criterios de redaccin del diccionario, y
(b) las variantes formales documentadas en el corpus que estn asociadas a una forma lxica principal, sin ser meras variantes grcas de ella.
Contiene tambin el diccionario un tercer tipo de elementos vinculados
a unas entradas determinadas, que se encuentran integrados en los artculos correspondientes a ellas y no dan lugar a entradas propias; se trata
de los derivados apreciativos, de las variantes exivas de la entrada no
previstas en el modelo exivo que la caracteriza y de las conversiones sintcticas, que estn vinculadas a las acepciones correspondientes. Por ltimo, las unidades lxicas plurinominales no constituyen tampoco entradas propias ni estn vinculadas a acepciones o mezcladas con ellas, como
ocurre en muchos diccionarios, sino que estn agrupadas en una seccin
propia del artculo correspondiente a la entrada con la que se encuentran
relacionadas de acuerdo con unos criterios explcitos.
El DDLC se organiza en artculos, que constituyen la unidad bsica
en que se estructura toda la informacin que contiene el diccionario. Los
criterios para el establecimiento y la delimitacin de los artculos se basan exclusivamente en principios de carcter formal y gramatical, y se
aplican de una manera sistemtica a lo largo de todo el diccionario sin
ninguna excepcin. Estos criterios consisten en la identidad o diferencia
en cualquiera de las tres caractersticas que conguran la entrada: la grafa de la forma cannica, su categora y sus propiedades exivas. La diferencia en cualquiera de estas tres caractersticas determina la existencia
de un artculo distinto; en caso contrario, toda la informacin se agrupa
en un nico artculo, independientemente de las diferencias de carcter
meramente semntico o de consideraciones de carcter etimolgico, que
no intervienen como criterios diferenciadores de los artculos, contrariamente a lo que ocurre en la mayora de los diccionarios tradicionales. En
el DDLC no existen, pues, dos entradas que coincidan en su forma grca,
en su categora y en su modelo de exin.
Otra de las caractersticas del DDLC que merece ser mencionada es
el sistema de ordenacin de las acepciones, que se basa exclusivamente
en una combinacin de criterios frecuenciales y lgicos. Resumidamente
dir que en un artculo que presenta varias acepciones puede ocurrir que
estas tengan una anidad semntica estrecha, en cuyo caso se aplica el
criterio frecuencial: la acepcin que se muestra ms frecuente en el corpus aparece en primer lugar y el resto se ordenan por orden decreciente
de frecuencia; si, en cambio, pueden establecerse varios grupos a partir

La actividad lexicogrca del Institut dEstudis Catalans. Pasado, presente y futuro

309

del criterio de anidad de signicado, aparece en primer lugar el grupo


que contiene la acepcin ms frecuente y el resto de grupos por orden
decreciente de la acepcin ms frecuente del grupo. El sistema de ordenacin presenta, pues, una jerarqua de dos niveles.
De acuerdo con lo dicho ms arriba sobre el tipo de diccionario a que
aspiramos, las deniciones del DDLC evitan la informacin de carcter enciclopdico (basada en la descripcin de la realidad) y se concentran en la
informacin de carcter lingstico (descripcin del valor signicativo, de
las restricciones lxicas y de las propiedades sintcticas de las unidades).
Desde el punto de vista del texto denidor, se tiene en cuenta la distincin entre los elementos propiamente denidores (constituyentes intrnsecos de la denicin) y los que se reeren a condiciones o restricciones
selectivas (constituyentes extrnsecos), codicndolos adecuadamente;
estos conceptos (Rafel 1989) estn en conexin con los de entourage de
Rey-Debove y de contorno desarrollado por Seco (1979).
El DDLC contiene, para cada entrada, informacin de carcter cuantitativo relativa al uso observado en el corpus. Esta informacin aparece
simplicada, con una representacin grca, no numrica, que indica la
pertenencia de la entrada a uno de los cinco rangos de uso establecidos.
Para las entradas correspondientes a los tres primeros rangos de uso, el
DDLC contiene, adems, informacin sobre la reparticin porcentual de
sus categoras morfolgicas en el corpus.
2.2.2. Contenido y estructura del DDLC
Como ya hemos comentado, el DDLC consta de una serie de elementos
estructurales organizados en forma de base de datos; cada uno de ellos
est vinculado a un elemento de referencia, que es la entrada, lo cual permite congurarlos en forma de artculo de diccionario, que es la manera
ms comn de presentarlos ante los usuarios, pero no la nica posible;
por otra parte, esta es la forma ms prctica de referirse organizadamente a los distintos elementos que conforman la obra. En el esquema de la
gura 3 pueden observarse los distintos elementos estructurales del diccionario y las relaciones entre ellos. Estos elementos tienen distintos grados de obligatoriedad y de dependencia unos de otros y, en consecuencia,
puede haber artculos muy complejos sobre todo si tenemos en cuenta
la recurrencia potencial de algunos de sus componentes y artculos muy
simples.

310

Joaquim Rafel i Fontanals

Figura 3. Estructura del artculo estndar del DDLC

No podemos entrar en este trabajo en el comentario detallado de cada


uno de los elementos que constituyen la estructura de DDLC. Slo recordar que los ejemplos son citas extradas del CTILC, que se reproducen
sin ninguna adaptacin ni modicacin; la seleccin del ejemplo ms
adecuado para ilustrar una determinada acepcin se hace teniendo en
cuenta una serie compleja de criterios que ahora no podemos detallar; si
la acepcin tiene ms de un patrn sintctico, debe haber un ejemplo por
cada patrn. Los ejemplos se identican con una referencia simplicada
que aporta una primera informacin sobre la procedencia de la cita; en la
versin electrnica del DDLC se pueden desarrollar interactivamente los
elementos codicados de esta referencia simplicada y se puede acceder
a la referencia bibliogrca completa de la obra en cuestin.
Sealar tambin que el apartado de derivacin incluye todos los derivados formados sobre la misma base que la entrada o sobre una base
culta con cierta similitud formal y de sentido equivalente, cuyo sentido
sea mximamente predictible, es decir, que sean el resultado de un proceso derivativo transparente a todos los niveles (semntico, morfosintctico
y fonolgico). A n de evitar decisiones subjetivas de los redactores, se
han establecido y denido claramente siete procesos derivativos especicando los ajos que pueden actualizarlos, el tipo de transformacin que
suponen, la categora y el signicado del derivado en relacin con los de
la base a que est asociado y la denicin formularia que le corresponde.
Para cada derivado que se incluye en este apartado se indica el nmero
del proceso derivativo a que corresponde y tantos ejemplos como acep-

La actividad lexicogrca del Institut dEstudis Catalans. Pasado, presente y futuro

311

ciones de la entrada se encuentran actualizadas por este derivado en el


corpus, indicando en cada ejemplo el nmero de la acepcin de la entrada
que actualiza.
2.2.3. Ejecucin y estado actual del DDLC
La elaboracin de DDLC ha pasado desde su inicio por una serie de
fases previas a la redaccin, que resumidamente son las siguientes: (a)
establecimiento de la nomenclatura del diccionario, (b) concrecin de los
criterios lexicogrcos que se iban a aplicar en la redaccin de la obra, (c)
redaccin de una serie de artculos de prueba, y (d) establecimiento de la
estacin de trabajo lexicogrca.
Desde 1999 la obra se halla en la fase de redaccin sistemtica. En relacin con esta fase, que es de una complejidad notable, slo destacar
que la redaccin del DDLC no avanza siguiendo estrictamente el orden
alfabtico, sino que, a partir de una progresin alfabtica bsica, conjuntamente con el artculo de la palabra correspondiente al orden alfabtico,
se redactan tambin los artculos relativos a otras unidades lxicas que
estn relacionadas con ella por su forma o por una relacin semntica
o sistemtica, sea cual sea la letra del alfabeto a que pertenecen; cada
redactor elabora, pues, paralelamente, una serie ms o menos larga de artculos cuyas entradas estn relacionadas de acuerdo con estos criterios;
con este procedimiento se intenta evitar en lo posible la falta de coherencia estructural y descriptiva que afecta, en algunos casos de manera
grave, a la mayora de diccionarios existentes.
Una accin importante en los trabajos de ejecucin de la obra es lo
que llamamos validacin estructural. Se trata de una operacin que se
realiza sobre los artculos ya redactados y tiene como objeto el control
sistemtico de la aplicacin rigurosa de los criterios de redaccin y de la
coherencia estructural de la obra.
Por lo que se reere al estado actual de la redaccin, hay que tener en
cuenta que la extensin de la parte redactada del diccionario vara de da
en da, porque se van sancionando los artculos a medida que se da por
terminado su proceso de redaccin. El volumen actual (en datos de 16 de
noviembre de 2006) es de 32.241 artculos; por lo que respecta a la distribucin alfabtica, un poco menos de la tercera parte de este volumen (9.433
artculos) corresponde a la parte redactada segn la progresin alfabtica
rigurosa, que alcanza hasta la entrada avanar v., mientras que los 22.808
artculos restantes (un poco ms de las dos terceras partes) corresponden a entradas pertenecientes a otras letras del alfabeto, de acuerdo con

312

Joaquim Rafel i Fontanals

el sistema particular de progresin en la redaccin a que acabo de referirme. Este nmero de artculos redactados corresponde a un poco ms
de la tercera parte de la extensin prevista del diccionario. Como datos
estadsticos que pueden ser de inters podemos decir que estos 32.241 artculos contienen 76.173 acepciones, 51.596 colocaciones, 119.099 ejemplos,
7.440 conversiones sintcticas, 6.651 locuciones, 10.510 variantes, 7.440 derivados y 21.720 unidades de informacin complementaria. El nmero de
obras del corpus que han sido objeto de alguna cita en los ejemplos del
diccionario es 3.191.
2.2.4. Edicin electrnica del DDLC
Desde el mes de enero de 2005 el DDLC es consultable a travs de Internet en forma de edicin electrnica. Esta edicin electrnica consta de un
componente nuclear, constituido por el conjunto de artculos redactados,
y de unos componentes accesorios, que son una Presentacin, muy breve
y sinttica, y una Gua de utilizacin, ms larga y compleja en la cual se
encuentran explicados los distintos componentes del diccionario. Dado
que las consultas se realizan directamente sobre la base de datos del diccionario, la edicin electrnica est continuamente actualizada: por una
parte, el nmero de artculos consultables va aumentando a medida que
se da por terminado el proceso de redaccin de cada grupo, y, por otra
parte, se incorpora automticamente cualquier modicacin de que sea
objeto la parte ya redactada.
Con esta edicin electrnica, el DDLC se pone a disposicin del pblico
mediante una estructura dinmica que permite la relacin entre elementos de un mismo artculo o de distintos artculos del diccionario y tambin con elementos complementarios externos a los propios artculos a
travs de los vnculos activos adecuados.

3. el futuro inmediato
Con la nalidad de planicar las lneas generales de las actuaciones
futuras y evitar en lo posible los pasos en falso y las decisiones precipitadas, el ao 1996, recin publicada la primera edicin del DIEC, la Seccin
Filolgica y el Consejo Permanente del Institut dEstudis Catalans aprueban un plan de actuacin lexicogrca para los aos posteriores. Dicho
plan establece:

La actividad lexicogrca del Institut dEstudis Catalans. Pasado, presente y futuro

313

(a) que se llevar a cabo una revisin sistemtica y una cierta remodelacin de este diccionario con el n de publicar una segunda edicin
de la obra;
(b) que se iniciar la redaccin de un diccionario de carcter descriptivo sobre la base del Corpus Textual Informatitzat de la Llengua Catalana,
una vez nalizados los trabajos de constitucin de este corpus, y
(c) que se emprender la elaboracin de un diccionario normativo diseado sobre unas nuevas bases establecidas a partir de un debate en la
Seccin Filolgica.
El primero de estos objetivos se ha conseguido ya, como acabamos de
ver, con la terminacin de los trabajos de la segunda edicin del Diccionari de la llengua catalana. Ha habido un notable retraso sobre las previsiones iniciales, pero nalmente la Seccin Filolgica ha sancionado la obra,
que ya ha sido publicada. El segundo objetivo, el inicio de la redaccin del
Diccionari descriptiu de la llengua catalana, se cumpli en 1998, inmediatamente despus de la conclusin de los trabajos del CTILC. Como hemos
visto, los trabajos de este complejo proyecto estn en marcha y el ritmo
de redaccin es altamente satisfactorio; actualmente se redactan ms de
7.000 artculos por ao, lo cual permite estimar la nalizacin de la redaccin dentro de unos ocho aos.
El nico objetivo que queda todava pendiente es, pues, la elaboracin
de un nuevo diccionario normativo que no sea la mera actualizacin del
que se acaba de terminar. Ello supone un debate a fondo, por una parte,
sobre cmo debe entenderse en el siglo XXI un diccionario de carcter
prescriptivo, con todas sus implicaciones sociolgicas, y, por otra parte,
sobre la estructura y la naturaleza de este diccionario en sus mltiples aspectos. Este es, pues, el principal reto que tiene planteado en el momento
actual la Seccin Filolgica del Institut dEstudis Catalans por lo que respecta a su actividad lexicogrca. Llegar a conclusiones y a acuerdos sobre este punto requiere un debate complejo, puesto que entran en juego
opiniones, criterios, sensibilidades y, en suma, ideologas distintas; debemos creer, con todo, que se abordarn con serenidad los variados aspectos
de esta problemtica y que el proyecto que resulte de las deliberaciones
se llevar a buen trmino con la debida ecacia.

314

315

ACTIVIDADES LEXICOGRFICAS DA ACADEMIA


DAS CINCIAS DE LISBOA
Joo Malaca Casteleiro

Universidade de Lisboa / Academia das Cincias de Lisboa

1. nota introdutria
Uma das primeiras preocupaes da Real Academia das Cincias, fundada em Dezembro de 1779, foi desde logo a elaborao de um grande
dicionrio da lngua portuguesa. Neste empreendimento comearam a
trabalhar, em meados do ano seguinte, os acadmicos Pedro Jos da Fonseca, Bartolomeu Incio Jorge e Agostinho Jos da Costa de Macedo, os
quais conseguiram, ao m de treze anos de intenso labor, publicar, em
1793, o primeiro e nico volume deste grande dicionrio, mas circunscrito
apenas letra A (Academia das Cincias 1793).
Tomando como base de trabalho o Vocabulrio Portugus e Latino, de
Rafael Bluteau (1712-1728), publicado em 10 volumes, este primeiro Dicionrio da Academia baseava-se na melhor metodologia lexicogrca da
poca, tanto portuguesa como europeia, e fundamentava-se em fontes
documentais copiosas, que abrangiam cerca de quinhentas obras, de
mais de duzentos autores diferentes. O Dicionrio que ento se arquitectava privilegiava, sobretudo, os sculos XVI e XVII, considerados como determinantes na refundao da lngua portuguesa, graas inuncia do
Humanismo e do Renascimento e ao labor literrio dos escritores clssicos, mas abrangia tambm o sculo XIV um tempo de transio e todo
o perodo medieval. Tinha uma grande preocupao normativa, com um
certo excesso purista, alis prprio da poca, mas visava essencialmente
o objectivo patritico de defesa da lngua portuguesa, que estava a ser
invadida por estrangeirismos, sobretudo de provenincia francesa, e comeava a perder terreno no plano internacional.
O primeiro Dicionrio da Academia, apesar de se quedar pela letra A,
constitui um monumento lexicogrco, pela sua riqueza, pelo seu rigor, pela
sua amplitude, assim como pela metodologia inovadora que consagra.

316

Joo Malaca Casteleiro

Este primeiro projecto da Academia repousou na poeira dos arquivos


por mais de sculo e meio. De facto, s no incio da primeira metade do
sculo XX ele foi retomado, graas iniciativa de Jacinto do Prado Coelho,
Lus Filipe Lindley Cintra, Joseph Piel e Ins Louro. Do labor destes acadmicos, sob a direco de Jacinto do Prado Coelho, secundados por vrios colaboradores externos, resultou em 1976 um novo primeiro volume
(Academia das Cincias 1976), mas, mais uma vez, apenas para a letra A
e incidindo, sobretudo, na lngua portuguesa contempornea. A metodologia lexicogrca foi renovada, com recurso lingustica moderna, nomeadamente semntica estruturalista e ao que de melhor se fazia na
lexicograa europeia.
No foram, porm, dadas Academia condies para dispor de colaboradores a tempo inteiro e novamente este primeiro volume no teve continuidade. Foi necessrio esperar at 1988, ano em que arranca o projecto
que d origem publicao, em 2001, pela Editorial Verbo, do Dicionrio de
Lngua Portuguesa Contempornea (Academia das Cincias 2001), o qual
abrange essencialmente os sculos XIX e XX. Contriburam nanceiramente para a concretizao deste projecto a Fundao Calouste Gulbenkian e o
Ministrio da Educao, alm de outras instituies, como o Ministrio da
Cultura e o Instituto Cames, que deram apoios mais pontuais.

2. caractersticas essenciais do dicionrio da lngua portuguesa contempornea


Este novo Dicionrio, que passo a designar como Dicionrio da Academia ou, simplesmente, Dicionrio, segue a linha dos seus predecessores
o primeiro, publicado em 1793, e o segundo em 1976 os quais, apesar
de abrangerem apenas a letra A, estabeleceram, cada qual na sua poca,
uma metodologia lexicogrca rigorosa, inovadora, assente em fontes
documentais muito ricas e variadas, modelar no quadro da lexicograa
europeia.
Esta obra tem como objectivo essencial honrar o desgnio inicial da
Academia, pondo disposio do pblico portugus e agora, por extenso, de todos os povos que comunicam em lngua portuguesa, um dicionrio copioso, inovador, rigoroso e normalizador do uso vocabular.
O Dicionrio da Academia regista sobretudo o lxico prprio da lngua
portuguesa contempornea e actual sculos XIX e XX perodo em que
o nosso idioma se enriqueceu com um vastssimo nmero de novas palavras, quer construdas no seu interior por prexao, suxao, compo-

Actividades Lexicogrcas da Academia das Cincias de Lisboa

317

sio e outros processos lexicais, quer importadas de outras lnguas, com


especial destaque para o francs e o ingls.
Trata-se de um Dicionrio amplo, que regista cerca de 70.000 entradas
lexicais, em ordem alfabtica, e quase 170.000 acepes ou denies de
signicados.
As denies das palavras so acompanhadas de mais de 85.000 sinnimos e de cerca de 16.000 antnimos. No interior dos artigos do dicionrio incluem-se mais de 22.000 combinatrias xas, que se usam, de
certo modo, como palavras compostas sem hfen, tais como gua morta,
corredor de fundo, sala de jantar, etc.
Os signicados ou acepes das palavras so ilustrados com 33.000
abonaes ou citaes, provenientes de autores literrios, tanto portugueses como brasileiros e africanos, e ainda de autores cientcos e outros,
nomeadamente de origem jornalstica. Para ilustrar os signicados das
palavras foram ainda construdos ad hoc 90.000 exemplos de frases ou
construes. As locues e expresses idiomticas diversas, registadas no
Dicionrio, totalizam cerca de 14.000.
O lxico registado no Dicionrio abrange, no apenas o vocabulrio de
uso geral, mas tambm cerca de 32.000 termos ou acepes das diferentes reas cientcas e tcnicas, mais de 3.000 regionalismos portugueses
e ainda os neologismos recentes e os vocbulos internacionais dos nossos dias, nomeadamente os das novas tecnologias. O Dicionrio regista
igualmente, na ordem alfabtica, cerca de 700 elementos de formao
(prexos, suxos e outros), gentlicos de uso mais geral, que se referem
a continentes, pases, estados brasileiros, cidades e outros, as siglas e os
acrnimos de uso corrente, assim como as principais locues latinas.
Como obra de amplitude lusfona, o Dicionrio da Academia regista
mais de 6.000 brasileirismos, cerca de um milhar de africanismos recentes
e uma centena e meia de asiaticismos ainda actuais.
Como dicionrio padro da lngua, a presente publicao constitui uma
obra de natureza essencialmente descritiva, fundamentada no uso, embora tenha uma preocupao normalizadora em aspectos que se relacionam
com a graa, a fontica, o aportuguesamento de estrangeirismos ou a sua
substituio por formas vernculas, a hifenizao de certos compostos, etc.
No que respeita aos estrangeirismos recentes, ou seja, vocbulos importados das lnguas modernas, o Dicionrio da Academia regista cerca de um
milhar, dos quais 70% so de origem inglesa, sobretudo por via americana,
20% de origem francesa e 10% de outras provenincias. Destes, o Dicionrio
mantm, na sua forma de origem, aqueles que o uso nacional e internacional consagrou, como copyright, leasing, marketing, software, etc.

318

Joo Malaca Casteleiro

Registou, com forma aportuguesada ou semiaportuguesada, palavras


algumas delas j consagradas pelo uso de certos autores como ateli
(do fr. atelier), bibel (do fr. bibelot), brngue (do ingl. brieng), gangue (do
ingl. gang), icebergue (do ingl. iceberg), lbi (do ingl. lobby), motar (do fr.
motard), raile (do ingl. rail), stresse (do ingl. stress), trica (do russo troika),
etc. Props formas vernculas, por traduo, em casos como alta-delidade, em vez do ingl. hi-, assalto, em vez do ingl. round, empregado de
bar, em vez do ingl. barman, churrasco, em vez do ingl. barbecue, correio
electrnico, em vez do ingl. e-mail, registo de embarque/entrada, em vez
do ingl. check-in, resultado, em vez do ingl. score, saber-fazer, em vez do
ingl. know-how, etc.
No domnio dos estrangeirismos foi preocupao da Academia proteger de excessos a lngua portuguesa, sem purismo excessivo, mas tambm sem a permissividade abusiva de certos media. O uso, por exemplo,
de 2 ou 3% num texto, de termos estrangeiros, na sua graa de origem,
no desvirtuar, com certeza, o esprito do idioma. O mesmo no acontecer, porm, se no mesmo texto ocorrerem 10 ou 15% de palavras estrangeiras, na sua forma de origem. Seguiu-se, alis, no que concerne a
este caso, a mesma preocupao dominante em outras lnguas, como, por
exemplo, o espanhol ou o francs.
Todas as entradas lexicais do Dicionrio apresentam, alm da classicao gramatical, a transcrio fontica da pronncia, segundo a norma
culta, aproximada, de Lisboa e Centro do pas, excepto em abreviaturas,
elementos de formao, locues latinas e smbolos.
O Dicionrio apresenta igualmente a etimologia das palavras, com
excepo de certos compostos hifenizados (algodo-em-rama, m-desemana, etc.), das contraces (, deste, etc.), das locues latinas (ad hoc,
status quo, etc.) e dos smbolos (Ag, NW, etc.).
O Dicionrio da Academia constitui uma obra mpar no panorama
lexicogrco portugus, pela amplitude e variedade do lxico registado,
pela riqueza das acepes ou signicados que apresenta, pela quantidade
de sinnimos e antnimos que acompanham as denies, pela cpia de
abonaes e exemplos que ilustram as acepes das palavras, pela forma inovadora como estrutura toda a informao lexical, pelo interesse da
transcrio fontica da pronncia das palavras.

Actividades Lexicogrcas da Academia das Cincias de Lisboa

319

3. verso portuguesa do dicionrio houaiss da lngua


portuguesa
Uma tarefa a que lanmos mos na Academia, no seguimento da
publicao do dicionrio acima referido e em colaborao com o Instituto Antnio Houaiss, do Rio de Janeiro, consistiu na elaborao da verso
portuguesa do Dicionrio Houaiss da Lngua Portuguesa, entretanto publicado no Brasil (Houaiss 2001).
Esta tarefa, ou seja, a adaptao da verso brasileira deste dicionrio
norma europeia do portugus, apresentou-se como um desao lexicogrco muito interessante e que era difcil recusar, pelas seguintes razes:
(a) Era a primeira vez que se procedia adaptao norma europeia
do portugus de um dicionrio em verso brasileira, o que constitua, sem
dvida, uma experincia inovadora e de grande alcance para a Lexicograa Portuguesa.
(b) Este dicionrio era a obra de uma vida de um dos mais eminentes
llogos brasileiros, como foi Antnio Houaiss.
(c) Esta obra procurava abranger o vastssimo domnio geogrco da
Lusofonia, na medida em que inseria africanismos e asiaticismos dos pases e territrios de lngua portuguesa.
(d) Dava especial destaque diversidade lexical do portugus, numa perspectiva comparativa, sem, contudo, prejudicar a unidade essencial da lngua.
(e) Permitia desenvolver laos de uma ecaz cooperao lexicogrca
entre a equipa portuguesa, que colaborou na concluso do Dicionrio da
Academia, e a equipa brasileira do Dicionrio Houaiss.
(f) Constitua para o mundo de lngua portuguesa mais uma importante obra de referncia lexicogrca.
O trabalho de adequao ao portugus europeu de um dicionrio de
to grande envergadura, com cerca de 218.000 entradas lexicais, no devia
limitar-se apenas s divergncias ortogrcas, como eventualmente poderia esperar-se, mas tinha de abarcar tambm vrios domnios da gramtica, como a ortopia, igualmente com reexos na ortograa, a morfologia, a
sintaxe e a semntica. Assim, na verso portuguesa do Dicionrio Houaiss
tivemos necessidade de inserir variadssimas alteraes, umas relacionadas com a macroestrutura e outras respeitantes redaco e estruturao
dos prprios artigos. A elaborao da verso portuguesa do Dicionrio
Houaiss ocupou-nos cerca de dezoito meses. Este foi publicado pelo Crculo de Leitores, em seis volumes, em 2002-2003 (Houaiss 2002-2003).

320

Joo Malaca Casteleiro

4. elaborao do novo dicionrio da lngua portuguesa


Concluda a verso portuguesa do Dicionrio Houaiss, comemos a
dar corpo a um novo projecto, que consistia na elaborao de um novo
dicionrio de tipo escolar, que pudesse caber num nico volume, mais
manusevel, e satisfazer melhor s necessidades de aprendizagem e
ensino da lngua nas escolas, numa perspectiva de produo textual ou
codicao e no apenas concebido na ptica da compreenso ou descodicao lexical. De facto, os dicionrios de tipo escolar disponveis satisfaziam mais a esta ltima perspectiva do que primeira.
A nomenclatura do dicionrio foi estabelecida progressivamente,
com mtodos inovadores baseados na investigao lingustica e no uso
de novas tecnologias. Assim, a estruturao inicial da nomenclatura, que
constituiu o seu ponto de partida, alicerou-se nas cerca de 2.200 palavras
resultantes da investigao sobre o Portugus Fundamental pelo Centro de Lingustica da Universidade de Lisboa (Bacelar do Nascimento et
al 1987). A este primeiro acervo lexical foram sendo progressivamente
acrescentadas entradas, como resultado de pesquisa e seleco a partir de
corpora seleccionados, de comparao com outras obras da lexicograa
portuguesa e brasileira e de pesquisa em motores de busca da Internet.
nomenclatura assim seleccionada foram ainda acrescentadas as entradas de programas escolares seleccionados do ensino bsico e secundrio
e da Terminologia Lingustica para o Ensino Bsico e Secundrio.
A nomenclatura deste dicionrio , por um lado, mais restrita, abrangendo apenas cerca de 53.700 palavras, em contraste com as cerca de 70.000
do Dicionrio da Lngua Portuguesa Contempornea, j que se eliminaram,
entre outros, os verbetes correspondentes a regionalismos, brasileirismos,
africanismos e asiaticismos. Em contrapartida, nas cerca de 53.700 entradas
lexicais entra um grande nmero de palavras novas no registadas no dicionrio anterior. Este dicionrio comporta cerca de 130.000 acepes, mais de
73.500 sinnimos e quase 13.000 antnimos e ainda aproximadamente 64.000
exemplos, ilustrativos do uso das palavras que constituem a nomenclatura
do dicionrio. Por motivos de natureza prtica e de economia textual, no
foram tidas em conta abonaes ou citaes literrias e outras.
A estrutura dos artigos ou verbetes do novo dicionrio diferente e
inovadora quanto ao modelo lexicogrco adoptado. Assim, merecem
destaque, como caractersticas inovadoras, entre outras, a diviso silbica
para translineao das palavras, apresentada logo na entrada lexical; a
classicao morfossintctica dos verbos e respectiva exemplicao; os
quadros de conjugao verbal; a juno, na mesma entrada lexical, de pa-

Actividades Lexicogrcas da Academia das Cincias de Lisboa

321

lavras homnimas com idntica etimologia mas classicao gramatical


diferente.
A redaco dos verbetes teve claramente a inteno didctica de explicitao do conhecimento da lngua, aliada necessidade de clareza e
simplicidade das denies. Como trabalho prvio redaco do dicionrio, foi feita uma lista reduzida dos denidores a utilizar num dicionrio de cariz didctico. Para tal objectivo, foi estabelecido um conjunto de
denies baseado num nico ncleo de denio, funcionando a denio dos verbetes da mesma famlia com base na denio do verbo.
Esta opo teve em conta, alm de critrios de economia, a necessidade de
os aprendentes da lngua tomarem conscincia da capacidade produtiva
do portugus, atravs dos seus mecanismos regulares de exo, de derivao, de composio e outros.
O Novo Dicionrio da Lngua Portuguesa contm uma classicao
explcita de todas as regncias verbais e respectiva exemplicao. Esta
classicao segue a nomenclatura da Terminologia Lingustica para o
Ensino Bsico e Secundrio aprovada em Dirio da Repblica, em Dezembro de 2004.
Na elaborao dos verbetes respeitantes aos verbos foi dada informao quanto conjugao verbal, o que levou criao de 59 paradigmas verbais. A cada um dos 7.683 verbos includos na nomenclatura do
dicionrio foi atribudo o paradigma correspondente sua exo, com
indicao da defectividade verbal.
Em suma, este Novo Dicionrio apresenta-se como um instrumento
de aprendizagem muito til para o consulente que deseje esclarecer e
compreender as suas dvidas, adquirir conhecimentos e melhorar a utilizao que faz do portugus, quer como lngua materna, lngua segunda
ou lngua estrangeira.
Infelizmente, este Dicionrio, apesar de concludo em ns de 2005, ainda no est publicado.

5. novas tarefas lexicogrficas da academia


Uma das tarefas mais importantes que esto em curso respeita elaborao da segunda edio do Dicionrio de Lngua Portuguesa Contempornea. O principal objectivo desta edio o de corrigir as gralhas, erros
e lacunas da primeira e aumentar a nomenclatura para cerca de 90.000 a
95.000 entradas. Outro objectivo, no menos importante, consiste na reviso das fontes documentais, assim como na sua ampliao, a m de

322

Joo Malaca Casteleiro

se inclurem autores de referncia que no foram contemplados na primeira edio e alargar tal incluso a novos escritores, entretanto surgidos
e cuja qualidade literria seja reconhecida. Torna-se necessrio tambm
rever alguns modelos especcos dentro da elaborao dos artigos, visando uma maior sistematizao e rigor lexicogrcos. Encontra-se j revista
e actualizada a maior parte da letra A, que inclui cerca de 2.400 artigos ou
acepes novas e foi j efectuada a redaco, segundo o novo modelo da
2 edio, de aproximadamente 7.200 artigos ou acepes novas para as
outras letras do dicionrio.
O Dicionrio da Lngua Portuguesa Contempornea, que abrange apenas os sculos XIX e XX, o primeiro de uma trilogia que deve ser completada com um Dicionrio da Lngua Portuguesa Medieval, para os sculos
XII a XV e um Dicionrio da Lngua Portuguesa Clssica, para os sculos
XVI a XVIII.
O Dicionrio da Lngua Portuguesa Medieval encontra-se j em curso de elaborao, no mbito de uma cooperao muito oportuna entre
a Academia e o Centro de Lingustica da Universidade Nova de Lisboa.
Nesta tarefa colaboram tambm as Professoras Maria Francisca Xavier,
Maria de Lurdes Crispim, a Doutora Alexandra Fiis e outros colaboradores. Este projecto apoiado nanceiramente, nomeadamente atravs da
concesso de algumas bolsas de investigao, pela Fundao para a Cincia e Tecnologia do Ministrio da Cincia, Tecnologia e Ensino Superior.
Sobre este projecto no adiantarei mais nada, uma vez que a Professora
Maria Francisca Xavier o fai neste mesmo volume.

323

PASADO, PRESENTE E FUTURO NOS TRABALLOS


LEXICOGRFICOS DA REAL ACADEMIA ESPAOLA
Guillermo Rojo

Universidade de Santiago de Compostela / Real Academia Espaola

1. introducin
Tratarei de esbozar as lias xerais da lexicografa acadmica no pasado, as caractersticas bsicas do que se est a facer na actualidade e os
parmetros esenciais que, na mia opinin, van determinar a sa evolucin no futuro inmediato.

2. o pasado
Como ben sabido, os primeiros Estatutos da Real Academia Espaola establecen con toda claridade as obrigas que os seus fundadores consideran inescusables na complicada etapa pola que pasaba o espaol no
primeiro cuarto do sculo XVIII: publicacin dos tres grandes cdigos nos
que, ao seu entender, estaba baseada a importancia e consistencia dunha
lingua, isto , un dicionario, unha gramtica e unha ortografa. A esas tres
grandes obras engadan outras como, por exemplo, unha historia da lingua
e unha potica. As tres primeiras foron aparecendo no decurso do sculo e a primeira delas, o dicionario, foi, como tamn ben coecido, unha
autntica novidade nas obras lexicogrcas. Resulta realmente asombroso
que aqueles primeiros acadmicos, sen formacin tcnica ningunha, conseguiran en soamente 26 anos preparar os materiais, redactar e publicar a
totalidade dunha obra que superaba, con bastante distancia, os estndares
da poca. O coecido habitualmente como Diccionario de Autoridades segue a ter grande utilidade hoxe, e non unicamente no referente historia
da lexicografa.
Despois da publicacin da primeira edicin da Ortografa e en paralelo cos traballos de preparacin da futura Gramtica, acometeron a

324

Guillermo Rojo

segunda edicin da obra, na que pensaban aplicar numerosas melloras


tcnicas, incorporar un grande nmero de voces que non aparecen en Autoridades e tamn eliminar algunhas das que guran na edicin. O ritmo
foi xa bastante diferente e a obra non chegou a aparecer nunca. O primeiro tomo da segunda edicin sau en 1770 co que temos a posibilidade
de estudar as diferenzas de concepcin entre as das e pouco despois
decidiron acometer os traballos de reducin da obra, para facela mis accesible. O resultado desa decisin o Diccionario de la lengua castellana
compuesto por la Real Academia Espaola, reducido a un tomo para su
ms fcil uso, publicado en 1780 (RAE 1780). En realidade, non unha obra
distinta da anterior, senn o que queda dela despois de srenlle retiradas
as autoridades, os textos que aboan cada unha das palabras e acepcins
mencionadas.
O proxecto do dicionario grande non abandonado, seguen a traballar nel durante bastantes anos, pero son as sucesivas edicins do DRAE
as que absorben a maior parte dos esforzos dos acadmicos da poca. O
dicionario comn emprende as, con este mal paso inicial, un camio irregular, que agora podemos seguir con comodidade en todos os seus detalles grazas existencia do Tesoro lexicogrco del espaol, a disposicin
dos interesados na pxina electrnica da Academia.
Non posible, nin teo eu competencia para facelo, afondar aqu nos
detalles da evolucin experimentada por esta obra que, con todos os seus
defectos, a columna vertebral, a espia da lexicografa hispnica. Moitas das edicins feitas nos case que douscentos cincuenta anos seguintes
limtanse a facer algunhas adicins de palabras ou acepcins ou corrixir
pequenos detalles nas denicins. Outras, en cambio, establecen tos importantes polas adaptacins estruturais que supoen ou ben, coma as de
1925 e 2001, pola atencin especial prestada s voces usadas en Amrica.
En rpida sntese, as caractersticas bsicas de toda a vida do DRAE
anterior edicin de 2001 eran as seguintes:
(a) As edicins sucesivas an retocando as anteriores na medida e direccins que en cada caso se consideraban axeitadas. Non se produca nunca
unha reformulacin radical do DRAE, polo que, mesmo anda na versin
actual, posible localizar acepcins que teen unha formulacin non moi
distinta da que aparece en Autoridades.
(b) Anda que publicado pola Academia Espaola, o DRAE foi considerado sempre unha obra colectiva, na que a colaboracin das Academias
americanas era imprescindible. A Academia espaola favoreceu a creacin de Academias nas vellas colonias americanas e tamn en Filipinas.

Pasado, presente e futuro nos traballos lexicogrcos da Real Academia Espaola

325

As Academias americanas controlaban as propostas de modicacin, que


se publicaban no BRAE, e facan propostas de inclusin de voces especcas dos pases respectivos. Dende a creacin da Asociacin de Academias
de la Lengua Espaola, en 1951, hai unha Comisin permanente da Asociacin, que, formada por representantes de diferentes Academias, traballa
en Madrid durante cinco meses cada ano. Esa Comisin a que se ocupa
de tomar as decisins pertinentes sobre as voces americanas.
(c) A pesar da competencia dos tcnicos e da boa disposicin dos acadmicos, a documentacin manexada habitualmente para o DRAE resultaba
escasa e, en moitos casos, deciente. A decisin de prescindir das autoridades creou uns hbitos de traballo que en moitas ocasins levaron a reducir
a documentacin previa que guraba noutras obras lexicogrcas (en
moitos casos transmitida dunhas a outras) ou a basearse nas achegas persoais de acadmicos ou correspondentes. De aqu derivaba tamn unha
dicilmente salvable descompensacin de materiais (por citar un nico
factor, na edicin actual hai 576 acepcins distribudas en 526 entradas que
levan a marca correspondente provincia de Salamanca).
O DRAE , sen dbida ningunha, o elemento central da lexicografa acadmica, pero, como ben sabido, non o nico. Flanquano, por unha parte,
o Diccionario manual (RAE 1927), que tivo varias edicins e ofreca unha forma til e cmoda de paliar os efectos negativos da s veces excesiva distancia entre edicins sucesivas da obra de referencia e tamn un lugar no que
formular propostas provisorias que non se consideraba axeitado introducir
directamente no DRAE. Pola outra, o Diccionario histrico, que pretenda ser
un dicionario integral do espaol de todas as pocas en todas as sas variedades. Tras do intento frustrado anterior guerra civil (RAE 1933-1936), o
proxecto de Casares, ben fundamentado nos presupostos metodolxicos da
poca na que foi concibido, deu lugar a unha importante recolleita de material, estimado nuns doce millns de papeletas, pero os atrasos producidos
polo choque entre uns obxectivos excesivamente ambiciosos e a imposibilidade de manter os recursos humanos e materiais que precisaran levou a
Academia a suspender o proxecto en 1996 para reenfocalo dende una perspectiva distinta.
A falla destes outros dous elementos do conxunto explica probablemente algunhas das caractersticas menos positivas do DRAE. Tia que
ser un rexistro do xa consolidado e bendicido polo uso culto en todo o
mundo hispnico, pero tamn deba dar orientacins sobre formas que
se estaban difundindo, co risco que iso supn. Tia que ser un dicionario
de uso do espaol actual, pero tamn tia que axudar a quen necesitaba

326

Guillermo Rojo

consultar formas ou expresins dos textos clsicos. Non doado conxugar nunha obra nica obxectivos tan discordantes entre si.

3. o presente
A actuacin da Real Academia Espaola nos ltimos anos est marcada pola intencin de crear as condicins necesarias para remediar os defectos e inconsistencias da etapa anterior. En primeiro lugar, sen dbida,
a orientacin panhispnica de todos os seus traballos. O obxectivo declarado, que a consecucin dunha norma culta unitaria que non negue as
peculiaridades das normas nacionais ou areais non , en denitiva, nada
mis que o recoecemento das caractersticas xeogrcas, sociopolticas
e culturais do espaol no mundo actual. Existe unha estreita colaboracin entre as 22 Academias que integran a Asociacin, manifestada no
feito de que as publicacins son conxuntas a partir da Ortografa, aparecida en 1999. E, por suposto, non se trata simplemente da publicacin:
o sistema de traballo adoptado habitualmente consiste na designacin
dun responsable de cada proxecto en todas as Academias e a constitucin dunha comisin interacadmica, estruturada por reas lingsticas,
que examina todos os materiais e valora as observacins formadas polas
diferentes Academias.
Evidentemente, xar como obxectivo un espaol xeral, relativamente unitario ao tempo que respectuoso coas caractersticas rexionais s
posible cun decidido investimento en infraestrutura documental. Esa
a intencin coa que a RAE decidiu en 1995 emprender a confeccin do
Corpus de referencia del espaol actual (CREA) e, poucos meses despois,
como primeiro paso tamn para o novo proxecto de Diccionario histrico,
do Corpus diacrnico del espaol (CORDE). Na actualidade (novembro de
2006), o CREA, a disposicin pblica dende 1998, consta duns 155 millns de
formas grcas procedentes de textos dos mais diversos tipos e de todos
os pases hispnicos, producidos entre 1975 e 2004. Pola sa parte, o CORDE
contn textos dende as orixes do idioma ata 1974 e consta actualmente
de algo mis de 270 millns de formas. En conxunto, pois, mis de 400
millns de formas coas que os investigadores poden documentar e estudar o uso, a difusin, a frecuencia e mis a evolucin de palabras e de
expresins do espaol de todos os tempos. O Diccionario panhispnico de
dudas (DPD), o Diccionario del Estudiante (RAE 2006) o Diccionario esencial
(RAE 2005) e, naturalmente, a prxima edicin do DRAE estn construdos
a partir destes dous enormes crpora textuais.

Pasado, presente e futuro nos traballos lexicogrcos da Real Academia Espaola

327

A utilizacin de recursos electrnicos, non poda ser doutra forma,


constite outra marca distintiva do traballo da RAE na actualidade. As
tcnicas da lingstica de corpus son, como acabo de sinalar, as utilizadas
na recolleita do material no que se documenta e contrasta o contido das
diversas obras lexicogrcas e tamn a nova Gramtica. Por outra parte, o
DRAE xa realmente unha base de datos lexicogrcos organizada para
que poida conter non soamente a entrada tal e como aprobada nas Comisins correspondentes, senn tamn toda a historia interna e o propio
decurso administrativo polo que pasa. Grazas ao seu carcter electrnico,
posible agora no DRAE realizar un autntico control do dicionario (referencias internas, por exemplo), garantir a autocontencin ou engadir
estruturacins adicionais, como, por exemplo, a marcacin temtica acabada recentemente, que permitir, por exemplo, acometer a revisin do
DRAE por reas. Finalmente, os recursos electrnicos serven para a difusin da obra, que pode aparecer agora en formas ou presentacins imposibles sen eles. O DRAE, por exemplo, pon a disposicin dos interesados
a 22 edicin, publicada en papel e CD, e tamn, como adianto da 23, as
palabras ou acepcins xa aprobadas polas Academias para a sa inclusin.
Faciltase desde xeito a consulta dunha obra permanentemente actualizada, algo imposible de conseguir polos procedementos tradicionais. Os
dezaoito millns de consultas que recibiu a versin electrnica do DRAE
en setembro do 2006 son testemua able da importancia adquirida por
este recurso.
Todo o anterior, anda que centrado no DRAE, aplcase tamn s
outras obras de carcter lexicogrco que as Academias publicaron recentemente e que, nunha consideracin global, pretenden atender a
obxectivos especcos e, por tanto, descargar o DRAE da necesidade de
atendelos. O DPD pretende dar resposta s dbidas lingsticas dos falantes do espaol, nesa perspectiva unitaria e diversa que xen referencia anteriormente, tratando de dar as razns que avalan a(s) solucin(s)
ofrecida(s) en cada caso e actuando tamn como o instrumento no que
as Academias fan as propostas que estiman mis aconsellables nos casos
nos que se detecta vacilacin. O Diccionario del estudiante reformula e
adapta o contido do DRAE s necesidades dos nosos estudantes do ensino
medio. Por n, o Diccionario esencial, que acaba de aparecer, selecciona
do DRAE, mediante contraste cos datos do CREA, as palabras e acepcins
correspondentes a ese espaol xeral que se busca e engdelle aquelas que
estn xa aprobadas para a prxima edicin.

328

Guillermo Rojo

4. o futuro
Esta a lia bsica na que a Academia pretende proseguir o seu traballo no futuro inmediato, unha lia marcada fundamentalmente pola
colaboracin intensa entre todas as Academias, a utilizacin en profundidade dos recursos electrnicos, a reestruturacin do DRAE para adaptalo
aos mis recentes avances da dicionarstica e organizacin dos recursos
existentes nun plan de lexicografa integrada que se manifeste en obras
con obxectivos distintos, complementarias entre si.
Amais das citadas no pargrafo anterior, nesta nova xeira o DRAE estar
acompaado doutras das obras que completarn o panorama da lexicografa do espaol. En primeiro termo, o Nuevo Diccionario histrico de la lengua
espaola, que acaba de comezar unha nova formulacin que nos permitir
dispor nun mximo de quince anos da historia dos 50.000 lemas centrais do
espaol. En segundo lugar, o Diccionario acadmico de americanismos, que
dar cumprimento a unha vella aspiracin da Asociacin de Academias.
Con todo isto, a prxima edicin do DRAE, que podera aparecer no
2013, en conmemoracin do terceiro centenario da creacin da Real Academia Espaola, corresponder a unha obra resituada en obxectivos e caractersticas. O DPD ter a misin de facer propostas en terreos nos que
a norma non est anda sucientemente ben establecida. O DH dar a
historia dos signicados e, naturalmente, conter tamn as voces que xa
non se utilizan e as acepcins desusadas. O DAA, pola sa parte, conter
os americanismos que non sexan de uso xeral. En consecuencia, o DRAE,
desprendido destes compoentes que o arredan do seu obxectivo central,
quedar relevado desas obrigas secundarias que escurecen a sa nalidade fundamental e poder ser sometido a esa revisin en profundidade
que a longa historia da obra central da lexicografa hispnica est demandando en realidade desde a sa primeira edicin.

329

O TESORO DELLA LINGUA ITALIANA DELLE ORIGINI:


O FUTURO DO ITALIANO ANTIGO?
Pr Larson

Opera del Vocabolario Italiano (CNR)

A Opera del Vocabolario Italiano (OVI) un instituto de investigacin


no campo da lingstica que pertence ao Consiglio Nazionale delle Ricerche (CNR) un organismo estatal anlogo ao Consejo Superior de Investigaciones Cientcas e que ten a tarefa institucional de elaborar un vocabulario histrico da lingua italiana.
Dito desta maneira, soa moi ben, pero toda persoa que observe o substancial das cousas percibe rapidamente que se trata dun labor ideal,
unha empresa irrealizable se se consideran as posibilidades reais do OVI
de hoxe, cos seus catorce traballadores. Por tanto, lxico que desde hai
dez anos eu e os meus colegas nos esteamos ocupando dun labor, sempre
vasto, pero mis reducido e por isto concretamente factible: a primeira
tranche, a primeira seccin do proxecto que mencionei anteriormente,
un vocabulario histrico do italiano antigo chamado Tesoro della Lingua
Italiana delle Origini (TLIO).

330

Pr Larson

A actividade de redaccin do TLIO, despois de tantos anos de traballos


preparatorios1 que s veces foron tamn dispersivos, debo admitilo comezou a se concretar s nos anos noventa do sculo pasado, cando decidimos que a base de datos textual era o bastante grande para que se puidese
iniciar a redaccin das primeiras voces, que despois se publicaron directamente, no 1997, na nosa pxina web (http://www.vocabolario.org).
Mencionei a base de datos como cousa coecida, mais creo que sera
necesario explicar con maior detalle de que se trata, xa que esta base de
datos a que converte TLIO en algo completamente novo en Italia. De feito,
as nosas voces de vocabulario redctanse sobre materiais dun corpus informatizado e non reutilizando e reelaborando os traballos desenvolvidos
polos lexicgrafos das xeracins precedentes, como ten acontecido sempre
nalgunha medida cos grandes dicionarios italianos (e tamn en traballos
semellantes noutros pases), que debemos, non obstante, tomar sempre
en consideracin, xa que estou falando do glorioso anda que moi envellecido Vocabolario della Crusca, do tamn glorioso Tommaseo / Bellini
1.

O Tesoro, e o propio OVI, naceron no seo da Accademia della Crusca nos anos sesenta do pasado sculo:
soamente nos comezos dos anos oitenta pasaron a ser xestionados polo CNR. Para termos unha idea do
vasto proxecto inicial e do entusiasmo que o alentaba pode resultar interesante a lectura dunha serie de
artigos do principal promotor do proxecto, o grande lingista Giacomo Devoto (1969: esp. 136-171) (trtase
de textos publicados no xornal orentino La Nazione entre 1964 e 1968).

O Tesoro della Lingua Italiana delle Origini: O futuro do italiano antigo?

331

(1865-1879) e do recentemente nalizado Grande Dizionario della Lingua


Italiana (GDLI). Todos estes dicionarios abranguen tamn a fase antiga da
lingua, pero non se ocupan especicamente dela, e para a poca antiga
refrense ademais a un corpus moito mis pequeno e mis literario que o
noso. Dicionarios tradicionais deste tipo tenden, pois, a falsear a visin da
lingua antiga, dada a sa formulacin teleolxica, observando sempre o
antigo a travs do ltro do moderno, como algo que nos leva ao moderno.
Polo contrario, o Tesoro redctase ex novo, as que, se tamn ns cometemos erros, polo menos os nosos son erros orixinais e non herdados dos
nosos predecesores! O corpus est constitudo idealmente2 por todos os
textos en italiano antigo redactados nos primeiros sculos e editados dalgunha forma. O lmite cronolxico ante quem, nunha primeira fase dos
traballos, fora xado no ano 1375 ano da morte de Giovanni Boccaccio,
a ltima das chamadas Tres Coroas (Tre Corone) da literatura italiana3,
pero desde hai algns anos desprazmolo ao ano 1400, onde permanecer, anda que este lmite se supere nalgns casos.
Podera ser til subliar un feito tan ben coecido que frecuentemente o esquecemos: a lexicografa italiana nace, nun certo sentido, como
lexicografa histrica. Os acadmicos da Crusca, a diferenza do que faran
mis tarde os acadmicos de Francia e de Espaa, codicando linguas
orais xa existentes4, publicaron o seu primeiro Vocabolario no 1612 (os
traballos preparatorios comezaran no 1591) para fornecer unha lingua literaria construda preferentemente na imitacin da lingua dos escritores
orentinos do secolo doro, o sculo XIV:
Nel compilare il presente Vocabolario [...] abbiamo stimato necessario di ricorrere allautorit di
quegli scrittori, che vissero, quando questo idioma principalmente fior, che f da tempi di Dante,
o ver poco prima, sino ad alcuni anni, dopo la morte del Boccaccio. Il qual tempo, raccolto in una
somma di tutto un secolo, potremo dir, che sia dallanno del Signore 1300 al 1400 poco pi, o
poco meno [...] (Vocabolario della Crusca 1612: f. a3v -A lettori-).

Os Cruscanti baseronse s parcialmente nos usos da fala viva da


poca, para concentrarse nun canon de textos considerados como norma,
elixido seguindo criterios de pureza lingstica anda mis que de excelencia literaria. Deste punto de vista ideolxico resultan interesantes as
2.

Uso este termo porque, anda sendo moi extenso, con 1.960 textos, 21.779.246 ocorrencias, 442.770 formas
distintas, 116.597 lemas, 3.576.383 ocorrencias lematizadas, o corpus non est completo e contina a crecer.

3.

Trtase de Dante Alighieri (1265-1321), Francesco Petrarca (1304-1374) e Giovanni Boccaccio (1313-1375).

4.

A primeira edicin do Dictionnaire de lAcadmie franoise data do ano 1694; a primeira do Diccionario de
la Real Academia Espaola do 1780.

332

Pr Larson

modicacins do mesmo ttulo do vocabulario nos anos inmediatamente


precedentes sua publicacin, coa referencia, mis poltica que lingstica, lingua toscana e a mencin, proposta para despois ser retirada a
continuacin, da lingua viva de Florencia:
1608: Vocabolario della lingua toscana degli Accademici della Crusca
1610: Vocabolario della lingua toscana cavato dagli scrittori e dalluso della citt di Firenze dagli Accademici
della Crusca
1611: Vocabolario degli Accademici della Crusca

A base fontica e morfolxica do italiano estndar moderno remonta


as cando menos nos seus trazos esenciais visin que da lingua orentina do sculo XIV tian os estudosos do tardo sculo XVI.
O TLIO , pois, un vocabulario histrico do italiano antigo, desde os
primeiros textos breves dos sculos IX e X despois de Cristo ata nais
do sculo XIV. En verdade, falar de lingua italiana referndose poca
medieval un anacronismo: s a partir do sculo XVI se pode comezar
a falar dunha lingua italiana codicada non identicable con ningunha
das variedades faladas daquela na pennsula apennica5. Ata o de agora
os lexicgrafos e os lingistas histricos ocupronse do italiano antigo
privilexiando a perspectiva de antecesor directo da lingua moderna, isto
, a antiga variedade da Toscana e sobre todo da cidade de Florencia (con
algunha rara excepcin en casos mis ou menos illados como o umbro da
poesa relixiosa de Jacopone da Todi). Nun contexto rigorosamente lingstico, no interior dun ambicioso proxecto recente no cal tiven unha
pequena participacin, a Grammatica dellitaliano antico dirixida por
Giampaolo Salvi (Budapest) e Lorenzo Renzi (Padua) (Salvi / Renzi no prelo), o italiano antigo identicado co orentino do sculo XIII, a variedade que est na base do italiano literario e do italiano estndar moderno:
e esta sen dbida unha denicin aceptable, pero non a nosa.
Se quixese ser preciso e inatacable debera ter dito que o TLIO un
vocabulario histrico das antigas variedades italorromances, por mis
que a cmoda expresin italiano antico encontre equivalentes perfectos noutras denicins lingsticas anlogas como old English, ancien
franais, Althochdeutsch e espaol antiguo, que denen tamn conxuntos
dialectais heteroxneos, coexistentes no mesmo continuum xeogrco e
sen ningunha norma supradialectal.
5.

A data tradicional o ano 1525, no que se publica a primeira edicin da Prose della volgar lingua de Pietro
Bembo, onde se propn como norma literaria italiana o orentino do sculo XIV.

O Tesoro della Lingua Italiana delle Origini: O futuro do italiano antigo?

333

No OVI adoptamos sistematicamente esta denicin moi ampla da


expresin italiano antico: e este feito o que quixen sinalar co ttulo do
meu traballo. Ademais, non xemos escollas entre os xneros. Os vellos
dicionarios, que, como dixen, queran proporcionar un modelo de lingua
escrita para imitar, sempre consideraron case exclusivamente a lingua
literaria e relegaron os outros rexistros; para ns, non obstante, valen o
mesmo, e frecuentemente mis, os termos que aparecen en textos tcnicos e lexislativos (onde s veces posible coecer con maior precisin
o seu valor semntico) que os usados polos grandes escritores. O feito de
que o corpus se construse como unha base de datos coloca todos os textos ao mesmo nivel, e o principal criterio de seleccin dos exemplos o
cronolxico, xa non o do xnero do texto ou a sa orixe xeogrca.
Un pequeno excursus: entre as antigas variedades italorromances
existen tamn variedades moi afastadas entre si, polo menos tanto como
as variedades romances da pennsula ibrica: abonda con comparar, por
exemplo, un texto de Miln, un de Xnova, un de Perugia e un de Sicilia
para comprendelo: as isoglosas que separan a Lombarda da Sicilia son
probablemente mis numerosas que as que separan Catalua de Castela
e de Galicia. A pesar disto, a vontade dos escritores e dos gobernantes dos
diversos estados italianos impediu que se formasen verdadeiras linguas
autnomas, as que a escolla do modelo toscano non foi o resultado dunha imposicin Florencia non dominaba politicamente ningn territorio
fra da Toscana! senn o resultado dunha imitacin literaria voluntaria
e gradual.
O corpus do TLIO foi creado a propsito para a redaccin do vocabulario, pero tamn un instrumento independente. Por esta razn decidimos
facelo accesible a todos os usuarios, e debo dicir que fan un uso intenso
del6. Desde hai varios anos o corpus consultable a travs do sitio ItalNet,
creado e mantido por un consorcio formado polo OVI, das universidades
estadounidenses (Chicago e Notre Dame) e unha universidade britnica
(Reading); no 2005 puxemos tamn na rede unha versin do noso software interno, o GATTO (do que non falarei agora, pois esixira case unha
conferencia completa), chamada GattoWeb, que permite a calquera usuario efectuar consultas no corpus, para integrar os datos proporcionados
polo TLIO, ou para investigacins privadas de todo tipo.
Despois desta premisa extremadamente sumaria volvo falar do
mesmo TLIO, cuxo lugar de publicacin ocial e primaria o noso sitio
6.

Para demostrarlle ao Consiglio Nazionale delle Ricerche que merecemos existir (xa que hai que facelo!)
recollemos no sitio web un elenco de traballos cientcos que usan os nosos recursos.

334

Pr Larson

web (http://tlio.ovi.cnr.it/TLIO/). verdade que unha seleccin de voces


se imprime cada ano no noso anuario, o Bollettino dellOpera del Vocabolario Italiano, pero trtase sempre dunha escolla representativa e non
da producin anual total de das mil voces7. Son consciente de que esta
ltima cifra redonda pode parecer estraa, pero xa que formamos parte
dun organismo estatal que coordina institutos de investigacin en moitos campos diversos e pertencentes a maior parte s chamadas ciencias
puras decidimos declarar como tarefa anual esta cifra redonda de voces
(aos burcratas gstanlles as cifras exactas), anda que todos ns sabemos
que os nmeros no noso campo non signican nada. Dicir 2.000 voces de
vocabulario cada ano como dicir 1.960 textos no corpus, xa que un texto pode ser unha inscricin de das lias sobre un sarcfago do sculo XII,
pero tamn poden ser os catorce mil hendecaslabos da Divina Commedia
de Dante ou os cen relatos do Decamerone de Giovanni Boccaccio.
Actualmente temos en rede mis de 17.000 voces, que pertencen maioritariamente s primeiras letras do alfabeto, anda que tamn a outras, s
veces dunha maneira un pouco abrupta. Mais non tanto: e para ilustralo
cun exemplo lxico poemos o caso da persoa que estea redactando a familia lexical de abbondare e abbondanza e decida engadir tamn os derivados
prexados sovrabbondanza, sovrabbondare e strabbondanza, ou o caso de
que o redactor da voz asbergo (un tipo de coiraza medieval) considere tamn
as variantes isbergo, osbergo, sbergo e usbergo (e mis tendo en conta que a
forma usbergo a nica que se coece un pouco hoxe, porque apareca nas
vellas edicins non lolxicas da Divina Commedia nas edicins actuais
comparece asbergo nunha expresin que se converteu logo en proverbial).
As voces do vocabulario redctanse consultando o banco de datos coa
axuda do mesmo software que se necesita para crear, corrixir, modicar e
lematizar o corpus: como xa dixen chmase GATTO. Trtase dun zonimo
accidental, o acrnimo de Gestione degli Archivi Testuali del Tesoro delle
Origini. GATTO foi producido para as nosas esixencias especcas polo
meu colega Domenico Iorio-Fili e actualzase continuamente. Se algun
tivese interese en probalo para os propios traballos pode descargalo gratuitamente desde a nosa pxina web, xunto co manual de uso.
E agora entremos no TLIO. Escolln unha voz recente, errore s.m.

7.

Ata hoxe publicronse once tomos do Bollettino, imprimidos pola editorial Edizioni dellOrso de Alessandria (http://www.ediorso.it).

O Tesoro della Lingua Italiana delle Origini: O futuro do italiano antigo?

335

En primeiro lugar encontramos o lema en forma normalizada, seguido polas indicacins da categora gramatical. O lema est na forma italiana moderna se o termo anda existe; os lemas con grafa dialectal8
utilzanse exclusivamente para os termos testemuados tan s nunha
parte determinada do dominio italorromance, posto que a tentativa de
italianizalo producira un lema cticio.
A continuacin, o lema encontra un pargrafo cero, composto por
unha serie de subpargrafos numerados de 0.1 a 0.8.
O punto 0.1 contn unha lista de todas as formas grcas do lema
presentes no corpus (nos casos de palabras sobre todo verbos rexistrados en moitas variedades lingsticas diferentes, esta lista pode ser longusima). Para reconstrur o material sobre o que foi redactada a voz a
travs desta lista chega con premer na icona co gatio a carn do lema,
na esquerda da pantalla: aparece unha pxina de consulta que leva ao
contorno GattoWeb, onde se visualiza despois o resultado completo da
bsqueda no corpus, dicir, o mesmo material sobre o cal traballou o
compilador da voz:
8.

Pode que sexa mellor que explique rapidamente que as palabras italianas dialetto e dialettale se usan con
maior liberdade que en Espaa, onde son usados frecuentemente, se estou ben informado, para descualicar as realidades lingsticas consideradas subalternas.

336

Pr Larson

O punto 0.2 est dedicado etimoloxa e serve simplemente para


identicar o lema a respecto doutras formas homgrafas e homfonas:
sempre que sexa posible limtase a un reenvo a un dos principais repertorios etimolxicos, neste caso segunda edicin do Dizionario Etimologico della Lingua Italiana (Cortelazzo / Zolli 1999)9. Nalgns casos, cando o
redactor pode descartar as hipteses etimolxicas recoecidas ou pose
materiais ou coecementos que permiten precisar a orixe dunha palabra,
o pargrafo 0.2 pode conter tamn unha discusin etimolxica orixinal.
No punto 0.3 indcase o texto que contn o primeiro testemuo do
lema e, para facilitar a navegacin no interior da voz, tamn o nmero
da acepcin onde est situado este exemplo.
O punto 0.4 ilustra o tipo de atestacin do lema: mstrase a distribucin xeolingstica inventariando os primeiros testemuos de cada rea
lingstica, divididas por comodidade en catro grupos: (1) textos setentrionais, (2) textos toscanos e corsos, (3) textos meridionais e medianos (con
mediani indcase tradicionalmente os dialectos da Umbria, das Marcas e
do Lacio, contiguos ao grupo toscano e mis prximos a el que s falas propiamente meridionais), (4) textos sicilianos. Sinlanse non s os primeiros
9.

Para as palabras derivadas de timos latinos pertencentes s primeiras letras do alfabeto, recrrese sistematicamente ao LEI.

O Tesoro della Lingua Italiana delle Origini: O futuro do italiano antigo?

337

testemuos absolutos de cada rea, senn tamn (e esta unha novidade


nosa) os primeiros testemuos en textos lingisticamente signicativos.
Estes textos, que estn marcados na bibliografa e no corpus cun TS (testo
signicativo), son aqueles que consideramos homoxneos e sinceros, e
por tanto representativos da variedade lingstica a que pertencen: trtase
sobre todo de textos de carcter prctico como libros de contas, cartas privadas, etc., que teen menor aspiracin literaria e reicten mellor a autntica lingua do escriba do que as composicins puramente literarias. Poo
un exemplo: o exemplo mis antigo nun texto de Boloa est nun poema
copiado no 1282 nos rexistros do concello chamados Memoriali bolognesi,
e citmolo no punto 0.4. Pero indicamos tamn o primeiro testemuo nun
texto bolos marcado con TS, un documento do 1295.

No punto 0.5 insrense eventuais observacins de carcter lingstico


sobre as construcins e sobre os usos sintcticos, e tamn informacins
variadas que teen que ver coa fontica, morfoloxa, etc. Aqu ten tamn
o seu lugar o ndice de locucins e da fraseoloxa rexistradas na voz (cando existen). Grazas a este ndice posible consultar as locucins en todo o
vocabulario ata hoxe publicado. Na imaxe seguinte pdense ver os resultados dunha busca onde se visualizan todas as locucins que conteen a
palabra mano, e tamn as voces onde se encontran as locucins:

338

Pr Larson

No punto 0.6 sitanse anotacins de distinto tipo: sobre os usos do


lema como nome de persoa ou de lugar, e tamn as ligazns bibliogrcas
ou as ligazns a outras voces do vocabulario.
No punto 0.7 forncese un resumo da estrutura da voz, citando as denicins das acepcins nicas e subacepcins. Anda que poida parecer
unha cousa intil, en moitos casos recorrer ao punto 0.7 pode ser suciente para orientarse dentro do TLIO: o resumo corresponde realmente lista
das acepcins que se encontra nos dicionarios tradicionais que simplemente ofrecen o signicado das palabras.
0.7 1 Lo spostarsi continuamente senza una direzione e una meta det.; tragitto di direzione estremamente variabile (percorribile soltanto in un lungo lasso di tempo). 1.1 Estens. [Con rif. ai
pianeti:] moto incessante (lungo una traiettoria det.). 1.2 Deviazione (da un tragitto det., che
costituisce il percorso corretto o usuale). 1.3 Fig. Esitazione nel compiere unazione det., indugio.
2 [Con rif. al vagare della mente:] stato di confusione emotiva; affanno, tormento (anche specif.
di natura amorosa). Fras. Essere, mettere, stare in (grande) errore; trarre derrore. 3 Cattiva valutazione
della realt o di una sua manifestazione det. (specif. il considerare vero ci che falso o viceversa).
3.1 Cattiva valutazione sensoriale (spec. visiva), che porta il soggetto a percezioni deformate della
realt o alla percezione di oggetti privi di consistenza fisica. 3.2 Opinione o comportamento non
conforme al suo oggetto o alla sua intenzione (segnatamente secondo una norma condivisa);
stato di chi non valuta correttamente la realt (per ignoranza, fraintendimento o inganno). Fras.
Cadere, vivere in errore. 3.3 Azione o effetto del distogliere lattenzione da ci che si sta facendo,
distrazione. 3.4 Difficolt di valutazione o di interpretazione della realt o portata di un oggetto o

O Tesoro della Lingua Italiana delle Origini: O futuro do italiano antigo?

339

unopinione, possibilit di dubbio o fraintendimento. Fras. Mettere in errore. 4 Stato di cose turbato,
confuso, non conforme a giustezza. 4.1 Fras. Errore di fortuna, della natura: stato di cose non conforme a quanto costituisce la normalit (assunta a metro di giustezza), dovuto a fenomeni casuali.
4.2 Non conformit di un oggetto (prodotto da unazione) alla sua intenzione o alla sua funzione,
imperfezione, difetto. 5 Divergenza di opinioni circa la valutazione di un det. evento o oggetto
(passibile di scatenare ostilit), malinteso, discordia. Fras. Essere in errore.

Finalmente, no punto 0.8 encntrase a data de redaccin e o nome


do redactor. En caso de voces revisadas ou ampliadas, pdense engadir o
nome do revisor e a data da revisin. As voces non asinadas, por tradicin,
fainas persoalmente o director. Tamn este punto mis til do que parece, porque os colaboradores vellos e novos son moitos (o nmero total,
contando tamn as persoas que traballaron en colaboracin con outros,
e tamn persoas que xeron s unha voz, de 67 persoas), e tamn se
procuramos uniformar o resultado dos seus esforzos poden quedar peculiaridades. Non obstante, a sinatura da voz serve sobre todo ao propio
redactor, que est autorizado a citar a voz do vocabulario como obra sa e
citala no seu currculo e na lista das sas publicacins.

Se agora entramos na mesma voz, a primeira cousa que percibimos


que se citan moitos exemplos para cada acepcin. Isto unha consecuencia directa da ideoloxa lingstica que expliquei antes: se por italiano
antico entendemos, como dixen, o conxunto de todas as antigas varie-

340

Pr Larson

dades italorromances temos o deber de documentar a fondo a situacin.


Existen tipos lexicais semanticamente simples pero difundidos por todo
o territorio italorromance, onde baixo unha soa acepcin son citados corenta exemplos: por esta razn a lectura do TLIO pode resultar s veces un
pouquio indixesta.
As diferenzas entre o TLIO e os outros dicionarios histricos italianos
son, como se pode ver, numerosas; mais, aln das caractersticas que acabo de ilustrar, existen outras. Antes de conclur esta mia breve exposicin mencionarei dous trazos do noso vocabulario que non estn presentes noutros instrumentos lexicogrcos anlogos.
A primeira delas a marca Glossa. Cando nun exemplo o lema tratado
vn dalgn xeito explicado ou glosado na mesma variedade lingstica
do propio texto ou nunha outra o exemplo vai precedido da abreviatura
Gl. Isto sucede nos exemplos tirados de verdadeiros glosarios bilinges:
[5] Gl Gloss. prov.-it., XIV in. (it.sett./fior./eugub.), pag. 108.1: Aziman .i. calamita.
[3] Gl Senisio, Declarus, 1348 (sic.), 53v, pag. 65.4: Circopaticus a um, animal quoddam simile simie,
sed caudatum, quod dicitur gactu maymuni.
[6] Gl Gloss. lat.-eugub., XIV sm., pag. 87.2: Hic catus, ti et hic murilegus, hic pilax, cis id est lo gacto.

Mais tamn acontece noutras glosas mis discursivas e casuais:


[4] Gl Serapiom volg., p. 1390 (padov.), Bestiario, cap. 27, pag. 433.9: E butage sovra de laqua da
alto cum grande impeto, o remore, a che la faa spuma, po muove questa soura fortemente
e arecogi questa spuma.
[1] Gl Francesco da Buti, Inf., 1385/95 (pis.), c. 21, 1-18, pag. 544.24: Et in-tende prima lautore
di trattare qui del peccato della baratteria, che per altro nome si chiama moccobellaria; e moccobellaria vendimento, o vero comperamento di quello che luomo tenuto di fare per suo uficio
o in cose publiche o private, per danari o per cose equivalenti.

Os exemplos marcados deste xeito pdense procurar nas voces do


TLIO a travs da funcin de busca Gloss(ario).
A segunda caracterstica do TLIO que me gustara salientar refrese s
voces presentes en textos consistentes en traducins doutra lingua. No
noso corpus existen, a carn de obras orixinais en verso ou en prosa, numerosos textos traducidos do latn, do francs antigo ou doutras linguas
como o provenzal, e mesmo caso nico e extremadamente precoz unha
traducin do casteln, unha parte do Libro delle stelle sse de Afonso o
Sabio realizada contra 1341 por un orentino residente en Sevilla.

O Tesoro della Lingua Italiana delle Origini: O futuro do italiano antigo?

341

Cando o redactor o considera til, un exemplo tirado dunha traducin


pode ir acompaado do fragmento correspondente do texto de procedencia:
[3] Bibbia (03), XIV-XV (tosc.), 2 Re 18, vol. 3, pag. 257.9: 6. E usco il popolo contra ad Israel,
e fue fatta la battaglia nellalbareto di Efraim.|| Cfr. II Sm 18, 5-8 factum est proelium in saltu
Ephraim.
[2] Bono Giamboni, Vegezio, a. 1292 (fior.), L. 1, cap. 1, pag. 6.25: In che modo la poca gente de
Romani contra la moltitudine de Galli averebbe avuto potenza? Come la loro piccola statura contra la grandezza degli Alemanni avrebbe avuto ardimento? || Cfr. Veg. Mil. 1, 1: Quid adversus
Germanorum proceritatem brevitas potuisset audere?.
[1] Andrea da Grosseto (ed. Selmi), 1268 (tosc.), L. 4, cap. 16, pag. 329.10: Allegramente sono da
amare le virt, per che dice Augustino... || Cfr. Albertanus, De amore et dilectione Dei, L. IV, cap.
3: Virtutes dixi vehementer esse diligendas
[8] <Tesoro volg. (ed. Gaiter), XIII ex. (fior.)>, L. 7, cap. 17, vol. 3, pag. 281.15: ma guarda che tu
per prestezza non perdi la perfezione di tua opera; ch l villano disse, cane frettoloso fa catelli
ciechi. || Cfr. B. Latini, Tresor, II, 66, 5: li vilains dist ke hastive lisse fet chiens avules.

Deste xeito resltalle posible ao lector comprender o modo de traballar dos tradutores medievais e ter unha idea de como eran percibidas na
poca as linguas diferentes do italiano e, se cadra, mesmo comprender o
proceso de xeracin de certos latinismos ou estranxeirismos que sobreviviron na lingua.

342

343

OS DICIONARIOS HISTRICOS.
TRAZOS DUN DICIONARIO HISTRICO GALEGO E
CONSIDERACINS SOBRE A SA VIABILIDADE
Antn Santamarina

Instituto da Lingua Galega. USC

1. ollada s dicionarios histricos


Un dicionario unha obra na que se lle mostra a algun o uso e o valor
das palabras ou calquera outra informacin sobre elas; daquela, o autor dun
dicionario antes de acometer a sa obra imaxina un lector ideal e segundo
as necesidades deste lector ideal fai un dicionario dun tipo ou doutro. Por iso
hai moitos tipos de dicionario anda que por antonomasia, cando dicimos
dicionario, pensemos nos que se organizan alfabeticamente e se reren
uso actual dunha lingua. Que os lemas estean nunha lingua e as explicacins noutra ou noutras un trazo engadido que ten outras explicacins,
algunhas entendibles e outras non; por exemplo, que o Franzsisches etymologisches Wrterbuch (FEW) tea os lemas en francs e os testemuos sexan
todos do francs e o occitano e os dialectos respectivos e en cambio estea
redactado en alemn dbese s a que Wartburg manexaba mellor o alemn
c francs e a redaccin dos artigos en alemn lle consuma menos tempo. A
historia da lingua mesma explica, se que nesa lingua os hai, tamn algns
trazos dos seus dicionarios. Por exemplo, no caso dos dicionarios galegos
anteriores s 80 a maior parte do lxico includo era de procedencia popular; o lexicgrafo confundase co dialectlogo; anda polos anos 50 Aquilino
Iglesia Avario (que tamn papeletizaba autores) andaba co seu caderno
na man caza de palabras, mesmo nas tabernas de Santiago, das que era
asiduo e onde o coecan coa alcua de o home das palabras. Esa mesma
historia externa explica bastantes trazos dos dicionarios aparecidos despois
dos 80 na medida en que reciclan con maior ou menor ltrado (en xeral cun
criterio normativista) os dicionarios dialectolxicos anteriores.
Pois ben, entre a variada gama de dicionarios existente para o galego
(lingua, dbidas, sinnimos, rima, falas, nomenclaturas, terminoloxas,
etc.) hai a lagoa dun dicionario histrico, ou sexa, un dicionario onde cada

344

Antn Santamarina

entrada contea a biografa enteira da palabra. verdade que o pblico


destinatario deste tipo de dicionarios restrinxido, como o o de receptores dunha gramtica histrica, que ten s unha clientela nos especialistas, nativos ou alleos, interesados pola historia da lingua. Con todo hai
unha diferenza grande entre a gramtica e os dicionarios; os procesos de
palatalizacin de nexos consonnticos latinos en romance s interesan
a un pequeno clan de historiadores da lingua; en cambio a historia de
cada palabra coma un pequeno fragmento da historia da cultura dun
pobo; por iso un dicionario histrico ten un pblico que abarca, fra dos
lingistas, especialistas en moitas outras materias (historiadores, etngrafos, xuristas...) e lectores cultos curiosos anda que non tean intereses
profesionais determinados.
Polas sas caractersticas os dicionarios histricos non adoitan ser
obra de iniciativa privada, porque non son obras rendibles economicamente, senn de institucins acadmicas (Universidades ou Academias),
anda que hai excepcins.
Os dicionarios histricos teen un antecedente nos dicionarios de autoridades. Entre os romnicos est o Vocabolario della Crusca (1612), que
non fai en realidade outra cousa que trasladar a un dicionario monolinge romance o que xa se via facendo cos grandes lexicns das linguas
clsicas desde o comezo do Renacemento, a saber, exemplicar con citas
reais de escritores clsicos os varios sentidos dunha palabra. O Diccionario
de Autoridades da Real Academia Espaola (1726-39) ou o Johnson (1755) e,
despois deles, moitos outros seguen o exemplo do da Crusca. En linguas
como o italiano ou o espaol, onde a distancia entre a lingua antiga e a
moderna escasa, os dicionarios de autoridades (porque as inclen de
toda a historia da lingua) funcionan como dicionarios histricos ou pouco
lles falta; o caso do Tommaseo / Bellini (1865-1879), ou o seu derivado na
UTET de Salvatore Bataglia (1904-1971) / Giorgio Brberi Squarotti (1929- )
(Bataglia 1961-2002). Con todo, os primeiros prototipos de dicionarios histricos s se idean e aparecen na segunda metade do sculo XIX, cando se
aplica con rigor s lxicos nacionais a mesma metodoloxa histrica que
se aplicaba s gramticas. Non as estrao que os que idearon o primeiro dicionario histrico dunha lingua moderna, o Deutsches Wrterbuch
(DWB), (fosen llogos de profesin como talmente o caso dos irmns
Grimm Jacob (1785-1863) e Wilhelm (1786-1859); os indoeuropestas recordan o primeiro pola Deutsche Grammatik (J. Grimm 1819-1837), onde
se formula por primeira vez a clebre lei da mutacin consonntica; e os
nenos de todo o mundo recordan a ambos polos contos populares. Ambos eran profesores e bibliotecarios e por razns polticas foron apartados

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

345

dos seus cargos (a Tommaseo, que tamn era folclorista e escritor pero
era xurista de profesin pasoulle o mesmo varias veces en Italia). Cesantes ofrecronse a un editor de Leipzig para facerlle un dicionario do
alemn en 6 volumes que mellorase os de J. Ch. Adelung (1774-1786) e o
de J. H. Campe (1807-1812). A idea dos Grimm era facer un dicionario que
presentase o lxico alto-alemn conforme o testemuo dos escritos posteriores segunda metade do sculo XV ata o momento actual. Excluase,
daquela, toda intencin normativa e outorgbaselle valor primordial
cronoloxa e forma da voz documentada para establecer a historia de
cada palabra. Estaba previsto que a obra se acabase en 10 anos. Coa axuda de 80 colaboradores voluntarios comezaron o traballo en 1838 e no 52
apareceu o primeiro fascculo. Wilhelm morreu no 59 e foi responsable
da redaccin da letra D; Jacob morreu no 63; redactara as letras A B C E e
estaba na palabra Frucht do F. Levaban un 25% da obra feita. Erraran todas
as contas porque a obra foi acabada moito despois e por outras persoas;
non resultaron 6 volumes senn 32; e non foron 10 anos posto que a obra
s rematou en 1961, 123 anos despois de comezada, 107 despois de aparecido o primeiro fascculo e 98 despois de desaparecido o ltimo Grimm.
Despois da morte dos Grimm pasou a responsabilidade do DWB a principios do XX Academia dos Cientcos de Prusia (Preuische Akademie
der Wissenschaften) co taller en Gttingen, e en 1930 Academia de Berln. Desde 1957 (nunha cooperacin entre as das Alemaas a travs das
universidades de Berln e Gtingen, que contina despois de reunicado
o pas) trabllase na reelaboracin das letras A-F; o primeiro fascculo
apareceu en 1965 e est previsto rematar no ano de 2012. A duracin do
proxecto provocou unha muda de criterios editoriais (ademais do enriquecemento da documentacin); as que unha voz como essen redactada por Jacob en 1862 ten oito columnas, mentres que trinken redactada
en 1950 ten trinta e sete1. Son moitas as ensinanzas que se poden extraer
da obra do DWB. Metodoloxicamente puxo os fundamentos da lexicografa histrica que despois seran moi renados pola obra do New English
Dictionary on Historical Principles (NED) Oxford English Dictionary (OED)
desde 1895, e de aqu exportados a outras obras semellantes (entre elas
o propio DWB reelaborado). Pero igual de importante salientar cmo a
obra se fraguou co saber, o entusiasmo e a entrega dos dous autores e coa
colaboracin desinteresada de moitos patriotas amantes da lingua; cmo
se continuou por varias xeracins de lexicgrafos, que seguen a chamarlle en honor dos iniciadores o Dicionario Grimm anda que da pluma deles
1.

Para este e outros pormenores vxase Osselton (2000).

346

Antn Santamarina

xa non queda case nada nos artigos do dicionario; e nalmente cmo o


goberno acabou considerando ese dicionario un monumento cultura da
nacin alem e acabou apoiando economicamente o proxecto anda que
supoa un investimento do que non se pode esperar unha rendibilidade
econmica (a pesar de haber cerca de 100 millns de xermanfonos posibles compradores). A primeira versin est dispoible na rede (http://
germazope.uni-trier.de/Projects/DWB).
O seguinte gran to na lexicografa histrica foi o dicionario do ingls, que xurdiu dunha iniciativa da Philological Society, unha entidade
privada (unha especie de academia) fundada coa intencin de promover
os estudos sobre a estrutura, anidades e historia das linguas. Fundouse
en 1842. A nais dos 50 (1857) varios membros da sociedade comezaron
a manifestarse sobre as deciencias dos dicionarios dispoibles na poca e en 1858 puxeron en marcha a iniciativa dun dicionario histrico que
tivo como primeiro editor (maio de 1860) a Herbert Coleridge (un neto do
poeta), desaparecido pouco tempo (abril do 1861) vtima da tuberculose
(contrada nunha reunin da PhilSoc que asistiu coa roupa mollada);
tia 31 anos; deixaba 100.000 chas. Entrou outro novo editor, Frederick
Furnivall; puxo en marcha un exrcito de lectores voluntarios (ata 800)
que reuniron unha cantidade enorme de chas, almacenadas ata 1879,
a maior parte no domicilio particular de Furnivall; outras nos domicilios
de subeditores que as tian para ordenar (cando trataron de recuperalas
a letra H estaba en Florencia na casa dun diplomtico que as levara al
para traballar nelas). Na poca de Furnivall unha boa parte das chas volvronse inservibles porque o tempo e os ratos as gastaran; outras foran
convertidas en lixo; e outras (as de PA) foran usadas para acender o lume.
En 1876 a PhilSoc tomou a determinacin de nomear un novo responsable
do dicionario e involucrar na empresa unha editorial que explotara os
benecios da edicin. Propxose a James Murray (1837-1915), que daquela tia 39 anos, para editor (que traballara a tempo parcial) e Clarendon Press da Universidade de Oxford como empresa editora. O dicionario
levara dez anos de traballo e tera 4 volumes de 2.600 pxinas cada un.
Despois de moitas negociacins os delegados da Oxford University Press
asinaron o contrato con Murray. O editor redactou un novo chamamento
con instrucins precisas de cmo facer unha nova colleita de citas, publicouno na prensa e distribuno por libreras e bibliotecas. pouco tempo
comezaron a chegar seu scriptorium unha media de 1.000 chas por da;
en 1882 tia 3 millns e medio, en cuxa ordenacin colaborou moita xente, entre eles varios membros da sa propia familia, que era moi numerosa e traballadora. En 1884 apareceu o primeiro fascculo. No 1888 un dos

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

347

asistentes de Murray, Henry Bradley (1845-1923), foi promovido a coeditor


(traballou ata o 96 en Londres e despois en Oxford). A memoria foi inxusta
con Bradley, porque nolo presenta coma unha sombra de Murray, pero o
seu traballo no OED foi case tan importante coma o do fundador. Ningn dos dous editores chegou a ver a obra acabada; Murray morreu en
1915 despois de ter redactado as letras A-D, H-K, O-P e T; Bradley morreu
en 1923, despois de facer as letras E-G, L-M, S-Sh, St e W-We. Antes diso
xa se incorporaran outros dous editores, William Craigie (1867-1957) en
1901 (letras N, Q-R, Si-Sq, U-V e Wo-Wy), e Charles T. Onions (1873-1965),
en 1914 (letras Su-Sz, Wh-Wo e X-Z). Ou sexa, que despois dun determinado momento funcionaban catro equipos redactores para acelerar o remate da obra, que cada vez se botaba mis fra dos prazos previstos (13
anos, que en realidade foron 52), pois s o 19 de abril de 1928 sau o ltimo
fascculo (desde Wise ata o nal de W). Agora a obra era encadernable
(e en realidade a partir de a vendeuse encadernada); eran 10 volumes.
No ano 1933 apareceu un suplemento e o dicionario foi reimpreso en 12
volumes. No 1957 nomeouse un novo editor, o neozelands Robert Burcheld (1923-2004), que actualizou a obra con materiais especialmente do
XX de todos os pases angloparlantes. Cando foi nomeado pola editorial
en 1957, encarguselle un Suplemento que se preva levara sete anos e
tera 1.275 pxinas; levoulle 29 anos, e foron 4 volumes cun total de 6.000
pxinas. Apareceron entre 1972 e 1986; daquela, nese ano o OED estaba
en 16 volumes. A editorial tomou despois a determinacin de integrar todos os engadidos nunha edicin que apareceu en 1989 (20 volumes, 22.000
pxinas), as como de preparar unha edicin electrnica que circula desde
1992 (hoxe estn na versin 3.1).
Tamn no NED (OED) hai que destacar traballo dos voluntarios, algns
deles fornecedores de paquetes de ata 165.000 chas2 dos 5 millns que
chegou a ter o cheiro de Murray; a xente comprendeu que se trataba dun
dictionary worthy of the great English nation (The Times 1869) e prestouse a axudar desinteresadamente. Tal era o orgullo dos voluntarios que
algn chegou mesmo a deixar mandas de 1.000 libras no seu testamento
para Murray. O mesmo volveu manifestarse en resposta chamamento
de Burcheld no ano 1957. Pero por encima de todo iso estivo o talento e a
preparacin de Murray as como a sa capacidade monstruosa de traballo. E todo sen apoio da coroa. Na clebre conferencia de Murray The evolution of English lexicography hai unha velada queixa disto cando se rere a como o goberno francs publica (1852) o Esclarcisemet de Palsgrave:
2.

Thomas Austin Jr. levaba esa cifra en 1888. Cfr. Gilliver (2000).

348

Antn Santamarina

Entre os cambios de goberno que viu Francia nos ltimos tempos, nunca esqueceu que a historia
da lingua francesa [...] parte da historia de Francia; o goberno britnico non chegou anda hoxe
situacin de percibir isto (Murray 1900).

Hai moitos lugares onde se conta a historia desta obra monumental,


the greatest enterprise of its kind in history (Winchester 2003: XV, que
cita as palabras do Primeiro Ministro Baldwin o 6 de xuo de 1928 cando
se xo a festa de presentacin do ltimo volume); the nest dictionary
ever made in any language (Winchester 2003: XXIII). Entre as moitas
obras que falan do OED hai unha dunha neta do propio Murray (Murray
1977) e outra editada por Lynda Mugglestone (2000b)3.
As cualidades do OED mellor que dicilas velas na realidade. un dicionario rigorosamente histrico: cada palabra gura coas sas diferentes
formas histricas e modernas e os signicados estn organizados tamn
historicamente conforme van aparecendo e desaparecendo; en palabras
de signicacin complexa os sentidos agrpanse por bloques de anidades, cada un deles dividido en subapartados xerrquicos necesarios, cos
seus signicados ben exemplicados e datados. Ademais das formas e
os signicados, cada palabra leva, se son necesarias, outras indicacins
(rea, rexistro, etc.). Neste sentido foi e segue a ser modelo para outras
empresas e isto algo que procede do modo en que foi concibido desde o
principio. Por iso, contrario do que ocorreu co dicionario dos Grimm, que
na redaccin actual xa non ten practicamente nada do texto redactado
polos dous irmns, no OED todo o que redactaron Murray e os coeditores
que traballaron con el e o sucederon segue a ter validez total; nas novas
edicins non hai nada que quitar do que escribiron eles; engdense, iso si,
novas palabras ou novos usos rexistrados longo do sculo XX ou pense marcas de obsoletas a palabras ou acepcins que hoxe xa non circulan.
Iso o que xustica que aumente de tamao; de feito a primeira edicin
tia 252.259 entradas, na segunda engadronse 41.752 entradas novas e integrouse nova informacin en 27.620 (cfr. a introducin da versin electrnica). No OED resultan non s admirables todas esas cousas que dixemos
tanto de Murray como dos outros colaboradores e do pobo britnico en
xeral, senn tamn o atrevemento dunha empresa privada (a OUP), que,
non sen tensins entre os conselleiros da editorial (profesores da Universidade de Oxford), que non paraban de reclamar o remate da obra, e os
traballadores do OED, que non paraban de ampliar o produto e adiar o seu
3. Para unha historia resumida vxanse as pxinas do propio OED na rede: http://dictionary.oed.com/about/
history.html e http://oed.hertford.ox.ac.uk/main/

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

349

remate, soubo apostar por unha obra que acabou convertndose nun dos
principais monumentos da cultura mundial do sculo XX.
zaga do DWB e do OED foron construndose monumentos semellantes para outras linguas europeas longo do sculo XX (algunhas iniciadas
tamn no XIX), en especial en pases de linguas xermnicas, promovidos
polas academias e nanciados con dieiro dos orzamentos do estado. Todos teen os trazos esenciais do OED ou, se non foron concibidos con eles,
acabaron adoptndoos.
O primeiro e o Woordenboek der Nederlandsche Taal (WNT), que comezou a organizarse algo antes c OED. As sas orixes remntanse a 1850,
cando se constituu unha comisin liderada por Matthias de Vries (18201892); no ano seguinte nun congreso presentou un plan para un dicionario
holands e nomeouse un comit editorial formado polo propio de Vries e
por Lammert te Winkel (1806-1863); por certo, os dous son os reformadores
da ortografa holandesa actual. O dicionario desde o principio foi froito
dunha colaboracin entre holandeses e amengos; en 1852 comezou a recolleita de materiais. A empresa (como a alem) comezou pola iniciativa
privada dos promotores e dunha editorial; deu problemas ata que o goberno holands se xo cargo dos gastos despois da primeira guerra mundial. O plan do dicionario mudou a partir da dcada de 1880; en principio
prevase que fose un dicionario do holands do sculo XIX; polo tanto non
a ser histrico (o modelo estaba mis no Littr ca nos Grimm); pero a
medida que colleitaban documentacin, por consello dos Grimm, foron
recuando ata o 1500 e tomando tamn en consideracin documentacin
non literaria (artes e ciencias), ademais dos dialectos, transformando as a
idea do dicionario estilo do OED. O primeiro fascculo apareceu en 18834
e o ltimo en 1998 (684 fascculos, 40 volumes); o INL (Institut voor Nederlanse Lexikologie) est actualizando constantemente a obra, agora con
procedementos novos. Pasaron cinco xeracins de lexicgrafos desde que
se comezou (http://www.inl.nl/index.php?option=com_content&task=v
iew&id=222&Itemid=244).
Pero a lingua holandesa non dispn s do WNT, pois un dialecto moi
importante dela e falado en Sudfrica, o afrikaans, ten tamn o seu Woordeboek van die Afrikaanse Taal (WAT). O afrikaans unha variante do
holands levado primeiro por colonias de protestantes no sculo XVII e
despois por comerciantes e tracantes; hoxe unha variante estandarizada como lingua parte, falada como primeira ou segunda lingua por
mis de 16 millns (o holands flano uns 22 millns). O WAT iniciouse
4.

A introducin de De Vries de marzo de 1882 (ntese a coincidencia co OED).

350

Antn Santamarina

nos anos 1920, comezouse a publicar en 1951 (volume I) e est en curso de


publicacin anda; no 2005 apareceu o volume XII (letras P-Q). Naturalmente agora traballan con ferramentas electrnicas; pdese mercar en
CD ata a letra O; pero anda non est dispoible a sa consulta en rede
(http://www.wat.co.za/).
Outro dicionario histrico xermnico o Svenska Akademiens ordbok
(SAOB) tamn coecido como Ordbok ver svenska sprket utgiven av
Svenska Akademien. Anda que est nos estatutos da Academia, de 1786,
formar un dicionario similar doutras academias (particularmente da
francesa), a obra do dicionario da Academia Sueca s se puxo en marcha
cen anos despois (1883); Theodor Wisn (1835-1892) foi o responsable de
facelo e naturalmente desde aquela tivo varias xeracins de redactores.
Contn o vocabulario sueco desde 1521 actualidade. Entre 1898 e 2007
xeron os fascculos que van ata o nmero 363; a ltima entrega contn
as letras TILL-TOJS (marzo de 2007); prevese que remate para o 2017; pode
verse informacin na rede (http://www.saob.se/) e consultarse en lia
(http://g3.spraakdata.gu.se/saob/). Ten unha novidade con respecto
Grimm, OED e WNT en que rexistra nomes propios e topnimos (cousa
que tamn veremos noutros dicionarios histricos s que nos referiremos
despois).
En Dinamarca hai o Ordbog over det danske sprog (ODS), iniciado en
1901 por Verner Dahlerup (1859-1938). Comezou sendo unha empresa privada, de Dahlerup e da sa muller, e acabou pasando a Sociedade Danesa
de Lingua e Literatura. Comprende o vocabulario dans desde 1700 a 1955.
Ten 28 volumes e publicouse entre 1919 a 1956; no 1992 actualizouse cun
Supplement. Agora est dispoible na Internet (http://ordnet.dk/ods/bogvaerket_html).
O mis asombroso de Dinamarca que ademais teen un Jysk Ordbog
(JOB), con datos dos dialectos iutos (jutish ou jutlandic), iniciado por Peter Skautrup (1896-1982), coecido tamn por unha monumental historia
da lingua danesa en catro volumes + ndice (Skautrup 1944-1968); est na
Universidade de Aarhus e accesible en rede (http://www.jyskordbog.dk/
hjemmesider/index.html). Descoezo o tamao (non ten formato papel)
pero debe ser grande porque en 1980 o cheiro tia 3.000.000 de chas.
En Noruega o Norsk Ordbok (NOB) (do nynorsk) (http://no2014.uio.
no/) comezou a compilarse en 1930. En 1950 apareceu o primeiro volume;
no 2007 apareceu o vol VI (k-kv); est previsto que acabe en 2014 con 12
volumes (de 800 pxinas). Abarca o noruegus desde 1650 ata a actualidade. Comezou sendo un corpus de chas manuais; hoxe ten ademais un
corpus informatizado de 25,6 millns de rexistros. Neste momento, ade-

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

351

mais da directora do proxecto (e outros responsables), ten seis grupos de


redactores de catro persoas cada un na Universidade de Oslo5.
Para as linguas romnicas hai poucos produtos equiparables o OED;
os dicionarios de autoridades (tipo Battaglia) s son histricos en parte
porque o material sobre o que traballan exclusivamente literario.
Para o casteln houbo, como sabido, dous intentos falidos. Un que
partiu dunha iniciativa da Academia en 1914, deseguida desactivada, reiniciada nos anos 20 e que grazas en especial labor de acadmicos como
Garca de Diego, Cotarelo e Casares logrou sacar en 1933 o primeiro volume (a letra A) e en 1935 o segundo (letra B e parte da C) (RAE 1933-1936). A
guerra paralizou a obra e, mis grave anda, un incendio queimou a Editorial Hernando, que almacenaba a edicin case enteira. En realidade, o
dicionario histrico de 1914 era histrico s no ttulo, dado que na prctica
era unha renovacin do de Autoridades de 1726-1739, pero mis completo
e actualizado. Despois da guerra volveuse a iniciar a obra do dicionario
histrico. En 1946 creouse na Academia o Seminario de Lexicografa, que
sera o encargado de levar adiante a obra do dicionario. En 1947 comezou
de novo o traballo cun novo plan (desbotado o plan do 14, polas razns
ditas); o encargado de desealo era Casares e a nova iniciativa obrigaba a
recompilar novos materiais porque os cheiros da Academia (que almacenan chas desde o Dicionario de Autoridades) contian un material tan
anticuado e defectuoso (chas baseadas en malas edicins e a maior parte das veces con mala localizacin), que xo necesario comezar de novo.
Fxose un chamamento semellante de Murray pero apenas respondeu
mis que un colaborador (o arcebispo galego Leopoldo Eijo Garay)6. Polo
procedemento que fose, os cheiros da Academia pasaron de 4 millns de
chas en 1947 a 11 millns en 1960. Neste ano apareceu o primeiro fascculo do novo dicionario histrico e en 1972 completouse o 1 volume, que xa
non puido ver Casares, que morera no 64; responsabilizronse del despois,
5.

Como se ve, as linguas nrdicas teen todas unha aparicin literaria tarda; algunhas teen case como
textos fundadores a traducin da Biblia, do XVI.

6.

No seu informe de 1948 RAE Casares insiste nesta posibilidade dado que todos los grandes Diccionarios
del siglo XX han tenido desde el primer momento la preocupacin de imbuir en el nimo de la opinin
culta de sus respectivos pases el convencimiento de que, tanto las entidades patrocinadoras de dichas
obras Academias, Sociedades, Congresos, etc. como cuantas personas se ponan abnegadamente a su
servicio, se arriesgaban en una empresa patritica, cuya gloria, en caso de buen xito, rebasara ampliamente el crculo de los iniciadores y ejecutores, para extenderse a la nacin entera, elevando el prestigio
de la respectiva cultura ante el mundo civilizado. Artculos de prensa, folletos, circulares, conferencias,
todo pareci poco para crear un clima favorable a la gestacin de esos diccionarios, que haban de ofrecer
a propios y extraos la riqueza, la vitalidad y la gracia de la lengua materna como el reejo ms autntico
y luminoso del verdadero genio nacional.

352

Antn Santamarina

sucesivamente, Garca de Diego, Lapesa e Seco. Dos seguintes volumes s


hai outro completo, o volume II (fasc. 11-20, publicados entre 1974 e 1992);
do volume III saron dous fascculos en 1994 e 1996, e do IV s un fascculo en 1996. Aqu interrompeuse por varias razns, entre elas a falta de
nanciamento e a imposibilidade de establecer un equipo estable de redactores. Hoxe aquel proxecto pode darse por denitivamente paralizado.
Na actualidade est prevista unha nova acometida dunha empresa que
probablemente se vai chamar Nuevo diccionario histrico de la lengua
espaola (NDHLE), que nace con pretensins semellantes anterior de
Casares, Garca de Diego e Lapesa, s que agora parece que hai garantido un nanciamento estable por parte da administracin, conforme se
desprende das noticias de prensa segundo as cales o MEC nancia a RAE
con 1,2 millns de euros ano, que se unirn as achegas de institucins
e empresas (El Pas 25.01.2006). Sera bo que por n unha lingua tan importante e defendida cunha poltica lingstica mis retrica que ecaz
contase cun instrumento as. Os crpora de que dispn o casteln (non s
na Real Academia) proporcionan un material bruto moi abundante; con
todo, os diferentes corpus parece que non satisfn os requisitos do editor
(J. A. Pascual), e estase no seo da Academia a preparar un corpus electrnico ad hoc diferente do CORDE e do CREA. Mentres o dicionario histrico
non aparece, o etimolxico de Corominas cobre parcialmente a lagoa co
esforzo persoal dunha soa persoa e con resultados forzosamente moi parciais (anda as, un dicionario etimolxico non un dicionario histrico,
por moito que en boa medida o presupoa).
Tampouco Francia ten un dicionario histrico semellante OED (ou o
DHLE do casteln, abortado). Pero ten varios produtos que o suplen case
totalmente. Un deles o Trsor de la Langue Franaise (TLF), iniciado en
1957 pola seccin de Nancy do CNRS baixo a direccin de Paul Imbs (despois substitudo por Quemada e R. Martin). Foi o primeiro dicionario moderno que se compilou electronicamente (usando chas perforadas). un
dicionario grande, con 23.000 pxinas, hoxe consultable gratuitamente en
rede (http://atilf.atilf.fr/tlf.htm), e dispoible en papel e CD. Non un verdadeiro dicionario histrico, posto que s toma en consideracin o francs
escrito dos sculos XIX e XX; non comprende, daquela, ningunha palabra
extinguida literariamente antes de 1800 nin palabras do francs dialectal
antigo ou moderno; tampouco histrico na medida en que prescinde
da organizacin histrica das acepcins; en realidade foi concibido como
unha parte dun dicionario histrico que ter (se se fan) cinco cortes sincrnicos da historia da lingua francesa. Anda as, sendo s da ltima etapa, as palabras que perviven no francs literario moderno teen nal

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

353

de cada artigo unha xenerosa nota etimolxica e histrica que dan conta
da evolucin formal e semntica da palabra desde as orixes ata o francs
actual (cfr. por exemplo a voz parole).
Tampouco un dicionario histrico cannico (a pesar do seu nome),
polos mesmas razns de que os lemas son unicamente os do francs estndar de hoxe, o Dictionnaire Historique da la Langue Franaise (DHLF)
da editorial Robert, dirixido por A. Rey; d a etimoloxa, a cronoloxa das
formas e as acepcins principais e secuencia en que se xeraron; pero non
ten exemplos; tampouco ten entradas dialectais nin arcaicas. Os dous, o
TLF e o DHLF, dan case un dicionario histrico; o que falta hai que suplilo
con dicionarios etimolxicos coma o de Wartburg (FEW) ou o de Baldinger
(1974-2006) (para o occitano), ambos inacabados, que teen abundante informacin histrica e dialectal. Para o francs hai, daquela, un substituto
do dicionario histrico, anda que sexa repartido en tres ou catro dicionarios diferentes; por iso, seguramente nunca se formulou a idea de fabricar
para o francs nada semellante OED.
Para Italia xa vimos que o Battaglia (GDLI) era case un dicionario histrico; de feito moito mis ca un dicionario da lingua toscana de todos
os tempos, porque entran non s toscanismos (con tal de que tivesen uso
literario). Tanto Salvatore Bataglia (1904-1971) como Giorgio Brberi Squarotti (1929-), que o dirixiron, teen un mrito inmenso, como tamn a empresa privada que o nanciou, a UTET (Unione Tipograco-Editrice Torinese), que xa antes nanciara o Tommaseo / Bellini (1865-1879). Por parte
da Crusca hai, desde hai moito, proxectado un Vocabolario storico della
lingua italiana, nunca realizado. Parte deste dicionario da Accademia, o
que se rere lingua das orixes ata 1375, est sendo realizado agora polo
CNR, o Tesoro della lingua italiana delle origini (TLIO), que concorre con
outro Glossario degli antichi volgari italiani (GAVI) que se publica pola universidade de Helsinki desde 1983, coidado de Giorgio Colussi, e leva ata
o momento 20 volumes aparecidos. Os dicionarios etimolxicos, que para
o italiano hai varios, e un especialmente monumental, o LEI de Pster
(agora na letra B), axudan a compoer o perl histrico do lxico italiano
mentres non haxa o prometido da Crusca. En calquera caso, non hai nada
en Italia (igual que en Francia) nunha obra nica equiparable OED.
E isto o que hai para as grandes linguas nacionais europeas occidentais (supoo que para o polaco, o ruso, o ucrano, o checo ou o hngaro
hai empresas histricas similares, pero btanos mis lonxe e pertence a
linguas menos accesibles). Pero quedan na Europa occidental linguas pequenas e mesmo dialectos sen vocacin de lingua que teen moito que
ensinarnos en materia de lexicografa histrica. Entre estas linguas est

354

Antn Santamarina

en primeiro lugar a catal, que dispn dun Diccionari catal-valenci-balear (DCVB) completo desde o ano 1962. A historia do dicionario cataln
exemplar para ns (e para moitos outros) e foi contada en numerosos
lugares, de maneira moi pormenorizada nas memorias de Moll, que son
unha memoria do dicionario mesmo na medida en que o DCVB foi a obra
da sa vida. O dicionario cataln iniciouno, sen embargo, un manacor,
o cengo Antoni M Alcover7 (1862-1932). En 1901 lanzou Alcover (como a
PhilSoc de Londres e mis tarde Murray e anda despois Burcheld) unha
Lletra de Convit a tots els amics de la llengua catalana para que colaborasen na sa recolleita; nos cinco primeiros anos apuntronse 1.643 voluntarios (con rendementos moi dispares) que enviaron mis de 700.000
cdulas; para manter contacto cos entusiastas do seu convite iniciou o Bollet del Diccionari de la Llengua Catalana (1901-1926), folleto mensual que
funcionaba de crnica do dicionario, entre outras cousas. Pero Alcover era
s un acionado, e ademais va que el s a ser incapaz de levar adiante
a obra. En 1921 tomou como colaborador un mocio de 17 anos que se chamaba Francesc de Borja Moll (1903-1991), para quen procurou unha formacin lolxica slida con mestres como Schdel e Meyer-Lbke. A historia
do Diccionari foi moi azarosa. Unha das razns foi o carcter belics,
rstic i agressiu (en palabras de Moll) do calonge, que entrou pronto
en disputa co Institut dEstudis Catalans, institucin que patrocinaba o
Diccionari, entre outras razns porque Alcover quera facer un dicionario
que fose vez dialectal, histrico e literario e a maiora dos membros do
IEC propoan naquel momento a elaboracin de tres dicionarios (un do
cataln antigo, outro do moderno e outro dialectal); co IEC (e con Fabra
persoalmente) mantivo discrepancias ortogrcas. Isto motivou que Alcover rompese co IEC e que marchase en 1917 coa calaixera do dicionario
para Mallorca, onde se a facer de costas para o IEC; isto motivou tamn o
cambio de nome da obra, que pasou a chamarse desde aquela Diccionari
catal-valenci-balear e non Diccionari de la llengua catalana. Outra dicultade foi a falta de medios, pois parte dunha axuda que conseguiu
Alcover do rei Afonso XIII, que durou s seis anos, e dalgunha institucin,
o diccionari estivo sempre borde da bancarrota. Anda as, en xaneiro de
1924 comezou a redaccin, con dous redactores (Alcover e Moll) e outros
dous colaboradores fugaces; a nais do 1926 apareceu o primeiro fascculo; en 1930 estaba completo o primeiro volume. A recepcin do dicionario
foi pouco entusiasta (en especial no Principado, onde o catalanismo convertera a Alcover nunha especie de besta negra); isto repercutiu na falta
7.

Gran recolledor de literatura oral, anda son populares hoxe as sas Rondalles de Jordi des Rac.

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

355

de subscritores e de subvencins ociais e motivou que Alcover comprometese a sa facenda e anda a da familia; cando morreu en 1932 dun ataque de feridura (apoplexa) estaba completamente arruinado. En 1934, xa
sen Alcover, completouse o volume segundo. A todas estas desgrazas hai
que engadir a guerra civil; con ela o traballo do dicionario interrompeuse
e Moll pasou a gaar a vida como impresor (na imprenta que o propio
Alcover fundara para imprimir o dicionario) e como profesor de ensino
medio. Moll continuou traballando s; desde 1943 a 1959 contou coa colaboracin de Manuel Sanchis Guarner (1911-1981) e da sa lla Aina Moll;
agora contaba coa subvencin dun mecenas privado (o industrial barcelons Enric Prez i Capdevila) e cos fondos que recadaba das subscricins.
En 1949 comezaron a sar de novo fascculos e grazas a unha campaa de
mrquetin moi ben organizada por simpatizantes do dicionario a obra
puido conclurse sacando a razn de case un volume por ano (III, 1950;
IV, 1951; V, 1953; VI, 1954; VII, 1955; VIII, 1957; IX, 1959; X, 1962). Nos anos seguintes reelaborronse e reimprimronse os dous primeiros volumes, e
ademais prescindiuse neles da ortografa cismtica de Alcover. O DCVB
unha obra extraordinaria tanto polo sacricio con que foi levada a cabo
como polo patriotismo dos seus iniciadores e redactores e mecenas, como
polo contido mesmo, pois ten abundantsima documentacin histrica,
literaria e dialectal e est executada coa mellor tcnica lexicogrca anda que non siga rixidamente os principios histricos do OED; en parte
debedor do GPSR (do que imos falar), entre outras cousas, porque d cabida a bastantes apelidos, que localiza nas reas en que son orixinarios
e abundan; en cambio, contrario do GPSR, non rexistra topnimos. En
1962, e anda hoxe, ningunha lingua hispnica (includas as multimillonarias portuguesa e castel) tian nada equiparable, nin de lonxe. Pode
consultarse en rede (http://dcvb.iecat.net/).
Todas as linguas que vimos ata agora son linguas de estado. Algunhas
delas teen detrs un potencial demogrco enorme e todas elas teen
unha tradicin literaria longa, de ata 12 sculos algunha. O caso do cataln
particular porque ten grande tradicin literaria pero non ten estado, anda que no Principado se ten manifestado suciente vontade nacional como
para telo. Pero dentro da tradicin lexicogrca europea, prxima a ns, hai
tamn casos de variedades rexionais sen vocacin de lingua para as que se
desenvolveron empresas lexicogrcas de grande envergadura. Os dicionarios resultantes teen moito parecido cos dicionarios histricos mencionados, coa diferenza de que nestes casos os testemuos literarios son moito
mis escasos e os dialectais mis abundantes. Estn neste apartado os catro grandes dicionarios realizados en Suza para as catro variedades xerm-

356

Antn Santamarina

nica e romnicas al falados. Estn todos auspiciados desde 1996 pola Academia Suza de Ciencias Humanas e Sociais e na sa pxina poden verse as
referencias (http://www.sagw.ch/frz/index.asp?pag=Kommissionen). Vou
mencionalos porque son obras exemplares, honra do pas que apoiou a sa
elaboracin e dos llogos que os iniciaron e continuaron.
Comezo polo Glossaire des patois de la Suisse romande (GPSR), dicionario dialectal que rexistra todas as palabras patesas que estiveron ou estn
anda en uso no interior dos lmites da Suza romanda; acolle tamn as
palabras e usos particulares do francs suzo. Por riba o Glossaire reserva
un lugar importante s nomes de persoa e s nomes de lugar romandos.
Foi ideado arredor de 1890 por Louis Gauchat (1866-1942), unha especie de
Leite de Vasconcelos suzo, mesmo celibatario como aquel. Gauchat soubo
convencer as autoridades federais e cantonais para amparar economicamente a obra de recolleita dos patois franco-provenzais de Suza; en 1899 a
Comisin Administrativa (composta polos xefes de Instrucin Pblica dos
cantns francfonos) deu luz verde a un proxecto que anda dura 107 anos
despois; os tres primeiros redactores (que imprimiron carcter obra) foron Gauchat, Jules Jeanjaquet (1866-1950) e Ernst Tappolet (1870-1939). As
ocinas do GPSR estiveron primeiro en Berna, despois en Lausana (1956)
e agora estn en Neuchtel (1972). Os tres redactores xeron un nmero
considerable de enquisas, algunhas delas en profundidade, s mellores
informantes; en trece anos xuntaron mis dun milln de chas. Baleiraron tamn unha rica colleita de textos (moitos deles manuscritos cedidos
polos herdeiros dos autores a arquivos e museos). E incorporaron o Ficheiro Muret (Ernest Muret) con mis de 150.000 topnimos. Naturalmente o
GPSR non un dicionario histrico estilo dos descritos, porque non se
rere a unha lingua viva, senn a unha lingua de museo, recuperable s a
travs de textos e dos poucos falantes rurais sobreviventes a principios do
XX; pero explica con pormenor semellante s dicionarios histricos toda
a riqueza de variantes formais e de contido dos diferentes lemas. Comezou a publicarse en 1924 e na actualidade estanse redactando as letras F e
G8. Anda que no seu sitio non dixemos de maneira clara se o DCVB ten un
modelo, o mis prximo o GPSR, e non os dicionarios histricos tipo OED
ou DHLE. Na Internet hai informacin do Glossaire e ligazns a outros
sitios (http://www.gpsr.ch/)9.

8.

O ltimo fascculo aparecido o 112 (2006), pertencente ao tomo VII, que abrangue o fragmento frgnat-

9.

Para coecer o estado de publicacin da obra, vxase o catlogo da editorial Droz (https://www.droz.org).

fripeur.

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

357

Unha historia moi parecida a do Wrterbuch der schweizerdeutschen


Sprache (WbsdS), ou Schweizerisches Idiotikon. Anda que a idea dun dicionario suizo-alemn mis antiga, os traballos para o WbsdS empezaron
en 1862; en 1881 apareceu o primeiro fascculo. O WbsdS recolle o alemn
de Suza, tanto o escrito desde a Alta Idade Media como o dos dialectos
modernos (tal como se recolleron principalmente na segunda metade do
sculo XIX); sese algo do territorio suzo na medida en que recolle tamn as penetracins alemnicas do norte de Italia (os Walser ou valeses
que penetraron no XII e no XIV, e hoxe estn esmorecentes). Aparece por
fascculos encadernables; na actualidade est case completo o volume
16 (nal de W); estar rematado para o 2020. Ter uns 130.000 rexistros
remate. Igual que o GPSR ten un equipo de redactores e nanciamento
asegurado. Hai informacin na rede (http://www.sagw.ch/dt/kommissionen/woerterbuch/index.html).
historia semellante, pero mis heroica anda, a do dicionario romanche, o Dicziunari Rumantsch Grischun (DRG), tendo en conta que a
poboacin retorromanche desde hai 150 anos s de 48.000 falantes. O
dicionario foi ideado en 1904 pola Sociedade Retorromanche de Chur, liderada por Robert von Planta (1864-1937), coa intencin de recoller todo o
patrimonio lingstico dos romanches. O material procede de 130 enquisas realizadas polo propio Planta (que elaborara un cuestionario de 10.000
palabras xa en 1898), Florian Melcher (?-1913), que foi o primeiro redactor,
e Chasper Pult (1869-1939); e do baleirado de textos posteriores a 1560 (que
cando comeza a haber materiais escritos en romanche). Cada artigo
unha monografa da palabra (con formas, signicado, frases, realidade
material ou espiritual que se rere, etimoloxa, etc.). En 1939 aparece
o primeiro fascculo, que tivo como editor responsable a Andrea Schorta
(1905-1990); a ltima entrega aparecida o fascculo dobre 162/163 (manmancar) correspondente volume 12. Non dan un prazo para o remate,
pero pode ser tamn pola dcada dos 2020. Igual cs outros dicionarios
helvticos, desde 1996 a Academia Suza de Ciencias Humanas a que
prov os fondos para que a obra do DRG se leve a cabo. Tamn neste caso
existe informacin na rede (http://www.drg.ch/index.html e http://
www.drg.ch/downloads/100onnsDRG.pdf).
E o ltimo grande dicionario suzo o que corresponde zona italiana,
o Vocabolario dei dialetti della Svizzera italiana (VSI), comezado a publicar
en 1952. O Vocabolario presenta os diversos matices de pronuncia e de
signicado, exemplicacin de proverbios, modos de dicir e lastrcche,
unha mole de documentacin sobre as crenzas, as prcticas supersticiosas, a farmacopea e a medicina popular, os usos e as tradicins de todo

358

Antn Santamarina

o territorio da Suza italiana. Unha voz unha monografa da palabra e


da cousa. Publcase por fascculos (dous por ano). En novembro de 2007
apareceu o fascculo 70, de cbia a ccolr. A redaccin hoxe dirxea Franco
Lur e traballan con el outras sete persoas. Existe informacin na rede
(http://www.ti.ch/decs/dc/cde/temi/vocabolario.asp).
Menciono estes ltimos catro glosarios, exemplares tanto polo seu valor
cientco como polo patriotismo con que foron acometidos e realizados.

2. trazos dun dicionario histrico galego


A historia da nosa lingua explica unha parte do atraso da nosa lexicografa, que foi contada varias veces por ns mesmos e por outros. Como
ben sabido, anda que houbo un rexurdimento vizoso, a forza da elite
concienciada non foi capaz de contrarrestar a falta de estima e mesmo a
hostilidade pola lingua do pas. Nun clima as era pouco imaxinable unha
empresa lexicograca de envergadura. A outra parte da historia dos dicionarios, como a da lingstica galega en xeral, explcase polo atraso da loloxa no noso pas; certamente, se o nivel cultural da Galicia de mediados
do XIX, e anda de mediados do XX, fose equiparable de Suza (anda no
peor dos casos: que s se considerase o galego un dialecto sen vocacin
emancipadora) sera inconcibible que non aparecese algn von Planta ou
algn Gauchat que, co apoio dos organismos ociais competentes, intentase un Dizionar ou Glossaire. Isto non sucedeu. Pero anda as, non se entenda que por atrasada lles damos pouco mrito s pequenas empresas
lexicogrcas privadas que foron aparecendo; contrario, teno e moi
grande, tanto polo valor das obras, como polo patriotismo dos autores.
Pero non podemos estar cegos realidade: a lingstica que se faca por
Europa adiante a mediados do XIX s chegou a Galicia no ltimo terzo
do sculo XX; antes de 1963 contbanse cos dedos dunha man os galegos
que sentiran falar de Saussure ou de Meillet, e con poucos mis dedos os
que viran un Meyer-Lbke; o primeiro dicionario de Oxford que chegou
nosa Facultade debe ser dos anos setenta, nunha edicin fotogrca. As
que un intento de dicionario histrico (ou mellor pancrnico) como
o da Academia pouco despois da sa fundacin hai cen anos era unha
empresa prematura. Non mester que fagamos aqu unha anlise desa
obra abortada.
Pero hoxe quizais son chegados os tempos. En primeiro lugar porque a
lingua mesma non est no estado de carencia en que estaba hai cento e pico
de anos, cando Pintos ou Valladares facan os seus vocabularios. probable

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

359

que nalgns aspectos esteamos peor hoxe; de feito, moitas voces vencelladas cultura tradicional seguramente desapareceron antes de que fosen sometidas a unha recolleita tan sistemtica como a que se xo para os dialectos suzos; quen faga traballo dialectal hoxe sabe da dicultade que supn
atopar un informante bo; con todo, anda se chegou a tempo, polos anos
setenta e oitenta, para facer un atlas e bastantes monografas que salvaron o esencial do naufraxio. En cambio, por outro lado, as cousas melloraron
moito porque a lingua, especialmente despois do movemento das Irmandades, quedou rexistrada en escritos de temtica cada vez mis variada. Dito
doutra maneira: Valladares, anda que quixese, apenas poda documentar
palabras en textos; de feito a maior parte das ilustracins literarias que incle no seu dicionario son cantigas populares ou refrns e mesmo poemas
propios; anda don Eladio Rodrguez (1958-1961), polos anos 20, cando faca
o seu Diccionario, andaba escaso de fontes. Hoxe para o galego moderno
hai moitas fontes porque hai centenares de millns de palabras xadas
en documentos escritos, de maneira que se perdemos algo por unha parte
compensmolo con creces pola outra. verdade que estas fontes estn lexicogracamente algo descompensadas, porque hai campos nos que o galego
ten pouco cultivo, pero anda as hai moito material lxico que baleirar ou
xa baleirado. Para o galego antigo tamn as cousas estn nun bo momento,
pois canto texto literario est descuberto conta con edicins boas; o mesmo
sucede con moita documentacin notarial, que anda sendo algo montona
como material lexicogrco, moi abondosa e est sendo transcrita e nalgns casos provista de glosarios. E ademais hai moita xente no pas que leu
a Saussure e anda a Coseriu. Por esta razn dicimos que o momento de comezar un dicionario histrico propicio. E quizais son chegados os tempos
tamn porque o galego adquiriu un grao de institucionalizacin considerable: a lingua principal da administracin autonmica e local; acabou tendo (mesmo para moitos que non o practican) un valor simblico. Por ser lingua ocial require instrumentos que faciliten o seu acceso s usuarios; e por
ser simblica necesita instrumentos que a canonicen, e entre eles estn as
gramticas e os dicionarios, e entre estes un histrico. Unha lingua con estes
instrumentos fai que os propios falantes se sintan orgullosos e que os de
fra nos respecten. De a que a fabricacin dun dicionario destas caractersticas sexa considerado en todos os sitios onde se acometeu un monumento
memoria cultural do pobo; por iso se implica nel o pobo mesmo (ou polo
menos as sas elites mis sensibles) e as autoridades. As obras deste tipo, al
onde se acometeron, xustifcanse polas deciencias das anteriores10. Pero as
10. On some Deciencies in our English Dictionaries foi o manifesto que leu Richard Trench ante a PhilSoc o 5
de novembro de 1857 e disparou a obra do OED.

360

Antn Santamarina

deciencias hai que miralas con perspectiva histrica, pois cada dicionario
non mis que o elo dunha cadea onde cada dicionario unha peza necesaria para o que vn despois; o mesmo Murray matizou mis tarde as palabras
de Trench recoecendo que, sen unha cadea de dicionarios que empeza no
XVII e vai desde Caudrey, Johnson, Bailey, Cocker, Webster e moitos outros,
o OED sera inexplicable. E o mesmo acontecer co galego se algn da se
fai. Naturalmente, supoendo que este dicionario se xese, non supora a
desaparicin dos outros dicionarios, porque cada destinatario necesita un
tipo diferente de dicionario. O histrico , dixemos, para especialistas e para
xente cun nivel de curiosidade lingstica moi especial; e por outra parte,
podera ser a base doutros dicionarios. Na lingua inglesa o OED non anulou
outras actividades lexicogrcas, senn contrario.
Vexamos logo que entrara nese dicionario e como se mostrara a informacin. O que digamos non vai ter moita orixinalidade porque non se
trata mis que de aplicar noso o que xa foi feito para outras linguas, conforme foi explicado nas introducins dos dicionarios, en informes previos
presentados s institucins que os promovan, ou en guas posteriores.
Para moverse ben polo OED e entender ben o que ten dentro moi til
ler a gua que escribiu Donna Lee Berg (1993) e mesmo o libro citado de
Winchester (2003). En casteln hai informes de Julio Casares desde os anos
40, recollidos logo en libro (Casares 1950), que son de lectura moi proveitosa. Mis recentemente, Jos Antonio Pascual coautor dun texto que en
certa maneira adianta aspectos do que vai ser o NDHLE da RAE (Pascual /
Garca 2007). Hai con todo que advertir que, como se trata dunha materia
moi especca, a lexicografa histrica non adoita ser tratada nos manuais
de lexicografa a non ser de maneira tanxencial. Daquela, o que digamos
a seguir non un blueprint ou manual do redactor do DHG, senn unha
aproximacin que esperamos que un lector poida atopar nel.
1. No noso caso, o primeiro que hai que dilucidar cal a profundidade (historical coverage) do corpus, ou sexa, ata onde recuamos na documentacin, pois hai das posibilidades. Ou ben comezar a nosa historia en 1612, que a data do primeiro texto galego coecido despois da
desaparicin do galego como lingua da administracin (os ltimos documentos notariais son de 1530 ou por a), ou ben remontarnos s primeiras
orixes. Ambas as opcins son defendibles; a primeira vira a coincidir coa
postura adoptada polos dicionarios das linguas nrdicas, que comezan a
sa documentacin no sculo XVI, porque mis atrs desa poca hai moi
pouca documentacin; no noso caso tera xusticacin comezar no XVII,
porque cando o galego tomou a opcin de seguir un camio solitario

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

361

despois dunha etapa comn co portugus, despois varios sculos durante


os cales a documentacin escrita moi escasa. En certa maneira esta solucin resolvera moitas dicultades, entre elas a do volume e a do tempo,
e por outra parte deixara a etapa medieval para unha empresa diferente,
que se podera facer a travs dunha cooperacin transfronteiriza, pois interesa tamn pas vecio (ou a Galicia e a todos os pases onde se fale
portugus). Mesmo pensando na estratexia da fabricacin do dicionario,
podera facilitar as cousas afondar s ata o XVII dado que, termos unha
lagoa de varios sculos sen documentacin, a necesidade de aterse rigor
de trazar historicamente a xenealoxa das diferentes acepcins de cada
palabra patrimonial obviara non poucos apuros insuperables; ter rota a
cadea temporal obrigar a organizar as acepcins de maneira menos cannica (se cadra estilo do DCVB); pero isto de momento unha conxectura que non se poder comprobar ata que se fagan ensaios con palabras
reais. De optarmos por facelo s do galego moderno, este dicionario sera
equiparable (proporcins gardadas) TLF, que o do francs dos dous ltimos sculos; os sculos anteriores completaranse con outros dicionarios (xa Sarmiento o quera facer as).
Pero anda tendo en conta as vantaxes que supora non ir mis al do
XVII, cremos que se debe tomar a historia do galego na sa integridade
porque a decadencia (como en Inglaterra a etapa normanda) non representou a aparicin dunha lingua nova senn unha lagoa que desembocou
na rehabilitacin literaria dunha lingua que, a nivel popular, mantivera
sempre unha continuidade que s foi perturbada polas interferencias do
bilingismo e da diglosia. Lingisticamente , pois, mis defendible a postura da continuidade, porque nos dicionarios histricos est gardada non
s a lingua senn en certa maneira tamn a historia cultural dun pas, e
no noso hai unha continuidade lingstica e cultural por riba de calquera decadencia. As que o noso dicionario histrico debera documentar
o seu vocabulario desde as mesmas orixes do idioma e s veces mesmo
mis al, pois nos textos latinos tardos hai xa moitas voces romanceadas
ou mesmo sen romancear que son a primeira documentacin dunha serie que pode chegar ata hoxe; outros dicionarios histricos, como o OED
ou o TLIO, recuperan constantemente voces anglosaxonas ou italianas
dos documentos latinos.
2. Tendo optado pola solucin larga, vaiamos contido. Un dicionario
destas caractersticas ten que basearse principalmente no uso, ou sexa,
debe rexistrar s palabras que algunha vez tiveron uso real nun texto escrito; a escritura era ata hai pouco a nica maneira de darlle soporte per-

362

Antn Santamarina

manente palabra e, anda que hoxe hai outros medios de soporte, o escrito segue a ser insubstituble porque o nico controlable. Dito doutra
maneira mis sinxela: cada palabra ten que estar rexistrada nun discurso
e ir ilustrada cun fragmento del e non con exemplos fabricados. Iso quere
dicir que hai que facer un baleirado dun nmero representativo de textos.
sabido que nunca pode haber unha colleita exhaustiva, pois, por moi
representativa que sexa a mostra, sempre vai faltar algunha palabra ou
algunha acepcin (se cadra algunha de certa frecuencia) que est fra das
fontes manexadas; e por outra parte o vocabulario est cambiando case
cada da, cousa que se nota mis polas palabras que aparecen que non polas que pasan a obsoletas (porque algun pode resucitalas nun momento
dado). Pero, anda as, conveniente cerrar nun momento o corpus e gardar para futuras empresas os apndices coas descubertas e novidades.
Hoxe hai ese baleirado representativo tanto para o galego medieval, que
conta cun corpus de case todo o editado, como para o moderno, que ten
un corpus con testemuos ata o ano 2007, como xa se expuxo noutros
captulos deste volume.
Ademais das voces rexistradas en textos, os dicionarios histricos
usan os dicionarios anteriores como corpus; nos dicionarios hai voces que
nalgn (ou en moitos casos) non foron nunca usadas en texto ningn dos
baleirados; carecen daquela de exemplos a non ser que o dicionarista que
as rexistra incla unha ilustracin. Tendo en conta que entre ns abundan dicionarios, vocabularios e nomenclaturas que se basean en enquisas
dun determinado territorio, a posibilidade de que un localismo recollido,
por exemplo, por Anbal Otero ou por Elixio Rivas nunca fose usado en
textos bastante grande; polo tanto vai haber unha cantidade non desprezable de voces que s se tean rexistrado en dicionarios.
Sobre a informacin dos dicionarios galegos hai que lembrar que cada
un deles un elo dunha cadea onde a informacin vai pasando unhas veces de maneira literal e outras ltrada. A informacin de carcter semntico en xeral transmitida con bastante delidade (anda que non faltan
exemplos de terxiversacins graves); en cambio, outras informacins,
como por exemplo a do lugar ou lugares en que se rexistra unha verba,
adoitan desaparecer; paras as voces que se incorporaron nos dicionarios
procedentes dos vocabularios de Sarmiento, Anbal Otero ou Elixio Rivas
prescindiuse sistematicamente de indicar a sa procedencia xeogrca,
ademais doutras informacins. E unha informacin non desdeable
mesmo para un dicionario de carcter xeral, dado que ese dato pode darnos unha idea da posible difusin da palabra; de feito, mesmo os dicionarios de uso ou prescritivos dunha lingua como o espaol nos informan

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

363

constantemente de que unha palabra propia s de Colombia ou de lava ou de Extremadura; os galegos, mesmo os normativos recentes, non
deban ocultar ese dato. En calquera caso, a distribucin xeogrca dunha
palabra unha informacin da que non se pode prescindir nun dicionario
histrico, sempre que se saiba; entre outras razns, porque os dicionarios
histricos son a base dos dicionarios etimolxicos e a noticia sobre a vitalidade e dispersin dunha palabra imprescindible; as que no DHG
haber que recuperar esta informacin dos dicionarios cando a dean.
E anda unha nota marxinal mis: determinado tipo de voces (e mesmo procedementos lexicais) son comns a moitas linguas. No OED non
raro ver como se cita moitas veces como fonte un dicionario dunha lingua
estranxeira, que foi seguramente a primeira en poer en circulacin un
neoloxismo. Obviamente, nun dicionario histrico coma o noso, recorrer a
estes dicionarios para estas voces culturais vai ser non s conveniente, senn obrigatorio, pois o dato sobre a lingua en que se cuou unha palabra
e a lingua intermediaria entre aquela e a nosa non superuo. Os dicionarios enciclopdicos doutras linguas que na nosa non os hai tern que
estar constantemente abertos na mesa do lexicgrafo; porque hai moitas
cousas que se din en galego e non son s da cultura galega.
Non se esgotan niso seguramente as fontes do lxico galego, anda que
as mencionadas (textos galegos e dicionarios galegos) sexan as principais.
Nos sculos chamados escuros producronse moitos escritos en casteln,
moitos deles inditos, que estn empedrados de palabras galegas ou ben
porque o produtor do texto ten un coecemento deciente do casteln e intercala a palabra galega que lle familiar ou ben porque a palabra se rere
a un fenmeno da cultura galega que non ten traducin casteln e se cita
por iso na lingua orixinaria. Calquera que repase documentos (escrituras,
regulamentos de gremios como os dos mareantes, que rexistra moitos termos de pesca, etc.) dos sculos XVI-XIX encontrar a cada paso palabras en
galego. Case toda esta documentacin est anda sen explorar, entre outras
razns porque esixe un baleirado manual, dos orixinais mesmo, porque hai
poucos transcritos. Cmpre que quede constancia da lagoa.
Qudanos anda unha pequena consideracin referida macroestrutura do dicionario. Est claro que sendo un dicionario da lingua galega o
fondo esencial do seu contido (nomenclatura, lemario...) deben de ser as
palabras galegas. Pero entre o que galego e o que non galego a raia
non est clara s veces, e especialmente se se opera co criterio do uso e
non con criterios puristas. Todos os dicionarios teen un problema cos
estranxeirismos, pois entre os naturalizados e os ocasionais hai un continuo no que difcil poer lmites. Entre ns as cousas complcanse por-

364

Antn Santamarina

que o bilingismo facilita os intercambios (que poden ser conscientes ou


inconscientes) e provoca as reaccins puristas consabidas, s veces dexeneradas en hiperenxebrismo. En cada caso haber que tomar unha determinacin. O mis grave que moitas veces seremos incapaces de saber
(e isto xa se rere mis etimoloxa que feito mesmo de exclur, inclur
ou etiquetar a palabra) se esa palabra prstamo, calco ou autctona. Os
catro sculos de silencio prvannos de poder aplicar o criterio cronolxico
para poder dilucidalo cando non vale o formal. Tamn vai ser dicultoso tomar a determinacin de se se lles d cabida no dicionario histrico s palabras que pertencen s verbos ou latns (dos canteiros, etc.). En
principio, un argot unha lingua diferente, anda que a sa morfoloxa e
sintaxe sexan galegas; daquela, as palabras argticas deberan de estar
excludas dos dicionarios histricos. Iso non quita que palabras da xiria
non se poidan incorporar lingua comn. Antes de eu ter ningunha familiaridade co latn dos canteiros recolln de informantes meus da Fonsagrada baiorte vio, que puxen na mia memoria de licenciatura coma
se fose unha palabra de Suarna; s despois aprendn de onde via, o cal
non me impedira seguramente tela rexistrado igual. Hai que ter en conta
que algunhas destas palabras estn bastante xeneralizadas, como guiche, guicho ou a variante con gheada ghiche, ghicho, ghicha, ghichio...,
que est recollida unhas ducias de veces no TILG. E s veces danse casos
en que ser imposible saber se unha palabra pasou do galego argot ou
viceversa, como o caso de baloca castaa e pataca. Como nos casos dos
estranxeirismos, est pouco claro s veces se unha voz argtica est naturalizada ou ten un uso ocasional. En calquera caso, o que parece claro
que non se poden incorporar en bruto os dicionarios do verbo dicionario
histrico, pero tampouco se poden exclur de cheo; todos estamos fartos
de ler en casteln palabras como gach, parn, piltra, entre moitas outras,
que o dicionario (anda o de lingua, canto mis o histrico) ten que rexistrar. En caso de dbida a losofa debe ser varrer para dentro.
E anda imos ter outro problema engadido, este mis grave cs anteriores, a saber, qu voces (tecnicismos) das falas especializadas admitir e
cales non. O OED, que na actualidade ten 615.000 entradas, non d cabida
a todos cantos tecnicismos circulan pola lingua inglesa, que se contan seguramente por millns. No noso caso hai tamn decenas de miles, como
se pode ver no observatorio neolxico de Vigo (que non ten representacin de toda canta ciencia e tcnica hai); haber que estar atento a ese
observatorio e establecer algn criterio para decidir que neoloxismos
pasan e cales quedan. Na mia opinin estes termos teen un interese
secundario para o noso dicionario histrico, porque son en xeral interna-

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

365

cionalismos que coinciden (sen adaptacin ou con pouca adaptacin) en


todas as linguas. Moitos deles son de escasa duracin ou de vida efmera. Por unha razn puramente econmica (a de permitir que o dicionario
tea un remate) hai que ltralos con parsimonia (tanto no sentido galego
de coidado como no ingls de aforro), pero non exclulos de a feito entre
outras razns porque moitos deles teen circulacin moito mis al da
lingua especializada.
Tendo en conta todo anterior podemos conclur que o contido (os lemas) dun dicionario histrico son mis ou menos os dun dicionario de
lingua, pero mis abundantes porque non se poen restricins cronolxicas, nin xeogrcas, nin normativas; e por outra parte se mis xeneroso
con palabras xergais e tecnicismos. Os tipos de entrada ou lema (main
entry) seran, daquela, as voces normais (patrimoniais, cultas, algns
estranxeirismos, algns xergalismos, etc.) do vocabulario galego rexistradas conforme sa forma cannica moderna (o antigo e moderno
auzar prevalecer sobre a variante antiga afeuzar e sobre a variante moderna aunzar); no caso de palabras arcaicas hoxe fra da circulacin prevalecer como vedette a forma mis tpica (arrafear, refear, arrefear tern como entrada arrafear tendo en conta que deriva de rafez <r. raz).
Supoo que ha de haber moitos casos discutibles, pero o principio xeral
debe ser este. Naturalmente esas formas secundarias teen entrada, pero
s a efectos de referencias cruzadas (para reenviar entrada principal);
encabezan, como se dixsemos, un artigo que non existe (polo menos
nese lugar).
Ademais das palabras normais teen entrada nos dicionarios (vxase Berg / 1993: 53 e ss.):
(a) As letras do alfabeto, que deben encabezar un artigo non (ou non
s) polo valor do grafema, senn principalmente por outros valores que
poidan ter, por exemplo, referidos sa gura (unha curva en forma de
S, ou facendo eses), posibilidade que ten de formar parte dunha seriacin
(a, b, c), valores como smbolo (K), abreviacins (por pudor pode escribirse
c. ou m. en vez da palabra enteira), etc. Todas as letras deben ter entrada,
mesmo algunhas que non se usan no alfabeto galego (como omega, que
entra polo nome e non polo grafema, anda que parte do contido do artigo
tea que referirse a este ltimo).
(b) Os acrnimos e as abreviacins. Os acrnimos corresponden a palabras que se forman coa letra (s veces slaba) inicial de cada elemento
que compn o acrnimo (RAG, ORGA, ONU, SIDA...). s veces poden corresponder a palabras doutro idioma, como VIP, que por certo en ingls non se

366

Antn Santamarina

le vip senn vi-ai-pi. Non hai que confundir acrnimos con inicialismos,
do tipo OLP. A fronteira entre o acrnimo e o inicialismo non est clara
moitas veces, e ns coecemos mesmo mestura dos dous procedementos
en casos como UPG ou ILG. Os acrnimos en xeral dan lugar a entradas; os
inicialismos non: desenvlvense no artigo da letra correspondente. Pero a
fronteira s veces tan borrosa que vai haber casos discutibles e polo tanto incongruencias. Por abreviacins refermonos s palabras recortadas,
tipo metro (que hoxe est tan lexicalizado que xa case ningun se acorda
da sa etimoloxa: (tren) metro(politano); outras veces, como no caso de
bici, a etimoloxa mis transparente anda e neste caso a entrada ter o
carcter s de referencia cruzada (a denicin s incluir os exemplos).
(c) Axos e outras formas combinables (afns s axos). Os dicionarios
de lingua xa incorporan estes elementos como entradas; unhas veces son
morfemas con escaso contido lxico, como ex-, anti-, auto-, -doiro, -izar,
pero outras veces son elementos radicais, a maior parte das veces de grecismos, que se antepoen ou pospoen a outras races, igualmente gregas
as mis das veces (pero que case nunca apareceron combinadas no grego
clsico): refermonos a casos como cripto-, neo-, austro-, -cardia, -dinmico,
-lecto... conveniente que entren estes elementos nun dicionario histrico para ver a sa historia, pero non est claro ata qu punto a inclusin
destas entradas libera de inclur tamn as palabras compostas nas que
entra un deses elementos. Posiblemente moitos dos derivados formados
con ex- non necesiten ter entrada, como moitos dos formados con auto-,
e aqu o dicionarista poderase espraiar (cfr. o que fai o OED para pre-, con
mapa e todo, ou para auto- sen mapa); en cambio todos os formados
con -ectoma ou quiro- teen que ter entrada no lugar que lles corresponda e entn o artigo poder abreviarse. O galego non ten como o ingls a
posibilidade de usar palabras patrimoniais como prexos (tipo self: selfadhesive) ou suxos (tipo man: spiderman), a non ser que consideremos
latinismos como -forme (vermiforme) e outros como xa patrimoniais.
(d) Nomes propios e marcas rexistradas. Os nomes propios non entran
nos dicionarios de lingua nin nos histricos. Hai, con todo, casos onde o
nome propio de persoa ten os trazos dun apelativo: paio, xan, prkinson
(que en realidade unha elipse de enfermidade de Parkinson), e neste
caso forman parte da macroestrutura do dicionario. O mesmo ocorre con
algns nomes xeogrcos (ribeiro). Algns deles estn tan asimilados
que xa se escriben con minscula. Outras veces o nome propio gura
como determinante ou atributivo doutro nome (bao (de) Mara, cruz de
Caravaca); neste casos se o nome propio gura como entrada s a efectos de referencia cruzada pois a locucin ir explicada na palabra rexente.

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

367

Hai casos, con todo, pouco claros. Relacionados cos nomes propios estn
os substantivos e adxectivos, e mesmo verbos e adverbios, derivados de
nomes propios (gongorismo, gongorino, gongorizar; coruesismo, coruesista). Todos os dicionarios teen un problema con estas entradas porque
se trata dun sistema aberto que non se sabe moi ben onde cortar; no TILG
aparecen esporadicamente verbos como despontevedrizar, que con certeza vai ser excludo do dicionario histrico. Murray era moi restritivo, ata o
punto de que excluu con algo de esaxero o adxectivo e substantivo African por ser de etimoloxa e valor obvios para calquera, a pesar de que hai
datos del en ingls desde o ano 888. A importancia e a frecuencia destas
voces o criterio determinante. E relacionados cos nomes propios estn
os nomes comerciais, s veces marcas rexistradas, de determinados produtos (do tipo Aspirina, Coca, Martini, Kleenex, tirita, maicena (<maizena)
ou Ciprianillo). Lembremos que bolgrafo, plexigls, celo e tergal, igual que
as palabras anteriores, son marcas comerciais, algunhas rexistradas, e s
os moi entendidos o saben ou sospeitan, a pesar de que algunhas teen
mesmo sitio na Internet (como www.tiritas.com, da casa Hartmann). A
inclusin destas palabras depender do uso xenrico que se faga delas,
cousa que non sempre ben discernible.
(e) As palabras compostas teen entrada nos dicionarios a travs
da sa forma grca soldada (abrecartas), anda que a sa denicin se
aproxime moito sa anlise etimolxica (utensilio que serve para abrir
cartas). Pero hai casos en que entre a palabra composta e o sintagma libre
hai lmites borrosos porque anda a morfoloxa non est xada denitivamente: sapoconchos ou sapos conchos son posibles; mal non temos
dbida de que hai que escribilo xunto en maldicir, maldicin, malbaratar,
malbarate, pero xa non estamos tan seguros se debemos facer o mesmo
en malcriado, malnacido ou maleducado porque mal- anda esta moi ligado seu valor adverbial primitivo (de feito non se pode dicir *maleducacin). Vexo difcil neste caso cmo se poden establecer criterios para decidir entre dar entrada combinacin ou ben remitir a sa inclusin a un
dos elementos da combinacin; hai que repasar neste caso a denicin
de palabra, tema do que xa se sabe que hai tratados enteiros. O editor ter
que decidir co seu gusto sobre o grao de solidariedade; en calquera caso,
estas combinacins teen que ter un sitio no dicionario (ou ben como
entrada ou ben como elementos polirremticos dentro dunha entrada).
E outra decisin similar haber que adoptar con referencia s derivados
que son resultado dunha adicin gramatical case mecnica; inclur como
entradas todos os adverbios en -mente non ten sentido ningn, a non ser
que queiramos por razns comerciais de presumir de ter moitos lemas.

368

Antn Santamarina

O mesmo podemos dicir dos adxectivos en ble, dos participios que se


poden usar adxectivamente, etc. Naturalmente algns destes derivados
teen que gurar, pero s aqueles que tean algn matiz semntico engadido que non guraba na base ou ben que tean unha frecuencia moi
elevada na lingua. Noutros casos inclense baixo a palabra principal correspondente. Isto no noso caso ( contrario do ingls) moi frecuente,
porque temos moitos diminutivos, aumentativos, etc.
(f) Palabras dubidosas ou claramente espurias. Nos textos, nunha parte moi considerable de casos as palabras falan por si soas, ou porque son
moi coecidas ou ben porque os contextos permiten vericar cal o sentido exacto ou aproximado de cada palabra. Pero moitas veces as palabras
poden estar referidas a cousas que xa descoecemos porque pertencen a
un mundo desaparecido e vai ser moi difcil de dilucidar o seu signicado;
outras veces poden deberse a erros dos autores ou mesmo a caprichos
s que a nosa literatura (ou foi) bastante propicia; isto non , alis, un
fenmeno s noso; entre a correspondencia de Murray hai moitas cartas
dirixidas a autores vivos para preguntarlles qu queran dicir con tal palabra, cousa que s veces nin os mesmos autores lograban esclarecer (cfr.
Mugglestone 2000a: 17 e ss.). Debe ser un fenmeno universal; a ns mesmos tennos ocorrido mis dunha vez, anda con escritores tan amigos da
verdade lolxica como Ferrn, que incle por exemplo a palabra ss nun
contexto de Arraianos: a donicela che coma un rato; tenche sete ss de
dentes aados coma navallias (p. 64). Este tipo de caprichos ou fantasas verbais (ou simplemente erros) teen tamn entrada nos dicionarios
histricos e sobre elas o lexicgrafo dir o que saiba ou ben declarar que
non sabe nada; en calquera caso, se fai unha conxectura que quede claro
que o que propn inseguro e provisional. Tamn entre os nosos dicionarios houbo unha tendencia a fabricar palabras (se o casteln cara en
galego face, daquela descarado *desfazado, segundo Cuveiro (1876) e seguintes); como tamn houbo a tendencia a copiar palabras que proceden
de lecturas errneas doutras fontes escritas (a voz airoa angua pequena
de Sarmiento foi mal lida por Rodrguez (1863), aixa, e con esta forma foi
transmitida despois a varios dicionarios); ou ben a facer pasar por galegas
palabras que procedan doutras linguas (o grego ergaleion instrumento
ou ferramenta dun artce nun texto de Sarmiento interprtase como galego e lese mal (ergaleirn) por De la Iglesia e as pasa a Rodrguez (1863) e
a varios dicionarios posteriores. s veces algunhas destas palabras poden
remanecer en escritos dalgn autor que acode s dicionarios para enxebrizar o seu galego, de maneira que as fantasmas lxicas dos dicionarios
poden retroalimentar a lingua literaria e lexitimar estas voces. Pero o nor-

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

369

mal que estas palabras carezan completamente de uso. Pois ben, mesmo estas voces dos dicionarios debern de aparecer no DHG debidamente comentadas cando se saiban comentar. No OED estas formas espurias
rexistranse como erros e explcanse cando se sabe; e se non presntase
como explicada nos dicionarios como..., e dse a cita. No OED as entradas
espurias van entre corchetes (o artigo enteiro).
Non menciono agora outros pormenores da posible macroestrutura, entre eles o de se o dicionario ten que ser alfabtico ou conceptual. A
posibilidade (mis ben necesidade) de publicalo en formato electrnico
permite que o traballo non sexa necesario acometelo por letras; o traballo
pode render mis tratando acios de palabras que teen unha anidade
semntica (voces que designan plantas, peixes, medo...) ou formal (un primitivo coa sa restra de derivados).
3. Pasamos agora a ver como sera a estrutura (microestrutura) dun
verbete tpico. Hai que ter en conta que as entradas son heteroxneas e
s en entradas moi complexas van ocorrer todos os trazos acumulados.
Srvenos de gua o OED.
Nos dicionarios histricos, coma nos dicionarios de lingua, hai das
seccins; unha, a que comprende o verbete da entrada e toda a informacin que non semntica: categora gramatical, grafas, fontica, etimoloxa, frecuencia (que non aparece no OED pero si no TLF); a outra seccin
a que se rere contido semntico do verbete, con todo o que leva aparellado: acepcins, exemplos, etiquetas de rexistro, combinacins, etc.
No OED, para entradas que tiveron unha morfoloxa moi complicada
(verbos como go), entre as das seccins, realmente na seccin de contidos pero principio de todo, numerado sempre como letra A (inexional
forms), fronte a B (signication), clasifcanse todas as variantes morfolxicas, por exemplo, no verbo por tempos e persoas (o noso verbo correspondente a go ir, e sen dbida outros, necesitarn esa seccin)11.
Esa distribucin dalgns dicionarios (primeiro as formas e etimoloxa
e despois o contido) non ten por que ser necesariamente as nesa orde;
noutros dicionarios, como o DCVB ou o TLF, a informacin sobre as variantes, pronunciacin, morfoloxa, frecuencias e etimoloxa dse nal
da entrada; cremos que a estratexia do OED a mis acertada porque dis11. Non todos os dicionarios inclen este apartado de inexional forms, como ocorre no TLF, que promete un
volume separado para as variantes exionais; pero a maiora dos outros inclen paradigmas histricos e
dialectais.

370

Antn Santamarina

tingue ben as informacins relativas forma ( principio) das relativas


contido (despois). Vaian onde queiran esas informacins, o nico que
non cambia de lugar o lema (encabezado, cabeceira, rbrica, verbete,
mot vedette, headword) que encabeza o artigo lexicogrco, e a denicin.
Onde vai ir cada informacin haber que decidilo cando se faga o blueprint denitivo.
Na seccin do lema (ou se se quere no que non seccin do signicado)
aparecen obrigatoriamente a cabeceira (headword), a categora gramatical e a etimoloxa; de ser necesario infrmase sobre o grao de integracin da palabra (arcasmo, estranxeirismo...), moitas veces simplemente
mediante un signo non alfabtico, o nmero de homnimo, etiqueta de
campo, e variantes formais.
Non necesario que nos deteamos pormenorizadamente en cada
un destes aspectos porque todos os dicionarios de lingua conteen todas
esas informacins e indicacins de navegacin de maneira mis ou menos explcita. Pero hai algn que merece comentario porque non habitual nos dicionarios de lingua:
(a) En primeiro lugar a fontica. En linguas cunha ortografa moi arbitraria, como a do ingls ou a do francs, a pronunciacin do lema (na sa
forma non marcada) gura na maiora, ou nunha boa parte das entradas.
Para dar un testemuo de como a pronunciacin do francs moderno
Imbs e o seu equipo (TLF), parte de acudir a libros como o de Quemada
ou Martinet, xeron enquisas cunha poboacin de testemuas (estudantes de enxeeiros de Pars, procedentes de toda Francia, que seran o corpo social representativo do noso tempo). A grafa do galego fai previsible
na maiora dos casos cal a pronunciacin. Por iso, fra dos casos onde
entren as vogais medias, o seseo, a gheada, o rotacismo e poucos outros
fenmenos (coma o de inhibir), non ser necesario facer constar cal a
pronuncia. Tendo en conta que non se vai tratar dun dicionario normativo
( contrario do TLF ou mesmo do OED), no caso de que teamos que dar
a pronunciacin, haber que localizar a extensin de cada variante. Supoendo que haxa consenso, poder proporse unha das variantes como
aspirante a normativa.
(b) As variantes (orto)grcas tamn se deben de facer constar en
caso de que as haxa, e non s as que se reren s diferentes formas de escribir palabras que teen algn fonema con grafa arbitraria (como herba, erba, herva, erva, que se pronuncia igual calquera que sexa a grafa),
senn aquelas variantes en que a pronuncia motiva grafas diferentes,
como vai ocorrer na entrada toupa, que ser a que se escolla como ca-

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

371

nnica para Talpa europaea, onde debern gurar como variantes toupo,
teipa, teipe, teupa, tiopa, tiopo, topia (pero non toupeira, anda que sinnimo nalgns sitios, porque xa mis que unha variante fontica); naturalmente todas elas tern entrada pero s a efecto de referencia cruzada
contra toupa. Supoo que vai haber problemas mis dunha vez se que
a etimoloxa que vai seguir estas formas non o resolve; imaxinemos esta
serie de nomes para a Digitalis purpurea (entre outros):
belitroque, bilicloques, bilicroque, bilitroque, milicrocas, milicroques, palitroques, cloques,
croque, crquel, croquetas, cuco, farricoque, trcoles, trqueles, troques, estalote, estraladeira, estralante, estraloque, estroleque, estroqueiro.

Con esta restra imos ter dous problemas, que en realidade son un s:
cl das formas dar como cannica, que posterior a resolver se todos son
variantes da mesma familia etimolxica; e en segundo lugar, qu formas
dar como variantes e cales como sinnimas. Nos dicionarios histricos,
e no noso tamn, onde se van mesturar formas antigas e modernas, as
variantes grcas e fonticas van ser numerosas. Imaxnese a cantidade
delas que entrarn baixo o verbete escribir se a raz no galego medieval
pode ser (e)scre- ou (e)scri-; que o // do medio se pode escribir como <v>,
<u>, <pu> e <b>; que a desinencia pode ser er, ou ir; e calquera dos /i/ se
pode grafar <i>, <j> ou <y> (poderan ser mais de 100 variantes). Tendo en
conta que estamos a falar dunha lingua de oito ou mis sculos obvio
que hai variantes grcas propias dunha poca, e as o haber que facer
constar; o mesmo acontece coa pronunciacin que corresponda a estas
grafas, que se rexistrar ou reconstruir na medida do posible.
(c) Tocante etimoloxa. Esta unha informacin que se d moi resumidamente, mesmo nos dicionarios de lingua (DRAE, Robert, Larousse,
Webster, Houaiss...), e daquela non pode faltar nun dicionario histrico
en tanto que a etimoloxa pertence historia da palabra, polo menos na
medida en que explica o seu nacemento. O destinatario dun dicionario
histrico un profesional da lingstica ou unha persoa con curiosidades lolxicas mis apuradas cs dun usuario que s quere comprobar
un signicado ou coecer unha grafa correcta. Daquela, a nota etimolxica dun dicionario histrico, sen chegar a ser un artigo de dicionario
etimolxico, ten que ser mis informativa c dun simple dicionario de
lingua. Nun dicionario destas caractersticas vai haber moitos tipos de
etimoloxa. Por exemplo a dos internacionalismos formados con material
grego e latino non necesitan mis indicacin c timo e o seu signicado na lingua orixinal e, de ser o caso, a lingua intermediaria, se se sabe;

372

Antn Santamarina

o mesmo sucede cos estranxeirismos modernos, adoptados (tal cal) ou


adaptados ( sistema fontico e morfolxico), tamn con indicacin da
lingua intermediaria; isto cabe nunha lia dunha columna. Tampouco as
palabras patrimoniais derivadas ou compostas necesitan na maiora dos
casos mis etimoloxa c referencia cruzada primitivo ou a cada un dos
elementos do composto. En cambio, as palabras patrimoniais primitivas
debern ser obxecto dun exame mis pormenorizado porque son o testemuo mis el do noso pasado cultural. Moitas destas palabras teen
cognados noutras linguas e xa foron tratadas en dicionarios etimolxicos
hispnicos e romnicos; entre elas unha boa parte teen etimoloxas que
se poden admitir denitivamente como correctas porque cumpren todos
os requisitos da fontica e da semntica. Outras son anda obxecto de debate e non hai ningunha hiptese conclunte; neste caso haber que mostrar as diferentes hipteses, avalialas como mellor se poida e conclur que
algunha delas verosmil ou que ningunha o e se deixa polo momento
como de etimoloxa descoecida. Outras sern palabras galegas para as
que nunca se propuxo ningunha hiptese e entre elas haberaas tamn de
dicultade moi variable, cunha porcentaxe considerable de orixe escura
ou descoecida. Sexa como sexa, os testemuos que vai dar un dicionario
deste estilo van obrigar con certeza a revisar hipteses doutros dicionarios
hispnicos, porque os novos datos ofrecidos agora por primeira vez polo
galego van validar ou invalidar etimoloxas mis ou menos aceptadas. A
forma uesugo, documentada en textos latinos de Galicia en 1133 (en casteln ca. 1400), fai imposible a etimoloxa de Corominas (do occitano besuc
birollo < BIS-OCULU). Por outra parte, hai que ter en conta que o tramo de
lingua que tratamos de mis de oito sculos (en bastantes casos moitas
palabras galegas xa estn romanceadas en textos latinos de hai 1000 ou
mis anos). Iso quere dicir que moitas veces a etimoloxa dunha palabra
ter que facer referencia a transformacins (ramicacins de sentidos
novos, perda doutros) operadas dentro da propia historia do galego. Desde a etimoloxa haber que facer referencia a estas transformacins das
que se d conta na seccin da denicin. As reviravoltas da etimoloxa
romnica son s veces insospeitadas, dado que a lingua nai conviviu coas
linguas vulgares en contacto diglsico, de maneira que a derivacin lineal esperada pode estar perturbada por prstamos semnticos de variado tipo. Imaxinemos voces como orde, arco, arte (vulgares pola fontica),
ateigadas de acepcins cultas e de calcos doutras linguas. Nunha lingua
como a nosa, que estivo case desde sempre en contacto desvantaxoso co
casteln, os prstamos (conscientes ou non) e as reaccins de enxebrismo
e mesmo hiperenxebrismo alteraron tamn a vida das palabras. De todo

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

373

isto ten que dar conta a etimoloxa. Na seccin de etimoloxa darase a


bibliografa pertinente para cada palabra tratada, de habela. O OED con
frecuencia engade nota etimolxica unha miscelnea de feitos enciclopdicos relacionados coa historia da palabra na cultura europea. Cfr. por
ex. na palabra orange unha nota deste tipo; ou na palabra church (< ing.
antigo crice < gr. () casa do seor), onde, ademais de xusticar este nome fontica e semanticamente, compara esta denominacin
con outras candidatas sobrevividas noutras reas: corpo de conselleiros (que vn a ser unha traducin do hebreo qhl congregacin),
( ou ) casa real, ou (aedes) dominica. Os estudos etimolxicos sobre o galego non van permitir facer resumos etimolxicos
tan anados como os do OED, pero non est mal poermos unha meta
parecida que xa se ver como se cumpre.
4. Entramos nalmente na parte mis importante de calquera dicionario: a que trata dos sentidos das entradas ou informacin lexicogrca
propiamente dita. Cada entrada (a non ser as que sexan referencias cruzadas) ter que ter obrigatoriamente unha denicin (como mnimo) e
un ou mis exemplos. Ocasionalmente pode haber outras informacins,
como son as referidas estatus da palabra (arcasmo, forma non naturalizada), etiquetas de tipo gramatical (cando a palabra se usa cunha funcin
que non a esperada, por exemplo substantivos atributivos, adxectivos
substantivados), rexistro (dialectal, vulgar, etc.) asunto sobre o que hai
moita literatura, materia (Biol., Arquit., etc.), locucins e derivados (que
non tean entrada). Da maiora destes temas non imos ocuparnos; s diremos algo da denicin e dos exemplos.
Pero antes convn facer unha advertencia. Cando se dene o valor
dunha palabra sempre en relacin co valor que outras palabras teen
nunha etapa da historia. Nunha historia de oito ou mis sculos a lingua
produciu innumerables innovacins que alteraron o valor recproco dunhas palabras coas outras. Isto engade unha dicultade metodolxica s
dicionarios histricos, dado que na medida do posible teen que dar conta
das sucesivas sincronas (supoendo que queiran respectar a dicotoma
saussureana); como alis o hai que ir facendo para os fenmenos gramaticais nunha gramtica histrica (das do tipo da economa dos cambios
fonticos). Na prctica, facer isto, ou sexa trazar a historia da palabra en
relacin con todas as outras palabras do seu campo, sera enormemente
laborioso e irrealizable para todo o lxico, pois equivalera a facer un estudo onomasiolxico de todos os campos; cada palabra esixira case unha
tese de doutoramento. Ora, por experiencia sabemos que os sentidos cen-

374

Antn Santamarina

trais dunha palabra poden manterse estables longo do tempo. No OED


unha acepcin de church como conxunto dos clrigos dunha relixin ou
un segmento dela (do tipo a igrexa espaola) mostra exemplos desde o
sculo X actualidade. Outras veces as palabras cambian de signicado; o
fr. naf pasou de nativo, natural a falto de articio (e mesmo a inxenuo)
e no TLF dse a cadea de pasos pormenorizadamente. Pero nos dous casos
non se fai referencia s relacins paradigmticas de church ou naf con
outras palabras afns; o mesmo que ocorre tamn nas gramticas histricas (non estruturalistas) con fenmenos fonticos e gramaticais. Desta
maneira queda testemuo de como unha palabra existiu no discurso pero
non no sistema. Tendo en conta que facer un dicionario respectando escrupulosamente os principios saussureanos indicando como cada palabra
cambia segundo cambia o sistema irrealizable, os lexicgrafos estruturalistas mis escrupulosos preren abordar a historia lxica dunha lingua
a travs dunha batera de dicionarios de pocas sucesivas (como e o caso
de Imbs e o seu TLF). O malo que esta solucin ten dicultades prcticas,
porque realizar unha batera de catro ou cinco dicionarios correspondentes a outros tantos cortes cronolxicos economicamente inviable. O mesmo Imbs e editores sucesivos, recoecendo isto, engaden unha nota, como
queda visto, nal de cada entrada na que se xustican historicamente os
sentidos que ten unha palabra no francs moderno.
Pasando por alto esta eiva dos dicionarios histricos, imos logo ncleo esencial do dicionario: a anlise smica do vocabulario. Non imos
expor aqu ningunha teora nova, pois o tema principal de calquera manual de lexicografa; hai mesmo libros enteiros dedicados problema da
denicin e da desambiguacin da polisemia. Nos prlogos dos dicionarios hai tamn con mis ou menos pormenor ideas sobre a metodoloxa
lexicogrca verbo disto. Cada lingua impn unhas certas estratexias, e a
nosa pola sa historia tamn nos vai impoer algunhas, pero hai principios de tipo xeral que podemos ir apuntando baseados na experiencia e
na ensinanza allea.
Do vocabulario dunha lingua hai unha masa considerable que non
ten grandes problemas lexicogrcos: son as palabras monosmicas pertencentes s nomenclaturas cientcas, que crecen na medida en que nos
distanciamos da lingua comn; en xeral nos dicionarios bilinges teen
correspondencias exactas. En cambio, o ncleo fundamental do idioma
est formado por uns cantos milleiros de palabras polismicas que necesitan unha metodoloxa de anlise porque son potencialmente portadoras
dunha ambigidade; naturalmente, para que un discurso sexa ecaz, a
persoa que o produce, cando insire nel unha palabra polismica e daquela

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

375

ambigua, ten que fornecer mesmo tempo as claves necesarias para que
o receptor da mensaxe (no noso caso o lector lexicgrafo, porque os textos
que manexamos como crpora son s escritos) poida decodicala adecuadamente. As claves que se lle dan lector cando desambigua, ou lexicgrafo cando agrupa por anidades semnticas as diferentes papeletas ou
rexistros dunha palabra, son variadas (seguimos o esquema de Imbs no
prlogo do TLF, pero unha prctica experimentada en toda a lexicografa
desde o Renacemento).

(a) A maiora das claves son de tipo contextual (colocacins) na medida en que pertencen a un uso habitual colectivamente memorizado. Estas
claves ou auxiliares poden ser:

O contexto inmediato, e desta maneira o adxuvante pode ser categorial (unha palabra cambia de sentido co cambio de categora:
pasaxeiro s. ou a.: un pasaxeiro, unha crise pasaxeira), de natureza
sintctica (unha palabra non signica o mesmo se s se usa en
singular ou se se pode usar en singular e en plural: a luz intensa,
vexo das luces; ou se cambia de signicado segundo a preposicin que rexa: mirar algo, mirar por algo).
O auxiliar dominio. ben coecido que moitas palabras teen unha
acepcin diferente na lingua comn ou cando son usadas nun dominio especco (unha ciencia, unha tcnica, un ocio): mesa non
o mesmo na lingua comn que cando se fala de carros do pas; a
silencio psalle o mesmo segundo o usemos na lingua comn ou
falando de msica (gardar silencio, un silencio de redonda).
O auxiliar retrico (s veces concomitante redundantemente,
porque a lingua moitas veces redundante co contexto inmediato). Refermonos con isto uso que se fai dos vocbulos co recurso
da metfora, da metonimia e da elipse, que nos dicionarios se inventaran tamn como acepcins dentro do campo smico dunha
palabra: a febre, que unha alteracin da temperatura corporal (a
febre do cativo), pode por metfora pasar a desexo incontrolado (a
febre dos consumidores); mesa un moble coecido, e por metonimia mesa do leite ou Mesa pola Normalizacin Lingstica un
grupo de persoas, que se constiten non necesariamente arredor
dunha mesa, para reivindicar algo; vehculo autombil incorpora
os semas de vehculo a autombil cando vehculo desaparece por
elipse. Hai que ter en conta que as relacins metonmicas e meta-

376

Antn Santamarina

fricas teen diferentes graos de transparencia, pero o que interesa aqu chamar a atencin sobre o procedemento.
O auxiliar estilstico, que diferente do retrico porque non se rere a guras de pensamento senn a situacins nas que estn involucrados o emisor e receptor (niveis de lingua) ou intensidade
expresiva ou afectiva que caracterizan o uso dunha palabra (rexistros). Sabido que estas connotacins distinguen certas palabras
dalgns sinnimos semnticos (falador equivale a larapeteiro,
pero dependendo s do rexistro) e, o que mis importante anda,
interveen na segmentacin polismica das palabras (por exemplo home ten a acepcin de marido s nun contexto de lingua popular; nar pode signicar morrer por razns eufemsticas). Moitos destes sentidos dependen do sistema de valores de cada poca
e anda de cada grupo, e daquela as connotacins poden cambiar
segundo cambien as situacins socioculturais (cfr. palabras como
aristcrata, burgus, fascista, clase, masa, segundo onde e por quen
se digan; as regras de boa crianza xeron que longo da historia
bastantes palabras se tabuizasen).
Os auxiliares demarcativos, que axudan tamn a desambiguar a
polisemia, pois segundo as palabras do seu contorno unha palabra pode signicar unha cousa ou outra; na maiora dos casos un
verbo ten sentidos diferentes dependendo dos complementos (ou
actantes) que tea; nos dicionarios distnguense tradicionalmente sentidos dos verbos segundo o carcter transitivo, intransitivo,
pronominal, etc. (aproveitar/aproveitarse). Tamn as variacins na
morfoloxa poden discriminar sentidos (fumes en plural vaidade, arrogancia).
As condicins semnticas son os auxiliares mis importantes para
demarcar sentidos. Un verbo, por exemplo, pode ter sentidos diferentes segundo o suxeito sexa animado/inanimado, humano/
animal, persoa/cousa, abstracto/concreto (fulano corre, a auga corre, o da corre, o rumor corre; fulano quere a mengana, as plantas
queren luz).

Todos estes coadxuvantes contextuais permiten desambiguar polisemias tanto se o dicionario histrico como sincrnico; de feito, nos
dicionarios histricos asmese que un signicante ten un signicado
constante durante un certo tempo e ten que dar noticia das mutacins
formais como das perdas ou gaos no signicado; mesmo en certos casos
ter que asumir as estratexias dun dicionario bilinge cando a palabra

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

377

que se dene con palabras de hoxe xa non teen vixencia no vocabulario


actual. Naturalmente, tamn ten que dar noticia dos cambios de valores
que gobernan os rexistros: palabras que no galego medieval eran neutras
hoxe son palabrns ou revs12.
(b) Por outra parte, hai que ter en conta que a polisemia e homonimia son das caras da mesma moeda. Para linguas como as europeas, onde hai dicionarios etimolxicos, signicantes idnticos adoitan
darse como entradas diferentes sempre que a etimoloxa as retrotraia
a timos diferentes (golpe raposa e golpe de golpear son dous lemas
etimoloxicamente diferentes). Pero hai moitos casos para os que as etimoloxas son descoecidas ou escuras e non sabemos se estamos ante
voces homnimas ou polismicas; hai mesmo casos nos que tratndose
dunha palabra etimoloxicamente nica as acepcins son tan diferentes
que carecen de vnculo semntico ningn, ou sexa, carecen de semas comns que permita unicalas como un signicante nico. Nestes casos
os auxiliares demarcativos anteriores non son ecaces e a anlise distribucional a que pode dar indicios de se dous signicados pertencen a
un mesmo lema ou cada un a lemas diferentes: o que ocorre hoxe con
franquear unha porta (abrila) / franquear unha carta (selala), que non
teen ningn sema en comn nin calquera outro vnculo semntico;
produciuse nelas o que se chama rotura da unidade de campo ou homonimia interna. Nun dicionario de lingua (e mesmo nun dicionario
histrico por etapas) franquear debera ter dous lemas homnimos. Con
todo, non este o caso dun dicionario histrico, que como o etimolxico
trata da historia das palabras; neste caso os dous franquear acabaran
(histrica e etimoloxicamente) remontndose a un nico franquear,
cunha soa acepcin ou con das, pero menos distanciadas e polo tanto
de lema nico.
(c) Con auxiliares contextuais ou sen eles, as palabras hai que analizalas componencialmente como acabamos de ver (nos casos de homonimia interna); desa maneira inventaranse acepcins novas segundo se
engadan ou muden semas: muller ser humano de sexo feminino, se ten
engadido o sema de unida a un home por matrimonio ten a acepcin de
esposa. A adicin de semas, polo xeral, d lugar a signicados mis concretos; a falta deles d lugar a signicados mis abstractos ou xenricos.
Na anlise componencial, como se sabe, os diferentes semas organzanse
de modo xerrquico de maneira que un deles o clasicador e os outros
engaden diferenzas especcas.
12. Imos pasar por alto o problema da homonimia, que unha variante da polisemia.

378

Antn Santamarina

Todo isto de manual. Pero despois a prctica lexicogrca admite moita exibilidade porque, sexan polismicas, sexan homonmicas, a lexicografa non deu denido anda ata qu extremo se debe apurar a discriminacin
de sentidos. un problema vello dos dicionarios e nos libros de lexicografa
que tratan do tema sempre se chama a atencin sobre como en dicionarios
de alcance similar (polo tanto non un problema de tamao) a polisemia
se trata de maneira moi diverxente, como se desprende do nmero de acepcins, poucas veces coincidente, que se dan da mesma palabra; porque entre
os lexicgrafos hai das tendencias, a dos splitters e a dos lumpers (ou xebradores e agrupadores), segundo tendan, como os taxonomistas da bioloxa,
a recoller os matices mis midos ou preran dar nunha nica acepcin
varios sentidos algo diferentes pero con trazos comns. Ctase como exemplo de splitter o dicionario da Crusca, que para luogo ten 172 pargrafos, en
contraste co Littr, onde lieu ten s 24 (salvadas as diferenzas que poida haber de lingua a lingua, que son poucas (vxase Migliorini 1961: 46). Polo seu
carcter, os dicionarios histricos pertencen todos clase dos splitters. As
que para entradas algo complexas, para que o lector non se perda, a entrada
vn encabezada cun ndice, que agora no OED electrnico se proporciona
como un plano ou mapa da entrada (cfr. light a1).
5. Posterior clasicacin de acepcins dunha palabra (que xa se basea nunha anlise smica que en certa maneira supn unha denicin)
vn a denicin mesma. A denicin a parte esencial dun dicionario
(excepto dalgns tipos de dicionarios moi especiais). Non nos imos deter agora nunha teora da denicin, porque a denicin dun dicionario
histrico non diferente da denicin de calquera dicionario de lingua e
sobre ela hai literatura en todos os manuais, includos varios, excelentes,
en casteln (como Lara 2004). Xa se sabe que unha denicin correcta
aquela na que hai equivalencia semntica exacta entre o lema e a sa parfrase ou o sinnimo que lle segue. Polo tanto, unha denicin ser boa
se deniendum e deniens son reversibles. verdade que hai palabras especiais ( parte das gramaticais) que non se poden denir por sinnimos
nin polo procedemento aristotlico de genus proximum e differentiae specicae porque son primitivos semnticos, ou sexa, palabras que teen un
contido semntico que non ten genus proximum porque por riba do seu
genus xa non hai nada; non son hipnimos de ningun (ou non teen
hipernimo, que o mesmo); o caso de facer, suceder, parte, dicir, grande, onde e unhas ducias mis (cfr. Wierzbicka 1996). O nome de primitivos xa vn de Arnauld (1662) (Wierzbicka 1996: 12); dito nas palabras de
Wierzbicka (1996: 10), os elementos que se usan para denir o signicado

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

379

de palabras (ou calquera outro signicado) non poden ser eles mesmos
denidos; mis ben deben de ser aceptados como indenibilia. Por iso
as denicins destas palabras ou son circulares ou son mis escuras c
palabra mesma pois non se pode cumprir o requisito de que a denicin
sexa construda con elementos mis simples e comprensibles c palabra
denida. Na lexicografa clsica xa se entenda as: tre exister ne comporte pas dnition analytique parce que il ny a pas de terme ayant un
contenu plus gneral que lui, faute de quoi on a recours des dnissants
simplement synonymes et/ou des denitions dantonymie (TLF).
Ademais da exactitude hai unha serie de notas engadidas que se lles
adoita pedir s denicins lexicogrcas, entre elas, a brevidade e, de ser
posible, a elegancia.
As denicins lexicogrcas son, como sabido, denicin de palabras,
e non de cousas (estas seran mis propias dun dicionario enciclopdico).
Con todo, cando denimos unha palabra mostrando o seu xnero prximo
(escano banco...) estamos orientando o lector cara a un referente extralingstico, en certa maneira mostrndoo (funcin dectica) e a travs das
diferenzas especicas (corrido, xo e con respaldo...) estamos mostrando
os mobles que teen caractersticas parecidas pero non idnticas.
Por iso, as denicins dos dicionarios histricos desentndense bastante dos principios da reversibilidade e de que as denicins sexan denicins de palabras e non de cousas. Certamente un lector de dicionarios
histricos (forzosamente un especialista ou un curioso moi motivado
pola historia da lingua) prere os pormenores enciclopdicos denicin
do signo, ou mesmo a redundancia de informacins reversibilidade. Tamn pola mesma razn de que un lector de dicionarios unha persoa de
certa cultura se preocupa menos cs lectores doutros dicionarios de que
as palabras da denicin sexan menos escuras c entrada mesma, porque se entende que o seu posible lector domina un caudal lxico maior c
dun lector normal.
No OED, por citar un clsico, abundan denicins como as seguintes:
place (sb) 1b.
In modern use, forming the second element in the name of a group of houses (and hence of a
street) in a town or city, now or formerly possessing some of the characters (positive or negative)
of a square, chiefly that of not being properly a street.
Often used in the name of a small area more or less built around, and lying aside from a street
or thoroughfare, or of a short cul-de-sac or byway turning out of a main thoroughfare; also, more
vaguely given to a short row or terrace of houses, which originally stood by themselves on a
suburban road; being in fact a ready denomination for any aggregation of houses which cannot
be more particularly classed.

380

Antn Santamarina
Employed in 16th c. to render F. place and its Italian, Spanish, and German cognates, in reference
to foreign towns, whence introduced in English towns. (But in some cases the name Place has
arisen out of sense 4b, the site being that of a noblemans or bishops town-residence, which bore
the name, e.g. Ely Place in London [A definicin de Murray].
square (sb) 12. a
An open space or area (approximately quadrilateral and rectangular) in a town or city, enclosed
by buildings or dwelling-houses, esp. of a superior or residential kind, freq. containing a garden
or laid out with trees, etc.; more generally, any open space resembling this, esp. one formed at the
meeting or intersection of streets; also, the group of houses surrounding an area of this kind [A
definicin de Craigie].

Murray e Craigie, de quen son as denicins anteriores, pertencen


anda lexicografa clsica (anda non naceran os Rey, Quemada, Hausmann, etc.). Pero cando Imbs (ou Quemada ou Martin) ou os seus axudantes escribiron estoutra denicin para o TLF si que estaban xa a lexicoloxa e a lexicografa moito mis adiantadas, e en cambio seguen a dar
denicins tan pouco reversibles coma esta, por moito que lle quitemos
o entorno:
PLACE, subst. fm.
A. 1. Place publique et, p.ell., place. Dans une ville, une agglomration ou un village, lieu public
consistant en un espace plus ou moins large, dcouvert et le plus souvent entour de btiments
publics, o aboutissent plusieurs rues ou avenues, et o ont lieu souvent des activits commerciales, festives ou publiques.

No caso do noso dicionario histrico galego, igual que ocorre nos glosarios suzos, ou no DCVB, na mia opinin, o principio das equivalencias smicas non debe de ser unha camisa de forza, pois o usuario dun
dicionario destas caractersticas, especialmente en palabras patrimoniais
que teen algo que ver coa vida espiritual ou material dos galegos ou en
voces das nomenclaturas (partes do muo, ferramentas, etc.), mis que a
equivalencia exacta e a reversibilidade, agradecer informacins enciclopdicas que vaian mis al dos trazos esenciais; mesmo sera bo, se do
caso, mostralle os obxectos nun grco ou nunha imaxe.
Hai anda pormenores referidos denicin, como son o nada sinxelo
da xerarquizacin das acepcins. Nos dicionarios histricos a organizacin non pode ser senn cronolxica. Na prctica, isto en moitas palabras
imposible, porque acepcins que foron orixe doutras poden estar documentadas despois das que derivan dela. Por iso, cada denicin pide
estratexias diferentes. No noso caso, que temos unha historia literaria interrompida, probable que as rupturas cronolxicas sexan frecuentes. En
calquera caso, independentemente de que saibamos que rama vn antes

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

381

ou vn despois, nestes dicionarios poden haber varios niveis de xerarquizacin, como se ve polos catro en que Onions dividiu os 12 sentidos da
palabra whimsy (cfr. Berg 1993: 34) e casos parecidos a centos:

A outra parte importante da denicin son os exemplos. Ilustrar con


exemplos as denicins unha prctica que se vn facendo desde o Renacemento para as linguas clsicas e xa desde o XVII para os dicionarios
monolinges de linguas modernas. Anda que Saussure cuou a famosa
frase de que un dictionnaire un cemitire, a verdade que isto unha
esaxeracin, posto que xusto nos dicionarios onde se ven claramente
as das caras da sa dicotoma, por un lado a denicin, que nos mostra
cal (ou foi no tempo) o nicho dunha palabra na langue, e por outro os
exemplos, que son produtos reais onde se mostra a palabra funcionando
na parole. Os exemplos veen a ser para o lector como os testemuos de
que a denicin que elaborou o lexicgrafo responden a unha realidade
non fabricada. Como di Imbs, nunha denicin con exemplos o lector est
vez en presenza de esquemas abstractos e de modelos concretos, de maneira que en casos de dbida pode ir dos esquemas s modelos e confrontalos, e confrontalos anda cos seus propios enunciados ou intuicins.
Canto s exemplos cmpren tamn algunhas precisins. Nos baleirados manuais de textos os investigadores xa eran selectivos na recolla
de datos, pois das palabras frecuentes non rexistraban senn mostras escolleitas; eran, en cambio, mis exhaustivos coas palabras de frecuencia
menor ou obsoletas. As quedaban os cheiros desproporcionados (abundantes de palabras raras e escasos e palabras comns). Os redactores do
OED, cando Murray se xo cargo da redaccin, tiveron que solicitar dos
lectores que lles chasen tamn as palabras frecuentes. Agora, cos balei-

382

Antn Santamarina

rados electrnicos, o vocabulario non leva ltros humanos (ou non leva
mis ltros cs que lle queiramos impor mquina) e poden aparecer todas as palabras dun corpus, cada unha coa sa frecuencia; iso quere dicir
que palabras con moitas ocorrencias van ter moitas chas e o problema
convrtese no contrario, ou sexa, nun exceso de documentacin: palabras
como ter, vir, haber..., e xa non digamos algunhas palabras gramaticais,
que teen decenas de millares de exemplos cada unha (polo menos para
un corpus de cerca de 15 millns, como o noso moderno). Nestes casos o
redactor do dicionario ten que operar s cunha mostra e anda dela s lle
pode trasladar lector un exemplario moi reducido.
Hai que ter en conta que os exemplos son os portadores dunha tradicin e deben deixar ben manifesta a sa continuidade ou a sa ruptura.
No OED insrense, ordenados cronoloxicamente, de dous a cinco exemplos
por sculo. No DHLE danse tres ou catro por sculo e indcase que entre
o sculo tal e cal hai mis de 124 chas (ou as que sexan), para dar idea
da frecuencia. Como o dicionario histrico debe dar conta da cronoloxa
das palabras, imprescindible que a primeira documentacin sexa un dos
exemplos.
Os textos ilustrativos, sempre que haxa abondos para escoller, deben
mostrar a palabra en contextos sintagmticos que permitan corroborar
ben que a anlise feita na denicin correcta (nunha entrada como ovo
convn que entren exemplos que inclan palabras como pita, poer, nio,
cesta, ducia, casca, xema, choco, cocido, estrelado, podre, goro...). Se por riba
os exemplos ilustran as relacins paradigmticas da palabra (sinnimos
e antnimos), os dominios de uso ou os niveis de lingua, anda mellor. Os
textos en prosa sempre son preferibles s textos en verso.
Para ser ben, os exemplos deben ser autenticamente histricos, ou
sexa culturais, demostrativos de usos datados e vencellados s condicins
do medio (Imbs) de maneira que o dicionario de lingua se prolongue tanto como sexa posible nun dicionario de cousas, tanto da cultura material
como espiritual. A lingua un espello da cultura dun pas e o dicionario
a travs das denicins e dos exemplos cumpre unha funcin antropolxica (Lara 1990); iso o que xustica que poida haber, por exemplo, un
Diccionario del espaol de Mxico.
Nos dicionarios de autoridades os exemplos estn escollidos cun
criterio esttico. De feito, quen non era bo escritor xa non era considerado autoridade. O noso corpus non foi feito tomando como criterio a
excelencia literaria dos testemuos. O corpus non do galego literario
(belles lettres), pois hai textos de moitos xneros. Pero, anda considerando textos que foron escritos con pretensins literarias, na escolla de

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

383

autores para o corpus non fomos escrupulosos por razn de esttica;


consideramos que para dar testemuo da existencia dunha palabra tan
bo era Xos Baa Pose (=Pepe de Xan Baa) como Rosala ou Cunqueiro.
Con todo, habendo onde escoller (e sempre que outros criterios non o
desaconsellen, por exemplo, a cronoloxa ou que o contexto sexa mis
esclarecedor), ser preferible dar exemplos de escritores bos, e non dos
mediocres ou malos.
Sen dbida o lemario do noso dicionario histrico vai ter un bo nmero de entradas que non proceden dun corpus, senn doutras obras
lexicogrcas anteriores (dicionarios, monografa, atlas, etc.). Na maiora dos casos nunca no atlas a palabra non est ilustrada con exemplo.
Nestes casos o autor do dicionario poder citar o exemplo do vocabulario
orixinal se o ten, pero absterase de fabricar un exemplo. ben sabido que
entre os dicionarios de lingua hainos que optan por dar exemplos reais,
pero outros preren fabricar os exemplos. Como un dicionario histrico
non un dicionario de lingua con vocacin pedagxica, limitarase a dar
os feitos lexicogrcos tal como os documenta.
Escusamos dicir que, calquera que sexa a calidade ou procedencia, as
citas deben ir sempre coa referencia de fonte. As voces que procedan do
ALGa ou doutro material dialectal deben indicar a localidade onde foron
rexistradas.
Ademais da denicin e dos exemplos (con outras informacins,
rexistro dominio, etc.), dentro da seccin semntica hai anda outros
apartados nos dicionarios histricos; o ocupado polas locucins ([saber
algo] polo libro con todos os pormenores), combinacins frecuentes (libro do profesor, libro do alumno, libro de instrucins...) e derivados (libresco). Non este o lugar de discutir sobre o problema das locucins, senn
sobre o lugar onde se colocan nun dicionario histrico. Como se sabe, non
teen entrada propia; dselles entrada debaixo da palabra principal (ou
de maior carga semntica) da locucin. O OED agrpaas todas despois
da ltima acepcin. Podera facerse seguramente doutra maneira (por
exemplo, cada locucin debaixo da acepcin que correspondese), pero supoemos que iso ten dicultades, porque s veces non doado decidir a
que acepcin corresponde a palabra nuclear da locucin.
Ademais das locucins, e a seguir (no OED ou no DHLE), inclense tamn frases proverbiais (do tipo [ser] antes o ovo ou a galia para referirse
a algo cuxa precedencia dubidosa).
E nalmente poden (e algns dicionarios fano) inclur unha serie de
colocacins (ou expresins plurirremticas). Nunha entrada como antena
(na acepcin de aparello de telecomunicacin) debern gurar antena

384

Antn Santamarina

de recepcin, de emisin, parablica, colectiva, individual, interior, telescpica, anda que ningunha das expresins necesite denicin, porque o
seu signicado vn cadrando co da suma dos dous elementos.
En canto s derivados, como xa se dixo, algns teen entrada como
lemas separados se teen usos lexicalizados independentes (librillo ou librito ou mesmo librio o de follas de papel de arroz para lear cigarros). En
cambio, lstanse dentro da entrada, sen denicin ningunha, ordenados
alfabeticamente e seguidos por unha lista de exemplos, naqueles casos
en que o derivado se forma cun prexo ou un suxo produtivo e de signicado transparente para un nativo; e aqu van todos os apreciativos (-io,
-azo...) e anda outros do tipo -ble, -idade, -izar, des-, re- (educable, galeguidade, galeguizar, desensarillar, recolocar). Non est moi denido na prctica lexicogrca, con todo, qu derivados teen entrada e cales se colocan
como apndice dunha entrada; se fosen todos suxos non presentaran
moitas dbidas (entre outras razns porque a sa colocacin nun dicionario alfabtico xa sera contigua entrada); pero haber prexos, que
mandan os derivados a maior parte das veces moi lonxe dos primitivos,
obriga a darlles entrada s derivados anda que s sexa como referencia
cruzada. Nos prximos dicionarios de feitura electrnica este problema
da colocacin vai desaparecer e mesmo os derivados prexados poden ter
unha remisin interna doada.
Anda nos queda outra observacin que facer referente parte dos
contidos (ou sense section) do dicionario. Ata hai pouco o dicionario por
antonomasia via sendo unha obra en soporte papel que se organizaba
en artigos encabezados por unha palabra que, entre outras funcins, tia
a de facilitar a busca nunha organizacin alfabtica. Por iso, a gran maiora dos dicionarios eran semasiolxicos, ou sexa, an da palabra para o
signicado. Pero agora as ferramentas informticas permiten recuperar
a informacin de moitas outras maneiras. Para poer un exemplo sinxelo, a palabra choco, que vimos antes no sintagma ovo choco, s se poda
buscar en choco (claro que se podera buscar noutras partes do dicionario,
pero sera obrigatorio ler o dicionario enteiro). Nun dicionario electrnico,
supoendo que se planique ben e que se lle fabrique un motor de busca adecuado, poderiamos atopar a palabra choco en calquera outro lugar,
e especialmente nas referencias paradigmticas (hipernimos, hipnimos, sinnimos, antnimos ou simplemente palabras de signicado afn:
goro, galeado, fecundo...) que se inclusen nas denicins; e tamn nas secuencias sintagmticas que se usasen de ilustracins, como poden ser os
exemplos includos en sintagmas tales coma pita, galia, ovo, auga, caldo,
camp, voz, lata, neboeiro... + choco/a. Un e outro tipo de relacins pode

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

385

mostrarse simplemente nunha restra de colocacins como fai o TLF13, en


vez de usar un exemplo para cada unha. O ordenador encargarase de informarnos de que choco aparece nunha entrada, pero tamn nas entradas
pita, ovo, auga, etc., formando sintagmas con elas; ou en goro, fecundo, etc.,
coas que forma un paradigma. Isto que xa se fai agora nas consultas complexas dos dicionarios electrnicos. Probablemente se podera completar
con algn sistema que marcase o campo nocional a que pertence cada
palabra (ou no seu caso cada acepcin). Desta maneira podera facerse
por exemplo unha busca de todos os lemas que inclusen na denicin o
hipernimo peixe; sera cuestin de establecer unha arborizacin xerrquica de campos ou utilizar algunha xa fabricada, como a dos dicionarios
ideolxicos, ou o Begriffsystem de Hallig / Wartburg (1952), ou o wordnet, e
usar denidores de maneira consistente. E as podera conseguirse unha
explotacin onomasiolxica (da idea palabra) do dicionario, til entre
outras cousas para facer etimoloxas.
6. E vn agora a parte mis delicada do dicionario (polo menos do
noso), que a sa fabricacin e viabilidade.
Polo que dixemos nesta mesma contribucin, o primeiro paso est
dado: o material sobre o que facer o dicionario existe xa, pois co TMILG e
co TILG, que xuntan entre os dous mis de 20 millns de rexistros, hai un
carozo mis que representativo para comezar. verdade que hai outros
crpora complementarios non integrables no mesmo cheiro, como son
o CORGA, os varios crpora da Universidade de Vigo14 e, ademais, o CODOLGA, e anda probablemente outros que nin estn situados en Galicia
(especialmente para o galego antigo). A experiencia dir cando o solapamento total ou cando vai ser necesario botar man de datos alleos. Por
outro lado, se consideramos os dicionarios como corpus, temos xa unha
boa parte deles reunidos nos dous dicionarios de dicionarios, moderno e
medieval (Santamarina 2003b e Gonzlez Seoane 2006). Sera desexable
que os diferentes crpora, tanto de textos como de dicionarios, se integrasen nunha nica base de recursos, e iso posible que suceda antes
de dous anos. verdade que hai dispersa outra documentacin, s veces
dentro da mesma casa, como a do ALGa ou do Arquivo Dialectal (que
habera que pr en formato integrable ou polo menos manexable); outra
veces o material est fra do ILG e anda non dispoible de todo, como
13. uf dautruche, de cane, de merle, doie, de pigeon, de poule; pondre, couver un oeuf; couvaison, incubation,
closion de loeuf... OEuf frais, gt, pourri; oeuf du jour; blanc doeuf; jaune doeuf; gober un oeuf cru; mirer
un oeuf; coquille doeuf (en parlant dune couleur); bote oeufs.
14. Vxase, neste mesmo volume, o traballo de Gmez Guinovart.

386

Antn Santamarina

pode ser o procedente do refraneiro e do dicionario de fraseoloxa. E nalmente algunha informacin est anda en fontes dispersas e difciles de
recoller, por exemplo a que gura en textos redactados en casteln, que
insiren palabras referidas a institucins galegas que non teen traducin
ou que, se a teen, lle era descoecida usuario. unha dispersin algo
embarazosa, pero creo que as cousas hai que velas polo lado positivo e
considerar como corpus bsico o TILG e o TMILG e os dicionarios de dicionarios, e considerar os outros como contrapuntos que poden permitir
unhas veces comprobacins e outras completar os datos propios. En calquera caso, os vimbios para facer o cesto xa estn xuntos (ou case), non
hai que ir monte por eles; a obra da cesta est nun estadio en que case
se pode comezar a tecer.
Agora, podemos formular unha pequena batera de preguntas que
non son doadas de responder. Entre elas as seguintes: (a) qun fai o dicionario histrico, (b) nde se fai, (c) cnto vai levar facelo, (d) cnto vai
custar facelo e tamn (e) cmo se fai.
(a) A primeira pregunta quizais a mis doada de contestar porque
hoxe son moitos os que neste pas saben como se fai (e tamn como non
se debe facer) un dicionario. En principio, parece que algunha responsabilidade deberan de ter os que se ocuparon previamente de organizar os
crpora de base, pero non necesariamente s eles. O que est claro que
a duracin da obra vai depender directamente do nmero e preparacin
e dedicacin das persoas que traballen nela. Iso quere dicir que o razoable sera que houbese un equipo estable que, como peda Julio Casares
(desenganado de ver como os membros do seu equipo se an marchando
despois de estaren preparados), estea decorosamente pagado. Hai que
ter en conta, de todas maneiras, que agrupar por anidades os diferentes
valores dunha palabra e facer despois as sas denicins un traballo
delicado para o que non todos valen, e daquela a escolla dos membros do
equipo debe efectuarse despois de avaliados adecuadamente os talentos
de cada un. Entre os fabricantes do dicionario non esquezamos que hai
unha parte informtica que debe ocupar un profesional competente.
(b) A segunda pregunta (nde se fai), no caso dunha lingua coma a
nosa, hai que responder dicindo que no seo dunha institucin acadmica.
Un particular ou unha institucin privada con nimo de lucro nunca vai
embarcarse nunha empresa destas caractersticas, porque o mesmo que
embarcarse nunha empresa de perdas millonarias; quen pense na posibilidade de que apareza un mecenas privado, sexa persoa ou fundacin, disposto a perder cartos pola cultura do pas est botando as contas da leiteira,

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

387

porque esa unha especie extinguida, ou, se a hai, intereseira. Daquela


quedan s das institucins que poidan facelo, ou a Universidade (entndese universidades, que hai tres) ou a Academia, ou as das. Naturalmente,
hai a posibilidade de que se faga s na Universidade de Santiago de Compostela, e mis concretamente no ILG, pois en denitiva onde estn os
crpora principais. Isto ten inconvenientes insuperables por dous lados; en
primeiro lugar, porque o ILG non como o CSIC, onde pode haber un grupo de investigadores sen docencia a tempo completo dedicados exclusivamente a iso; ou sexa, inviable que a USC (ou as tres universidades se algn
da o ILG pasa a interuniversitario) poida convocar catro ou cinco prazas
de lexicgrafo. Igualmente, a posibilidade dun proxecto de investigacin
dentro do ILG ou dun convenio tampouco viable vista de como est a
poltica de investigacin neste pas, onde os convenios van de ano en ano e
non se pode garantir unha estabilidade, e os proxectos competitivos a nivel
autonmico ou estatal, anda que poden ser por tres anos, non permitiran
contratacins decorosas para persoas co nivel de preparacin requirido
por un proxecto deste tipo ( parte de que nos proxectos estatais estn excludos os dicionarios). As que, na mia opinin, de ser unha empresa
realizable, s podera ser a travs dunha colaboracin entre a Academia e o
ILG. A Academia ten entre os seus cometidos fundacionais a compilacin
dun dicionario. Claro que a Academia podera optar por facelo ela soa, e
estara no seu dereito, pero sera bastante absurdo que volvese a empezar
de cero e empezase a compilar un corpus no que se leva mis de 20 anos traballando e que xa est feito. Pondonos no mellor dos casos, que entre a
Academia e o ILG houbese un acordo de colaboracin, o problema do nanciamento persistira porque a Academia tera que negociar sa vez con
outras institucins o nanciamento. Iso vn a ser como pasarlle o morto a
outro. De todas maneiras, cremos que a Academia est en mellor situacin
de conseguir un nanciamento, pois, tendo en conta que as leis lle deron
a potestade en materia lingstica, tamn deberan darlle os medios para
que fabrique os recursos lingsticos adecuados. Neste ano do centenario
en que todos son a recoecerlle unha autoridade ben ou mal gaada, sera esperable que lle recoecesen tamn un orzamento axeitado. Lembrei
antes que o Ministerio de Educacin lle concedeu unha renda anual de 1.2
millns de euros RAE mentres duren os traballos do dicionario histrico
do espaol (e non unha cifra incompatible cos donativos de institucins
privadas ou de mecenas individuais). No noso caso, por parte dos poderes
pblicos (galegos e estatais) a poltica ter amarrada a Academia por convenios anuais en vez de asegurarlle unha cantidade anual xa nos orzamentos da Comunidade Autnoma; pero iso unha dinmica que convira

388

Antn Santamarina

romper e asegurarlle RAG por algn organismo da administracin un


nanciamento de longa duracin. En calquera caso, a RAG est en mellores condicins de conseguir ese nanciamento do que o ILG. Pero as como
case se pode garantir que a RAG dira si proxecto comn, non est tan
claro claro que as institucins autonmicas e estatais estean dispostas a
concederlle un nanciamento axeitado. No prlogo do WNT dica Matthias
deVries que a lingua a alma da nacin; a nacin mesma (apud Osselton 2000: 68). No noso caso, se se mira a lingua con tantas reticencias como
a nacin, a cousa pode ir para largo.
(c) Canto vai levar facelo? Pois depende de canta xente traballe, e sa
vez isto depende do nanciamento que haxa, entre outras cousas mis.
En xeral, estas obras nunca duran o que se calcula, entre outras razns
porque non se pode facer ben o clculo mentres non se entre en materia,
ou sexa, se saiba cantos lemas hai que denir e que cantidade media de
lemas pode denir cada redactor por ano. Os calculadores sempre pecan
de optimistas. Para que se vexa o enganosos que son os clculos a priori
vede na seguinte tboa a diferenza que houbo entre o tempo previsto e o
tempo real das seguintes empresas:
Dicionario

Comezo

Fin

Anos previstos

Anos reais

Veces o previsto

DWB

1838

1961

10

123

12,3

OED

1876 (1858)

1928

13

52

WNT

1852

1998

25

146

5,84

SAOB

1883

2017

12

166

13,8

ODS

1901

1956

12

55

4,5

NO

1930

2014

84

DCVB

1901

1962

61

Outras empresas resultaron peor, como o caso do DHLE, que das


veces consecutivas non pasou do volume II.
Agora comprenderase por que o ILG ten difcil embarcarse s nunha
empresa coma esta; anda o ten difcil a Academia se vai negociar un convenio cunha Consellara ou cun Ministerio se se presenta cunha memoria
na que se incla a tboa anterior.
Con todo, cremos que o galego est nunha situacin mis favorable
cs linguas anteriores con vistas a facer un dicionario histrico en tempo
breve, entre outras razns porque non unha lingua tan copiosa (non
podemos fachendear diso) coma as dos arredores. A nosa literatura pequena e lacunosa; as nomenclaturas de ocios son escasas, o uso do ga-

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

389

lego nas ciencias foi cativo, as que o nmero de lemas rexistrado nos
nosos crpora vai ser bastante menor; menor incluso c do cataln. Iso
pode poernos no equivalente a cinco ou seis volumes do DCVB, supoendo que se xese en papel. Tase en conta ademais que o noso corpus est feito; para os dicionarios da tboa anterior a data de inicio a
que corresponde de comezo do baleirado de textos; tal como estn as
cousas ns poderiamos comezar xa os traballos de redaccin en poucos
meses. Por outra parte, habera que imitar mis ben s que buliron que
non s que buliron pouco ou traballaron con interrupcins (a pesar deles). O TLF comezouse en 1957, apareceu o 1 volume en 1971 e rematou en
1994 (47 anos); o GDLI empezou a publicarse en 1961 e rematou en 2002; o
WAT (do afrikaans) vai ben de ritmo. As que, pomonos no mellor dos
casos, con cinco redactores full time mis os que xa gaen un soldo por
outro lado (na universidade por exemplo) e poidan dar cheda na obra do
dicionario, en 10 anos poderan ter redactado un bo carozo del. Dentro
dun pouco diremos unhas palabras sobre como se fai e volveremos sobre
isto. Sexa como for, o tempo que leve facelo vai depender da cantidade de
xente que traballe e de que traballe coa dedicacin esperada. O detallismo
con que se faga tamn pode inur na duracin; se cadra mellor nunha
primeira edicin sacricar algn pormenor secundario.
(d) Canto vai custar? Depende da cantidade de xente que traballe nel e
do tempo que leve rematalo. Cos datos que dei antes pode calquera botar
a conta: cinco lexicgrafos e un informtico con dedicacin exclusiva poden levantar un 300 mil euros ano. Se son 10 anos son 3 millns de euros
dos de hoxe. Dse por sentado que os acadmicos ou membros da universidade que poidamos traballar niso sera a base de prestacins voluntarias. Na mia opinin, son cifras asumibles e quen se asuste dese monto
ten que saber que un traballo que se pagara moi xenerosamente con
que lle dedicasen unha cuarta parte do que se queima cada ano en fogos
Apstolo (e podera poer moitos mis exemplos de foguetera similar
que non d proveito a ningun ou d un proveito ben escaso e efmero).
Damos por suposto que o resultado vai ser consultable en principio s
por Internet e daquela non haber gastos adicionais en papel, impresin
e encadernacin.
(e) Como se fai? Contestar esta pregunta sera o mesmo que ter xa un
manual de instrucins de como facelo, cousa que anda non est pensada
nos pormenores (que van ser moitos, e moitos deles s van xurdir e se podern resolver cando se entre en materia). Non vou facer senn das observacins relacionadas coas tecnoloxas actuais e que poden facer mis
viable o proxecto, adecundoo en cada caso dispoibilidade de medios.

390

Antn Santamarina

En primeiro lugar, temos que asumir que o tempo dos dicionarios


en papel pasou historia; a nosa empresa non pode ser como a de a de
Aguilar (DEA), ou a de UTET (GDLI), ou a da OUP (OED), que tentan sacar
benecio do moitsimo dieiro investido; os resultados da nosa empresa
sern de uso gratuto como son as beirarras ou o paseo da Ferradura; o
uso por Internet eliminar a carga de ter que facer un exemplar para cada
contribunte galego. de supoer, con todo, que vai haber fanticos da
letra impresa anda por un tempo, e para estes haber que facilitar ferramentas que lles permitan cargar e imprimir e encadernar pola sa conta
parte da obra ou a obra enteira se queren.
Outra observacin. Os dicionarios dos sculos XIX e XX (anteriores a
1961) haba que facelos necesariamente en papel e ilos publicando por volumes ou por fascculos, e ademais seguindo a ordenacin alfabtica. Iso
implicaba ter que redactar a entrada baco antes c entrada abade (ou polo
menos todas as palabras do fascculo I antes de entrar no II, pois haba que
imprimilos e encadernalos). O soporte electrnico vai permitir que a redaccin se poida empezar por calquera sitio do alfabeto e seguindo a orde que
sexa mis axeitada, se cadra unhas veces por campos lxicos e outras por
familias de palabras, pero sempre guiados por criterios non alfabticos. Iso
vai permitir que nos centremos de entrada nas 20 ou 25 mil palabras patrimoniais, dicir, aquelas palabras que se manifestan dentro de estruturas
lexicais complexas, e que deixemos para o nal a terminoloxa e as nomenclaturas (sempre cando non se reran a realidades da cultura espiritual ou
material galega). Noutras palabras, o usuario dun dicionario histrico galego vai estar sempre mis interesado en atopar nel palabras como abondo,
acabar, ancio, afogar, alumar ou al (e podemos inclur nesta lista tamn
palabras do galego antigo xa desaparecidas como ccedra ou concambiar)
do que palabras como abrasivo, acarofobia, acetileno, agaricceas ou albuminasa. Todas as palabras do segundo grupo, que teen interese por moitas
outras razns, son fabricacins mis ou menos antigas que se poden atopar
nos dicionarios de calquera lingua e teen unha denicin que traducible
literalmente dunha lingua para outra. Por iso os primeiros dicionarios (Vocabolario della Crusca 1612, Dictionnaire de lAcadmie Franaise 1694, Diccionario de Autoridades 1726) non incluan o vocabulario des arts e des mtiers,
e anda hoxe son un problema para dicionarios con vocacin exhaustiva
como o OED ou o TLF, conforme vimos, porque universalismos destes hainos
a millns e naturalmente non se pode facer un dicionario dun milln de palabras. Desta maneira, podera ir montndose gradualmente un dicionario
partindo do vocabulario mis representativo da etnicidade galega e ir engadndolle materiais conforme se fose dispondo de medios. Propoo, como

Os Dicionarios Histricos: Trazos dun Dicionario Histrico Galego e consideracins...

391

se ve, comezar polo mis urxente; se se procede as, forzosamente o noso


dicionario histrico nun principio vaise parecer mis s glosarios suzos ca
s dicionarios histricos das grandes linguas; pero a nosa aspiracin deber
ser que entre todo, tanto alumar como albuminasa.
Anda quero engadir un comentario sobre a estratexia de fabricacin
do dicionario, e neste caso a inspiracin debmoslla intervencin de Pr
Larson. Como se dixo, debe de haber un equipo de redactores permanentes (catro ou cinco, podendo ser); estes redactores traballaran a tempo
completo, como contratados pola institucin que faga o dicionario, baixo
a responsabilidade dun editor, que supervisara o seu traballo e tratara de
que fose o mis homoxneo posible de acordo cos canones lexicographici
previamente formulados polo editor ou editores. Cada entrada ira asinada
polo seu redactor; en caso de que fose revisada por outra persoa que non
sexa o editor (ou un dos editores) tamn constara o seu nome; o visto e
prace nal para a inclusin dunha entrada denitivamente na base de datos debe dalo o editor (ou un dos editores, se hai mis de un).
Fra dese ncleo reducido de redactores podera contarse tamn coa
colaboracin de redactores espontneos; se se fai a travs dunha colaboracin entre o ILG e a Academia poderan ser acadmicos ou investigadores
do ILG, pero non s; calquera llogo onde queira que estea (dentro das
universidades galegas ou fra delas, ou mesmo no estranxeiro). A estes
colaboradores internos e externos proporcionaranselles as instrucins
necesarias de cmo redactar unha voz, o acceso s bases de datos e unha
plataforma informtica con folla de estilo, etc. na que introducir os datos.
Igual que no caso dos redactores permanentes seran responsables da entrada e asinarana (deixando tamn constancia do nome do revisor, se o
houbo). Tamn coma no caso anterior un editor dara o visto e prace nal
para que a voz fose denitivamente engadida base de datos denitiva.
Outras observacins sobre o como deixmolas para o manual de redaccin se algn da se fai.
Con isto damos remate esta contribucin. longo dela creo que
demos noticia suciente sobre a necesidade dun dicionario histrico, os
materiais de que dispoemos, os medios humanos e institucionais de que
se dispn (ou que fan falta) e as dicultades que hai para inicialo e levalo
a cabo. Demos tamn algunha noticia sobre a art and craft necesaria para
facelo.
Como se pode ver, para esta obra non propoemos ningunha innovacin metodolxica revolucionaria; no sculo XX e anda no XIX xa se
produciron moitos dicionarios que cumpran os requisitos de obras ben

392

Antn Santamarina

feitas e seguen a ter un valor insustituble na actualidade. A pretensin


dos galegos para o sculo XXI ter por n obras, e en concreto un dicionario histrico, que cumpra eses estndares e que se acabe antes de que
se cumpra o primeiro cuarteirn do sculo. Nunca tan cerca se estivo de
poder botalo a andar; esperemos que se poida facer.

393

BIBLIOGRAFA CITADA

A.J. (1701): A compleat account of the Portugueze language, being a copious


dictionary of English with Portugueze, and Portugueze with English.
With an Easie And Unerring Method of its Pronunciation. London: R.
Janeway [Edicin facsimilar de R. C. Alston, Menston: Scolar Press,
1970].
Academia das Cincias (1793): Diccionario da lingoa portugueza / publicado pela Academia Real das Sciencias de Lisboa. Lisboa: Ofcina da
mesma Academia. [Edicin facsimilar de 1993].
Academia das Cincias (1940): Vocabulrio Ortogrco da Lngua Portuguesa. Lisboa: Imprensa Nacional.
Academia das Cincias (1947): Vocabulrio ortogrco resumido da lngua
portuguesa. Lisboa: Imprensa Nacional.
Academia das Cincias (1970): Vocabulrio ortogrco resumido da lngua
portuguesa. Lisboa: Imprensa Nacional.
Academia das Cincias (1976): Dicionrio da Lngua Portuguesa. Lisboa:
Imprensa Nacional-Casa da Moeda.
Academia das Cincias (2001): Dicionrio da Lngua Portuguesa Contempornea. 2 vols. Lisboa: Verbo.
Acevedo y Huelves, Bernardo / Marcelino Fernndez y Fernndez / Ignacio Aguilera (ed.) (1932): Vocabulario del bable de occidente. Madrid:
Junta para Ampliacin de Estudios e Investigaciones Cientcas, Centro de Estudios Histricos. [Includo en Santamarina (2003b)].
Acosta, Cristbal (1578): Tractado Delas Drogas, y medicinas de las Indias
Orientales, con sus Plantas debuxadas al biuo por Christual Acosta
mdico y cirujano que las vio ocularmente. En el qual se verica mucho
de lo que escriui el Doctor Garca de Orta. Burgos: Martn de Victoria.
Adamo, Giovanni / Valeria della Valle (2003): Neologismi quotidiani. Un
dizionario a cavallo del millenio 1998-2003. Firenze: Olschki Editrice.

394

Bibliografa citada

Adelung, Johann Christoph (1774-1786): Grammatisch-kritisches Wrterbuch der hochdeutschen Mundart. 5 vols. Leipzig: Breitkopf & Sohn;
1793-18022 (4 vols.).
Adler, Ada (ed.) (1928-1938): Suidae Lexicon. 5 vols. Stuttgart: Verlag Teubner.
Aguil i Fuster, Marian (1915-1934): Diccionari Aguil. Materials lexicogracs aplegats per Marian Aguil i Fuster, revisats y publicats sota la
cura de Pompeu Fabra i Manuel de Montoliu. 8 vols. Barcelona: Institut
dEstudis Catalans.
Alcal, Pedro de (1505): Vocabulista aruigo en letra castellana. Granada:
Juan Varela de Salamanca.
Alcover, Antoni Maria (1911): Crnica de la Secci Filolgica de lInstitut
dEstudis Catalans, Bollet del Diccionari de la Llengua Catalana VI, 20,
368-372.
Alcover, Antoni Maria (1920): Triunf denitiu, absolut i consumat de
lobra de Diccionari dins les Corts dEspanya..., Bollet del Diccionari de
la Llengua Catalana 3, 65-180.
Aldrete, Bernardo de (1606): Del origen y principio de la lengva castellana o
romance que oi se usa en Espaa. Roma: Carlos Willeto. [Ed. facsimilar
con estudo de Lidio Nieto, Madrid: CSIC, 1972].
Alewyn, Abraham / Joannes Coll (1714): Tesuro dos Vocbulos Das das
Lnguas Portuguza, e Blgica; Em que circunstantemnte se demstro
as sinicaos das Palvras Poruguzas segndo a abundncia da Belgica sincia da Lingugem; Ha bra, geralmnte, Pra tdos os amadres
das mbas Lnguas, e Principalmnte Pra s ensinadres e discplos das
msmas grandemnte proveitsa. Amsterdam: Pieter vanden Berge.
Almeida, tila (1988): Dicionrios parentes e aderentes. Uma bibiliograa
de dicionrios, enciclopdias, glossrios, vocabularios e livros ans em
que entra a lngua portuguesa. Joo Pessoa: FUNAPE/Nova Stela.
Alonso Ramos, Margarita (1994-1995): Hacia una denicin del concepto
de colocacin: de J. R. Firth a I. A. Meluk, Revista de Lexicografa 1,
9-28.
Alonso y de los Ruizes de Fontecha, Juan (1606): Diez previlegios para las
mujeres preadas. Alcal: Luys Martynez Grande.
Alonso, Amado (1951): Rec. de Gili Gaya (1947-1957), en NRFH V, 3, 324-328.
Alvar Ezquerra, Manuel (1992): La Janua Linguarum de los jesuitas irlandeses de Salamanca, en Jos Antonio Bartol Hernndez / Juan Felipe
Garca Santos / Javier de Santiago Guervs (eds.): Estudios lolgicos
en homenaje a Eugenio de Bustos Tovar. Vol. I. Salamanca: Universidad,
61-64.
Alvar Ezquerra, Manuel (1993): Lexicografa descriptiva. Barcelona: Biblograf.

Bibliografa citada

395

Alvar Ezquerra, Manuel (1996): El Tesoro del andaluz, en Ignacio Ahumada (ed.): Vocabularios dialectales. Revisin crtica y perspectivas. Jan:
Universidad, 43-58.
Alvar Ezquerra, Manuel (2000): Tesoro lxico de las hablas andaluzas. Madrid: Arco/Libros.
Alvar Ezquerra, Manuel (2002): El diccionario de Richard Percyvall, en
Carmen Saralegui Platero / Manuel Casado Velarde (eds.): Pulchre,
bene, recte. Estudios en homenaje al Prof. Fernando Gonzlez Oll. Pamplona: Universidad de Navarra/Gobierno de Navarra, 49-71. [Recollido
en De antiguos y nuevos diccionarios del espaol. Madrid: Arco/LibrosAgencia Espaola de Cooperacin Internacional, 2002, 170-190].
Alvar Ezquerra, Manuel (2002-2004): Lxico espaol en la Historia animalium de Conrad Gesner, Archivo de Filologa Aragonesa, 59-60, 149-167.
Alvar Ezquerra, Manuel (2003a): Estado actual del Nuevo Tesoro Lexicogrco del Espaol (s. XIV-1726): repertorios posteriores a 1600, en
Mara Antonia Martn Zorraquino / Jos Luis Aliaga Jimnez (eds.): La
lexicografa hispnica ante el siglo XXI. Balance y perspectivas (Actas
del Encuentro de Lexicgrafos celebrado en Zaragoza en el marco del
Centenario Mara Moliner, los das 4 y 5 de noviembre de 2002). Zaragoza: Gobierno de Aragn-Institucin Fernando El Catlico, 25-49.
Alvar Ezquerra, Manuel (2003b): El Nuevo Tesoro Lexicogrco del Espaol
(s. XIV-1726) y los diccionarios con las lenguas romnicas, en Actas de la
III Escuela Interlatina de Altos Estudios en Lingstica Aplicada. La lexicografa plurilinge en lenguas latinas: patrimonio, actualidad, perspectivas (San Milln de la Cogolla, 22-25 de octubre de 2003), no prelo.
Alvar Ezquerra, Manuel (2004): El Nuevo Tesoro Lexicogrco del Espaol
(s. XIV-1726): repertorios anteriores a 1600, en Paz Battaner / Janet DeCesaris (eds.): De Lexicograa. Actes del I Symposium Internacional de
Lexicograa (Barcelona, 16-18 de maig de 2002). Barcelona: Universitat
Pompeu Fabra, Institut Universitari de Lingstica Aplicada, 19-38.
Alvar Ezquerra, Manuel (2006a): Un proyecto en marcha: el Nuevo Tesoro
Lexicogrco del Espaol (s. XIV-1726), en Javier Rodrguez Molina /
Daniel Sez Rivera (coords.): Diacrona, Lengua Espaola y Lingstica.
Actas del IV Congreso Nacional de la Asociacin de Jvenes Investigadores de Historiografa e Historia de la Lengua Espaola (Madrid, 1, 2 y
3 de abril de 2004). Madrid: Sntesis, 43-61.
Alvar Ezquerra, Manuel (2006b): Lxico del Tractado de las drogas y medicinas de las Indias Orientales de Cristbal Acosta, Verba 33, 7-30.
Alvar Ezquerra, Manuel (2006c): Cambios en el lxico espaol del Vocabulista de fray Pedro de Alcal (1505), en Actas del II Congreso Interna-

396

Bibliografa citada

cional de Lexicografa Hispnica. Alicante, 19-23 de septiembre de 2006,


no prelo.
Alvar Ezquerra, Manuel / Lidio Nieto Jimnez (2003): El espaol americano en A spanish and english dictionary de John Stevens, en Francisco Moreno Fernndez / Francisco Gimeno Menndez / Jos Antonio
Samper / M Luz Gutirrez Araus / Mara Vaquero / Csar Hernndez
(coords.): Lengua, variacin y contexto. Estudios dedicados a Humberto
Lpez Morales. Vol. I. Madrid: Arco-Libros, 81-103.
Alvar Ezquerra, Manuel / Lidio Nieto Jimnez (2006): La edicin del Nuevo
Tesoro Lexicogrco del Espaol (s. XIV-1726), en Elisa Corino / Carla
Marello / Cristina Onesti (eds.): Atti del XII Conreso Internazionale di
Lessicograa. Torino, 6-9 settembre 2006. Proceedings XII Euralex International Congress. Torino, Italia, September 6th-9th, 2006. Alessandria:
Edizioni dellOrso, 365-370.
Amato Lusitano (1553): In Dioscoridis Anazarbei de medica materia libros
quinque, Amati Lusitani, doctoris medici ad philosophi celeberrimi,
enarrationes eruditissimae. Venecia: Gualterum Scotum.
Ameno, Francisco Lus (1781): Diccionrio exegtico. Lisboa: Ofc. Patr. de
Francisco de Luiz Ameno.
Angelis, Victoria de (1977-1980): Papiae Elementarium. 3 vols. Miln: Cisalpino Goliardica.
Annimo (1554a): A very protable boke to lerne the maner of redyng writyng & speakyng english & Spanish. Libro muy prouechoso para saber
la manera de leer, y screuir, y hablar Angleis, y Espaol. Londres: John
Kyngston & Henry Sutton para John Wyght. [Ed. facsimilar en Menston: Scolar Press, 1971].
Annimo (1554b): The boke of Englysche and Spanysche. Londres: Robert
Wyer. [Ed. facsimilar en Menston: Scolar Press, 1971].
Aramon i Serra, Ramon (1982): Pompeu Fabra i lInstitut dEstudis Catalans, in Homenatge a Pompeu Fabra, President del Patronat de la
Universitat Autnoma de Barcelona (1933-1939) en complir-se 50 anys
de la publicaci del Diccionari General de la Llengua Catalana i de les
Normes de Castell de la Plana (Acte inaugural del curs 1982-83). Barcelona: Universitat, 23-39.
Azorn Fernndez, Dolores (2000): Los diccionarios del espaol en su perspectiva histrica. Alicante: Universidad.
Bacelar, Bernardo de Lima e Melo (1783): Diccionario da lingua portugueza.
Lisboa: Of. de Joz de Aquino Bulhoens.
Bacelar, Bernardo de Lima e Melo (1784): Arte, e diccionario do commercio,
e economa portugueza. Lisboa: Of. de Domingos Gonsalves.

Bibliografa citada

397

Bacelar do Nascimento, Maria Fernanda et al. (1984): Portugus Fundamental. Vol. 1. Vocabulrio e Gramtica. Lisboa: INIC/Centro de Lingustica da Universidade de Lisboa.
Bacelar do Nascimento, Maria Fernanda et al. (1987): Portugus Fundamental. Vol. 2. Mtodos e documentos. Lisboa: INIC/Centro de Lingustica da Universidade de Lisboa.
Balbus, Johannes (1286): Catholicon. Ed. incunabular en Maguncia (1460).
Baldinger, Kurt / Denis Gendron / Georges Staka (1974-2006): Dictionnaire
tymologique de lancien franais. Quebec / Tbingen / Paris: Presses
de lUniversit Laval / Niemeyer / Klincksieck.
Barbosa, Jernimo Soares (1822): Grammatica philosophica da lingua portugueza ou principios da grammatica geral aplicados nossa linguagem. Lisboa: Academia Real das Sciencias.
Barreto, Manuel (1607): Vocabulario Lusitanico Latino composto na Provincia de Japo. 3 vols. manuscritos (Biblioteca da Academia das Cincias
de Lisboa).
Berg, Donna Lee (1993): A Guide to de Oxford English Dictionary. The essential companion and users guide. Oxford: Oxford University Press.
Blancas, Gernimo de (1641): ndice donde se declaran algunos vocablos
aragoneses antiguos, en Coronaciones de los serenssimos reyes de
Aragn. Zaragoza: Diego Dormer.
Bluteau, Rafael (1712-1728): Vocabulario Portuguez e Latino, Aulico, Anatomico, Architectonico, Bellico, Botanico [...], autorizado com exemplos dos
melhores escritores portuguezes, e latinos, e offerecido a ElRey de Portugal, D.Joa V pelo Padre D.Rafael Bluteau. Coimbra: Collegio das Artes
da Companhia de Jesus / Lisboa: Joseph Antonio da Silva, 1712 (vols. I
e II, A, B-C), 1713 (vols. III e IV, D-E, F-I), 1716 (vol. V, K-N), 1720 (vols. VI e
VII, O-P, Q-S), 1721 (vol. VIII, T-Z), 1727 (suplemento I), 1728 (suplemento
II). [Reimpresin en Hildesheim: Georg Olms, 2002. Edicin en CD-Rom
da Academia Brasileira de Letras, 2003].
Bluteau, Rafael (1714/1728): Prosas portuguesas. 2 vols. Lisboa: Jos Antnio da Silva.
Bosque, Ignacio (1982): Sobre la teora de la denicin lexicogrca, Verba 9, 105-123.
Bosque, Ignacio (2004): REDES. Diccionario combinatorio del espaol contemporneo. Madrid: Ediciones SM.
Bosque, Ignacio (2006): Una nota sobre la relevancia de la informacin
sintctica en el diccionario, en Elisenda Bernal / Janet DeCesaris
(eds.): Palabra por palabra. Estudios ofrecidos a Paz Battaner. Barcelona: Institut Universitari de Lingstica Aplicada, 47-53.

398

Bibliografa citada

Boulanger, Jean-Claude (1989): Lvolution du concept de nologie de la


linguistique aux industries de la langue, en Caroline de Schaetzen
(ed.): Terminologie diachronique. Actes du Colloque organis Bruxelles
les 25 et 26 mars 1988. Paris / Bruxelles: Conseil International de la Langue Franaise / Ministre de la Communaut Franaise de Belgique,
193-211. [Trad. ao galego como A evolucin do concepto de neoloxa: da
lingstica s industrias da lingua, in Xos Mara Gmez Clemente /
Alexandre Rodrguez Guerra (coords.) (2003b), 32-48. Ctase pola versin
galega].
Buescu, Maria Leonor Carvalho (1983): O estudo das lnguas exticas no
sculo XVI. Lisboa: ICALP.
Bugarn Lpez, Mara Xess (2007): O galego fundamental. Dicionario de
frecuencias. A Corua: Fundacin Barri.
bUSCatermos = Servizo de Normalizacin Lingstica: bUSCatermos. Universidade de Santiago de Compostela. <http://www4.usc.es/buscatermos/>
Cabral, Manuel de Pina (1780): Magnum lexicon latinum et lusitanum ex
diuturnis celeberrimorum eruditissimorumque philologorum observationibus depromptum ad plenissimam scriptorum latinorum interpretationem accommodatum. Lisboa: Typii Regiae Ofcinae.
Cabr, M. Teresa (1993): La terminologa. Teora, mtodos, aplicaciones. Barcelona: Antrtida.
Cabr, M. Teresa (2000): La neologia com a mesura de la vitalitat interna
de les llenges, en M. Teresa Cabr / Judit Freixa / Elisabet Sol (eds.):
La neologia en el tombant de segle. Barcelona: Universitat Pompeu Fabra, 85-108.
Cabr, M. Teresa / Mara Bozzo / Carolina Santamara (1996): El Diccionari
de la llengua catalana de lInstitut dEstudis Catalans, Butllet Intern
del Departament de Presidncia 11, 2-4.
Cabr, M. Teresa et al. (2004): La lexicograa i la identicaci automatitzada de neologia lxica, en Paz Battaner / Janet DeCesaris (eds.): De
Lexicograa. Actes del I Symposium Internacional de Lexicograa, Barcelona, 16-18 de maig de 2002. Barcelona: IULA, 287-294.
Calepino, Ambrosio (1502): Cornucopiae. Reggio.
Campe, Joachim Heinrich (1807-1812): Wrterbuch der deutschen Sprache.
5 vols. Braunschweig: Schulbuchhandlung.
Cndido Lusitano, v. Francisco Jos Freire.
Cannecatim, Bernardo Maria de (1804): Diccionario da lingua bunda ou
angolense, explicada na portugueza, e latina. Lisboa: Impresso Regia.
Cannecatim, Bernardo Maria de (1805): Colleco de observaes grammaticaes sobre a lingua bunda ou angolense, a que se ajunta um diccio-

Bibliografa citada

399

nario abbreviado da Lingua Congueza, ao qual accresce uma quarta


columna, que contm os termos da lingua bunda, identicos ou similhantes lingua congueza. Lisboa: Impresso Regia, 18592.
Cardoso, Jernimo (1551): Hieronymi Cardosi Dictionarium Iuventuti studiosae admodum frugiferum. Coimbra: Joo de Barreira e Joo lvares;
Coimbra: Joo lvares, 15622; Coimbra: Joo de Barreira, 15873.
Cardoso, Jernimo (1562-1563): Hieronymi Cardosi Lamacensis Dictionarium ex lusitanico in latinum sermonem. Lisboa: Joo lvares.
Carmelo, Luis do Monte (1767): Compndio de orthograa, com sufcientes
catalogos. Lisboa: Antonio Rodrigues Galhardo.
Carr Aldao, Uxo (1926): Coleicin de refrans de almanaque, Ns 35, 6-8;
36, 13-18.
Carr Alvarellos, Leandro (1928-1931): Diccionario galego-casteln e vocabulario casteln-galego. 2 vols. A Corua: Lar; A Corua: Impr. Zincke
Hermanos, 19332; A Corua: Impr. Roel, 19513; A Corua: Impr. Moret,
19724. [Includo en Santamarina (2003b)].
Carter, Henry Hare (1953): A Fourteenth-Century Latin-Old Portuguese
Verb Dictionary, Romance Philology 6 (2/3), 71-105.
Carvalho, J. M. Teixeira de (1914): Pedro de Mariz e a Livraria da Universidade de Coimbra, en Boletim Bibliogrco da Biblioteca da Universidade de Coimbra 1, 389-398, 438-446, 482-494, 533-542.
Carvalho, Jos Monteiro de (1765): Diccionario Portuguez das plantas, arbustos, matas, arvores, animaes quadrupedes, e reptis, aves, peixes,
mariscos, insectos, gomas, metaes, pedras, terras, mineraes &. Lisboa:
Ofcina de Miguel Manescal da Costa.
Casares, Julio (1950): Introduccin a la lexicografa moderna. Madrid: CSIC.
Casas, Cristbal de las (1570): Vocabulario de las dos lenguas toscana y Castellana / de Christoual de las Casas; en que se contiene la declaracion de
toscano en castellano, y de castellano en toscano; en dos partes con una
introduccion para leer y pronunciar en ambas lenguas. Sevilla: Alonso
Escriuano. [Ed. facsimilar de Ediciones Istmo (Madrid) para Wareham
Imprints (Wareham, Massachusetts), 1988].
Casteleiro, Joo Malaca (1993): Introduo a Academia das Cincias: Dicionrio da Lngua Portuguesa. Reproduo fac-similada da edio de
1793. Lisboa.
Chompr, Pierre / Pedro Jos da Fonseca (trad.) (1779): Diccionario abbreviado da fabula. Lisboa: Regia Ofcina Typograca.
CIPM = Maria Francisca Xavier (dir.): Corpus Informatizado do Portugus
Medieval. Centro de Lingstica da Universidade Nova de Lisboa.
<http://cipm.fcsh.unl.pt/>

400

Bibliografa citada

CLIG = Gmez Guinovart, Xavier (coord.) (2005): Dicionario CLUVI inglsgalego. Seminario de Lingstica Informtica. Universidade de Vigo.
<http://sli.uvigo.es/CLIG/>
CLP = Verdelho, Telmo (dir.): Corpus Lexicogrco do Portugus. Universidade de Aveiro. <http://clp.dlc.ua.pt/inicio.aspx>
CLUVI = Seminario de Lingstica Informtica: Corpus Lingstico da Universidade de Vigo. Vigo. Universidade. <http://sli.uvigo.es/ CLUVI/>
CODOLGA = Lpez Pereira, Jos Eduardo: Corpus Documentale Latinum
Gallaeciae. Centro Ramn Pieiro para a Investigacin en Humanidades. <http://corpus.cirp.es/codolga/>
Coln, Germn (1956): A propos du Tesoro Lexicogrco de S. Gili Gaya,
ZRPh 72, 379-386.
Constncio, Francisco Solano (1836): Novo Diccionario crtico e etymologico da lingua portuguesa. Paris: Angelo Francisco Carneiro Junior Tip.
de Casimir.
Corbeil, Jean-Claude (1971): Aspects du problme nologique, La Banque
des Mots 2, 123-136.
CORDE = Real Academia Espaola: Corpus Diacrnico del Espaol. Real
Academia Espaola. <http://corpus.rae.es/cordenet.html>.
CORGA = Guillermo Rojo (dir.): Corpus de Referencia do Galego Actual.
<http://corpus.cirp.es/corgaxml>.
Corominas, Joan (1954-1957): Diccionario crtico etimolgico de la lengua
castellana. Berna / Madrid: Francke / Gredos.
Cortelazzo, Manlio / Paolo Zolli (1999): Dizionario etimologico della lingua
italiana. Bologna: Zanichelli, 19992.
Corteso, Armando (1978): A Suma Oriental de Tom Pires e o Livro de Francisco Rodrigues, Coimbra: Universidade.
Coseriu, Eugenio (1977): Principios de semntica estructural. Madrid: Gredos.
Covarrubias Horozco, Sebastin (1611): Tesoro de la lengua castellana, o espaola. Madrid: Luis Snchez. [Ed. de Martn de Riquer en Barcelona: Horta,
1943. Ed. de Ignacio Arellano / Rafael Zafra en Pamplona: Universidad de
Navarra / Iberoamericana / Vervuert / Real Academia Espaola, 2006].
CREA = Real Academia Espaola: Corpus de Referencia del Espaol Actual.
Real Academia Espaola. <http://corpus.rae.es/creanet.html>
CRPC = Nascimento, Maria Fernanda Bacelar do (dir.): Corpus de Referncia do Portugus Contemporneo. Centro de Lingustica (Universidade
de Lisboa). <http://www.clul.ul.pt/sectores/linguistica_de_corpus/
projecto_crpc.php>
CTG = Seminario de Lingstica Informtica: Corpus Tcnico do Galego.
Vigo. Universidade. <http://sli.uvigo.es/CTG/>

Bibliografa citada

401

CTILC = Institut dEstudis Catalans: Corpus Textual Informatitzat de la Llengua


Catalana. Barcelona. Institut dEstudis Catalans. <http://ctilc.iec.cat/>
Cunha, Antnio Geraldo da (2002): Vocabulrio histrico-cronolgico do
portugus medieval. Rio de Janeiro: Casa Ruy Barbosa.
Cuveiro Piol, Juan (1876): Diccionario gallego. Barcelona: Tip. de Ramrez
y Ca. [Includo en Santamarina (2003b)].
Davies, Mark / Michael J. Ferreira (2006- ): Corpus do Portugus. <http://
www.corpusdoportugues.org>
DCR = Cuervo, Runo Jos: Diccionario de construccin y rgimen de la lengua castellana / por RJ. Cuervo; continuado y editado por Instituto Caro
y Cuervo. Barcelona: Herder, 1998.
DCVB = Alcover, Antoni M. / Francesc de Borja Moll (1926-1962). Diccionari
catal-valenci-balear. 10 vols. Palma de Mallorca: Moll. <http://dcvb.
iecat.net/>
DDLC = Institut dEstudis Catalans: Diccionari descriptiu de la llengua catalana. Barcelona. Institut dEstudis Catalans. <http://dcc.iecat.net/
ddlc/>
De Bruyne, Jacques (1999): Las preposiciones, en Ignacio Bosque / Violeta Demonte (dirs.): Gramtica descriptiva de la lengua espaola. Vol. I.
Sintaxis bsica de las clases de palabras. Madrid: Espasa, 657-703.
DEA = Seco, Manuel / Olimpia Andrs / Gabino Ramos (1999): Diccionario
del espaol actual. Madrid: Aguilar.
DEA abreviado = Seco, Manuel / Olimpia Andrs / Gabino Ramos (2000):
Diccionario abreviado del espaol actual. Madrid: Aguilar.
DEBJ = Esteve, J. / J. Bellvitges / A. Jugl (1803-1805): Diccionario catalancastellano-latino. 2 vols. Barcelona: Tecla Pla.
Deus, Joo de (1804): Diccionario historico, juridico, e theologico. Porto: Typ.
de Antonio Alvarez Ribeiro.
Devoto, Giacomo (1969): Civilt di parole/2. Firenze: Vallecchi Editore.
DGILE (1987)= Alvar Ezquerra, Manuel (dir.) (1987): Diccionario general ilustrado de la lengua espaola. Barcelona: Bibliograf.
DGLC = Fabra, Pompeu (1932): Diccionari general de la llengua catalana.
Barcelona: Llibreria Catalnia.
DGMG = Mart i Gadea, Joaquim (1891): Novsimo diccionario general valenciano-castellano. Valncia: Josep Canales Rom.
DGPF = Ferrer Pastor, Francesc (1985): Diccionari General. Valncia: Estel.
DGTM = Real Academia de Medicina e Cirurxa de Galicia (2002): Diccionario galego de trmos mdicos. Santiago de Compostela: Direccin Xeral
de Poltica Lingstica.
DHLE = Vxase RAE (1933-1936) e RAE (1960-1996).

402

Bibliografa citada

DHLF = Rey, Alain (dir.) (1992): Dictionnaire historique de la langue francaise; contenant les mots francais en usage et quelques autres delaisses. 2
vols. Paris: Dictionnaires Le Robert.
Dias, G. / S. Guillor / J. G. P. Lopes (2000): Extraction automatique
dassociations textuelles partir de corpora non traits, en M. Rajman
/ J.-C. Chappelier (2000): Proceedings of 5mes journes internationales
danalyse statistique des donnes textuelles. Lausanne: EPFL, 213-221.
Diccionario abbreviado da Bblia traduzido do francez. Lisboa: Antonio Rodrigues Galhardo, 1766, 17942.
Diccionario de Autoridades = Real Academia Espaola (1726-1739): Diccionario de la lengua castellana en que se explica el verdadero sentido de
las voces, su naturaleza y calidad, con las phrases o modos de hablar, los
proverbios o rephranes, y otras cosas convenientes al uso de la lengua
[...] / Compuesto por la Real Academia Espaola. Madrid: Francisco del
Hierro, 17702.
Diccionario Geral (1818) = Diccionario Geral da Lingoa Portugueza de algibeira. por tres literatos nacionaes. Contem mais de vinte mil termos
novos pertencentes a Artes, Ofcios, e Sciencias, todos tirados de Classicos Portuguezes, e ainda no incluidos em Diccionario algum at ao
prezente publicado. Lisboa: Impresso Regia.
Diccionario Portuguez e Brasiliano. Obra necessria aos ministros do altar
que empreenderam a converso de tantos milhares de almas que ainda
se acham dispersas, pelos vastos sertes do Brasil, sem o lume da f, e
batismo. Aos que paroqueiam misses antigas, pelo embarao com que
nelas se fala a lngua portuguesa, para melhor poder conhecer o estado
interior de suas conscincias. A todos os que se empregarem no estudo
da histria natural da geograa daquele pas, pois conserva constantemente os seus nomes originais e primitivos. Lisboa: Ocina Patriarcal,
1795. [En 1934 foi feita unha reedicin con adicin da segunda parte:
Dicionrio Portugus-Brasiliano e Brasiliano-Portugus, ordenada e
preparada por Plnio M. da Silva Ayrosa. So Paulo: Imprensa Ocial].
Diccionario Universal (1845) = Diccionario Universal da Lingua Portugueza,
que abrange Todos os Vocabulos da Lingua Portugueza, antigos e modernos, suas accepes e sentido conforme as authoridades de nossos
classicos, [...] por Uma Sociedade de Litteratos. Lisboa: Typographia de
P.A. Borges.
Diccionario universal das moedas: assim metallicas, como cticias, imaginarias, ou de conta, e das de fructos, conchas, &c. que se conhecem na Europa, Asia, Africa, e Amrica. A que se ajunta huma noticia das Moedas
dos Judeos, Gregos, e Romanos; e dois Mappas dos pzos das principaes

Bibliografa citada

403

Cidades de Commercio; das Medidas dextenso reduzidas a palmos, covados, e varas; e das de capacidade, assim para secos como para molhados. Recopilado por**** Lisboa, of. de Simo Thaddeo Ferreira, 1793.
Dictionarivm latino lvsitanicvm, ac iaponicvm ex Ambrosii Calepini. Amacusa, 1595.
Dictionnaire de lAcadmie Franaise. Paris: Coignard.
DIEC (1995) = Institut dEstudis Catalans (1995): Diccionari de la Llengua
Catalana. Barcelona / Palma / Valncia: Enciclopdia Catalana.
DLC (1982) = Diccionari de la llengua catalana. Barcelona: Enciclopdia Catalana, 1982.
DLCL = Labrnia, Pere (1839-1840): Diccionari de la llengua catalana ab la
correspondencia castellana y llatina. 2 vols. Barcelona: V. Pla.
DMCF = Figuera, Pere Antoni (1840): Diccionario mallorqui-castella. Palma:
Esteve Trias.
DMCT = Tarong i Corts (1878): Diccionario mallorqu-castell. [Obra
inacabada].
DMFC = Febrer i Cardona, A.: Diccionri menorqu, espaol, francs y llat.
Texto manuscrito de comezos do sculo XIX.
DPCB = Valls, Emili (1927): Pallas diccionai catal-castell-francs, amb
vocabularis castell-catal i francs-catal. Barcelona: Pallas.
DPD = Real Academia Espaola / Asociacin de Academias de la Lengua
Espaola (2005): Diccionario panhispnico de dudas. Madrid: Santillana. <http://buscon.rae.es/dpdI/>
DRAE = Real Academia Espaola (2001): Diccionario de la lengua espaola. Madrid: Espasa-Calpe, 200122. Edicin en CD-ROM, Madrid: EspasaCalpe, 2003. <http://buscon.rae.es/draeI/>
DRAG (1913-1928) = Real Academia Gallega (1913-1928): Diccionario gallego-castellano. A Corua: Imprenta Ferrer. [Includo en Santamarina
(2003b)].
DRAG (1997) = Garca, C. / Manuel Gonzlez Gonzlez (dirs.) (1997): Diccionario da Real Academia Galega. A Corua: Galaxia / Xerais.
DRG = Planta, Robert de / Florian Melcher / Chasper Pult et al. (1939- ):
Dicziunari rumantsch grischun, publich da la Societ reto-rumantscha cul agd da la Confederaziun, dal chantum Grischun e da la Lia
rumantscha. 12 vols. (A-M). Cuoira: Bischofberger. <http://www.drg.
ch/index.html>
DS = Gutirrez Cuadrado, Juan (dir) (1996): Diccionario Salamanca de la lengua
espaola. Madrid/Salamanca: Santillana/Universidad de Salamanca.
DUE = Moliner, Mara (1966): Diccionario de uso del espaol. Madrid: Gredos, 19982. [Ed. electrnica en 2001].

404

Bibliografa citada

DVCE = Escrig, Jos (1851): Diccionario valenciano-castellano. Valncia: Imprenta de J. Ferrer de Orga.
DVPM (1999) = Xavier, Mara Francisca / G. Vicente / M. L. Crispim (ed.)
(1999): Dicionrio de Verbos Portugueses do Sculo 13. Lisboa: Centro de
Lingustica da Universidade Nova de Lisboa.
DVPM (2003) = Xavier, Maria Francisca / G. Vicente / M. L. Crispim (ed.)
(2003): Dicionrio de Verbos do Portugus Medieval. Sculos 12 e 13/14.
Lisboa: Centro de Lingustica da Universidade Nova de Lisboa.
DWB = Grimm, Jacob / Grimm, Wilhelm (1854-1861): Deutsches Wrterbuch. 32 vols. Leipzig: S. Hirzel. <http://germazope.uni-trier.de/Projects/DWB>
Encyclopdie = Diderot, M. (1752): L encyclopdie ou dictionnaire raisonn
des sciences, des arts et des mtiers []. Mis en ordre & publi par M.
Diderot []. Paris: Briasson / David / Le Breton / Durand, 1752 ss.
Estienne, Robert (1531): Thesaurus linguae latinae. Paris.
Estravs (1995) = Alonso Estravs, Isaac (dir.) (1995): Dicionrio da lngua
galega. Santiago de Compostela: Sotelo Blanco.
Fabra, Pompeu (1917): Diccionari ortogrc. Barcelona: Institut dEstudis
Catalans.
Faria, Eduardo de (1858-1859): Diccionario da lingua portugueza de Eduardo de Faria: quarta edio para uso dos portuguezes e brasileiros resumida correcta e augmentada com grande numero de termos antigos
e modernos, por D. Jos Maria de Almeida e Araujo Corra de Lacerda,
etc. Comprehendendo todos os vocabulos devidamente accentuados
suas accepes e sentidos conforme a auctoridade dos nossos classicos.
A etymologia de todos os termos radicaes, expondo o sentido rigoroso das raizes primitivas latinas, gregas, etc. A interpretao dos termos
que usavam os antigos escriptores, e que se acham mal denidos nos
Diccionarios at hoje publicados. Uma introduco grammatical a
mais completa, e ao alcance de todas as intelligencias. Um vocabulario
da lingua Tupy, chamada lingua geral dos indigenas do Brasil: seguido
de um Diccionario de Synonymos com reexes criticas. 2 vols. Lisboa:
Imp. de Francisco Xavier de Sousa.
Faria, Eduardo de (1859): Novo Diccionario da Lingua Portugueza. O mais exacto e mais completo de todos os Diccionarios at hoje publicados. Quarta
edio. Rio de Janeiro: Typ. Imperial e Constitucional de J. Villeneuve.
Fernndez Rei, Francisco (2004a): O Arquivo do Galego Oral do Instituto
da Lingua Galega, en C. Pujales Prats (ed.): Actas I, II e III Encontros O
Son da Memoria. Santiago de Compostela: Consello da Cultura Galega, 63-79.

Bibliografa citada

405

Fernndez Rei, Francisco (2004b): Andisas e rutas: mar de mar e mar de


vento na Arousa e na Costa da Morte, Ardenta. Revista Galega de Cultura Martima e Fluvial 1, 47-52.
Fernndez Rei, Francisco (2005): Cardumes, barras e manchas de peixe
en galego e portugus, en Ana I. Boulln Agrelo / Xos Lus Couceiro
Prez / Francisco Fernndez Rei: As tebras alumeadas. Estudos lolxicos ofrecidos en homenaxe a Ramn Lorenzo. Santiago de Compostela:
Universidade, 347-363.
Fernndez Rei, Francisco (2007): Unha vida entre peixe e salitre do mar
da Arousa, Ardenta. Revista Galega de Cultura Martima e Fluvial 4,
22-29.
Fernndez Rei, Francisco / Carme Hermida Gulas (1996): A nosa fala. Bloques e reas lingsticas do galego. Santiago de Compostela: Consello
da Cultura Galega, 20032. <www.consellodacultura.org/arquivos/asg/
anosafala.php>
Fernndez Rei, Francisco / Carme Hermida Gulas / Fernando R. Tato Plaza
(2004): Historias de vida e lxico do Castieirio (Santiago de Compostela), en Rosario lvarez / Antn Santamarina (eds.): (Dis)cursos
da escrita. Estudos de loloxa galega ofrecidos en memoria de Fernando R. Tato Plaza. A Corua: Fundacin Barri, 141-182.
Ferreira, Jos de Azevedo (1980): Alphonse X. Primeyra Partida. Edition et
tude. Braga: INIC.
Ferreira, Jos de Azevedo (1987): Afonso X. Foro Real. Vol. 1. Edio e estudo
lingustico. Lisboa: INIC.
Ferreiro, Manuel (1994): Contribucin lexicografa histrica do galego: o
vocabulario de Payzal, Cadernos de lingua 9, 55-88.
FEW = Wartburg, Walther von (1922- ): Franzsisches Etymologisches Wrterbuch. Eine Darstellung des galloromanischen Sprachschatzes. Bonn,
1922-1928, Leipzig, 1932-1940, Basel, 1944 e ss.
Feyj, Joo de Moraes Madureyra (1781): Orthographia, ou arte de escrever,
e pronunciar com acerto a lingua portugueza. 3 impr. Lisboa: Na Regia
Ofcina Typograca.
Figueiredo, Antnio Pereira de (1754): Coleco de palavras familiares assim portugusas como latinas. Lisboa: Miguel Rodrigues.
Figueiredo, Antnio Pereira de (1760): Breve diccionario da latinidade pura
e impura, com a signicao portugueza. Lisboa: Of. Patr. de Francisco
Luiz Ameno.
Filgueira Valverde, Xos / L. Tobo Fernndes / A. Magarios Negreira /
Cordal Cars (1926): Vocabulario popular casteln-galego. Vigo: El Pueblo Gallego. [Includo en Santamarina (2003b)].

406

Bibliografa citada

Folqman, Carlos (1755): Diccionario Portuguez e Latino, no qual as dices


e phrases da lingua portugueza [] se acham clara e distinctamente
vertidas na latina, e authorisadas com exemplos dos auctores classicos.
[] Compilado do Vocabulario do Reverendo Padre D. Rafael Bluteau, e
dos melhores Diccionarios de varias linguas [...] offerecido ao Rei Fidelissimo Dom Jos I [...] por Carlos Folqman. Lisboa: Miguel Manescal da
Costa.
Folqman, Carlos (1762): Nomenclatura portugueza, e latina [...] com hum pequeno vocabulario de verbos portuguezes. Lisboa: Miguel Rodrigues.
Fonseca, Jos da / Jos Incio Roquete (1848a): Diccionario da Lingua Portugueza de Jos da Fonseca, feito inteiramente de novo e consideravelmente augmentado por Jos Incio Roquete. Pars/Lisboa: Guillard/
Aillaud.
Fonseca, Jos da / Jos Incio Roquete (1848b): Diccionario dos Synonimos,
Poetico e de Epithethos da Lingua Portugueza. Pars: Aillaud.
Fonseca, Pedro Jos da (1762): Parvum lexicon latinum Lusitana interpretatione adjunta. Lisboa: Miguel Manescal da Costa.
Fonseca, Pedro Jos da (1771): Diccionario portuguez, e latino. Lisboa: Regia
Ofcina Typograca.
Franco, Antnio (1716): Indiculo universal: contm distinctos em suas classes os nomes de quasi todas as couzas que ha no mundo. vora. [Reeds.
en 1754, 1804].
Franco, Francisco Soares (1804-1806): Diccionario de agricultura. 5 vols.
Coimbra: Real Imprensa da Universidade.
Franco Grande, Xos Lus (1968): Diccionario galego-casteln e vocabulario
casteln-galego. Vigo: Galaxia. [Includo en Santamarina (2003b)].
Freire, Francisco Jos [Cndido Lusitano] (1765): Diccionario poetico. Lisboa: Ofcina Patriarcal de Francisco Luiz Ameno. [Reedicins en 1794,
1820].
Freire, Francisco Jos [Cndido Lusitano] (1842): Reexes sobre a lingua
portugueza. Lisboa: Typ. Soc. Propagadora dos Conhecimentos Uteis.
Freixa, Judit / Elisabet Sol (2003): Neoloxismos para a actualizacin de
gramticas e diccionarios, en Xos Mara Gmez Clemente / Alexandre Rodrguez Guerra (coords.) (2003b), 179-190.
Garca de Palacio, Diego (1587): Instrvcin nvthica para el bven vso y regimiento de las naos, su traa y su gouierno conforme a la altura de
Mxico. Mxico: Pedro Ocharte. [Ed. facsimilar en Madrid: Ediciones
Cultura Hispnica, 1944].
Garca Gonzlez, Constantino (1974): Lxico de la comarca compostelana.
Santiago de Compostela: Universidade.

Bibliografa citada

407

Garca Gonzlez, Constantino (1985): Glosario de voces galegas de hoxe.


Santiago de Compostela: Universidade. [Includo en Santamarina
(2003b)].
Garca Macho, Mara Lourdes (1993): Sobre los vocablos suprimidos en la
edicin de 1516 del Vocabulario espaol-latino de Nebrija, Anuario de
Letras 30, 135-159.
Garca Macho, Mara Lourdes (1995): Variantes lxicas y derivados en dos
ediciones del Vocabulario espaol-latino de Elio Antonio de Nebrija,
Cahiers de Linguistique Hispanique Mdivale 20, 187-208.
Garca Macho, Mara Lourdes (2005): Actitud de Nebrija en las ediciones
posteriores del Vocabulario espaol-latino, en Luis Santos Ro (ed.):
Palabra, norma, discurso. En memoria de Fernando Lzaro Carreter. Salamanca: Universidad, 537-558.
Gardin, B. et al. (1974): propos du sentiment nologique, Langages 36, 45-72.
Garrett, Joo Baptista da Silva Leito de Almeida (1966): Obras. Vol. II. Porto: Lello e Irmo.
GAVI = Colussi, Giorgio (1983-2006): Glossario degli antichi volgari italiani. 20
vols. Helsinki / Foligno: Helsinki University Press / Editoriale Umbra.
GDLE = Aquilino Snchez (1985): Gran diccionario de la lengua espaola.
Madrid: SGEL.
GDLI = Battaglia, Salvatore / Giorgio Brberi Squarotti (1961-2002): Grande
dizionario della lingua italiana. 21 vols. Torino: UTET.
GDS XXI = Pena, X. A. (2005) Gran dicionario Sculo XXI da lingua galega.
Vigo: Editorial Galaxia / Edicins do Cumio.
GDUEA = Aquilino Snchez (dir.) (2001): Gran diccionario de uso del espaol actual. Madrid: SGEL.
GDXL (2000) = Carballeira Anxo, X. M. (coord.) (2000): Gran Diccionario Xerais da Lingua. Vigo: Xerais.
GEC (1969-1980) = Joan Carreras i Mart (1969-1980): Gran Enciclopdia Catalana. Barcelona: Enciclopdia Catalana.
Gesner, Conrad (1551-1587): Historiae animalium. Zrich: Christophorus
Froschoverum, 1551 (I), 1554 (II), 1555 (III), IV (1558), 1587 (V).
Gestido de la Torre, Eloi / Xos Mara Gmez Clemente (2003): Neoloxa,
neoloxismos e diccionarios, en Mara lvarez de la Granja / Ernesto
Gonzlez Seoane (eds): A estandarizacin do lxico. Santiago: Consello
da Cultura Galega, 475-498.
Gili Gaya, Samuel (1945): Caractersticas de este diccionario, en Diccionario general ilustrado de la lengua espaola. Prlogo de D. Ramn
Menndez Pidal. Revisin de D. Samuel Gili Gaya. Barcelona: Spes; Barcelona: Bibliograf, 19713.

408

Bibliografa citada

Gili Gaya, Samuel (1947-1957): Tesoro Lexicogrco del Espaol (1492-1726).


Madrid: CSIC, 1947 (fasc. I, A), 1948 (fasc. II, B), 1952 (fasc. III, C-Ch), 1957
(fasc. IV, D); Madrid: CSIC, 1960 (vol. I, A-E).
Gilliver, Peter (2000): Appendix II. OED Personalia, en Lynda Mugglestone
(2000b: 232-252).
Gmez Aguado, Enrique (ed.) (1992): Francisco del Rosal, Diccionario etimolgico. Alfabeto primero de origen y etimologa de todos los vocablos originales de la lengua castellana. Madrid: CSIC.
Gmez Clemente, Xos Mara / Alexandre Rodrguez Guerra (2003a):
Neoloxismos na lingua xornalstica galega, en Xos Mara Gmez
Clemente / Alexandre Rodrguez Guerra (coords.) (2003b), 95-168.
Gmez Clemente, Xos Mara / Alexandre Rodrguez Guerra (coords.)
(2003b): Neoloxa e lingua galega: teora e prctica. Vigo: Universidade.
Gmez Guinovart, Xavier / E. Sacau Fontenla (2005): Tcnicas para o desenvolvemento de dicionarios de traducin a partir de crpora aplicadas na xeracin do Dicionario CLUVI Ingls-Galego, Viceversa. Revista
Galega de Traduccin 11, 159-171.
Gmez Pablos, Beatriz (2004): Rafael Bluteau en el Diccionario de Autoridades, Revista de Filologa de la Universidad de La Laguna 22, 67-78.
Gonzlez Gonzlez, Manuel (1996): O Diccionario da lingua galega da
Real Academia Galega, en Actas do Simposio de Lexicografa actual:
elaboracin de diccionarios, organizado pola Real Academia Galega e
o Centro de Investigacins Lingsticas e Literarias Ramn Pieiro
(Santiago-A Corua, 9-11 outubro de 1995). A Corua: Real Academia
Galega, 111-119.
Gonzlez Seoane, Ernesto (dir.) / Mara lvarez de la Granja / Ana Isabel
Boulln Agrelo (2006): Dicionario de dicionarios do galego medieval.
Santiago de Compostela: Universidade.
GPSR = Gauchat, Louis / Jules Jeanjaquet / Ernst Tappolet / E. Muret (1924- ):
Glossaire des patois de la Suisse romande. 7 vols. (A-F). Neuchtel / Paris: V. Attinger. <http://www.gpsr.ch/>
Griera, Antoni (1935-1947): Tresor de la llengua, de les tradicions i de la cultura popular de Catalunya. 14 vols. Barcelona: Eds. Catalunya.
Grimm, Jacob (1819-1837): Deutsche Grammatik. 4 vols. Gttingen:
Dieterichsche Buchhandlung. [Reimpresin en London: Routledge,
1999].
Guadix, Diego de [1593]: Recopilacin de algunos nombres arbigos que los
rabes pusieron a algunas ciudades y a otras muchas cosas. Manuscrito 59-I-24 da Biblioteca Colombina (Sevilla). [Existe unha edicin de
Elena Bajo Prez / Felipe Mallo Salgado, Gijn: Ediciones Trea, 2005].

Bibliografa citada

409

Guardiola Savall, M. Isabel (2006): El Tresor lexicogrc valenci (1543


1880) (TLV), en Actas del II Congreso Internacional de Lexicografa Hispnica. Alicante, 19-23 de septiembre de 2006, no prelo.
Guerra, Francisco (1982): El Tesoro de Medicinas de Gregorio Lpez, 15421596. Estudio, texto y versin. Madrid: Ediciones Cultura Hispnica.
Guerreiro, Miguel do Couto (1784): Tratado da versicaa portugueza [...]
Diccionario de Consoantes. Lisboa: Of. Patr. de Francisco Luiz Ameno.
Guiter, Henri (1994): Rang et dispersion des frquences lexicales romanes, Revue de Linguistique Romane 58, 47-70.
Hallig, Rudolf / Walther von Wartburg (1952): Begriffssystem als Grundlage fr die Lexikographie: Versuch eines Ordnungsschemas. Abhandlungen der Deutschen Akademie der Wissenschaften zu Berlin, Klasse
fr Sprachen, Literatur und Kunst 1952/4. Berlin: Akademie.
Houaiss, Antnio (2001): Dicionrio Houaiss da Lngua Portuguesa. Rio de
Janeiro: Objetiva.
Houaiss, Antnio (2001): Dicionrio Houaiss da Lngua Portuguesa. 6 vols.
Lisboa: Crculo de Leitores.
Ibez Fernndez, Jos (1950): Diccionario galego da rima e galego-casteln. Madrid: Marsiega.
IEC (1911) = Institut dEstudis Catalans (1911): Institut dEstudis Catalans.
Barcelona.
IEC (1996) = Institut dEstudis Catalans (1996): Lelaboraci del Diccionari
de la llengua catalana. Criteris aprovats per la Secci Filolgica, en
Documents de la Secci Filolgica. Vol. III. Barcelona: Institut dEstudis
Catalans, 11-53.
IEC (1997) = Institut dEstudis Catalans (1997): Diferncies del DIEC respecte
del DGLC quant a la representaci de les entrades i la nomenclatura,
en Institut dEstudis Catalans: Documents normatius 1962-1996 (amb les
novetats del diccionari). Barcelona: Institut dEstudis Catalans, 45-228.
IEC (2001) = Institut dEstudis Catalans (2001): Diccionari manual de la llengua catalana. Barcelona: Edicions 62 / Enciclopdia Catalana / Institut
dEstudis Catalans.
ILG / RAG (1990) = Instituto da Lingua Galega / Real Academia Galega
(1990): Diccionario da lingua galega. A Corua: Real Academia Galega.
Ir Indo (2004)= Domnguez Dono, X. / A. X. Raj Paz / B. Varangas Gonzlez. (coords.): Dicionario de galego. Vigo: Ir Indo.
Ivo, Miguel Tibrio Pedegache Brando (1778): Novo Diccionario francez e
portuguez. Lisboa. [ a 4 ed.; falta noticia das anteriores].
Ivo, Miguel Tibrio Pedegache Brando / Manuel Joaquim Henriques de
Paiva (?) (17865): Novo Diccionario Francez e Portugues, composto se-

410

Bibliografa citada

gundo os mais clebres diccionarios e enriquecido de muitos termos de


medicina, de anatomia, de cirurgia, de farmacia, de quimicia [sic], de
historia natural, de botanica, de mathematica, de marinha, e de todas
as outras artes e sciencias, notavelmente corrigido, emendado, e addicionado com hum sem numero de termos, e locues, e algumas frazes
em ambos os idiomas. Quinta Edio. Lisboa: Ofcina de Filipe da Silva
e Azevedo; 18037.
Janua linguarum (1611) = Janua linguarum, sive modvs maxime accomodatvs, qvo patet aditvs ad omnes lingvas intelligendas. Salamanca:
Francisco de Cea Tesa, 1611.
Jarava, Juan (1557): Historia de las yeruas y plantas, sacada de Dioscride
Anazarbeo y otros insignes autores, con los nombres griegos, latinos y
espaoles. Amberes: Herederos de Arnoldo Byrcman. [Ed. facsimilar
de J. M. Lpez Piero / M. L. Lpez Terrada / J. Pardo Toms (1998): Historia de las yervas y plantas. Un tratado renacentista de materia mdica.
Barcelona: Juan de Serrallonga].
JOB = Peter Skautrup: Jysk Ordbog. [en lia] <http://www.jyskordbog.dk/
hjemmesider/index.html>
Johnson, Samuel (1755): A Dictionary of the English Language: In which the
Words are deduced from their Originals, and illustrated in their different signications by Examples from the best Writers To which are prexed a History of the Language, and an English Grammar. 2 vols. London: Printed by W. Strahan for J. and P. Knapton; T. and T. Longemand;
C. Hitch and L. Hawes; A. Millar; and R. and J. Dodsley.
Junius, Hadrianus [Adriaen de Jonghe] (1567): Nomenclator omnivm rervm propria nomina variis lingvis explicata indicans. Amberes: Cristbal Plantino [Ed. facsimilar en Hildesheim-New York: Georg Olms,
1976].
Koike, Kazumi (2001): Colocaciones lxicas en el espaol actual. Anlisis
formal y lxico-semntico. Alcal de Henares: Universidad de Alcal/
Takushoku University.
Laguna, Andrs (1555): Acerca de la materia medicinal y de los venenos
mortferos. Amberes: Juan Latio. [Ed. facsmilar en Madrid: Consejera
de Agricultura y Cooperacin de la Comunidad de Madrid, 1991].
Lara, Luis Fernando (1990): El diccionario, instrumento de la etnicidad,
en Luis Fernando Lara: Dimensiones de la lexicografa. A propsito del
Diccionario del espaol de Mxico. Mxico: El Colegio de Mxico, pg.
39-50.
Lara, Luis Fernando (2004): De la denicin lexicogrca. Mxico: El Colegio
de Mxico.

Bibliografa citada

411

Laredo, Bernardino de (1527): Modus faciendi cum ordine medicandi. Sevilla: Jacobo Cromberger.
Laurenzi, Joseph (1640): Amalthea onomastica in qua voces universae, abstrusiores, sacrae, profanae, antiquae, antiquatae, usurpatae, usurpandae [...]. Basilea.
Leech, G. / A. Wilson (1996). Recommendations for the Morphosyntactic
Annotation of Corpora. EAGLES Guidelines. [en lia] <http://www.ilc.
cnr.it/EAGLES96/annotate/annotate.html>
LEI = Pster, Max (1979- ): Lessico Etimologico Italiano. Wiesbaden: Reichert.
Leiras Pulpeiro, Manuel (ca. 1906): Vocabulario. Texto manuscrito. Fundacin Penzol. [Includo en Santamarina (2003b)].
Lence Santar, Eduardo (1938-1941): Etnografa mindoniense. Ed. de Armando Requeixo. Santiago de Compostela: Follas Novas, 2000.
Llpiz Mndez, Vicente Luis (1954a): Locuciones, en Llpiz 1954a.
Llpiz Mndez, Vicente Luis (1954a): Refranero gallego. Indito. Editorial de
los Biblilos Gallegos. Museo de Pontevedra.
Llpiz Mndez, Vicente Luis (1956): Paremias selectas. Un manuscrito bonaerense (1956) de Vicente Llpiz Mndez, Cadernos de Fraseoloxa
Galega 8 (2006), 265-316. [Edicin de Xess Ferro Ruibal e Cristina Veiga
Novoa].
Lopes, David (1969): A expanso da lngua portuguesa no Oriente nos sculos XVI, XVII e XVIII. 2 ed. revista, prefaciada e anotada por Lus de
Matos. Porto: Ed. Portucalense. [A primeira edicin de 1936; reprod.
facsimilar en Lisboa: Copipronto, 2000].
Lpez, Gregorio (1672): Tesoro de medicinas para todas enfermedades.
Mxico: Francisco Rodrguez Lupercio.
Lpez Fernndez, S. et al. (2005): Novas palabras galegas. Repertorio de creacins lxicas rexistradas na prensa e en Internet. Vigo: Universidade.
Lpez Ferreiro, Antonio (ed.) (1901): Galicia Histrica. Coleccin diplomtica. Santiago: Tipografa Galaica.
Lorenzo, Ramn (ed.) (1968): Sobre cronologia do vocabulrio galego-portugus (Anotaes ao Dicionario etimolgico de Jos Pedro Machado).
Vigo: Galaxia.
Lorenzo, Ramn (ed.) (1988): Coloquio de lexicografa. Santiago de Compostela: Universidade.
Losada Soler, Elena (2006): Los vocabularios del Roteiro da primeira viagem de Vasco da Gama y de la Relazione de Pigafetta: dos niveles de
conciencia lingstica, en Maresia 1, 42-53.
Lucena, Joo de (1600): Historia da Vida do Padre Francisco Xavier. Lisboa:,
Pedro Crasbeeck. [Ed. facsimilar en Lisboa, 1952].

412

Bibliografa citada

Luz, Toms da (1673): Amalthea, sive hortus onomasticus in gemina divisus orilegia, quorum quodlibet multigenas subdividitur in areolas, in
quibus communiora nomina ad quotidianum lingu Latialis usum, &
exercitation~e spectantia continentur, cum indice totulorum ad limen
apposito. Lisboa: Joannes a Costa.
Macdonald, Gerald J. (1981): Antonio de Nebrija, Vocabulario de romance
en latn. Madrid: Ctedra.
Machado, Diogo Barbosa (1741-1758): Bibliotheca Lusitana, Historia, Critica
e Chronologica, na qual se comprehende a noticia dos autores portuguezes, e das obras que compozeram desde o tempo da promulgao da Lei
da Graa, at o tempo presente. Lisboa. [Cit. pola ed. de Coimbra, 1966].
Maia, Manuel Rodrigues (1790): Diccionrio das elypses, que mais frequentemente se encontram nos auctores clssicos: interpretadas. Lisboa: Of.
de Antnio Gomes.
Mancho Duque, Mara Jess (ed.) (2005): Juan Jarava, Historia de las yervas
y plantas. Salamanca: Universidad.
Marcuello, Francisco (1617): Primera parte de la historia natvral y moral
de las aves. Zaragoza: Juan de Lanaja y Quartanet. [Ed. facsimilar en
Madrid: ICONA, 1989].
Marques, Jos (1758-1764): Nouveau dictionnaire des langues franoise et portugaise: Novo diccionario das linguas portugueza e franceza, com os termos latinos, tirado dos melhores Authores, e do Vocabulario Portuguez, e
Latino do P.D. Rafael Bluteau. Lisboa: Imp. de Jos da Costa Coimbra, 1758
(vol. I); Lisboa: Ofc. Patriarcal de Francisco Luiz Ameno, 1764 (vol. II).
Marques, Jos (1775-1776?): Nouveau Dictionnaire des langues franoise et
portugaise. Troisime edition. Lisboa: Imp. Royale.
Marques, Jos (ed.) (1999): Roteiro da primeira viagem da Vasco da Gama
ndia / lvaro Velho. Porto: Faculdade de Letras.
Maunory, Monsieur de (1701): Grammaire et dictionnaire franois et espagnol. Pars: Veuve de Claude Barbin.
Messner, Dieter (1994- ): Dicionrio dos dicionrios portugueses: Salzburg: Universitt/Institut fr Romanistik. [Da obra, en curso de publicacin, saron
a lume os seguintes volumes: I, ABA-ABC (1994); II, ABD-ABU (1994); III, AC
(1996); IV, ADA-AFU (1996); V, AGA-AJU (1995); VI, ALA-ALG (1997); VII, ALHALZ (1998); VIII, AM (1998); IX, AN-AO (2003); X, APA-APU (2005); XI, AQ-ARL,
(2005); XII ARM- ARRI (2005); XIII, ARRO-ATELI (2006); XIV, ATEM-AZU; H
(2005); K (2002); NA-NI (1999); NO-NU (2001); O (2002); U (1997)].
Messner, Dieter (1998): Postscriptum: Vasco da Gama und ein Tabu in der
portugiesischen Lexikologie, in Mitteilungen des Deutscher Lusitanisten-Verband 10, 45-46.

Bibliografa citada

413

Messner, Dieter (2007a): Os dicionrios portugueses, devedores da lexicograa espanhola, Pennsula. Revista de Estudos Ibricos 4, 15-20.
Messner, Dieter (2007b): Las relaciones lexicogrcas hispano-lusas, en
ngel Marcos de Dios: Aula ibrica. Actas de los congresos de vora y
Salamanca. Salamanca: Universidad, 317-322.
Migliorini Bruno (19613): Che cos un vocabolario. Firenze: F. Le Monnier.
Minsheu, John (1599): A Dictionarie in Spanish and English, rst published
into the English tongue by Ric. Perciuale [...] Hereunto for the further
prote and pleasure of the learner or delighted this tongue, is annexed
an ample English Dictionarie. Londres: Edm. Bollifant. [Ed. facsimilar
en Mlaga: Universidad, 2000].
Minsheu, John (1617): Ductor in Linguas, The Gvide Into tongves. Londres:
Iohannis Minsheu.
Miranda Menndez, Fernanda (2004): Dimenses meta nos textos jurdicos medievais, en Ana Maria Brito / Olvia Figueiredo / Clara Barros
(eds.): Lingustica histrica e histria da lngua portuguesa. Actas do
Encontro de Homenagem a Maria Helena Paiva. Porto: Faculdade de
Letras, 227-237.
Morais Silva, Antnio de (1789): Diccionario da lingua portugueza / composto pelo padre D. Rafael Bluteau; reformado e accrescentado por Antonio de Moraes Silva. 2 vols. Lisboa: Of. de Simo Thaddeo Ferreira;
18132; 18233; 18314; 18445; Lisboa: Typ. de Antonio Jos da Rocha, 18586;
1877-18787; 18898; 18919.
Morais Silva, Antnio de (1949-1959): Grande dicionrio da lngua portuguesa. Ed. revista, corrigida, muito aumentada e actualizada segundo
as regras do acordo ortogrco luso-brasileiro de 10 de Agosto de 1945
por Augusto Moreno, Cardoso Jnior e Jos Pedro Machado. 12 vols. Lisboa: Editorial Conuncia 1949-195910.
Mugglestone, Lynda (2000a): Pioneers in the Untrodden Forest: The New
English Dictionary, en Lynda Mugglestone (2000b), 1-22.
Mugglestone, Lynda (ed.) (2000b): Lexicography and the OED. Pioneers in
the Untrodden Forest. Oxford: Oxford University Press.
Murray, James Augustus Henry (1900): The evolution of English lexicography. Oxford: Clarendon Press; London: Henry Frowde.
Murray, K. M. Elisabeth (1977): Caught in the Web of Words. James Murray
and the Oxford English Dictionary. New Haven / London: Yale University Press.
NDMA = Amengual, Josep J. (1858): Nuevo diccionario mallorquin-castellano-latin. Palma: J. Colomar.

414

Bibliografa citada

Nebrija, Elio Antonio de (1481): Introductiones latin. Salamanca. [Ed. facsimilar en Salamanca: Universidad, 1981].
Nebrija, Elio Antonio de (1492): Lexicon hoc est dictionarium ex sermone
latino in hispaniense. Salamanca. [Ed. facsimilar de Germn Coln /
Amadeu-J. Soberanas, Barcelona: Puvill, 1979].
Nebrija, Elio Antonio de (1495?): Dictionarium ex hispaniense in latinum
sermonem. Salamanca. [Ed. facsimilar da Real Academia Espaola
(Madrid, 1989), que reproduce a edicin facsimilar anterior de 1951].
Nebrija, Elio Antonio de (1518): Lexicon illorum vocum quae as medicamentariam arte pertinerent, en Pedacij dioscoridis anazarbei de medicinali materia liber primus. Alcal: Arnaldo Guillermo de Brocar.
Nebrija, Elio Antonio de (1545): Dictionarium Aelij Antonij Nebrissensis iam
denuo innumeris dictionibus locupletatum. Amberes: Iohannis Steelsij.
NED = Vxase OED.
Nieto Jimnez, Lidio (2002): Tesoro lexicogrco del espaol marinero anterior a 1726. Madrid: Arco/Libros.
Nieto Jimnez, Lidio / Manuel Alvar Ezquerra (2002): Apuntes para la historia de la lexicografa hispano-inglesa, Revista de Filologa Espaola
82, 319-343.
Nieto Jimnez, Lidio / Manuel Alvar Ezquerra (2004): El Nuevo Tesoro Lexicogrco del Espaol (s. XIV-1726), en Actas del I Congreso Internacional de Lexicografa Hispnica, La Corua, 14-18 de septiembre de 2004,
no prelo.
Nieto Jimnez, Lidio / Manuel Alvar Ezquerra (2006): Nebrija en la lexicografa hispano-inglesa anterior al Diccionario de Autoridades, segn
los datos del NTLE, en Antonio Roldn Prez / Ricardo Escavy Zamora
/ Eulalia Hernndez Snchez / Jos Miguel Hernndez Terrs / M Isabel Lpez Martnez (eds.): Caminos Actuales de la Historiografa Lingstica. Actas del V Congreso Internacional de la Sociedad Espaola de
Historiografa Lingstica. Murcia, 7-11 de noviembre de 2005. Murcia:
Universidad, vol. I, 133-153.
NOB = Norsk Ordbok. 6 vols. (A-K). Oslo: Det norske Samlaget, 1950-2002.
<http://no2014.uio.no/>
Novo diccionario (1806) = Novo Diccionario da Lingua Portugueza, composto sobre os que at ao presente se tem dado ao prelo, e Accrescentado de
varios vocabulos extrahidos dos Classicos Antigos, e dos Modernos de
melhor nota, que se acha universalmente recibidos. Lisboa: Typograa Rollandiana, 1806.
NTLE = Nieto Jimnez, Lidio / Manuel Alvar Ezquerra (2007): Nuevo tesoro
lexicogrco del espaol (s. XIV-1726). 11 vols. Madrid: Arco/Libros.

Bibliografa citada

415

Observatori de Neologia (1998): Diccionari de paraules noves. Barcelona:


Enciclopdia Catalana.
Och, F. J. / H. Ney (2003): A Systematic Comparison of Various Statistical
Alignment Models, Computational Linguistics 29 (1), 19-51.
ODS = Dahlerup, Verner (1919-1956): Ordbog over det danske sprog. 28 vols.
Copenhague: Gyldendal. <http://ordnet.dk/ods/bogvaerket_html>
OED = Murray, James Augustus Henry / Henry Bradley / W. A. Craigie / C.
T. Onions (1928): Oxford English Dictionary. Oxford: Clarendon Press;
19892 (20 vols.); 20003 (en lia). [Publicado inicialmente en 128 fascculos
entre 1884 e 1928. Ata 1895 leva por ttulo A new English dictionary on
historical principles founded mainly on the materials collected by the
Philological Society].
Oliveira: Alberto de (s.d.): Ea de Queiroz. Pginas de memorias. Lisboa:
Portugal-Brasil.
Orta, Garcia da (1563): Coloquio dos simples e drogas he cousas mediinais da India e assim dalgu[m]as frutas achadas nella onde se tratam
algu[m]as cousas tocantes amediina, [sic] pratica e outras cousas boas
pera saber / cpostos pello Doutor Garia Dorta, sico del Rey nosso
senhor, vistos pello muyto Reuerendo senhor, ho lienciado Alex Diaz
Falcam, desembargador da casa da suprica inquisidor nestas partes.
Goa: Ioannes de Endem. [Reprod. facsimilar s.d. (1963?)].
Ortigo, Jos Duarte Ramalho (1943/1945): Figuras e questes literarias. 2
vols. Lisboa: Livraria Clssica Editora, 1943 (vol. I), 1945 (vol. II).
Osselton, Noel (2000): Murray and his European Counterparts, en Lynda
Mugglestone (2000b: 59-76).
Otero lvarez, Anbal (1949-1977): Hiptesis etimolgicas referentes al
gallego-portugus [I]-(XXV), Cuadernos de Estudios Gallegos IV/13
(1949), 171-200; VI/18 (1951), 83-114; VIII/24 (1953), 87-119; IX/28 (1954),
273-292; X/32 (1955), 405-427; XI/33 (1956), 117-139; XI/34 (1956), 245-269;
XII/36 (1957), 107-125; XII/37 (1957), 213-227; XIII/39 (1958), 77-94; XIV/43
(1959), 87-105; XIV/44 (1959), 331-348; XV/45 (1960), 89-104; XVI/49 (1961),
159-175; XVII/53 (1962), 329-347; XVIII/54 (1963), 16-34; XIX/58 (1964),
141-160; XX/60 (1965), 12-30; XX/62 (1965), 330-349; XXI/64 (1966), 170188; XXII/67 (1967), 165-182; XXIII/69 (1968), 70-88; XXV/75 (1970), 70-88;
XXVI/80 (1971), 287-306; XXX/90-91-92 (1976-77): 137-155. [Includo en
Santamarina (2003b)].
Otero lvarez, Anbal (1967): Contribucin al diccionario gallego. Vigo: Galaxia. [Includo en Santamarina (2003b)].
Otero lvarez, Anbal (1977): Vocabulario de San Jorge de Piqun. Santiago de
Compostela: Universidade de Santiago. [Includo en Santamarina (2003b)].

416

Bibliografa citada

Owen, Lewis (1605): The Key of the Spanish Tongve. Londres: T. C. for W. Welby.
Palencia, Alfonso de (1490): Universal vocabulario en latn y en romance
o Universale compendium vocabulorum cum vulgare expositione. Sevilla: Paulus de Colonia.
Palmireno, Juan Lorenzo (1569): Vocabulario del humanista [...] donde se
trata aues, peces, quadrpedos, con sus vocablos de caar, y pescar,
yeruas, metales, monedas, piedras preciosas, gomas, drogas, olores, y
otras cosas que el estudioso en letras humanas ha menester. Valencia:
Pedro de Huete. [Ed. facsimilar en Valencia: F. Domenech, 1978].
Papias (ca. 1050): Elementarium doctrinae erudimentum. Eds. incunabulares en Miln (1476) e Venecia (1485, 1491 e 1496).
Pascual Rodrguez, Jos Antonio / Rafael Garca Prez (2007): Lmites y horizontes en un diccionario histrico. Salamanca: Diputacin.
Peiris, Edmund (1943): Sinhalese Christian Literature of the XVIIth and XVIIIth
Centuries, en Journal of the Royal Asiatic Society C.B., 35, 96, 163-181.
Pensado Tom, Jos Luis (1974): Opsculos lingsticos gallegos del siglo
XVIII. Vigo: Galaxia.
Pereira, Bento (1634): Prosodia in Vocabularium Trilingue, Latinum, Lusitanicum, & Hispanicum digesta, in qua dictionum signicatio, et sylabarum quantitas expenditur. vora. [Reeds. en Lisboa, 1653, 1661, 1669,
1674, 1683].
Pereira, Bento (1647): Thesouro da Lingoa Portuguesa. Lisboa.
Pereira, Bento (1655): Florilegio dos modos de fallar, e adagios da lingoa
portuguesa: dividido em duas partes, em a primeira das quaes se poem
pella ordem do Alphabeto as Frases Portuguesas, a que correspondem
as mais puras, & elegantes Latinas: na segunda se poem os principaes
adagios Portugueses, com seu Latim proverbial correspondente. Pera se
ajuntar a Prosodia, & Thesouro Portugues, como appendiz, ou complemento. Lisboa.
Pereira, Bento (1697): Tertia pars selectissimarum descriptionum, quas idem
auctor vel olim se compositas, vel probatissimis scriptoribus emendicatas alphabetico ordine digessit. Ubi quae sine ullo auctore proponuntur, auctor ipse Florilegii composuit, reliquas collegit. vora. [Reeds.
en vora, 1710, 1723, 1732, 1741, 1750].
Pereira, Bento (1697): Thesouro da Lingoa Portugueza, en Prosodia in Vocabularium Bilingue, Latinum, et Lusitanum digesta, [...] auctore Doctore
P.Benedicto Pereyra S.J. [...], Septima Editio. Evora: Typographia Academiae.
Pereira, Bento / Matias de S. Germano (1750): Prosodia in vocabularium bilingue, Latinum, et Lusitanum digesta. vora: Typographia Academiae.

Bibliografa citada

417

Pereira, Isaas da Rosa (1964-1966): A livraria da Universidade de Lisboa, no incio do sculo XVI, en Arquivo de bibliograa portuguesa 37/48, 155-170.
Prez Pascual, Ignacio / Cleof Tato Garca (1986): O vocabulario de Leiras
Pulpeiro (I), Verba 13, 237-267.
Pinto, Lus lvares (1784): Diccionario pueril para uso dos meninos. Lisboa:
Ofc. Patr. de Francisco Luiz Ameno.
Pintos, Juan Manuel (1865): Vocabulario gallego-castellano. Ed. de M. Neira
e X. Riveiro. Anexo 5 de Cadernos de lingua. A Corua: RAG, 2000. [Includo en Santamarina (2003b)].
Pomey, Francisco / Antonio Franco (1754): Indiculo universal: contm distinctos em suas classes os nomes de quasi todas as couzas que ha no
mundo. vora: Off. da Universidade.
Pomey, Francisco / Manuel de Azevedo (1736): Pomarium latinitatis elegantiori consitum cultu, longeque paritiori descriptum manu in quo
locutiones synonymae bene multae...editio postrema ac nova lusitano
ordine translata. Coimbra.
Porto Dapena, Jos lvaro (1997): Algunas observaciones sobre el contorno de la denicin lexicogrca, en M. Almeida / J. Dorta (eds.): Contribuciones al estudio de la lingstica hispnica. Homenaje al profesor
Ramn Trujillo. Vol. II. Santa Cruz de Tenerife: Montesinos, 211-226.
Porto Dapena, Jos lvaro (2000-2001): Las letras como entradas del diccionario, Revista de Lexicografa 7, 125-154.
Porto Dapena, Jos lvaro (2002a): Manual de tcnica lexicogrca. Madrid: Arco/Libros.
Porto Dapena, Jos lvaro (2002b): La estructura actancial como criterio
separador de acepciones en el artculo lexicogrco, en Jos Ignacio
Prez Pascual / Mar Campos Souto (eds.): Cuestiones de lexicografa.
Lugo: Tris Tram, 171-190.
Porto Dapena, Jos lvaro (2003-2004): La lematizacin de los pronombres
en los diccionarios actuales, Revista de Lexicografa, 10, 139-182.
Porto Rey, Francisco (1900-1908): Diccionario gallego-castellano. Edicin
de Mara Xess Bugarn Lpez e Begoa Gonzlez Rei. A Corua: Real
Academia Galega, 2000.
Pottier, Bernard (1962): Rec. de Gili Gaya (1947-1957), Bulletin Hispanique
64, 143-144.
Prat de la Riba, E. (1910): Memria endreada a la Diputaci de Barcelona
pel seu President. Barcelona.
Quilis, Antonio (1982): Diccionarios de pronunciacin, LEA 4/2, 325-332.
Quinque linguarum (1526) = Quinque linguarum vtilissimus uocabulista
Latine. Tusche. Galliche. Hyspane. & Alemanice. Ualde necessarius per

418

Bibliografa citada

mundum versari cupientibus. Nouiter per Franciscum Garonus maxima


diligentia in lucem elaboratus. Venecia: Franciscum Garonus, 1526.
Quinque linguarum (1534) = Qvinqve lingvarvn, Latinae, Theutonicae, Gallicae, Hispanicae, Italicae, dilucidissimus dictionarius. Amberes: Ioannes Steelsius, 1534.
RAE (1780) = Real Academia Espaola (1780): Diccionario de la lengua castellana compuesto por la Real Academia Espaola, reduicido un tomo
para su mas fcil uso. Madrid: Joaqun Ibarra.
RAE (1927) = Real Academia Espaola (1927): Diccionario manual e ilustrado de la lengua espaola. Madrid: Espasa-Calpe.
RAE (1933-1936): Real Academia Espaola (1933-1936): Diccionario histrico
de la lengua espaola. Madrid: Imprenta de Librera y Casa Editorial
Hernando, 1933 (vol. I, A), 1936 (vol. II, B-Cevilla).
RAE (1960-1996): Diccionario histrico de la lengua espaola. Madrid: Imp.
Silverio Aguirre Torre.
RAE (2000) = Real Academia Espaola (2000): Ortografa espaola. Madrid:
Espasa-Calpe.
RAE (2001) = Corpus Diacrnico del Espaol. Prontuario de marcacin
SGML. Madrid.
RAE (2005) = Real Academia Espaola (2005): Diccionario del estudiante.
Madrid: Santillana.
RAE (2006) = Real Academia Espaola / Asociacin de Academias de la
Lengua Espaola (2006): Diccionario esencial de la lengua espaola.
Madrid: Espasa-Calpe.
Rafel, Joaquim (1989): Sobre la normalitzaci dels diccionaris catalans: els
elements intrnsecs i extrnsecs en les denicions lexicogrques, en
La corona dArag i les llenges romniques. Miscellnia dhomenatge
per a Germ Colon. Tbingen: Gunter Narr Verlag, 441-452.
Rafel, Joaquim (1996): El diccionari de lInstitut i el Diccionari Fabra, en
Estudis de Lingstica i Filologia oferts a Antoni M. Badia i Margarit. Vol.
3. Barcelona: Publicacions de lAbadia de Montserrat i Departament de
Filologia Catalana, 217-269.
Rafel, Joaquim (dir.) (1996-1998): Diccionari de freqncies. 3 vols + 2 CDROM. Barcelona: Institut dEstudis Catalans.
Rafel, Joaquim (2006): Els elements extrnsecs en les denicions lexicogrques: teoria i aplicaci, en Elisenda Bernal / Janet DeCesaris (ed.):
Palabra por palabra. Estudios ofrecidos a Paz Battaner. Barcelona: Institut Universitari de Lingstica Aplicada, 201-217.
Rafel, Joaquim (2007): Prescripcin y descripcin en la actividad acadmica: el Diccionari descriptiu de la llengua catalana, en Mar Campos et

Bibliografa citada

419

al.: Reexiones sobre el diccionario. Actas del I Congreso Internacional


de Lexicografa Hispnica (A Corua, septiembre de 2004). A Corua:
Universidade, 9-33.
Ramos, Vtor (1972): A edio portuguesa em Frana (1800-1850). Repertrio
geral dos ttulos publicados e ensaio crtico. Paris: Fundao Calouste
Gulbenkian.
Reguera y Pardias, E. (1840-1858): Traduccin de algunas voces, frases y locuciones gallegas, especialmente de agricultura, al castellano (1840-1858).
Ed. e estudo de J. L. Pensado. A Corua: Real Academia Galega, 1995.
Rey, Alain (1976): Le nologisme: un pseudoconcept?, Cahiers de Lexicologie 28, 3-17.
Rey-Debove, J. (1967): La dnition lexicographique: bases dune typologie formelle, Travaux de Linguistique et de Littrature V, 1, 141-161.
Ribeiro, Diogo (1626): Vocabulario da lingoa canarina. Lisboa: Junta de Investigao do Ultramar, 1973. [Reprod. facsimilar do manuscrito, con
nota introdutoria de Justino Mendes de Almeida].
Rico, Alberto / Joan Sol (1995): Gramatica i Lexicograa catalanes: sntesi
histrica. Valncia: Universitat.
Ros Panisse, Mara do Carme (1977): Nomenclatura de la ora y fauna
martimas de Galicia. I. Invertebrados y peces. Santiago: Universidade.
[Includo en Santamarina (2003b)].
Ros Panisse, Mara do Carme (1983): Nomenclatura de la ora y fauna martimas de Galicia. II: Mamferos, aves y algas. Santiago: Universidade.
[Includo en Santamarina (2003b)].
Rivas Quintas, Eligio (1978): Frampas. Contribucin al vocabulario gallego.
Salamanca: Ceme. [Includo en (Santamarina 2003b)].
Rivas Quintas, Elixio (1988): Frampas II. Contribucin al diccionario gallego.
Lugo: Alvarellos. [Includo en (Santamarina 2003b)].
Rivas Quintas, Elixio (1996): Millo e Hrreo, Legumia e Cesto. Santiago de
Compostela: Laiovento.
Rivas Quintas, Elixio (1997a): O muo. Ourense: Grafo Dos.
Rivas Quintas, Elixio (1997b): Ferramenta e labranza manual, Ourense:
Grafo Dos.
Rivas Quintas, Elixio (1997c): O castieiro e as castaas. Ourense: Grafo Dos.
Rivas Quintas, Elixio (1998a): O forno de pan. Ourense: Grafo Dos.
Rivas Quintas, Elixio (1998b): O tear e o tecido. Ourense: Grafo Dos.
Rivas Quintas, Elixio (2003): Frampas III. Contribucin al diccionario gallego, en Santamarina (2003b).
Rodrigues, Francisco (1917): A formao intelectual do Jesuta. Porto: Liv.
Magalhes & Moniz.

420

Bibliografa citada

Rodrigues Tuzu, Joo et al. (1603-1604): Vocabulario da lingoa de Iapam


com a declarao em Portugues, feito por alguns padres e irmos da
Companhia de Iesu. Nagasaki: Tipograa do Colgio.
Rodrguez, Francisco Javier (1855): Diccionario gallego-castellano. Texto manuscrito. Real Academia Galega. [Includo en Santamarina
(2003b)].
Rodrguez, Francisco Javier (1863): Diccionario gallego-castellano. A Corua. [Includo en Santamarina (2003b)].
Rodrguez Gonzlez, ngel / Jos Armas Castro (1992): Minutario Notarial
de Pontevedra (1433-1435). Santiago de Compostela: Consello da Cultura Galega.
Rodrguez Gonzlez, Eladio (1958-1961): Diccionario enciclopdico gallegocastellano. 3 vols. Vigo: Galaxia. [Includo en Santamarina (2003b)].
Rodrguez Ro, Xusto A. (1998): O tratamento dos prstamos na norma
lxica do galego, Verba 25, 293-322.
Rodrguez Ro, Xusto A. (2003): Metodoloxa do traballo terminolxico puntual en lingua galega. Santiago: Consello da Cultura Galega.
Romero Lema, F. (2000): Vocabulario de Soneira. Ed. de X. M. Rei Lema. A
Corua: Real Academia Galega.
Rosal, Francisco del [1601]): Origen y etimologa de todos los vocablos originales de la lengua castellana. Manuscrito 6929-T.127 da Biblioteca
Nacional (Madrid).
Rosrio, Joaquim do (1794): Compendio do Diccionario dos Casos de Consciencia de Pontas. 8 vols. Lisboa: Simo Thaddeo Ferreira.
S, Joaquim Jos da Costa e (1773-1774): Diccionario italiano e portuguez. 2
vols. Lisboa: Rgia Ocina Tipogrca.
S, Joaquim Jos da Costa e (1794): Diccionario portuguez-francez-e-latino.
2 vols. Lisboa: Ofcina de Simo Thaddeo Ferreira.
Salas Quesada, Pilar (2003): Los comienzos de la lexicografa bilinge
con el espaol y el portugus. El Dicionrio Castelhano-Portuguz de
Raphael Bluteau, Res Diachronicae 2, 343-351.
Salvi, Giampaolo / Lorenzo Renzi (dirs.) (no prelo): Grammatica dellitaliano
antico. Bologna: Il Mulino [Versin provisoria en <http://www.geocities.com/gpsalvi/konyv/>].
Santamarina, Antn (2003a): O VOLG: criterios de elaboracin, en Mara
lvarez de la Granja / Ernesto Gonzlez Seoane (eds.): A estandarizacin do lxico. Santiago de Compostela: Instituto da Lingua Galega /
Consello da Cultura Galega, 53-92.
Santamarina, Antn (2003b): Diccionario de diccionarios. Versin 3. A Corua: Fundacin Pedro Barri de la Maza.

Bibliografa citada

421

Santamarina, Antn (2003c): Diccionario, en Gran Enciclopedia Galega


14. Lugo: El Progreso / Diario de Pontevedra, 26-35.
SAOB = Ordbok ver svenska sprket utgiven av Svenska Akademien [=
Svenska Akademiens ordbok]. Lund: Gleerupska univ.-bokh., 1898-2008
(A-T). <http://g3.spraakdata.gu.se/saob/>
Sarmento, Francisco de Jesus Maria (1785): Thesouro biblico ou diccionario historico, e etymologico dos nomes proprios. Lisboa: Off. de Simo
Thaddeo Ferreira.
Sarmento, Pedro de Mariz de Sousa (1788): Elementos de construco e diccionario francez e portuguez de todas as pessas de... navios... Lisboa: Of.
Patr. de Francisco Luiz Ameno.
Sarmento, Pedro de Mariz de Sousa (1789): Preceitos de construco de navios e da sua mastrio e nomenclatura portugueza dos termos technicos da mastrio e diccionario delles em francez e portuguez. Lisboa: Of.
de Antnio Rodrigues Galhardo.
Sarmiento, Martn (1970): Coleccin de voces y frases gallegas. Ed. y estudio
de J. L. Pensado Tom. Salamanca: Universidad.
Sarmiento, Martn (1973): Catlogo de voces y frases de la lengua gallega.
Ed. y estudio de J. L. Pensado Tom. Salamanca: Universidad.
Sarmiento, Martn (1975): Viaje a Galicia (1745). Ed. de J. L. Pensado Tom.
Salamanca: Universidad.
Sarmiento, Martn (1986): Catlogo de voces vulgares y en especial de voces
gallegas de diferentes vegetables. Ed. y estudio de J. L. Pensado Tom.
Salamanca: Universidad.
Sarmiento, Martn (1999): Onomstico etimolgico de la lengua gallega. Ed.
y estudio de J. L. Pensado Tom. A Corua: Fundacin Barri.
Savourel, Y. (ed.) (2005): TMX 1.4b Specication. Localisation Industry Standards Association. [en lia] <http://www.lisa.org/standards/tmx/
specication.html> [Consulta: 7 novembro 2007]
Seco, Manuel (1979): El contorno en la denicin lexicogrca, en Homenaje a Samuel Gili Gaya (in memoriam). Barcelona: Vox, 183-191;
reproducido en Manuel Seco (1987): Estudios de lexicografa espaola.
Madrid: Paraninfo, 35-45.
Shaw, Jean Florence (1997): Contributions to a study of the printed dictionary in France before 1539. Toronto: Edicta.
Silva, Bartolomeu Alvares da (1764): Colleco da palavras familiares portuguezas, francezas, latinas e britanicas. Coimbra: Real Ofcina da Universidade.
Silva, Innocencio Francisco da (1858-1958): Diccionario bibliographico portuguez. Lisboa: Impr. Nacional.

422

Bibliografa citada

Silvestre, Joo Paulo Martins (2004): Rafael Bluteau e o Vocabulario Portuguez, e Latino: teoria metalexicogrca, fontes e recepo. Tese de
doutoramento. Universidade de Aveiro.
Simes, A. M. / J. J. Almeida (2003): NATools: A Statistical Word Aligner
Workbench, Procesamiento del Lenguaje Natural 31, 217-224.
Skautrup, Peter (1944-1968): Det danske sprogs historie. 4 vols. Copenhague:
Gyldendalske boghandel.
Sobreira = Sobreira, Juan: Papeletas de un diccionario gallego. Edicin y
estudio crtico de Jos Luis Pensado Tom. Ourense: Instituto de Estudios Orensanos Padre Feijoo, 1979. [Includo, xunto con outros textos
de Sobreira, en Santamarina (2003b)].
Sousa, Joo de (1789): Vestigios da lingua arabica em Portugal, ou lexicon
etymologico das palavras, e nomes portuguezes, que tem origem arabica. Lisboa: Na Ofcina da Academia Real das Sciencias.
Sousa, Joo de / Jos de Santo Antnio Moura (1830): Vestigios da Lingoa
Arabica em Portugal, ou Lexicon etymologico das palavras, e nomes
portuguezes, que tem origem arabica, composto por ordem da Academia Real das Sciencias de Lisboa por Fr. Joo de Sousa, [], e augmentado e annotado por Fr. Joze de Santo Antonio Moura. Lisboa: Na Typographia da mesma Academia.
Sousa, Manuel de / Joaquim Jos da Costa e S (1784-1786): Nouveau dictionnaire Franois-Portugais. 2 vols. Lisboa: Simo Thadeo Ferreira.
Teixeira, Antnio Jos (trad.) (1780): Noticia da mythologia. Lisboa: Typ. Rollandiana. [Reed. en 1803].
Teixeira, Vicente de Bastos (1779): Dictionnaire moderne franois expliqu
en portugais. Tome premier (A-C). Lisboa: Imp. Louisiane.
Terreros y Pando, Esteban de (1786): Diccionario castellano con las voces
de ciencias y artes y sus correspondientes en las tres lenguas Francesa,
Latina Italiana. Madrid: Viuda de Ibarra, Hijos y Compaa. [Edicin
facsimilar en Madrid: Arco/Libros, 1987].
Tiedemann, J. (2003): Recycling Translations - Extraction of Lexical Data
from Parallel Corpora and their Application in Natural Language Processing. Upssala: Acta Universitatis Upsaliensis.
TILG = Santamarina, A. (dir.): Tesouro Informatizado da Lingua Galega.
Santiago de Compostela: Instituto da Lingua Galega. <http://www.
ti.usc.es/TILG>
TILIO = Opera del Vocabolario Italiano: Tesoro della Lingua Italiana delle Origini. Consiglio Nazionale delle Ricerche. <http://tlio.ovi.cnr.it/TLIO/>
TLF = Imbs, Paul et al. (dir.) (1971-1994): Trsor de la langue franaise. Dictionnaire de la langue du XIX et du XX sicle (1789-1960). 16 volumes.

Bibliografa citada

423

Paris: Centre National de la Recherche Scientique. [Ed. en CD-ROM en


Paris: CNRS, 2004]. <http://atilf.atilf.fr/tlf.htm>
TMILG = Varela Barreiro, Xavier (dir.) (2004- ): Tesouro Medieval Informatizado da Lingua Galega. Santiago de Compostela: Instituto da Lingua
Galega. <http://ilg.usc.es./tmilg/>
Tommaseo, Niccol / Bernardo Bellini (1865-1879): Dizionario della lingua
italiana. 4 vols. Torino: UTET.
Transtagano, Antonio Vieira (1773): A Dictionary of the Portuguese and
English Languages in two parts, Portuguese and English and English
and Portuguese [...] By Anthony Vieyra Transtagano. Londres: J. Nourse;
17942.
TUVI = Seminario de Lingstica Informtica: Banco de Datos Terminolxico da Universidade de Vigo. Vigo. Universidade. <http://sli.uvigo.
es/ TUVI/>
Urrea, Miguel de (1582): M. Vitrvvio Pollion De Architectura, dividido en
diez libros, traduzidos de latn en castellano por [...]. Alcal de Henares:
Juan Gracin. [Ed. facsimilar en Valencia, Albatros Ediciones, 1978].
Valladares Nez, Marcial (1884): Diccionario gallego-castellano. Santiago
de Compostela: Tipografa del Seminario Conciliar Central. [Includo
en Santamarina (2003b)].
Valladares Nez, Marcial (1896): Nuevo suplemento al Diccionario gallegocastellano, publicado en 1884 por D. Marcial Valladares Nez [1893-1896].
Edicin e estudio de Mari Carme Garcia Ares. Santiago de Compostela:
Real Academia Galega, 2000. [Includo en Santamarina (2003b)].
Valverde y Ganda, Bartolom (1760?): Tractado de Etymologas de voces
castellanas en otras lenguas, castellana, hebrea, griega, rabe. Manuscrito LI.2 da Biblioteca del Monasterio de El Escorial..
Vandelli, Domingos (1788): Diccionario dos termos technicos de Historia Natural extrahidos das obras de Linno. Coimbra: Real Of. da Universidade.
Vzquez Bertomeu, Mercedes (2001): Notarios, notaras y documentos en
Santiago y su tierra en el siglo XV. Sada: Edicis do Castro.
Vzquez Saco, Francisco (1962): Refraneiro galego e outros materiais de
tradicin oral [= Cadernos de Fraseoloxa Galega 5]. Edicin de Josefa
Beloso Gmez, Patricia Bujn Otero, Xess Ferro Ruibal e M Carmen
Paz Roca.
Velez, Antnio (1599): Index totius artis (Emmanuelis Aluari e Societate Iesu
De institutione grammatica libri tres). vora.
Verdelho, Telmo (1982): Historiograa lingustica e reforma do ensino. A
propsito de trs centenrios: Manuel lvares, Bento Pereira e Marqus de Pombal, en Brigantia 2,4, 347-356.

424

Bibliografa citada

Verdelho, Telmo (1995): As origens da gramaticograa e da lexicograa


latino-portuguesas. Aveiro: INIC..
Verdelho, Telmo (1999-2000): O Calepino em Portugal e a obra lexicogrca de Amaro Reboredo, en Revista Portuguesa de Filologia 23, 125-149.
Verdelho, Telmo (2002): O dicionrio de Morais Silva e o incio da lexicograa moderna, in Brian Head et al. (eds.): Histria da lngua e histria da gramtica. Actas do encontro. Braga: Universidade do Minho,
Centro de Estudos Humansticos, 473-490.
Verdelho, Telmo (2006): A Amalthea (1673) de Toms da Luz, Beihefte zu
Lusorama 11, 93-118.
Verdelho, Telmo / Joo Paulo Silvestre (eds.) (2007): Dicionarstica portuguesa: inventariao e estudo do patrimmio lexicogrco. Aveiro:
Universidade.
Vieira, Domingos (1871-1874): Grande Diccionario Portuguez ou Thesouro
da Lingua Portugueza. 5 vols. Porto: Cahrdron e Bartholomeu H. de Moraes.
Viterbo, Joaquim de Santa Rosa de (1798-1799): Elucidario das Palavras,
Termos, e Frases, que em Portugal antigamente se usaro e que hoje
regularmente se ignoro. 2 vols. Lisboa: Of. de Simo Thaddeo Ferreira.
[Reedicins en 1865 e 1966].
Vocabolario della Crusca = Accademia della Crusca (1612):Vocabolario degli
Accademici della Crusca. Venezia: Appresso Giovanni Alberti, 1612; Firenze: Tipograa Galileiana, 1863-1923 [5 impresin, que incle ata a palabra ozono; a ltima edicin completa a cuarta, dos anos 1729-1738].
Vocabulario de seis linguaies (1541) = Vocabulario de seis linguaies, latn,
francs, espagniol, italin, englese y alemana. Venecia: Marchio Sessa,
1541.
VOLG (1989) = Instituto da Lingua Galega / Real Academia Galega (1989):
Vocabulario Ortogrco da Lingua Galega. Versin provisional. Santiago: ILG / RAG.
VOLG (2004) = Santamarina, Antn / Manuel Gonzlez Gonzlez (2004):
Vocabulario Ortogrco da Lingua Galega. A Corua: Real Academia
Galega / Instituto da Lingua Galega. <http://www.realacademiagalega.org/volga>
VSI = Spiess, Federico / Rosanna Zeli / Franco Lur (1952- ): Vocabolario dei
dialetti della Svizzera italiana. Lugano: Fotocomposizione Taiana.
WAT = Schoonees, Pieter Cornelis et al. (1950- ): Woordeboek van die Afrikaanse Taal. 12 vols (A-Q). Pretoria: Staatsdrukker. <http://www.wat.co.za/>
WbsdS = Staub, Friedrich / Ludwig Tobler / Albert Bachmann (1881- ):
Schweizerisches Idiotikon. Wrterbuch der schweizerdeutschen Sprache.

Bibliografa citada

425

Gesammelt auf Veranstaltung der Antiquarischen Gesellschaft in Zrich


unter Beihlfe aus allen Kreisen des Schweizervolkes. Frauenfeld: Huber.
Wierzbicka, Anna (1996): Semantics. Primes and Universals. Oxford: Oxford
University Press.
Winchester, Simon (2003): The Meaning of Everything. The Story of the
Oxford English Dictionary. Oxford: Oxford University Press.
WNT = Vries, Matthias de / Lammert A. Te Winkel et al. (1882-1998): Woordenboek der Nederlandsche Taal. 40 vols. S-Gravenhage, [etc.]: M.
Nijhoff, [etc.]. [Ed. en CD-ROM en Rotterdam: AND Publishers, 2000.
<http://www.wnt.inl.nl/>
Wolf, Elena (1971): Dicionrio inverso da lngua portuguesa. Moscova:
Nanka.
Wooldridge, Terence Russon (1977): Les dbuts de la lexicographie franaise. Toronto: University of Toronto Press.
Ximenez Arias, Diego (1566): Lexicon ecclesiaticum latinohispanicum, ex sacris Biblijs, Concilijs, Ponticum ac Theologorum Decretis. Salamanca.
Zaba Lasala, M Puricacin (1999): Diccionario de Juan Alonso y de los
Ruyzes de Fontecha. Madrid: Arco/Libros.
Zamora Mosquera, Federico (1972): Refrns e ditos populares galegos. Vigo:
Galaxia.

Você também pode gostar