Escolar Documentos
Profissional Documentos
Cultura Documentos
lingstica
6
COLECCIN B A S E
COLECCIN B A S E
Serie
lingstica
A lexicografa , nos estudos lingsticos do galego, unha lia de atencin preferente e incesante desenvolvemento. Neste volume renense 19
contribucins resultantes do convite
feito polo Instituto da Lingua Galega
a distintos investigadores co fin de
facer unha instantnea do estado
actual desta disciplina en Galicia e, a
partir dela, planificar o traballo da
sa seccin de lexicografa para os
prximos anos.
Pola sa temtica, os traballos responden a tres grandes perspectivas:
(a) a historiografa e a metodoloxa
lexicogrficas, (b) os recursos lexicogrficos no presente e as sas perspectivas de futuro e (c) a lexicografa
acadmica. A presenza fundamental
do galego como obxecto de estudo
vese enriquecida con olladas selectas
a outras linguas como o portugus, o
casteln, o cataln e o italiano.
EDITORES
CONSELLO
DA CULTURA
GALEGA
A LEXICOGRAFA
GALEGA moderna
recursos e
perspectivas
CONSELLO
DA CULTURA
GALEGA
COLECCIN B A S E
EDITORES
CONSELLO
DA CULTURA
GALEGA
Praza da Universidade, 4
ilgsec@usc.es
correo@consellodacultura.org
Proxecto grco
Agalip
Deseo de cubertas
Manuel Janeiro
ISBN 978-84-96530-85-0
Depsito legal VG- 1648-2008
Imprime: C/A grca
NDICE
Limiar .....................................................................................................................................................
I. HISTORIOGRAFA E METODOLOXA
41
57
Telmo Verdelho
Lexicograa portuguesa. Perspectiva crtica ...........................................................
83
Guillermo Rojo
Pasado, presente e futuro nos traballos lexicogrcos da Real
Academia Espaola .................................................................................................................... 323
Pr Larson
O Tesoro della Lingua Italiana delle Origini: o futuro do italiano
antigo? .................................................................................................................................................. 329
Antn Santamarina
Os dicionarios histricos. Trazos dun dicionario histrico
galego e consideracins sobre a sa viabilidade .................................................. 343
LIMIAR
Recentemente o Instituto da Lingua Galega quixo facer unha instantnea do estado actual da lexicografa galega co n de, a partir dela, propiciar unha reexin e planicar o traballo da sa seccin de lexicografa
para os prximos anos. Con tal motivo convidou a participar a distintos
especialistas, da casa e de fra, e encargoulles a realizacin de traballos
orixinais nos que desen conta dalgn aspecto da sa propia investigacin
que fose relevante neste eido e, deste xeito, contribusen a xar as reas
temticas preferentes e delimitar mellor, dentro delas, as vas polas que
haxa que encamiar no futuro os esforzos lexicogrcos.
Neste volume renense 19 contribucins, mais poderan gurar algunhas mis que, estando previstas no chamamento inicial, non chegaron a termo. A uns e a outros contribuntes exprsalles o Instituto da Lingua Galega o seu agradecemento pola colaboracin prestada.
***
A idea inicial foi abordar de forma proporcional tres grandes perspectivas: (a) a historiografa e a metodoloxa lexicogrcas, (b) os recursos
lexicogrcos no presente e as sas perspectivas de futuro e (c) a lexicografa acadmica. Ao cabo as seccins non resultaron exactamente
proporcionais mais nas tres comparecen traballos representativos e de
innegable valor.
Abre a seccin de metodoloxa o traballo de Manuel Alvar Ezquerra
(Universidad Complutense de Madrid). Nel d noticia pormenorizada dos
aspectos mis cotins e ntimos do proceso de construcin do monumental 11 volumes e 10.522 pxinas e recentemente aparecido (2007) Nuevo
tesoro lexicogrco del espaol (s. XIV-1726) (NTLE), feito en colaboracin
con Lidio Nieto Jimnez. Este captulo un bo exemplo de caderno de
10
11
12
13
14
un balance histrico da actividade lexicogrca da RAE. Correspondendo co pasado, explica as caractersticas bsicas das sucesivas edicins
do DRAE anteriores de 2001. Como actividades presentes da Academia
destaca a realizacin dos crpora moderno (CREA) e diacrnico (CORDE),
culminada coa publicacin, en 2001, do Diccionario de la lengua espaola
(edicin en CD-ROM en 2003). De cara ao futuro sinala, como losofa de
traballo, a importancia da colaboracin entre todas as Academias e, no
terreo das obras lexicogrcas, a posta en marcha do Nuevo diccionario
histrico de la lengua espaola, do Diccionario acadmico de americanismos e a prxima publicacin dun novo DRAE (2013?) no que xa non se
incla a informacin diacrnica e diatpica correspondente aos dous
dicionarios mencionados. No captulo 18 e na representacin da Opera
del Vocabolario Italiano (OVI), Pr Larson describe o marco institucional e
lolxico de OVI (representa a continuacin da Accademia della Crusca) e
cntrase no Tesoro della Lingua Italiana delle Origini (TLIO). Realiza unha
visita guiada a este dicionario do italiano antigo, inclundo referencias
mnimas ao corpus no que se fundamenta. Pasa revista aos oito en realidade nove apartados que compoen a estrutura das entradas (lema
o moderno, variantes grcas, etimoloxa, atestacins, observacins
lingsticas, anotacins, valores semnticos estruturados e informacin
sobre os redactores) e destaca tres opcins deste recurso on-line: a posibilidade de recuperacin de explicacins semnticas nos propios textos
(opcin Gloss.), a indicacin do grao de abilidade e representatividade
lingstica das fontes textuais e a posibilidade de recuperacin conxunta
das unidades polirremticas.
No captulo que clausura o volume, Antn Santamarina (director da
Seccin de Lexicografa do Instituto da Lingua Galega-USC e membro
numerario da Real Academia Galega) contribe cun extenso texto preparatorio do Dicionario Histrico da Lingua Galega. Nas sas pxinas
condensa a experiencia e o esforzo de varias dcadas de traballo lexicogrco orientado realizacin desta vasta obra que situar o galego no
restrito grupo de linguas romnicas que conten cun dicionario histrico.
Por varias veces refrese a estes dicionarios como monumentos imprescindibles das culturas nacionais, pero ao que con mis nfase lle atribe
esta cualidade ao Oxford English Dictionary (OED), que chega a cualicar
como un dos principais monumentos da cultura mundial do sculo XX.
Nunha primeira parte de carcter historiogrco bota unha ollada aos
mis importantes dicionarios histricos. Cita algns antecedentes antigos e detense mis demoradamente nos dicionarios de linguas da Europa occidental, moi maioritariamente de linguas xermnicas (alemn,
15
17
I. HISTORIOGRAFA E METODOLOXA
19
Cuando los organizadores de este volumen me propusieron que escribiera sobre los problemas en la redaccin de diccionarios generales de la
lengua, me alegr porque me haca recordar pasados retos e imaginaba
los que pueden presentarse a la actividad diccionarstica en los prximos
aos. Sin embargo, no me atrev a sostener el envite porque en estos momentos mis preocupaciones se hallan orientadas en otras direcciones.
Mirando hacia el quehacer actual que absorbe la mayor parte de mi tiempo fue cuando les propuse tratar de las dicultades que surgen, que nos
han surgido, en la elaboracin de un tesoro lexicogrco, el Nuevo tesoro
lexicogrco del espaol (s. XIV-1726) (NTLE)1, que, por otra parte, no deja
de ser un diccionario de carcter general, si bien muy diferente de lo que
concebimos habitualmente como un diccionario general de la lengua, de
carcter descriptivo y sincrnico. Por otro lado, el NTLE se encuentra ms
cerca, porque lo es, de los repertorios de carcter acumulativo e histrico,
y muchos de los problemas que se nos presentaron son comunes a los
que aparecen en cualquier otro proyecto de lexicografa histrica. No son,
pues, problemas nuevos, sino viejos conocidos como siempre, unos ms
que otros que reaparecen al emprender una nueva obra.
Una de las principales dicultades con las que se encuentra cualquiera que desee redactar un diccionario, del tipo que sea, es la informatizacin, pues, como resulta conocido de todos, hoy ya no se acomete una
empresa lexicogrca sin acudir a los ordenadores, no puede ser de otro
modo. No creo necesario recordar aqu que fueron los estudios lexicolgicos y lexicogrcos de los primeros en beneciarse de los avances
*
Este trabajo se encuadra dentro de los llevados a cabo para el proyecto Nuevo Tesoro Lexicogrco del
Espaol (s. XIV-1726), que goza de una ayuda del Ministerio de Ciencia y Tecnologa (HUM2004-05344).
1.
A propsito de la obra, vanse Alvar Ezquerra (2003a, 2003b, 2004 y 2006a). Adems, Nieto Jimnez / Alvar
Ezquerra (2004) y Alvar Ezquerra / Nieto Jimnez (2006).
20
tecnolgicos, como ha ocurrido siempre, por lo menos desde que la imprenta irrumpi en nuestro mundo. El uso de los ordenadores en nuestros mbitos ya no es una novedad: han transcurrido ms de treinta aos
desde que comenzaron a hacerse los primeros trabajos de informatizacin aplicada al lxico y a los diccionarios del espaol. Por supuesto, los
medios, tcnicas, procedimientos, rapidez, volumen de datos tratados,
complejidad de las consultas, etc., etc., han cambiado de forma sustancial, y lo que hoy podemos hacer en nuestra casa en unos minutos con
un ordenador personal y un programa comercial, entonces requera de
un gran esfuerzo personal y material, y de unas cuantas semanas, si no
meses, de trabajo.
Por lo que respecta al NTLE, los inconvenientes en su informatizacin
han surgido por cualquier parte cuando menos los esperbamos, y hemos
tenido que acudir a mltiples frentes para ir solucionando los problemas
que se planteaban cada vez que desebamos avanzar un paso en el trabajo.
En primer lugar, para tratar informticamente los datos contenidos
en los diccionarios que desebamos recopilar resultaba necesario darles
un formato electrnico, como es obvio. Para ello haba que disponer de
ordenadores, pero de qu tipo? En el inicio de las tareas, una parte del
equipo se encontraba en Madrid, y otra en Mlaga, as que debamos buscar la mxima compatibilidad posible, para evitar problemas en el envo
de datos de un lado a otro. Nos pareci lo ms apropiado emplear ordenadores personales en lugar de grandes equipos, decisin que vena avalada
por mi experiencia anterior durante la redaccin del Diccionario general
ilustrado de la lengua espaola (DGILE 1987), en la que la utilizacin de
grandes equipos informticos nos proporcion ms de un sobresalto, y
siempre debido a motivos ajenos a la propia redaccin lexicogrca. Es
ms, cuando la editorial Biblograf s. a. decidi crear en Mlaga el CELEX
(Centro de Lexicografa Vox), se opt por los ordenadores personales, pues
eran la mejor solucin para facilitar el trabajo en equipo con sedes diferentes, y para el envo de materiales entre Mlaga y Barcelona.
La segunda parte del problema informtico inicial consista en la recuperacin de la informacin contenida en las fuentes que iban a servir
para la elaboracin del NTLE. El trabajo que pretendamos llevar a cabo se
nos presentaba inmenso: agrupar decenas y ms decenas de diccionarios
y otras obras con contenido lxico. La primera idea que acude a cualquiera que se vea en la misma tesitura es la de escanear los repertorios. Sin
embargo, apenas la consideramos, entreviendo la multitud de inconvenientes que nos iban a surgir, derivados de los tipos de materiales tan
heterogneos que bamos a manejar.
21
22
23
24
25
26
mento oportuno para decir que ha sido la nica ocasin en que durante
el proceso de tecleado hemos debido acudir, fuera de nuestro equipo, a un
especialista en lenguas que no fuesen la nuestra. Nuestros colaboradores,
afortunadamente, poseen unos conocimientos sobrados de otros idiomas
para las tareas realizadas, y solamente el amenco ha ofrecido alguna
resistencia, no demasiada, pues, para nuestra sorpresa, una de nuestras
colaboradoras se haba iniciado en el conocimiento de esa lengua, y varios miembros del equipo dominaban a la perfeccin el alemn. Por lo
dems, el latn, el griego, el francs, el ingls, el cataln, el gallego o el
portugus no han presentado especiales dicultades, y slo las pocas palabras en hebreo que hay en el Tesoro de Covarrubias (1611), y las escasas
del Minsheu (1617) o del manuscrito de Bartolom Valverde (1760?) nos
han llevado a consultas externas.
A la vez que se realizaba el proceso de codicacin, se avanzaba ya algn paso en la redaccin del NTLE, como fue el ir efectuando una incipiente lematizacin, para la que se reserv un campo especial: los sustantivos
y adjetivos iran en singular, estos ltimos bajo la forma masculina, con
la terminacin femenina si fuese el caso, las formas de los paradigmas
verbales se lematizaban en innitivo, etc. Como no es difcil de sospechar,
las unidades fraseolgicas han presentado no pocas dicultades. Se ha
procurado lematizarlas bajo la entrada que tena el autor, salvo en aquellas ocasiones en que aparecan bajo un elemento de relacin, en cuyo
caso se han llevado a la palabra que soportara la mayor carga semntica
de la expresin. Cuando hemos detectado que una construccin de este
tipo aparece bajo entradas diferentes, porque as lo hacan los autores,
hemos procurado poner unas referencias cruzadas, con el n de que no
se pierdan las informaciones. En general, hemos marcado los refranes y
frases proverbiales entre unas comillas de valor, no as las frases hechas y
las locuciones, mxime cuando el DRAE las registra como tales. Tampoco
llevan una seal especial las numerosas frases y ejemplos que guran en
algunos repertorios como meros modelos de uso. En este sentido, he de
decir que se han detectado algunos refranes y frases proverbiales que se
presentaban truncados, y que tambin se han marcado, para mantener
una cierta coherencia con los que no estn truncados en los mismos artculos del Tesoro.
De modo simultneo al tecleado, se iban incorporando unas referencias internas que nos ayudasen ms adelante en la agrupacin de variantes, o para que sirviesen de llamadas de atencin. Esas referencias
se han revisado en la correccin nal, para mantener nicamente como
remisiones internas aquellas que fuesen necesarias y eliminar las que
27
28
dur poco y son otra alarma. En el nuevo proceso de carga volva a suceder lo mismo, desaparecan los errores, pero se presentaban otros que no
haba antes. Ya no quedaba duda, el programa realizaba unos cortes aleatorios, probablemente debidos a la cantidad de informacin trasvasada.
Recurrimos entonces al Grupo de Estructura de Datos de la Universidad
de Las Palmas de Gran Canaria, que ya me haba ayudado en las tareas
informticas del Tesoro lxico de las hablas andaluzas, y nuestras sospechas fueron conrmadas. A partir de ese instante la colaboracin ha sido
intensa, y las herramientas de que hemos ido disponiendo son resultado
de su generosa asistencia, aunque en los ltimos meses hemos recurrido
a informticos de la UPM, como he dicho, por la comodidad de la proximidad, y la necesidad del contacto directo y continuo. Fueron aquellos
quienes nos propusieron la solucin adoptada, y la importacin de datos,
desde entonces, no se ha hecho directamente empleando los recursos de
Access, sino mediante un programa diseado ad hoc, que es el que lleva la
informacin desde el tratamiento de textos a la base de datos, con el n
de que no se pierda nada, y, para mayor seguridad, a continuacin realiza
una comparacin para comprobar que lo que ha llegado a la base de datos
sea igual a lo que se deseaba trasvasar. El proceso es extraordinariamente
rpido y, sobre todo, nos proporciona una seguridad en nuestros medios
que habamos comenzado a perder. Pasado el tiempo he constatado que
los errores no eran culpa nuestra, ni se deban a cdigos mal empleados,
pues otras personas que han llevado a cabo procesos similares en otras
empresas lexicogrcas se han tropezado con idnticos inconvenientes.
Tal vez se trate de un defecto en el diseo del programa, cuestin sobre la
que no he querido indagar ms, una vez que los problemas sobrevenidos
estaban ya resueltos.
En el momento en que consideramos que disponamos de una cantidad signicativa de obras en la base de datos, procedimos a generar un
informe para ir viendo los resultados parciales, y animarnos en nuestro
quehacer. As, a nales de 1999 (tras varios aos de intensos trabajos) elaboramos el primer borrador del NTLE, pasando todo el contenido de la
base de datos a un tratamiento de textos, Word de Microsoft. Los cientos
y cientos de pginas producidos nos caus asombro, pero tambin nos
mostraba que el camino que quedaba por recorrer an era largo.
Cuatro aos ms de esfuerzos nos llevaron a realizar un nuevo ensayo del resultado nal, y vimos, nuevamente, cmo se producan errores
en la carga de la base de datos, si bien esta vez ya no eran imputables a
fallos en los programas informticos, sino a nosotros mismos: se haban
producido durante el proceso de tecleado. Esta alerta se produjo cuando
29
las marcas para separar campos no coincidan con los de la base de datos.
Se trataba de un mero problema formal fcilmente subsanable. Pero, a
la vez, nos percatamos tambin de la presencia de otras faltas formales,
como equivocaciones en las secuencias de signos y otros errores de consistencia. Afortunadamente, se podan sistematizar, y, por tanto, corregir
de una forma automatizada. El grupo informtico de Las Palmas se dispuso a prepararnos un nuevo programa que comprobara si los separadores
de campos estaban bien puestos, y otro que comprobara si las marcas
sistemticas que habamos ido utilizando haban sido tecleadas correctamente. A partir de ese momento, comenzamos a buscar y detectar otros
errores formales que pudiesen ser corregidos de una manera automtica,
o con la asistencia de sistemas informticos, lo que nos llev a solicitar
nuevos programas. En realidad, es un solo programa que va realizando
mltiples tareas encadenadas, y en un orden estricto para que unas instrucciones no puedan afectar a los cambios realizados por otras. De este
modo, se increment el programa para detectar que siempre que se abra
un parntesis, un corchete, un signo de interrogacin o de exclamacin,
unas comillas, etc., estn cerrados en el mismo campo, que los diferentes campos terminen de la misma manera, en especial que al nalizar
el texto de cada artculo aparezca un punto, que no surjan espacios en
blanco delante de los signos de puntuacin, y que haya uno tras ellos (menos para el punto nal), que no aparezcan dos espacios en blanco consecutivos, que los puntos suspensivos sean tres, etc., etc. Son pequeos
detalles cuya correccin, en el conjunto del NTLE, hubiera requerido una
gran dedicacin de haberla realizado manualmente, y, lo que es peor, sin
la garanta del resultado nal. De este modo, hemos podido disponer de
un corrector formal que se ha ido perfeccionando continuamente, hasta
en doce versiones diferentes, algunas de las cuales suponan una marcha
atrs, pues, a veces, los requerimientos para una correccin concreta afectaban a otros lugares, producindose cambios en exceso, o se introducan
elementos que no deban aparecer. En denitiva, se trataba de ir anando
la herramienta y puliendo los errores en su diseo o en la apreciacin de
las tareas que se requeran.
La utilidad de este sistema es innegable, y desde los primeros instantes nos produjo una gran fascinacin por las ventajas que presentaba, no
slo porque nos exoneraba de una gran cantidad de trabajo, a la vez que
nos proporcionaba una considerable seguridad sobre el contenido formal
de los originales, lo que nos permiti en la posterior fase de correccin
manual centrar nuestra atencin en otros aspectos. Por otra parte, la rapidez del mecanismo resultaba asombrosa, pues la correccin de cual-
30
31
No se recogan todos los diccionarios del periodo abarcado, y faltaban algunos anteriores, como pusieron de maniesto quienes se encargaron de
hacer reseas del Tesoro cuando fue publicado (por ejemplo, Alonso 1951,
Coln 1956 y Pottier 1962). Adems, aquella era una lista de diccionarios
en la que tambin guraban obras que no eran de carcter lexicogrco,
ni mucho menos, por ms que su inters para la historia de nuestro lxico resultaba incuestionable, por lo que su incorporacin, fuera de otras
consideraciones, estaba sobradamente justicada desde el punto de vista
lexicolgico.
Ante todo ello, se impona elaborar nuestra propia lista de obras, tarea
a la que nos dedicamos de inmediato, y que no hemos abandonado sino
en el ltimo instante, al concluir el proceso de redaccin, tal ha sido nuestro empeo por ser consecuentes con nuestras decisiones, y por proporcionar al usuario la mayor cantidad posible de materiales, siempre que
no se entorpeciera el manejo de la obra y que no se acumulasen informaciones de manera farragosa hasta ocultar las informaciones verdaderamente interesantes. ste es el motivo por el que no damos cuenta de
algunas nomenclaturas que, en la parte espaola, no hacen sino repetir
cabalmente lo que ya gura en los repertorios que toman como fuente,
con escassimos o nulos cambios, adems, en un lxico, que, por la naturaleza de las obras, es el ms cotidiano, por lo que aparece abundantemente
documentado en la lexicografa y en la historia de la lengua.
En otros lugares he descrito cmo se ha ido congurando el conjunto
de obras que ha terminado por ser el cuerpo del NTLE3. Si don Samuel haba dado cabida a textos no lexicogrcos, y, como he dicho, su presencia
en su Tesoro quedaba justicada, nosotros no slo mantuvimos aquella
decisin, sino que la extendimos, de modo que retomamos los mismos
textos y aadimos alguno ms. De este modo, si haba razones para recoger el lxico del Dioscrides de Andrs Laguna (1555)4, ya que incluye unas
tablas en varias lenguas de los nombres registrados en su interior (entre
ellas, por supuesto, de los espaoles), no tena sentido prescindir de los
trminos espaoles que puso Antonio de Nebrija (1518) en la edicin del
Dioscrides impresa en 1518 por Guilln Arnao de Brocar, partiendo de la
edicin de Ruelio, publicada poco antes en Pars. Y ello nos llev a incorporar tambin las voces espaolas que Amato Lusitano (1553) haba incluido
en su versin de la obra, aparecida slo dos aos antes que la de Laguna.
Los motivos que amparaban la inclusin de las palabras espaolas con3.
4.
Gili Gaya emple la edicin de 1570, y no la primera, de 1555, como hemos hecho nosotros.
32
tenidas en esas obras son los mismos que autorizan la de las que hay en
la obra de Conrad Gesner (1551-1587) (cfr. Alvar Ezquerra, 2002-2004), o en
la Historia de las yeruas y plantas de Juan Jarava (1557)5, o en el anterior
Modus faciendi cum ordine medicandi de fray Bernardino de Laredo (1527)
la primera farmacopea escrita en espaol, que tambin tienen ndices
de las palabras espaolas registradas en su interior. Y desde ellas llegamos al Tesoro de medicinas para todas enfermedades de Gregorio Lpez
(1672)6. De esta manera, en el interior de nuestro NTLE se halla un tesoro
lxico de la medicina de la poca, que, sin duda, presenta un notable inters y puede ser de gran utilidad a quienes se interesan por esa parcela del
lxico. Como nos ha sucedido con otros grupos de obras, han sido ms las
consultadas, pero no han pasado a engrosar las pginas del NTLE por no
ser de carcter lexicogrco y no presentar un ndice de voces que avalase
su incorporacin, pese a que el vocabulario contenido en ellas sea de inters, como por ejemplo, el Tractado de las drogas y medicinas de las Indias
Orientales de Cristbal Acosta (1578) (cfr. Alvar Ezquerra 2006b).
Ciertamente, ese grupo de obras constituye un conjunto homogneo
de fuentes para un mbito de lxico especco, pero no es el nico que
hay en nuestro NTLE, aunque s el ms rico. No carece de importancia el
dedicado a la terminologa marinera, tanto es as que Lidio Nieto (2002)
dio un avance de esa parte en su Tesoro lexicogrco del espaol marinero anterior a 1726, aunque despus se ha aadido alguna obra ms. En
otros mbitos, como el del derecho, las bellas artes o las ciencias exactas,
la riqueza no es tan grande, y no por falta de empeo por nuestra parte.
Los repertorios de lxico tcnico se desarrollan despus del periodo abarcado en el NTLE, y son muy pocos los elencos de que hemos podido disponer. Es lo mismo que sucede con las listas de palabras de uso regional,
pues antes de 1726 solamente aparece la de Gernimo de Blancas (1641)7,
mientras que s hay algn elenco de voces anticuadas, as como de carcter etimolgico segn se entenda la etimologa en la poca, aunque
una buena porcin de ellos slo se han conservado manuscritos, pese a
su trascendencia, como sucedi con el repertorio de voces de origen ra-
5.
Disponemos de una edicin moderna de M Jess Mancho Duque (2005), con varios estudios preliminares
donde se desentraan los problemas relativos a la obra y su contenido.
6.
De 1672, aunque redactado a nales del siglo anterior. El manuscrito holgrafo ha sido editado por Francisco Guerra (1982).
7.
Son las voces aragonesas que se encuentran en el ndice donde se declaran algunos vocablos aragoneses
antiguos [...], que puso en las Coronaciones de los serenssimos reyes de Aragn, publicadas en 1641, si bien
fueron escritas en 1583.
33
Recopilacin de algunos nombres arbigos [...], ms. 59-I-24 de la Biblioteca Colombina (Sevilla), manejado
por los lexicgrafos posteriores.
9.
10. Origen y etimologa de todos los vocablos originales de la lengua castellana, ms. 6929-T.127 de la Biblioteca
Nacional, Madrid. Tambin hay ms copias de l. Hay una edicin moderna con estudio de Enrique Gmez
Aguado (1992) y reproduccin del manuscrito citado.
11. Sobre ella, vase Nieto Jimnez / Alvar Ezquerra (2002).
34
35
36
37
(slo las variantes) de la edicin de 1520, ltima hecha en vida del autor
y corregida por l, que coincide, sustancialmente, con la de 1516, tambin
corregida por Nebrija13.
Aunque se ha introducido todo el contenido de los repertorios seleccionados, como se dijo antes, en ocasiones se ha suprimido texto (especialmente en las obras no lexicogrcas), cuando resultaba irrelevante
para el conocimiento de la palabra. Como el NTLE es un repertorio lxico,
no han pasado a l los numerosos nombres propios que aparecen en las
fuentes, sean geogrcos, de personas, de seres mitolgicos, de animales
fantsticos, de constelaciones y cuerpos celestes, etc., salvo, evidentemente, cuando estn lexicalizados, o cuando constituyen parte de una expresin pluriverbal jada.
Por lo que se reere a los diccionarios bilinges y plurilinges, nicamente hemos tenido en consideracin la parte espaol-otra lengua, no
la parte en la que nuestra lengua es a la que se vierten las palabras. No
se nos oculta que en esa otra parte de los diccionarios hay lxico de enorme inters para la historia de nuestra lengua, pero no es menos cierto
que la informacin, en bastantes ocasiones, hubiese sido muy repetitiva,
alargando en exceso el NTLE, y, adems, nuestros recursos tanto humanos como econmicos resultaban limitados para acometer esa tarea, que
queda para fases posteriores del proyecto, si es que retomamos energas
para continuarlo. De todos modos, son muchas las excepciones que se
han hecho a este principio, ya que hemos llevado al NTLE las voces espaolas de todos los repertorios anteriores a 1500, independientemente de
su posicin en la obra (como entrada o como lengua meta). Igualmente
se ha hecho excepcin de algunos repertorios posteriores, entre ellos todos los de Nebrija, que no slo son sus dos diccionarios grandes los ms
conocidos, por otra parte, y los diccionarios que iniciaban la lexicografa
bilinge del espaol con otra lengua. El lugar que ocupa el espaol no se
ha planteado para las nomenclaturas, ya que en ellas lo importante no es
la posicin de la lengua, sino el modo de ordenar las informaciones, que,
al pasar al NTLE, se muestran segn el orden alfabtico.
En el momento en que se tuvieron seleccionadas todas las obras, y
se hubieron tecleado, se comenz el proceso de lematizacin denitiva,
esbozado cuando se pasaban los textos a formato electrnico. La diferencia es que entonces se realizaba aisladamente para cada una de las obras
manejadas, mientras que ahora se proceda de una manera conjunta, y
13. De esta ltima hay una edicin debida a Gerald J. Macdonald (1981). El contenido lxico de esta salida ha
sido analizado por Mara Lourdes Garca Macho (1993, 1995 y 2005).
38
39
Con todos los datos unicados, nos ha sido posible corregir errores
que haban pasado desapercibidos al tratar las obras aisladamente, o que
no habamos podido solucionar a falta de mayor informacin. Ha sido
tambin ste el momento en que hemos podido solventar muchas de las
dudas que haban quedado durante el proceso de tecleado. Pero tambin
nos ha obligado a unicar la puntuacin en aquellos lugares en que lo
contenido es similar, y que, al ser tratado independientemente, se haba
codicado segn el criterio de cada colaborador.
Sabamos de la dependencia de unas obras de otras, que, ahora, queda
bien patente, pero tambin, al reunir todos los datos, hemos podido comprobar nuevas liaciones y deudas. Queda, a partir de estos momentos,
una enorme labor de estudio, pues antes no se haban entrevisto muchas
de las concomitancias que se muestran con nitidez al presentar todos los
diccionarios agrupados y ordenados, como se puede apreciar en la larga lexicografa con el ingls (cfr. Nieto Jimnez / Alvar Ezquerra 2006). En
otras ocasiones se aprecia cmo se han repetido armaciones que no tenan consistencia, o que deben ser precisadas, como la deuda de Stevens
respecto a Minsheu (cfr. Alvar Ezquerra / Nieto Jimnez 2003), o la de Pedro de Alcal con respecto a Nebrija (cfr. Alvar Ezquerra, 2006c). Disponer
de un modo conjunto de todas las informaciones nos proporciona un excelente panorama de la historia de nuestro lxico y de la representacin
de cada una de las palabras a travs de los diccionarios, pero adems se
convierte en un instrumento de primera magnitud para ver la liacin
y la interdependencia de los diccionarios, y eso que nicamente hemos
recogido las primeras ediciones de las obras, excepcin hecha, como he
comentado, de Nebrija, aunque en una sola de sus obras. Es ms, las posibilidades que nos brinda una base de datos nos permite comparaciones
entre obras, entre series de obras, entre repertorios de una misma poca,
o la bsqueda de soluciones para una voz de otra lengua en diversos elencos, e, incluso, rastrear la actividad de un lexicgrafo cuando es autor de
varios repertorios, etc. (Alvar Ezquerra 2006a: 55).
Ha sido ciertamente revelador comprobar cmo los errores y erratas
se transmitan de un elenco a otro. En este sentido, el NTLE se convierte
en un excelente instrumento para averiguar las fuentes empleadas por
determinados autores, o para seguir la presencia de un lexicgrafo en los
diccionarios posteriores, o para conocer qu edicin de una obra pudieron manejar sus seguidores. En este sentido, cabe hablar de la delidad
de los diccionarios ingleses con respecto a los anteriores, pese a las innovaciones que hay en todos ellos. En ocasiones, nuestro trabajo nos ha
llevado a consultar no slo varias ediciones de un mismo repertorio, sino
40
Con otras apariencias, bajo otras formas, en otros tiempos, las dicultades y los problemas continan siendo los mismos. Dicho con la desesperacin y el estoicismo del autor del Eclesiasts (1, 9), y como advertencia,
y alivio, para quienes en el futuro intenten abrirse paso en este mundo:
nihil novum sub Sole.
Esperamos que los esfuerzos no sean baldos y sirvan para el mejor
conocimiento de nuestro lxico, de nuestros diccionarios y de nuestra
lengua. Indocti discant, et ament meminisse periti (que los que no saben
aprendan, y los instruidos gocen al recordar), que cuentan decan los
edictos romanos.
41
1
Paris-Lodron-Universitt Salzburg
1.
Bluteau (1712-1728)
Covarrubias (1611)
Compostella [] La etimologia de
Compostela no la s con certidumbre;
pudo haberse dicho de alguna estrella o
cometa, que sealase el lugar donde estaba el cuerpo santo del Apstol.
No ano 1986, com motivo dum colquio de lexicograa (cfr. Ramn Lorenzo 1988), reunira-se na cidade de
Santiago de Compostela um grupo de importantes lexicgrafos das lnguas romnicas. Alguns, infelizmente, j desapareceram. Para que a memria deles continue, reproduzo uma foto em anexo.
42
Dieter Messner
Bluteau menciona expressis verbis a fonte, o lexicgrafo espanhol Sebastin de Covarrubias Horozco, o autor do Tesoro de la lengua castellana o
espaola, deixando ver um comportamento que muitos lexicgrafos antigos e modernos no mostram to frequentemente, ocultando as fontes.
Se compararmos as citaes sacadas dos dois dicionrios, podemos constatar uma semelhana bastante alta. provvel que Bluteau no s tenha
copiado a etimologia proposta pelo Covarrubias ele o confessa, mas sim
tambm outros troos da microestrutura do modelo espanhol, que sublinhei
no texto. E com este exemplo j estamos no centro da minha contribuio.
Fui convidado para tratar dos dicionrios como fonte lexicogrca, e
concentrar-me em dicionrios portugueses, por isso no me vou ocupar
de dicionrios espanhis, os quais, ao contrrio do que aconteceu com os
portugueses, j foram analisados sob este ponto de vista. De cada dicionrio espanhol com certa importncia j se conhece a genealogia, por exemplo do Universal Vocabulario de Alfonso de Palencia (1490) dizem uma
fonte foi o Elementarium Doctrinae rudimentum de Papias, do Tesoro de
Covarrubias (1611) uma fonte foi o Calepino, etc., etc. (cfr. Azorn Fernndez 2000). No conheo o nmero exacto de estudos, so muitssimos, que
se zeram sobre os dicionrios que copiavam as vrias edies do Diccionario de la lengua espaola (DRAE). E no s os lexicgrafos espanhis
copiaram o DRAE, mas sim tambm os autores de dicionrios galegos,
como mostrou Santamarina, que chamou a ateno sobre a forma como
Sobreira copiou o DRAE de 1780: se se cotexan as papeletas de Sobreira co
diccionario da RAE 1780 o asunto resulta case escandaloso (Santamarina
2003b: 54). E para a lngua catal consta: El diccionari de lAcademia espaola ser guia universal dels de la nostra llengua (Rico / Sol 1995: 127).
A minha presena aqui justica-se por ser responsvel de um projecto
de grande envergadura que se chama Dicionrio dos dicionrios portugueses. Publiquei j 20 volumes, com um total de 12.000 pginas (Messner
1994- ).
Para o espanhol existe uma obra semelhante, o Tesoro lexicogrco
1492-1726, de Samuel Gili Gaya (1947-1957); infelizmente cou inacabado.
Mas teremos dentro de pouco um Nuevo Tesoro, o NTLE, redigido por Manuel Alvar e Lidio Nieto.
Com a ajuda da obra de Gili Gaya foi possvel esclarecer a histria de
palavras espanholas, e a genealogia dos dicionrios. S quero mencionar
o exemplo da palavra aferes que Nebrija atribuu o signicado nugae,
quer dizer coisas sem importncia, um signicado errado que se conservou em todos os dicionrios seguintes, durante mais de dois sculos, at
ao ano de 1726. S o Diccionario de Autoridades corrige este signicado.
43
A.J. (1701)
abano: A fan.
abanos: Collars.
abanos:
kraagen.
abanos de camisa.
Hemds banden...
halsbanden,
Bluteau (1712-1728) foi a fonte de Folqman (1755), de Marqus (17581764), autor do primeiro dicionrio portugus-francs, e de Transtagano
(1773), autor do segundo dicionrio portugus-ingls.
44
Dieter Messner
Transtagano (1773)
Bluteau (1712-1728)
Folqman (1755)
Marques (1758-1764)
abanar, v. a. to fan.
abanar o lume, ou
o fogo, to kindle the
fire...
abanar as arvores, to
shake the trees...
abanar as moscas,
muscas abigere.
abanar as moscas,
muscas abigere.
abanar as moscas, to
drive the flies away...
abanar-se, to coll
ones self with a fan.
abanar as orelhas:
[...] Surdum simulare.
abanar as orelhas
[...], surdum simulare.
abanar as orelhas
[...], surdum simulare.
abanar as orelhas, to
give a negative answer.
Entre os muitos dicionrios portugueses que consultei antes de comear o meu projecto existe mesmo um dedicado s cincias naturais,
que descreve, entre outros, tambm os animais. provvel que o autor
no tenha tomado obras cientcas como base, mas, sim, o dicionrio de
Bluteau.
o Diccionario Portuguez das plantas, arbustos, matas, arvores, animaes quadrpedes, e reptis, aves, peixes, mariscos, insectos, gomas, metaes,
terras, mineraes, &. [] escrito por Jos Monteiro de Carvalho (Carvalho
1765).
45
Bluteau (1712-1728)
Carvalho (1765)
Abada, abada [...]. Fera de Africa nas terras de Benguela [], a Abada he hum
animal do tamanho de um potro de
dous annos, com a cabea mais pequena, & mais chata, que a do cavallo; tem
o pelo denso, & spero, rabo de boy, mas
mais curto, & ps fendidos, muito mais
grossos, que os de veado; tem este animal dous cornos, hum na testa do comprimento de trs, ou quatro palmos, &
este negro, ou pardo escuro, lizo, agudo
na ponta [...]. Tem a Abada outro corno
na nuca, mais curto [...], esta ponta da
abada tem fama de contra veneno [...]. O
P. Gaspar Schot [...], & outros authores
vulgares, como Covarrubias [...] se tem
equivocado [...].
Uma breve anotao entre parntese: Bluteau uma das raras excepes pouca presena portuguesa na dicionarstica espanhola.
No primeiro dicionrio da Academia espanhola, publicado entre 1726
e 1739, o que chamamos hoje Diccionario de Autoridades, encontramos
tambm Rafael Bluteau. Nos volumes publicados a partir de 1734 achamos citaes do dicionrio de Bluteau (Gmez-Pablos 2004):
Galardon: El premio, recompensa retribucion de los mritos, servicios y beneficios. Bluteau en
su Diccionario Portugus siente que esta voz se deriva del Francs Guerdn, que antiguamente se
deca Guerredon, esto es don o premio de guerra [segundo Corominas: origen germnico].
Roque: Pieza grande en el juego del Axedrez, que se coloca en la esquinas del tablero. Camina por
lnea recta, y puede andar de una vez todas sus casas, si las halla desembarazadas de otras piezas.
Covarr. dice que significa la fortaleza que se suele hacer al frente de los enemigos: y assi algunos le
dan la etymologia de Roca: y Bluteau en su Diccionario Portugues previene, que algunos se la dan
de la voz Persa Rokh, que significa caballero errante o aventurero [Corominas: rabe].
Acredito que o Dicionrio dos dicionrios portugueses vai ser til muito tempo, porque nem no Brasil nem em Portugal existe algo semelhante ao Corpus diacrnico del espaol (CORDE) da RAE em Madrid. Existem
muitas tentativas de criar corpora, todos pequenos, nenhum projecto de
grande envergadura. Se compararmos os resultados j publicados do Corpus informatizado do portugus medieval (CIPM) da Universidade Nova
46
Dieter Messner
de Lisboa com o Vocabulrio do Portugus medieval, um CD-Rom de Antnio Geraldo da Cunha (2002), constatamos lacunas:
CIPM (consulta 1.11.2006)
DULDAR cf. DUVIDAR
Ocorrncias: 3
C6
CP3
dulte 1 (CantigasEsc.Mald.)
PP f.s.
dultada 1 (CEM)
Cunha (2002)
duldar (4) vb. Duvidar: sXIII Fuero
Real III.820; S XIV Gen.Estoria 23,1;
Crnica Gen.Gallega 897,50; Hist.Troyana 33.33.;
dultar. (7) vb. Duvidar: sXIII CSM 50.3,
sXIV Crnica Gen.Gallega 98.43; SantoGraal 119b7; Miragres 225,9; Tristan
79.3; Hist.Troiana 104.4 Crn.Troyana
1. 156.6.
Temos que falar tanto de dicionrios portugueses em tanto que fonte de dicionrios portugueses, como tambm de dicionrios escritos em
outras lnguas, a espanhola, sobretudo, e a francesa tambm, que os lexicgrafos portugueses usaram para redigir as suas obras.
Tambm temos que distinguir entre dicionrios receptores que copiaram inteiramente as entradas do seu modelo, e os outros que s tiraram
uma parte do modelo, ou a transformaram.
Com a citao da entrada Compostela, tomada de Bluteau, mostrei
que o Covarrubias (1611), chamado por Bluteau curioso investigador de
etimologias, era uma fonte importante para explicar a etimologia de palavras portuguesas em 1700, mas nem sempre Bluteau aceitou cegamente o que escreveu Covarrubias. Por isso reproduo uma parte da entrada
Abada:
O P. Gaspar Schot [...], & outros authores vulgares, como Covarrubias [] se tem equivocado.
Covarrubias foi tambm a fonte para difundir as explicaes etimolgicas em Portugal que o Padre Guadix j redigiu antes de 1593 (Guadix
1593; cfr. Messner 2007a).
O seguinte exemplo, que ilustra a prolongada inuncia de Covarrubias em Portugal, provm do Dicionrio da Academia Portuguesa, publicado em 1793:
47
Covarrubias (1611)
Quando encontrei esta palavra no dicionrio portugus de 1793 perguntei-me, por qu que, pouco antes do ano de 1800, os lexicgrafos acadmicos copiaram o resumo que Covarrubias fez das duas etimologias
propostas, uma pelo Padre Guadix, do que o livro recebeu a licena em
1593, quer dizer j 200 anos antes da publicao do dicionrio portugus
de 1793, e a outra por Diego de Urrea, uma autoridade parece ao redor
de 1600, porque nomeado por Covarrubias no prlogo ao leitor assim:
Yo he consultado a Diego de Urrea, intrprete del rey nuestro seor.
Os dicionrios portugueses posteriores so mais explcitos:
Alquitira ou Alcatira, s. f. (do Arab. alcatira, derivado do verbo ctara, pingar, destillar, gottejar,
porque a gomma alcatira ou tragacantho transsuda da planta), a gomma tragacantho; it. a planta
que a d (astragalus tragacantha) (Constncio 1836).
48
Dieter Messner
Alquitira. s. f.
Certo arbusto de flores polypetalas, e da
familia das leguminosas. He denominada por Linneo Astragalus tragacantha. He
hum arbusto pequeno, espinhoso [...]. As
flores so pequenas, leguminosas, e quasi
purpurinas. s flores succedem bainhas
villosas, inchadas, e chas de pequenos
gros da figura de hum rim. Nos principios de Junho, e mezes seguintes corre,
ou naturalmente, ou por incises feitas no
tronco ou ramos deste arbusto, em maneira de fio, ou fita mais ou menos comprida, enrolada, crespa, ou em grumos,
hum succo gommoso, branco, ou cinzento, luzidio, leve, sem gosto, ou cheiro, que
se chama tambem gomma alquitira, ou s
alquitira. Quando se lana de infuso em
agoa se incha muito, e parece huma especie de creme gelado. Esta mucilagem
da gomma alquitira serve na Pharmacia,
e outros usos. He voz puramente Arabiga, segundo Covarrubias, que traz as
origens, que lhe assigno Diogo de Urra
e o P. Guadix. A. da Cruz, Recop. 2,8
Fao este colerio. R. Sarcaiola nutrida
[...] alquitira, &c. Azev. Correc. 2,2,121
Alquitira e gomma arabiga. Morat. Pratic.
1,30,1 Gomma alcatira, amendoas doces,
de cada hum meia ona.
Alquitra, s. f. (do Arab. alcatira) Herva, e juntamente gomma medicinal. (Dragacanthum gummi). Morat. Prat. 1. 30. 1. . Alguns dizem alquetiro (Morais 18586).
Alquitira, s. f. (Do rabe alcatira) O mesmo que Alcatira [...] (Vieira 1871-1874).
Alcatira s. f. ant. (Do rabe alcatira; do verbo catara, pingar, distillar.) Arbusto de flores polyptalas, da famlia das leguminosas. Produz um succo gommoso, branco, cinzento, inodoro e inspido;
uma mucilagem empregada na Pharmacia [...] (Vieira 1871-1874).
49
Os acadmicos portugueses de 1793 foram prudentes. Fizeram bem porque algumas explicaes so extravagantes. Guadix, por exemplo, deduz
o nome da capital da ustria, Viena, de elementos rabes. Os acadmicos
portugueses no transcrevem as duas propostas etimolgicas de Covarrubias, porque no souberam qual a melhor entre as duas. J tiveram entre mos uma obra, os Vestgios da Lngua Arbica em Portugal, ou lexicon
etymologico das palavras, e nomes portuguezes, que tem origem arbica
(Sousa 1789). Muitas vezes aproveitam dela, mas na edio de 1789 a palavra alquitira ainda no est; por isso foram forados a recorrer a Covarrubias, sem meterse nas explicaes divergentes entre Urrea e Guadix.
De onde que vem ento a frase derivado do verbo ctara pingar,
distillar? Constncio (1836) copiou a explicao etimolgica da palavra
alcatro que est em Sousa (1789), porque este deduz alcatro do verbo
rabe ctara; verbo que est em Covarrubias e que provm de Urrea:
Alcatro [] Alcatrn. Espcie de bitume liquido. Deriva-se do verbo ctara pingar, distillar, cahir
s pingas; porque o pez se colhe das gotas da resina, que o pinheiro de si distilla (Sousa 1789).
Na nova edio do mesmo livro sobre Vestgios arbigos, feita em Lisboa em 1830, j est alquitira com o timo:
Alquitira [] Arab. Alcatira. He nome de certo arbusto, ou da goma de certa raiz (Sousa /
Moura 1830).
50
Dieter Messner
Pelo outro lado h denies de palavras triviais, que diferem das dos
dicionrios anteriores, e em terceiro lugar h microestruturas no acompanhadas de textos reais.
Esta falta de ilustraes contrasta com uma frase do prlogo, onde podemos ler:
O Diccionario [...] dever conter os vocabulos puramente Portuguezes em todas as suas significaes [...] inteiramente com o uso regular [...] fixado tudo pelos exemplos dos Autores
Classicos.
51
RAE (1780)
Alguns colegas atribuem certa importncia ao primeiro e nico volume de este dicionrio:
Em suma, verifica-se que o 1. Dicionrio da Academia ainda hoje um modelo de tcnica lexicogrfica, elaborado com o maior rigor cientfico [...] (Casteleiro 1993: XXII).
RAE (1780)
52
Dieter Messner
53
Mais interessante e provavelmente no conhecida a inuncia espanhola sobre os dicionrios posteriores em Portugal, no sculo XIX, no
que as grandes lnguas europeias criaram os seus dicionrios.
Os trs lexicgrafos acadmicos de 1793 no foram os nicos em traduzir dicionrios espanhis, sem declar-lo. Em 1806 publicou-se o Novo
Diccionario da Lingua Portugueza, composto sobre os que at ao presente
se tem dado ao prelo, e Accrescentado de varios vocabulos extrahidos dos
Classicos Antigos, e dos Modernos de melhor nota, que se acha universalmente recibidos (Novo Diccionario 1806).
notria a insero de muitos neologismos recuperados dizem no
ttulo de autores portugueses antigos e modernos. A verdade por completo outra: encontrei as palavras tambm no Diccionario castellano con
las voces de ciencias y artes y sus correspondientes en las tres lenguas Francesa, Latina Italiana, de Esteban de Terreros y Pando (Terreros 1786).
Terreros (1786)
Novo Diccionario
(1806)
Diccionario Universal
(1845)
Allioth, s. m. Estrella da
cauda da ursa maior.
Novo Diccionario
(1806)
Diccionario Universal
(1845)
54
Dieter Messner
55
ANEXO
1. Coloquio de Lexicografa (Instituto da Lingua Galega, Santiago de Compostela, 27 de febreiro 1 de marzo de 1986).
57
Universidade da Corua
0. introducin
Cando nos preguntamos pola informacin gramatical nos dicionarios, estamos a partir en realidade da existencia dunha dicotoma a de
gramtica / dicionario, na que certamente cada da se cre menos, anda
que, por outro lado, vea sendo mantida tradicionalmente mesmo dende
moito antes de que Saussure fundase a lingstica sobre as sas famosas antinomas. Estou seguro de que a inmensa maiora dos que aqu nos
atopamos seguimos pensando que posur unha lingua non consiste basicamente noutra cousa que, por unha banda, en coecer o seu vocabulario
e, por outra, en dominar as regras gramaticais que nos permiten xerar ou
producir, a partir daquel, un indenido nmero de enunciados. Pero non
menos certo, ao mesmo tempo, que todos estamos absolutamente convencidos de que en materia de linguaxe e, polo tanto, tamn na lingstica non hai compartimentos estancos, de maneira que nunca se poden
facer delimitacins exactas e, conseguintemente, os lmites que intentemos establecer sern sempre imprecisos e necesariamente difusos.
No que aos terreos da Lexicografa e da Gramtica se rere, esta indenicin pxoa recentemente moi ben de manifesto Ignacio Bosque
(2004: LXXIX e ss.) na introducin do seu REDES, dicionario dedicado, como
sabido, ao aspecto combinatorio do lxico, por certo nunca tratado anteriormente en ningunha lingua. Segundo observa, cando informaba das
particulares caractersticas da sa obra, anda en elaboracin, aos colegas,
haba discrepancias entre eles no sentido de que, se eran gramticos, lle dican que o que estaba a facer era lexicografa, mentres que, tratndose de
lexicgrafos, se inclinaban a pensar que a sa investigacin corresponda,
pola contra, ao mbito do gramatical. E certamente nin el mesmo que,
segundo confesa, non lexicgrafo, senn gramtico parece estar moi
58
59
60
M
O
R
F
O
L
O
X
GRAMTICA
LXICO
S
I
N
T
A
X
E
Anda que insisto a delimitacin entre os membros de cada un destes dous pares de disciplinas sexa na prctica relativamente difusa, non
cabe a mis mnima dbida de que as como na Gramtica existen unha
morfoloxa e unha sintaxe, tamn no estudo do lxico e por ende na
Lexicografa haber que facer a mesma distincin. Hai que falar, como
se fai con frecuencia, dunha morfoloxa lxica xunto a unha morfoloxa
gramatical, preocupada esta ltima fundamentalmente polos aspectos
exivos; pero tamn dunha sintaxe lxica, referida ao nivel mis concreto
da palabra, fronte a unha sintaxe gramatical, enfocada mis ben ao estudo da oracin e as sas partes ou funcins.
61
nos dicionarios bilinges cando eramos estudantes. Pero non hai que
acudir exclusivamente aos dicionarios escolares para constatar este feito, pois tamn os dicionarios comns e correntes de tipo mis ou menos
descritivo e normativo pensemos, para o espaol, no DRAE ou no DUE de
Mara Moliner tenden a inclur as mesmo este tipo de informacin en
atencin a que estn destinados a un pblico non particularmente versado en materia gramatical.
En calquera das das estruturas que caracterizan un dicionario pode
detectarse a informacin morfosintctica. En primeiro lugar, na macroestrutura, isto , atendendo ao lemario ou conxunto de entradas, e en segundo termo, na microestrutura ou interior do artigo lexicogrco. No
primeiro caso cabe anda referirnos a dous aspectos: o que atende aos
tipos de lxico rexistrado, ao inclur, entre outras cousas, palabras ou morfemas gramaticais as como elementos morfolxicos por exemplo, prexos e suxos derivativos, e, por outra banda, o que se rere mis ben
forma da entrada, a cal, ademais de informar sobre a sa propia ortografa, pode facelo as mesmo sobre as sas particularidades morfolxicas, e
ata s veces fontico-fonolxicas.
Dende logo todos os dicionarios de tipo xeral rexistran as chamadas
palabras gramaticais, isto , pronomes, preposicins e conxuncins, de
modo que aqu atopamos o primeiro solapamento entre Gramtica que
mis propiamente a que debe estudar estes elementos e o Dicionario,
o cal, por outro lado, cando de tipo xeral, non se limita a recoller as unidades lxicas, senn todo tipo de vocbulos indo mesmo mis al destes:
por exemplo, a rexistrar as mesmo certos axos ou, sen ir mis lonxe, as
letras do abecedario (vxase a este respecto Porto Dapena 2000-2001) e ata
s veces elementos que non pertencen propiamente lingua, como o
caso do DUE de Mara Moliner cando recolle mesmo certos clics (chsss!,
mmm, etc.).
Pero falando de elementos de tipo gramatical includos na nomenclatura do Dicionario, cabe anda seguindo unha feliz distincin de Eugenio
Coseriu (1977: 107-109) entre linguaxe primaria e metalinguaxe separar
entre entradas gramaticais, as representadas por pronomes, preposicins,
formas irregulares, etc., que pertencen, obviamente, linguaxe primaria,
e, por outro lado, entradas de gramtica, isto , terminoloxa gramatical,
pertencente ao lxico especializado da Gramtica ou, mis ben, da Lingstica, estudado s veces enciclopedicamente non s, por suposto,
nos dicionarios e vocabularios especializados, senn mesmo s veces se
ben iso non se xustique doadamente nos dicionarios xerais e comns.
Exemplicando co mesmo DUE de Mara Moliner, os artigos que esta au-
62
63
As pois, vou referirme concretamente informacin sintctica contida case sempre implicitamente nas denicins lexicogrcas, ou nos
contextos de que estas forman parte dentro das respectivas acepcins. Os
exemplos que vou utilizar corresponden todos eles a dicionarios do espaol, concretamente ao DRAE, ao DUE e ao DEA de Manuel Seco, Olimpia
Andrs e Gabino Ramos, por ser a lexicografa espaola o mbito no que
mis traballei e, polo tanto, mellor me movo.
64
65
cunstancia que se aproveita s veces para ofrecer na correspondente microestrutura todo un estudo de tipo gramatical, entrando as o Dicionario
no que xa habera que considerar saber enciclopdico. Considrese a este
propsito, por exemplo, o longo artigo, de mis de corenta pxinas, que a
propsito da palabra verbo aparece na primeira edicin do DUE de Mara
Moliner, o cal constite un amplo e detallado captulo digno de gurar
nun tratado de gramtica descritiva.
De todos os xeitos, habemos de coincidir con Gili Gaya en que un dicionario, como xa queda sinalado, non debe ser nunca unha gramtica
estruturada en captulos dispostos por orde alfabtica, que realmente o
que Mara Moliner xo cos artigos de desarrollo gramatical e que, precisamente por esa razn, os encargados de preparar a segunda edicin do
DUE, eliminaron da nomenclatura, pasndoos a formar un longo apndice ao nal da obra. inevitable, con todo, que un dicionario comn trate
o lxico metalingstico, anda que, evidentemente, sen chegar ao grao
de especializacin dun dicionario de lingstica ou sobre terminoloxa
gramatical, nin, por suposto simplemente porque cadra de camio, tomar como pretexto ese vocabulario para desenvolver toda unha teora
lingstica ou un estudo detallado da gramtica da lingua en cuestin.
Isto ltimo supora unha confusin por certo bastante frecuente nos
dicionarios comns entre o lingstico e a realidade (anda que neste caso
esteamos a falar vez dunha realidade lingstica), pois unha cousa, loxicamente, ser denir a palabra verbo, que o que atinxe ao dicionario, e
outra ocuparse como fai Mara Moliner da realidade chamada verbo. s
veces a confusin tan forte que se chegan a inclur na nomenclatura dos
dicionarios elementos que, anda sendo realidades lingsticas, non constiten verdadeiras unidades lxicas, como o caso, por exemplo, das letras,
segundo puxen de manifesto hai algn tempo nun artigo sobre o tema
(Porto Dapena 2000-2001). Realmente unha entrada como B, por exemplo,
non unha palabra (fronte ao substantivo be), senn a letra mesma, a cal,
malia ser unha realidade grca e, polo tanto, lingstica, non debera
gurar como entrada en ningn dicionario e s, en todo caso, nunha enciclopedia. Cando, efectivamente, o DRAE nos dene
b 1. f. Segunda letra del abecedario espaol y del orden latino internacional, que representa un
fonema consonntico labial y sonoro. Su nombre es be, be alta o be larga.
non nos est a dar o signicado dunha palabra b inexistente, senn que
nos est a caracterizar a letra mesma, o signo ortogrco; por iso non ten
ningn sentido a marcacin f. (feminino) que fai desta entrada.
66
que atopamos na ltima edicin do DRAE. Dende logo nos dicionarios histricos, ao detectrense s veces mltiples grafas dunha mesma palabra,
moi frecuente atoparnos con enunciados deste tipo.
67
Achmonos neste ltimo caso ante enunciados polimrcos, os cales non s poden informar da existencia de variantes ortogrcas, senn
moitas veces tamn morfonolxicas, como sera o caso, por exemplo, dun
dicionario que rexistrase como entradas as formas amueblar ou amoblar,
carnicera ou carnecera, espabilar ou despabilar, etc. Mesmo por exemplo, na primeira edicin do DUE de Mara Moliner dentro dun mesmo
enunciado pode aparecer toda unha familia morfolxica, con remisin
entrada que se subordinan; o caso, por exemplo, de
perfeccin; perfeccionador, -a; perfeccionamiento; perfeccionar; perfeccionarse; perfectamente; perfectibilidad; perfectible; perfectivo, -a. V. bajo PERFECTO.
E no DEA:
lead (ing; pronunc corriente, /lid/; pl normal, -s) m En un peridico: Entradilla.
En canto a aspectos relacionados coa pronuncia dados na macroestrutura, cabe engadir que algns dicionarios por exemplo, o GDUEA de
SGEL presentan as entradas con separacin silbica, dando as informacin cremos que innecesaria e s veces ata discutible acerca deste particular. As, des.a.gra.de.ci.do, em.plas.to, ma.nual.men.te.
Agora ben, a informacin mis estritamente gramatical ofrecida pola
forma en que se rexistran as entradas , evidentemente, a que atinxe ao
carcter exivo, isto , gramaticalmente variable ou, pola contra, invariable das palabras. En primeiro lugar, como sabido, os substantivos e
68
69
Dende logo, como xa sinalou A. Quilis (1982), nun dicionario de espaol a indicacin da pronuncia non ten demasiada xusticacin, dada a
normal e case exacta correspondencia entre letras e fonemas. A lectura
do espaol (e tamn do galego) non ofrece, efectivamente, ningunha dicultade sobre todo aos falantes nativos coecendo, claro est, esas
equivalencias, que, ademais, non son absolutamente idnticas para todos
os hispanofalantes (e galegofalantes), o que dicultara s veces a sa
transcricin fontica1. S excepcionalmente, no caso de emprstitos tomados doutras linguas na sa orixinal grafa, poden presentarse dicultades neste sentido e, polo tanto, resulta necesario e conveniente realizar
algunha observacin ao respecto, sempre, naturalmente, que a pronuncia
contradiga dalgn xeito as correspondencias letra /son de espaol ou galego. Considrese, como exemplo, o caso de sndwich tal como aparece na
primeira edicin do DUE:
sandwich (pronunc. aproximadamente sanuich; y a la espaola, vulgarmente, sambich). Palabra inglesa con que se designa [...].
Resulta, polo tanto, redundante o procedemento seguido polo GDLE, que incle invariablemente a pronuncia segundo a norma espaola de todas as sas entradas, as cales aparecen en transcricin fontica: as,
ha.ber [ar]
70
o mtodo seguido polo DRAE, que na sa versin electrnica ofrece a posibilidade de despregar a conxugacin completa de cada verbo, picando
simplemente o botn azul que aparece ao lado da entrada. En calquera
caso, velaqu un punto mis onde Gramtica no seu sentido mis estrito e Dicionario interren claramente.
71
etctera.
3.3. A informacin gramatical nas denicins: o contorno
Pero falando da denicin lexicogrca como fonte de informacin
gramatical, convn non esquecer que esta non consiste contra o que
doadamente se puidese pensar nunha mera descricin do signicado
ou contido semntico dunha palabra ou unidade lxica, senn que moitas veces informa tamn, implcita ou explicitamente, acerca do seu comportamento sintagmtico. Isto quere dicir que nunha denicin poden
distinguirse con frecuencia dous elementos: o que propuxen chamar
72
que vn a ser mis ben unha denicin sinonmica, dado que o enunciado parafrstico est representado por unha soa palabra; pero onde se nos
informa acerca das caractersticas do suxeito (ten que ser unha corrente
de auga) e da necesidade dun complemento de lugar.
Non foron estudadas anda en profundidade as circunstancias en que
unha denicin ha de ofrecer o seu contorno. Dende logo este non debe
faltar, obviamente, cando os elementos que o compoen tean que cumprir unhas determinadas condicins semnticas e, polo tanto, exista un
condicionamento por parte do denido, representado xeralmente por un
verbo ou, se acaso, un adxectivo. Pola contra, non necesarioe polo tanto
non debe aparecer cando doadamente deducible do contexto parafrstico. De a, por exemplo, que esta denicin tomada do DRAE:
anglfono. adj. Dicho de una persona o de un pas: Que tiene el ingls como lengua nativa
73
nos dicionarios: s veces as denicins non son o sucientemente explcitas porque lles falta o contorno, como esta outra, tomada as mesmo do
DRAE,
abanicar. tr Hacer aire con el abanico
Non fai falta sinalar que se di unicamente de persoas. Por outra banda, os contornos explcitos poden ser integrados, cando como o tpico
forman parte do enunciado denicional, e non integrados, se aparecen
fra del; as, en
transcurrir. intr. Dicho generalmente del tiempo: Pasar, correr
74
tes do verbo denido, pero con funcins sintcticas distintas s que lles
corresponden cando se constren con el. o caso, entre outros, de
rizar. tr. Formar en el pelo artificialmente anillos o sortijas, bucles, tirabuzones, etc.
o complemento indirecto sera, non obstante, o directo do denido. Notemos que, nestas circunstancias, o poder informativo sintacticamente
falando do contorno queda bastante minguado, o que levou a algns autores de dicionarios o caso, por exemplo, do DEA ou do DS e antes, anda
que tan s parcialmente, do DUE a sinalar por diversos procedementos
formais as funcins sintcticas que os elementos do contorno han de desempear cando aparecen co denido. Considrese, como exemplo, esta
denicin do DEA:
retirar. tr. Hacer que [alguien o algo (cd)] deje de estar [en un lugar (compl DE)]
75
Sistema semellante a este, anda que mis sinxelo, foi o adoptado despois polo DS.
De todos os xeitos, habida conta de que toda esta parafernalia de parnteses e subndices resultan bastante enguedellantes hora de consultar o dicionario, eu avogara hoxe por separar nas acepcins os elementos
contextuais ou contorno, dos propiamente denicionais ou parafrsticos,
rexistrando en primeiro lugar o contexto e logo a denicin, que as quedar bastante despoxada de elementos externos. , por certo, unha prctica que estou a adoptar penso que con xito no meu futuro Diccionario
Corua de la lengua espaola actual (DCLEA) e que, ao meu xuzo, far
deste dicionario, sendo xeral, un dos mis informativos dende o punto de
vista sintctico. Proporei tan s un caso a xeito de simple mostra:
beber v. 1. tr. [~ un animal o persona (suj.) <una cosa lquida> <p. e. agua> (od.)]. Ingerirla o meterla
en la boca hacindola pasar al tubo digestivo.
Yo nunca bebo soda. Cuando tengo sed, mejor bebo agua. (Santiago, El sueo de Amrica, 21
[CREA])
a) intr. Sin obj. directo puede significar particularmente consumir bebidas alcohlicas. En este
caso puede ir acompaado de los advs. de cantidad mucho, demasiado o poco, o tambin con la expresin como un cosaco. Si no lleva ningn adv., se entiende siempre mucho o demasiado y, por lo tanto,
el verbo adquiere ms particularmente el significado de ser alcohlico o tener el vicio de tomar
bebidas alcohlicas. Finalmente, en frase negativa equivale siempre a ser abstemio, no probar el
alcohol: Domingo no bebe, pero su hijo s.
Y el espaol bebe sobre todo fuera de casa y raras veces bebe en solitario. (Domingo, El sabor
de Espaa, 40 [CREA])
Viva en una pensin y beba como un cosaco. (Leguineche, La tierra, 151 [CREA])
No fuma, no bebe y habla con el desparpajo y la insolencia propias de su edad. (El Pas [CREA],
02/08/87 [CREA])
b) [~ alguien (suj.) por algo o alguien (cp.)]. Tomar una copa p. e. despus de un brindis para
celebrar o desear algo positivo a favor de la persona o cosa que se expresa.
Vamos a beber por los buenos consejos. (Loriga, Hroes, 130 [CREA])
Contra sus hbitos, la madre pidi que le sirvieran vino y bebi por su esposo y sus hijos, mencionando cada nombre con tal nfasis (luego comentaran) que quiz quiso despedirse de esta
manera. (Otero, Temporada de ngeles, 130 [CREA])
76
En realidade non existe unha idea clara na lexicografa tradicional acerca do que ha de ser unha acepcin
e unha subacepcin, e, polo tanto, tal distincin obedece as mesmo a criterios meramente subxectivos.
Na mia opinin, non obstante, os dous termos deberan empregarse, respectivamente, para referirse aos
signicados e s variantes de signicado: debe entenderse que dous sentidos dun vocbulo corresponden
a signicados ou acepcins distintas cando en ambos a devandita palabra forma parte de paradigmas
lxico-semnticos diferentes, mentres que, de pertenceren ao mesmo paradigma, acharmonos ante variantes ou subacepcins dun mesmo signicado (vxase Porto Dapena (2002a: 199). Sobre os problemas do
establecemento de acepcins ocupronse recentemente J. A. Pascual Rodrguez e R. Garca Prez (2007: 117
e ss.).
77
Dende logo eu non teo ningunha dbida como non a tivo tampouco
Cuervo no seu DCR de que a separacin de acepcins debe consistir basicamente en distinguir signicados ou, por mellor dicir, sentidos, anda
cando cada un destes vaia moitas veces asociado a un determinado comportamento sintctico. Pero non todo o mundo segue este procedemento:
sen ir mis lonxe, o DEA, que representa nestes momentos sen dbida o
mellor dicionario do espaol actual, parte, como sabido, dunha separacin sintctica, ao estudar separadamente nos artigos dos verbos as
construcins transitiva, intransitiva e pronominal, cousa que o leva, por
certo, a repetir en moitos casos o mesmo signicado en cada unha desas
construcins, duplicando ou triplicando as o nmero de acepcins. Considrese, por poer un exemplo sinxelo, o seguinte artigo do DEA:
enfermar A intr 1 Ponerse enfermo [1]. Tb. (reg) pr (~ se). A veces con un compl. DE.
B tr 2 Poner enfermo [1 y 2] [a alguien o algo]. A veces con un compl DE o, raro, CON.
onde se establecen das acepcins, que en realidade non son mis que
unha, anda que en construcins sintcticas distintas: as diferenzas veen aqu dadas pola conguracin sintctica dos actantes, pois o suxeito
de 1 o complemento directo de 2, onde vez se incrementa un novo
actante, un causante ou instigador.
Cando unha mesma acepcin dun verbo susceptible de expresarse
mediante construcins distintas o mis frecuente nos dicionarios porque este o proceder preferido polo DRAE utilizar unha soa denicin
de acordo cunha desas construcins (a que se considera mis xenuna) e
engadir, mediante abreviaturas, na mesma acepcin, expresins como u.
t. c. tr. (intr. ou prnl.), dicir, usado tamn como transitivo (intransitivo
ou pronominal). As,
derrumbar [...].2. tr. Derribar, demoler una construccin o parte de ella. U. t. c. prnl.
A informacin sintctica resulta correcta, pero sen dbida insuciente, posto que non se explica a modicacin funcional de que sern obxecto os actantes.
Estes mesmos dicionarios, non obstante, non seguen un criterio homoxneo nesta cuestin, posto que, ao lado desta solucin, atopamos
tamn, o mesmo que no exemplo que acabamos de ver do DEA, unha diversicacin de acepcins, que repito non presentan mis que unha
pura variacin na conguracin sintctica dos actantes. Considrese, por
exemplo, o seguinte artigo tomado do propio DRAE:
78
empapar. 1. tr. Humedecer algo de modo que quede enteramente penetrado de un lquido. Empapar
una sopa en vino. U. t. c. prnl. El pan se empapa en el vino. 2. tr. Dicho de una cosa: Absorber dentro de
sus poros o huecos algn lquido. La tierra empapa el agua. U. t. c. prnl. La tierra se empapa de agua. 3. tr.
Absorber un lquido con un cuerpo esponjoso o poroso. Empapar con un trapo el agua vertida. 4. tr. Dicho
de un lquido: Penetrar los poros o huecos de un cuerpo. La lluvia empapa los vestidos. U. t. c. prnl. La
lluvia se empapa en la tierra.
cuxas catro acepcins son en realidade unha soa, pero con distintas funcins sintcticas dos mesmos actantes e que poderiamos resumir nas seguintes frases:
1. Juan empap la esponja en agua.
2. La esponja empap el agua.
3. Juan empap el agua con una esponja.
4. El agua empap la esponja.
non se deduce senn mis ben ao contrario que non sexan aceptables, entre outras, expresins como *Tena suma hambre ou *Esta lmpara es suma, fronte, en cambio, a Lo har con sumo gusto, Hay que
tener sumo cuidado, que seran perfectamente aceptables. Nos dicionarios, efectivamente, case nunca se precisa con que palabra ou palabras concretas adoita construrse de feito un vocbulo; dicir, non
se rexistra o que hoxe coecemos co nome de colocacins, as como
en moitsimos casos tampouco se mostra o rxime preposicional das
79
Non se precisa, en efecto, que dos obxectos comparados un deles haber de actuar como complemento preposicional precedido de con.
Non , dende logo, agora o momento de entrar na discusin do que
debemos entender exactamente por colocacin, nocin, como se sabe,
dabondo controvertida (vxase, entre outros, Alonso Ramos 1994-1995 e
Koike 2001) e que eu aplicara, por razns prcticas, a toda combinacin
xa de palabras establecida polo uso que se repite sen que entre elas
exista solidariedade nin que, por outro lado, posa signicado idiomtico.
dicir, a presenza dunha non esixe necesariamente a da outra non existe condicionamento ou seleccin semntica e, dende o punto de vista do
seu contido, cada unha conserva o seu correspondente signicado. As, a
expresin frecuente durmir profundamente ou pracidamente ser unha
colocacin, pois nin durmir esixe a profundamente ou pracidamente, nin
ningn destes adverbios a durmir, e, ademais, ambas as das palabras
conservan o seu signicado individual. Pero notemos que a semellante
combinacin non se fai a mis mnima alusin en ningn dicionario xeral da lingua galega (nin da espaola verbo do comportamento parello
de dormir).
En relacin, por certo, co espaol dormir, en todos os dicionarios atopamos rexistradas expresins como dormir a pierna suelta ou dormir
como un lirn, que, ao meu modo de ver, seguen sendo tamn colocacins, agora constitudas por dormir e as locucins a pierna suelta e como
un lirn. Neste caso penso que tal rexistro se debe interpretacin sen
dbida errnea desas combinacins como locucins verbais anda que,
evidentemente, o carcter locucional corresponde unicamente s correspondentes expresins adverbiais.
Non este, naturalmente, o nico caso en que os dicionarios comns
rexistran colocacins. Obsrvese, por exemplo, o seguinte exemplo tomado do DRAE:
tomar [] 28. tr. Ponerse a ejecutar la accin o la labor para la cual sirve un determinado instrumento. Tomar la pluma, ponerse a escribir. Tomar la aguja, ponerse a coser.
80
onde evidente que tomar la pluma e tomar la aguja son as mesmo colocacins. O rexistro, con todo, deste tipo de construcins sempre espordico e, dende logo, nada sistemtico.
E outro tanto cabe dicir do rxime preposicional, cando este non deducible do enunciado denicional, como no caso de comparar, a que me
refern antes. S algns dicionarios por exemplo, o DEA e, na maiora dos
casos, o DUE ofrecen realmente esa informacin. E as, no artigo correspondente mesma palabra comparar, o DEA di o seguinte:
comparar [...] 2 Expresar la semejanza que se encuentra [entre una persona o cosa (cd) y otra
(compl A o CON).
4. conclusin
E, xa para conclur, direi que, dende logo, os dicionarios comns de
tipo xeral e semasiolxico ou alfabtico, aos que aqu me vin referindo, non informan sobre aspectos morfolxicos e, sobre todo, sintcticos
coa mesma intensidade e detalle con que o fan os dicionarios especializados ou dicionarios gramaticais, dicir, entre outros, os de valencias, de
construcin e rxime, combinatorios, de colocacins, etc. Se as non fose,
obvio que a existencia destes ltimos carecera de toda xusticacin.
Non obstante, como creo quedou sucientemente demostrado ao longo desta breve exposicin, os dicionarios comns anda sen pretendelo
moitas veces informan sobre eses e outros aspectos en maior medida do
que quizais podera pensarse primeira vista. Isto, por outra banda, non
signica que o dicionario se extralimite nas sas funcins de informar
sobre o lxico da lingua, entrando nun terreo que non lle corresponde e
reservado unicamente gramtica. Realmente, anda que verdade que
existe certa imbricacin entre Dicionario e Gramtica, como, por exem-
81
82
83
Universidade de Aveiro
1. O biblinimo Dictionarium foi pela primeira vez publicado em Portugal em 1551 no ttulo de um pequeno manual escolar, Hieronymi Cardosi Dictionarium Iuventuti studiosae admodum frugiferum (Cardoso 1551)1,
destinado ao ensino do latim a estudantes portugueses. Trata-se de um
abreviado vocabulrio latim-portugus, com 3.300 entradas, distribudas
por grupos temticos, sem qualquer ordem alfabtica e com valorizao
de um universo de referncia profano, com alargado espao para a terminologia da medicina.
A primeira dicionarizao efectiva do portugus, com alfabetao do
conjunto do corpus lexical, teve lugar em 1562, com a publicao de um
dicionrio de portugus-latim (Cardoso 1562-1563). Regista cerca de 12.000
entradas e oferece uma boa documentao do vocabulrio comum, tradicional e no erudito da lngua. Todavia, apresenta j alguns indcios da
renovao latinizante que se encontrava crescentemente exercitada nos
textos dos humanistas e nos versos de poetas como Cames.
A lexicograa portuguesa, prolongando a herana latina, nasceu um
pouco mais tarde do que a de outras lnguas europeias, e teve um percurso menos abundante, em obras publicadas, mas no deixou de preencher
um espao interessante, pela sua dimenso lingustica e cultural, e ainda
por uma certa originalidade, no panorama amplo da elaborao dicionarstica das lnguas modernas.
Poderemos salientar, entre vrios aspectos observveis no percurso
histrico da lexicograa portuguesa, um conjunto de traos mais caracterizadores, que particularmente a distinguem de outras experincias
lexicogrcas suas contemporneas, e que marcam a sua especicidade.
Nomeadamente:
1.
84
Telmo Verdelho
85
86
Telmo Verdelho
2. A reexo lexicogrca participa da histria da lngua, uma condio do seu ordenamento normativo e, de certo modo, acompanha a
lngua escrita antes do aparecimento dos dicionrios. O dicionrio um
instrumento metalingustico tardio, que veio fazer parceria com a gramtica, no apoio ao ensino e ao uso da lngua. A gramtica surgiu na
antiguidade clssica, na sequncia da reexo lingustica dos lsofos e
sostas gregos e dos llogos helenistas, mas o dicionrio uma arte
moderna, criada para o estudo e uso do latim, no mbito do humanismo
renascentista, e depois desenvolvida, at aos nossos dias, com o apoio da
tcnica tipogrca, no percurso progrediente da generalizao da escrita
por parte das lnguas modernas.
Em todo o caso, os dicionrios latinos, que comearam a ser publicados no nal do sculo XV, no surgiram ex nihilo, foram precedidos
por alguns textos medievais pr-dicionarsticos v.g. Elementarium de
Papias (1050) (cfr. de Angelis 1977-1980 e Shaw 1997) e Catholicon de Balbo (1286) (cfr. Shaw 1997) e sobretudo por uma considervel produo
glossarstica, que facilitava o acesso aos textos latinos e apoiava o ensino
do latim. Desse patrimnio de glossrios medievais, que relativamente abundante para algumas lnguas europeias, guarda-se para o portugus apenas um modesto e delido manuscrito alcobacense, dos sculos
XIII ou XIV, com uma lista alfabtica de verbos latinos (cerca de 3.000)
a que foram acrescentadas as equivalncias portuguesas (1.130 formas
diferentes muitos verbos portugueses so vrias vezes repetidos e utilizados para traduzirem os verbos latinos correspondentes que foram
agenciados de modo mais copioso por uma longa tradio de escrita)2.
Houve provavelmente mais glossrios de latim-portugus, mas so hoje
herana perdida.
A escrita portuguesa desse tempo repercute o esprito pr-dicionarstico da cultura literria medieval, especialmente nos textos dedicados ao
relacionamento jurdico, que retomam as formas latinas e as traduzem
quanto letra e quanto ao sentido (cfr. Jos de Azevedo Ferreira 1980 e
1987, e ainda Miranda Menndez 2004).
Tambm nos textos de Avis so frequentes as transcries de sequncias glossarsticas e os enunciados redundantes, que procuram com insistncia garantir o acesso signicao das palavras. Nestas obras, com
objectivos bem distantes da reexo discursiva, salienta-se a informao
2.
Descrito no Inventrio dos cdices alcobacenses com o n CDIV/286: Pequeno dicionrio de verbos latinos
com a correspondente signicao em portugus. No m algumas notas sobre versicao... letra gtica
cursiva, mida, dos meados do sculo XIV (p. 257); ver Carter (1953). Cfr. Verdelho (1995: 195 e 515).
87
metalingustica, sobretudo orientada para o esclarecimento lexical e lolgico, e a preocupao de traduzir o latim para linguagem3.
A escrita em linguagem, na Idade Mdia, pela sua insistente redundncia, acusa bem a ausncia dos dicionrios, que a partir do sculo XVI vo
libertar os autores para um certo aligeiramento da intransparncia semntica, para a inovao lexical, e tambm para uma fcil intertextualizao
do latim em citaes eruditas e de ornamento estilstico. Com o advento da
produo lexicogrca, termina tambm a tradio glossarstica. As gramticas latinas, que comearam a ser impressas em grande nmero e distribudas individualmente pelos estudantes, e os pequenos dicionrios escolares,
organizados por grupos temticos de palavras, permitiam a aprendizagem
sistemtica, dos verbos e nomes anmalos e do vocabulrio em geral.
3. Em Portugal a renovao deste horizonte metalingustico foi feita
no mbito duma estreita e continuada vinculao tradio europeia.
A lngua portuguesa, desde o incio da sua memria escrita, recebeu
informao metalexicogrca, proveniente de um convvio interlingustico em que, juntamente com o latim, se ia cultivando uma relao com
os vernculos, particularmente com o espanhol, o provenal, o italiano e
o francs, e sobretudo com a produo lexicogrca latina originada no
espao central da Europa.
A prosa no historiogrca produzida em lngua portuguesa durante
a Idade Mdia retomava e traduzia, geralmente a partir do latim, como
j notmos, textos e fragmentos avulsos de smulas e enciclopdias que
transmitiam o legado do saber europeu, elaborado desde a antiguidade.
Esses textos pr-dicionarsticos continuaram a ser usados depois do sculo
XV, juntamente com os dicionrios humanistas, j impressos, provenientes de Espanha, Itlia e Frana. No esplio acumulado das bibliotecas portuguesas e ainda no mercado do livro antigo, encontram-se exemplares,
no raros, desses monumentos inaugurais da elaborao lexicogrca.
Para alm de testemunhos manuscritos ainda conservados (um fragmento do Catholicon e os cdices alcobacenses das Derivationes de Hugcio e do Elementarium de Papias, este em trs preciosos volumes), temos
3.
Servem-nos de ilustrao estes exemplos do Livro da Montaria: E con este escolhimento representa a outra
virtude a que dizem vontade e, se se acorda con aquillo que o entender boo acorda, entom lhe dizem bom
entendimento porque se ajunta a esta palavra de duas virtudes, de entender e de vontade, a que dizem
mente. Tomando estas duas palavras, entender e mente, vem a fazer aquella concordia daquellas virtudes e
chamam-lhe entendimento (1.1). E porque ha hi huma palavra en latin que comprehende a muytas partes,
demais aos que as obran, que diz assi: Omnis laus in ne canitur, que quer dizer, todo louvor est en n das
cousas quando bem feitas son, ca, das cousas que bem feitas non son, non pode en ellas caber louvor (1.23).
88
Telmo Verdelho
Citado em Teixeira de Carvalho (1914: 484). Ver ainda Isaas da Rosa Pereira (1964-1966).
5.
6.
7.
Teve a primeira edio em 1566 em Salamanca e foi duas vezes impresso em Portugal (Braga, 1569 e Lisboa, 1588).
89
Foram bem conhecidas e muito manuseadas as recolhas lexicais ciceronianas de Mrio Nizolio (1488-1567) e de Pedro Juan Nez de Valencia
(1522-1602), e vrios outros dicionrios literrios, de eptetos e de citaes,
particularmente as obras de Ravsio Textor (1480-1524) (Ofcina, Cornucopia e Epithetorum opus). A obra de Textor, sobretudo a Ofcina, reiteradamente citada em textos portugueses. Heitor Pinto na Imagem da
Vida Crist refere-se-lhe 14 vezes; Barros cita Ravsio no Espelho de Casados (1540); Jorge Ferreira de Vasconcelos recolheu, na obra de Textor, os
nomes das suas personagens e numerosas outras informaes histricas
e mitolgicas; e Cames, muito provavelmente, socorreu-se dos eptetos
recolhidos por Textor, para o provimento de grande parte da alatinada adjectivao que ornamenta a sua obra, alm de outros elementos poticos,
como a designao para o fabuloso e oportuno mito do Adamastor.
Os grandes dicionrios latinos do sculo XVI e XVII, especialmente o
Thesaurus Linguae Latinae de Robert Estienne (1503-1559), o Calepino de
Ambrsio Calepino (1435-1511) e a Amalthea de Giuseppe Laurenzi (1573?1647) tiveram recepo ampla e diuturnamente recorrida entre os humanistas e pedagogos portugueses.
O Thesaurus Linguae Latinae (Estienne 1531), nos seus trs volumes in
folio, foi conhecido e muito utilizado. A sua difuso pode ter sido condicionada pelo facto de Robert Estienne ser um autor damnatus, pela adeso
ao calvinismo; em todo o caso, temos notcia certa de que o Thesaurus circulou com muito desimpedimento e foi citado pelos estudiosos em Portugal, ao longo dos sculos XVI, XVII e XVIII. Conservam-se, nas bibliotecas
portuguesas, vrios exemplares, ainda que alguns se encontrem riscados
e mutilados, pelo mau uso dos leitores ou pelas injrias censrias. Amaro
Reboredo deve ter recolhido no Thesaurus as sries de locues, de listas
coocorrentes e de grupos de signicantes sinonmicos ou analgicos que
alargam inesperadamente um bom nmero de artigos.
O dicionrio de Ambrsio Calepino (1502) foi, entre toda a lexicograa
europeia, a obra que mais se difundiu e utilizou em Portugal, e ainda
hoje o ttulo dicionarstico importado que se encontra com mais abundncia no fundo bibliogrco portugus, pblico e privado, e teve o privilgio de ser levado pelos Missionrios portugueses at ao Japo em 1595
(Verdelho 1999-2000).
No sculo XVII, a Amalthea onomastica de Laurenzi (1640) motivou o
modesto vocabulrio escolar de Frei Toms da Luz (1633-1713) a Amalthea
sive hortus onomasticus (Luz 1673) (cfr. Telmo Verdelho 2006) e serviu de
fonte copiosssima (cerca de 7.300 citaes) para a reviso da Prosdia de
Bento Pereira, levada a cabo em 1697.
90
Telmo Verdelho
91
92
Telmo Verdelho
A necessidade de vocabulrios no apoio missionao vem igualmente documentada no Prologo do Vocabulario da lingoa de Iapam; nele se
declara que ja ha annos auia alguns Vocabularios, & Artes de mo (Rodrigues Tuzu et al. 1603-1604).
Na sua maior parte, esses vocabulrios eram transmitidos de forma
manuscrita porque no havia meios, nem teriam qualidade suciente8.
Foi objecto de vrias edies; cfr. Marques (1999). Ver ainda Messner (1998) e Losada Soler (2006).
9.
Barbosa Machado (1741-1758: II, 449-450) atribui a autoria da arte de gramtica da lngua malabar e deste
vocabulrio ao P. Henrique Henriques (c. 1520-1600), que partiu para a ndia em 1546 e teria pronto o Vocabulrio em 1550.
93
94
Telmo Verdelho
95
Antnio Velez (1599?): Index totius artis (Emmanuelis Aluari e Societate Iesu De institutione grammatica libri tres). vora.
2. Manuel Barreto (1607): Vocabulario Lusitanico Latino composto na
Provincia de Japo. 3 vols. manuscritos (Academia das Cincias de
Lisboa).
3.1. Bento Pereira (1634): Prosodia in Vocabularium Trilingue, Latinum,
Lusitanicum, & Hispanicum digesta, in qua dictionum signicatio, et
sylabarum quantitas expenditur. vora [reeds. em Lisboa, 1653; Lisboa,
1661; Lisboa, 1669; Lisboa, 1674; Lisboa, 1683 (cfr. infra Pereira 1697)].
4.1. Bento Pereira (1647): Thesouro da Lingoa Portuguesa. Lisboa. Publicado sempre juntamente com a Prosodia a partir de 1661.
5.1. Bento Pereira (1655): Florilegio dos modos de fallar, e adagios da
lingoa portuguesa: dividido em duas partes, em a primeira das
quaes se poem pella ordem do Alphabeto as Frases Portuguesas, a
96
Telmo Verdelho
97
98
Telmo Verdelho
nas seguintes), acrescenta mesmo um primeiro elenco de autores portugueses procurados e valorizados como fontes de referncia para o registo
e testemunho do bom uso das palavras do vernculo, mas as entradas
desse dicionrio de portugus-latim, para alm das equivalncias latinas,
no tm enquadramento de glosas, com denio ou contextuao e explicao semntica em portugus.
O primeiro tratamento lexicogrco da lngua portuguesa foi elaborado por Rafael Bluteau, no Vocabulario Portuguez e Latino, publicado em
oito volumes in folio, com mais dois outros de suplemento, entre 1712
e 1728 (Bluteau 1712-1728). Trata-se de uma realizao monumental, no
tanto pela sua dimenso, pela feitura tipogrca, pela encadernao e
pelo cuidado tratamento biblioflico (que so, em todo o caso, notveis),
mas sobretudo pela abundncia dicionarstica, pela memria da lngua
acumulada, pela erudio enciclopdica (englobando os saberes modernos e a sabedoria antiga) e, nalmente, tambm pelos seus mritos literrios.
Rafael Bluteau foi um padre teatino cosmopolita e poliglota, que nasceu de uma famlia francesa, em Londres, onde aprendeu o ingls e o francs; estudou depois em Itlia (doutorou-se em Roma), e aos 30 anos, ao
servio da religio, veio para Lisboa, onde se familiarizou rapidamente
com o portugus, comeando desde logo a us-lo na oratria e na escrita.
Interessou-se pelo estudo do vernculo e preocupou-se com a normalizao lexical e ortogrca. Confrontando-se com a modstia dos recursos
dicionarsticos empreendeu, com grande generosidade e com sentido de
servio a elaborao desse magnum opus que to faustosamente haveria de avultar na histria da lexicograa portuguesa.
Os paratextos introdutrios e posfaciais, a informao bibliogrca e
o conjunto de vocabulrios especiais coligidos no suplemento fazem da
obra de Bluteau uma importante referncia da reexo lexicogrca e
metalingustica na histria da lngua portuguesa11.
Em anexo ao tomo VIII do Vocabulario encontra-se um Diccionario castelhano y portuguez de 189 pginas, magno in quarto, com cerca de 22.000
entradas, registando a equivalncia portuguesa apenas quando no h coincidncia ou semelhana lexical entre as duas lnguas (cerca de 11.000 formas contrastantes). Este dicionrio precedido por um vocabulrio bsico
de portugus-castelhano com cerca de 1.200 entradas (Salas Quesada 2003).
11. Nas Prosas portuguesas Bluteau retomou a reexo sobre a norma lingustica Decisoens Academicas de
Palavras Portuguezas (Bluteau 1714-1728: I, 1) e sobre a ortograa, especialmente na Prosa grammatonomica (Bluteau 1714-1728: II, 186).
99
O Vocabulrio foi modelado pelo ideal de dicionrio autorizado e locupletssimo, procurou coligir toda a memria lexical disponvel, incluindo as variedades regionais, diacrnicas e as terminologias do universo
tcnico e erudito, com seleccionada excluso no que respeita aos nomes
prprios da geograa e da histria. Acumulou um corpus lexical considervel para a poca, muito superior aos registos at ento efectuados e,
sobretudo textualizou, pela primeira vez, de modo sistemtico, em cerca de 36.000 entradas, a interpretao e as denies das palavras portuguesas, tornando-se uma fonte imprescindvel para toda a lexicograa subsequente. Os artigos lexicogrcos de Bluteau desprendem-se do
constrangimento dicionarstico e aproximam-se da exercitao literria,
oferecendo-se, ainda hoje, como um exemplo de leitura aprazvel do patrimnio clssico.
Jos Caetano (1690-post 1757) elaborou um Complemento do Vocabulario portuguez de Bluteau, aproveitando ainda alguns apontamentos
deixados pelo autor, que comeou a ser impresso justamente antes do
terramoto de Lisboa de 1755. A destruio e o incndio que se seguiram
provocaram o seu total desaparecimento. Sorte diferente, menos aniquiladora, sofreu a compilao efectuada pelo P. Carlos Folqman (1704-?). O
seu Diccionario Portuguez e Latino, no qual as dices e phrases da lingua
portugueza [] se acham clara e distinctamente vertidas na latina, e authorisadas com exemplos dos auctores classicos. [] Compilado do Vocabulario do Reverendo Padre D. Rafael Bluteau (Folqman 1755), publicado
imediatamente antes do terramoto, foi igualmente destrudo pelo fogo,
mas resgataram-se alguns exemplares que nos servem para confronto e
que nos permitem apreciar a recepo e o percurso de evoluo e de actualidade do Vocabulrio12.
A mais importante sequncia do Vocabulrio de Bluteau foi empreendida por Antnio de Morais Silva, acima citado, que o transformou no
primeiro dicionrio moderno e funcional da lngua portuguesa. A partir
de 1789, todos os dicionrios monolingues do portugus participaram no
processo de herana e de actualizao desse monumento instituidor da
lexicograa portuguesa. Recentemente foi retomado no projecto do Corpus Lexicogrco do Portugus, da Universidade de Aveiro, e foi objecto
de uma tese de doutoramento (Silvestre 2004).
O texto integral do Vocabulrio encontra-se j disponvel em memria digital, transcrito em modo texto, e est em preparao uma edio
12. O dicionrio de Folqman e as origens da lexicograa monolingue do portugus: edio e estudo o ttulo do
projecto de doutoramento de Paula Cristina Barbosa Arajo (bolseira da FCT, na Universidade de Aveiro).
100
Telmo Verdelho
1754
1755
1758-64
Jos Marques: Nouveau dictionnaire des langues franoise et portugaise: Novo diccionario das linguas portugueza e franceza. 2 vols. Lisboa: Imp. de Jos da Costa Coimbra / Of. Patr. de
Francisco Luiz Ameno.
1760
Antnio Pereira de Figueiredo (1725-1797): Breve diccionario da latinidade pura e impura, com
a significao portugueza. Lisboa: Of. Patr. de Francisco Luiz Ameno.
1762
Carlos Folqman: Nomenclatura portugueza, e latina [...] com hum pequeno vocabulario de verbos
portuguezes. Lisboa: Miguel Rodrigues.
Pedro Jos da Fonseca (1737-1816): Parvum lexicon latinum Lusitana interpretatione adjunta.
Lisboa: Miguel Manescal da Costa [vrias reeds.].
1764
Jos Marques: Novo Diccionario das lnguas portugueza, e franceza. Lisboa: Of. Patr. de Francisco Luiz Ameno.
101
Jos Monteiro de Carvalho: Diccionario Portuguez das plantas, arbustos, matas, arvores, animaes
quadrupedes, e reptis, aves, peixes, mariscos, insectos, gomas, metaes, pedras, terras, mineraes &.
Lisboa: Officina de Miguel Manescal da Costa.
Francisco Jos Freire (Cndido Lusitano) (1719-1773): Diccionario poetico. Lisboa: Na Of.
Patr. de Francisco Luiz Ameno [reeds. em 1794, 1820].
1766
1767
Fr. Luis do Monte Carmelo (1715-1785): Compndio de orthografia, com sufficientes catalogos.
Lisboa: Antonio Rodrigues Galhardo.
1771
Pedro Jos da Fonseca (1737?-1816): Diccionario portuguez, e latino. Lisboa: Regia Officina
Typografica [vrias reeds.].
1773
Antonio Vieira Transtagano: A Dictionary of the Portuguese and English Languages, in two
parts. Londres: J. Nourse [vrias reeds.].
1773-74
1775-76?
Jos Marques: Nouveau Dictionnaire des langues franoise et portugaise. Lisboa: Imp. Royale [3 ed.].
1778
Miguel Tibrio Pedegache Brando Ivo (1730?-1794): Novo Diccionario francez e portuguez.
Lisboa [4. ed. Falta notcia das eds. anteriores; teve depois vrias reeds.].
1779
Vicente de Bastos Teixeira: Dictionnaire moderne franois expliqu en portugais Tome premier.
Lisbonne: Imp. Louisiane [1 vol. at lettra C].
Pierre Chompr / Pedro Jos da Fonseca (1737-1816) (trad.): Diccionario abbreviado da
fabula. Lisboa: Na Regia Officina Typografica [vrias reeds.].
1780
Manuel de Pina Cabral: Magnum lexicon latinum et lusitanum. Olysipone: Typii Regiae Officinae [vrias reeds.].
Antnio Jos Teixeira (?) (trad.): Noticia da mythologia. Lisboa: Na Typ. Rollandiana [reed.
em 1803].
1781
[Francisco Lus Ameno (1713-1793)]: Diccionrio exegtico. Lisboa: Of.. Patr. de Francisco
de Luiz Ameno.
Joo de Moraes Madureyra Feyj (1688-1741): Orthographia, ou arte de escrever, e pronunciar
com acerto a lingua portugueza. Lisboa: Na Regia Officina Typografica [3 impr.].
102
Telmo Verdelho
1783
Bernardo de Lima e Melo Bacelar: Diccionario da lingua portugueza... Lisboa: Of. de Joz
de Aquino Bulhoens.
1784
1784-86
Manuel de Sousa / Joaquim Jos da Costa e S (1740-1803): Nouveau dictionnaire FranoisPortugais. 2 vols. Lisboa: Simo Thaddeo Ferreira.
1785
Fr. Francisco de Jesus Maria Sarmento (?): Thesouro biblico ou diccionario historico, e etymologico dos nomes proprios. Lisboa: Na Of. de Simo Thaddeo Ferreira.
1788
1789
1790
Manuel Rodrigues Maia: Diccionrio das elypses, que mais frequentemente se encontram nos auctores clssicos: interpretadas. Lisboa: Of. de Antnio Gomes.
1793
[Academia das Cincias]: Diccionario da lingoa portugueza publicado pela Academia Real
das Sciencias de Lisboa. Lisboa: Officina da mesma Academia.
Diccionario universal das moedas: assim metallicas, como ficticias, imaginarias, ou de conta, e das de
fructos, conchas, &c. que se conhecem na Europa, Asia, Africa, e Amrica. A que se ajunta huma
noticia das Moedas dos Judeos, Gregos, e Romanos; e dois Mappas dos pzos das principaes Cidades de
Commercio; das Medidas dextenso reduzidas a palmos, covados, e varas; e das de capacidade, assim
para secos como para molhados. Recopilado por***. Lisboa: Of. de Simo Thaddeo Ferreira.
1794
103
Joaquim Jos da Costa e S (1740-1803): Diccionario portuguez-francez-e-latino. 2 vols. Lisboa: Na Officina de Simo Thaddeo Ferreira.
Antonio Vieira Transtagano: A Dictionary of the Portuguese and English. Diccionario abbreviado da Bblia traduzido do francez Lisboa: Typ. Rollandiana [2 ed.].
Joaquim do Rosrio: Compendio do Diccionario dos Casos de Consciencia de Pontas. 8 vols.
Lisboa: Simo Thaddeo Ferreira.
1795
1798-99
Frei Joaquim de Santa Rosa de Viterbo (1744-1822): Elucidario das palavras, termos, e frases,
que em Portugal antigamente se usro e que hoje regularmente se ignoram.... 2 vols. Lisboa: Of. de
Simo Thaddeo Ferreira [reeds. em 1865, 1966].
1804
Fr. Joo de Deus (1732-179?): Diccionario historico, juridico, e theologico. Porto: Typ. de Antonio Alvarez Ribeiro.
Fr. Bernardo Maria da Cannecattim: Diccionario da lingua bunda ou angolense, explicada na
portugueza, e latina composto por... Lisboa: Impresso Regia.
1804-06
1805
Fr. Bernardo Maria da Cannecattim: Colleco de observaes grammaticaes sobre a lingua bunda
ou angolense, a que se ajunta dicionario abreviado da lngua conguesa. Lisboa: Imp. Regia.
1806
Nesta sequncia de ttulos avultam cinco aspectos essenciais que haveriam de caracterizar de maneira estruturante a histria dos dicionrios
portugueses ao longo dos ltimos dois sculos:
(a) a renovao da lexicograa latino-portuguesa (Folqman 1755,
Figueiredo 1754 e 1760, Fonseca 1762 e 1771, Pina Cabral 1780);
(b) a emergncia da interlexicograa do portugus com as lnguas
europeias (francs: Marques 1758 e 1764, Silva 1764, Ivo 17784,
Sousa / S 1784-86, Teixeira 1779, S 1794; italiano: S 1773-74;
ingls: Vieira Transtagano 1773);
(c) o despontar de dicionrios especializados em domnios cientcos e tcnicos, sobre a economia, o comrcio, as cincias naturais, a agricultura, as cincias jurdicas e a teologia (Carvalho
1765, Bacelar 1784, Francisco Sarmento 1785, Pedro Sarmento
104
Telmo Verdelho
105
106
Telmo Verdelho
107
108
Telmo Verdelho
A procura e o uso deste dicionrio devem ter-se intensicado no Brasil, por iniciativa da Editora Empresa Literria Fluminense de A. A. da
Silva Lobo, que tinha sede no Rio de Janeiro e que promoveu tambm a
8 edio em 1889. Diz o editor, na nota introdutria desta Nova edio
revista e melhorada:
Fmos ns que ha onze annos, ao comearmos a nossa casa no Brazil, ahi levmos o Moraes,
collocando cinco sextas partes do total da 7 edio, que um nosso amigo fazia em Lisboa a esse
tempo.
10. Acompanhando a democratizao da escrita e da leitura, os dicionrios foram alargando o seu espao de recepo e de difuso at se tornarem hoje um instrumento de uso quotidiano, indispensvel no relacionamento das sociedades. So uma condio de civilizao.
O primeiro dicionrio prtico portugus, procurado pelo pblico e
muito divulgado, foi um dicionrio bilingue de francs-portugus, acima
referido (Ivo / Paiva 1786). Era um volume manual in 8 que ter comeado
a publicar-se pelos anos de 1770 e que teve um assinalado sucesso editorial, com tiragens numerosas, no dizer dos editores. Teve uma edio,
que se dizia stima, em 180316. Oferecia-se com a aparncia de um livro
funcional, gracamente aligeirado, utilitrio e certamente menos dispendioso do que outros de volume semelhante. Transcreve-se a portada da
edio de 1786, que se dizia 5:
Novo Diccionario Francez e Portugues, composto segundo os mais clebres diccionarios e enriquecido de muitos
termos de medicina, de anatomia, de cirurgia, de farmacia, de quimicia [sic], de historia natural, de botanica, de
16. Os applausos com que o pblico tem recebido, e approvado este Diccionario todas as vezes que tem sahido luz, a grande estimao que delle fez, a brevidade com que seis edies to numerosas se consummiro, tudo isto prova bem evidentemente a sua bondade e merecimento (Aviso, texto introdutrio da
7 ed.).
109
mathematica, de marinha, e de todas as outras artes e sciencias, notavelmente corrigido, emendado, e addicionado
com hum sem numero de termos, e locues, e algumas frazes em ambos os idiomas. Quinta Edio. Lisboa: Na
Officina de Filipe da Silva e Azevedo. Anno M.DCC.LXXXVI.
110
Telmo Verdelho
111
112
Telmo Verdelho
113
114
Telmo Verdelho
tigao que recorrem tecnologia computacional e que oferecem na Internet a informao elaborada. Entre outros, merecem boa lembrana, o
Corpus do Portugus (Davies/Ferreira 2006) que d acesso a uma base de
dados com mais de 45 milhes de palavras, permitindo acesso fcil a todas as formas contextuadas com as respectivas concordncias22.
Especial meno devida ao Tesouro Medieval Informatizado da Lingua Galega (TMILG), promovido pelo Instituto da Lingua Galega (Santiago
de Compostela) e dirigido pelo Prof. Xavier Varela Barreiro. Trata-se de um
trabalho lolgico feito com rara sistematicidade e com recorrida acribia.
Alm da fruio literria dos textos, acrescenta um tratamento computacional que faculta acesso a todas as formas ocorrentes oferecendo-se
como o mais importante recurso paralexicogrco, presentemente disponvel, para o estudo do portugus antigo.
22. Transcreve-se a informao fornecida pelos autores: O Corpus do portugus foi generosamente patrocinado pela US National Endowment for the Humanities (2004-06). O projeto do corpus foi concludo no vero
de 2006, mas a interface, a anotao/etiquetagem e a arquitetura do corpus ainda esto sendo modicados. Tambm recebemos um apoio muito generoso de nossas respectivas universidades: Brigham Young
University (Mark Davies) e Georgetown University (Michael J. Ferreira).
115
117
0. introducin
O galego fundamental: dicionario de frecuencias o ttulo da mia
tese de doutoramento presentada na Universidade de Santiago de Compostela (Bugarn 2007)1. Anda que o obxectivo inicial era o establecemento do lxico galego fundamental, a magnitude do traballo, as limitacins
humanas, cronolxicas, tecnolxicas, etc. levaron a acoutar o campo de
traballo ao lxico galego de frecuencia, un dos dous elementos base para
a construcin do lxico fundamental.
A denominacin de Dicionario de frecuencias vn dada pola presentacin das formas obtidas do corpus, xa que foron agrupadas baixo o seu
lema correspondente.
Agradzolle ao Dr. Manuel Gonzlez Gonzlez a oportunidade que me brindou ao darme a coecer esta
lia de investigacin, os seus nimos e a direccin da tese.
118
membro dunha comunidade debe coecer para establecer unha comunicacin elemental.
Pero, como se chega ao establecemento do lxico fundamental dunha
lingua? Xeralmente na construcin do lxico fundamental adoitase recorrer combinacin do lxico de frecuencias e do lxico de dispoibilidade. Do primeiro extrense as formas mis usadas polos falantes mentres
que o segundo proporciona aquelas palabras que os falantes actualizan
de modo mis espontneo a travs de estmulos axeitados, anda que non
alcancen unha determinada frecuencia.
119
moi frecuentes por posuren moitas acepcins mentres que outros son
raros por apareceren en contextos de uso demasiado especializados ou
tcnicos. nde establezamos o corte far que o dicionario sexa de tipo bsico ou escolar, por exemplo, onde deben estar recollidas as formas mis
usuais, fronte a outro concibido coma un tesouro da lingua, xa no outro
extremo, onde se pretende recoller todo o lxico desa lingua.
(4) Outro campo de aplicacin o da recuperacin de pacientes con
perda ou problemas de fala. Cando tratamos de dicir unha palabra que
sae do noso campo de lxico habitual e frecuente adoitamos atoparnos
con certas dicultades chegando a tela... na punta da lingua. Ese fenmeno, anda que mis agravado, afecta a persoas afsicas. Neste grupo
tamn poderiamos inclur as persoas con dicultades na lectoescritura.
(5) O galego, como o resto das linguas, debe incorporarse ao mundo
das novas tecnoloxas para poder ser til aos seus falantes. Entre as sas
mltiples aplicacins centrmonos, por un instante, no desenvolvemento
de recoecedores de fala. Hoxe en da o home pode establecer dilogos
coas mquinas para que as elas leven a cabo as tarefas para as que foron
concibidas. As e todo, as comunicacins adoitan producirse en medios
que non estn exentos de rudos e interferencias. Se a mquina dispn de
ferramentas como listaxes de lxico acompaadas de datos estatsticos
de frecuencia de uso pode chegar a recompoer aquelas mensaxes dubidosas grazas lxica matemtica.
(6) Se seguimos dentro do campo informtico, o deseo de xogos tamn necesita dunha ferramenta de apoio que indique os distintos niveis
de frecuencia e, coa mesma, de proximidade ou afastamento do xogadorfalante fronte aos vocbulos-xogo. Un clsico Aforcado en soporte electrnico, por exemplo, ten que posur distintos niveis de dicultade e non
errar neles se quere ter xito e non perder o xogador xa no nivel principiante por exceso de dicultade.
120
121
2.
Quixera agradecer o apoio prestado polo Dr. Antn Santamarina, con quen tiven a sorte de traballar durante seis anos no seu equipo de Lexicografa, no Instituto da Lingua Galega. Unha parte importante dos
textos manexados neste corpus proceden do seu proxecto Base de datos lexicogrca do galego moderno.
122
123
124
3.2. Resultados
3.2.0. Introducin
Un corpus informatizado coma este permite distintas vas de consulta:
(a) polo lema:
ABANDONO
s.m.
abandono
66
s.m.
abandonos
s.m.
abandoo
2
suma: 69
abandono
66
v.
abandono
6
suma: 72
125
1,45% NON
0,59% SEU
3,76% E
1,28%
0,58% HABER
3,74% DE
1,19% A (prep.)
0,56% ESTAR
3,09% DO
0,94% EN
0,54% DICIR
0,83% TER
0,53% FACER
0,78% PARA
0,53% ME
1,89% UN
0,71% POR
0,52% MOITO
0,69% O (pron.)
1,56% NO
0,64% LLE
0,51% TODO
1,48% SE (pron.)
0,63% IR
0,50% OU (conx.)
(2) Outra lista que incle, seguindo unha orde alfabtica, o lema
coas sas ocorrencias, as como a(s) categora(s) diferenciada(s)
xunto coas cifras tanto da(s) ocorrencia(s) como do total de formas
agrupadas baixo ese lema.
126
CARO
adx.
cara
23
adx.
caras
11
adx.
carsemo
adx.
carsimas
adx.
carsimo
adx.
carsimos
adx.
caro
54
adx.
caros
11
suma: 72
127
Da observacin dos cen lemas mis frecuentes no idioma galego pdense tirar, entre outras, as seguintes conclusins:
128
3.
port.
cast.
cat.
fr.
prov.
it.
rom.
o (art.)
o-a
el - la
el - la
le - la
lou - la
il -la
de
de
de
de
de
de
de
di + da
i (conx.)
que
un
que
el - ea
(pron.)
en
que
tre
avea
un
ser
en
un
et
essere
n (prep.)
a (prep.)
um
que
(conx.)
un
che
un
que
(pron.)
se
se
avoir
stre
un
fi
interesante comprobar que os adverbios mis habituais fan referencia situacin cronolxica ou locativa. Esas referencias revlanse como un motivo habitual en calquera producin lingstica reexo dunha
necesidade de concrecin situacional no tempo ou no espazo.
129
gal.
port.
cast.
cat.
fr.
prov.
it.
rom.
ser (v.)
no
ser
ser
il
soun
si
se (pron.)
que
(conx.)
a (prep.)
su
anar
ne
se
(pron.)
in
s (conx.)
10
se (pron.)
com
haber
haver
que
(conx.)
av
non
nu (adv.)
11
non
lhe
con
no
je
dins
avere
la (prep.)
12
por
ter
un
pr
con
pe (pron.)
13
con
seu
por
per
se
en
per
al (art.)
14
para
em
yo
en
qui
faire
lo
care
(pron.)
15
ter
para
este
amb
mi
mai (adv.)
16
o (pron.)
me
no
fer
ce (pron.) tout
suo
din
17
lle
dizer
todo
com
en (prep.) mai
quello
ca (conx.)
18
este
por
como
me
dans
coume
gli
eu
19
ir
eu
ms
seu
son
sus
fare
ce (pron.)
20
seu
mais
para
dir
vous
em
tutto
c (conx.)
21
haber
mas
estar
li
pour
mai
ma
acest
22
estar
como
tener
ms
on
me
dire
putea
23
me
estar
ir
hi
plus
vire
tu
24
dicir
ir
ese
tot
nous
dire
piu
cel, cea
25
facer
haver
hacer
tenir
par
moun
io
face
26
moito
meu
otro
ell
me
i (pron.)
mio
pentru
27
mis
(adv.)
ele
poder
ne (pron.) mais
veni
questo
cnd (adv.)
28
todo
ver
pero
si (conx.)
sur
ana
altre
noi
29
ou
fazer
decir
per
tout
bu
come
dar (conx.)
30
como
muito
aquest
le (pron.)
en
egli
ntre
31
ese
todo
ver
poder
pouvoir
toun
ne
32
pero
ja
mi
estar
faire
se (conx.)
potere
tot
33
outro
dar
sin
altre
dire
aquu
vedere
voi
34
el
saber
aquel
aquell
mon
vous
lui
da
35
eu
querer
hombre
ja
comme
quand
vi
vedea
36
xa
outro
ya
veure
avec
pas
volere
prin (prep.)
37
poder (v.)
sem
vida
ho
bien
te
om
38
se (conx.)
poder
dar
saber
lui
i (adv.)
se
cum
(conx.)
39
dar
homem
sobre
voler
en (pron.) u
sapere
mare
40
meu
este
si
quan
tu
iu
poco
veni
41
tamn
esse
cuando
perqu
noun
stare
aa (adv.)
130
gal.
port.
cast.
cat.
fr.
prov.
it.
rom.
42
vir
quem
mismo
jo
ou
nous
cosa
numai
(adv.)
43
cando
aquele
dos
si
grand
andare
nici
(conx.)
44
saber
casa
nuestro
donar
leur
ounte
venire
dup
(prep.)
45
ver
vir
vez
home
voir
tant
anche
zice
46
porque
bem
mucho
qu
cela
voul
perch
spune
47
ben
nem
grande
cosa
poud
me
ti
48
mesmo
tu
molt
sans
bon
ci
dac
49
ano
tempo
ento
entre
passar
savoir
autre
cosi
trebui
50
despois
palavra
da
senyor
monsieur
entre
quale
su
51
as
olho
querer
deux
tu
senza
dect
52
querer
quando
poco
te
moi
bn
ti
doi
53
pois
onde
muy
ara
notre
teni
tanto
meu
54
nos
algum
tan
tornar
mme
ac
due
unul
(pron.)
55
aquel
ficar
porque
fins
(prep.)
vouloir
sant
dovere
iar
56
dous
mesmo
usted
ni
non
nostre
parlare
tot
57
che
vida
ni
grand
giorno
lua
58
vez
at
uno
sense
tout
tms
parere
acel
59
da
ou
creer
dia
venir
diu
ora
zi
60
levar
vez
primer
meu
trs
amour
trovare
ochi
61
sen
assim
llegar
casa
encore
fal
qualche
nostru
62
bo
deixar
tiempo
tan
petit
long
quando
acum
(adv.)
63
aqu
entrar
mujer
deixar
cop
dare
parte
64
agora
isso
ao
venir
homme
dous
sentire
domn
65
pr
to
algn
dos
quelque
plus
tu
unde
66
onde
primeiro
parecer
mateix
peu
pii
uomo
ns
67
pasar
so
hasta
trobar
devoir
canta
mai
sau
68
casa
tambm
espaol
semblar
falloir
jour
cui
mn
69
pouco
tu
mundo
any
jour
ome
ancora
apoi (adv.)
70
coma
coisa
vivir
arribar
donner
souto
occhio
spre
(prep.)
71
chegar
conhecer
pasar
gran
aussi
lu
guardar
bine (adv.)
72
tempo
dia
casa
bo
autre
aqu
mano
trece
73
galego
dois
despus
pensar
dont
man
parola
loc
131
gal.
port.
cast.
cat.
fr.
prov.
it.
rom.
74
entre
ouvir
saber
mig
te
crida
chi
a(i)-ci
(adv.)
75
al
pai
siempre
nos
aller
mstre
grande
atunci
(adv.)
76
algn
pensar
cosa
encara
oui
vii
amare
pn (prep.)
77
si (adv.)
sentir
hablar
ull
rien
quau
mettere
cap
78
nin
passar
desde
mai
quand
jouine
parte
an
79
anda
tempo
sino
parlar
si (adv.)
ri
poi
sub(t)
(prep.)
80
primeiro
corao
donde
tot (adv.)
premier
soulu
quanto
bun
81
sobre
(prep.)
mo
nuevo
aix
mme
vostre
sempre
rmine
82
seor
olhar
tambin
sentir
trouver
car
vecchio
sta
83
chamar
te
slo
entrar
heure
tres
ogni
altul
(pron.)
84
grande
velho
pueblo
pas (adv.)
croire
vers
tempo
vreme
85
falar
ainda
ahora
tant
prendre
encaro
prendere mult
86
tanto
ano
mano
sortir
votre
saupre
dio
pune
87
cousa
hora
mil
hora
moins
rn
signore
singur
(adx.)
88
ata
nada
tres
on
bon
snse
vita
urm
89
parte
pouco
llevar
obrir
celui
blanc
pensare
ncepe
90
deixar
sobre
bien
vegada
temps
ne
primo
lsa
91
home
noite
dejar
posar
chose
uei
tuo
ct
algun
paure
certo
prea
92
noso
paixo
ojo
93
pois
encontrar sempre
alors
plen
solo
via
94
nada
senhor
salir
vida
vie
passa
molto
peste
(prep.)
95
te
grande
quien
aix
toujours
toumba
pmnt
96
quedar
porta
nada
damunt
femme
ansin
voi
uita
97
ti
sim
pensar
mirar
parler
ni
allora
trei
98
sempre
al
aqu
temps
donc
terro
amore
mult
99
medio
aqu
poner
sobre
entre
courre
bene
tot
100
andar
parecer
sentir
entre
jamais
aigo
casa
vorb
tout
O artigo manexado incle tres veces a forma tout na columna francesa nas posicins 29, 58 e 92.
132
Se nos achegamos aos datos desde o punto de vista semntico posible establecer unha serie de grupos atendendo a campos nocionais5:
5.
En ocasins algn dos lemas pode aparecer en mis dun grupo xa que a ampla frecuencia est en relacin
directa coa posibilidade de posur varias acepcins.
133
Tempo cronolxico: ano, da, tempo, vez, noite, mes, momento, hora,
sculo.
Ser humano: seor, home, muller, xente, neno, mozo, grupo, rapaz,
sociedade, don, persoa, vello, vecio, amigo.
Familia. Este campo est moi relacionado co anterior e case funcionando coma un subcampo: llo, pai, irmn, nai, to. Hai que inclur aqu tamn home esposo, muller esposa, neno llo, mozo
noivo, rapaz llo e vello av.
Espazo e medio fsico: casa, parte, auga, terra, lugar, mar, mundo,
camio, zona, illa, lado, monte, situacin, campo, cidade, sitio.
Outros campos que ocupan un lugar importante nesta listaxe son
os referidos ao corpo humano (ollo, cabeza, corpo, lingua), aos alimentos (auga, vio, pan), s relacins laborais (traballo, obra, producin, sistema, empresa), poltica (pas, estado, lei, pobo, goberno),
aos sentimentos (verdade, amor, medo), relixin (deus, igrexa).
Os campos nocionais documentados permiten armar que o mundo
xira ao redor do ser humano, que se describe a si mesmo fsica e psicoloxicamente, que se sita no espazo e no tempo, e que se organiza socialmente.
(b) Os cen adxectivos mis frecuentes:
134
135
6.
Na lista dos cen adverbios a aparicin do smbolo (+) indica que a palabra remata en mente. Esta solucin
veu motivada por razns de espazo.
136
7.
Neste traballo non foron eliminados aqueles castelanismos que o autor usa inconscientemente coma se
fose palabra galega: carretera, jueves etc. Estes casos adoitan rexistrarse maioritariamente nos traballos
que recollen material oral, rexistro non-formal.
137
4. conclusin
A travs desta breve exposicin quixemos dar a coecer o Galego fundamental. Dicionario de frecuencias, sen deixar de lado o corpus-base e a
informacin que del se pode extraer. Cando afrontamos o traballo de investigacin o obxectivo que se persegua era, en suma, contribur ao mellor coecemento da vitalidade do lxico da lingua galega, as como poder
establecer un punto de partida slido sobre o que basear a elaboracin de
material didctico nos distintos niveis educativos, a extraccin de datos
tiles para o desenvolvemento de ferramentas de enxeara lingstica e
de tecnoloxas da fala, etc. Se o conseguimos, anda que s fose por encetar novos camios, dariamos por bo o presente labor.
138
139
140
tos, etc.). Esta disposicin detallada habilita a posibilidade de realizar consultas sobre a totalidade do documento (noticia) ou sobre unha unidade
estrutural concreta (titular, resumo, p de foto ou corpo). A codicacin
incle ademais a marcacin de fragmentos que aparecen nunha lingua
distinta do galego as evitamos indexar eses fragmentos e impedimos
que engorden os datos totais do corpus no referente a nmero de palabras
e tamn que se poidan realizar buscas sobre eles, os poemas, as entrevistas, as tboas, as frmulas, etc.
Sobre este conxunto de formas grcas posible facer buscas de palabras ou expresins en xeral, por tipos de texto, pocas, reas temticas
ou calquera combinacin dos parmetros anteriores. Proximamente contamos con poer na rede unha nova versin do CORGA que, ademais de
chegar aos case 20.000.000 de formas, engade un novo sistema de consulta
da nmina de autores e obras que permite buscar que obras ou autores
estn no corpus, saber que nmero de palabras totais e documentos corresponde busca realizada ou que cantidade de palabras contn o CORGA nunha certa rea temtica, perodo de tempo, etc.
Por exemplo, se buscamos unha forma como abreconcertos nos xornais que tean como rea temtica principal economa e poltica, nos resultados da consulta, cando se nos ofrece o nmero de oracins e documentos atopados de todo o corpus, podemos visualizar o nmero de palabras e
documentos que cumpren as condicins esixidas na consulta inicial.
Somos conscientes, sen embargo, de que para facer buscas mis
avanzadas imprescindible que os textos do CORGA estean lematizados
e etiquetados, e levamos xa algns anos traballando nesta direccin, e
aqu, cando falamos de etiquetacin, debemos aclarar que entendemos
esta como o proceso mediante o cal a cada unidade lxica se lle asigna un
lema e unha etiqueta. En concreto, no Centro Ramn Pieiro para a Investigacin en Humanidades desenvlvese paralelamente construcin do
CORGA un proxecto denominado Etiquetador e lematizador do galego actual destinado precisamente a lematizar e etiquetar os textos de CORGA,
ao que internamente coecemos como XIADA, e sobre o que imos centrar
este traballo tal como nos solicitaron os organizadores deste volume.
hora de abordar a construcin dun analizador e etiquetador cmpre
atender as seguintes frontes:
(1) Determinacin dun sistema de etiquetas.
(2) Deseo da estrutura do lexicn e construcin deste.
(3) O preprocesador.
(4) O etiquetador.
141
Tipo
d-Determinado
Artigo
(D) 1 i-Indeterm. 2
Adverbio n-Nuclear
(W) 1 m-Modificador
a-Nucleo e
Modificador
r-Relativo
g-Int.-Exctivo 2
Conxuncin c-Coordinante
(C) 1 s-Subordinante 2
Preposicin
(P) 1
Verbo
(V) 1
3
3
Xnero
Nmero
0- Non
aplicable
0-Non
aplicable
Adxectivo
(A) 1
Substantivo c-Comn
(S) 1 p-Propio
Categora
e- Plural
n-Neutro
m- Masculino
f- Feminino s- Singular
a- Masculino p- Plural
e- Feminino a- Singular
Grao
Persoa
s- Superlativo a-Primeira e
Terceira
0-Non
0-Non
aplicable
aplicable
1-Primeira
2-Segunda
c- Comparativo 3-Terceira
e-Pretrito
p-Presente
i-Copretrito
l-Antepretrito
f-Futuro
x-Xerundio
Caso
Tempo verbal
Modo
Posuidor
a-Singular
e Plural
p-Plural
i-Indicativo
s-Subxuntivo
m-Imperativo
f-Infinitivo
s-Singular
l-Acus./Dat.
n-Nominativo
a-Acusativo
d-Dativo
i-Impersoal
p-Preposicional
r-Nom./Prep.
Modo
a-Determinante
e non Determ.
n-Non
Determinante
d-Determinante
142
Eva M Domnguez Noya
5
3
4
Posesivo
(M)
1
Indefinido
(I)
1
c - Cardinal
Numeral
(N)
1 o - Ordinal
t- Tnico
Pronome
(R)
1 a - tono
f- Frmula
Categora
a- Abreviatura
Perifrica
(Z)
1 g- Sigla
s- Smbolo
o- Outros tipos
2
Sinal de
puntuacin
(Q)
1
Interxeccin
(Y)
1
Exclam./ Interr
(G)
1
Relativo
(T)
Demostrativo
(E)
1
143
144
Como se pode observar no tagset de XIADA que acabamos de reproducir (dispoible en http://corpus.cirp.es/xiada), na primeira columna recllense as categoras gramaticais e as letras coas cales as
denominamos:
Adverbio
Adxectivo
Artigo
Conxuncin
Demostrativo
Exclamativo-Interrogativo
Indenido
Interxeccin
Locucin
Numeral
Posesivo
Preposicin
Pronome
Relativo
Sinal de Puntuacin
Substantivo
Verbo
Categora Perifrica
W
A
D
C
E
G
I
Y
L
N
M
P
R
T
Q
S
V
Z
145
1.
2.
Segmento inicial do lema sen desinencia se esta recorrente. Por exemplo nen.
3.
Denicin e caracterizacin morfolxica da forma obxecto de anlise sempre e cando estea completa e
non a enviemos a ningn grupo derivacional.
146
Conxuntos de desinencias para as que se proporcionan uns valores. Por exemplo o grupo G1 consta de:
o: masculino singular
a: feminino singular
os: masculino plural
as: feminino plural
Deste xeito, para todos os substantivos e adxectivos que rematan en -o, fan o feminino en -a e forman
o plural engadindo -s, tipo neno, introducimos s o lema e a raz correspondente, sen necesidade de ter
que inclur completas as formas masculina e feminina cos respectivos plurais.
147
estrutura que empregamos en XIADA a opcin mis rendible a de caracterizar -iu no seu valor de ei3s05 como non normativa no grupo V2 segundo o que se conxugan todos os verbos regulares da 2 conxugacin.
Outro exemplo: os grupos G2 e G3 foron creados para exionar os
substantivos e adxectivos cuxo masculino singular remataba en -n e
facan o feminino en - e -ana respectivamente. A aplicacin da normativa ocial reduce considerablemente o nmero de elementos que van ao
grupo G3 incrementando o G26. Ao igual que suceda cos lemas, debemos
manter as caractersticas dos dous grupos para que o analizador recoeza e caracterice as formas existentes nos textos anteriores normativa
ocial actual pero tamn temos que introducir as modicacins precisas
para que as novas formas normativas sexan recoecidas e analizadas. A
opcin mis intelixente parece ser a caracterizacin das desinencias -ana
no G2 e - no G3, cos respectivos plurais, como non normativas.
interesante e sobre todo til, desde o punto de vista lingstico, diferenciar na estrutura do lexicn mdulos segundo o tipo de lxico que contean e con que poidan ser combinados. Para iso dispuxemos no deseo
da estrutura, e obviamente implementamos na construcin do lexicn,
dun campo mis no que se caracteriza o lema como pertencente ao lxico
comn ou ao tcnico-cientco, especicando neste ltimo o mbito no
que se clasica: administracin, economa, medicina, etc.
Relacionado co punto anterior est a inclusin na estrutura do lexicn
dun indicador que nos marca a procedencia de cada un dos lemas. Nos
textos actuais presntanse formas que non aparecen nos dicionariosvocabularios preceptivos da lingua galega DRAG (1997) e o mis recente
VOLG (2004), ben porque son termos tcnicos para os que se acaba de
propoer unha denominacin, ben porque se documentan cun uso categorial distinto. Non obstante, a sa introducin no lexicn imprescindible para o recoecemento e caracterizacin dos textos. Coa indicacin da
5.
6.
Na normativa ocial anterior seguan o esquema -n / -ana (as races e lemas destas formas remitanse
en XIADA ao grupo de derivacin G3), mentres que na actual se acomodan ao esquema -n / - (debemos
remitir as races e lemas ao grupo de derivacin G2) as formas seguintes: afgn, alazn, alemn, barregn,
bosquimn, capitn, cataln, ermitn, escribn, gardin, musulmn, run, sancristn, sultn e trun.
O G2 consta das seguintes terminacins, que caracterizamos formalmente como:
n: masculino singular
ns: masculino plural
: feminino singular
s: feminino plural
ana: feminino singular (*)
anas: feminino plural (*)
148
LEMAS
RACES
FORMAS
Adverbio
1.906
1.916
1.916
Adxectivo
13.574
13.625
44.899
Substantivo
28.806
28.943
62.074
Verbo
6.690
9.113
367.220
3. preprocesador
Lingisticamente, unha vez elaborados os modelos formais que van
acoller as races e grupos de derivacin e implementado o lexicn computacional, estamos en disposicin de etiquetar automaticamente calquera texto galego contemporneo. Trtase simplemente de executar o
149
150
151
4. etiquetador
Antes de que se poida empregar un etiquetador automtico estatstico, como o caso, necesario adestralo desambiguando manualmente
un subconxunto de textos. Obviamente canto maior sexa o volume de
textos que se desambigen man mis probabilidades hai de que acerte
o etiquetador. O noso obxectivo, ademais, que, fronte ao 95/96% de acerto que presentan os etiquetadores existentes para o ingls para o galego
non hai estatsticas, o noso etiquetador alcance un acerto do 99%.
A utilizacin do preprocesador e do etiquetador automtico vainos
resultar til para atender das frontes: por unha banda, revisar as anlises obtidas automaticamente e, pola outra, tomar nota das formas descoecidas para mellorar o seu funcionamento e incrementar o lexicn
computacional.
Esperamos que proximamente sexa posible consultar tanto o lematizador e o etiquetador en rede como un subcorpus de CORGA lematizado
e etiquetado.
152
153
Desde a sa creacin en 1971, unha das principais lias de investigacin do Instituto da Lingua Galega (ILG) da Universidade de Santiago de
Compostela foi a recolleita sistemtica do galego oral tanto na Galicia
administrativa como nas comarcas estremeiras do Eo-Navia (Asturias), O
Bierzo (Len) e As Portelas (Zamora), onde o galego tamn lingua propia.
Ese material usouse para redactar monografas lxicas ou gramaticais ou para ser cartografado, como ben se pode ver nos volumes editados
do Atlas Lingstico Galego (ALGa), nos de morfoloxa e fontica dos anos
90 e nos volumes lxicos que desde o 2003 se comezaron e publicar e que
en conxunto constituirn unha excelente achega para redactores de dicionarios e doutras obras lexicogrcas.
Cando anda estaba indito, moito deste material oral utilizouse nas
diversas propostas de codicacin morfolxica e lxica realizadas desde
mediados dos anos 70 polo ILG, en solitario ou en colaboracin con outras
entidades, particularmente coa Real Academia Galega. Os paradigmas
verbais da normativa vixente ou os nomes dos das da semana e dos meses do ano, por poer s uns exemplos, son como son en boa parte merc
revelado e posterior interpretacin de fotos do galego oral realizadas
por investigadores do ILG.
Ademais, especialmente desde 1974, diversos membros do Instituto
rexistraron ininterrompidamente etnotextos na prctica totalidade do
dominio lingstico galego, vez que dirixiron traballos acadmicos de
moi diverso tipo onde o material estudado eran mostras orais con unha
ou con mis dunha persoa informante. Estas gravacins, algunhas con
mis de 30 anos de vida, xunto con moitas outras fornecidas por xente
que non do ILG, pero que as depositou al para que estean a disposicin dos investigadores, constiten o esencial do Arquivo do Galego Oral
154
(AGO). Na xnese deste Arquivo est o labor pioneiro de Constantino Garca, fundador do ILG, e tamn o de Antn Santamarina, que nos animaron
a moitos, cando eramos estudantes universitarios, a recoller e traballar o
galego oral.
Nesta presentacin trataremos en primeiro lugar o estado xeral do
AGO e dos traballos e publicacins que del derivaron; e a seguir daremos
unha mostra do aproveitamento lxico dese material.
Unha descricin detallada de cada un dos subarquivos do AGO pode verse en Fernndez Rei (2004a).
155
156
157
San Cosme de Barreiros) ou para redactar traballos de cursos de doutoramento en que se analizaban aspectos da oralidade das parroquias dun
concello (O Grove, A Estrada, Padrn, Vilardevs). Son investigacins xeralmente cunha ampla escolma de textos orais transcritos, sempre con
mostras de diversas xeracins acompaados dun glosario ou dun estudo
fontico e/ou morfolxico ou das interferencias.
Aproximadamente un terzo deste inxente material est transcrito e/
ou comprobado acusticamente para chalo tematicamente, pero s unha
parte das transcricins se informatizaron. E este subarquivo dos 90, anda
que de xeito intermitente, seguiu aumentando con etnotextos rexistrados nos comezos deste milenio.
158
159
Con material dos anos 90 realizronse diversos traballos de investigacin dirixidos por membros do proxecto do AGO, tal como mis arriba se
dixo, vez que profesorado do ILG utiliza etnotextos (ditos e inditos) e
gravacins en rexistro formal para as prcticas de galego oral nas clases
con alumnado de titulacins de Filoloxa e de Ciencias da Comunicacin;
e algns artigos publicados recentemente derivan, en maior ou menor
medida, de material de etnotextos do AGO, como son Fernndez Rei / Hermida Gulas / Tato Plaza (2004) e Fernndez Rei (2004b, 2005, 2007).
Ademais, o material usouse para moi diversas nalidades: hai anos
algunha actriz do Centro Dramtico Galego acuda ILG para escoitar
gravacins de falas occidentais con gheada e seseo para preparar a sa
personaxe, de igual xeito que alumnado universitario acode a consultar
material para traballos academicamente dirixidos ben lingsticos, ben
etnogrcos, como foi neste caso un sobre as costureiras presentado no
2006 na Facultade de Ciencias da Comunicacin.
A publicacin mis salientable (e ata o momento a de maior utilidade
e difusin) feita con material dos tres subarquivos de etnotextos do AGO
foi o audio-libro A nosa fala. Bloques e reas lingsticas do galego, edicin
preparada polos autores deste traballo para o Arquivo Sonoro de Galicia
do Consello da Cultura Galega (Fernndez Rei / Hermida Gulas 1996), do
que, ademais de distriburse en libraras, se xo unha edicin que se lles
regalou s 700 persoas que participaron no congreso dos 25 anos do ILG
en setembro do 1996. Na 2 edicin, de 2003, as tres casetes con tres horas
de gravacin foron substitudas por tres CDs; e no 2004 fxose unha versin electrnica do libro e dos textos orais para consultar libremente en
Internet (www.consellodacultura.org/arquivos/asg/anosafala.php), que
no 2005 tivo mis de 15.000 consultas.
Nesa obra guran textos de diversas pocas e diversas xeracins nos
que se pode apreciar a variedade dialectal do galego e vez se d unha
mostra de como somos e de como estamos no mundo ns outros, os galegos. Como dica Filgueira Valverde no limiar dese audio-libro, os textos
teen non s interese como documento lingstico senn tamn como
testemuos da vida mesma: trxicos unhas veces, festivos outras, intranscendentes outras, pero sempre engaiolantes (Fernndez Rei / Hermida Gulas 1996: 7).
Na transcricin das gravacins de A nosa fala procurouse un compromiso entre a claridade necesaria para que un non lingista poida ler
os textos e o rigor preciso para fornecerlle a un lingista a maior informacin fontica e fonolxica posible. Tomouse como base a normativa
vixente da lingua galega que elaboraron o ILG e a RAG, pero cunha serie
160
de particularidades relativas abertura das vogais de grao medio, representacin da gheada e do seseo e outros fenmenos relevantes do galego
oral (Fernndez Rei / Hermida Gulas 1996: 11-15).
161
2.1. Entradas
En funcin da sa relacin co lxico considerado estndar, fundamentalmente o contido no VOLG, as palabras dos textos que non se inclen
no GDXL poden ser variantes ou derivadas dunha forma comn ou ben
lemas totalmente novos.
Entre as variantes fonticas ou morfolxicas dunha forma comn
podemos salientar voces como rastear (<rastrear), rosucitar (<resucitar),
rtolo (<rtulo), robanda (<rebanda), remudo (<remuda), resido (<reso), a
relentn (<a ralent), rar2 (<raer).
Ausentes do GDXL tamn estn formas derivadas doutras comns,
que si teen o seu espazo nesta obra de referencia. Mostras de voces derivadas son a rebolazos, roulada ou rumbante:
rebolazos, a loc. adv. De rebolos, dando voltas: por a escaleir abaixo, un pouco de p, outro
pouc a rebolazos (Calvos-Calvos de Randn3).
roulada s.f. Grupo cunhas caractersticas semellantes: andaban todos na roulada (AmeneiroTeo).
rumbante adx. Rumboso, esplndido, pomposo: non vin fsta tan rumbante coma ela (Campobecerros-Castrelo do Val).
Tamn anotamos palabras que non gardan relacin con ningn dos
outros lemas do dicionario e, xa que logo, son totalmente novas:
raspita s.f. Aparello do cerco, mis pequeno c do cerco de xareta, que se emprega na pesca de
baixura en lugares onde hai pouca auga: raspita tmanse moitos muxes (Fefins-Cambados).
rebisca s.f. Cebo para coller peixes que se atopa no propio ro debaixo das pedras: pa pesca-lo
peixe, hai a rebisca (Friol).
rechinchudo,-a adx. Repoludo, gordo e ancho por demais: i-ra gorda i rechinchuda, de gorda
xa regaou (Calvos-Calvos de Randn).
relento,-a adx. Pousado, lento: o corazn simpre, relento, triste (Mourelle-A Pastoriza).
represar v.t. Reprender, recriminar: quedaron amigos, el non represou a mullr (A Gudia).
Neste caso a forma de referencia, raer, non contn o signicado que nos textos ten rar tensar o aparello
para metelo a bordo: rar chammoe ns metlo a brdo, o aparello (Cambados).
3.
Indicamos o lugar e o concello da gravacin, ags cando ambos tean a mesma denominacin.
162
2.3. Signicados
No campo do signicado onde a contribucin dos textos mis salientable. Entre as novas acepcins detectadas aparecen as seguintes:
rabuar v.i. 1. Tocar un obxecto facendo un rudo semellante que se realiza espetar con forza
as uas: xa don Climente taba rabuando prta (Friamonde-A Estrada).
raiar v.i. 2. Limitar: estn a raiando a con Portugal (Lubin)6.
rebumbio s.f. Importancia, dimensin: vend o rebumbio qu a cousa iba tomando (FriamondeA Estrada).
recaer v.i. Pasar por, acudir a: Vaite mirar a ver se recaeron por al teus irmns (Ameneiro- Teo).
recibir v.i. Comungar, recibir a hostia: fasan unha va cruses resiba, haba comunin (Fefins-Cambados).
reco s.m. Rosada, orballo: o orballo dese, vamos, qu hai pola ma, t ese reco qu hai as
4.
5.
6.
163
(Lubin)7.
reliquia s.f. Obxecto relacionado co culto a un santo ou lugar sagrado que se garda en lembranza dunha visita: unhos santos feitos de masa, ps levaban como reliquias de San Andrs
(Chmparra-Cedeira).
remendar v.t. 2. fig. Curar unha ferida sen moitos coecementos: al un remendeiro, qu asta n
o levaron mdico; remendoull a cabeza (Cabreiros-Xermade).
remendeiro s.m. Curandeiro, mencieiro: levrono non sei pa donde, al un remendeiro, qu asta
n o levaron mdico (Cabreiros-Xermade).
renunciar v.i. Renegar, abxurar: que renunciaban da relighin catlica (Cerdedo)8.
repoerse v.p. Compoerse, amaarse: quedou as todo arruinado. Pro aora foise repoendo
un algo (Cabreiros-Xermade).
resaca s.f. Mar picado e o seu efecto escachar no peirao ou nas pedras do mar ou chocaren
das ondas: ndisa mas a resaca chammose ns mar, cand mar picado (FefinsCambados).
responso s.m. Recitado similar s oracins nos oficios de defuntos: o responso ese que tia entre
San Antonio (Lubin)9.
retraer v.t. Reter, gardar na memoria: a mia memoria vai pasada, non retraio nada xa (Salcidos-A Guarda).
revisar v.t. Inspeccionar: anque non foran cazadores revisronllelas (O Buriz-Guitiriz).
revolver v.t. 2. Toldar: que revlv o ro todo (Caldelas-Tui).
rodeo s.m. Roda, crculo, curro: truxmos o inghiniro aqu. Fixmosll un rodeo (San Xin-O
Rosal).
romeu s.m. 2. Barba de raposo, alga maria: pois ns o romeu chamabmos nha planta, n
esterco (Fefins-Cambados).
rosario s.m. 3. p. ext. Conxunto de cousas iguais que se presentan enfiadas semellando ese obxecto
de culto: rosarios de castaas, cocamos castaas sin pelare lgo despois cunh gulla i fo
formaban un rosario (O Buriz-Guitiriz)10.
run adx. 2. Pobre: o publo run; run pro somos poucos vecios (Sabuguido-Vilario
de Conso).
rula s.f. 1. Aparello elctrico para poxar o peixe: aparatio ltrico que hai, que, chmanlle precisamente a rula (Rinlo-Ribadeo). 2. Lonxa: da rula non teo ms nada que decir (RinloRibadeo).
rumbar v.i. Ruxir, facer rudo: os picos tocaron un no outro, rumbaron (Lindn-Mondoedo).
8.
9.
164
rabioso,-a adx. Moi picante: xa hai algns que pican, xa hai quen os mte mui grandes, que
se faen rabiosos (Caselas-O Rosal) [fronte a que provoca unha sensacin desagradable moi
intensa].
rapar v.t. Cortrlle-las crinas s bestas bravas: mrcanas tdolos anos, na i-anca, rpanas
(Cerdedo) [fronte a cortarlle a la ou o pelo a un animal].
recra s.f. Alimentacin e coidado dun animal comprado anda cra: ta comprando khaulas
metlicas pa, p recra de coello (Caselas-O Rosal) [fronte accin e efecto de recriar; recriar
= continuar criando un animal, proporcionndolle a alimentacin adecuada, para o seu total
desenvolvemento]11.
rega s.f. 2. fig. Chuvia en tempo de sol continuado: aqu o que faa falta, que vira unha rghia,
porqu isti un calor espantoso (Fornelos-O Rosal) [fronte a accin e efecto de regar ou accin e efecto de mollar ou mollarse]12.
2.4. Fraseoloxa
Tocante fraseoloxa pdese salientar, entre outras, a ausencia no
GDXL de dar resultado, nin de risas nin de veras, polo regular13 e retorcer o
pescozo.
165
Verbo de resultar cmpre indicar que en ningn dos dicionarios analizados se fai mencin da existencia do complexo resulta que, que se emprega no comezo ou continuacin das narracins como frmula focalizadora:
resulta qu o utor da estab qu cun amigho (A Chan-Cotobade).
3. remate
O Arquivo do Galego Oral existe merc xenerosidade de milleiros
de galegofalantes que doaron as sas voces e xenerosidade de moi diversas persoas que percorreron o dominio lingstico galego para facer
gravacins in situ e que algunhas, ademais, realizaron o traballo, moitas
veces ingrato, de transcribilas.
14. No Estravs (1995) recllese o valor adverbial e tamn a locucin adverbial co primeiro signicado.
15. Para os dicionarios posteriores a 1980 pode verse Santamarina (2003c: 32-35).
166
167
168
169
170
171
172
173
guapa. [Vaca] ben feita. Llpiz recolle Guapes son les vaques como desdn feminino a un piropo.
ngoa / ncoa. Postema que sale en la regin inguinal. Muchas veces se confunde con la fgoa
que es llaga purulenta. Llpiz recllea en Muras de Eume. ngoa branca, Deus te desfaga; ngoa negra,
Deus te detea; ngoa rbea, Deus te consuma (rezuma). // ncoa forca foi a (en) Roma; forca veu e ncoa non.
ncoa forca! e define ncoa como incordio, adenitis (Llpiz 1954a: Medicina, 171). Os dicionarios
definen estas palabras como unha simple rexin corporal.
ixola. Habilidade do feirante para mercar barato, vender caro e desfacerse das maulas. A ixola a
nai do choio (Llpiz 1954a: 2,14).
larchn. Tratante de gando. Ao mis larchn / latarego, mis logo danllun pego (Llpiz 1954a: 2,4).
Podera ser que este valor semntico que anota Llpiz fose unha derivacin feita polos criadores
de gando (sempre rivais dos tratantes de gando) a partir dos significados que para esta palabra son
mis comns: folgazn e tragador de bienes de otros que recolle Anbal Otero.
latrica. Pltica, sermn. Pregaria nun deserto, latrica perdida. Recollido do sacerdote Nicanor Durn
(Llpiz 1954a: Culto religioso, 582,132).
lomba. Lombo. Boi cadeirudo e de lomba ancha, ao seu dono saca da lama (Llpiz 1954a). A palabra lomba
aparece nos dicionarios como corcova, lombo cando ten prominencias pero refrese sempre a
persoas, non s bovinos que, non sendo de raza Holstein, teen diversas prominencias.
174
175
176
1.
177
178
179
180
2.
Facer vnculos e casas. Recordade, que inda tempo, Non vos metades en chanzas, que os valentes e o
bon vio, Como dicen, logo acaban. Qu ha de darvos ese crego? Qu caudillo o que vos manda? Un
escribano? vergonza E que haxa quen tras del vaia. Pode que tea valor, Como tamn faramalla, Pero n
un escribano Sin opinin e sin fama. De esta xente solo salen Enredos, preitos e trampas. Foron a peste
da terra E os ladrs da xente honrada. Queredes saber por qu Contra as leises se levanta? Porque antes a
escribana De Burn daba ganancias. (Poema s insurrectos de Burn (23.1.1823)).
181
182
183
0. introducin
Froito dos traballos do Observatorio de Neoloxa da Universidade de
Vigo1, en 2005 publicamos unha obra lexicogrca que denominamos Novas palabras galegas (Lpez Fernndez et alii 2005) e que reecta a vitalidade (Cabr 2000, Gmez Clemente / Rodrguez Guerra 2003a) na creacin
de palabras que tia a lingua galega. Nun anterior artigo xemos unha
pequena descricin desta obra (Gestido de la Torre / Gmez Clemente
2003). Recollanse nela creacins lxicas que non estaban nos dicionarios
galegos e que cumpran, polo tanto, un criterio de exclusin lexicogrca.
Os criterios utilizados naquela obra deben ser revisados e ampliados e a
informacin fornecida completada. Nesta contribucin pretendemos:
(a) matizar os criterios de identicacin de neoloxismos utilizados
nos traballos do Observatorio de Neoloxa,
(b) describir unha serie de marcas, algunhas derivadas do criterio
de identicacin e outras complementarias, que debern ser empregadas en futuras edicins do devandito dicionario2, e
1.
Este proxecto comezou en 1998. Nestes momentos faise unha avaliacin dunha serie de fontes en Internet: www.vieiros.com; www.galicia-hoxe.com; www.canalciencia.com; www.anosaterra.com. En setembro de
2006, comezouse a analizar un blog, concretamente o chamado Brtemas de Manuel Bragado. Na base de
datos, neste momento, estn almacenados un total de 12.000 neoloxismos revisados.
2.
Comprbense as marcas nos dicionarios de novas palabras do cataln (Observatori de Neologia 1998) e do
italiano (Adamo / Della Valle 2003). O primeiro utiliza principalmente marcas lexicogrcas (sobre o corpus de exclusin). O segundo incle tamn informacin morfolxica e sintctica sobre os procedementos
de formacin e identica os formantes.
184
Este feito agrvase pola relativa limitacin no nmero de entradas dos dicionarios utilizados no corpus de
exclusin: VOLG (45.000), GDXL (95.000) e GDS XXI (80.000).
4.
signicativo ver como os dicionarios, especialmente os acadmicos, son pouco permeables introducin
de palabras de uso frecuente. As gramticas rexistran anda con menor frecuencia novos formantes que
poderan ser repertoriados nunha determinada lingua. Vxase Freixa / Sol (2003), que nos fornece datos
moi signicativos sobre a relacin da neoloxa catal cos dicionarios normativos nesa lingua.
185
rxense por unha serie de normas que son mis ou menos permeables s
novas creacins lxicas, dependendo do tipo de dicionario que se elabore,
da ideoloxa, da tradicin, etc. Malia constatarmos estes feitos, o criterio
de exclusin lexicogrca ten unha vantaxe, que a da obxectividade na
obtencin dos datos e, dende logo, a facilidade de aplicacin.
2. O criterio temporal, a frecuencia e o criterio psicolxico-pragmtico
Estes tres criterios deben ser considerados conxuntamente porque estn estreitamente relacionados.
a) Criterio temporal e criterio da frecuencia
O criterio temporal basase na constatacin de que unha unidade
lxica leva pouco tempo instalada nunha determinada lingua (velaqu a
cerna do concepto de neoloxismo). Comprbase coas datas de aparicin
dunha palabra nun dicionario ou nun corpus textual para a atribucin
dunha terica primeira ocorrencia nunha determinada lingua. Con respecto a isto temos que dicir que:
Os dicionarios galegos non inclen ningunha referencia a unha
posible datacin da palabra na lingua.
As datas que se poden extraer dos corpora textuais galegos, CORGA e TILG, e da base de datos do Observatorio de Neoloxa deben
ser utilizadas da seguinte maneira para establecer o criterio de
novidade:
Data da primeira ocorrencia. Neste sentido mis til
o TILG por comezar os seus rexistros en 1612. O CORGA
comeza a recoller os de 1975 e a base de datos do Observatorio comeza en 1998. Se consignamos esta primeira
data, temos un dato obxectivo, pero hai que recoecer
que non tarefa doada interpretar cando unha unidade lxica deixa de ser un neoloxismo, cantos anos teen
que pasar para que unha palabra xa non sexa considerada nova (estamos a falar de unidades lxicas non rexistradas en dicionarios). Quizais non haxa unha fronteira
obxectiva, anda que podemos entender que descentralizador, por exemplo, rexistrada en 1977 no CORGA xa non
un neoloxismo. Pero, unha palabra moi utilizada como
represaliar, que se rexistra en 2001 tamn nesa base de
datos, non nos dicionarios, ou non un neoloxismo
186
Rey (1976: 17) defneo as: Le nologisme est une unit du lexique, mot, lexie ou syntagme, dont la forme
signiante ou la relation signiant-signi, caractrise para un fonctionnement effectif dans un modle
de communication dtermin [novidade funcional], ntait pas ralise au stade inmdiatement antrieur du code de la langue [sincrona]. Cette nouveaut, qui doit tre apprcie par rapport une dnition
prcise et empirique du code [novidade pragmtica], correspond en gnral un sentiment spcique
chez les locuteurs [xuzo colectivo]. Selon le modle de code choisi, on distinguira donc des nologismes en
synchronie large et troite, des nologismes pour la langue dans son ensemble ou pour un usage dtermin, des nologismes dans un contexte thmatique spcialis (technique et science) ou non spcialis.
187
6.
Vxase tamn Gardin et al. (1974) e obsrvese a sa metodoloxa baseada en enquisas a un nmero determinado de falantes.
188
c) Composicin patrimonial7
Se os dous elementos que forman o composto estn repertoriados no corpus de exclusin: CN 0.
Se s aparece unha das bases que forman o composto: +CN 1.
Se non aparece ningn elemento repertoriado: +CN 2.
d) Composicin culta8
Os dous formantes estn repertoriados: CN 0.
Un dos formantes non est repertoriado: +CN 1.
Ningn dos formantes est repertoriado: +CN 2.
e) Composicin hbrida9
Se aparecen repertoriadas as bases e mais os formantes:
CN 0.
Se non aparecen repertoriadas as bases: +CN 1.
Se non aparecen repertoriados os formantes: +CN 2.
Se non aparecen nin as bases nin os formantes: +CN 3.
f) Emprstitos10
Se un emprstito est adaptado (A), a CN menor porque
se entende que leva mis tempo na lingua: CN 0.
Se un prstamo est sen adaptar (SA): +CN 1.
Se o emprstito non est repertoriado na lingua orixinal
(LO): +CN 2.
7.
Na composicin patrimonial integramos aquelas palabras que estn formadas por unin de lexemas simples autnomos da lingua e que manteen distinto grao de autonoma.
8.
Entendemos por composicin culta o procedemento polo cal se unen dous formantes de orixe grecolatina.
Os exemplos rexistrados corresponden a neoloxa terminolxica. Non hai unha relacin exhaustiva de
formantes cultos nos dicionarios e gramticas galegas. Isto leva a que se consideren neoloxismos lexicogrcos unidades que poida que estean recollidas en dicionarios especializados que non forman parte do
noso corpus de exclusin e en obras dedicadas ao estudo terico-prctico da terminoloxa.
9.
10. Vxanse os traballos de Rodrguez Ro (1998, 2003) para unha completa relacin dos procedementos de
adaptacin de emprstitos ao galego.
189
190
diamente. A marca GX00 apareceu en cada unha desas entradas para indicar
que estaban nese dicionario. En 2005 incorporamos ao corpus de exclusin
lexicogrca o GDS XXI. O emprego desta obra cando redactamos o dicionario de neoloxismos implicara exclur 550 das sas entradas. Este dato mostra
que a ltima obra citada se elaborou cun criterio aberto aceptacin de novas unidades lxicas que non tiveran entrada noutros dicionarios.
11. Para exemplicar esta informacin xemos unha comprobacin sobre 841 candidatos a neoloxismos do
ano 2005, non rexistrados no corpus de exclusin lexicogrco, con 1334 ocorrencias.
191
[1980-1990] on-line, modelizacin, privacidade, submundo, gay, profesionalizacin, sociopedagxico, arbitrismo, impasse, corresponsabilidade.
[1990-2000] peonalizacin, xenocida, microrrede, aeroxerador, comps, e-mail, chat, recompilatorio, plurinacionalidade, risoterapia.
[2000-2003] alterglobalizacin, xogabilidade, jazzstico, pangaleguismo, eurobarmetro, punch,
supervendas, router, teledermatoloxa, e-learning.
- Frecuencia baixa:
antiobreiro -a 2, apartidista 2, seguidista 5, potenciador -a 4, antinacionalista 17.
(2) Se unha unidade ten unha dispersin temporal ampla, o seu carcter neolxico menor. Se as ocorrencias estn moi concentradas nuns
determinados anos, pdese considerar que mis neolxica:
- Ocorrencias dispersas:
planeamento 54: [1975-1984] 15; [1985-1994] 3; [1995-2004] 36.
- Ocorrencias concentradas:
departamental 58: [1975-1984] 1; [1985-1994] 3; [1995-2004] 54.
perigosidade 40: [1975-1984] 1; [1985-1994] 7; [1995-2004] 32.
plurinacional 51: [1975-1984] 8; [1985-1994] 5; [1995-2004] 38.
192
193
13. Lmbrese o comentado antes sobre a presenza de neoloxismos terminolxicos na nosa base que deberan
ser tratados dunha forma diferente pola sa escasa aparicin nos dicionarios. Ademais, as gramticas
tampouco recollen exhaustivamente os formantes cultos que funcionan na creacin de unidades de valor
especializado.
194
conclusins
O criterio lexicogrco forncenos dunha maneira sistemtica candidatos a neoloxismos. A consideracin dunha palabra como neoloxismo
lexicogrco debe ser matizada coa aplicacin doutros criterios. Os dicio-
195
narios de neoloxismos deben presentarlle ao usuario a maior informacin posible sobre a cronoloxa, a frecuencia (a absoluta e a dispersin
temporal) e os procedementos de formacin das novas unidades, de maneira que poidan estes datos servirlle para formar o seu xuzo sobre a
calidade neolxica dunha palabra. En futuras ampliacins da nosa obra
de 2005 introduciremos esta informacin e esperamos que sexa til para
a comprensin do concepto de neoloxismo.
196
197
1. introducin
Neste artigo presentamos os traballos en lexicografa e terminoloxa
a partir de crpora que se estn a desenvolver na Universidade de Vigo
por parte dos equipos de investigacin do Seminario de Lingstica Informtica e do Observatorio de Neoloxa, que realizan un labor conxunto
orientado creacin de recursos para a lingua galega no marco do grupo
TALG (Tecnoloxas e Aplicacins da Lingua Galega). Neste traballo explicaremos as caractersticas dos crpora CLUVI e CTG, que constiten a fonte
destes traballos, a metodoloxa seguida para a elaboracin do Dicionario
CLUVI Ingls-Galego e do Banco de Datos Terminolxico da Universidade
de Vigo, as como os resultados obtidos ata o momento e as tarefas que
estamos a realizar e que temos en perspectiva.
Este traballo foi nanciado polo Ministerio de Educacin y Ciencia e o Fondo Europeo de Desenvolvemento Rexional (FEDER), dentro do proxecto Deseo e implementacion dun servidor de recursos integrados
para o desenvolvemento de tecnoloxas da lingua galega (RILG) do Plan Nacional de I+D+I, 2006-2009 (ref.
HUM2006-11125-C02-01/FILO), proxecto coordinado da Universidade de Vigo (Seminario de Lingstica Informtica e Observatorio de Neoloxa) e da Universidade de Santiago de Compostela (Instituto da Lingua
Galega).
198
O corpus xurdico Lega galego-espaol contn material textual bilinge de dous mbitos especializados da linguaxe xurdica moi prximos, mais ben diferenciados: por unha banda, o mbito administrativo,
representado por 30 exemplares do Diario Ocial de Galicia publicados
entre 2000 e 2005; e pola outra banda, o mbito lexislativo, representado
por un conxunto de 62 textos publicados entre 1978 e 2007 con lexislacin
diversa de mbito estatal (publicada no Boletn Ocial del Estado) e supraestatal (Constitucin Europea). Mis concretamente, as leis e regulamentos publicados no BOE pertencen a distintos eidos dentro do mbito
lexislativo: ao eido xudicial, ao mbito da Constitucin e dos Estatutos,
ao eido econmico, ao eido social, ao Dereito ambiental, ao Dereito informtico e ao mbito relacionado con sectores especcos (universidades, pesca, circulacin, etc.). Os textos que proveen do DOG suman un
199
200
de traducin. A memoria de traducin unha base de datos onde se almacenan a versin orixinal e traducida de cada unha das frases que se
traducen no marco da aplicacin. Cando se est a traducir unha frase, o
programa detecta automaticamente se esa mesma frase ou outra similar
xa foi traducida con anterioridade, co obxecto de que se poida reutilizar a
traducin sen necesidade de reescribila completamente, facendo as modicacins que se consideren mis axeitadas. En 1997 a industria creou e
impulsou o estndar TMX para permitir o intercambio de memorias de
traducin entre os distintos programas de traducin asistida. Con certas
diferenzas, un corpus paralelo aliado equivale a unha memoria de traducin e, na prctica, existe un nmero considerable de crpora paralelos
aliados codicados en TMX, coa vantaxe adicional de que os crpora as
etiquetados poden ser empregados como memorias de traducin para
alimentar os programas de traducin asistida. A xeito de ilustracin das
caractersticas xerais deste formato, amsase a seguir o aliamento ingls-galego en TMX simplicado das tres primeiras frases de A Perla de
Steinbeck, no orixinal ingls e mais na sa traducin ao galego. Obsrvese que, no formato TMX, tanto o orixinal, coma a sa traducin, coma a
informacin sobre os aliamentos, est todo includo nun nico cheiro.
Nos cheiros TMX, os segmentos orixinais e traducidos discorren literalmente en paralelo, rodeados por etiquetas que explicitan a sa adscricin
lingstica e as sas equivalencias.
<?xml version=1.0 ?>
<!DOCTYPE tmx SYSTEM tmx14simp.dtd>
<tmx version=1.4>
<header creationtool=TRANS Suite 2000 creationtoolversion=1.4.2 segtype=sentence otmf=CTMTS2000 adminlang=gl srclang=en datatype=empty>
</header>
<body>
<tu>
<tuv xml:lang=en>
<seg>In the town they tell the story of the great pearl --how it was found and how it was lost
again.</seg>
</tuv>
<tuv xml:lang=gl>
<seg>Na cidade cntase a historia da gran perla, de como foi atopada e de como foi perdida de
novo.</seg>
</tuv>
</tu>
201
<tu>
<tuv xml:lang=en>
<seg>They tell of Kino, the fisherman, and of his wife, Juana, and of the baby, Coyotito.</
seg>
</tuv>
<tuv xml:lang=gl>
<seg>Flase de Kino, o pescador, e da sa muller, Juana, e do neno, Coyotito.</seg>
</tuv>
</tu>
<tu>
<tuv xml:lang=en>
<seg>And because the story has been told so often, it has taken root in every mans mind.</
seg>
</tuv>
<tuv xml:lang=gl>
<seg>E como a historia foi contada tan a mido, acabou por botar races na mente de cada
home.</seg>
</tuv>
</tu>
</body>
</tmx>
202
203
das a partir das sas traducins ao galego. Nestes momentos, o SLI esta a
completar a segunda edicin do dicionario, cuxa publicacin est prevista
para o ltimo cuarto de 2008. Esta segunda edicin no prelo incorpora ao
dicionario un maior nmero de entradas e equivalencias tiradas do corpus (ao redor de 20.000 entradas e 40.000 traducins), ao tempo que ampla
os datos lexicogrcos contidos nas entradas con informacin sobre os
americanismos do ingls e con notas de interese gramatical, tradutolxico
e normativo, co obxectivo de que a ferramenta resultante poida ser realmente til tanto na docencia do ingls como na traducin ingls-galego.
A extraccin de lxico bilinge a partir do corpus Tectra, que serviu de
base xeracin do dicionario tivo lugar en catro fases: anotacin do corpus
coas equivalencias de traducin entre frases, preparacin do corpus para
a extraccin (fase de preedicin), extraccin lxica bilinge automtica,
e edicin manual dos resultados da extraccin (fase de postedicin). O
problema central da extraccin automtica de lxico bilinge consiste en
converter un corpus paralelo anotado cos aliamentos a nivel de oracin
(isto , coas equivalencias oracionais de traducin) nun corpus etiquetado paralelo cos aliamentos a nivel de palabra (isto , coas equivalencias
lxicas de traducin). Para acadar esta tarefa, existen diversos algoritmos
baseados principalmente en medidas estatsticas relacionadas coa asociacin mutua ou coa coaparicin dos elementos lxicos nas frases bilinges
aliadas (Och / Ney 2003). Todos estes algoritmos presentan unha marxe
de erro considerable nos resultados (Tiedemann 2003) por mor da natureza
intrinsecamente non literal da traducin e doutras dicultades relacionadas coas caractersticas dos crpora, como a distancia lingstica entre
as linguas implicadas, o tipo de textos ou o estilo da traducin. Para tentar superar as limitacins da extraccin lxica baseada unicamente nos
aliamentos oracionais, codicamos no corpus paralelo a informacin
tradutolxica sobre asimetras de traducin (aliamentos non biunvocos
e alteracins de orde na traducin), e preeditamos o corpus mediante a
eliminacin de diversos elementos que posen unha incidencia directa
nos erros da extraccin (segmentos de texto marcados como omisins
ou adicins, signos de puntuacin ags os guins de unin de palabras
compostas, dxitos e palabras gramaticais cun alto ndice de frecuencia).
A partir da versin preeditada do corpus paralelo, realizouse a extraccin
lxica bilinge automtica utilizando como ferramenta o programa de aliamento lxico NATools (Simes / Almeida 2003). Este programa calcula
o ndice de correlacin entre as coaparicins dos elementos lxicos nas
oracins bilinges aliadas e ofrece como sada da extraccin un dicionario probabilstico ingls-galego consistente nunha lista bilinge de todas
204
205
206
Este formato interno pdese consultar e converter a distintos formatos de presentacin de acordo cos requisitos lexicogrcos precisos en
cada caso. As, na versin para a web do dicionario, o dicionario en XML
procesado mediante un programa en PHP que permite a consulta interactiva do dicionario e a presentacin dinmica dos resultados xerados
en HTML para a sa visualizacin, como se pode comprobar realizando a
consulta da calquera palabra inglesa na web do dicionario (http://sli.uvigo.es/CLIG/). Tamn se poden xerar presentacins das entradas aplicando follas de estilo XSL directamente sobre o formato XML, con resultados
como o que se mostra a continuacin:
annexe noun
anexo The Caf sur la Rue opened its Internet annexe last October_a kind of high-tech office with a dozen
computers. O Caf sur la rue dotouse do seu anexo virtual en 1998: unha oficina equipada cuns
dez ordenadores. [C04 (1300)]
transitive verb
anexar Jordan annexes the West Bank, while Egypt rules the Gaza Strip. Xordania anexa Cisxordania,
Exipto administra a Franxa de Gaza. [C14 (1542)]
Neste exemplo de presentacin impresa, as distintas categoras dunha entrada introdcense mediante o cadrado, as acepcins inician pargrafo e van subliadas, mentres que os exemplos van precedidos dun
tringulo e, nun corpo de letra mis pequeno, conteen a frase en ingls
en cursiva, a sa traducin ao galego en redonda, e levan ao nal entre
corchetes a referencia bibliogrca abreviada da fonte (obra e nmero de
frase). Nos restantes exemplos, ilustramos diferentes tipos de informacin lexicogrca codicada no dicionario: fraseoloxa, americanismos,
notas s entradas e notas s acepcins. Todos os exemplos forman parte
da segunda edicin do dicionario:
angel noun
anxo Prue, a perfect angel with the others, and sometimes now, at night especially, she took ones breath away
with her beauty. Prue era un verdadeiro anxo cos outros, e s veces, sobre todo polas noites, estaba
tan fermosa que lle cortaba a un a respiracin. [CAR (766) ]
guardian angel anxo da garda Whats more, the trains guardian angels bent over backwards trying
to prevent it from turning into a dragon. Polo demais, os anxos da garda do tren trataban por tdolos
medios de impedir que se transformase nun dragn. [C30 (1258)]
amphitheatre ( amphitheater) noun
anfiteatro Passing through the ravine, they came to a hollow, like a small amphitheatre, surrounded by perpendicular precipices, over the brinks of which impending trees shot their branches, so that you only caught glimpses
of the azure sky and the bright evening cloud. Pasaron a travs do desfiladeiro e chegaron ata un val,
207
que era coma un pequeno anfiteatro, rodeado de precipicios verticais, con rbores prximas
bordo, que proxectaban as sas plas, polo que a penas se poda albisca-lo azul do ceo e as nubes
brillantes da noitia. [RIP (81)]
actual adverb O ingls actual nunca debe traducirse polo galego actual. Para este significado, o
ingls emprega ou ben current ou present.
real And yet was he to accuse Miss Daisy Miller of actual or potential inconduite, as they said at Geneva?
E sen embargo, a el acusar a Miss Daisy Miller de inconduite real ou potencial, como dican en
Xenebra? [DAI (216) ]
autntico At most, by an alms given to a beggar whose blessing he fled from, he might hope wearily to win for
himself some measure of actual grace. Todo o mis, ao dar unha esmola a un mendigo de cuxa benzn
fuxira, podera agardar, con canseira, conseguir certa medida de autntica gracia. [RET (2146) ]
verdadeiro The tortures endured, however, were indubitably quite equal for the time, to those of actual sepulture. Con todo, as torturas sufridas naqueles momentos foran indubidablemente iguais s dun
verdadeiro enterro. [BUR (249)]
ache noun
dor A diferenza entre ache e pain consiste en que a primeira refrese a unha dor intensa e xeralizada (a cabeza, a espalda, as moas) mentres que a segunda supn unha dor mis localizada, p.ex.,
nun brazo. He felt only an ache of soul and body, his whole being, memory, will, understanding, flesh, benumbed and weary. Senta soamente dor de corpo e alma: todo o seu ser, memoria, vontade, intelecto,
carne, atordoado e canso. [ RET (2751) ]
pena They sat with bowed heads, dead to all things but the ache at their hearts. Estaban sentados coa
cabeza gacha, insensibles a todo ags pena dos seus corazns. [LEG (668)]
intransitive verb
doer Her head began to ache, and the lights on the altar swayed before her eyes. Empezoulle a doe-la cabeza, e a notar como as luces do altar oscilaban ante os seus ollos. [ESP (953)]
208
O corpus de dereito Galex recompila 72 textos lexislativos (leis, decretos, regulamentos) de mbito autonmico, estatal e supraestatal, publicados entre 1998 e 2006. O corpus de informtica Xiga contn 2450 textos
sobre informtica publicados entre 1997 e 2007, tirados de manuais, axudas, mens e mensaxes de programas (Proxecto Xis, Trasno, OpenOfce,
Windows); de textos acadmicos e de divulgacin (Galipedia, servizos informticos universitarios, artigos en libros e revistas cientcas); dos medios de comunicacin especializados (Dxitos, Fwwwrando-Vieiros, Cdigo
Cero, Ocano Internet-Galicia Hoxe), e de roldas, foros, grupos de novas
e blogues. O corpus de economa Achega consta de 210 textos de economa publicados entre 2000 e 2007, tirados de convenios colectivos (banca,
caixas de aforro, seguros), lexislacin, libros, artigos (Revista Galega de
Economa, Terra e Tempo), informes (Instituto Universitario de Estudos
e Desenvolvemento de Galicia/IDEGA) e traballos acadmicos (teses de
doutoramento, actas de congresos). O corpus Auga de ecoloxa e ciencias
ambientais recolle 853 textos de ecoloxa publicados entre 1999 e 2007, e
est formado por lexislacin ambiental, libros, artigos, teses e traballos
acadmicos, informes e guas, de fontes como a Federacin Ecoloxista
Galega, a Coordinadora para o Estudo dos Mamferos Marios/CEMMA,
a Asociacin para a Defensa Ecolxica de Galiza/ADEGA, a Sociedade
Galega de Historia Natural, a Consellara de Medio Ambiente e a propia
Universidade de Vigo. Por ltimo, o corpus de socioloxa componse de 569
textos publicados entre 2000 e 2007 correspondentes a informes, artigos
acadmicos e de opinin, e procedentes de diversas fontes, como a Xunta
de Galicia, o Instituto Galego de Estatstica, o Consello Econmico e Social
de Galicia, Altermundo.org, o Proxecto Galicia 2010, o Observatorio Galego
dos Medios e a revista Andaina.
209
Fragmento includo na seccin de ecoloxa e ciencias ambientais do CTG e pertencente tese de doutoramento de Alfredo Lpez Fernndez, Estatus dos pequenos cetceos da plataforma de Galicia, dirixida por
ngel Guerra Sierra e Graham J. Pierce, e presentada na Facultade de Bioloxa da Universidade de Santiago
de Compostela en 2003.
210
211
212
213
214
Ref. 666406
Campo temtico:
Relacins semnticas:
Termo GL:
Categora:
Variante:
com
Frecuencia relativa:
3.11639679709
Contexto de uso:
Termo GL:
gas invernadoiro
Categora:
Variante:
morf
Frecuencia relativa:
0.623279359418
Contexto de uso:
215
6. perspectivas
Nestes momentos, os nosos esforzos de investigacin no eido da lexicografa e a terminoloxa baseadas en crpora estn centrados na ampliacin dos crpora CLUVI e CTG (que supn a incorporacin de novos textos,
de novos campos especializados e de mis informacin lingstica), na segunda edicin do Dicionario CLUVI Ingls-Galego, e na extensin da informacin terminolxica do TUVI aos mbitos da informtica e da medicina.
Simultaneamente, estamos a traballar xunto co Instituto da Lingua
Galega da Universidade de Santiago de Compostela no proxecto RILG
(Recursos Integrados para o desenvolvemento de tecnoloxas da Lingua
Galega), un proxecto encamiado a ofrecer un portal web de servizos
lingsticos do galego desde o que se poida acceder de xeito conxunto
aos bancos textuais e aos dicionarios desenvolvidos polo Seminario de
Lingstica Informtica e o Observatorio de Neoloxa da Universidade de
Vigo e polo Instituto da Lingua Galega. Os recursos que se pretende integrar neste servizo inclen o Tesouro Informatizado da Lingua Galega
(TILG), o Tesouro Medieval Informatizado da Lingua Galega (TMILG), o Corpus CLUVI, o Corpus Tcnico do Galego (CTG), o Dicionario de Dicionarios
216
217
218
219
directamente, derivan del. No terreo estritamente lexicogrco botronse a andar o Dicionario Histrico da Lingua Galega e mais o Dicionario
Medieval Galego-Portugus, este ltimo en colaboracin con equipos da
Universidade Nova de Lisboa. Tamn se est a traballar na Dialectoloxa
Medieval Galego-Portuguesa, no Inventario Toponmico da Galiza Medieval (ITGM), que se pode consultar xa no seguinte enderezo web: http://ilg.
usc.es/itgm/, na Gramtica Histrica da Lingua Galega e na edicin paleogrca de distintas obras medievais xa incorporadas ao TMILG, mais que
nalgns casos reclaman unha lectura mis actualizada ou, cando menos,
mis axeitada s esixencias que presentan actualmente os estudos de
lingstica histrica. Algunhas desas obras, en fase avanzada de transcricin, son o Tratado de Albeitaria, os Miragres de Santiago e as Cantigas de
Santa Mara. Todo isto sen esquecer que o TMILG, xunto co TILG, os dous
Dicionarios de Dicionarios (o medieval e mais o moderno) e o Seminario
de Lingstica Informtica da Universidade de Vigo, participar na construcin dunha plataforma de recursos informticos para a investigacin
da lingua galega (RILG), co patrocinio do Ministerio de Educacin e Ciencia e da Consellara de Innovacin e Industria da Xunta de Galicia.
220
PROSAeEverso
VERSOna
NAdocumentacin
DOCUMENTACIN DO
prosa
do TMILG
tmilg
80
80
70
70
60
60
50
50
40
40
30
30
20
20
10
10
00
Pr osanotarial
notar ial
Prosa
Pr
osanon
nonnotar
ial
Prosa
notarial
Ver
so
Verso
221
A estas cinco categoras xerais podemos engadir anda outras das representadas por documentos de caractersticas temticas bastante peculiares, mais que veen especicamente singularizados polo contexto institucional en que se xeraron. Refermonos, por un lado, aos documentos reais
(privilexios, acoutamentos, mandatos, ordenanzas...), e, polo outro, aos documentos eclesisticos e especialmente aos monsticos (cartas de irmandade, decretos de anexin, repartimentos, restauracins monsticas...).
Desde o punto de vista dos focos xeradores de documentacin, o
TMILG permtelle ao usuario acceder documentacin elaborada tanto
nos ncleos eclesisticos (catedrais, mosteiros, parroquias, snodos) como
nos civs (concellos, universidades, documentos de carcter privado e
outros textos de natureza diversa). Porn, o primeiro grupo, o da prosa
notarial relixiosa e mis concretamente a redactada nos mosteiros, a que
goza dunha maior presenza numrica dentro do corpus. Neste sentido,
estn xa incorporadas ao TMILG un total de 32 coleccins documentais
procedentes de diversos mosteiros, dos cales 12 radican na provincia de
Lugo, 9 na da Corua, 7 na de Ourense e 4 na de Pontevedra. Ademais,
estn xa revisadas, preparadas e listas para a sa inminente inclusin
varias coleccins diplomticas de mosteiros pertencentes aos territorios
galegfonos de Asturias, Zamora e Len. Estas coleccins suman un total de 5 obras, o que converte a Galiza exterior nunha rea xeogrca e
lingstica xa notablemente representada no TMILG. Porn, o constante
traballo de enriquecemento das fontes bibliogrcas e de procesamento
dos textos extrados delas fai que estas cifras sexan sempre provisionais
e susceptibles de actualizacins peridicas1.
Mosteiro
1.
Concello
Provincia
Toques
A Corua
Leiro
Ourense
Puebla de Sanabria
Zamora
Mondoedo
Lugo
O Vicedo
Lugo
Amoeiro
Ourense
necesario deixar clara esta circunstancia, pois, por poer unicamente un exemplo, as cifras relativas
provincia da Corua poderan engrosarse grazas aos textos procedentes de mosteiros como San Martio de Cnduas (Ponteceso) ou San Cristovo de Dorme (Boimorto), ou incluso con documentos serodios
(nais do s. XV) que nos relatan procesos de reforma monstica que afectaron a cenobios como o de San
Mamede de Seavia (Coristanco). Ao tratrense de obras anda en proceso de revisin e conteren total ou
maioritariamente textos en latn e/ou en casteln non foron tidas en conta neste cmputo.
222
Mosteiro
Emprazamento
Provincia
Santiago de Compostela
A Corua
Ponferrada
Len
Ramirs
Ourense
Esgos
Ourense
A Laracha
A Corua
Dozn
Pontevedra
Bergondo
A Corua
Celanova
Ourense
Lourenz
Lugo
Narn
A Corua
Trives
Ourense
Palas de Rei
Lugo
A Corua
Pantn
Lugo
A Capela
A Corua
A Estrada
Pontevedra
Santiago de Compostela
A Corua
Santiago de Compostela
A Corua
Cacabelos
Len
Paradela
Lugo
Guntn
Lugo
Pantn
Lugo
Ourense
Viveiro
Lugo
Asturias
Pontevedra
Pontevedra
Santiago de Ermelo
Bueu
Pontevedra
Santiago de Mens
Malpica
A Corua
Viveiro
Lugo
Carballedo
Lugo
Nogueira de Ramun
Ourense
Lousame
A Corua
Veiga de Espiareda
Veiga de Espiareda
Len
223
No seguinte grco podemos observar mis detalladamente a relacin porcentual existente entre as distintas procedencias xeogrcas da
documentacin cenobtica do TMILG, tomando como referencia o marco
administrativo actual. Deste xeito podemos observar algns datos bastante congruentes tanto co decorrer da historia medieval galega como,
mis especicamente, coas tendencias xeogrcas dos asentamentos
monsticos no Noroeste peninsular: por exemplo, comprobamos que a
provincia que maior cantidade de coleccins documentais achega Lugo,
e mis en concreto a sa rea meridional, que, xunto cos territorios mis
setentrionais da provincia de Ourense artellados ao redor do ro Mio,
constite unha rea especialmente rica no que a institucins monsticas
se rere: a Ribeira Sacra. Por outra banda, resulta cando menos rechamante a precariedade documental que presenta a provincia de Pontevedra (4
coleccins), superada de feito polos territorios galegfonos hoxe administrativamente asturianos e casteln-leoneses (5 coleccins). A provincia
da Corua, pola sa banda, proporcinalle ao TMILG 9 coleccins documentais, se ben hai que ter en conta o considerable peso cuantitativo e
cualitativo que teen os mosteiros radicados en Santiago de Compostela,
capital eclesistica de extraordinaria relevancia neste sentido.
COLECCINS DOCUMENTAIS MONSTICAS NO TMILG
No que se rere ao outro grande bloque de prosa notarial, o constitudo polos textos civs, domina claramente a documentacin de tipo particular, sendo xa moito menos numerosa a procedente doutros mbitos
como o universitario e o municipal (soamente os concellos de Santiago,
Noia, Pontevedra, Ourense e A Corua achegan producin textual relevante ao TMILG).
224
O segundo grupo en importancia cuantitativa o da prosa non notarial, que comprende aproximadamente o 15% do total dos textos. A prosa
non notarial est representada por obras ou fragmentos de obras pertencentes a cinco grandes bloques temticos ben coecidos e delimitados:
(a) prosa literaria: pertencen ao xnero da narrativa extensa a Crnica
Troiana (CT), a Historia Troiana (HT) e mais o fragmento conservado do
Livro de Tristan (LT);
(b) prosa histrica: como sabemos, a historiografa medieval coecida en lingua galega ntrese exclusivamente de traducins de orixinais
procedentes doutros mbitos lingsticos, nomeadamente o casteln.
Soamente dispomos de tres textos que renan as caractersticas denitorias deste xnero: a Xeral Historia (XH), a Crnica Xeral e Crnica de Castela (TC) e mais a Crnica de Santa Mara de Iria (CI);
(c) prosa relixiosa: no TMILG rexstranse tan s das obras deste tipo,
os Miragres de Santiago (MS) e un fragmento do tratado Sobre a simona
(SaS). Descoecemos, cando menos a da de hoxe, obras prossticas galegas medievais pertencentes ao xnero da haxiografa, a catequstica ou o
sermn, por exemplo;
(d) prosa tcnica: no noso corpus inclense das obras que, polo seu
carcter descritivo e directivo, poden clasicarse sen maiores problemas
dentro desta categora, se ben cada unha delas desenvolve temticas moi
afastadas entre si. Por unha banda, a Arte de Trobar (AT) inscrbese dentro
do mbito da teora potica e, a un nivel mis amplo, no mundo das ciencias sociais e humanas; en cambio, o Tratado de Albeitaria (TA) cntrase
no terreo da veterinaria e, xa que logo, pode considerarse un manual de
ciencias aplicadas, o nico existente a da de hoxe na nosa tradicin prosstica medieval;
(e) prosa xurdica: anda carecendo de tratados xurdicos propiamente ditos, a prosa galega medieval si conta cun amplo repertorio de ordenamentos e cdigos legais, todos eles xa dispoibles no TMILG: refermonos
aos fragmentos conservados do Foro Xuzgo (FX), Flores de Dereito (FD),
Foro Real (FR), Glosas de Textos Legais (GTL) e o Ordenamento de Alcal de
Henares (OA), as como a versin completa conservada dos Foros de Castelo Rodrigo (FCR). A todas estas obras hai que engadir anda os distintos
fragmentos das sete Partidas de Afonso X, na sa traducin ao galego.
225
226
PROSA
Breve
Extensa
Narrativa
Ciencia e tcnica
Sociedade
Relixin
Historia
Dereito
Lrica
Teatro
Didctica
VERSO
Narrativa
Tradicional
Culta
pica
Relixiosa (CSM-cantigas narrativas)
Didctica
Lrica
Tradicional
Culta
Dramtica
227
228
229
230
Curiosamente, o CORDE non d ningunha ocorrencia do derivado devisaion / divisaion para o casteln,
nin na poca medieval nin na moderna, o que parece rearmar mis anda a singularidade desta forma.
231
seguintes termos: parto et demito et traspaso. Estas escollas lxicas entroncan o traspasamento de foro con outros tipos documentais profusamente representados no TMILG como son a demitizn ou a renuncia;
(i) informacin editorial: neste derradeiro apartado do encabezamento
rexstrase a pxina da obra na que comeza o documento, as como o rango
de pxinas que abrangue. Asemade, faise constar tamn o captulo da edicin co que se corresponde cada documento.
Este encabezamento veu funcionando, con certos reaxustes puntuais,
ao longo destes case 20 anos de vida do TMILG, mais na actualidade o
grupo de investigacin est a desenvolver un novo e mis ambicioso etiquetario (DTD) mediante o que se recolla toda a informacin pertinente
non s de cada documento en particular, senn tamn do conxunto da
obra ou volume no que se recolle. Os tems informativos contemplados
nese novo encabezamento son esencialmente os mesmos aos que se veu
recorrendo at o de agora, pero moito mis matizados e detallados. Ademais, incorporarase toda a informacin de tipo arquivstico e codicolxico
existente para cada documento e moitas veces accesible xa a travs das
propias edicins dos textos.
Xa dentro do documento en si, e nunha segunda e mis fonda fase de
revisin, mrcanse tamn, mediante os indicadores previamente convidos, todos e cada un dos elementos onomsticos: topnimos, antropnimos, ttulos de obras, nomes de das e de meses, nomes de institucins...
Esta prctica a que permite desenvolver proxectos como o xa mencionado Inventario Toponmico da Galiza Medieval, que esixe un laborioso proceso previo de illamento, clasicacin e identicacin dos topnimos de
cada documento que contribuu a asentar unha metodoloxa de traballo
xa ensaiada con xito nalgns traballos de doutoramento desenvolvidos
por bolseiros do TMILG.
Como exemplo deste proceso de tratamento e etiquetaxe dos textos
para o TMILG presentamos un documento pontevedrs do s. XV, pertencente a unha tipoloxa documental inslita at o de agora, o contrabto de
perdon. O contido do escrito certamente pintoresco, como tamn o son
os termos e o lxico empregados: Pedro de Montes, natural do mosteiro de
Aciveiro, compromtese a perdoar todo mal, dano, pecado et copulaon
et adulterio que a sa muller, Tareixa de Montes, cometera e puidera
cometer at o 1 de abril seguinte, data na que ambos os dous deberan
reencontrarse para faser maridana segundo que manda Deus et Santa
Iglesia. Xa que logo, o interese do documento desborda os aspectos meramente lingsticos para converterse nunha peza de indubidable valor
histrico e sociolxico.
232
233
dia con qualquer persona en meu perjuiso. Et para esto asi seer mas firme, vos a dita
Tareija de Montes ata o dito primeiro dia de abril avedes de vir aa iglesia de San Migell de
Carvalleda, et desde que ende fordes fasermo a saber para que vos et eu falemos en hu
seguramente et conertandonos para <P 151> que en hun faamos nosa vivenda, asi
como por Deus et por dereito somos obligados de nos faser maridana segundo que
manda Deus et Santa Iglesia, et non nos et eu como dito he de boo vos perdoo et dou
por livre et quita, para qui et por ante Deus, de todo mal, dano, pecado et copulaon
et adulterio que vos cometestes et fezestes et cometerdes et feserdes en meu perjuiso
ata o dito primeiro dia de abril, et prometo et outorgo aa boa fe de Deus et sen mao
engno et por juramento que ende fao en este sinal de crus en lugar de santos avangeos,
que eu que vos lo tea et conpra et agarde asi, et que en publico nen en scondido vos
non bea nen pase, por min nen por outro, contra elo nen contra parte delo, et demais
~
concertandonos ena
dita vivenda que, sen enbargo do sobre dito, vos faa maridana
do corpo et do aver ben et lealmente asi como marido a moller et por la via et forma
que manda Deus et Santa Iglesia, et non no teendo et conprindo en todo asi et yndo et
pasando contra elo, que eu seja enfames et fe perjuro, et me costamio de non ser de tal
pecado asolto salvo por noso seor o papa; et demais que eu de et page por pena en nome
de interese a vos a dita Maria de Montes dosentos froliins de ouro do cuo de Aragon, et
apena pagada ou non que senpre este contrabto este firme, sobre lo qual renunio as
leis do dereito, dolo, engano, medo, fora, endusimento et a todas las outras et dereitos
canonicos et cevils et impereaas et reaas de que me eu ou outro por min pudeiramos
ajudar para contra esto que dito he vir, que quero et outorgo que me non vallan nen
sejamos sobrelo nen sobre parte dlelo oydos nen resebidos en juiso nen fora del; et
por que esto seja erto outorgey ende este contrabto de perdon ante o notario et testemoyas de juso scriptas. Que foi outorgado na villa de Pontevedra, ano, dias, mes sobre
~
ditos. Testemoyas que foron presentes, Afonso Soares caldeirerio morador ena
dita villa
et Garia Corto et Gomes Ares moradores en Ribadavia et Gil Martines clrigo de San Justo
de Avion et outros. <P 152>
4. algunhas conclusins
O TMILG, ao longo dos seus case catro anos en rede, converteuse nunha ferramenta indispensable para achegarse s mltiples vertentes da
cultura galega medieval, con especial relevancia das dimensins lingstica e histrica. Isto as grazas ao abondoso material textual que constite o corpus base, mais tamn sa diversidade xenrica e, en certo xeito,
lingstica, o cal posibilita unha achega multidisciplinar a un perodo da
nosa historia especialmente rico e anda non totalmente explotado en
todas as sas innitas posibilidades.
234
235
bUSCatermos:
BANCO DE DATOS TERMINOLXICO MULTILINGE
Xusto Rodrguez Ro
Este traballo ten por obxecto presentar o bUSCatermos e mais o Banco de Datos Terminolxico (BDT) do Servizo de Normalizacin Lingstica
da USC, intentando destacar tamn algunhas das utilidades que pode ter
para o traballo lexicogrco.
bUSCatermos non mis ca a parte visible do BDT: unha interface que
permite realizar consultas no corpus de informacin dese banco a travs
de Internet. Xa que logo, o verdadeiramente relevante a cantidade e o
tipo de informacin que se compila neste e a forma en que se organiza.
Actualmente, o BDT agrupa informacin procedente de tres tipos de
fontes:
(1) A producin terminolxica sistemtica elaborada polo SNL.
Componse de tres tipos de repertorios: vocabularios (abranguen grandes reas de especialidade e compilan un nmero de conceptos relativamente alto, normalmente entre 4.000 e 5.000), lxicos (atenden a mbitos
especializados mis restrinxidos, e oscilan entre os 1.000 e os 3.000 conceptos) e termos esenciais (produtos pensados especicamente para o alumnado que se limitan a recoller e divulgar terminoloxa relevante dentro
dos plans de estudo de diferentes titulacins).
(2) A producin terminolxica puntual desta mesma entidade.
Consta de varios milleiros de chas en que se recolle e se xustica a
resposta a consultas formuladas sobre termos concretos das mis diversas reas de especialidade.
236
Xusto Rodrguez Ro
Outros dicionarios e
vocabularios especializados
Traballo terminolxico
puntual do SNL
DIXITALIZACIN e INTEGRACIN
FUSIN e REELABORACIN
bUSCatermos
O labor mis custoso2 de toda esta secuencia indubidablemente a reelaboracin dos materiais, pero parecanos evidente a necesidade de abordala,
tendo en conta o obxectivo que pretendemos acadar. Se o que intentamos
proporcionarlles a todos os membros da comunidade da USC3 unha ferramenta que lles axude a mellorar a calidade dos textos tcnicos que elaboran,
1.
A escolla destes repertorios non se fai de xeito aleatorio, senn que previamente deben cumprir unha
serie de condicins: (1) deben centrarse en reas estudadas dentro dalgunha titulacin impartida na USC;
(2) deben acadar un grao de calidade mnimo que as faga aproveitables como fontes de consulta; (3) os
autores deben autorizar explicitamente a sa utilizacin e inclusin no BDT, e (4) debe tratarse de produtos elaborados sen vocacin comercial (que se distriburon gratuitamente, que son accesibles de balde a
travs de Internet) ou que xa remataron a sa vida comercial til (traballos esgotados, de acceso moi
difcil).
2.
Non s custoso, senn que tamn se pode entender como inacabable, xa que cada vez que se engade un
novo repertorio ao Banco cumprira reelaboralo tendo en conta as posibles coincidencias e contradicins
con todo o material preexistente.
3.
bUSCatermos accesible desde calquera ordenador conectado rede informtica desta institucin.
237
238
Xusto Rodrguez Ro
cepto. Neses casos facemos unha valoracin crtica que pode levarnos a
preferir unha delas, a inclulas todas como sinnimas ou a propor unha
alternativa diferente, xusticamos e argumentamos a decisin adoptada e outorgmoslles unha marca de valoracin4.
Tendo en conta todo o devandito, evidente que o lexicgrafo non
pode recorrer ao bUSCatermos da mesma forma ca a un corpus xa que
a maior parte da informacin non procede de usos reais documentados
senn de fontes secundarias, a un dicionario de dicionarios a informacin destas fontes secundarias non se conserva no seu estado orixinal
ou a un dicionario descritivo existe unha vontade orientadora do uso
explicitamente declarada.
Pero anda as, pode ser un material interesante para tirar del informacin de cara a traballos de lexicografa especializada, ou para as
entradas e acepcins especializadas presentes nas obras lexicogrcas
xerais.
Por exemplo, as mis de 50.000 denicins5 de conceptos pertencentes
a mbitos temticos moi diversos poden ser tiles no proceso de elaboracin de dicionarios monolinges, tanto xerais como especializados.
Para traballos lexicogrcos bilinges ou multilinges poderase tirar
partido do feito de que para a maiora dos conceptos descritos se ofrezan
denominacins en mis dun idioma. As, existen equivalentes castelns
para preto de 70.000 deles, ingleses para mis de 30.000, portugueses para
preto de 20.000, franceses para case 13.000, e cantidades menores para o
alemn, o italiano ou o cataln.
Os autores de produtos con vocacin correctiva (dicionarios de dbidas, dicionarios que inclen no corpus de entradas formas incorrectas)
poderan obter datos relevantes dos mis de 2.000 rexistros en que a informacin ofrecida para un concepto incle unha denominacin problemtica. Empregamos esta categora para referirnos a aquelas que, sendo moi
frecuentes no uso real, consideramos que deben evitarse por non seren
adecuadas para designar ese concepto.
E nalmente, tamn poden ter interese os varios miles de propostas
denominativas neolxicas, realizadas polo persoal do SNL co n de resolver as cuestins terminolxicas que van xurdindo de forma puntual
vinculadas ao labor de asesoramento lingstico. En concreto, produtos
4.
Esas marcas, que abranguen desde o grao 1 (termos normativos) ata o grao 5 (termos por resolver), asgnanse segundo uns criterios que se detallan en http://www4.usc.es/buscatermos/Caracteristicas.htm.
5.
Estas denicins poden proceder dos traballos que se foron compilando ou ben ser elaboradas polo persoal do SNL ou polos especialistas da USC que colaboran con ns.
239
240
241
242
vai permitir estudar e descrever uma quantidade signicativa de vocabulrio com vista elaborao do primeiro dicionrio. Este ser ainda necessariamente pequeno, porque foi planeado para ser realizado no prazo
apertado de cinco anos, por uma pequena equipa, integrando uma doutorada e cinco estudantes de ps-graduao em Lingustica2.
Maria de Lourdes Crispim e eu prpria, ambas do Centro de Lingustica da Universidade Nova de Lisboa, em colaborao com o Prof. Joo Malaca Casteleiro, do Instituto de Lexicologia e Lexicograa da Academia de
Cincias de Lisboa (ILL-ACL)3, estabelecemos os objectivos do projecto, a
sua concepo e o manual de redaco, assegurando tambm o acompanhamento regular e a reviso do trabalho dos outros membros da equipa,
bem como as reunies com consultores do projecto.
Pretende-se com a realizao deste dicionrio cumprir trs objectivos
principais: contribuir para o preenchimento da lacuna da dicionarstica
portuguesa relativa ao perodo medieval, formar jovens investigadores
que podero vir a dar continuidade ao estudo da lngua portuguesa histrica e elaborao de outros dicionrios e, ainda, facilitar a leitura dos
textos daquele perodo a estudiosos de outras reas e, em particular, a
estudantes, tanto do ensino superior como do secundrio.
O projecto de elaborao deste Dicionrio do Portugus Medieval assenta numa concepo de carcter prospectivo, em que vai sendo descrita a
histria da origem e da evoluo dos elementos lexicais atestados em corpora escritos ao longo dos primeiros sculos da histria da lngua, desde
o sculo XII at nal do sculo XV. Nesta perspectiva, so aplicados dois
critrios que funcionam como pilares do processo de elaborao do DPM:
exaustividade e sistematicidade.
A deciso sobre a adopo do critrio de exaustividade uma consequncia da conjugao de duas outras decises tomadas neste projecto
a constituio do corpus textual informatizado, o qual inclui exclusivamente fontes primrias, textos representativos de domnios scio-culturais e histricos da poca em estudo, e a acessibilidade ao corpus com o
auxlio de ferramentas informticas, permitindo e facilitando a extraco
2.
A partir de nais de 2004, a equipa integra quatro bolseiros nanciados directamente pela Fundao para
a Cincia e a Tecnologia do Ministrio da Cincia, Tecnologia e Ensino Superior, nomeadamente a doutora
Maria Alexandra Fiis, a mestre Maria de Ftima Martins e os mestrandos Joo Loureiro e Raquel Oliveira.
Tambm alguns tarefeiros nanciados pelo Centro de Lingustica da UNL tm ocupado muitas horas com
este trabalho, o mestre Miguel Gonalves e, alternadamente, os mestrandos Sandro Dias e Ana Esprito
Santo.
3.
Atravs desta colaborao est prevista a integrao do Dicionrio do Portugus Medieval na triologia de
dicionrios do ILL-ACL.
243
automtica, contextualizada, quanticada e localizada de todas as formas/variantes dos vocbulos existentes nos textos.
Deste modo, o Dicionrio do Portugus Medieval, elaborado a partir
de um corpus informatizado de textos medievais de diferentes gneros e
de diversas temticas, comportar todos os vocbulos que ocorrem nesses textos. Ser, ento, um dicionrio exaustivo no da lngua portuguesa medieval, mas da lngua que est documentada nas fontes textuais
utilizadas.
O critrio de sistematicidade na elaborao dos artigos do dicionrio, constitui um requisito metodolgico fundamental em todas as fases
previstas para a progresso consistente do projecto, sendo este tambm
facilitado pela possibilidade de utilizao de ferramentas informticas
(lematizadores, sistemas de concordncias, dicionrios electrnicos e etiquetadores ou outros).
A elaborao do DPM segue de perto, embora com adaptaes, a metodologia j utilizada no desenvolvimento do Dicionrio de Verbos do Portugus Medieval (DVPM), concebido por uma equipa de linguistas, tambm
do Centro de Lingustica da Universidade Nova de Lisboa, constituda
inicialmente por Maria Francisca Xavier, Maria da Graa Vicente, Maria
de Lourdes Crispim, Maria Teresa Brocardo e Antnio Emiliano, tendo os
dois ltimos colaborado at 1997. A equipa que realiza a investigao e as
tarefas para o desenvolvimento do DVPM tem contado com a colaborao
de diversos estudantes universitrios dos trs ciclos de formao, de diferentes reas, nomeadamente Lingustica, Clssicas, Estudos Portugueses
e Histria.
Deste trabalho resultou uma primeira publicao, intitulada Dicionrio de Verbos Portugueses do Sculo 13 (DVPM 1999), e uma segunda,
publicada em papel e na Internet, o Dicionrio de Verbos do Portugus
Medieval. Sculos 12 e 13/14 (DVPM 2003), ambas organizadas por Maria
Francisca Xavier, Maria da Graa Vicente e Maria de Lourdes Crispim.
Pretendeu-se com aquelas publicaes mostrar o trabalho realizado e
solicitar crticas, sugestes e colaboraes que contribussem tanto para
melhorar o que estava feito como para dar continuidade ao projecto.
As duas publicaes referidas acima do conta do trabalho desenvolvido em duas fases sucessivas, que correspondem ao tratamento lexical
morfolgico, sintctico e semntico dos verbos atestados em dois corpora textuais complementares.
O corpus inicial que serviu de base ao DVPM era constitudo pelo seguinte conjunto de textos no literrios do sculo XIII:
244
Neste corpus, perfazendo um total de 134.332 palavras, foram identicados, analisados e introduzidos na base de dados online do DVPM os 578
verbos que foram apresentados na publicao de 1999.
O corpus textual seguinte constituiu a segunda fonte do DVPM. Totalizando 171.000 palavras, o corpus incluiu, para alm dos textos do corpus
inicial, dois do sculo XII, mais alguns do sculo XIII e sete textos, de que
no h certeza se so do sculo XIII ou do sculo XIV, editados a partir de
cpias do sculo XV, como se indica na relao dos textos que se apresenta abaixo:
DN - 2 documentos notariais (2 metade do sculo XII), editados por Ana Maria Martins.
DN - 6 documentos notariais (s.d. ou datados entre 1243 a 1274), editados por Ana Maria Martins.
TOX 23 documentos notariais (s.d. ou datados entre 1269 e 1300), editados por Stephen
Parkinson.
TP Tempos dos Preitos (1280?), editados por Jos de Azevedo Ferreira.
VS 7 Vidas de Santos de um Manuscrito Alcobacense (sculo XIII ou XIV, cpias do sculo
XV), editados por Ivo Castro et alii.
No segundo corpus foram encontrados mais 212 verbos do que no anterior, totalizando 790 os verbos que constituram o DVPM publicado em
2003.
Durante a segunda fase de desenvolvimento do Dicionrio de Verbos,
para alm da elaborao das chas daqueles 212 verbos, foram ainda revistos os verbos anteriormente estudados, tendo sido introduzida informao complementar nas entradas daqueles que se encontram atestados
tambm nos textos que no faziam parte do corpus inicial mais formas
verbais (com variantes grcas) e respectivas classicaes morfolgicas,
mais acepes, mais contextos gramaticais e correspondentes abonaes.
245
Desde 2003, vo sendo publicadas na Internet as chas criadas e as revises das chas dos verbos dos sucessivos corpora que vo sendo acrescentados como fontes para o DVPM.
Deste modo, a experincia de anos obtida no processo de desenvolvimento do Dicionrio de Verbos permitiu consolidar a metodologia a seguir na elaborao do Dicionrio do Portugus Medieval.
A partir do corpus textual total, foram constitudos dois corpora, um
com textos dos sculos XII, XIII e XIII/XIV, o outro com os textos dos sculos XIV e XV. O estudo do lxico de um e de outro corpus corresponde a
duas fases sequenciais do projecto, programadas para levar a cabo a elaborao das chas do dicionrio. A primeira fase teve incio em nais de
2004 e terminou em nais de 2006, a segunda fase iniciou-se em princpios
de 2007, estando previsto o seu trmino em nais de 2008.
Tratando-se de um projecto de dicionrio exaustivo e sistemtico, as
duas fases do projecto compreendem passos idnticos, sendo que a segunda envolve ainda outros que complementam ou revem os primeiros.
Ambas as fases tm em comum os seguintes passos:
(a) Preparao dos dados
- extraco da listagem automtica das palavras do corpus
- lematizao
- agrupamento das variantes grcas
- extraco de concordncias das formas grcas atestadas
no corpus
(b) Identicao das unidades lexicais
- seleco das vedetas dos artigos
- agrupamento das variantes grcas e remisso para o artigo da cabea
- incluso da etimologia, origem das palavras e/ou sua
formao
(c) Anlise lingustica das unidades lexicais
- classicao gramatical
- determinao e denio dos signicados
- seleco das abonaes
246
247
248
tafularia s. f. (De taful + -aria). 1. Vcio ou prtica do jogo [1264-1284 CSM214] Ca se Deus deu
aas gentes jogos pera alegria / averen, todo o tornan elas en tafuraria, / e daquesta guisa queren gar. 2. Casa
de jogo [1264-1284 CSM174] E pois l ouve dito, logo sayu da tafuraria / e fillouss a chorar muito, [sc.
13 CEM251] Ainda eu outras manhas havia, / per que eu nom posso j muito valer: / nunca vos entro na
tafularia / que lhi nom haja algum preita volver. / Porque hei eu pois em gram coita seer? / fugir e guarir na
putaria. (Var. tafularia, tafuraria).
249
apndice
o corpus informatizado do portugus medieval (cipm)
Construdo a partir de textos j editados, o corpus respeita os critrios
de cada editor, embora, desde o incio, tenha sido necessria uma adaptao das solues grcas das intervenes editoriais (itlicos, sublinhados, uso de parnteses ou barras) em funo da necessidade de uniformizao exigida pela utilizao de diferentes suportes lgicos (DVPM 1999) e
de coerncia de notao interna do corpus.
1. Sculo XII
DN = 2 textos notariais (2 metade do sculo XII), in Ana Maria Martins
(ed.) (2000): Documentos notariais dos sculos XII a XVI. Edio digitalizada, cedida pela editora.
- Finto dos casais de Eligoo
- Notcia de haver
DP = 4 documentos privados (2 metade do sculo XII), in Jos Antnio
Souto Cabo (ed.) (2003): Nas origens da expresso escrita galego-portuguesa. Documentos do sculo XII. Braga: Universidade do Minho.
Edio digitalizada, cedida pelo editor.
- Pacto de Gomes Pais e Ramiro Pais (ca. 1173)
- Carta de foro da Benfeita
- Nomina de Pedro Viegas (1184)
- Escrito de Paio Soares
2. Sculo XIII
NT = Notcia de Torto (ca. 1214), in Lus Filipe Lindley Cintra (1990): Sobre
o mais antigo texto no-literrio portugus: a Notcia de Torto (leitura
crtica, data, redaco e comentrio lingustico), Boletim de Filologia
31, 21-77 (texto crtico, pp. 37-41). Edio digitalizada para o CIPM.
TL e TT = Testamento de D. Afonso II (1214), in Pe. Avelino Jesus da Costa
(1979): Os mais antigos documentos escritos em portugus, Revista
Portuguesa de Histria 17, 307-321 (dois manuscritos: Lisboa e Toledo).
Edio digitalizada para o CIPM.
CA = 34 documentos portugueses da Chancelaria de D. Afonso III (12551279), in Luiz Fagundes Duarte (1986): Os documentos em portugus da
Chancelaria de D. Afonso III (Edio). Dissertao de Mestrado. Lisboa:
FLUL, 68-295. Edio digitalizada para o CIPM.
250
251
3. Sculos XIII/XIV
CAmo = 159 cantigas de amor (sem data), in Mercedes Brea (coord.) (1996):
Lrica profana galego-portuguesa. Santiago de Compostela: Centro Ramn Pieiro. Edio digitalizada in Base de Datos en lia da Lrica Profana Galego-Portuguesa do Centro Ramn Pieiro (www.cirp.es).
CEM = 69 cantigas de escrnio e maldizer, in Graa Videira Lopes (2002):
Cantigas de escrnio e maldizer dos trovadores e jograis galego-portugueses. Lisboa: Estampa. Edio digitalizada, cedida pela editora.
VS = 7 vidas de santos de um manuscrito alcobacense (sem data; cpias
do sculo XV), in Ivo Castro et alii (eds.) (1985): Vidas de santos de um
manuscrito alcobacense (Cod. Alc. cclxvi / antt 2274). Lisboa: INIC, 16-52,
59-83. Edio digitalizada para o CIPM.
4. Sculo XIV
CAmo = 20 cantigas de amor (sem data), in Mercedes Brea (coord.) (1996):
Lrica profana galego-portuguesa. Santiago de Compostela: Centro Ramn Pieiro. Edio digitalizada in Base de Datos en lia da Lrica Profana Galego-Portuguesa do Centro Ramn Pieiro (www.cirp.es).
CEM = 2 cantigas de escrnio e maldizer, in Graa Videira Lopes (2002):
Cantigas de escrnio e maldizer dos trovadores e jograis galego-portugueses. Lisboa: Estampa. Edio digitalizada, cedida pela editora.
HGP = 62 textos notariais da Galiza e do Noroeste de Portugal (1301-1399),
in Clarinda de Azevedo Maia (1986): Histria do galego-portugus.
Coimbra: INIC, 19-295. Edio digitalizada para o CIPM.
DN = 79 textos notariais (sem data ou datados entre 1304 e 1397), in Ana
Maria Martins (ed.) (2000): Documentos notariais dos sculos XII a XVI.
Edio digitalizada, cedida pela editora.
TOX = 15 textos notariais (sem data ou datados entre 1309 e 1336), in Stephen Parkinson (ed.): Arquivo de Textos Notariais em Portugus Antigo. Oxford. Edio digitalizada, cedida pelo editor.
CS = 3 documentos dos Costumes de Santarm ((1340-1360), in Maria Celeste Matias Rodrigues (1992): Dos costumes de Santarm. Dissertao
de Mestrado. Lisboa: FLUL, 160-251. Edio digitalizada, cedida pela editora.
FG = 1 foro de Garvo (sem data), in Maria Helena Garvo (ed.) (1992): Foros de Garvo. Edio e estudo lingustico. Dissertao de Mestrado.
Lisboa: FLUL, 65-99. Edio digitalizada, cedida pela editora.
252
253
LEBC = Livro da Ensinana de Bem Cavalgar Toda Sela (sem data), in Joseph M. Piel (ed.) (1944): Livro da ensinana de bem cavalgar toda sela.
Lisboa: Livraria Bertrand. Edio digitalizada para o CIPM, revista por
Joo Dionsio.
CP = Castelo Perigoso (sem data), in Joo Antnio Santana Neto (ed.)
(1997): Duas leituras do tratado asctico-mstico Castelo Perigoso. Dissertao de Doutoramento. So Paulo: Faculdade de Filosoa, Letras e
Cincias Humanas, USP. Edio digitalizada cedida pelo editor e revista por Irene Nunes.
DSG = Demanda do Santo Graal (sem data), in Irene Freire Nunes (2001):
A demanda do Santo Graal. Edio digitalizada para o CIPM com base
na edio publicada pela Imprensa Nacional-Casa da Moeda (Lisboa,
1995), revista pela editora.
LVT = Livro das Tres Vertudes (sem data), Maria de Lourdes Crispim (ed.).
Verso paradiplomtica digitalizada, cedida pela editora.
OE = Orto do Esposo (sem data), in Bertil Maler (ed.) (1956): Orto do Esposo.
Rio de Janeiro: Ministrio da Educao e Cultura, Instituto Nacional do
Livro. Edio digitalizada para o CIPM.
CPVC = Carta de Pro Vaz de Caminha, in M. V. Guerreiro / E. B. Nunes
(eds.) (1974): Carta a el-rey dom Manuel sobre o achamento do Brasil.
Lisboa: INCM. Edio digitalizada para o CIPM.
HRP = Histria dos Reis de Portugal (sem data), in Lus Filipe Lindley Cintra (ed.) (1951): Crnica geral de Espanha de 1344. Lisboa: INCM. Edio
digitalizada para o CIPM.
ZPM = Crnica do Conde D. Pedro de Meneses (sem data), in Maria Teresa Brocardo (ed.) (1994): Crnica do Conde D. Pedro de Meneses. Dissertao de Doutoramento. Lisboa: FCSH, 333-693. Edio digitalizada,
cedida pela editora.
CDF = Crnica de D. Fernando, in Giuliano Macchi (ed.) (1975): Ferno Lopes. Cronica de D. Fernando. Lisboa: INCM. Edio digitalizada para o
CIPM.
CDJI1 = Crnica de D. Joo I, parte 1, in Ferno Lopes (1945): Crnica de D.
Joo I. Porto: Livraria Civilizao (segundo o cdice n 352 do Arquivo
Nacional da Torre do Tombo). Edio digitalizada para o CIPM.
CDJI2 = Crnica de D. Joo I, parte 2, in Ferno Lopes (1949): Crnica de D.
Joo Primeiro. Porto: Livraria Civilizao. Edio digitalizada para o
CIPM.
CDPI = Crnica de D. Pedro I, in Damio Peres (ed.) (1965): Ferno Lopes.
Crnica de D. Pedro I. Porto: Livraria Civilizao. Edio digitalizada e
revista por Jos Barbosa Machado, cedida pelo revisor.
254
255
256
257
1. introducin
Cando en 1905 a Asociacin Iniciadora y Protectora de la Academia
Gallega de La Habana impulsou a creacin da RAG, encomendoulle como
unha das principais tarefas a de realizar o dicionario da lingua galega.
Neste momento xa se coecan algns dicionarios do galego, todos eles
de carcter bilinge, que no fondo tian sempre como punto de referencia
o casteln. Pero nin o dicionario de F. J. Rodrguez (1863), nin o de Cuveiro
(1876), nin o de Valladares (1884) podan considerarse obras de referencia
nin sequera cos criterios lexicogrcos pouco esixentes da poca, anda
que hai que recoecer que a obra de Valladares supuxo un adianto considerable con respecto s das anteriores. En realidade, no nico aspecto en
que os lexicgrafos do XIX superaron o labor realizado no XVIII polos seus
antecesores Sarmiento e Sobreira, foi en darlles s sas obras un formato
mis prximo ao que hoxe consideramos un dicionario. Coa vontade de
dar un paso cualitativo dentro da lexicografa galega comezaron os traballos do Diccionario da RAG cun fervor realmente admirable. Para a sa
realizacin pediuse a colaboracin de todos os acadmicos da institucin
e daquelas persoas que naquel momento estaban en posesin dalgunha
recolla lxica galega ou con ganas de levala a cabo. Desde aquela houbo
diversas contribucins importantes no campo da lexicografa galega, que
non este o momento de examinar nin de valorar. Foi no 1990 cando se
deron os pasos mis rmes no aspecto metodolxico na lexicografa monolinge, coa publicacin por parte do Instituto da Lingua Galega e a Real
Academia Galega do Diccionario da lingua galega (ILG/RAG 1990), Anda
que contaba s con 12.000 entradas, supuxo un avance decisivo en aspectos metodolxicos tan importantes como:
258
259
Para a anlise mis polo mido das caractersticas desta obra pode verse Gonzlez Gonzlez (1996).
260
261
262
263
264
- Ficcin
- Outros
Na constitucin temtica do corpus tivronse en conta non s as
reas temticas, senn tamn as subreas. Por exemplo, na rea temtica
Economa e poltica, estn representadas as subreas de:
- Poltica
- Desenvolvemento e infraestruturas
- Emprego, traballo, industria
- Sector servizos
- Explotacin primaria
- Economa, facenda, bolsa
- Ordenacin sanitaria
- Xustiza, lexislacin, dereito
- Asuntos sociais
- Ordenacin acadmica
As buscas e concordancias pdense realizar sobre o conxunto do corpus, ou ben restrinxilas a unha ou varias reas temticas. O usuario pode
seleccionar tamn o perodo cronolxico que sexa do seu interese:
- 1975-1979
- 1980-1984
- 1985-1989
- 1990-1994
- 1995-1999
- 2000-2004
Deste corpus existen das versins en lia. A primeira contn 17.5 millns de formas, e est dispoible no enderezo http://corpus.cirp.es/corga.
A segunda, sobre a que anda se est a traballar, contn neste momento
13.3 millns de formas, e est dispoible no enderezo http://corpus.cirp.
es/corgaxml2.
A segunda versin en .xml creouse para posibilitar un sistema de recuperacin de informacin mis exible e efectivo, e obrigou a unha codicacin e deseo dunha estrutura formal que dea conta da disposicin
2.
No momento da publicacin o volume de formas incrementouse xa notablemente. A situacin actual pdese consultar na pxina do Centro Ramn Pieiro para a Investigacin en Humanidades (www.cirp.es).
265
interna caracterstica de cada un dos grandes tipos de textos (xornalsticos, ensaio, novela...).
Estase ultimando unha ferramenta de anlise gramatical automtica
e de desambiguacin, que permitir a lematizacin automtica, a actualizacin da base cun custo econmico baixo, e buscas secuenciais por categoras (por exemplo, verbo tirar + preposicin).
266
vez se lles dea unha maior importancia nos dicionarios modernos. Tense
dito moitas veces que non se coece en profundidade unha lingua ata
que non se coecen ben os seus fraseoloxismos. Pero, ademais, as como
no lxico dunha lingua se reicte dalgunha maneira a historia e as experiencias dos pobos, a fraseoloxa revlanos por veces dun xeito moi transparente a maneira particular de ver a realidade de cada sociedade ou de
cada cultura.
4. a macroestrutura do drag
4.1. As entradas
O Dicionario da Real Academia Galega contn ao redor de cincuenta
mil artigos lexicogrcos, e as sas entradas estn baseadas no Vocabulario ortogrco da lingua galega (VOLG), con algns engadidos:
(a) Considerouse conveniente completar algunha familia de palabras
que no VOLG apareca unicamente cos seus membros mis relevantes.
(b) Introducronse algunhas voces non includas no VOLG, xeralmente
pertencentes a linguas de especialidade, pero que presentan certo uso.
(c) Completouse algunha serie de palabras que constiten un conxunto completo claramente delimitado, e que por algunha razn quedou incompleta no VOLG.
O VOLG unha proposta de vocabulario normalizado da lingua galega.
A primeira edicin provisoria sau no ano 1990, en edicin non venal, e a
primeira edicin ocial do ano 2004. Actualmente pdese consultar na
pxina da RAG a versin en lia deste vocabulario (www.realacademiagalega.org). Esta versin en lia presenta xa algunhas correccins e novidades con respecto editada en papel. A realizacin desta proposta de vocabulario normalizado da lingua galega esixiu realizar unha seleccin de
formas dialectais dentro do propio galego, levar a cabo unha depuracin
de castelanismos e de voces espurias innecesarias, facer unha proposta de
ortografa, acentuacin e morfoloxa correctas, e, en certa medida, afrontar tamn o problema de actualizacin e modernizacin do lxico.
Foi necesario, en primeiro lugar, facer unha seleccin de formas dialectais. Por poer un exemplo que sexa claramente comprensible, para designar a rbore betulla, de entre un gran nmero de formas existentes (bidueiro,
bedueiro, bidoeiro, bidoeira, budueira, abedoeira, abedueiro..., bedugo, bedulo,
267
dulo, bdalo, bido, budio...) foi necesario escoller unha delas, neste caso bidueiro, para a norma estndar. Evidentemente, as escollas non poden ser
feitas de xeito arbitrario, senn seguindo unha serie de criterios da maneira
mis coherente posible. Os principais criterios seguidos no VOLG para a seleccin dialectal foron: a autenticidade da forma, a extensin xeogrca, a
tradicin literaria e a coherencia interna dentro da mesma familia.
O VOLG signicou un avance extraordinario tamn na depuracin de
castelanismos e voces espurias innecesarias. O prstamo lingstico pode
ser necesario en certos casos, cando designa unha realidade nova, pero
debe evitarse que unha voz fornea retire da circulacin outra galega que
designe o mesmo concepto. Por iso se excluron castelanismos moi introducidos, como por exemplo abonar, para restitur no seu lugar a forma
patrimonial galega aboar; ou lusismos con certa implantacin literaria,
como aceitona, anceio ou saudade, para darlles prioridade s voces propiamente galegas oliva, ansia ou devezo, e soidade.
O VOLG unha proposta de ortografa correcta para a lingua galega.
Na tradicin escrita do galego moderno existen tendencias grcas alleas
historia e evolucin da propia lingua. Son frecuentes grafas debedoras do casteln como *acibro, *trebo, *barrer, e hai grafas que s se explican baixo a inuencia do portugus, como por exemplo *povo. Todas elas
foron restitudas forma ortogrca mis acorde cos criterios grcos do
galego: acivro, trevo, varrer, pobo.
A presin do casteln, e a penetracin dun gran nmero de cultismos
a travs desta lingua, introduciu nos falantes galegos un alto nmero de
acentuacins antietimolxicas, que foi necesario corrixir na proposta normativa do lxico galego: fronte s realizacins populares, introducidas a
travs do casteln, do tipo *smose, *dicese, *atmsfera, *isobara, *fotolise,
*monolito..., propuxronse as formas con acentuacin mis etimolxica
osmose, diocese, atmosfera, isbara, fotlise, monlito...
No VOLG tamn se fai unha proposta de morfoloxa correcta para a
lingua galega: indcase o xnero correcto de cada substantivo (condnanse, por exemplo, usos como *o fraude, *o sndrome, fronte s formas recomendadas a fraude, a sndrome), indcase o rxime de cada verbo, do que
aparecen usos incorrectos debidos interferencia co casteln (quecer (i) /
quentar, adormecer (i) / adormentar, amarelecer (i) / amarelar).
Naqueles casos en que a formacin do feminino ou do plural pode ser
problemtica, tamn se informa sobre este particular: afgn / f: afg, pero
cachn / f: cachana.
Outra funcin que tivo que cumprir o VOLG a de actualizacin e modernizacin do lxico. O galego, debido s especiais circunstancias hist-
268
269
270
271
Esta prctica non se leva a cabo cando a forma irregular cadra xusto
ao lado do lema, porque neste caso o usuario, ao buscar a forma irregular,
encontra xa facilmente o lema correspondente. Isto ocorre, por exemplo,
con actriz, que non gura como entrada porque caera xustamente despois de actor.
Hai un caso especial no que se lle d cabida forma morfoloxicamente irregular mesmo que alfabeticamente lle cadre xusto ao lado do seu
lema: cando a forma do feminino ten algunha acepcin distinta que non
pose a forma masculina:
duque s.m. (f. duquesa) Nobre do mis alto rango, despois do prncipe e inmediatamente superior ao marqus. Fomos visitar o pazo dos duques de Alba.
duquesa s.f. 1. V. duque. 2. Muller do duque. Acudiu a duquesa en representacin do seu marido.
Cando non existe un elemento semntico dominante, asgnase ao primeiro, e remtese desde o outro:
posesorio -a adx. Relativo ou pertencente posesin. A lei esixa o transcurso dun prazo posesorio de
dez anos. Xuzo posesorio. V. xuzo.
272
cerrar.
cerreta.
zarrote s.m.
cerrote.
zarrulo s.m.
cerrulo.
zarrume s.m.
cerrume
zarcear v.i.
zarzallar.
zarcelo s.m.
sarcelo.
(b) O das formas que son incorrectas en galego, que van marcadas cun
asterisco, e desde as cales se remite para a forma normativa galega:
*almidn s.m. amidn.
5. a microestrutura
Que contn e como se organiza un artigo lexicogrco no DRAG? O
DRAG ofrece informacin sobre a forma grca do lema; informacin
gramatical; informacin sobre a pronunciacin (s nos casos conitivos);
informacin diastrtica e diafsica; informacin tecnolectal; informacin
sobre o carcter da acepcin (g., por ext.); a denicin de cada acepcin;
observacins referidas acepcin; exemplos; sinnimos, antnimos e palabras prximas semanticamente; unidades pluriverbais nas que ocupa
un lugar central a entrada, e observacins referidas ao enunciado.
273
5.1. O lema
O lema a forma non marcada: a do masculino singular, no caso dos
substantivos e adxectivos; e a do innitivo, no caso dos verbos. Encabeza
sempre o artigo, e encabeza o pargrafo que contn este. Aparece sempre marcado tipogracamente dunha maneira que se faga mis visible
e que destaque sobre o resto da informacin, para xebrar con claridade a
informacin pertencente a un artigo da dos contiguos, e sobre todo, dado
que os artigos estn dispostos segundo a orde alfabtica dos lemas que
lle serven de entrada, para facilitarlle a busca ao usuario. No DRAG o lema
aparece marcado tipogracamente en letra grosa.
274
(d) s veces a informacin sintagmtica sobre rexencia de certas preposicins vai indicada entre parnteses a continuacin da entrada e co
mesmo tipo de letra da entrada:
carecente (de) adx. Que ten ou amosa algunha carencia. Carecente de estmulos e ilusins e
invadida pola nostalxia decidiu regresar sa vila natal. SIN. carecedor, carente.
275
dunha accin. Non puxo ningunha pga polo cambio de da. SIN. dificultade, impedimento,
inconveniente, obstculo, pexa, traba.
276
5.7. A denicin
5.7.1. Que a denicin?
A denicin consiste en facer corresponder unha unidade lxica,
descoecida ou mal coecida, cunha serie de unidades pertencentes ao
mesmo sistema lingstico, organizadas segundo as estruturas sintagmticas deste sistema, e que sexa capaz de remitir ao mesmo signicado
e de determinar no usuario do dicionario a elaboracin conceptual deste
signicado.
5.7.1.1. Denicins propias / denicins impropias
xa clsica a distincin entre denicins propias e denicins impropias, anda que en realidade estas ltimas non son verdadeiras denicins.
As denicins impropias estn formuladas en metalingua de signo, e
non se deixan someter lei da sinonimia. Non son verdadeiras denicins (qu signica a palabra), senn explicacins (cmo e para qu se
emprega a palabra). As palabras s que se aplica este tipo de denicin
interxeccins e palabras gramaticais (preposicins, conxuncins, pronomes, artigos e certos adverbios, adxectivos e verbos) son realmente
indenibles:
277
lle, lles pron. pers. Formas tonas de terceira persoa singular e plural respectivamente, en funcin
de complemento indirecto. Fxenlles pedir perdn. Non lles soubo contestar. OBS. lle e lles contraen cos
pronomes persoais o, a, os, as e lo, la, los, las dando lugar s formas llo, lla, llos, llas e llelo, llela, llelos,
llelas, respectivamente.
278
b) A exclusin
O procedemento da exclusin consiste en denir unha palabra negando o seu oposto (por exemplo, abandonar = non continuar). Neste
caso non se trata dun estudo interno do semema do denido, senn dun
estudo externo que supn a existencia e o coecemento de parellas de
contrarios. Isto o que atopamos en denicins como as seguintes:
abandonar v.t.. 3. Non continuar con [algo]. Abandonaron os seus plans de ataque. Os guerrilleiros
abandonaron a loita. // v.p. 4. Non coidar de si. Dun tempo para ac abandonouse de tal xeito que parece
un farrapeiro. SIN. desleixarse.
lizquente adx. Nin fro nin quente. Non me gusta o leite lizquente, quroo fervendo. SIN. morno,
temperado, tpedo.
amuar v.i. 4. Non responder ao que preguntan, baixando a cabeza. Por mis que lle preguntaban, non
conseguan nada, ela amuaba.
c) A inclusin negativa
Neste tipo de denicin existe un inclunte que serve para negar o exclunte. Trtase, pois, dunha negacin semntica, non dunha negacin
sintctica. o que aparece en:
279
impericia s.f. Falta de pericia. A impericia da tripulacin provocou o afundimento do barco. ANT. destreza, pericia. CF. inhabilidade.
avitaminose s.f. Med. Carencia ou deficiencia de vitaminas, que pode causar enfermidades. O escorbuto
unha das numerosas enfermidades provocadas por avitaminose.
280
5.9 Os exemplos
Todas as acepcins levan un ou varios exemplos, que contriban a:
(a) aclarar mis o signicado, ofrecendo trazos do signicado que non
son substanciais, pero si habituais;
281
Como pode observarse tamn no exemplo anterior, cando un sinnimo ou antnimo o de todas as acepcins, vai ao nal de todo, precedido
do smbolo .
282
283
indica que a informacin que se ofrece a continuacin vlida para todas as acepcins da entrada;
7.3. Abreviaturas
Non necesario insistir na importancia que nunha obra como un dicionario ten a economa de espazo. Por iso, en poucas obras se fai un uso
tan profuso das abreviaturas. A maiora delas estn destinadas a facilitar
informacin sobre o uso, informacin gramatical, informacin tecnolectal e informacin sobre as redes lxicas. Velaqu as mis utilizadas no
DRAG para cada un destes grupos.
284
anticuado ou antigo
coloquial
desusado
familiar
literario
pexorativo
popular
propio
vulgar
absoluto (verbo)
adverbio
adxectivo
artigo
artigo determinado
artigo indeterminado
contraccin
conxuncin
demostrativo
exclamativo
feminino
futuro
futuro do pretrito
intransitivo
imperativo
imperfecto
indenido
indicativo
innitivo
innitivo conxugado
interrogativo
interxeccin
irregular
locucin
locucin adverbial
locucin adxectiva
loc. conx.
loc. lat.
loc. prep.
loc. s.
loc. s. lat.
m.
n.
num.
num. card.
num. ord.
p.
part.
perf.
pl.
plusc.
pos.
pref.
prep.
pres.
pret.
pron.
pron. pers.
rel.
s.
sing.
subx.
t.
v.
xer.
locucin conxuntiva
locucin latina
locucin preposicional
locucin substantiva
locucin substantiva latina
masculino
neutro
numeral
numeral cardinal
numeral ordinal
pronominal
participio
perfecto
plural
pluscuamperfecto
posesivo
prexo
preposicin
presente
pretrito
pronome
pronome persoal
relativo
substantivo
singular
subxuntivo
transitivo
verbo
xerundio
7.3.3. Tecnolectos
Aeron.
Agr.
Anat.
Antig.
Antrop.
Arqueol.
Arquit.
Art.
Aeronutica
Agricultura
Anatoma
Antigidade clsica
Antropoloxa
Arqueoloxa
Arquitectura
Arte
285
286
Astrol.
Astron.
Bibliol.
Biol.
Bioqum.
Bot.
Catol.
Cinem.
Cir.
Dep.
Der.
Econ.
Electr.
Electrn.
Enxe.
Farm.
Filos.
Fs.
Fon.
Fot.
Gram.
Herld.
Hist.
Impr.
Inform.
Ling.
Lit.
Mar.
Mat.
Mec.
Med.
Metal.
Meteor.
Mtr.
Micol.
Mil.
Miner.
Mit.
Ms.
pt.
Astroloxa
Astronoma
Bliblioloxa
Bioloxa
Bioqumica
Botnica
Catolicismo
Cinematografa
Cirurxa
Deportes
Dereito
Economa
Electricidade
Electrnica
Enxeera
Farmacia
Filosofa
Fsica
Fontica e Fonoloxa
Fotografa
Gramtica
Herldica
Historia
Imprenta
Informtica
Lingstica
Literatura
Martimo
Matemticas
Mecnica
Medicina
Metalurxia
Meteoroloxa
Mtrica
Micoloxa
Milicia
Mineraloxa
Mitoloxa
Msica
ptica
Paleogr.
Petrogr.
Pint.
Pol.
Psic.
Psiq.
Qum.
Radiod.
Relix.
Ret.
Silv.
Sociol.
Taurom.
Telecom.
Teol.
Tip.
Top.
Vet.
Xent.
Xeogr.
Xeol.
Xeom.
Zool.
Paleografa
Petrografa
Pintura
Poltica
Psicoloxa
Psiquiatra
Qumica
Radiodifusin
Relixin
Retrica
Silvicultura
Socioloxa
Tauromaquia
Telecomunicacins
Teoloxa
Tipografa
Topografa
Veterinaria
Xentica
Xeografa
Xeoloxa
Xeometra
Zooloxa
antnimo
comprese
sinnimo
7.3.5. Outras
ac.
a. C.
d. C.
ex.
ext.
obs.
sc.
V.
acepcin
antes de Cristo
despois de Cristo
exemplo
extensin
observacin
sculo
vxase
287
288
289
Comenzar diciendo, para aquellos que no conozcan bien la naturaleza de esta institucin, que el Institut dEstudis Catalans es una corporacin acadmica, cientca y cultural que tiene por objeto la alta investigacin cientca, principalmente la de todos los aspectos de la cultura
catalana. Fue creado en 1907 por un acuerdo de la Diputacin Provincial
de Barcelona, ms tarde bajo la tutela de la Mancomunitat de Catalunya, y, despus de un primer perodo oreciente y de una existencia agitada a merced de los avatares por los que ha pasado el pas durante el
segundo y tercer cuarto del siglo XX, actualmente su situacin legal se
basa en un Real Decreto del ao 1976. De acuerdo con los estatutos vigentes sus nalidades son:
(a) ocuparse del estudio de la lengua catalana, establecer su normativa y velar para que su proceso de normalizacin sea coherente en todo su
mbito lingstico;
(b) contribuir a la planicacin, la coordinacin, la realizacin y la
difusin de la investigacin en las distintas reas de la ciencia y de la
tecnologa, y
(c) impulsar con las actividades que le son propias el progreso y el desarrollo de la sociedad y realizar, cuando corresponda, trabajos de asesoramiento de los poderes pblicos y otras instituciones.
La corporacin se halla estructurada en cinco secciones temticas: la
Histrico-Arqueolgica, la de Ciencias Biolgicas, la de Ciencias y Tecnologa, la Filolgica y la de Filosofa y Ciencias Sociales. La funcin normativa con relacin a la lengua es competencia del conjunto de la institucin,
pero tanto esta funcin especca como el resto de trabajos relacionados
con la lengua conciernen especialmente a su Seccin Filolgica.
290
La idea del diccionario est vinculada a la Seccin Filolgica desde antes de su creacin; en la memoria presentada a la Diputacin de Barcelona para promover la ampliacin del Institut dEstudis Catalans con dos
nuevas secciones, Enric Prat de la Riba menciona el diccionario como la
misin de la propuesta Seccin Filolgica, a la cual denomina tambin
Academia de la Lengua Catalana:
Perx, al costat de la secci histrich-arqueolgica ja existent y de la secci de ciencies, haura de
constituirse la secci filolgica, s a dir, lAcademia de la Llengua Catalana. Els catalans que han
fet de lestudi daquesta llengua el centre de totes les seves activitats, suniren als poetes y prosadors que ab la seva producci literaria lhan refeta y salvada. La seva missi sera fer el diccionari
de la nostra llengua, magna empresa en que trobaren la col-laboraci entusiasta, amorosa, de
tots els catalans, pera inventariar la llengua; de les altres seccions de lInstitut pera definicions,
descripcions, historia de mots, gravats, etz. (Prat de la Riba 1910: 46).
Observemos que la misin encargada a la Seccin Filolgica no se limita sin embargo a la confeccin del diccionario de la lengua, sino que se
extiende tambin a su estudio cientco y a aspectos de carcter social,
con lo cual esta institucin queda congurada no como una academia
que tiene estrictamente como objetivo jar un modelo de lengua, sino
que tambin le son encargados el estudio de la lengua y el fomento del
uso lingstico.
Cmo ha llevado a cabo la Seccin Filolgica del Institut dEstudis
Catalans esta misin, especialmente en el aspecto lexicogrco, que es el
que nos interesa ahora? La actividad del Institut dEstudis Catalans en sus
distintos campos de actuacin ha estado fuertemente condicionada a lo
largo de su historia por diversos factores de naturaleza muy distinta, unos
de orden externo y otros de orden interno. Con la denominacin genrica
de factores de orden externo me reero a la situacin poltica y social a
lo largo del siglo XX, que, llegando al extremo de reducir la institucin a
la clandestinidad durante una buena parte de su existencia, ha impedido
que cumpliera en el momento debido los principales objetivos para los
que fue creada. Con la denominacin de factores de orden interno me
291
reero a los inherentes a la mayor parte de las instituciones acadmicas, ligados a la dicultad para llegar a acuerdos sobre todo a causa de
las diferencias de criterios en algunas cuestiones fundamentales o para
planicar adecuadamente acciones coherentes y viables (Rafel 1996). La
combinacin de estos factores de naturaleza diversa permite distinguir
diferentes perodos, condicionados por los acontecimientos y caracterizados por la naturaleza de las actividades llevadas a cabo.
Un breve perodo inicial, que podemos establecer entre 1911 y 1918, se
caracteriza por una actividad importante en el seno de la Seccin Filolgica. Sabemos, sobre todo a travs de las notas que Antoni M. Alcover publicaba en el Butllet del Diccionari de la Llengua Catalana, que en las primeras reuniones de esta institucin se discutieron los planes de actuacin
para alcanzar los objetivos jados. Podemos deducir que las discusiones
se centraron en el modelo de diccionario que haca falta y, en denitiva,
en el modelo de lengua que haba de ser objeto de las deliberaciones y de
la labor de la Seccin. El resultado fue que, a parte de trazar un plan de publicaciones diversas, la Seccin acord adoptar el proyecto de diccionario
que Alcover haba promovido desde 1901, que menciona como nuestro
diccionario y el Diccionario gordo de nuestra lengua, y al mismo tiempo acuerda la publicacin de un diccionario cataln provisional, basado
en la lengua escrita, dando escasa cabida a las variantes dialectales, el
cual haba de reejar las palabras ms obvias y corrientes de la lengua
literaria; segn Alcover, la direccin de este ltimo diccionario haba sido
encargada a l mismo y a Pompeu Fabra. El texto publicado por Alcover
contiene varios elementos que creo que son realmente signicativos para
comprender la problemtica que nos ocupa:
Tamb acord la Secci Filolgica publicar un Diccionari catal provisional, propiament del llenguatge
escrit, sense aficarse gayre dins les variedats i opulencia lexica dels diferents dialectes catalans, tant
vitencs, gracies a Deu, a Catalunya espanyola i a Catalunya francesa, a les Balears i an el Reyne
de Valencia, aix es, un Diccionari aont sincloguen gran part dels mots que surten per tot arreu
dins els autors i dems monuments escrits antics i moderns i que nos troben desgraciadament
dins cap dels Diccionaris catalans actuals. Naturalment aix no ha desser el nostre Diccionari que
tantes vegades hem proms, que fa tants danys quel preparam, quens costa tants i tants i tants
de sacrificis, per el qual ens han enviades miles i miles de cdules quumplen tants de calaixos de
la nostra Calaixera. El Diccionari aix com el bosquetjrem dins la Lletra de convit, aix com hem dit
tantes de vegades que seria, aix com el somiam des de lany 1901, ha desser lobra-capital de la
Secci Filolgica; an aqueixa obra estem abocats nosaltres i una partida damics fa tants danys,
i hi seguirem abocats i shi abocarn tots els elements de la Secci Filolgica i tots els que dita
Secci puga moure i desxondir per tot arreu. Per aqueixa obra envirem lany 1908 a Alemanya els
tres pensionats de la Diputaci, En Griera, En Montoliu i En Barnils, que ja han fets an aquelles
Universidats els estudis filolgics queren del cas, i ara se posaran a la tasca cent voltes gloriosa del
Diccionari gros de la nostra llengua, aont sha daplegar tota la llengua catalana, lantiga, la moderna,
292
293
294
295
Les Oficines Lexicogrfiques, que havien pogut continuar actives durant la Dictadura b que sota
un altre nom, com a servei de la Diputaci, reprenen llur lligam amb la Secci Filolgica i es veuen
reforades amb lingrs de nous collaboradors, com Joan Coromines i el qui us parla, que vnen
a fer costat als antics Manuel de Montoliu, Josep M. Casas i Homs i Francesc Torres, als quals
suneix, ja comenada la guerra, Josep Miracle. Tots plegats, sota la direcci de Fabra, intensifiquen la replega de materials, amb lesperana de poder comenar aviat la redacci del Diccionari
de lInstitut (Aramon 1982: 36).
296
297
298
como esta, centrada ms en el lxico comn, sin tantas palabras especializadas, destinado a un usuario con unas necesidades ms elementales,
til para la escuela, etc.; as, el ao 1997 tom el acuerdo de publicar un
diccionario abreviado con el nombre de Diccionari manual de la llengua
catalana. Este diccionario, que aparece en el ao 2001 (IEC 2001), no es, sin
embargo, una mera versin abreviada del anterior, sino que en su elaboracin se aplican una serie de acciones encaminadas a hacer de l una
obra ms manejable y comprensible para el pblico a que va destinada.
Por otra parte, por el hecho de ser preparado cuando los trabajos de la segunda edicin del diccionario normativo estaban ya bastante avanzados,
se pudo beneciar de las innovaciones que ya se haban introducido o
que se haba decidido introducir.
Por otra parte, recin terminada la primera edicin del Diccionari de
la llengua catalana, se comienza, de hecho, su revisin; sin embargo, los
trabajos sistemticos de preparacin de la segunda edicin de la obra no
comienzan hasta 1997. El conjunto de actuaciones previstas se estructur
en cuatro grandes apartados:
(1) Aplicacin de criterios lexicogrcos.
(2) Revisin del lxico de especialidad:
(a) Revisin de la nomenclatura.
(b) Revisin de las deniciones.
(3) Tratamiento de las propuestas de enmienda.
(4) Revisin del lxico comn.
Los criterios a los que se reere el primer apartado son los siguientes:
(1) Numeracin de las acepciones y de las subacepciones.
(2) Ordenacin de las acepciones.
(3) Regularizacin de grupos semnticos y morfolgicos.
(4) Supresin del punto y coma como separador de acepciones.
(5) Acepciones y subacepciones constituidas por ejemplos sin denicin.
(6) Entrada de ajos.
(7) Entrada de gentilicios.
(8) Distribucin de cdigos de categora gramatical.
(9) Tratamiento de los verbos pronominales.
(10) Modicacin de deniciones impropias.
(11) Regularizacin de las remisiones.
(12) Tratamiento de las marcas valorativas.
(13) Marcaje de dialectalismos.
299
300
Segunda Edicin
Diferencia
Entradas
67.566
69.988
2.422
Subentradas
17.000
17.343
343
Acepciones
103.000
115.117
12.117
Ejemplos
44.000
50.064
6.064
Una vez terminados los trabajos de revisin y actualizacin, la segunda edicin del diccionario fue raticada por la Seccin Filolgica en febrero de 2006 y en estos momentos ha pasado en el proceso de publicacin.
El libro vi la luz en 2007.
301
302
Figura 1. Reparticin del texto literario entre sus cuatro grupos tipolgicos
Figura 2. Reparticin del texto no literario entre sus diez grupos tipolgicos
303
hallara representado cada uno de los subtipos establecidos de una manera aproximadamente proporcional al volumen de texto producido en
aquel perodo. Hay que decir todava que, por lo que se reere a la lengua
no literaria, la mayor parte de las reas temticas o funcionales han sido
divididas en un nmero variable de subreas, hasta un mximo de diez,
y se han seleccionado textos de cada una de ellas; por lo que respecta a
los textos literarios, sin necesidad de subdividir los gneros de una manera sistemtica, se tuvieron en cuenta diferencias de carcter temtico
o de otra naturaleza (por ejemplo, narrativa imaginativa, libros de viajes,
memorias; teatro costumbrista o clsico; poesa religiosa o profana, etc.).
Con estas medidas se intent lograr el mximo equilibrio entre las ms
variadas manifestaciones de la lengua escrita.
Una caracterstica destacada del CTILC es que se trata de un corpus totalmente lematizado; en l se ha llevado a cabo una operacin de anlisis
lingstico en virtud de la cual se ha categorizado gramaticalmente cada
una de las ocurrencias de cada forma grca y se ha asociado a una unidad lxica de referencia; con ello se cubren dos objetivos: por una parte
se desambiguan formas grcas que corresponden a formas gramaticales
distintas (de una misma serie exiva o de series exivas correspondientes
a lemas distintos) y por otra parte, como consecuencia de la misma operacin, se relacionan entre ellas las distintas formas de una serie exiva, las
cuales quedan asociadas a un mismo lema. El CTILC, por el hecho de estar
completamente lematizado, tiene un elevado nivel de funcionalidad; realizando una consulta a partir de un lema obtenemos informacin sobre todas las formas de exin correspondientes, con las posibles variantes grcas o formales que aparecen en textos de diferentes pocas, y tambin a
las eventuales formas derivadas mediante ajos apreciativos o intensivos,
para las cuales, siguiendo criterios lingsticos, no se ha creado un lema
propio, sino que se han asociado al lema correspondiente a su base lxica.
El nmero de lemas a que ha dado lugar esta operacin es de 149.185, que
corresponden a 678.386 formas gramaticales y a 51.253.680 ocurrencias del
texto (el total de ocurrencias del corpus menos los nombres propios).
El CTILC fue constituido entre los aos 1985 y 1997; podemos considerarlo, pues, un trabajo pionero en nuestras latitudes. Una vez terminado,
dispone de un sistema de consulta y explotacin concebido especialmente para su utilizacin con nalidades lexicogrcas, pero que es tambin
til para cualquier tipo de estudio que se pretenda elaborar a partir de datos empricos. En este momento el CTILC se puede consultar pblicamente por Internet a travs de la web del Institut dEstudis Catalans; el procedimiento de consulta permite obtener una serie de contextos relativos
304
DEBJ
DLCL
DMCF
DVCE
NDMA
DMCT
DGMG
DCVB
DPCV
DGLC
DGFP
DIEC
La informacin que contienen estos diccionarios fue trasladada a soporte informtico y el texto fue tratado de modo que permite la reproduccin de los originales siguiendo los criterios tipogrcos de cada uno. Los
diferentes elementos que conguran la estructura de los distintos diccio-
305
306
como el resultado de una investigacin especca, su realizacin persigue el mximo rigor cientco, su formulacin aspira a un alto grado de
explicitud y utiliza una cierta formalizacin en su lenguaje y en su presentacin. Como consecuencia de ello, sus usuarios ideales son los profesionales de la lengua; sin embargo, esta obra lexicogrca no pretende dirigirse solamente a especialistas, sino que, adems de ser til para
estos, aspira a estar al alcance de cualquier lector medianamente culto
interesado por los problemas de la lengua en cuanto que usuario: se pretende, pues, presentar el contenido del diccionario combinando el rigor
en el tratamiento de la informacin con la claridad expositiva y con la
facilidad de interpretacin.
La elaboracin de un diccionario descriptivo por una academia de
la lengua puede parecer una contradiccin, puesto que este diccionario
contiene palabras, acepciones o estructuras sintcticas que no son reconocidas por la normativa vigente, a pesar de encontrarse documentadas
en los textos; por una parte, este diccionario puede ser considerado ms
cientco que el normativo, porque intenta dar cuenta de una manera
sistemtica de la realidad de la lengua a partir de datos empricos, pero
por otra parte puede ser visto como un peligro para el uso lingstico
considerado correcto. En el caso que nos ocupa, este tema se debati
ampliamente en el seno de la Seccin Filolgica, la cual decidi que se
identicara con una marca visible todos aquellos elementos (entrada,
categora, acepcin, patrn sintctico, etc.) que no gozaran de sancin
normativa en el momento de divulgarlos.
En el aspecto material, tanto desde el punto de vista del proceso
de redaccin como en sus resultados nales, el proyecto de diccionario
descriptivo, como ya he dicho, pretende incorporar los ltimos avances
metodolgicos y tecnolgicos que se han producido en el campo de la
lexicografa. Como consecuencia de ello tiene las caractersticas de un
diccionario electrnico, en forma de base de datos multifuncional que
permite utilizaciones diversas, tanto relacionadas con la investigacin
como con la difusin de la obra; si nos centramos en la difusin, permite
las ms variadas posibilidades: por una parte, puede ser divulgado por
va electrnica a travs de Internet y, por otra parte, puede servir de base
para diversidad de publicaciones, sea en papel, sea en cualquiera de los
soportes electrnicos disponibles.
Una de las caractersticas ms destacadas del DDLC, que conforma
todo el diccionario, es el hecho de utilizar el CTILC como base fundamental y fuente exclusiva; se trata, pues, en sentido estricto, de un diccionario
basado en corpus. No es este el momento ni el lugar de detallar las venta-
307
308
309
310
311
312
el sistema particular de progresin en la redaccin a que acabo de referirme. Este nmero de artculos redactados corresponde a un poco ms
de la tercera parte de la extensin prevista del diccionario. Como datos
estadsticos que pueden ser de inters podemos decir que estos 32.241 artculos contienen 76.173 acepciones, 51.596 colocaciones, 119.099 ejemplos,
7.440 conversiones sintcticas, 6.651 locuciones, 10.510 variantes, 7.440 derivados y 21.720 unidades de informacin complementaria. El nmero de
obras del corpus que han sido objeto de alguna cita en los ejemplos del
diccionario es 3.191.
2.2.4. Edicin electrnica del DDLC
Desde el mes de enero de 2005 el DDLC es consultable a travs de Internet en forma de edicin electrnica. Esta edicin electrnica consta de un
componente nuclear, constituido por el conjunto de artculos redactados,
y de unos componentes accesorios, que son una Presentacin, muy breve
y sinttica, y una Gua de utilizacin, ms larga y compleja en la cual se
encuentran explicados los distintos componentes del diccionario. Dado
que las consultas se realizan directamente sobre la base de datos del diccionario, la edicin electrnica est continuamente actualizada: por una
parte, el nmero de artculos consultables va aumentando a medida que
se da por terminado el proceso de redaccin de cada grupo, y, por otra
parte, se incorpora automticamente cualquier modicacin de que sea
objeto la parte ya redactada.
Con esta edicin electrnica, el DDLC se pone a disposicin del pblico
mediante una estructura dinmica que permite la relacin entre elementos de un mismo artculo o de distintos artculos del diccionario y tambin con elementos complementarios externos a los propios artculos a
travs de los vnculos activos adecuados.
3. el futuro inmediato
Con la nalidad de planicar las lneas generales de las actuaciones
futuras y evitar en lo posible los pasos en falso y las decisiones precipitadas, el ao 1996, recin publicada la primera edicin del DIEC, la Seccin
Filolgica y el Consejo Permanente del Institut dEstudis Catalans aprueban un plan de actuacin lexicogrca para los aos posteriores. Dicho
plan establece:
313
(a) que se llevar a cabo una revisin sistemtica y una cierta remodelacin de este diccionario con el n de publicar una segunda edicin
de la obra;
(b) que se iniciar la redaccin de un diccionario de carcter descriptivo sobre la base del Corpus Textual Informatitzat de la Llengua Catalana,
una vez nalizados los trabajos de constitucin de este corpus, y
(c) que se emprender la elaboracin de un diccionario normativo diseado sobre unas nuevas bases establecidas a partir de un debate en la
Seccin Filolgica.
El primero de estos objetivos se ha conseguido ya, como acabamos de
ver, con la terminacin de los trabajos de la segunda edicin del Diccionari de la llengua catalana. Ha habido un notable retraso sobre las previsiones iniciales, pero nalmente la Seccin Filolgica ha sancionado la obra,
que ya ha sido publicada. El segundo objetivo, el inicio de la redaccin del
Diccionari descriptiu de la llengua catalana, se cumpli en 1998, inmediatamente despus de la conclusin de los trabajos del CTILC. Como hemos
visto, los trabajos de este complejo proyecto estn en marcha y el ritmo
de redaccin es altamente satisfactorio; actualmente se redactan ms de
7.000 artculos por ao, lo cual permite estimar la nalizacin de la redaccin dentro de unos ocho aos.
El nico objetivo que queda todava pendiente es, pues, la elaboracin
de un nuevo diccionario normativo que no sea la mera actualizacin del
que se acaba de terminar. Ello supone un debate a fondo, por una parte,
sobre cmo debe entenderse en el siglo XXI un diccionario de carcter
prescriptivo, con todas sus implicaciones sociolgicas, y, por otra parte,
sobre la estructura y la naturaleza de este diccionario en sus mltiples aspectos. Este es, pues, el principal reto que tiene planteado en el momento
actual la Seccin Filolgica del Institut dEstudis Catalans por lo que respecta a su actividad lexicogrca. Llegar a conclusiones y a acuerdos sobre este punto requiere un debate complejo, puesto que entran en juego
opiniones, criterios, sensibilidades y, en suma, ideologas distintas; debemos creer, con todo, que se abordarn con serenidad los variados aspectos
de esta problemtica y que el proyecto que resulte de las deliberaciones
se llevar a buen trmino con la debida ecacia.
314
315
1. nota introdutria
Uma das primeiras preocupaes da Real Academia das Cincias, fundada em Dezembro de 1779, foi desde logo a elaborao de um grande
dicionrio da lngua portuguesa. Neste empreendimento comearam a
trabalhar, em meados do ano seguinte, os acadmicos Pedro Jos da Fonseca, Bartolomeu Incio Jorge e Agostinho Jos da Costa de Macedo, os
quais conseguiram, ao m de treze anos de intenso labor, publicar, em
1793, o primeiro e nico volume deste grande dicionrio, mas circunscrito
apenas letra A (Academia das Cincias 1793).
Tomando como base de trabalho o Vocabulrio Portugus e Latino, de
Rafael Bluteau (1712-1728), publicado em 10 volumes, este primeiro Dicionrio da Academia baseava-se na melhor metodologia lexicogrca da
poca, tanto portuguesa como europeia, e fundamentava-se em fontes
documentais copiosas, que abrangiam cerca de quinhentas obras, de
mais de duzentos autores diferentes. O Dicionrio que ento se arquitectava privilegiava, sobretudo, os sculos XVI e XVII, considerados como determinantes na refundao da lngua portuguesa, graas inuncia do
Humanismo e do Renascimento e ao labor literrio dos escritores clssicos, mas abrangia tambm o sculo XIV um tempo de transio e todo
o perodo medieval. Tinha uma grande preocupao normativa, com um
certo excesso purista, alis prprio da poca, mas visava essencialmente
o objectivo patritico de defesa da lngua portuguesa, que estava a ser
invadida por estrangeirismos, sobretudo de provenincia francesa, e comeava a perder terreno no plano internacional.
O primeiro Dicionrio da Academia, apesar de se quedar pela letra A,
constitui um monumento lexicogrco, pela sua riqueza, pelo seu rigor, pela
sua amplitude, assim como pela metodologia inovadora que consagra.
316
317
318
319
320
321
322
se inclurem autores de referncia que no foram contemplados na primeira edio e alargar tal incluso a novos escritores, entretanto surgidos
e cuja qualidade literria seja reconhecida. Torna-se necessrio tambm
rever alguns modelos especcos dentro da elaborao dos artigos, visando uma maior sistematizao e rigor lexicogrcos. Encontra-se j revista
e actualizada a maior parte da letra A, que inclui cerca de 2.400 artigos ou
acepes novas e foi j efectuada a redaco, segundo o novo modelo da
2 edio, de aproximadamente 7.200 artigos ou acepes novas para as
outras letras do dicionrio.
O Dicionrio da Lngua Portuguesa Contempornea, que abrange apenas os sculos XIX e XX, o primeiro de uma trilogia que deve ser completada com um Dicionrio da Lngua Portuguesa Medieval, para os sculos
XII a XV e um Dicionrio da Lngua Portuguesa Clssica, para os sculos
XVI a XVIII.
O Dicionrio da Lngua Portuguesa Medieval encontra-se j em curso de elaborao, no mbito de uma cooperao muito oportuna entre
a Academia e o Centro de Lingustica da Universidade Nova de Lisboa.
Nesta tarefa colaboram tambm as Professoras Maria Francisca Xavier,
Maria de Lurdes Crispim, a Doutora Alexandra Fiis e outros colaboradores. Este projecto apoiado nanceiramente, nomeadamente atravs da
concesso de algumas bolsas de investigao, pela Fundao para a Cincia e Tecnologia do Ministrio da Cincia, Tecnologia e Ensino Superior.
Sobre este projecto no adiantarei mais nada, uma vez que a Professora
Maria Francisca Xavier o fai neste mesmo volume.
323
1. introducin
Tratarei de esbozar as lias xerais da lexicografa acadmica no pasado, as caractersticas bsicas do que se est a facer na actualidade e os
parmetros esenciais que, na mia opinin, van determinar a sa evolucin no futuro inmediato.
2. o pasado
Como ben sabido, os primeiros Estatutos da Real Academia Espaola establecen con toda claridade as obrigas que os seus fundadores consideran inescusables na complicada etapa pola que pasaba o espaol no
primeiro cuarto do sculo XVIII: publicacin dos tres grandes cdigos nos
que, ao seu entender, estaba baseada a importancia e consistencia dunha
lingua, isto , un dicionario, unha gramtica e unha ortografa. A esas tres
grandes obras engadan outras como, por exemplo, unha historia da lingua
e unha potica. As tres primeiras foron aparecendo no decurso do sculo e a primeira delas, o dicionario, foi, como tamn ben coecido, unha
autntica novidade nas obras lexicogrcas. Resulta realmente asombroso
que aqueles primeiros acadmicos, sen formacin tcnica ningunha, conseguiran en soamente 26 anos preparar os materiais, redactar e publicar a
totalidade dunha obra que superaba, con bastante distancia, os estndares
da poca. O coecido habitualmente como Diccionario de Autoridades segue a ter grande utilidade hoxe, e non unicamente no referente historia
da lexicografa.
Despois da publicacin da primeira edicin da Ortografa e en paralelo cos traballos de preparacin da futura Gramtica, acometeron a
324
Guillermo Rojo
325
326
Guillermo Rojo
consultar formas ou expresins dos textos clsicos. Non doado conxugar nunha obra nica obxectivos tan discordantes entre si.
3. o presente
A actuacin da Real Academia Espaola nos ltimos anos est marcada pola intencin de crear as condicins necesarias para remediar os defectos e inconsistencias da etapa anterior. En primeiro lugar, sen dbida,
a orientacin panhispnica de todos os seus traballos. O obxectivo declarado, que a consecucin dunha norma culta unitaria que non negue as
peculiaridades das normas nacionais ou areais non , en denitiva, nada
mis que o recoecemento das caractersticas xeogrcas, sociopolticas
e culturais do espaol no mundo actual. Existe unha estreita colaboracin entre as 22 Academias que integran a Asociacin, manifestada no
feito de que as publicacins son conxuntas a partir da Ortografa, aparecida en 1999. E, por suposto, non se trata simplemente da publicacin:
o sistema de traballo adoptado habitualmente consiste na designacin
dun responsable de cada proxecto en todas as Academias e a constitucin dunha comisin interacadmica, estruturada por reas lingsticas,
que examina todos os materiais e valora as observacins formadas polas
diferentes Academias.
Evidentemente, xar como obxectivo un espaol xeral, relativamente unitario ao tempo que respectuoso coas caractersticas rexionais s
posible cun decidido investimento en infraestrutura documental. Esa
a intencin coa que a RAE decidiu en 1995 emprender a confeccin do
Corpus de referencia del espaol actual (CREA) e, poucos meses despois,
como primeiro paso tamn para o novo proxecto de Diccionario histrico,
do Corpus diacrnico del espaol (CORDE). Na actualidade (novembro de
2006), o CREA, a disposicin pblica dende 1998, consta duns 155 millns de
formas grcas procedentes de textos dos mais diversos tipos e de todos
os pases hispnicos, producidos entre 1975 e 2004. Pola sa parte, o CORDE
contn textos dende as orixes do idioma ata 1974 e consta actualmente
de algo mis de 270 millns de formas. En conxunto, pois, mis de 400
millns de formas coas que os investigadores poden documentar e estudar o uso, a difusin, a frecuencia e mis a evolucin de palabras e de
expresins do espaol de todos os tempos. O Diccionario panhispnico de
dudas (DPD), o Diccionario del Estudiante (RAE 2006) o Diccionario esencial
(RAE 2005) e, naturalmente, a prxima edicin do DRAE estn construdos
a partir destes dous enormes crpora textuais.
327
328
Guillermo Rojo
4. o futuro
Esta a lia bsica na que a Academia pretende proseguir o seu traballo no futuro inmediato, unha lia marcada fundamentalmente pola
colaboracin intensa entre todas as Academias, a utilizacin en profundidade dos recursos electrnicos, a reestruturacin do DRAE para adaptalo
aos mis recentes avances da dicionarstica e organizacin dos recursos
existentes nun plan de lexicografa integrada que se manifeste en obras
con obxectivos distintos, complementarias entre si.
Amais das citadas no pargrafo anterior, nesta nova xeira o DRAE estar
acompaado doutras das obras que completarn o panorama da lexicografa do espaol. En primeiro termo, o Nuevo Diccionario histrico de la lengua
espaola, que acaba de comezar unha nova formulacin que nos permitir
dispor nun mximo de quince anos da historia dos 50.000 lemas centrais do
espaol. En segundo lugar, o Diccionario acadmico de americanismos, que
dar cumprimento a unha vella aspiracin da Asociacin de Academias.
Con todo isto, a prxima edicin do DRAE, que podera aparecer no
2013, en conmemoracin do terceiro centenario da creacin da Real Academia Espaola, corresponder a unha obra resituada en obxectivos e caractersticas. O DPD ter a misin de facer propostas en terreos nos que
a norma non est anda sucientemente ben establecida. O DH dar a
historia dos signicados e, naturalmente, conter tamn as voces que xa
non se utilizan e as acepcins desusadas. O DAA, pola sa parte, conter
os americanismos que non sexan de uso xeral. En consecuencia, o DRAE,
desprendido destes compoentes que o arredan do seu obxectivo central,
quedar relevado desas obrigas secundarias que escurecen a sa nalidade fundamental e poder ser sometido a esa revisin en profundidade
que a longa historia da obra central da lexicografa hispnica est demandando en realidade desde a sa primeira edicin.
329
330
Pr Larson
O Tesoro, e o propio OVI, naceron no seo da Accademia della Crusca nos anos sesenta do pasado sculo:
soamente nos comezos dos anos oitenta pasaron a ser xestionados polo CNR. Para termos unha idea do
vasto proxecto inicial e do entusiasmo que o alentaba pode resultar interesante a lectura dunha serie de
artigos do principal promotor do proxecto, o grande lingista Giacomo Devoto (1969: esp. 136-171) (trtase
de textos publicados no xornal orentino La Nazione entre 1964 e 1968).
331
Uso este termo porque, anda sendo moi extenso, con 1.960 textos, 21.779.246 ocorrencias, 442.770 formas
distintas, 116.597 lemas, 3.576.383 ocorrencias lematizadas, o corpus non est completo e contina a crecer.
3.
Trtase de Dante Alighieri (1265-1321), Francesco Petrarca (1304-1374) e Giovanni Boccaccio (1313-1375).
4.
A primeira edicin do Dictionnaire de lAcadmie franoise data do ano 1694; a primeira do Diccionario de
la Real Academia Espaola do 1780.
332
Pr Larson
A data tradicional o ano 1525, no que se publica a primeira edicin da Prose della volgar lingua de Pietro
Bembo, onde se propn como norma literaria italiana o orentino do sculo XIV.
333
Para demostrarlle ao Consiglio Nazionale delle Ricerche que merecemos existir (xa que hai que facelo!)
recollemos no sitio web un elenco de traballos cientcos que usan os nosos recursos.
334
Pr Larson
7.
Ata hoxe publicronse once tomos do Bollettino, imprimidos pola editorial Edizioni dellOrso de Alessandria (http://www.ediorso.it).
335
En primeiro lugar encontramos o lema en forma normalizada, seguido polas indicacins da categora gramatical. O lema est na forma italiana moderna se o termo anda existe; os lemas con grafa dialectal8
utilzanse exclusivamente para os termos testemuados tan s nunha
parte determinada do dominio italorromance, posto que a tentativa de
italianizalo producira un lema cticio.
A continuacin, o lema encontra un pargrafo cero, composto por
unha serie de subpargrafos numerados de 0.1 a 0.8.
O punto 0.1 contn unha lista de todas as formas grcas do lema
presentes no corpus (nos casos de palabras sobre todo verbos rexistrados en moitas variedades lingsticas diferentes, esta lista pode ser longusima). Para reconstrur o material sobre o que foi redactada a voz a
travs desta lista chega con premer na icona co gatio a carn do lema,
na esquerda da pantalla: aparece unha pxina de consulta que leva ao
contorno GattoWeb, onde se visualiza despois o resultado completo da
bsqueda no corpus, dicir, o mesmo material sobre o cal traballou o
compilador da voz:
8.
Pode que sexa mellor que explique rapidamente que as palabras italianas dialetto e dialettale se usan con
maior liberdade que en Espaa, onde son usados frecuentemente, se estou ben informado, para descualicar as realidades lingsticas consideradas subalternas.
336
Pr Larson
Para as palabras derivadas de timos latinos pertencentes s primeiras letras do alfabeto, recrrese sistematicamente ao LEI.
337
338
Pr Larson
339
unopinione, possibilit di dubbio o fraintendimento. Fras. Mettere in errore. 4 Stato di cose turbato,
confuso, non conforme a giustezza. 4.1 Fras. Errore di fortuna, della natura: stato di cose non conforme a quanto costituisce la normalit (assunta a metro di giustezza), dovuto a fenomeni casuali.
4.2 Non conformit di un oggetto (prodotto da unazione) alla sua intenzione o alla sua funzione,
imperfezione, difetto. 5 Divergenza di opinioni circa la valutazione di un det. evento o oggetto
(passibile di scatenare ostilit), malinteso, discordia. Fras. Essere in errore.
340
Pr Larson
341
Deste xeito resltalle posible ao lector comprender o modo de traballar dos tradutores medievais e ter unha idea de como eran percibidas na
poca as linguas diferentes do italiano e, se cadra, mesmo comprender o
proceso de xeracin de certos latinismos ou estranxeirismos que sobreviviron na lingua.
342
343
OS DICIONARIOS HISTRICOS.
TRAZOS DUN DICIONARIO HISTRICO GALEGO E
CONSIDERACINS SOBRE A SA VIABILIDADE
Antn Santamarina
344
Antn Santamarina
345
dos seus cargos (a Tommaseo, que tamn era folclorista e escritor pero
era xurista de profesin pasoulle o mesmo varias veces en Italia). Cesantes ofrecronse a un editor de Leipzig para facerlle un dicionario do
alemn en 6 volumes que mellorase os de J. Ch. Adelung (1774-1786) e o
de J. H. Campe (1807-1812). A idea dos Grimm era facer un dicionario que
presentase o lxico alto-alemn conforme o testemuo dos escritos posteriores segunda metade do sculo XV ata o momento actual. Excluase,
daquela, toda intencin normativa e outorgbaselle valor primordial
cronoloxa e forma da voz documentada para establecer a historia de
cada palabra. Estaba previsto que a obra se acabase en 10 anos. Coa axuda de 80 colaboradores voluntarios comezaron o traballo en 1838 e no 52
apareceu o primeiro fascculo. Wilhelm morreu no 59 e foi responsable
da redaccin da letra D; Jacob morreu no 63; redactara as letras A B C E e
estaba na palabra Frucht do F. Levaban un 25% da obra feita. Erraran todas
as contas porque a obra foi acabada moito despois e por outras persoas;
non resultaron 6 volumes senn 32; e non foron 10 anos posto que a obra
s rematou en 1961, 123 anos despois de comezada, 107 despois de aparecido o primeiro fascculo e 98 despois de desaparecido o ltimo Grimm.
Despois da morte dos Grimm pasou a responsabilidade do DWB a principios do XX Academia dos Cientcos de Prusia (Preuische Akademie
der Wissenschaften) co taller en Gttingen, e en 1930 Academia de Berln. Desde 1957 (nunha cooperacin entre as das Alemaas a travs das
universidades de Berln e Gtingen, que contina despois de reunicado
o pas) trabllase na reelaboracin das letras A-F; o primeiro fascculo
apareceu en 1965 e est previsto rematar no ano de 2012. A duracin do
proxecto provocou unha muda de criterios editoriais (ademais do enriquecemento da documentacin); as que unha voz como essen redactada por Jacob en 1862 ten oito columnas, mentres que trinken redactada
en 1950 ten trinta e sete1. Son moitas as ensinanzas que se poden extraer
da obra do DWB. Metodoloxicamente puxo os fundamentos da lexicografa histrica que despois seran moi renados pola obra do New English
Dictionary on Historical Principles (NED) Oxford English Dictionary (OED)
desde 1895, e de aqu exportados a outras obras semellantes (entre elas
o propio DWB reelaborado). Pero igual de importante salientar cmo a
obra se fraguou co saber, o entusiasmo e a entrega dos dous autores e coa
colaboracin desinteresada de moitos patriotas amantes da lingua; cmo
se continuou por varias xeracins de lexicgrafos, que seguen a chamarlle en honor dos iniciadores o Dicionario Grimm anda que da pluma deles
1.
346
Antn Santamarina
347
Thomas Austin Jr. levaba esa cifra en 1888. Cfr. Gilliver (2000).
348
Antn Santamarina
Entre os cambios de goberno que viu Francia nos ltimos tempos, nunca esqueceu que a historia
da lingua francesa [...] parte da historia de Francia; o goberno britnico non chegou anda hoxe
situacin de percibir isto (Murray 1900).
349
remate, soubo apostar por unha obra que acabou convertndose nun dos
principais monumentos da cultura mundial do sculo XX.
zaga do DWB e do OED foron construndose monumentos semellantes para outras linguas europeas longo do sculo XX (algunhas iniciadas
tamn no XIX), en especial en pases de linguas xermnicas, promovidos
polas academias e nanciados con dieiro dos orzamentos do estado. Todos teen os trazos esenciais do OED ou, se non foron concibidos con eles,
acabaron adoptndoos.
O primeiro e o Woordenboek der Nederlandsche Taal (WNT), que comezou a organizarse algo antes c OED. As sas orixes remntanse a 1850,
cando se constituu unha comisin liderada por Matthias de Vries (18201892); no ano seguinte nun congreso presentou un plan para un dicionario
holands e nomeouse un comit editorial formado polo propio de Vries e
por Lammert te Winkel (1806-1863); por certo, os dous son os reformadores
da ortografa holandesa actual. O dicionario desde o principio foi froito
dunha colaboracin entre holandeses e amengos; en 1852 comezou a recolleita de materiais. A empresa (como a alem) comezou pola iniciativa
privada dos promotores e dunha editorial; deu problemas ata que o goberno holands se xo cargo dos gastos despois da primeira guerra mundial. O plan do dicionario mudou a partir da dcada de 1880; en principio
prevase que fose un dicionario do holands do sculo XIX; polo tanto non
a ser histrico (o modelo estaba mis no Littr ca nos Grimm); pero a
medida que colleitaban documentacin, por consello dos Grimm, foron
recuando ata o 1500 e tomando tamn en consideracin documentacin
non literaria (artes e ciencias), ademais dos dialectos, transformando as a
idea do dicionario estilo do OED. O primeiro fascculo apareceu en 18834
e o ltimo en 1998 (684 fascculos, 40 volumes); o INL (Institut voor Nederlanse Lexikologie) est actualizando constantemente a obra, agora con
procedementos novos. Pasaron cinco xeracins de lexicgrafos desde que
se comezou (http://www.inl.nl/index.php?option=com_content&task=v
iew&id=222&Itemid=244).
Pero a lingua holandesa non dispn s do WNT, pois un dialecto moi
importante dela e falado en Sudfrica, o afrikaans, ten tamn o seu Woordeboek van die Afrikaanse Taal (WAT). O afrikaans unha variante do
holands levado primeiro por colonias de protestantes no sculo XVII e
despois por comerciantes e tracantes; hoxe unha variante estandarizada como lingua parte, falada como primeira ou segunda lingua por
mis de 16 millns (o holands flano uns 22 millns). O WAT iniciouse
4.
350
Antn Santamarina
351
Como se ve, as linguas nrdicas teen todas unha aparicin literaria tarda; algunhas teen case como
textos fundadores a traducin da Biblia, do XVI.
6.
No seu informe de 1948 RAE Casares insiste nesta posibilidade dado que todos los grandes Diccionarios
del siglo XX han tenido desde el primer momento la preocupacin de imbuir en el nimo de la opinin
culta de sus respectivos pases el convencimiento de que, tanto las entidades patrocinadoras de dichas
obras Academias, Sociedades, Congresos, etc. como cuantas personas se ponan abnegadamente a su
servicio, se arriesgaban en una empresa patritica, cuya gloria, en caso de buen xito, rebasara ampliamente el crculo de los iniciadores y ejecutores, para extenderse a la nacin entera, elevando el prestigio
de la respectiva cultura ante el mundo civilizado. Artculos de prensa, folletos, circulares, conferencias,
todo pareci poco para crear un clima favorable a la gestacin de esos diccionarios, que haban de ofrecer
a propios y extraos la riqueza, la vitalidad y la gracia de la lengua materna como el reejo ms autntico
y luminoso del verdadero genio nacional.
352
Antn Santamarina
353
de cada artigo unha xenerosa nota etimolxica e histrica que dan conta
da evolucin formal e semntica da palabra desde as orixes ata o francs
actual (cfr. por exemplo a voz parole).
Tampouco un dicionario histrico cannico (a pesar do seu nome),
polos mesmas razns de que os lemas son unicamente os do francs estndar de hoxe, o Dictionnaire Historique da la Langue Franaise (DHLF)
da editorial Robert, dirixido por A. Rey; d a etimoloxa, a cronoloxa das
formas e as acepcins principais e secuencia en que se xeraron; pero non
ten exemplos; tampouco ten entradas dialectais nin arcaicas. Os dous, o
TLF e o DHLF, dan case un dicionario histrico; o que falta hai que suplilo
con dicionarios etimolxicos coma o de Wartburg (FEW) ou o de Baldinger
(1974-2006) (para o occitano), ambos inacabados, que teen abundante informacin histrica e dialectal. Para o francs hai, daquela, un substituto
do dicionario histrico, anda que sexa repartido en tres ou catro dicionarios diferentes; por iso, seguramente nunca se formulou a idea de fabricar
para o francs nada semellante OED.
Para Italia xa vimos que o Battaglia (GDLI) era case un dicionario histrico; de feito moito mis ca un dicionario da lingua toscana de todos
os tempos, porque entran non s toscanismos (con tal de que tivesen uso
literario). Tanto Salvatore Bataglia (1904-1971) como Giorgio Brberi Squarotti (1929-), que o dirixiron, teen un mrito inmenso, como tamn a empresa privada que o nanciou, a UTET (Unione Tipograco-Editrice Torinese), que xa antes nanciara o Tommaseo / Bellini (1865-1879). Por parte
da Crusca hai, desde hai moito, proxectado un Vocabolario storico della
lingua italiana, nunca realizado. Parte deste dicionario da Accademia, o
que se rere lingua das orixes ata 1375, est sendo realizado agora polo
CNR, o Tesoro della lingua italiana delle origini (TLIO), que concorre con
outro Glossario degli antichi volgari italiani (GAVI) que se publica pola universidade de Helsinki desde 1983, coidado de Giorgio Colussi, e leva ata
o momento 20 volumes aparecidos. Os dicionarios etimolxicos, que para
o italiano hai varios, e un especialmente monumental, o LEI de Pster
(agora na letra B), axudan a compoer o perl histrico do lxico italiano
mentres non haxa o prometido da Crusca. En calquera caso, non hai nada
en Italia (igual que en Francia) nunha obra nica equiparable OED.
E isto o que hai para as grandes linguas nacionais europeas occidentais (supoo que para o polaco, o ruso, o ucrano, o checo ou o hngaro
hai empresas histricas similares, pero btanos mis lonxe e pertence a
linguas menos accesibles). Pero quedan na Europa occidental linguas pequenas e mesmo dialectos sen vocacin de lingua que teen moito que
ensinarnos en materia de lexicografa histrica. Entre estas linguas est
354
Antn Santamarina
en primeiro lugar a catal, que dispn dun Diccionari catal-valenci-balear (DCVB) completo desde o ano 1962. A historia do dicionario cataln
exemplar para ns (e para moitos outros) e foi contada en numerosos
lugares, de maneira moi pormenorizada nas memorias de Moll, que son
unha memoria do dicionario mesmo na medida en que o DCVB foi a obra
da sa vida. O dicionario cataln iniciouno, sen embargo, un manacor,
o cengo Antoni M Alcover7 (1862-1932). En 1901 lanzou Alcover (como a
PhilSoc de Londres e mis tarde Murray e anda despois Burcheld) unha
Lletra de Convit a tots els amics de la llengua catalana para que colaborasen na sa recolleita; nos cinco primeiros anos apuntronse 1.643 voluntarios (con rendementos moi dispares) que enviaron mis de 700.000
cdulas; para manter contacto cos entusiastas do seu convite iniciou o Bollet del Diccionari de la Llengua Catalana (1901-1926), folleto mensual que
funcionaba de crnica do dicionario, entre outras cousas. Pero Alcover era
s un acionado, e ademais va que el s a ser incapaz de levar adiante
a obra. En 1921 tomou como colaborador un mocio de 17 anos que se chamaba Francesc de Borja Moll (1903-1991), para quen procurou unha formacin lolxica slida con mestres como Schdel e Meyer-Lbke. A historia
do Diccionari foi moi azarosa. Unha das razns foi o carcter belics,
rstic i agressiu (en palabras de Moll) do calonge, que entrou pronto
en disputa co Institut dEstudis Catalans, institucin que patrocinaba o
Diccionari, entre outras razns porque Alcover quera facer un dicionario
que fose vez dialectal, histrico e literario e a maiora dos membros do
IEC propoan naquel momento a elaboracin de tres dicionarios (un do
cataln antigo, outro do moderno e outro dialectal); co IEC (e con Fabra
persoalmente) mantivo discrepancias ortogrcas. Isto motivou que Alcover rompese co IEC e que marchase en 1917 coa calaixera do dicionario
para Mallorca, onde se a facer de costas para o IEC; isto motivou tamn o
cambio de nome da obra, que pasou a chamarse desde aquela Diccionari
catal-valenci-balear e non Diccionari de la llengua catalana. Outra dicultade foi a falta de medios, pois parte dunha axuda que conseguiu
Alcover do rei Afonso XIII, que durou s seis anos, e dalgunha institucin,
o diccionari estivo sempre borde da bancarrota. Anda as, en xaneiro de
1924 comezou a redaccin, con dous redactores (Alcover e Moll) e outros
dous colaboradores fugaces; a nais do 1926 apareceu o primeiro fascculo; en 1930 estaba completo o primeiro volume. A recepcin do dicionario
foi pouco entusiasta (en especial no Principado, onde o catalanismo convertera a Alcover nunha especie de besta negra); isto repercutiu na falta
7.
Gran recolledor de literatura oral, anda son populares hoxe as sas Rondalles de Jordi des Rac.
355
de subscritores e de subvencins ociais e motivou que Alcover comprometese a sa facenda e anda a da familia; cando morreu en 1932 dun ataque de feridura (apoplexa) estaba completamente arruinado. En 1934, xa
sen Alcover, completouse o volume segundo. A todas estas desgrazas hai
que engadir a guerra civil; con ela o traballo do dicionario interrompeuse
e Moll pasou a gaar a vida como impresor (na imprenta que o propio
Alcover fundara para imprimir o dicionario) e como profesor de ensino
medio. Moll continuou traballando s; desde 1943 a 1959 contou coa colaboracin de Manuel Sanchis Guarner (1911-1981) e da sa lla Aina Moll;
agora contaba coa subvencin dun mecenas privado (o industrial barcelons Enric Prez i Capdevila) e cos fondos que recadaba das subscricins.
En 1949 comezaron a sar de novo fascculos e grazas a unha campaa de
mrquetin moi ben organizada por simpatizantes do dicionario a obra
puido conclurse sacando a razn de case un volume por ano (III, 1950;
IV, 1951; V, 1953; VI, 1954; VII, 1955; VIII, 1957; IX, 1959; X, 1962). Nos anos seguintes reelaborronse e reimprimronse os dous primeiros volumes, e
ademais prescindiuse neles da ortografa cismtica de Alcover. O DCVB
unha obra extraordinaria tanto polo sacricio con que foi levada a cabo
como polo patriotismo dos seus iniciadores e redactores e mecenas, como
polo contido mesmo, pois ten abundantsima documentacin histrica,
literaria e dialectal e est executada coa mellor tcnica lexicogrca anda que non siga rixidamente os principios histricos do OED; en parte
debedor do GPSR (do que imos falar), entre outras cousas, porque d cabida a bastantes apelidos, que localiza nas reas en que son orixinarios
e abundan; en cambio, contrario do GPSR, non rexistra topnimos. En
1962, e anda hoxe, ningunha lingua hispnica (includas as multimillonarias portuguesa e castel) tian nada equiparable, nin de lonxe. Pode
consultarse en rede (http://dcvb.iecat.net/).
Todas as linguas que vimos ata agora son linguas de estado. Algunhas
delas teen detrs un potencial demogrco enorme e todas elas teen
unha tradicin literaria longa, de ata 12 sculos algunha. O caso do cataln
particular porque ten grande tradicin literaria pero non ten estado, anda que no Principado se ten manifestado suciente vontade nacional como
para telo. Pero dentro da tradicin lexicogrca europea, prxima a ns, hai
tamn casos de variedades rexionais sen vocacin de lingua para as que se
desenvolveron empresas lexicogrcas de grande envergadura. Os dicionarios resultantes teen moito parecido cos dicionarios histricos mencionados, coa diferenza de que nestes casos os testemuos literarios son moito
mis escasos e os dialectais mis abundantes. Estn neste apartado os catro grandes dicionarios realizados en Suza para as catro variedades xerm-
356
Antn Santamarina
nica e romnicas al falados. Estn todos auspiciados desde 1996 pola Academia Suza de Ciencias Humanas e Sociais e na sa pxina poden verse as
referencias (http://www.sagw.ch/frz/index.asp?pag=Kommissionen). Vou
mencionalos porque son obras exemplares, honra do pas que apoiou a sa
elaboracin e dos llogos que os iniciaron e continuaron.
Comezo polo Glossaire des patois de la Suisse romande (GPSR), dicionario dialectal que rexistra todas as palabras patesas que estiveron ou estn
anda en uso no interior dos lmites da Suza romanda; acolle tamn as
palabras e usos particulares do francs suzo. Por riba o Glossaire reserva
un lugar importante s nomes de persoa e s nomes de lugar romandos.
Foi ideado arredor de 1890 por Louis Gauchat (1866-1942), unha especie de
Leite de Vasconcelos suzo, mesmo celibatario como aquel. Gauchat soubo
convencer as autoridades federais e cantonais para amparar economicamente a obra de recolleita dos patois franco-provenzais de Suza; en 1899 a
Comisin Administrativa (composta polos xefes de Instrucin Pblica dos
cantns francfonos) deu luz verde a un proxecto que anda dura 107 anos
despois; os tres primeiros redactores (que imprimiron carcter obra) foron Gauchat, Jules Jeanjaquet (1866-1950) e Ernst Tappolet (1870-1939). As
ocinas do GPSR estiveron primeiro en Berna, despois en Lausana (1956)
e agora estn en Neuchtel (1972). Os tres redactores xeron un nmero
considerable de enquisas, algunhas delas en profundidade, s mellores
informantes; en trece anos xuntaron mis dun milln de chas. Baleiraron tamn unha rica colleita de textos (moitos deles manuscritos cedidos
polos herdeiros dos autores a arquivos e museos). E incorporaron o Ficheiro Muret (Ernest Muret) con mis de 150.000 topnimos. Naturalmente o
GPSR non un dicionario histrico estilo dos descritos, porque non se
rere a unha lingua viva, senn a unha lingua de museo, recuperable s a
travs de textos e dos poucos falantes rurais sobreviventes a principios do
XX; pero explica con pormenor semellante s dicionarios histricos toda
a riqueza de variantes formais e de contido dos diferentes lemas. Comezou a publicarse en 1924 e na actualidade estanse redactando as letras F e
G8. Anda que no seu sitio non dixemos de maneira clara se o DCVB ten un
modelo, o mis prximo o GPSR, e non os dicionarios histricos tipo OED
ou DHLE. Na Internet hai informacin do Glossaire e ligazns a outros
sitios (http://www.gpsr.ch/)9.
8.
O ltimo fascculo aparecido o 112 (2006), pertencente ao tomo VII, que abrangue o fragmento frgnat-
9.
Para coecer o estado de publicacin da obra, vxase o catlogo da editorial Droz (https://www.droz.org).
fripeur.
357
358
Antn Santamarina
359
que nalgns aspectos esteamos peor hoxe; de feito, moitas voces vencelladas cultura tradicional seguramente desapareceron antes de que fosen sometidas a unha recolleita tan sistemtica como a que se xo para os dialectos suzos; quen faga traballo dialectal hoxe sabe da dicultade que supn
atopar un informante bo; con todo, anda se chegou a tempo, polos anos
setenta e oitenta, para facer un atlas e bastantes monografas que salvaron o esencial do naufraxio. En cambio, por outro lado, as cousas melloraron
moito porque a lingua, especialmente despois do movemento das Irmandades, quedou rexistrada en escritos de temtica cada vez mis variada. Dito
doutra maneira: Valladares, anda que quixese, apenas poda documentar
palabras en textos; de feito a maior parte das ilustracins literarias que incle no seu dicionario son cantigas populares ou refrns e mesmo poemas
propios; anda don Eladio Rodrguez (1958-1961), polos anos 20, cando faca
o seu Diccionario, andaba escaso de fontes. Hoxe para o galego moderno
hai moitas fontes porque hai centenares de millns de palabras xadas
en documentos escritos, de maneira que se perdemos algo por unha parte
compensmolo con creces pola outra. verdade que estas fontes estn lexicogracamente algo descompensadas, porque hai campos nos que o galego
ten pouco cultivo, pero anda as hai moito material lxico que baleirar ou
xa baleirado. Para o galego antigo tamn as cousas estn nun bo momento,
pois canto texto literario est descuberto conta con edicins boas; o mesmo
sucede con moita documentacin notarial, que anda sendo algo montona
como material lexicogrco, moi abondosa e est sendo transcrita e nalgns casos provista de glosarios. E ademais hai moita xente no pas que leu
a Saussure e anda a Coseriu. Por esta razn dicimos que o momento de comezar un dicionario histrico propicio. E quizais son chegados os tempos
tamn porque o galego adquiriu un grao de institucionalizacin considerable: a lingua principal da administracin autonmica e local; acabou tendo (mesmo para moitos que non o practican) un valor simblico. Por ser lingua ocial require instrumentos que faciliten o seu acceso s usuarios; e por
ser simblica necesita instrumentos que a canonicen, e entre eles estn as
gramticas e os dicionarios, e entre estes un histrico. Unha lingua con estes
instrumentos fai que os propios falantes se sintan orgullosos e que os de
fra nos respecten. De a que a fabricacin dun dicionario destas caractersticas sexa considerado en todos os sitios onde se acometeu un monumento
memoria cultural do pobo; por iso se implica nel o pobo mesmo (ou polo
menos as sas elites mis sensibles) e as autoridades. As obras deste tipo, al
onde se acometeron, xustifcanse polas deciencias das anteriores10. Pero as
10. On some Deciencies in our English Dictionaries foi o manifesto que leu Richard Trench ante a PhilSoc o 5
de novembro de 1857 e disparou a obra do OED.
360
Antn Santamarina
deciencias hai que miralas con perspectiva histrica, pois cada dicionario
non mis que o elo dunha cadea onde cada dicionario unha peza necesaria para o que vn despois; o mesmo Murray matizou mis tarde as palabras
de Trench recoecendo que, sen unha cadea de dicionarios que empeza no
XVII e vai desde Caudrey, Johnson, Bailey, Cocker, Webster e moitos outros,
o OED sera inexplicable. E o mesmo acontecer co galego se algn da se
fai. Naturalmente, supoendo que este dicionario se xese, non supora a
desaparicin dos outros dicionarios, porque cada destinatario necesita un
tipo diferente de dicionario. O histrico , dixemos, para especialistas e para
xente cun nivel de curiosidade lingstica moi especial; e por outra parte,
podera ser a base doutros dicionarios. Na lingua inglesa o OED non anulou
outras actividades lexicogrcas, senn contrario.
Vexamos logo que entrara nese dicionario e como se mostrara a informacin. O que digamos non vai ter moita orixinalidade porque non se
trata mis que de aplicar noso o que xa foi feito para outras linguas, conforme foi explicado nas introducins dos dicionarios, en informes previos
presentados s institucins que os promovan, ou en guas posteriores.
Para moverse ben polo OED e entender ben o que ten dentro moi til
ler a gua que escribiu Donna Lee Berg (1993) e mesmo o libro citado de
Winchester (2003). En casteln hai informes de Julio Casares desde os anos
40, recollidos logo en libro (Casares 1950), que son de lectura moi proveitosa. Mis recentemente, Jos Antonio Pascual coautor dun texto que en
certa maneira adianta aspectos do que vai ser o NDHLE da RAE (Pascual /
Garca 2007). Hai con todo que advertir que, como se trata dunha materia
moi especca, a lexicografa histrica non adoita ser tratada nos manuais
de lexicografa a non ser de maneira tanxencial. Daquela, o que digamos
a seguir non un blueprint ou manual do redactor do DHG, senn unha
aproximacin que esperamos que un lector poida atopar nel.
1. No noso caso, o primeiro que hai que dilucidar cal a profundidade (historical coverage) do corpus, ou sexa, ata onde recuamos na documentacin, pois hai das posibilidades. Ou ben comezar a nosa historia en 1612, que a data do primeiro texto galego coecido despois da
desaparicin do galego como lingua da administracin (os ltimos documentos notariais son de 1530 ou por a), ou ben remontarnos s primeiras
orixes. Ambas as opcins son defendibles; a primeira vira a coincidir coa
postura adoptada polos dicionarios das linguas nrdicas, que comezan a
sa documentacin no sculo XVI, porque mis atrs desa poca hai moi
pouca documentacin; no noso caso tera xusticacin comezar no XVII,
porque cando o galego tomou a opcin de seguir un camio solitario
361
362
Antn Santamarina
manente palabra e, anda que hoxe hai outros medios de soporte, o escrito segue a ser insubstituble porque o nico controlable. Dito doutra
maneira mis sinxela: cada palabra ten que estar rexistrada nun discurso
e ir ilustrada cun fragmento del e non con exemplos fabricados. Iso quere
dicir que hai que facer un baleirado dun nmero representativo de textos.
sabido que nunca pode haber unha colleita exhaustiva, pois, por moi
representativa que sexa a mostra, sempre vai faltar algunha palabra ou
algunha acepcin (se cadra algunha de certa frecuencia) que est fra das
fontes manexadas; e por outra parte o vocabulario est cambiando case
cada da, cousa que se nota mis polas palabras que aparecen que non polas que pasan a obsoletas (porque algun pode resucitalas nun momento
dado). Pero, anda as, conveniente cerrar nun momento o corpus e gardar para futuras empresas os apndices coas descubertas e novidades.
Hoxe hai ese baleirado representativo tanto para o galego medieval, que
conta cun corpus de case todo o editado, como para o moderno, que ten
un corpus con testemuos ata o ano 2007, como xa se expuxo noutros
captulos deste volume.
Ademais das voces rexistradas en textos, os dicionarios histricos
usan os dicionarios anteriores como corpus; nos dicionarios hai voces que
nalgn (ou en moitos casos) non foron nunca usadas en texto ningn dos
baleirados; carecen daquela de exemplos a non ser que o dicionarista que
as rexistra incla unha ilustracin. Tendo en conta que entre ns abundan dicionarios, vocabularios e nomenclaturas que se basean en enquisas
dun determinado territorio, a posibilidade de que un localismo recollido,
por exemplo, por Anbal Otero ou por Elixio Rivas nunca fose usado en
textos bastante grande; polo tanto vai haber unha cantidade non desprezable de voces que s se tean rexistrado en dicionarios.
Sobre a informacin dos dicionarios galegos hai que lembrar que cada
un deles un elo dunha cadea onde a informacin vai pasando unhas veces de maneira literal e outras ltrada. A informacin de carcter semntico en xeral transmitida con bastante delidade (anda que non faltan
exemplos de terxiversacins graves); en cambio, outras informacins,
como por exemplo a do lugar ou lugares en que se rexistra unha verba,
adoitan desaparecer; paras as voces que se incorporaron nos dicionarios
procedentes dos vocabularios de Sarmiento, Anbal Otero ou Elixio Rivas
prescindiuse sistematicamente de indicar a sa procedencia xeogrca,
ademais doutras informacins. E unha informacin non desdeable
mesmo para un dicionario de carcter xeral, dado que ese dato pode darnos unha idea da posible difusin da palabra; de feito, mesmo os dicionarios de uso ou prescritivos dunha lingua como o espaol nos informan
363
constantemente de que unha palabra propia s de Colombia ou de lava ou de Extremadura; os galegos, mesmo os normativos recentes, non
deban ocultar ese dato. En calquera caso, a distribucin xeogrca dunha
palabra unha informacin da que non se pode prescindir nun dicionario
histrico, sempre que se saiba; entre outras razns, porque os dicionarios
histricos son a base dos dicionarios etimolxicos e a noticia sobre a vitalidade e dispersin dunha palabra imprescindible; as que no DHG
haber que recuperar esta informacin dos dicionarios cando a dean.
E anda unha nota marxinal mis: determinado tipo de voces (e mesmo procedementos lexicais) son comns a moitas linguas. No OED non
raro ver como se cita moitas veces como fonte un dicionario dunha lingua
estranxeira, que foi seguramente a primeira en poer en circulacin un
neoloxismo. Obviamente, nun dicionario histrico coma o noso, recorrer a
estes dicionarios para estas voces culturais vai ser non s conveniente, senn obrigatorio, pois o dato sobre a lingua en que se cuou unha palabra
e a lingua intermediaria entre aquela e a nosa non superuo. Os dicionarios enciclopdicos doutras linguas que na nosa non os hai tern que
estar constantemente abertos na mesa do lexicgrafo; porque hai moitas
cousas que se din en galego e non son s da cultura galega.
Non se esgotan niso seguramente as fontes do lxico galego, anda que
as mencionadas (textos galegos e dicionarios galegos) sexan as principais.
Nos sculos chamados escuros producronse moitos escritos en casteln,
moitos deles inditos, que estn empedrados de palabras galegas ou ben
porque o produtor do texto ten un coecemento deciente do casteln e intercala a palabra galega que lle familiar ou ben porque a palabra se rere
a un fenmeno da cultura galega que non ten traducin casteln e se cita
por iso na lingua orixinaria. Calquera que repase documentos (escrituras,
regulamentos de gremios como os dos mareantes, que rexistra moitos termos de pesca, etc.) dos sculos XVI-XIX encontrar a cada paso palabras en
galego. Case toda esta documentacin est anda sen explorar, entre outras
razns porque esixe un baleirado manual, dos orixinais mesmo, porque hai
poucos transcritos. Cmpre que quede constancia da lagoa.
Qudanos anda unha pequena consideracin referida macroestrutura do dicionario. Est claro que sendo un dicionario da lingua galega o
fondo esencial do seu contido (nomenclatura, lemario...) deben de ser as
palabras galegas. Pero entre o que galego e o que non galego a raia
non est clara s veces, e especialmente se se opera co criterio do uso e
non con criterios puristas. Todos os dicionarios teen un problema cos
estranxeirismos, pois entre os naturalizados e os ocasionais hai un continuo no que difcil poer lmites. Entre ns as cousas complcanse por-
364
Antn Santamarina
365
366
Antn Santamarina
le vip senn vi-ai-pi. Non hai que confundir acrnimos con inicialismos,
do tipo OLP. A fronteira entre o acrnimo e o inicialismo non est clara
moitas veces, e ns coecemos mesmo mestura dos dous procedementos
en casos como UPG ou ILG. Os acrnimos en xeral dan lugar a entradas; os
inicialismos non: desenvlvense no artigo da letra correspondente. Pero a
fronteira s veces tan borrosa que vai haber casos discutibles e polo tanto incongruencias. Por abreviacins refermonos s palabras recortadas,
tipo metro (que hoxe est tan lexicalizado que xa case ningun se acorda
da sa etimoloxa: (tren) metro(politano); outras veces, como no caso de
bici, a etimoloxa mis transparente anda e neste caso a entrada ter o
carcter s de referencia cruzada (a denicin s incluir os exemplos).
(c) Axos e outras formas combinables (afns s axos). Os dicionarios
de lingua xa incorporan estes elementos como entradas; unhas veces son
morfemas con escaso contido lxico, como ex-, anti-, auto-, -doiro, -izar,
pero outras veces son elementos radicais, a maior parte das veces de grecismos, que se antepoen ou pospoen a outras races, igualmente gregas
as mis das veces (pero que case nunca apareceron combinadas no grego
clsico): refermonos a casos como cripto-, neo-, austro-, -cardia, -dinmico,
-lecto... conveniente que entren estes elementos nun dicionario histrico para ver a sa historia, pero non est claro ata qu punto a inclusin
destas entradas libera de inclur tamn as palabras compostas nas que
entra un deses elementos. Posiblemente moitos dos derivados formados
con ex- non necesiten ter entrada, como moitos dos formados con auto-,
e aqu o dicionarista poderase espraiar (cfr. o que fai o OED para pre-, con
mapa e todo, ou para auto- sen mapa); en cambio todos os formados
con -ectoma ou quiro- teen que ter entrada no lugar que lles corresponda e entn o artigo poder abreviarse. O galego non ten como o ingls a
posibilidade de usar palabras patrimoniais como prexos (tipo self: selfadhesive) ou suxos (tipo man: spiderman), a non ser que consideremos
latinismos como -forme (vermiforme) e outros como xa patrimoniais.
(d) Nomes propios e marcas rexistradas. Os nomes propios non entran
nos dicionarios de lingua nin nos histricos. Hai, con todo, casos onde o
nome propio de persoa ten os trazos dun apelativo: paio, xan, prkinson
(que en realidade unha elipse de enfermidade de Parkinson), e neste
caso forman parte da macroestrutura do dicionario. O mesmo ocorre con
algns nomes xeogrcos (ribeiro). Algns deles estn tan asimilados
que xa se escriben con minscula. Outras veces o nome propio gura
como determinante ou atributivo doutro nome (bao (de) Mara, cruz de
Caravaca); neste casos se o nome propio gura como entrada s a efectos de referencia cruzada pois a locucin ir explicada na palabra rexente.
367
Hai casos, con todo, pouco claros. Relacionados cos nomes propios estn
os substantivos e adxectivos, e mesmo verbos e adverbios, derivados de
nomes propios (gongorismo, gongorino, gongorizar; coruesismo, coruesista). Todos os dicionarios teen un problema con estas entradas porque
se trata dun sistema aberto que non se sabe moi ben onde cortar; no TILG
aparecen esporadicamente verbos como despontevedrizar, que con certeza vai ser excludo do dicionario histrico. Murray era moi restritivo, ata o
punto de que excluu con algo de esaxero o adxectivo e substantivo African por ser de etimoloxa e valor obvios para calquera, a pesar de que hai
datos del en ingls desde o ano 888. A importancia e a frecuencia destas
voces o criterio determinante. E relacionados cos nomes propios estn
os nomes comerciais, s veces marcas rexistradas, de determinados produtos (do tipo Aspirina, Coca, Martini, Kleenex, tirita, maicena (<maizena)
ou Ciprianillo). Lembremos que bolgrafo, plexigls, celo e tergal, igual que
as palabras anteriores, son marcas comerciais, algunhas rexistradas, e s
os moi entendidos o saben ou sospeitan, a pesar de que algunhas teen
mesmo sitio na Internet (como www.tiritas.com, da casa Hartmann). A
inclusin destas palabras depender do uso xenrico que se faga delas,
cousa que non sempre ben discernible.
(e) As palabras compostas teen entrada nos dicionarios a travs
da sa forma grca soldada (abrecartas), anda que a sa denicin se
aproxime moito sa anlise etimolxica (utensilio que serve para abrir
cartas). Pero hai casos en que entre a palabra composta e o sintagma libre
hai lmites borrosos porque anda a morfoloxa non est xada denitivamente: sapoconchos ou sapos conchos son posibles; mal non temos
dbida de que hai que escribilo xunto en maldicir, maldicin, malbaratar,
malbarate, pero xa non estamos tan seguros se debemos facer o mesmo
en malcriado, malnacido ou maleducado porque mal- anda esta moi ligado seu valor adverbial primitivo (de feito non se pode dicir *maleducacin). Vexo difcil neste caso cmo se poden establecer criterios para decidir entre dar entrada combinacin ou ben remitir a sa inclusin a un
dos elementos da combinacin; hai que repasar neste caso a denicin
de palabra, tema do que xa se sabe que hai tratados enteiros. O editor ter
que decidir co seu gusto sobre o grao de solidariedade; en calquera caso,
estas combinacins teen que ter un sitio no dicionario (ou ben como
entrada ou ben como elementos polirremticos dentro dunha entrada).
E outra decisin similar haber que adoptar con referencia s derivados
que son resultado dunha adicin gramatical case mecnica; inclur como
entradas todos os adverbios en -mente non ten sentido ningn, a non ser
que queiramos por razns comerciais de presumir de ter moitos lemas.
368
Antn Santamarina
369
mal que estas palabras carezan completamente de uso. Pois ben, mesmo estas voces dos dicionarios debern de aparecer no DHG debidamente comentadas cando se saiban comentar. No OED estas formas espurias
rexistranse como erros e explcanse cando se sabe; e se non presntase
como explicada nos dicionarios como..., e dse a cita. No OED as entradas
espurias van entre corchetes (o artigo enteiro).
Non menciono agora outros pormenores da posible macroestrutura, entre eles o de se o dicionario ten que ser alfabtico ou conceptual. A
posibilidade (mis ben necesidade) de publicalo en formato electrnico
permite que o traballo non sexa necesario acometelo por letras; o traballo
pode render mis tratando acios de palabras que teen unha anidade
semntica (voces que designan plantas, peixes, medo...) ou formal (un primitivo coa sa restra de derivados).
3. Pasamos agora a ver como sera a estrutura (microestrutura) dun
verbete tpico. Hai que ter en conta que as entradas son heteroxneas e
s en entradas moi complexas van ocorrer todos os trazos acumulados.
Srvenos de gua o OED.
Nos dicionarios histricos, coma nos dicionarios de lingua, hai das
seccins; unha, a que comprende o verbete da entrada e toda a informacin que non semntica: categora gramatical, grafas, fontica, etimoloxa, frecuencia (que non aparece no OED pero si no TLF); a outra seccin
a que se rere contido semntico do verbete, con todo o que leva aparellado: acepcins, exemplos, etiquetas de rexistro, combinacins, etc.
No OED, para entradas que tiveron unha morfoloxa moi complicada
(verbos como go), entre as das seccins, realmente na seccin de contidos pero principio de todo, numerado sempre como letra A (inexional
forms), fronte a B (signication), clasifcanse todas as variantes morfolxicas, por exemplo, no verbo por tempos e persoas (o noso verbo correspondente a go ir, e sen dbida outros, necesitarn esa seccin)11.
Esa distribucin dalgns dicionarios (primeiro as formas e etimoloxa
e despois o contido) non ten por que ser necesariamente as nesa orde;
noutros dicionarios, como o DCVB ou o TLF, a informacin sobre as variantes, pronunciacin, morfoloxa, frecuencias e etimoloxa dse nal
da entrada; cremos que a estratexia do OED a mis acertada porque dis11. Non todos os dicionarios inclen este apartado de inexional forms, como ocorre no TLF, que promete un
volume separado para as variantes exionais; pero a maiora dos outros inclen paradigmas histricos e
dialectais.
370
Antn Santamarina
371
nnica para Talpa europaea, onde debern gurar como variantes toupo,
teipa, teipe, teupa, tiopa, tiopo, topia (pero non toupeira, anda que sinnimo nalgns sitios, porque xa mis que unha variante fontica); naturalmente todas elas tern entrada pero s a efecto de referencia cruzada
contra toupa. Supoo que vai haber problemas mis dunha vez se que
a etimoloxa que vai seguir estas formas non o resolve; imaxinemos esta
serie de nomes para a Digitalis purpurea (entre outros):
belitroque, bilicloques, bilicroque, bilitroque, milicrocas, milicroques, palitroques, cloques,
croque, crquel, croquetas, cuco, farricoque, trcoles, trqueles, troques, estalote, estraladeira, estralante, estraloque, estroleque, estroqueiro.
Con esta restra imos ter dous problemas, que en realidade son un s:
cl das formas dar como cannica, que posterior a resolver se todos son
variantes da mesma familia etimolxica; e en segundo lugar, qu formas
dar como variantes e cales como sinnimas. Nos dicionarios histricos,
e no noso tamn, onde se van mesturar formas antigas e modernas, as
variantes grcas e fonticas van ser numerosas. Imaxnese a cantidade
delas que entrarn baixo o verbete escribir se a raz no galego medieval
pode ser (e)scre- ou (e)scri-; que o // do medio se pode escribir como <v>,
<u>, <pu> e <b>; que a desinencia pode ser er, ou ir; e calquera dos /i/ se
pode grafar <i>, <j> ou <y> (poderan ser mais de 100 variantes). Tendo en
conta que estamos a falar dunha lingua de oito ou mis sculos obvio
que hai variantes grcas propias dunha poca, e as o haber que facer
constar; o mesmo acontece coa pronunciacin que corresponda a estas
grafas, que se rexistrar ou reconstruir na medida do posible.
(c) Tocante etimoloxa. Esta unha informacin que se d moi resumidamente, mesmo nos dicionarios de lingua (DRAE, Robert, Larousse,
Webster, Houaiss...), e daquela non pode faltar nun dicionario histrico
en tanto que a etimoloxa pertence historia da palabra, polo menos na
medida en que explica o seu nacemento. O destinatario dun dicionario
histrico un profesional da lingstica ou unha persoa con curiosidades lolxicas mis apuradas cs dun usuario que s quere comprobar
un signicado ou coecer unha grafa correcta. Daquela, a nota etimolxica dun dicionario histrico, sen chegar a ser un artigo de dicionario
etimolxico, ten que ser mis informativa c dun simple dicionario de
lingua. Nun dicionario destas caractersticas vai haber moitos tipos de
etimoloxa. Por exemplo a dos internacionalismos formados con material
grego e latino non necesitan mis indicacin c timo e o seu signicado na lingua orixinal e, de ser o caso, a lingua intermediaria, se se sabe;
372
Antn Santamarina
373
374
Antn Santamarina
375
ambigua, ten que fornecer mesmo tempo as claves necesarias para que
o receptor da mensaxe (no noso caso o lector lexicgrafo, porque os textos
que manexamos como crpora son s escritos) poida decodicala adecuadamente. As claves que se lle dan lector cando desambigua, ou lexicgrafo cando agrupa por anidades semnticas as diferentes papeletas ou
rexistros dunha palabra, son variadas (seguimos o esquema de Imbs no
prlogo do TLF, pero unha prctica experimentada en toda a lexicografa
desde o Renacemento).
(a) A maiora das claves son de tipo contextual (colocacins) na medida en que pertencen a un uso habitual colectivamente memorizado. Estas
claves ou auxiliares poden ser:
O contexto inmediato, e desta maneira o adxuvante pode ser categorial (unha palabra cambia de sentido co cambio de categora:
pasaxeiro s. ou a.: un pasaxeiro, unha crise pasaxeira), de natureza
sintctica (unha palabra non signica o mesmo se s se usa en
singular ou se se pode usar en singular e en plural: a luz intensa,
vexo das luces; ou se cambia de signicado segundo a preposicin que rexa: mirar algo, mirar por algo).
O auxiliar dominio. ben coecido que moitas palabras teen unha
acepcin diferente na lingua comn ou cando son usadas nun dominio especco (unha ciencia, unha tcnica, un ocio): mesa non
o mesmo na lingua comn que cando se fala de carros do pas; a
silencio psalle o mesmo segundo o usemos na lingua comn ou
falando de msica (gardar silencio, un silencio de redonda).
O auxiliar retrico (s veces concomitante redundantemente,
porque a lingua moitas veces redundante co contexto inmediato). Refermonos con isto uso que se fai dos vocbulos co recurso
da metfora, da metonimia e da elipse, que nos dicionarios se inventaran tamn como acepcins dentro do campo smico dunha
palabra: a febre, que unha alteracin da temperatura corporal (a
febre do cativo), pode por metfora pasar a desexo incontrolado (a
febre dos consumidores); mesa un moble coecido, e por metonimia mesa do leite ou Mesa pola Normalizacin Lingstica un
grupo de persoas, que se constiten non necesariamente arredor
dunha mesa, para reivindicar algo; vehculo autombil incorpora
os semas de vehculo a autombil cando vehculo desaparece por
elipse. Hai que ter en conta que as relacins metonmicas e meta-
376
Antn Santamarina
fricas teen diferentes graos de transparencia, pero o que interesa aqu chamar a atencin sobre o procedemento.
O auxiliar estilstico, que diferente do retrico porque non se rere a guras de pensamento senn a situacins nas que estn involucrados o emisor e receptor (niveis de lingua) ou intensidade
expresiva ou afectiva que caracterizan o uso dunha palabra (rexistros). Sabido que estas connotacins distinguen certas palabras
dalgns sinnimos semnticos (falador equivale a larapeteiro,
pero dependendo s do rexistro) e, o que mis importante anda,
interveen na segmentacin polismica das palabras (por exemplo home ten a acepcin de marido s nun contexto de lingua popular; nar pode signicar morrer por razns eufemsticas). Moitos destes sentidos dependen do sistema de valores de cada poca
e anda de cada grupo, e daquela as connotacins poden cambiar
segundo cambien as situacins socioculturais (cfr. palabras como
aristcrata, burgus, fascista, clase, masa, segundo onde e por quen
se digan; as regras de boa crianza xeron que longo da historia
bastantes palabras se tabuizasen).
Os auxiliares demarcativos, que axudan tamn a desambiguar a
polisemia, pois segundo as palabras do seu contorno unha palabra pode signicar unha cousa ou outra; na maiora dos casos un
verbo ten sentidos diferentes dependendo dos complementos (ou
actantes) que tea; nos dicionarios distnguense tradicionalmente sentidos dos verbos segundo o carcter transitivo, intransitivo,
pronominal, etc. (aproveitar/aproveitarse). Tamn as variacins na
morfoloxa poden discriminar sentidos (fumes en plural vaidade, arrogancia).
As condicins semnticas son os auxiliares mis importantes para
demarcar sentidos. Un verbo, por exemplo, pode ter sentidos diferentes segundo o suxeito sexa animado/inanimado, humano/
animal, persoa/cousa, abstracto/concreto (fulano corre, a auga corre, o da corre, o rumor corre; fulano quere a mengana, as plantas
queren luz).
Todos estes coadxuvantes contextuais permiten desambiguar polisemias tanto se o dicionario histrico como sincrnico; de feito, nos
dicionarios histricos asmese que un signicante ten un signicado
constante durante un certo tempo e ten que dar noticia das mutacins
formais como das perdas ou gaos no signicado; mesmo en certos casos
ter que asumir as estratexias dun dicionario bilinge cando a palabra
377
378
Antn Santamarina
Todo isto de manual. Pero despois a prctica lexicogrca admite moita exibilidade porque, sexan polismicas, sexan homonmicas, a lexicografa non deu denido anda ata qu extremo se debe apurar a discriminacin
de sentidos. un problema vello dos dicionarios e nos libros de lexicografa
que tratan do tema sempre se chama a atencin sobre como en dicionarios
de alcance similar (polo tanto non un problema de tamao) a polisemia
se trata de maneira moi diverxente, como se desprende do nmero de acepcins, poucas veces coincidente, que se dan da mesma palabra; porque entre
os lexicgrafos hai das tendencias, a dos splitters e a dos lumpers (ou xebradores e agrupadores), segundo tendan, como os taxonomistas da bioloxa,
a recoller os matices mis midos ou preran dar nunha nica acepcin
varios sentidos algo diferentes pero con trazos comns. Ctase como exemplo de splitter o dicionario da Crusca, que para luogo ten 172 pargrafos, en
contraste co Littr, onde lieu ten s 24 (salvadas as diferenzas que poida haber de lingua a lingua, que son poucas (vxase Migliorini 1961: 46). Polo seu
carcter, os dicionarios histricos pertencen todos clase dos splitters. As
que para entradas algo complexas, para que o lector non se perda, a entrada
vn encabezada cun ndice, que agora no OED electrnico se proporciona
como un plano ou mapa da entrada (cfr. light a1).
5. Posterior clasicacin de acepcins dunha palabra (que xa se basea nunha anlise smica que en certa maneira supn unha denicin)
vn a denicin mesma. A denicin a parte esencial dun dicionario
(excepto dalgns tipos de dicionarios moi especiais). Non nos imos deter agora nunha teora da denicin, porque a denicin dun dicionario
histrico non diferente da denicin de calquera dicionario de lingua e
sobre ela hai literatura en todos os manuais, includos varios, excelentes,
en casteln (como Lara 2004). Xa se sabe que unha denicin correcta
aquela na que hai equivalencia semntica exacta entre o lema e a sa parfrase ou o sinnimo que lle segue. Polo tanto, unha denicin ser boa
se deniendum e deniens son reversibles. verdade que hai palabras especiais ( parte das gramaticais) que non se poden denir por sinnimos
nin polo procedemento aristotlico de genus proximum e differentiae specicae porque son primitivos semnticos, ou sexa, palabras que teen un
contido semntico que non ten genus proximum porque por riba do seu
genus xa non hai nada; non son hipnimos de ningun (ou non teen
hipernimo, que o mesmo); o caso de facer, suceder, parte, dicir, grande, onde e unhas ducias mis (cfr. Wierzbicka 1996). O nome de primitivos xa vn de Arnauld (1662) (Wierzbicka 1996: 12); dito nas palabras de
Wierzbicka (1996: 10), os elementos que se usan para denir o signicado
379
de palabras (ou calquera outro signicado) non poden ser eles mesmos
denidos; mis ben deben de ser aceptados como indenibilia. Por iso
as denicins destas palabras ou son circulares ou son mis escuras c
palabra mesma pois non se pode cumprir o requisito de que a denicin
sexa construda con elementos mis simples e comprensibles c palabra
denida. Na lexicografa clsica xa se entenda as: tre exister ne comporte pas dnition analytique parce que il ny a pas de terme ayant un
contenu plus gneral que lui, faute de quoi on a recours des dnissants
simplement synonymes et/ou des denitions dantonymie (TLF).
Ademais da exactitude hai unha serie de notas engadidas que se lles
adoita pedir s denicins lexicogrcas, entre elas, a brevidade e, de ser
posible, a elegancia.
As denicins lexicogrcas son, como sabido, denicin de palabras,
e non de cousas (estas seran mis propias dun dicionario enciclopdico).
Con todo, cando denimos unha palabra mostrando o seu xnero prximo
(escano banco...) estamos orientando o lector cara a un referente extralingstico, en certa maneira mostrndoo (funcin dectica) e a travs das
diferenzas especicas (corrido, xo e con respaldo...) estamos mostrando
os mobles que teen caractersticas parecidas pero non idnticas.
Por iso, as denicins dos dicionarios histricos desentndense bastante dos principios da reversibilidade e de que as denicins sexan denicins de palabras e non de cousas. Certamente un lector de dicionarios
histricos (forzosamente un especialista ou un curioso moi motivado
pola historia da lingua) prere os pormenores enciclopdicos denicin
do signo, ou mesmo a redundancia de informacins reversibilidade. Tamn pola mesma razn de que un lector de dicionarios unha persoa de
certa cultura se preocupa menos cs lectores doutros dicionarios de que
as palabras da denicin sexan menos escuras c entrada mesma, porque se entende que o seu posible lector domina un caudal lxico maior c
dun lector normal.
No OED, por citar un clsico, abundan denicins como as seguintes:
place (sb) 1b.
In modern use, forming the second element in the name of a group of houses (and hence of a
street) in a town or city, now or formerly possessing some of the characters (positive or negative)
of a square, chiefly that of not being properly a street.
Often used in the name of a small area more or less built around, and lying aside from a street
or thoroughfare, or of a short cul-de-sac or byway turning out of a main thoroughfare; also, more
vaguely given to a short row or terrace of houses, which originally stood by themselves on a
suburban road; being in fact a ready denomination for any aggregation of houses which cannot
be more particularly classed.
380
Antn Santamarina
Employed in 16th c. to render F. place and its Italian, Spanish, and German cognates, in reference
to foreign towns, whence introduced in English towns. (But in some cases the name Place has
arisen out of sense 4b, the site being that of a noblemans or bishops town-residence, which bore
the name, e.g. Ely Place in London [A definicin de Murray].
square (sb) 12. a
An open space or area (approximately quadrilateral and rectangular) in a town or city, enclosed
by buildings or dwelling-houses, esp. of a superior or residential kind, freq. containing a garden
or laid out with trees, etc.; more generally, any open space resembling this, esp. one formed at the
meeting or intersection of streets; also, the group of houses surrounding an area of this kind [A
definicin de Craigie].
No caso do noso dicionario histrico galego, igual que ocorre nos glosarios suzos, ou no DCVB, na mia opinin, o principio das equivalencias smicas non debe de ser unha camisa de forza, pois o usuario dun
dicionario destas caractersticas, especialmente en palabras patrimoniais
que teen algo que ver coa vida espiritual ou material dos galegos ou en
voces das nomenclaturas (partes do muo, ferramentas, etc.), mis que a
equivalencia exacta e a reversibilidade, agradecer informacins enciclopdicas que vaian mis al dos trazos esenciais; mesmo sera bo, se do
caso, mostralle os obxectos nun grco ou nunha imaxe.
Hai anda pormenores referidos denicin, como son o nada sinxelo
da xerarquizacin das acepcins. Nos dicionarios histricos a organizacin non pode ser senn cronolxica. Na prctica, isto en moitas palabras
imposible, porque acepcins que foron orixe doutras poden estar documentadas despois das que derivan dela. Por iso, cada denicin pide
estratexias diferentes. No noso caso, que temos unha historia literaria interrompida, probable que as rupturas cronolxicas sexan frecuentes. En
calquera caso, independentemente de que saibamos que rama vn antes
381
ou vn despois, nestes dicionarios poden haber varios niveis de xerarquizacin, como se ve polos catro en que Onions dividiu os 12 sentidos da
palabra whimsy (cfr. Berg 1993: 34) e casos parecidos a centos:
382
Antn Santamarina
rados electrnicos, o vocabulario non leva ltros humanos (ou non leva
mis ltros cs que lle queiramos impor mquina) e poden aparecer todas as palabras dun corpus, cada unha coa sa frecuencia; iso quere dicir
que palabras con moitas ocorrencias van ter moitas chas e o problema
convrtese no contrario, ou sexa, nun exceso de documentacin: palabras
como ter, vir, haber..., e xa non digamos algunhas palabras gramaticais,
que teen decenas de millares de exemplos cada unha (polo menos para
un corpus de cerca de 15 millns, como o noso moderno). Nestes casos o
redactor do dicionario ten que operar s cunha mostra e anda dela s lle
pode trasladar lector un exemplario moi reducido.
Hai que ter en conta que os exemplos son os portadores dunha tradicin e deben deixar ben manifesta a sa continuidade ou a sa ruptura.
No OED insrense, ordenados cronoloxicamente, de dous a cinco exemplos
por sculo. No DHLE danse tres ou catro por sculo e indcase que entre
o sculo tal e cal hai mis de 124 chas (ou as que sexan), para dar idea
da frecuencia. Como o dicionario histrico debe dar conta da cronoloxa
das palabras, imprescindible que a primeira documentacin sexa un dos
exemplos.
Os textos ilustrativos, sempre que haxa abondos para escoller, deben
mostrar a palabra en contextos sintagmticos que permitan corroborar
ben que a anlise feita na denicin correcta (nunha entrada como ovo
convn que entren exemplos que inclan palabras como pita, poer, nio,
cesta, ducia, casca, xema, choco, cocido, estrelado, podre, goro...). Se por riba
os exemplos ilustran as relacins paradigmticas da palabra (sinnimos
e antnimos), os dominios de uso ou os niveis de lingua, anda mellor. Os
textos en prosa sempre son preferibles s textos en verso.
Para ser ben, os exemplos deben ser autenticamente histricos, ou
sexa culturais, demostrativos de usos datados e vencellados s condicins
do medio (Imbs) de maneira que o dicionario de lingua se prolongue tanto como sexa posible nun dicionario de cousas, tanto da cultura material
como espiritual. A lingua un espello da cultura dun pas e o dicionario
a travs das denicins e dos exemplos cumpre unha funcin antropolxica (Lara 1990); iso o que xustica que poida haber, por exemplo, un
Diccionario del espaol de Mxico.
Nos dicionarios de autoridades os exemplos estn escollidos cun
criterio esttico. De feito, quen non era bo escritor xa non era considerado autoridade. O noso corpus non foi feito tomando como criterio a
excelencia literaria dos testemuos. O corpus non do galego literario
(belles lettres), pois hai textos de moitos xneros. Pero, anda considerando textos que foron escritos con pretensins literarias, na escolla de
383
384
Antn Santamarina
de recepcin, de emisin, parablica, colectiva, individual, interior, telescpica, anda que ningunha das expresins necesite denicin, porque o
seu signicado vn cadrando co da suma dos dous elementos.
En canto s derivados, como xa se dixo, algns teen entrada como
lemas separados se teen usos lexicalizados independentes (librillo ou librito ou mesmo librio o de follas de papel de arroz para lear cigarros). En
cambio, lstanse dentro da entrada, sen denicin ningunha, ordenados
alfabeticamente e seguidos por unha lista de exemplos, naqueles casos
en que o derivado se forma cun prexo ou un suxo produtivo e de signicado transparente para un nativo; e aqu van todos os apreciativos (-io,
-azo...) e anda outros do tipo -ble, -idade, -izar, des-, re- (educable, galeguidade, galeguizar, desensarillar, recolocar). Non est moi denido na prctica lexicogrca, con todo, qu derivados teen entrada e cales se colocan
como apndice dunha entrada; se fosen todos suxos non presentaran
moitas dbidas (entre outras razns porque a sa colocacin nun dicionario alfabtico xa sera contigua entrada); pero haber prexos, que
mandan os derivados a maior parte das veces moi lonxe dos primitivos,
obriga a darlles entrada s derivados anda que s sexa como referencia
cruzada. Nos prximos dicionarios de feitura electrnica este problema
da colocacin vai desaparecer e mesmo os derivados prexados poden ter
unha remisin interna doada.
Anda nos queda outra observacin que facer referente parte dos
contidos (ou sense section) do dicionario. Ata hai pouco o dicionario por
antonomasia via sendo unha obra en soporte papel que se organizaba
en artigos encabezados por unha palabra que, entre outras funcins, tia
a de facilitar a busca nunha organizacin alfabtica. Por iso, a gran maiora dos dicionarios eran semasiolxicos, ou sexa, an da palabra para o
signicado. Pero agora as ferramentas informticas permiten recuperar
a informacin de moitas outras maneiras. Para poer un exemplo sinxelo, a palabra choco, que vimos antes no sintagma ovo choco, s se poda
buscar en choco (claro que se podera buscar noutras partes do dicionario,
pero sera obrigatorio ler o dicionario enteiro). Nun dicionario electrnico,
supoendo que se planique ben e que se lle fabrique un motor de busca adecuado, poderiamos atopar a palabra choco en calquera outro lugar,
e especialmente nas referencias paradigmticas (hipernimos, hipnimos, sinnimos, antnimos ou simplemente palabras de signicado afn:
goro, galeado, fecundo...) que se inclusen nas denicins; e tamn nas secuencias sintagmticas que se usasen de ilustracins, como poden ser os
exemplos includos en sintagmas tales coma pita, galia, ovo, auga, caldo,
camp, voz, lata, neboeiro... + choco/a. Un e outro tipo de relacins pode
385
386
Antn Santamarina
pode ser o procedente do refraneiro e do dicionario de fraseoloxa. E nalmente algunha informacin est anda en fontes dispersas e difciles de
recoller, por exemplo a que gura en textos redactados en casteln, que
insiren palabras referidas a institucins galegas que non teen traducin
ou que, se a teen, lle era descoecida usuario. unha dispersin algo
embarazosa, pero creo que as cousas hai que velas polo lado positivo e
considerar como corpus bsico o TILG e o TMILG e os dicionarios de dicionarios, e considerar os outros como contrapuntos que poden permitir
unhas veces comprobacins e outras completar os datos propios. En calquera caso, os vimbios para facer o cesto xa estn xuntos (ou case), non
hai que ir monte por eles; a obra da cesta est nun estadio en que case
se pode comezar a tecer.
Agora, podemos formular unha pequena batera de preguntas que
non son doadas de responder. Entre elas as seguintes: (a) qun fai o dicionario histrico, (b) nde se fai, (c) cnto vai levar facelo, (d) cnto vai
custar facelo e tamn (e) cmo se fai.
(a) A primeira pregunta quizais a mis doada de contestar porque
hoxe son moitos os que neste pas saben como se fai (e tamn como non
se debe facer) un dicionario. En principio, parece que algunha responsabilidade deberan de ter os que se ocuparon previamente de organizar os
crpora de base, pero non necesariamente s eles. O que est claro que
a duracin da obra vai depender directamente do nmero e preparacin
e dedicacin das persoas que traballen nela. Iso quere dicir que o razoable sera que houbese un equipo estable que, como peda Julio Casares
(desenganado de ver como os membros do seu equipo se an marchando
despois de estaren preparados), estea decorosamente pagado. Hai que
ter en conta, de todas maneiras, que agrupar por anidades os diferentes
valores dunha palabra e facer despois as sas denicins un traballo
delicado para o que non todos valen, e daquela a escolla dos membros do
equipo debe efectuarse despois de avaliados adecuadamente os talentos
de cada un. Entre os fabricantes do dicionario non esquezamos que hai
unha parte informtica que debe ocupar un profesional competente.
(b) A segunda pregunta (nde se fai), no caso dunha lingua coma a
nosa, hai que responder dicindo que no seo dunha institucin acadmica.
Un particular ou unha institucin privada con nimo de lucro nunca vai
embarcarse nunha empresa destas caractersticas, porque o mesmo que
embarcarse nunha empresa de perdas millonarias; quen pense na posibilidade de que apareza un mecenas privado, sexa persoa ou fundacin, disposto a perder cartos pola cultura do pas est botando as contas da leiteira,
387
388
Antn Santamarina
Comezo
Fin
Anos previstos
Anos reais
Veces o previsto
DWB
1838
1961
10
123
12,3
OED
1876 (1858)
1928
13
52
WNT
1852
1998
25
146
5,84
SAOB
1883
2017
12
166
13,8
ODS
1901
1956
12
55
4,5
NO
1930
2014
84
DCVB
1901
1962
61
389
lego nas ciencias foi cativo, as que o nmero de lemas rexistrado nos
nosos crpora vai ser bastante menor; menor incluso c do cataln. Iso
pode poernos no equivalente a cinco ou seis volumes do DCVB, supoendo que se xese en papel. Tase en conta ademais que o noso corpus est feito; para os dicionarios da tboa anterior a data de inicio a
que corresponde de comezo do baleirado de textos; tal como estn as
cousas ns poderiamos comezar xa os traballos de redaccin en poucos
meses. Por outra parte, habera que imitar mis ben s que buliron que
non s que buliron pouco ou traballaron con interrupcins (a pesar deles). O TLF comezouse en 1957, apareceu o 1 volume en 1971 e rematou en
1994 (47 anos); o GDLI empezou a publicarse en 1961 e rematou en 2002; o
WAT (do afrikaans) vai ben de ritmo. As que, pomonos no mellor dos
casos, con cinco redactores full time mis os que xa gaen un soldo por
outro lado (na universidade por exemplo) e poidan dar cheda na obra do
dicionario, en 10 anos poderan ter redactado un bo carozo del. Dentro
dun pouco diremos unhas palabras sobre como se fai e volveremos sobre
isto. Sexa como for, o tempo que leve facelo vai depender da cantidade de
xente que traballe e de que traballe coa dedicacin esperada. O detallismo
con que se faga tamn pode inur na duracin; se cadra mellor nunha
primeira edicin sacricar algn pormenor secundario.
(d) Canto vai custar? Depende da cantidade de xente que traballe nel e
do tempo que leve rematalo. Cos datos que dei antes pode calquera botar
a conta: cinco lexicgrafos e un informtico con dedicacin exclusiva poden levantar un 300 mil euros ano. Se son 10 anos son 3 millns de euros
dos de hoxe. Dse por sentado que os acadmicos ou membros da universidade que poidamos traballar niso sera a base de prestacins voluntarias. Na mia opinin, son cifras asumibles e quen se asuste dese monto
ten que saber que un traballo que se pagara moi xenerosamente con
que lle dedicasen unha cuarta parte do que se queima cada ano en fogos
Apstolo (e podera poer moitos mis exemplos de foguetera similar
que non d proveito a ningun ou d un proveito ben escaso e efmero).
Damos por suposto que o resultado vai ser consultable en principio s
por Internet e daquela non haber gastos adicionais en papel, impresin
e encadernacin.
(e) Como se fai? Contestar esta pregunta sera o mesmo que ter xa un
manual de instrucins de como facelo, cousa que anda non est pensada
nos pormenores (que van ser moitos, e moitos deles s van xurdir e se podern resolver cando se entre en materia). Non vou facer senn das observacins relacionadas coas tecnoloxas actuais e que poden facer mis
viable o proxecto, adecundoo en cada caso dispoibilidade de medios.
390
Antn Santamarina
391
392
Antn Santamarina
393
BIBLIOGRAFA CITADA
394
Bibliografa citada
Adelung, Johann Christoph (1774-1786): Grammatisch-kritisches Wrterbuch der hochdeutschen Mundart. 5 vols. Leipzig: Breitkopf & Sohn;
1793-18022 (4 vols.).
Adler, Ada (ed.) (1928-1938): Suidae Lexicon. 5 vols. Stuttgart: Verlag Teubner.
Aguil i Fuster, Marian (1915-1934): Diccionari Aguil. Materials lexicogracs aplegats per Marian Aguil i Fuster, revisats y publicats sota la
cura de Pompeu Fabra i Manuel de Montoliu. 8 vols. Barcelona: Institut
dEstudis Catalans.
Alcal, Pedro de (1505): Vocabulista aruigo en letra castellana. Granada:
Juan Varela de Salamanca.
Alcover, Antoni Maria (1911): Crnica de la Secci Filolgica de lInstitut
dEstudis Catalans, Bollet del Diccionari de la Llengua Catalana VI, 20,
368-372.
Alcover, Antoni Maria (1920): Triunf denitiu, absolut i consumat de
lobra de Diccionari dins les Corts dEspanya..., Bollet del Diccionari de
la Llengua Catalana 3, 65-180.
Aldrete, Bernardo de (1606): Del origen y principio de la lengva castellana o
romance que oi se usa en Espaa. Roma: Carlos Willeto. [Ed. facsimilar
con estudo de Lidio Nieto, Madrid: CSIC, 1972].
Alewyn, Abraham / Joannes Coll (1714): Tesuro dos Vocbulos Das das
Lnguas Portuguza, e Blgica; Em que circunstantemnte se demstro
as sinicaos das Palvras Poruguzas segndo a abundncia da Belgica sincia da Lingugem; Ha bra, geralmnte, Pra tdos os amadres
das mbas Lnguas, e Principalmnte Pra s ensinadres e discplos das
msmas grandemnte proveitsa. Amsterdam: Pieter vanden Berge.
Almeida, tila (1988): Dicionrios parentes e aderentes. Uma bibiliograa
de dicionrios, enciclopdias, glossrios, vocabularios e livros ans em
que entra a lngua portuguesa. Joo Pessoa: FUNAPE/Nova Stela.
Alonso Ramos, Margarita (1994-1995): Hacia una denicin del concepto
de colocacin: de J. R. Firth a I. A. Meluk, Revista de Lexicografa 1,
9-28.
Alonso y de los Ruizes de Fontecha, Juan (1606): Diez previlegios para las
mujeres preadas. Alcal: Luys Martynez Grande.
Alonso, Amado (1951): Rec. de Gili Gaya (1947-1957), en NRFH V, 3, 324-328.
Alvar Ezquerra, Manuel (1992): La Janua Linguarum de los jesuitas irlandeses de Salamanca, en Jos Antonio Bartol Hernndez / Juan Felipe
Garca Santos / Javier de Santiago Guervs (eds.): Estudios lolgicos
en homenaje a Eugenio de Bustos Tovar. Vol. I. Salamanca: Universidad,
61-64.
Alvar Ezquerra, Manuel (1993): Lexicografa descriptiva. Barcelona: Biblograf.
Bibliografa citada
395
Alvar Ezquerra, Manuel (1996): El Tesoro del andaluz, en Ignacio Ahumada (ed.): Vocabularios dialectales. Revisin crtica y perspectivas. Jan:
Universidad, 43-58.
Alvar Ezquerra, Manuel (2000): Tesoro lxico de las hablas andaluzas. Madrid: Arco/Libros.
Alvar Ezquerra, Manuel (2002): El diccionario de Richard Percyvall, en
Carmen Saralegui Platero / Manuel Casado Velarde (eds.): Pulchre,
bene, recte. Estudios en homenaje al Prof. Fernando Gonzlez Oll. Pamplona: Universidad de Navarra/Gobierno de Navarra, 49-71. [Recollido
en De antiguos y nuevos diccionarios del espaol. Madrid: Arco/LibrosAgencia Espaola de Cooperacin Internacional, 2002, 170-190].
Alvar Ezquerra, Manuel (2002-2004): Lxico espaol en la Historia animalium de Conrad Gesner, Archivo de Filologa Aragonesa, 59-60, 149-167.
Alvar Ezquerra, Manuel (2003a): Estado actual del Nuevo Tesoro Lexicogrco del Espaol (s. XIV-1726): repertorios posteriores a 1600, en
Mara Antonia Martn Zorraquino / Jos Luis Aliaga Jimnez (eds.): La
lexicografa hispnica ante el siglo XXI. Balance y perspectivas (Actas
del Encuentro de Lexicgrafos celebrado en Zaragoza en el marco del
Centenario Mara Moliner, los das 4 y 5 de noviembre de 2002). Zaragoza: Gobierno de Aragn-Institucin Fernando El Catlico, 25-49.
Alvar Ezquerra, Manuel (2003b): El Nuevo Tesoro Lexicogrco del Espaol
(s. XIV-1726) y los diccionarios con las lenguas romnicas, en Actas de la
III Escuela Interlatina de Altos Estudios en Lingstica Aplicada. La lexicografa plurilinge en lenguas latinas: patrimonio, actualidad, perspectivas (San Milln de la Cogolla, 22-25 de octubre de 2003), no prelo.
Alvar Ezquerra, Manuel (2004): El Nuevo Tesoro Lexicogrco del Espaol
(s. XIV-1726): repertorios anteriores a 1600, en Paz Battaner / Janet DeCesaris (eds.): De Lexicograa. Actes del I Symposium Internacional de
Lexicograa (Barcelona, 16-18 de maig de 2002). Barcelona: Universitat
Pompeu Fabra, Institut Universitari de Lingstica Aplicada, 19-38.
Alvar Ezquerra, Manuel (2006a): Un proyecto en marcha: el Nuevo Tesoro
Lexicogrco del Espaol (s. XIV-1726), en Javier Rodrguez Molina /
Daniel Sez Rivera (coords.): Diacrona, Lengua Espaola y Lingstica.
Actas del IV Congreso Nacional de la Asociacin de Jvenes Investigadores de Historiografa e Historia de la Lengua Espaola (Madrid, 1, 2 y
3 de abril de 2004). Madrid: Sntesis, 43-61.
Alvar Ezquerra, Manuel (2006b): Lxico del Tractado de las drogas y medicinas de las Indias Orientales de Cristbal Acosta, Verba 33, 7-30.
Alvar Ezquerra, Manuel (2006c): Cambios en el lxico espaol del Vocabulista de fray Pedro de Alcal (1505), en Actas del II Congreso Interna-
396
Bibliografa citada
Bibliografa citada
397
Bacelar do Nascimento, Maria Fernanda et al. (1984): Portugus Fundamental. Vol. 1. Vocabulrio e Gramtica. Lisboa: INIC/Centro de Lingustica da Universidade de Lisboa.
Bacelar do Nascimento, Maria Fernanda et al. (1987): Portugus Fundamental. Vol. 2. Mtodos e documentos. Lisboa: INIC/Centro de Lingustica da Universidade de Lisboa.
Balbus, Johannes (1286): Catholicon. Ed. incunabular en Maguncia (1460).
Baldinger, Kurt / Denis Gendron / Georges Staka (1974-2006): Dictionnaire
tymologique de lancien franais. Quebec / Tbingen / Paris: Presses
de lUniversit Laval / Niemeyer / Klincksieck.
Barbosa, Jernimo Soares (1822): Grammatica philosophica da lingua portugueza ou principios da grammatica geral aplicados nossa linguagem. Lisboa: Academia Real das Sciencias.
Barreto, Manuel (1607): Vocabulario Lusitanico Latino composto na Provincia de Japo. 3 vols. manuscritos (Biblioteca da Academia das Cincias
de Lisboa).
Berg, Donna Lee (1993): A Guide to de Oxford English Dictionary. The essential companion and users guide. Oxford: Oxford University Press.
Blancas, Gernimo de (1641): ndice donde se declaran algunos vocablos
aragoneses antiguos, en Coronaciones de los serenssimos reyes de
Aragn. Zaragoza: Diego Dormer.
Bluteau, Rafael (1712-1728): Vocabulario Portuguez e Latino, Aulico, Anatomico, Architectonico, Bellico, Botanico [...], autorizado com exemplos dos
melhores escritores portuguezes, e latinos, e offerecido a ElRey de Portugal, D.Joa V pelo Padre D.Rafael Bluteau. Coimbra: Collegio das Artes
da Companhia de Jesus / Lisboa: Joseph Antonio da Silva, 1712 (vols. I
e II, A, B-C), 1713 (vols. III e IV, D-E, F-I), 1716 (vol. V, K-N), 1720 (vols. VI e
VII, O-P, Q-S), 1721 (vol. VIII, T-Z), 1727 (suplemento I), 1728 (suplemento
II). [Reimpresin en Hildesheim: Georg Olms, 2002. Edicin en CD-Rom
da Academia Brasileira de Letras, 2003].
Bluteau, Rafael (1714/1728): Prosas portuguesas. 2 vols. Lisboa: Jos Antnio da Silva.
Bosque, Ignacio (1982): Sobre la teora de la denicin lexicogrca, Verba 9, 105-123.
Bosque, Ignacio (2004): REDES. Diccionario combinatorio del espaol contemporneo. Madrid: Ediciones SM.
Bosque, Ignacio (2006): Una nota sobre la relevancia de la informacin
sintctica en el diccionario, en Elisenda Bernal / Janet DeCesaris
(eds.): Palabra por palabra. Estudios ofrecidos a Paz Battaner. Barcelona: Institut Universitari de Lingstica Aplicada, 47-53.
398
Bibliografa citada
Bibliografa citada
399
400
Bibliografa citada
CLIG = Gmez Guinovart, Xavier (coord.) (2005): Dicionario CLUVI inglsgalego. Seminario de Lingstica Informtica. Universidade de Vigo.
<http://sli.uvigo.es/CLIG/>
CLP = Verdelho, Telmo (dir.): Corpus Lexicogrco do Portugus. Universidade de Aveiro. <http://clp.dlc.ua.pt/inicio.aspx>
CLUVI = Seminario de Lingstica Informtica: Corpus Lingstico da Universidade de Vigo. Vigo. Universidade. <http://sli.uvigo.es/ CLUVI/>
CODOLGA = Lpez Pereira, Jos Eduardo: Corpus Documentale Latinum
Gallaeciae. Centro Ramn Pieiro para a Investigacin en Humanidades. <http://corpus.cirp.es/codolga/>
Coln, Germn (1956): A propos du Tesoro Lexicogrco de S. Gili Gaya,
ZRPh 72, 379-386.
Constncio, Francisco Solano (1836): Novo Diccionario crtico e etymologico da lingua portuguesa. Paris: Angelo Francisco Carneiro Junior Tip.
de Casimir.
Corbeil, Jean-Claude (1971): Aspects du problme nologique, La Banque
des Mots 2, 123-136.
CORDE = Real Academia Espaola: Corpus Diacrnico del Espaol. Real
Academia Espaola. <http://corpus.rae.es/cordenet.html>.
CORGA = Guillermo Rojo (dir.): Corpus de Referencia do Galego Actual.
<http://corpus.cirp.es/corgaxml>.
Corominas, Joan (1954-1957): Diccionario crtico etimolgico de la lengua
castellana. Berna / Madrid: Francke / Gredos.
Cortelazzo, Manlio / Paolo Zolli (1999): Dizionario etimologico della lingua
italiana. Bologna: Zanichelli, 19992.
Corteso, Armando (1978): A Suma Oriental de Tom Pires e o Livro de Francisco Rodrigues, Coimbra: Universidade.
Coseriu, Eugenio (1977): Principios de semntica estructural. Madrid: Gredos.
Covarrubias Horozco, Sebastin (1611): Tesoro de la lengua castellana, o espaola. Madrid: Luis Snchez. [Ed. de Martn de Riquer en Barcelona: Horta,
1943. Ed. de Ignacio Arellano / Rafael Zafra en Pamplona: Universidad de
Navarra / Iberoamericana / Vervuert / Real Academia Espaola, 2006].
CREA = Real Academia Espaola: Corpus de Referencia del Espaol Actual.
Real Academia Espaola. <http://corpus.rae.es/creanet.html>
CRPC = Nascimento, Maria Fernanda Bacelar do (dir.): Corpus de Referncia do Portugus Contemporneo. Centro de Lingustica (Universidade
de Lisboa). <http://www.clul.ul.pt/sectores/linguistica_de_corpus/
projecto_crpc.php>
CTG = Seminario de Lingstica Informtica: Corpus Tcnico do Galego.
Vigo. Universidade. <http://sli.uvigo.es/CTG/>
Bibliografa citada
401
402
Bibliografa citada
DHLF = Rey, Alain (dir.) (1992): Dictionnaire historique de la langue francaise; contenant les mots francais en usage et quelques autres delaisses. 2
vols. Paris: Dictionnaires Le Robert.
Dias, G. / S. Guillor / J. G. P. Lopes (2000): Extraction automatique
dassociations textuelles partir de corpora non traits, en M. Rajman
/ J.-C. Chappelier (2000): Proceedings of 5mes journes internationales
danalyse statistique des donnes textuelles. Lausanne: EPFL, 213-221.
Diccionario abbreviado da Bblia traduzido do francez. Lisboa: Antonio Rodrigues Galhardo, 1766, 17942.
Diccionario de Autoridades = Real Academia Espaola (1726-1739): Diccionario de la lengua castellana en que se explica el verdadero sentido de
las voces, su naturaleza y calidad, con las phrases o modos de hablar, los
proverbios o rephranes, y otras cosas convenientes al uso de la lengua
[...] / Compuesto por la Real Academia Espaola. Madrid: Francisco del
Hierro, 17702.
Diccionario Geral (1818) = Diccionario Geral da Lingoa Portugueza de algibeira. por tres literatos nacionaes. Contem mais de vinte mil termos
novos pertencentes a Artes, Ofcios, e Sciencias, todos tirados de Classicos Portuguezes, e ainda no incluidos em Diccionario algum at ao
prezente publicado. Lisboa: Impresso Regia.
Diccionario Portuguez e Brasiliano. Obra necessria aos ministros do altar
que empreenderam a converso de tantos milhares de almas que ainda
se acham dispersas, pelos vastos sertes do Brasil, sem o lume da f, e
batismo. Aos que paroqueiam misses antigas, pelo embarao com que
nelas se fala a lngua portuguesa, para melhor poder conhecer o estado
interior de suas conscincias. A todos os que se empregarem no estudo
da histria natural da geograa daquele pas, pois conserva constantemente os seus nomes originais e primitivos. Lisboa: Ocina Patriarcal,
1795. [En 1934 foi feita unha reedicin con adicin da segunda parte:
Dicionrio Portugus-Brasiliano e Brasiliano-Portugus, ordenada e
preparada por Plnio M. da Silva Ayrosa. So Paulo: Imprensa Ocial].
Diccionario Universal (1845) = Diccionario Universal da Lingua Portugueza,
que abrange Todos os Vocabulos da Lingua Portugueza, antigos e modernos, suas accepes e sentido conforme as authoridades de nossos
classicos, [...] por Uma Sociedade de Litteratos. Lisboa: Typographia de
P.A. Borges.
Diccionario universal das moedas: assim metallicas, como cticias, imaginarias, ou de conta, e das de fructos, conchas, &c. que se conhecem na Europa, Asia, Africa, e Amrica. A que se ajunta huma noticia das Moedas
dos Judeos, Gregos, e Romanos; e dois Mappas dos pzos das principaes
Bibliografa citada
403
Cidades de Commercio; das Medidas dextenso reduzidas a palmos, covados, e varas; e das de capacidade, assim para secos como para molhados. Recopilado por**** Lisboa, of. de Simo Thaddeo Ferreira, 1793.
Dictionarivm latino lvsitanicvm, ac iaponicvm ex Ambrosii Calepini. Amacusa, 1595.
Dictionnaire de lAcadmie Franaise. Paris: Coignard.
DIEC (1995) = Institut dEstudis Catalans (1995): Diccionari de la Llengua
Catalana. Barcelona / Palma / Valncia: Enciclopdia Catalana.
DLC (1982) = Diccionari de la llengua catalana. Barcelona: Enciclopdia Catalana, 1982.
DLCL = Labrnia, Pere (1839-1840): Diccionari de la llengua catalana ab la
correspondencia castellana y llatina. 2 vols. Barcelona: V. Pla.
DMCF = Figuera, Pere Antoni (1840): Diccionario mallorqui-castella. Palma:
Esteve Trias.
DMCT = Tarong i Corts (1878): Diccionario mallorqu-castell. [Obra
inacabada].
DMFC = Febrer i Cardona, A.: Diccionri menorqu, espaol, francs y llat.
Texto manuscrito de comezos do sculo XIX.
DPCB = Valls, Emili (1927): Pallas diccionai catal-castell-francs, amb
vocabularis castell-catal i francs-catal. Barcelona: Pallas.
DPD = Real Academia Espaola / Asociacin de Academias de la Lengua
Espaola (2005): Diccionario panhispnico de dudas. Madrid: Santillana. <http://buscon.rae.es/dpdI/>
DRAE = Real Academia Espaola (2001): Diccionario de la lengua espaola. Madrid: Espasa-Calpe, 200122. Edicin en CD-ROM, Madrid: EspasaCalpe, 2003. <http://buscon.rae.es/draeI/>
DRAG (1913-1928) = Real Academia Gallega (1913-1928): Diccionario gallego-castellano. A Corua: Imprenta Ferrer. [Includo en Santamarina
(2003b)].
DRAG (1997) = Garca, C. / Manuel Gonzlez Gonzlez (dirs.) (1997): Diccionario da Real Academia Galega. A Corua: Galaxia / Xerais.
DRG = Planta, Robert de / Florian Melcher / Chasper Pult et al. (1939- ):
Dicziunari rumantsch grischun, publich da la Societ reto-rumantscha cul agd da la Confederaziun, dal chantum Grischun e da la Lia
rumantscha. 12 vols. (A-M). Cuoira: Bischofberger. <http://www.drg.
ch/index.html>
DS = Gutirrez Cuadrado, Juan (dir) (1996): Diccionario Salamanca de la lengua
espaola. Madrid/Salamanca: Santillana/Universidad de Salamanca.
DUE = Moliner, Mara (1966): Diccionario de uso del espaol. Madrid: Gredos, 19982. [Ed. electrnica en 2001].
404
Bibliografa citada
DVCE = Escrig, Jos (1851): Diccionario valenciano-castellano. Valncia: Imprenta de J. Ferrer de Orga.
DVPM (1999) = Xavier, Mara Francisca / G. Vicente / M. L. Crispim (ed.)
(1999): Dicionrio de Verbos Portugueses do Sculo 13. Lisboa: Centro de
Lingustica da Universidade Nova de Lisboa.
DVPM (2003) = Xavier, Maria Francisca / G. Vicente / M. L. Crispim (ed.)
(2003): Dicionrio de Verbos do Portugus Medieval. Sculos 12 e 13/14.
Lisboa: Centro de Lingustica da Universidade Nova de Lisboa.
DWB = Grimm, Jacob / Grimm, Wilhelm (1854-1861): Deutsches Wrterbuch. 32 vols. Leipzig: S. Hirzel. <http://germazope.uni-trier.de/Projects/DWB>
Encyclopdie = Diderot, M. (1752): L encyclopdie ou dictionnaire raisonn
des sciences, des arts et des mtiers []. Mis en ordre & publi par M.
Diderot []. Paris: Briasson / David / Le Breton / Durand, 1752 ss.
Estienne, Robert (1531): Thesaurus linguae latinae. Paris.
Estravs (1995) = Alonso Estravs, Isaac (dir.) (1995): Dicionrio da lngua
galega. Santiago de Compostela: Sotelo Blanco.
Fabra, Pompeu (1917): Diccionari ortogrc. Barcelona: Institut dEstudis
Catalans.
Faria, Eduardo de (1858-1859): Diccionario da lingua portugueza de Eduardo de Faria: quarta edio para uso dos portuguezes e brasileiros resumida correcta e augmentada com grande numero de termos antigos
e modernos, por D. Jos Maria de Almeida e Araujo Corra de Lacerda,
etc. Comprehendendo todos os vocabulos devidamente accentuados
suas accepes e sentidos conforme a auctoridade dos nossos classicos.
A etymologia de todos os termos radicaes, expondo o sentido rigoroso das raizes primitivas latinas, gregas, etc. A interpretao dos termos
que usavam os antigos escriptores, e que se acham mal denidos nos
Diccionarios at hoje publicados. Uma introduco grammatical a
mais completa, e ao alcance de todas as intelligencias. Um vocabulario
da lingua Tupy, chamada lingua geral dos indigenas do Brasil: seguido
de um Diccionario de Synonymos com reexes criticas. 2 vols. Lisboa:
Imp. de Francisco Xavier de Sousa.
Faria, Eduardo de (1859): Novo Diccionario da Lingua Portugueza. O mais exacto e mais completo de todos os Diccionarios at hoje publicados. Quarta
edio. Rio de Janeiro: Typ. Imperial e Constitucional de J. Villeneuve.
Fernndez Rei, Francisco (2004a): O Arquivo do Galego Oral do Instituto
da Lingua Galega, en C. Pujales Prats (ed.): Actas I, II e III Encontros O
Son da Memoria. Santiago de Compostela: Consello da Cultura Galega, 63-79.
Bibliografa citada
405
406
Bibliografa citada
Bibliografa citada
407
408
Bibliografa citada
Bibliografa citada
409
410
Bibliografa citada
Bibliografa citada
411
Laredo, Bernardino de (1527): Modus faciendi cum ordine medicandi. Sevilla: Jacobo Cromberger.
Laurenzi, Joseph (1640): Amalthea onomastica in qua voces universae, abstrusiores, sacrae, profanae, antiquae, antiquatae, usurpatae, usurpandae [...]. Basilea.
Leech, G. / A. Wilson (1996). Recommendations for the Morphosyntactic
Annotation of Corpora. EAGLES Guidelines. [en lia] <http://www.ilc.
cnr.it/EAGLES96/annotate/annotate.html>
LEI = Pster, Max (1979- ): Lessico Etimologico Italiano. Wiesbaden: Reichert.
Leiras Pulpeiro, Manuel (ca. 1906): Vocabulario. Texto manuscrito. Fundacin Penzol. [Includo en Santamarina (2003b)].
Lence Santar, Eduardo (1938-1941): Etnografa mindoniense. Ed. de Armando Requeixo. Santiago de Compostela: Follas Novas, 2000.
Llpiz Mndez, Vicente Luis (1954a): Locuciones, en Llpiz 1954a.
Llpiz Mndez, Vicente Luis (1954a): Refranero gallego. Indito. Editorial de
los Biblilos Gallegos. Museo de Pontevedra.
Llpiz Mndez, Vicente Luis (1956): Paremias selectas. Un manuscrito bonaerense (1956) de Vicente Llpiz Mndez, Cadernos de Fraseoloxa
Galega 8 (2006), 265-316. [Edicin de Xess Ferro Ruibal e Cristina Veiga
Novoa].
Lopes, David (1969): A expanso da lngua portuguesa no Oriente nos sculos XVI, XVII e XVIII. 2 ed. revista, prefaciada e anotada por Lus de
Matos. Porto: Ed. Portucalense. [A primeira edicin de 1936; reprod.
facsimilar en Lisboa: Copipronto, 2000].
Lpez, Gregorio (1672): Tesoro de medicinas para todas enfermedades.
Mxico: Francisco Rodrguez Lupercio.
Lpez Fernndez, S. et al. (2005): Novas palabras galegas. Repertorio de creacins lxicas rexistradas na prensa e en Internet. Vigo: Universidade.
Lpez Ferreiro, Antonio (ed.) (1901): Galicia Histrica. Coleccin diplomtica. Santiago: Tipografa Galaica.
Lorenzo, Ramn (ed.) (1968): Sobre cronologia do vocabulrio galego-portugus (Anotaes ao Dicionario etimolgico de Jos Pedro Machado).
Vigo: Galaxia.
Lorenzo, Ramn (ed.) (1988): Coloquio de lexicografa. Santiago de Compostela: Universidade.
Losada Soler, Elena (2006): Los vocabularios del Roteiro da primeira viagem de Vasco da Gama y de la Relazione de Pigafetta: dos niveles de
conciencia lingstica, en Maresia 1, 42-53.
Lucena, Joo de (1600): Historia da Vida do Padre Francisco Xavier. Lisboa:,
Pedro Crasbeeck. [Ed. facsimilar en Lisboa, 1952].
412
Bibliografa citada
Luz, Toms da (1673): Amalthea, sive hortus onomasticus in gemina divisus orilegia, quorum quodlibet multigenas subdividitur in areolas, in
quibus communiora nomina ad quotidianum lingu Latialis usum, &
exercitation~e spectantia continentur, cum indice totulorum ad limen
apposito. Lisboa: Joannes a Costa.
Macdonald, Gerald J. (1981): Antonio de Nebrija, Vocabulario de romance
en latn. Madrid: Ctedra.
Machado, Diogo Barbosa (1741-1758): Bibliotheca Lusitana, Historia, Critica
e Chronologica, na qual se comprehende a noticia dos autores portuguezes, e das obras que compozeram desde o tempo da promulgao da Lei
da Graa, at o tempo presente. Lisboa. [Cit. pola ed. de Coimbra, 1966].
Maia, Manuel Rodrigues (1790): Diccionrio das elypses, que mais frequentemente se encontram nos auctores clssicos: interpretadas. Lisboa: Of.
de Antnio Gomes.
Mancho Duque, Mara Jess (ed.) (2005): Juan Jarava, Historia de las yervas
y plantas. Salamanca: Universidad.
Marcuello, Francisco (1617): Primera parte de la historia natvral y moral
de las aves. Zaragoza: Juan de Lanaja y Quartanet. [Ed. facsimilar en
Madrid: ICONA, 1989].
Marques, Jos (1758-1764): Nouveau dictionnaire des langues franoise et portugaise: Novo diccionario das linguas portugueza e franceza, com os termos latinos, tirado dos melhores Authores, e do Vocabulario Portuguez, e
Latino do P.D. Rafael Bluteau. Lisboa: Imp. de Jos da Costa Coimbra, 1758
(vol. I); Lisboa: Ofc. Patriarcal de Francisco Luiz Ameno, 1764 (vol. II).
Marques, Jos (1775-1776?): Nouveau Dictionnaire des langues franoise et
portugaise. Troisime edition. Lisboa: Imp. Royale.
Marques, Jos (ed.) (1999): Roteiro da primeira viagem da Vasco da Gama
ndia / lvaro Velho. Porto: Faculdade de Letras.
Maunory, Monsieur de (1701): Grammaire et dictionnaire franois et espagnol. Pars: Veuve de Claude Barbin.
Messner, Dieter (1994- ): Dicionrio dos dicionrios portugueses: Salzburg: Universitt/Institut fr Romanistik. [Da obra, en curso de publicacin, saron
a lume os seguintes volumes: I, ABA-ABC (1994); II, ABD-ABU (1994); III, AC
(1996); IV, ADA-AFU (1996); V, AGA-AJU (1995); VI, ALA-ALG (1997); VII, ALHALZ (1998); VIII, AM (1998); IX, AN-AO (2003); X, APA-APU (2005); XI, AQ-ARL,
(2005); XII ARM- ARRI (2005); XIII, ARRO-ATELI (2006); XIV, ATEM-AZU; H
(2005); K (2002); NA-NI (1999); NO-NU (2001); O (2002); U (1997)].
Messner, Dieter (1998): Postscriptum: Vasco da Gama und ein Tabu in der
portugiesischen Lexikologie, in Mitteilungen des Deutscher Lusitanisten-Verband 10, 45-46.
Bibliografa citada
413
Messner, Dieter (2007a): Os dicionrios portugueses, devedores da lexicograa espanhola, Pennsula. Revista de Estudos Ibricos 4, 15-20.
Messner, Dieter (2007b): Las relaciones lexicogrcas hispano-lusas, en
ngel Marcos de Dios: Aula ibrica. Actas de los congresos de vora y
Salamanca. Salamanca: Universidad, 317-322.
Migliorini Bruno (19613): Che cos un vocabolario. Firenze: F. Le Monnier.
Minsheu, John (1599): A Dictionarie in Spanish and English, rst published
into the English tongue by Ric. Perciuale [...] Hereunto for the further
prote and pleasure of the learner or delighted this tongue, is annexed
an ample English Dictionarie. Londres: Edm. Bollifant. [Ed. facsimilar
en Mlaga: Universidad, 2000].
Minsheu, John (1617): Ductor in Linguas, The Gvide Into tongves. Londres:
Iohannis Minsheu.
Miranda Menndez, Fernanda (2004): Dimenses meta nos textos jurdicos medievais, en Ana Maria Brito / Olvia Figueiredo / Clara Barros
(eds.): Lingustica histrica e histria da lngua portuguesa. Actas do
Encontro de Homenagem a Maria Helena Paiva. Porto: Faculdade de
Letras, 227-237.
Morais Silva, Antnio de (1789): Diccionario da lingua portugueza / composto pelo padre D. Rafael Bluteau; reformado e accrescentado por Antonio de Moraes Silva. 2 vols. Lisboa: Of. de Simo Thaddeo Ferreira;
18132; 18233; 18314; 18445; Lisboa: Typ. de Antonio Jos da Rocha, 18586;
1877-18787; 18898; 18919.
Morais Silva, Antnio de (1949-1959): Grande dicionrio da lngua portuguesa. Ed. revista, corrigida, muito aumentada e actualizada segundo
as regras do acordo ortogrco luso-brasileiro de 10 de Agosto de 1945
por Augusto Moreno, Cardoso Jnior e Jos Pedro Machado. 12 vols. Lisboa: Editorial Conuncia 1949-195910.
Mugglestone, Lynda (2000a): Pioneers in the Untrodden Forest: The New
English Dictionary, en Lynda Mugglestone (2000b), 1-22.
Mugglestone, Lynda (ed.) (2000b): Lexicography and the OED. Pioneers in
the Untrodden Forest. Oxford: Oxford University Press.
Murray, James Augustus Henry (1900): The evolution of English lexicography. Oxford: Clarendon Press; London: Henry Frowde.
Murray, K. M. Elisabeth (1977): Caught in the Web of Words. James Murray
and the Oxford English Dictionary. New Haven / London: Yale University Press.
NDMA = Amengual, Josep J. (1858): Nuevo diccionario mallorquin-castellano-latin. Palma: J. Colomar.
414
Bibliografa citada
Nebrija, Elio Antonio de (1481): Introductiones latin. Salamanca. [Ed. facsimilar en Salamanca: Universidad, 1981].
Nebrija, Elio Antonio de (1492): Lexicon hoc est dictionarium ex sermone
latino in hispaniense. Salamanca. [Ed. facsimilar de Germn Coln /
Amadeu-J. Soberanas, Barcelona: Puvill, 1979].
Nebrija, Elio Antonio de (1495?): Dictionarium ex hispaniense in latinum
sermonem. Salamanca. [Ed. facsimilar da Real Academia Espaola
(Madrid, 1989), que reproduce a edicin facsimilar anterior de 1951].
Nebrija, Elio Antonio de (1518): Lexicon illorum vocum quae as medicamentariam arte pertinerent, en Pedacij dioscoridis anazarbei de medicinali materia liber primus. Alcal: Arnaldo Guillermo de Brocar.
Nebrija, Elio Antonio de (1545): Dictionarium Aelij Antonij Nebrissensis iam
denuo innumeris dictionibus locupletatum. Amberes: Iohannis Steelsij.
NED = Vxase OED.
Nieto Jimnez, Lidio (2002): Tesoro lexicogrco del espaol marinero anterior a 1726. Madrid: Arco/Libros.
Nieto Jimnez, Lidio / Manuel Alvar Ezquerra (2002): Apuntes para la historia de la lexicografa hispano-inglesa, Revista de Filologa Espaola
82, 319-343.
Nieto Jimnez, Lidio / Manuel Alvar Ezquerra (2004): El Nuevo Tesoro Lexicogrco del Espaol (s. XIV-1726), en Actas del I Congreso Internacional de Lexicografa Hispnica, La Corua, 14-18 de septiembre de 2004,
no prelo.
Nieto Jimnez, Lidio / Manuel Alvar Ezquerra (2006): Nebrija en la lexicografa hispano-inglesa anterior al Diccionario de Autoridades, segn
los datos del NTLE, en Antonio Roldn Prez / Ricardo Escavy Zamora
/ Eulalia Hernndez Snchez / Jos Miguel Hernndez Terrs / M Isabel Lpez Martnez (eds.): Caminos Actuales de la Historiografa Lingstica. Actas del V Congreso Internacional de la Sociedad Espaola de
Historiografa Lingstica. Murcia, 7-11 de noviembre de 2005. Murcia:
Universidad, vol. I, 133-153.
NOB = Norsk Ordbok. 6 vols. (A-K). Oslo: Det norske Samlaget, 1950-2002.
<http://no2014.uio.no/>
Novo diccionario (1806) = Novo Diccionario da Lingua Portugueza, composto sobre os que at ao presente se tem dado ao prelo, e Accrescentado de
varios vocabulos extrahidos dos Classicos Antigos, e dos Modernos de
melhor nota, que se acha universalmente recibidos. Lisboa: Typograa Rollandiana, 1806.
NTLE = Nieto Jimnez, Lidio / Manuel Alvar Ezquerra (2007): Nuevo tesoro
lexicogrco del espaol (s. XIV-1726). 11 vols. Madrid: Arco/Libros.
Bibliografa citada
415
416
Bibliografa citada
Owen, Lewis (1605): The Key of the Spanish Tongve. Londres: T. C. for W. Welby.
Palencia, Alfonso de (1490): Universal vocabulario en latn y en romance
o Universale compendium vocabulorum cum vulgare expositione. Sevilla: Paulus de Colonia.
Palmireno, Juan Lorenzo (1569): Vocabulario del humanista [...] donde se
trata aues, peces, quadrpedos, con sus vocablos de caar, y pescar,
yeruas, metales, monedas, piedras preciosas, gomas, drogas, olores, y
otras cosas que el estudioso en letras humanas ha menester. Valencia:
Pedro de Huete. [Ed. facsimilar en Valencia: F. Domenech, 1978].
Papias (ca. 1050): Elementarium doctrinae erudimentum. Eds. incunabulares en Miln (1476) e Venecia (1485, 1491 e 1496).
Pascual Rodrguez, Jos Antonio / Rafael Garca Prez (2007): Lmites y horizontes en un diccionario histrico. Salamanca: Diputacin.
Peiris, Edmund (1943): Sinhalese Christian Literature of the XVIIth and XVIIIth
Centuries, en Journal of the Royal Asiatic Society C.B., 35, 96, 163-181.
Pensado Tom, Jos Luis (1974): Opsculos lingsticos gallegos del siglo
XVIII. Vigo: Galaxia.
Pereira, Bento (1634): Prosodia in Vocabularium Trilingue, Latinum, Lusitanicum, & Hispanicum digesta, in qua dictionum signicatio, et sylabarum quantitas expenditur. vora. [Reeds. en Lisboa, 1653, 1661, 1669,
1674, 1683].
Pereira, Bento (1647): Thesouro da Lingoa Portuguesa. Lisboa.
Pereira, Bento (1655): Florilegio dos modos de fallar, e adagios da lingoa
portuguesa: dividido em duas partes, em a primeira das quaes se poem
pella ordem do Alphabeto as Frases Portuguesas, a que correspondem
as mais puras, & elegantes Latinas: na segunda se poem os principaes
adagios Portugueses, com seu Latim proverbial correspondente. Pera se
ajuntar a Prosodia, & Thesouro Portugues, como appendiz, ou complemento. Lisboa.
Pereira, Bento (1697): Tertia pars selectissimarum descriptionum, quas idem
auctor vel olim se compositas, vel probatissimis scriptoribus emendicatas alphabetico ordine digessit. Ubi quae sine ullo auctore proponuntur, auctor ipse Florilegii composuit, reliquas collegit. vora. [Reeds.
en vora, 1710, 1723, 1732, 1741, 1750].
Pereira, Bento (1697): Thesouro da Lingoa Portugueza, en Prosodia in Vocabularium Bilingue, Latinum, et Lusitanum digesta, [...] auctore Doctore
P.Benedicto Pereyra S.J. [...], Septima Editio. Evora: Typographia Academiae.
Pereira, Bento / Matias de S. Germano (1750): Prosodia in vocabularium bilingue, Latinum, et Lusitanum digesta. vora: Typographia Academiae.
Bibliografa citada
417
Pereira, Isaas da Rosa (1964-1966): A livraria da Universidade de Lisboa, no incio do sculo XVI, en Arquivo de bibliograa portuguesa 37/48, 155-170.
Prez Pascual, Ignacio / Cleof Tato Garca (1986): O vocabulario de Leiras
Pulpeiro (I), Verba 13, 237-267.
Pinto, Lus lvares (1784): Diccionario pueril para uso dos meninos. Lisboa:
Ofc. Patr. de Francisco Luiz Ameno.
Pintos, Juan Manuel (1865): Vocabulario gallego-castellano. Ed. de M. Neira
e X. Riveiro. Anexo 5 de Cadernos de lingua. A Corua: RAG, 2000. [Includo en Santamarina (2003b)].
Pomey, Francisco / Antonio Franco (1754): Indiculo universal: contm distinctos em suas classes os nomes de quasi todas as couzas que ha no
mundo. vora: Off. da Universidade.
Pomey, Francisco / Manuel de Azevedo (1736): Pomarium latinitatis elegantiori consitum cultu, longeque paritiori descriptum manu in quo
locutiones synonymae bene multae...editio postrema ac nova lusitano
ordine translata. Coimbra.
Porto Dapena, Jos lvaro (1997): Algunas observaciones sobre el contorno de la denicin lexicogrca, en M. Almeida / J. Dorta (eds.): Contribuciones al estudio de la lingstica hispnica. Homenaje al profesor
Ramn Trujillo. Vol. II. Santa Cruz de Tenerife: Montesinos, 211-226.
Porto Dapena, Jos lvaro (2000-2001): Las letras como entradas del diccionario, Revista de Lexicografa 7, 125-154.
Porto Dapena, Jos lvaro (2002a): Manual de tcnica lexicogrca. Madrid: Arco/Libros.
Porto Dapena, Jos lvaro (2002b): La estructura actancial como criterio
separador de acepciones en el artculo lexicogrco, en Jos Ignacio
Prez Pascual / Mar Campos Souto (eds.): Cuestiones de lexicografa.
Lugo: Tris Tram, 171-190.
Porto Dapena, Jos lvaro (2003-2004): La lematizacin de los pronombres
en los diccionarios actuales, Revista de Lexicografa, 10, 139-182.
Porto Rey, Francisco (1900-1908): Diccionario gallego-castellano. Edicin
de Mara Xess Bugarn Lpez e Begoa Gonzlez Rei. A Corua: Real
Academia Galega, 2000.
Pottier, Bernard (1962): Rec. de Gili Gaya (1947-1957), Bulletin Hispanique
64, 143-144.
Prat de la Riba, E. (1910): Memria endreada a la Diputaci de Barcelona
pel seu President. Barcelona.
Quilis, Antonio (1982): Diccionarios de pronunciacin, LEA 4/2, 325-332.
Quinque linguarum (1526) = Quinque linguarum vtilissimus uocabulista
Latine. Tusche. Galliche. Hyspane. & Alemanice. Ualde necessarius per
418
Bibliografa citada
Bibliografa citada
419
420
Bibliografa citada
Bibliografa citada
421
422
Bibliografa citada
Silvestre, Joo Paulo Martins (2004): Rafael Bluteau e o Vocabulario Portuguez, e Latino: teoria metalexicogrca, fontes e recepo. Tese de
doutoramento. Universidade de Aveiro.
Simes, A. M. / J. J. Almeida (2003): NATools: A Statistical Word Aligner
Workbench, Procesamiento del Lenguaje Natural 31, 217-224.
Skautrup, Peter (1944-1968): Det danske sprogs historie. 4 vols. Copenhague:
Gyldendalske boghandel.
Sobreira = Sobreira, Juan: Papeletas de un diccionario gallego. Edicin y
estudio crtico de Jos Luis Pensado Tom. Ourense: Instituto de Estudios Orensanos Padre Feijoo, 1979. [Includo, xunto con outros textos
de Sobreira, en Santamarina (2003b)].
Sousa, Joo de (1789): Vestigios da lingua arabica em Portugal, ou lexicon
etymologico das palavras, e nomes portuguezes, que tem origem arabica. Lisboa: Na Ofcina da Academia Real das Sciencias.
Sousa, Joo de / Jos de Santo Antnio Moura (1830): Vestigios da Lingoa
Arabica em Portugal, ou Lexicon etymologico das palavras, e nomes
portuguezes, que tem origem arabica, composto por ordem da Academia Real das Sciencias de Lisboa por Fr. Joo de Sousa, [], e augmentado e annotado por Fr. Joze de Santo Antonio Moura. Lisboa: Na Typographia da mesma Academia.
Sousa, Manuel de / Joaquim Jos da Costa e S (1784-1786): Nouveau dictionnaire Franois-Portugais. 2 vols. Lisboa: Simo Thadeo Ferreira.
Teixeira, Antnio Jos (trad.) (1780): Noticia da mythologia. Lisboa: Typ. Rollandiana. [Reed. en 1803].
Teixeira, Vicente de Bastos (1779): Dictionnaire moderne franois expliqu
en portugais. Tome premier (A-C). Lisboa: Imp. Louisiane.
Terreros y Pando, Esteban de (1786): Diccionario castellano con las voces
de ciencias y artes y sus correspondientes en las tres lenguas Francesa,
Latina Italiana. Madrid: Viuda de Ibarra, Hijos y Compaa. [Edicin
facsimilar en Madrid: Arco/Libros, 1987].
Tiedemann, J. (2003): Recycling Translations - Extraction of Lexical Data
from Parallel Corpora and their Application in Natural Language Processing. Upssala: Acta Universitatis Upsaliensis.
TILG = Santamarina, A. (dir.): Tesouro Informatizado da Lingua Galega.
Santiago de Compostela: Instituto da Lingua Galega. <http://www.
ti.usc.es/TILG>
TILIO = Opera del Vocabolario Italiano: Tesoro della Lingua Italiana delle Origini. Consiglio Nazionale delle Ricerche. <http://tlio.ovi.cnr.it/TLIO/>
TLF = Imbs, Paul et al. (dir.) (1971-1994): Trsor de la langue franaise. Dictionnaire de la langue du XIX et du XX sicle (1789-1960). 16 volumes.
Bibliografa citada
423
424
Bibliografa citada
Bibliografa citada
425