Você está na página 1de 8

El modelo del Lxico Generativo: su aplicacin en la interpretacin del significado lxico en contextos textuales Ins Kuguel (ikuguel@ungs.edu.

ar) Universidad Nacional de General Sarmiento El objetivo de esta comunicacin es discutir la adecuacin descriptiva de una teora de semntica lxica a partir del anlisis de datos lingsticos en lengua espaola. El modelo terico adoptado es el del Lxico Generativo (Pustejovsky 1995). Se ver cmo este modelo permite establecer el significado de unidades lxicas sin presuponer una semntica de tipos conceptuales predefinida sobre la base de informacin extrada de un corpus textual. Siguiendo la lnea de los estudios semnticos que indagan en la interfase semntica-sintaxis, el modelo del Lxico Generativo adopta una perspectiva de tratamiento composicional de la unidad lxica que permite pensarla como una metaentrada semnticamente subespecificada o abierta cuyos componentes de significado se cierran o especifican en el contexto sintctico (Pustejovsky, 1999). En este sentido, Pustejovsky adopta una concepcin del lenguaje como dbilmente polimrfico[1], en la que todos los tems lxicos son semnticamente activos y las operaciones semnticas que determinan los tipos lxicos operan bajo restricciones bien definidas. Con el fin de dar cuenta del hecho de que las palabras en contexto pueden adquirir un nmero potencialmente infinito de significados o sentidos, limitando, al mismo tiempo, la cantidad de sentidos realmente almacenados en el lxico mental, este autor propone un modelo, el lxico generativo (LG) que consta, por una lado, de un conjunto nuclear de sentidos, con una estructura interna rica, a partir de los cuales se genera a medida que los tems lxicos individuales se combinan entre s en frases y clusulas un conjunto mayor de sentidos, y, por otro, de recursos o mecanismos generativos, encargados de generar estos sentidos extendidos. De este modo, la semntica de un tem lxico puede definirse como una estructura compuesta de cuatro componentes: la estructura argumental, la estructura eventiva, la estructura de qualia y la estructura de herencia lxica, que contribuyen con un tipo diferente de informacin al significado de una palabra. La estructura argumental especifica el nmero y tipo de argumentos lgicos y cmo se realizan sintcticamente. La estructura eventiva consiste en la identificacin del tipo de evento particular (i.e. estado, proceso, transicin) y de su estructura subeventiva. La estructura de qualia especifica los cuatro aspectos esenciales del significado de una palabra: el quale constitutivo, que especifica la relacin entre el significado y sus partes constitutivas, el quale formal, que distingue al significado dentro de un dominio ms amplio, el quale tlico, que explicita el propsito y la funcin del objeto, y el quale agentivo, que especifica los factores involucrados en el origen o la causa del objeto. Por ltimo, la estructura de herencia lxica especifica cmo la palabra se relaciona globalmente con otros conceptos en el lxico. Los mltiples sentidos aunados en una metaentrada constituyen un paradigma lxico conceptual (plc) en el que los distintos componentes del significado lxico se delimitan y relacionan entre s mediante mecanismos generativos que operan al actualizarse el tem lxico en un contexto determinado. Los mecanismos generativos son el ligamiento selectivo
1[1] La diferencia entre un lenguaje monomrfico y uno fuertemente polimrfico reside en que, mientras en el primero, cada unidad lxica tiene un nico tipo semntico y una nica denotacin, en el segundo, no existe nada inherente al lenguaje que restrinja el significado de las palabras en contexto. La propuesta de Pustejovsky de un lenguaje dbilmente polimrfico busca encontrar el trmino medio entre ambos extremos.

(operacin semntica por la que un tem lxico opera sobre un quale de otra unidad sin cambiar su tipo), la co-composicin (el significado de una unidad lxica surge de la combinacin con otra unidad en la frase) y la coercin de tipo (operacin semntica por la que una funcin, que requiere un determinado tipo, convierte una expresin al tipo requerido, cambiando su tipo y denotacin). En este trabajo se presentar una aplicacin de este modelo a un corpus de textos de especialidad producidos en el dominio de la ecologa, en el rea de contaminacin hdrica[2]. El anlisis se enmarca en un estudio que tiene por objetivo de caracterizar el valor terminolgico del lxico especializado como un componente semntico, activado en contexto por factores pragmticos. El corpus est constituido por seis textos especializados de un grado de especializacin ms bien alto: cuatro artculos de investigacin centrados en el diagnstico del grado de contaminacin de diferentes cursos de agua y dos captulos de manuales de nivel universitario dedicados al tema de la contaminacin del agua. Para seleccionar las unidades lxicas especializadas se emple una metodologa que combin un programa de tratamiento automatizado de textos[3], que permite establecer frecuencias y colocaciones, con la consulta a especialistas para confirmar el estatuto terminolgico de las unidades extradas. En el dominio elegido, prevalecen, en tanto ncleos de control textual[4], las entidades de clase natural agua, algas, bacterias, metal, etc.- que se realizan como temas objeto del anlisis del investigador (como se puede apreciar en el ejemplo 1) y como temas afectados por procesos de cambio de estado (ejemplo 2).
1. Durante 1994 se muestreo mensualmente el agua superficial (hasta 50 cm) en cinco sitios del rio Reconquista (texto 1) 2. Aguas abajo, en la zona de los oligosaprobios, la produccin de las algas disminuye y la variedad de sus comunidades aumenta. (texto 5)

Dentro de este grupo, hemos seleccionado algunos ejemplos, presentados aqu a modo de ilustracin de la aplicacin del modelo de LG para recuperar la informacin semntica que estos nombres generan en el contexto de especialidad estudiado as como para analizar los casos en que se crean unidades complejas (los sintagmas terminolgicos). En primer lugar analizaremos las unidades agua, metal y bacteria. En el cuadro 1 se pueden observar ejemplos de colocaciones para cada unidad, que ilustran los contextos sintcticos en los que se dan los mecanismos generativos de los significados especializados.

2[2] Ver Corpus textual. 3[3] TACT: Textual Analysis Computing Tools, desarrollado por la Universidad de Toronto (Canad).

4[4] Cfr. de Beugrande (1980).

Cuadro 1
agua Preposiciones en : Las concentraciones de metales disueltos encontradas en el agua del ro superaron ampliamente los limites para la proteccin de la vida acutica (texto 1) los distintos elementos que reaccionan dentro del agua (texto 5) En un estudio realizado sobre aguas de escorrenta de distintas ciudades, se han encontrado importantes concentraciones de metales pesados (texto 3) agua con elevados contenidos de As (texto 3) experimentos con plancton de agua dulce (texto 5) Todas las aguas contienen en solucin Adjetivos cierta fraccin de hidrocarburos... superior (texto 5) humus disuelto que tiene el agua. (texto 6) las plantas acuticas que pueblan las aguas de las lagunas (texto 6) Este procedimiento se reserva para aguas muy ricas en materia orgnica, con una DBO de 100 a 150 mg O (texto 5) Los salmnidos sealan la presencia de aguas bien oxigenadas pero pobres en minerales(texto 6) Verbos exceder superar metal Las concentraciones de los metales pesados generalmente excedieron los niveles de proteccin para la vida acutica. (texto 1) Los mximos de estos metales pesados superaron el limite respectivo en 1,7 (As), 3000 (Cd), 150 (Cr), 65 (Cu), 40 (Pb) y 17 veces (Zn). (texto 1) Las concentraciones de metales disueltos encontradas en el agua del ro superaron ampliamente los limites para la proteccin de la vida acutica. (texto 1) Los niveles de metales (Cu-Cd-Zn-Pb-NiCo), determinados en aguas por voltamperometra de preconcentracin, superan los permitidos para la proteccin de vida (texto 2) Llama la atencin la presencia de concentraciones ligeramente superiores de algunos metales como Cu, Mn, Fe y Pb en el pozo muestreado en la localidad de El Bracho. (texto 3) Verbos indicar Un organismo indicador clsico es la bacteria Escherichia coli. La presencia de esta especie en un cuerpo de agua indica contaminacin con materia fecal humana. (texto 6) bacteria Adjetivos Para evaluar el estado sanitario de las aguas se realizo el recuento de bacterias indicadoras indicador (grupo coliforme) en Agar Chromocult (Merck). (texto 2) El recuento de bacterias coliformes dado en la Tabla 2 es indicador del estado sanitario de las aguas. (texto 2)

dentro de :

sobre :

con:

de : Verbos contener tener presentar

Adjetivos rico pobre

Nombres aumento

Tanto en los conos cesteros de sedimentos, Nombres En cuanto a los parmetros bacteriolgicos la no potabilidad de las muestras se debi como en los sedimentos de los lagos y ros parmetro fundamentalmente a la presencia de Bacterias se constata generalmente un aumento en la Mesfilas Totales y Pseudomonas... (texto 4) concentracin de metales pesados, que funcin vienen principalmente de desages Las formas de crecimiento de Sphaerotilus industriales y de los compuestos de plomo natans y de otras bacterias son funcin de las procedentes de la combustin de la gasolina. caractersticas del medio (texto 5) (texto 5)

Si observamos los contextos sintcticos en los que aparece la unidad lxica agua en nuestro corpus, podemos apreciar una serie de colocaciones que activan el significado de CONTENEDOR mediante el mecanismo de ligamiento selectivo, que, en este caso, selecciona el quale constitutivo. Figura 1 Paradigma lxico conceptual de agua agua_plc EA ARG 1 = x1 : agua ARG 2 = y0 : sustancia contenida EE e0 : existir e1 : contener EQ AGENTIVO = entidad natural CONSTITUTIVO = contenedor (e1, x1, y0) FORMAL = tipo natural . tipo natural (e0, x1) . (e1, x1, y0) El paradigma lxico conceptual de este nombre (Figura 1), tal como es activado en el contexto estudiado, presenta una estructura argumental que consta de dos argumentos: el elemento contenedor (x1) y la sustancia contenida (y0), vinculados por el evento (e1) contener. Esta vinculacin se pone de manifiesto en el quale constitutivo, segn el cual el nombre es caracterizado como un contenedor. Este nuevo sentido se suma al de entidad natural generando un tipo unificado entidad natural (e0, x0) + contenedor (e1, x1, y0). De este modo queda determinada su estructura de herencia en funcin del quale constitutivo, la cual determinar tambin el significado activado en ro, como se puede apreciar los ejemplos 3 a 5.
3. El numero de gneros de fitoplancton detectados en el Ro Reconquista super a los registrados en el Lujn(texto 1) 4. Tradicionalmente la polucin se ha visto como un factor dominante en la vida de los ros, y ha conducido a explicitar el uso de organismos indicadores de las distancias etapas del proceso de autodepuracin. (texto 5) 5. Los primeros detergentes no eran biodegradables y, por lo tanto, se acumulaban en ros y aguas subterrneas. (texto 6)

Los casos de metal y bacteria permiten apreciar cmo se activa un componente del significado mediante el mecanismo de coercin de tipo. Ambos aparecen como el contenido de los N contenedores (i.e. como los componentes del quale constitutivo de agua) y ambos se realizan como objetos afectados por procesos de cambio de estado cuantitativo o cualitativo (en los ejemplos del cuadro 1, slo se ilustran cambios de estado cuantitativos: concentracin, crecimiento, multiplicacin). En los contextos de metal analizados, este N se caracteriza por aparecer asociado con un predicado de tipo funcional manifestado por los verbos exceder y superar, el adjetivo superior y el nombre aumento. Estos predicados evaluativos imponen una descripcin intencional a partir de la cual el nombre de tipo natural es reinterpretado como de tipo funcional. Figura 2 Paradigma lxico conceptual de metal metal_plc EA ARG 1= y1 metal

EE EQ

ARG 2 locativo = 1 : x1 e0 : existir e2 : "exceder" AGENTIVO = entidad natural FORMAL = tipo natural . tipo funcional (e0, y1) . (e2, y1, 1)

En la figura 2 se presenta el paradigma lxico conceptual de este grupo de nombres. La estructura argumental consta de un argumento (y1)[5], que es metal, y un argumento locativo 1, que son las
sustancias contenedoras (agua, ro, etc.). En el quale formal se pone en evidencia la relacin entre las estructuras argumental y eventiva de este nombre de clase natural, que es rejerarquizado como de tipo funcional. El nuevo sentido se suma al de entidad natural generando, as, un tipo unificado entidad natural (e , y1) + entidad funcional (e , y1, 1). El carcter de funcional que 0 2 adquiere este nombre en el corpus implica, a su vez, la determinacin de una ontologa local[6] (Johnston et al. 1995), a partir de la cual metal proyecta la funcionalidad de su quale formal a sus hipnimos arsnico, cadmio, cobre, cromo, mercurio, metales, plomo y zinc (ejemplos 6 a 8).
6. La presencia de As en concentraciones que superan los limites de tolerancia para aguas de consumo en aguas del S.E. tucumano ha sido muy documentada. (texto 3) 7. 8. Todos los ecosistemas muestran una carga excepcional de plomo... (texto 5) Tambin se detectaron concentraciones elevadas de cromo y zinc. (texto 5)

El N bacteria ejemplifica los casos en que la predicacin introduce un quale tlico: la caracterstica de esta entidad de funcionar como de ndice de contaminacin. El predicado tlico se realiza en el corpus mediante el adjetivo indicador, el verbo indicar y los nombres funcin y parmetro. Figura 3 Paradigma lxico conceptual de bacteria bacteria_plc EA ARG 1 = y2 bacteria ARG 3 locativo = 1 : x1 ARG 3 tema = z : contaminacin EE (e < e ) 0 3 e : indicar 3 CONSTITUTIVO = parte del agua AGENTIVO = entidad natural (e , y2, 1) 0 TLICO = indicador (e , y2, z, 1) 3 FORMAL = tipo natural . tipo funcional R ((e , y2, 1) . (e , y2, z, 1)) 0 3 [R: relacin causal]

EQ

La complejidad conceptual que subyace a este tipo de nombres se refleja en su paradigma lxico conceptual (figura 3). La predicacin hace que se genere, por el mecanismo de coercin de tipo, un sentido funcional impuesto por el quale tlico asociado al evento de indicar: las bacterias son utilizadas como instrumento para indicar contaminacin. La combinacin de los eventos existir e indicar lleva a reinterpretar este nombre como tipo complejo o dot-type, dado que la relacin entre ambos sentidos (el natural y el funcional) es causal: la causa de la contaminacin es la presencia de bacterias en el agua.

5[5] La formalizacin de los contaminantes mediante la variable (y1) seala que estos nombres constituyen un tipo particular de sustancia contenida en el agua, formalizada mediante la variable y y el superndice 0 en la figura 3. Ms adelante se ver como los indicadores, que tambin constituyen sustancias contenidas en el agua, se presentan con la misma variable y y el superndice 2 (cfr. figura 5). 6[6] Las ontologas locales son jerarquas que capturan subdominios de objetos relacionados dentro del contenido de un corpus particular.

A continuacin presentaremos el anlisis semntico de dos unidades terminolgicas complejas: materia orgnica y microorganismo. Ambas bases (materia y organismo) son N genricos, que se caracterizan por presentar un alto grado de subespecificacin semntica en cuanto a su rol formal. De hecho, su significado fuera de contexto solo permite interpretar que se trata de nombres que designan entidades, sin especificacin del tipo. Si observamos las colocaciones de estos dos nombres en el contexto analizado, podemos apreciar un recurso sintctico y otro morfolgico mediante los cuales se especifica el rol formal de estos nombres y se crean unidades complejas. En el primer caso, de 69 ocurrencias de la forma materia, 52 colocan con orgnica. Esta frecuencia de aparicin de la predicacin mediante el adjetivo orgnica del nombre materia hace posible postular la existencia de un sintagma terminolgico, es decir, un sintagma nominal lexicalizado en el contexto de la ecologa para designar un tipo particular de entidades. La otra unidad compleja frecuente en el corpus, formada por el mismo N y un adjetivo que selecciona el quale formal es materia fecal. En el segundo caso, de 164 ocurrencias de la forma organismo, 40 colocan con micro. Aqu, el procedimiento de especificacin del quale formal se realiza mediante la composicin culta. El mismo N de base, ocurre con frecuencia en el corpus junto con el adjetivo indicador, en cuyo caso, se trata de una seleccin del quale tlico: se especifica la funcin de la entidad. Asimismo, el formante culto micro coloca tambin con alga, en microalga. Otros ejemplos de especificacin del quale formal mediante formacin culta son fito y zooplancton, enterobacteria y biodiversidad. Estas dos operaciones de especificacin del significado en el contexto sugieren la existencia de al menos dos taxonomas subyacentes (una para materia y la otra para organismo) organizadas segn el tipo de entidad, especificado por ligamiento selectivo del rol formal. De esta manera, las relaciones entre los tems lxicos van determinando una estructura de herencia particular para cada significado (que en los casos ilustrados se corresponde con relaciones de hiperonimia).

Conclusiones En esta ponencia he presentado un anlisis semntico de nombres de clase natural (agua, metal, bacteria, materia, organismo) extrados de un corpus de textos de especialidad del dominio de la contaminacin hdrica. El objetivo central ha sido corroborar la posibilidad de extraer informacin semntica de un corpus, a partir de los contextos colocacionales de las unidades lxicas, sin una presuposicin previa de la semntica de estas unidades. Los ejemplos seleccionados permiten ver, adems, la caracterizacin del valor terminolgicos que estas unidades adquieren en el contexto estudiado. As, los 3 nombres analizados en primer lugar, ilustran las 3 clases semnticas centrales en este dominio: las entidades contenedoras (agua), las entidades contaminantes (metal) y las entidades indicadoras (bacteria). Las dos ltimas constituyen, a su vez, las sustancias contenidas en el agua. El hecho de que estas dos entidades sean reinterpretadas en este contexto como tipos funcionales mediante el mecanismo de coercin de tipo en un caso por descripciones evaluativas (como exceder) y en el otro por la imposicin de un quale tlico refleja la estructura conceptual del dominio mismo. En efecto, la ecologa se plantea como una disciplina en la que el investigador debe diagnosticar y remediar los factores que contaminan el ambiente. En el caso de la contaminacin hdrica, en particular, los elementos naturales presentes en el agua son objeto del anlisis del investigador, quien evala su impacto en el medio mediante parmetros preestablecidos. Lo interesante del modelo del Lxico Generativo (Pustejovsky 1995) es que el tipo de representacin semntica rica que postula permite ver reflejada en la entrada lxica de estas unidades terminolgicas la complejidad conceptual de los significados especializados: en estos casos, cmo la interaccin hombre-naturaleza repercute en la retipificacin de los N de clase natural como funcionales. El segundo grupo de nombres analizados (materia y organismo) nos ha permitido determinar los mecanismos de especificacin semntica por los cuales se generan los sentidos que configuran su significado en el dominio de la ecologa. En tal sentido, hemos visto cmo los qualia originalmente subespecificados se especifican mediante la operacin de ligamiento selectivo y cmo estos N genricos tienden a constituirse en ncleos de unidades complejas (hemos visto un caso de sintagmacin y otro de composicin), que reflejan, a su vez, las taxonomas cientficas subyacentes a la disciplina.

Corpus textual Texto 1: Casta, P. M., Loez, C.R., Olgun, H.F., Puig, A., Rovedatti, M.G., Topalin, M.L. & A. Salibin (1998) Caracterizacin y variacin espacial de parmetros fisicoqumicos y del plancton en un ro urbano contaminado (Ro Reconquista, Argentina), en Revista Internacional de Contaminacin Ambiental, 14 (2) 69-77. 4201 palabras. Texto 2: Ceretti, H. Hughes, E. Ramrez, S. Vullo, D. L. & A. Zalts (2001) Metales pesados y microbiota en un ambiente acutico natural, perturbado por actividades humanas, ponencia presentada en la III Jornada de Investigacin de la Universidad Nacional de General Sarmiento, Los Polvorines, Prov. Buenos Aires, 29 de noviembre de 2001.4298 palabras. Texto 3: Garca, M. G., Araoz M. M. y Del V. Hidalgo, M. (2000) Contenido y distribucin de metales pesados en las aguas subterrneas del S.E. de Tucumn, en Faras, H., Piln, M., Borsellino, M., Pece, F., Storniolo, A. y M. Mattar Uso y preservacin de los recursos hdricos den los umbrales del siglo XXI. Memorias del XVIII congreso nacional de agua. Santiago del Estero: Instituto de Recursos Hdricos, Facultad de Ciencias Exactas y Tecnologas, Universidad Nacional de Santiago del Estero, CD-Rom. 2438 palabras. Texto 4: Panigatti, M. C., Griffa, C. y Boglione, R. (2000) Evaluacin de los niveles de contaminacin en aguas subterrneas de la ciudad de Rafaela, Santa Fe, en Faras, H., Piln, M., Borsellino, M., Pece, F., Storniolo, A. y M. Mattar Uso y preservacin de los recursos hdricos den los umbrales del siglo XXI. Memorias del XVIII congreso nacional de agua. Santiago del Estero: Instituto de Recursos Hdricos, Facultad de Ciencias Exactas y Tecnologas, Universidad Nacional de Santiago del Estero, CD-Rom. 1553 palabras. Texto 5: Margalef, Ramn (1983) Contaminacin o polucin de los cursos de agua (captulo 16, 763-768) y Ecosistemas forzados (captulo 18, 831-834, 849-867), en Limnologa,. Barcelona: Omega. 15.478 palabras. Texto 6: Foguelman, Dina. & Elizabeth Gonzlez Urda (1994) El ecosistema ro (captulo 2, 77-96) y Las aguas bajan turbias (captulo 4, 127-156), en El agua en Argentina. Buenos Aires: Prociencia-Conicet. 9665 palabras.

Referencias bibliogrficas Anick, P. & Bergler, S. (1992) Lexical Structures for Linguistic Inference, en Pustejovsky, James & S. Bergler (eds.) Lexical Semantics and Knowledge Representation, Berlin: Springer Verlag. Asher, N. & Pustejovsky, J. (2000) The Metaphysics of Words in Context, en www.cs.brandeis.edu /~jamesp/ Busa, F., Calzolari, N., Lenci, A. & Pustejovsky, J. (2001) Building a Semantic Lexicon: Structuring and Generating Concepts, en Bunt, H., Mudkrnd, T. & Thijsee, E. (eds) Computing Meaning, Vol. II, Dordrecht: Kluwer, 29-51. Cabr, M. T. (1999) La terminologa. Representacin y comunicacin. Barcelona: Institut Universitari de Lingstica Aplicada, Universitat Pompeu Fabra. Ciapuscio, G. & Kuguel, I. (2002) Hacia una tipologa del discurso especializado: aspectos tericos y aplicados, en Fuentes Morn, M. T. & Garca Palacios, J. (eds.) Texto, terminologa y traduccin. Salamanca: Almar, 37-73. Cruse, A. (2000): Meaning in Language. New York: Oxford University Press. de Beaugrande, R. (1980) Chapter III: Conceptual Connectivity en Text, Discourse, and Process. London: Longman, 60-102. Johnston, M., Boguraev, B. & J. Pustejovsky (1995) The Acquisition and Interpretation of Complex Nominal, en Papers from the 1995 American Association for Artificial Intelligence, California: AAAI Press. Kuguel, I. (2003): Estructura semntica de los nombres deverbales en el lxico especializado, ponencia presentada en el II Encuentro de Gramtica Generativa, Buenos Aires, 7 al 9 de agosto de 2003. Kuguel, I. (en prensa): Caracterizacin semntica del lxico en textos de ecologa: los nombres de clase natural, en: Neue Romania, Berlin: Institut fr Romanische Philologie der Freien Universitt Berlin. Pustejovsky, J. (1995) The Generative Lexicon. Cambridge: The MIT Press.

Pustejovsky, J. (1998) The Semantics of Lexical Underspecification, en Folia Lingstica XXXIII / 3-4. Wien: Mouton de Gruyter. Pustejovsky, J. (2001) Type Construction and the Logic of Concepts, en Bouillon, P. & Busa, F. (eds.) The Syntax of Word Meaning. Cambridge: Cambridge University Press. Pustejovsky, J., Bergler, S. & Anick, P. (1993) Lexical Semantic Techniques for Corpus Analysis en Computational Linguistics, Volume 19, Number 2, 331-358.

Você também pode gostar