Tema 5 Recursos lingsticos y terminolgicos en Internet
Grupo EPA MSTER ESPAOL/INGLS PARA FINES ESPECFICOS Espaol de la ciencia y la tecnologa
Tema 5: Recursos lingsticos y terminolgicos en Internet Dra. Isabel Santamara Prez mi.santamaria@ua.es Dr. Jos Joaqun Martnez Egido jj.martinez@ua.es
La web es un mundo de aplicaciones textuales hay un gran conjunto de imgenes e incontables archivos de audio, pero el texto predomina no slo en cantidad, sino en utilizacin (Milln, 2001: pg. 35-36) OBJETIVOS Consultar y localizar informacin de inters lingstico y terminolgico. Localizar, gestionar y evaluar textos especializados de una materia. Constituir un corpus textual especializado, til para la investigacin lingstica y terminolgica. Presentar distintos recursos de consulta lingstica y terminolgica en Internet. CONTENIDOS
Internet como fuente de informacin especializada: obtencin de corpus
Herramientas lingsticas para el tratamiento de textos: Antconc
Internet como almacn de recursos lingsticos y terminolgicos
Qu es Internet? Internet es la red de redes que permite la interconexin de redes y ordenadores de todo tipo mediante ruteadores (dispositivos de conexin y distribucin de datos en una red). Qu se puede hacer en Internet? Enviar mensajes Opinar sobre temas Chatear Consultar catlogos de bibliotecas Visitar museos Conseguir informacin Ofrecer informacin Conseguir programas informticos Comprar/vender, etc. Internet para el lingista Fuente de comunicacin (listas de discusin, correo electrnico, foros) Intercambio de datos (bases de datos, publicaciones, documentacin, corpus, etc.) Fuente de informacin terminolgica y documental (catlogos, contextos, definiciones, trminos, glosarios, bases de datos). Captura de informacin para realizar un trabajo terminolgico (trmino, contextos, textos, publicaciones, herramientas, etc.) Internet como fuente de informacin especializada: el corpus Internet
fuente de informacin lingstica
Corpus
informacin textual y discursiva informacin sobre unidades concretas (variantes, definiciones, categora gramatical) ejemplos de coocurrencias, etc. Internet como fuente de informacin especializada: el corpus Criterios o estrategias de bsqueda para la recuperacin de informacin Necesidad de informacin
Herramientas de bsqueda en Internet
INFORMACIN
EN LA WEB Internet como fuente de informacin especializada: el corpus Qu tipo de informacin recuperamos?
Material textual disponible en Internet que contiene informacin lingstica.
Productos finales que contienen informacin lingstica (bases de datos, glosarios, diccionarios en lnea, corpus, etc.). Directorios vs. motores de bsqueda BUSCADORES ndices o directorios Motores de bsqueda Metabuscadores Tendencia actual
convertir a los buscadores en portales que ofrecen servicios, ventas y productos
Imposibilidad de ubicar a los actuales buscadores en una sola descripcin (directorios, motores de bsquedad, etc.) Directorios vs. motores de bsqueda
Directorios vs. motores de bsqueda Directorios Bsqueda dirigida
Funcionan por navegacin
Lista de recursos clasificados por temas
Recogen una pequea parte de los recursos digitales de la WWW
Organizan la informacin manualmente asignando los recursos a una o ms clases
Actualizacin de la informacin lenta Motores de bsqueda Consulta libre
Funcionan por recuperacin de informacin
Programas automticos que constituyen una BD con todas las pginas web exploradas
Recogen la totalidad de recursos
Organizan la informacin por comparacin automtica y creacin de ndices
Actualizacin automtica y rpida Indices-directorios
Ventajas Desventajas -Informacin clasificada, precisa y de calidad -Suelen presentar sus enlaces comentados -Realizada por expertos calidad -Permiten buscar por una catalogacin temtica preexistente -Es posible navegar por una temtica determinada sin concretar la palabra clave -Resultados menores que con los motores de bsqueda -Enlaces no siempre actualizados -Cada directorio tiene su propia clasificacin -Sistema menos intuitivo que en los motores -En las clasificaciones priman los criterios comerciales Motores de bsqueda
Ventajas Desventajas -Abundante informacin -Est todo -Buscan en toda la red -Fciles de usar e intuitivos -Actualizacin de los enlaces -Exceso de informacin -Los primeros resultados suelen ser pginas que enlazan con otras -Presencia de resultados que no interesan Motores de bsqueda
Recursos ms utilizados para buscar en Internet Se basan en programas automticos que saltan de una pgina a otra de la web, siguiendo los enlaces que encuentran en cada pgina para construir una gigantesca base de datos. La bsqueda es por palabras clave. Ejemplos Directorios: Yahoo http://es.yahoo.com/ Excite http://www.excite.es/directory Lycos http://www.tripod.lycos.es
Buscadores: Google http://www.google.com AltaVista http://www.altavista.com Oz http://www.ozu.es Terra http://www.terra.es Metabuscadores Buscador de buscadores Redirigen las consultas simultneamente a bases de datos de varios motores y directorios tiles para consultar datos muy concretos. Algunos permiten realizar una consulta simultnea a todos los buscadores indexados o bien determinar el buscador en concreto al que se desea enviar la interrogacin. Ejemplos de metabuscadores http://metacrawler.com http://www.i-une.com http://www.kartoo.com
Otros metabuscadores en: http://www.cuervoblanco.com/metabuscadores.html http://www.buscopio.net http://www.internetinvisible.com
Buscadores especializados Se estructuran sobre la base de un directorio temtico, aunque pueden ofrecer un motor de bsqueda. Su atractivo reside en la especializacin temtica y en la calidad de los vnculos. Los recursos que proporcionan son muy variados: portales temticos, sitios web de asociaciones, pginas personales, etc. http://www.scirus.com
Recuperacin de informacin: operadores booleanos Permiten expresar nuestras necesidades de informacin con la mxima precisin.
Sirven para exigir o excluir conceptos en la bsqueda avanzada y en determinados motores de bsqueda. Tipos de operadores booleanos AND (&): localiza documentos que contengan uno y otro trminos expresados en la consulta.
OR (I): localiza documentos que contengan uno u otro de los trminos especificados en la consulta.
NOT (!): recupera documentos que no contengan un trmino expresado en la consulta. Tipos de operadores booleanos Frase exacta: Permite buscar ocurrencias de fragmentos textuales que coincidan exactamente con el contenido de un documento. Se representan: transcripcin gentica
Tipos de operadores booleanos Limitar idioma: Permite limitar los resultados de la bsqueda a los que se encuentren en una determinada lengua especificada previamente. Limitar a un servidor (domain: host): Encuentra las pginas con la palabra o frase especificada en el dominio del servidor Web donde se encuentre estas pginas. Domain: .mx (limitamos la bsqueda a ese dominio: Mxico)
Tipos de operadores booleanos Limitar a ttulo: El motor de bsqueda encuentra las pginas que contienen la palabra o frase en el ttulo.
Limitar a texto: el contenido de la pgina.
Limitar a perodo temporal. Tipos de operadores booleanos Formatos de documentos en Internet Pginas .html Documentos de word .doc Archivos .pdf Imgenes .jpg, .gif Comprensin y descomprensin de ficheros .zip Internet como almacn de recursos lingsticos y terminolgicos a. Recursos lexicogrficos b. Recursos terminolgicos: catlogos de diccionarios especializados c. Recursos textuales d. Bases de datos terminolgicos y neolgicos e. Consulta con otros especialistas: listas de discusin y foros a) Recursos lexicogrficos Recursos lingsticos generales: Diccionarios y enciclopedias Espaol http://www.rae.es http://clavecorp.grupo-sm.com Cataln http://pdl.iecat.net Ingls http://www.m-w.com (Merriam Webster) http://www.ldoceonline.com (Longman) http://dictionary.cambridge.org http://www.hyperdictionary.com http://www.oed.com/ (Oxford English Dictionary)
Francs http://atilf.atilf.fr/tlfv3.htm
Alemn http://www.dwds.de/
AllWords.com: Diccionario ingls con traduccin a seis idiomas http://www.allwords.com Diccionario de sinnimos http://tradu.scig.uniovi.es/sinon.html ElMundo.es http://www.elmundo.es/diccionarios a) Recursos lexicogrficos Portales http://www.yourdictionary.com. Portal con 2.500 diccionarios y gramticas en 300 lenguas http://www.onelook.com/browse.shtml. Portal con cerca de 900 diccionarios http://www.diccionarios.com. Portal de Larousse. http://www.lexicool.com. Portal con ms de 4.000 enlaces de diccionarios y glosarios bilinges y multilinges
b) Recursos terminolgicos Portales Portalingua http://www.portalingua.info. Portal dedicado a las lenguas neolatina. Consulta de recursos en lnea. TermSciences http://www.termsciences.fr/. Portal terminolgico multidisciplinario. Permite la consulta de trminos en francs, ingls, espaol y alemn Eureka http://www.foreignword.com/eureka/default.asp. Portal que recoge informacin sobre bancos de datos terminolgicos, glosarios, diccionarios, traduccin, etc. Latinosapiens http://www.latinosapiens.info. Portal de informacin cientfica en lenguas neolatina. Contiene artculos, foros, revistas.
b) Recursos terminolgicos Catlogo de glosarios y diccionarios especializados Hiperenciclopdia http://www.grec.net/home/cel/mainc.htm Visual dictionary http://www.infovisual.info/ Glossarist http://www.glossarist.com/ Terminology Collection http://lipas.uwasa.fi/comm/termino/collect/ Vademcum del traductor externo http://www.europarl.europa.eu/transl_es/plataforma/pagina/celter/c elula.htm Inventerm http://www.inventerm.com/
c) Recursos textuales Corpus BwanaNet BNC (British National Corpus) CREA (Corpus de Referencia del espaol actual) Internet (Scirus [cientfico], Google) d) Bancos de datos terminolgicos y neolgicos
TERMITE (Banco creado por la International Telecommunications Union) http://www.itu.int/terminology/index.html Terminologa de la FAO http://www.fao.org/faoterm/index.asp?lang=ES IATE http://iate.europa.eu/ UPF_Term http://upfterm.upf.edu:8080/cat/index.htm TIS (Terminological Information System) http://tis.consilium.eu.int/utfwebtis/frames/introfsEN.htm Termium http://www.termium.gc.ca/site/accueil_home_f.html Cercaterm http://www.termcat.es Neoloteca http://www.termcat.es Bobneo http://obneo.iula.upf.edu/bobneo/
f) Listas de discusin, foros y blogs The Linguist List. Conjunto de listas (corpora, ELEX, lexicography) http://www.linguistlist.org/
Relacin temtica de listas de distribucin de RedIris (tecnotrad, traduccin, tradumtica) http://www.rediris.es/list/
Evaluacin de resultados Autora Actualidad Precisin y correccin Tratamiento del contenido Originalidad Enlaces a otros recursos Ergonoma Citacin en otros sitios