Você está na página 1de 8

EXAMEN

TEORIA

1- Exhaustividad y pertinencia ( y otros conceptos de evaluación), autores,


presentación formulistica y tabular, explicación. (10-11/05/04)
Un modelo de búsqueda reconoce solamente el tema principal, por consiguiente no se
obtiene toda la información pertinente (silencio), por otra parte, algunos documentos
recuperados pueden no contener información pertinente, entonces se produce ruido y se
reduce la precisión en la búsqueda de información.
Las medidas de la eficacia en un SRI mas usadas son:
• Exhaustividad: la ratio numérica entre de documentos relevantes
recuperados sobre el total de documentos relevantes en un fichero de
información
• Precisión: la ratio numérica de documentos relevantes recuperados sobre
el numero total de documentos recuperados ya sean relevantes o no.
Un incremento de la precisión conducirá a una caída de la precisión. Los ratios
normales son de 70-90% exhaustividad y del 8-20% precisión.
E = total de documentos existentes en el sistema.
A = conjunto de documentos almacenados en el sistema.
R = total de documentos recuperados
F = conjunto de documentos recuperados
P = total de documentos pertinentes
D = conjunto de documentos efectivamente pedidos
PE = total de documentos pertinentes existentes en el sistema (D∩A)
P ≠PE
PE⊂P Todo PE es P, pero no al contrario
Factores de evaluación: para medir los resultados de la RI.
• Factores optimizables con 1:
o Factor de pertinencia (FP). FP = P / R.
Los rasgos pertinentes son los que son comunes entre 2 elementos
o Factor de respuesta (FRE) o coeficiente de Exhaustividad. FRE = P / PE.
• Factores optimizables con 0:
o Factor de ruido (FRU). FRU = (R – P) / P.
Total de documentos recuperados no pertinentes divido por el total de
documentos pertinentes.
o Factor de silencio u omisión (FO). FO = (PE –R) / PE. Total de
documentos pertinentes existentes no recuperados dividido por el total de
documentos pertinentes existentes.
• Factores complementarios:
o Factor de resolución (FR). FR = R / E
o Factor de eliminación (FE). FE = (E-R) / E
Representación tabular:
• Según Buckland:
Documentos Relevantes No relevantes
Recuperados x u
No Recup. v y
Exhaustividad: x/x+v*100
Precision: x/v+u*100

• Según Mijailov:
Documentos Relevantes No relevantes Total docs.
Recuperados a b a+b
No Recup. c d c+d
Totales a+c b+d
Exhaustividad: a/a+c*100
Precision: a/a+b*100

• Según Blair:
Documentos Relevantes No
relevantes
Recuperados x u a+b=total
a b docs. recup
No Recup. v y
c d
a+c=total docs. recup.

Formalismo
Colum. Ref. x v u y
casos variables p∩r p-r r-p ¬pUr
p r p∩r p-¬r ¬r-p ¬pU¬r
1º 1 1 1 0 0 0
2º 1 0 0 1 0 0
3º 0 1 0 0 1 0
4º 0 0 0 0 0 1

X= pertinente, recuperado
V= silencio
U= ruido
Y = eliminación o filtrado

2- Teoría de conjuntos (lógica de clases) en su aplicación a los sistemas de


indización y recuperación de información, las criticas de Yehoshua-Bar
Hillel al uso tópico de esa teoría: síntesis de las criticas y propuesta de
reajuste. (24/05/04)

Desde el punto de vista lógico a la hora de establecer una división, el criterio de división
debe ser homogéneo, dentro de los elementos de una misma división, no así para
distintas divisiones.
Estructura monojerárquica: la división se basa en uno único criterio de clasificación.
Estructura polijerárquica: cuando la división se basa en varios criterios.
Clasificación por facetas: pueden ser compilatorias o jerárquicas, consiste en unificar
varios criterios en un único criterio. Para resolver búsquedas específicas y
multifacéticas es necesario asistir a nuevos métodos de RI, la indización coordinada
incorpora la teoría de los conjuntos para enunciar los principios esenciales de los
lenguajes coordinados.
Teoría de conjuntos: basada en la lógica de clases se distinguen dos grupos de
operadores:
• Formadores de clases: (AND, OR, NOT) crean clases complejas a partir de
clases básicas.
• Anunciadores: crean enunciados (inclusión, igualdad, subsumision)
Justificación del paso de sistemas clasificatorios a sistemas de indización
(combinatorios)
• Los sistemas clasificatorios no permiten todas las combinaciones de caracteres,
los combinatorios si.
• Los sistemas clasificatorios ante cualquier cambio deben reorganizar sus
entradas, la lista alfabética permiten una mejor actualización
Un sistema jerárquico se complica si queremos hacer nuevas subdivisiones o
principios de subdivisión.

3- Recursos gramaticales para lenguajes combinatorios postcoordinados: el


problema, especificación de recursos, ejemplo, propuesta. (06/08/04)

Recursos gramaticales de los lenguajes de RI de descriptores


En la formulación de solicitudes de búsqueda se realiza con un conjunto no ordenado de
descriptores, por lo que la recuperación produce ruido al permitir falsas combinaciones
de términos, para solucionar este problema se recurre a los lenguajes sintácticos
mediante vínculos y roles.
En el lenguaje ordinario no hay control sobre el vocabulario, pero si existen unas leyes
sintácticas (concordancia, puntuación), por tanto el agrupamiento y el orden o función
del elemento intervienen en el significado dando sintaxis a los lenguajes.
Mejoras sintácticas en los lenguajes combinatorios
• Lazos de agrupamiento: son símbolos especiales unidos a los descriptores en los
modelos de búsqueda de documentos y diseñados para el grupo conceptual de
esos descriptores. Reducen el ruido entre un 10/15% pero aumentan el tiempo de
indización.
• Indicadores de función (roles): son símbolos especiales que se unen a un
descriptor y reducen el alcance del concepto que se establece mediante
indicación de la función lógica que el descriptor dado desempeña en un contexto
particular.
• De los roles a la consideración de facetas: si a cada término le añadimos sus
posibles facetas hará que determinadas combinaciones resulten inútiles.
Estos sistemas reducen el ruido entre un 10/15% pero aumentan el tiempo de
indización.
PRACTICA

1- Introducción de información en el entorno administrativo de tesauro. Beat


v 32.0 a (29/03/04)
BEAT 3.2, administrador de entornos de tesauros, este programa trabaja con todo lo
que tiene que ver con la edición y administración de tesauros.
• Al arrancar introducir el nombre del tesauro a crear
• F5 pone en pantalla la información sobre el tesauro actual, contiene fichero
diario con todos los pasos que hacemos en el tesauro
• Introducir términos en el tesauro, desde la ventana principal con INTRO,
primero introducimos el elemento a relacionar, pulsamos relaciones,
introducimos la relación y el elemento relacionado.
Aparecen dos listas una de términos y otra de relaciones
Con INSERT elegimos la relación (US=USE, UP, TG, TE, TR)
Con SUP, eliminamos; con SCP modificamos
• Elegir entre preferidos (descriptores) y recusados (no descriptores)
• Introducir notas (F9), existen tres tipos para elegir:
o Nota de alcance o nota explicativa (NE)
o Nota de fuente (NF) de donde procede el termino
o Nota histórica (NH) cambios realizados en el tesauro
• Relaciones entre términos:
o Relaciones simétricas: relacionante y relacionado son conmutables
X∩Y=Y∩X → X USE Y=Y UP X
o Relaciones no simétricas: negación de la simetría
 Débil: al menos un caso no cumple simetría (no simetría)
Fuerte: si se da lo primero no se da lo segundo (antisimetría)

2- Posibilidad de la herramienta Extphr32: entrada y salida de información,


cambio de proceso
Realización de un tesauro a partir de datos obtenidos con el extractor de términos de
T. Craven ExtPhr32 (constructor de tesauros inductivo)

Realización con un gestor de tesauros:


• Importación desde el gestor de tesauros:
Trabajamos directamente con el resultado obtenido desde el ExtPhr32 , fases:
o Importación en el tesauro TheW32
 Importar términos y vínculos
 Seleccionar archivo a importar
 Proceso de importación
 Salida del listado en bruto
o Reajuste del cuadro de lista de términos obtenido (en el interior del
gestor de tesauros)
 Corrección en el cuadro de procesamiento actual, según el
siguiente proceso (arreglar, introducir, suprimir, visualizar
después de la corrección), con ello conseguimos depurar los
términos, una vez depurados se estructuran.
 Reiteración del proceso, pasar al siguiente término y continuar,
introducir vínculos y proseguir.
• Importación en el gestor a partir de la modificación realizada en un editor de
texto Word (camino MSWord + TheW32):
Partiendo del resultado de la transformación de Word, se realiza una
estructuración de la red semántica mediante el establecimiento de diferentes
tipos de relaciones:
o Vinculaciones inter-clase e intra-clase:
 Inter-clase: relaciones entre dos grupos o clases; intra-clase: entre
individuales y su clase
 Estas vinculaciones fundan relaciones lógicamente distintas
(inclusión / membresía)
 Lo anterior autoriza la distribución de términos en
Predescriptores e Identificadores.
 Llamaremos individuales a aquellos términos que señalan
individuos y llamamos comunes a aquellos que designan una
clase.
 Términos Predescriptores = identifican a clases;
Términos Identificadores = identifican individuos
 Tanto los identificadores como los predescriptores podrán ser
preferidos o no, es independiente, y ambos forman parte del
tesauro.
 Apilamiento de predescriptores: funcionan como nombres
comunes y se pueden adoptar como preferidos (descriptores) o
como recusados (sinónimos no descriptores)
Frente a éstos, llamamos identificadores a los términos que
funcionan como nombres propios y pueden ser tb. preferidos o no.
 Apilamiento de identificadores: se hace posteriormente al de
predescriptores, los términos restantes se asumirán como
identificadores. Tipos: Nombres propios (antropónimos,
topónimos), Abreviaciones (acrónimos, siglas, abreviaturas).
o Relaciones de equivalencia interlingüística:
 Interlingüística: entre lenguas diferentes
Intralingüística: entre términos sinónimos y cuasisinónimos
 De un conjunto de n términos sinónimos (o cuasisinónimos) , se
preferirá a uno a los restantes que se llamara descriptor y a los
restantes o recusados se les llamará no descriptores.
 Los relatores de equivalencia son USE y UP. Coche UP auto, auto
USE coche.

o Relaciones jerárquicas: se hacen tras fijar las de equivalencia lingüística,


tipos:
 Jerárquicas genéricas (lógicas),entre una clase o categoría y sus
miembros o especies; mesa---mueble
 Jerárquicas partitivas (antológicas), el nombre de la parte implica
el nombre del todo al que pertenece: pata---mesa
 Las relaciones de enumeración no son de jerarquización, en ella
se relacionan casos de tal categoría.

o Relaciones asociativas: son aquellas relaciones semánticas (de


significado) que no son de equivalencia ni jerárquicas, son simétricas sin
especificación, esta relación es reciproca y se indica TR

3- Introducción de información y demás procesos en el gestor de tesauros


TheW32 (070-8/03/04)

Componentes de la pantalla de trabajo del TheW32


• Encabezamiento actual
• Control de nº de vinculo
• Control mnemotécnico de vinculo
• Parrilla de referencias
• Botón de referenciación. Establece un vinculo entre el termino del
encabezamiento y el que esta en la lista de términos
• Separador
• Cuadro de lista de términos del tesauro sean o no descriptores
Opciones de archivo
• Exportar términos y vínculos: para utilizar archivos en otro gestor de tesauros,
en formato ANSI. Exporta en formato termino origen ! relator ! termino de
destino
• Importar términos y vínculos: para importar desde ficheros ANSI desde otro
gestor de tesauros, se importa en el mismo formato que la exportación.
• Convertir desde: es una transformación a partir de texto externo, con formato de
tabulación o con un tesauro de gestión de imágenes.
• Cargar ajustes: configurar las diferentes partes que tiene la plantilla, el sistema
de vínculos a utilizar (los relatores y las relaciones jerárquicas)
• El formato del registro es importante a la hora de visualizar el documento.
Detrás de un tesauro hay un gestor de BD.
• Guardar como
• Exportar a XML, el documento debe ir acompañado de su DTD sino XML no lo
puede validar.
• Exportar a JavaScript: exportar un tesauro a un fichero con una función
JavaScript, tras exportarse se visualiza con Wordpad para comprobar que esta
bien.
• Opciones de impresión: Da la opción de imprimir por letras (letra inicial-letra
final) por defecto de la A la Z. Se puede modificar el formato de impresión en
base digital para poder trabajar con cualquier gestor de tesauros.
• Previsualización en RTF: Tiene un formato de texto enriquecido, se puede
comunicar entre maquinas distintas, incorpora el formato y la imagen.
• Resumen: Resumen estadístico de aquello con lo que cuenta el programa
(términos introducidos, relaciones, etc)
• HTML: Guarda el tesauro en sitio web.
Imprimir: Permite imprimir en cualquiera de los tres formatos (TREE, SHORT,
ALPHA)
4- CMap tools: introducción de información, traslado de proyecto / mapas a
otro ordenador. Otros gestores de mapas conceptuales. Herramientas de
software análogos: gestores de ontologías.

Gestores de mapas conceptuales


Concep Map Tools: herramientas para la elaboración y gestión de mapas
conceptuales.
CMapTool: ejecución del programa
Carpeta Server: lugar donde se almacenan los proyectos (datos)
Proyecto: abarca innumerables mapas conceptuales
Mapa conceptual: abarca al menos un nudo, pertenecen a un proyecto
El programa permite la creación de mapas conceptuales colaborativos
Formula concepcional: Estructura conceptual abstracta que abarca facetas que
tienen que ver con la acción del hombre.
Al ejecutar el programa CMapTool se abren dos ventanas una propia del
programa y otra de ayuda.
Descripción de la Ayuda del programa CMapTool:
• Crear un proyecto:
o Carpeta dentro de SERVER (seleccionamos servidor local)
o Menú→Nuevo proyecto→Nombre proyecto
• Crear un mapa de conceptos: tras crear un proyecto
o Seleccionamos proyecto→Nuevo Mapa (abre una nueva ventana
donde crear un nuevo mapa)
• Añadir un concepto a un mapa:
o Cuadro de concepto = nudo
o Escribir nombre del concepto
• Crear un vinculo entre dos conceptos:
o Creamos flechas entre conceptos y aparece un rotulo con la
expresión de la relación (TG, TE)
Edición, permite la combinación de colores para contrastar las relaciones
entre conceptos en su representación en el plano.
• Añadir imágenes, videos y otros mapas de conceptos al mapa
• Guardar un mapa de conceptos, hay que guardarlo siempre rellenando los
siguientes campos:
o Nombre del mapa
o Descripción
o Creador
o Servidor
o Proyecto
• Abrir un mapa de conceptos, sólo moverse por el mapa
• Editar un mapa de conceptos, modificar el mapa
• Ojear
• Crear una sopa de conocimiento

Otras herramientas de mapas conceptuales:


• Topic Map Designer: genera documentos en XML
• Touch Graph Link Browser: también genera documentos en XML

Você também pode gostar