Você está na página 1de 114

Visualización y Análisis de Patrimonio

Cultural por medio de Tecnología Semántica

Title Visualización y Análisis de Patrimonio Cultural por medio de


Tecnología Semántica

Issue Date 2015-05-19

Publisher Instituto Tecnológico y de Estudios Superiores de Monterrey

Abstract La gran cantidad de información que existe actualmente requiere


de tecnologías que faciliten su entendimiento y exploración, por
lo cual surgen las tecnologías semánticas y con ellas el concepto
de Linked Data aunado a herramientas para su construcción,
edición y consumo. Esta investigación propone una metodología
para evaluar herramientas con características semánticas que
faciliten la exploración de recursos de acervo cultural, utilizando
como referencia el dataset de Hierros de la Conquista que es
parte de la colección de Patrimonio Cultural del Tecnológico
de Monterrey. Este dataset está construido bajo los principios
de Linked data y complementado con el modelo de datos de
Europeana, que es un modelo semántico para recursos de
patrimonio cultural. La metodología evalúa un conjunto de cuatro
herramientas, elegidas a partir de la clasificación de cuarenta
de ellas, para obtener la herramienta que más se adapta a la
visualización requerida por las colecciones del Tecnológico de
Monterrey. Después de ser evaluadas y descritas a detalle se
ponderan para encontrar la herramienta más adaptable a la
visualización de patrimonio cultural y se propone una lista de
modificaciones a la colección para mejorar la experiencia de su
visualización.

Discipline Ingeniería y Ciencias Aplicadas / Engineering & Applied Sciences


Item Type Tesis de maestría

Downloaded 08/07/2018 19:51:35

Link to Item http://hdl.handle.net/11285/576771


Instituto Tecnológico y de Estudios Superiores de Monterrey

Campus Monterrey

Escuela de Ingeniería y Ciencias

Visualización y Análisis de Patrimonio Cultural por medio de Tecnología


Semántica
Tesis presentada por

Lydia Abygail Yépez Grimaldo

sometida a la

Escuela de Ingeniería y Ciencias

como un requisito parcial para obtener el grado académico de

Maestro en Administración de Tecnologías de Información

Monterrey Nuevo León, 19 de Mayo de 2015


Dedicatoria

A Dios por sus bendiciones para conmigo.

A mis padres que me han demostrado su apoyo incondicional en todo momento y

me han brindado sus mejores consejos de vida.

A todos aquellos que me apoyaron y me aportaron sus conocimientos durante la

realización de esta tesis, en especial mi asesor Héctor Ceballos quien me permitió

aprender mucho de él.

IV
Reconocimientos

Gracias a mis padres por su incondicional apoyo en todos los aspectos.

Gracias al Dr. Héctor Gibrán Ceballos, por apoyarme, orientarme y enseñarme

gran parte de lo que pude aplicar a esta tesis.

Gracias al Dr. Daniel Jorge Sanabria, al Dr. Juan Carlos Lavariega y a la Dra.

Lorena Guadalupe Gómez por su valioso apoyo y cooperación durante la

realización, revisión y aprobación de esta tesis.

Gracias a Diego Valerio Camarda por sus importantes aportaciones y

recomendaciones al trabajo realizado, respaldadas por su experiencia en el área.

Gracias a Franz Inc por permitirme utilizar las funciones beta de Allegrograph, lo

cual facilitó la inclusión de la herramienta en esta tesis.

Gracias al Tecnológico de Monterrey por el apoyo y las enseñanzas que me brindo

durante estos años.

Gracias al Consejo Nacional de Ciencia y Tecnología en México por su apoyo.

V
Visualización y Análisis de Patrimonio Cultural por medio de Tecnología

Semántica

por

Lydia Abygail Yépez Grimaldo

Resumen

La gran cantidad de información que existe actualmente requiere de tecnologías


que faciliten su entendimiento y exploración, por lo cual surgen las tecnologías
semánticas y con ellas el concepto de Linked Data aunado a herramientas para su
construcción, edición y consumo. Esta investigación propone una metodología
para evaluar herramientas con características semánticas que faciliten la
exploración de recursos de acervo cultural, utilizando como referencia el dataset
de Hierros de la Conquista que es parte de la colección de Patrimonio Cultural del
Tecnológico de Monterrey. Este dataset está construido bajo los principios de
Linked data y complementado con el modelo de datos de Europeana, que es un
modelo semántico para recursos de patrimonio cultural. La metodología evalúa un
conjunto de cuatro herramientas, elegidas a partir de la clasificación de cuarenta
de ellas, para obtener la herramienta que más se adapta a la visualización
requerida por las colecciones del Tecnológico de Monterrey. Después de ser
evaluadas y descritas a detalle se ponderan para encontrar la herramienta más
adaptable a la visualización de patrimonio cultural y se propone una lista de
modificaciones a la colección para mejorar la experiencia de su visualización.

VI
Contenido

DEDICATORIA..................................................................................................................IV

RECONOCIMIENTOS........................................................................................................V

RESUMEN ........................................................................................................................VI

CAPÍTULO 1. INTRODUCCIÓN ......................................................................................... 1

1.1 MOTIVACIÓN ........................................................................................................... 1

1.2 CONTEXTO ............................................................................................................. 1

1.3 PREGUNTA DE INVESTIGACIÓN ........................................................................... 2

1.4 SOLUCIÓN............................................................................................................... 2

1.5 CONTRIBUCIONES PRINCIPALES ......................................................................... 3

1.6 ORGANIZACIÓN DE LA TESIS................................................................................ 4

CAPÍTULO 2. MARCO TEÓRICO ...................................................................................... 5

2.1 BIBLIOTECAS DIGITALES....................................................................................... 6

2.1.1 LINKED OPEN DATA ............................................................................................ 7

2.1.2 BIBLIOTECAS DIGITALES DE PATRIMONIO CULTURAL................................... 7

2.2 TECNOLOGÍA SEMÁNTICA .................................................................................... 8

2.2.1 RDF Y RDFS ....................................................................................................... 10

2.2.2 OWL .................................................................................................................... 12

2.3 ESTRUCTURA DE GRAFOS ................................................................................. 13

2.3.1 USABILIDAD Y VISUALIZACIÓN DE GRAFOS .................................................. 14

CAPÍTULO 3. VISUALIZACIÓN DE LINKED DATA MEDIANTE GRAFOS ...................... 19

3.1 HERRAMIENTAS DE VISUALIZACIÓN MEDIANTE GRAFOS .............................. 20

3.2 HERRAMIENTAS Y SUS CARACTERÍSTICAS ..................................................... 29

3.3 SELECCIÓN DE HERRAMIENTAS ........................................................................ 31

3.4 METODOLOGÍA DE EVALUACIÓN ....................................................................... 36

VII
3.5 ASPECTOS MÁS RELEVANTES PARA PATRIMONIO CULTURAL ..................... 38

CAPÍTULO 4. CASO DE ESTUDIO.................................................................................. 44

4.1 RESULTADOS ....................................................................................................... 50

4.1.1 ALLEGROGRAPH ............................................................................................... 50

4.1.2 LOG: LINKED OPEN GRAPH ............................................................................. 54

4.1.3 LODLIVE ............................................................................................................. 59

4.1.4 RELFINDER ........................................................................................................ 62

4.2 TABLA COMPARATIVA ......................................................................................... 67

4.3 VENTAJAS DE LA VISUALIZACIÓN DE PATRIMONIO CULTURAL COMO LINKED


OPEN DATA .................................................................................................................... 69

4.4 ADAPTACIONES SUGERIDAS .............................................................................. 69

CAPÍTULO 5. CONCLUSIONES ...................................................................................... 71

5.1 TRABAJO FUTURO ............................................................................................... 74

GLOSARIO ...................................................................................................................... 75

APÉNDICE A: GUÍA PARA LA EXTRACCIÓN DE INFORMACIÓN DE EUROPEANA .... 82

APÉNDICE B: EXPLORACIÓN DE DATOS DE EUROPEANA ........................................ 85

APÉNDICE C: GRAFO PARA HIERROS DE LA CONQUISTA ........................................ 90

APÉNDICE D: GRAFO PARA FOTOTECA ...................................................................... 91

APÉNDICE E: GUÍA DE EVALUACIÓN PARA USUARIOS FINALES ............................. 92

REFERENCIAS ................................................................................................................ 95

CURRICULUM VITAE .................................................................................................... 102

VIII
Lista De Figuras

Figura 2.1 Mapa conceptual de los temas abarcados dentro del Marco Teórico ................ 5

Figura 2.2 Ejemplo de tripletas del modelo RDF ............................................................. 10

Figura 2.3 Ejemplo de un grafo utilizando propiedades y URIs reales .............................. 13

Figura 3.14Mapa Conceptual de los temas abarcados en el Capítulo 3 ........................... 19

Figura 3.25 Interface de visualización de Allegrograph .................................................... 33

Figura 3.36 Interface de visualización de Linked Open Graph.......................................... 33

Figura 3.47 Interface de visualización de Linked Open Data Demonstrator ...................... 34

Figura 3.58 Interface de visualización de Lodlive ............................................................. 35

Figura 3.69 Interface de visualización de Relfinder .......................................................... 36

Figura 3.710 Representación del recurso de patrimonio cultural “National Flag of México”

de la colección de Europeana .......................................................................................... 39

Figura 4.11Integración y publicación de las colecciones de patrimonio cultural del

Tecnológico de Monterrey ................................................................................................ 46

Figura 4.212Extracto de la colección de Hierros de la Conquista correspondiente al Hierro

HC-002............................................................................................................................. 47

Figura 4.313Colección de hierros de la conquista contenida en Marmotta ....................... 48

Figura 4.414Extracto de la colección de Fototeca correspondiente a la Foto

120621_104453 ............................................................................................................... 49

Figura 4.515Configuración del Endpoint de HC en Allegrograph ....................................... 50

Figura 4.616Representación de nodos y arcos por Allegrograph ....................................... 51

Figura 4.717Estructura de nodos y etiquetas en Allegrograph/Gruff .................................. 52

Figura 4.818Visualización del grafo completo en Allegrograph/Gruff ................................ 52

Figura 4.919Detalle sobre demanda de un recurso en Allegrograph/Gruff ......................... 53

IX
Figura 4.1020Ventana de vista general del grafo con Allegrograph/Gruff .......................... 54

Figura 4.1121Visualización de Patrimonio Cultural del Tecnológico de Monterrey utilizando

LOG ................................................................................................................................. 55

Figura 4.1222Expansión de nodos de salida en LOG ........................................................ 55

Figura 4.1323Visualización de imágenes usando el menú contextual de LOG .................. 56

Figura 4.1424Detalle sobre demanda de un recurso en LOG ............................................ 57

Figura 4.1525Visualización de imágenes con la propiedad depiction en LOG ................... 57

Figura 4.1626Vista previa de la visualización con LOG ..................................................... 58

Figura 4.1727Contenido del Tecnológico de Monterrey que ofrece LodLive ...................... 59

Figura 4.1828Expansión a relacionados de salida y entrada con LodLive ......................... 60

Figura 4.1929Detalle sobre demanda de un recurso con LodLive ..................................... 60

Figura 4.2030Visualización de imágenes con LodLive ....................................................... 61

Figura 4.2131Visualización de mapas con LodLive ........................................................... 61

Figura 4.2232Visualización de Patrimonio Cultural del Tecnológico de Monterrey utilizando

LodLive ............................................................................................................................ 62

Figura 4.2333Visualización de Patrimonio Cultural del Tecnológico de Monterrey con

Relfinder........................................................................................................................... 63

Figura 4.2434Panel de elección o creación del endpoint a utilizar ..................................... 63

Figura 4.2535Configuraciones del endpoint de HC con Relfinder ...................................... 64

Figura 4.2636Opciones de entrada para una palabra clave con Relfinder ........................ 65

Figura 4.2737Visualización de imágenes usando depiction con Relfinder ......................... 65

Figura 4.2838Panel de filtrado de clases y propiedades en Relfinder ................................ 66

X
Lista De Tablas

Tabla 2.1 Factores del modelo QUIM y su descripción .................................................... 16

Tabla 2.2 Factores de Visualización ................................................................................ 17

Tabla 3.1 Visualizadores de Linked Data ........................................................................ 20

Tabla 3.24Comparación general de las herramientas de visualización ............................ 30

Tabla 3.35Lista de herramientas de visualización a evaluar ............................................. 32

Tabla 3.46Guía propuesta para la visualización de Linked Data ...................................... 37

Tabla 4.17Calificación de herramientas enfocada en Hierros de la Conquista ................. 67

Tabla 4.28Resultados de acuerdo a la prioridad de criterios ............................................ 68

XI
Capítulo 1. Introducción_ _________

Capítulo 1. Introducción

Introducción

En el primer capítulo de este trabajo se explica de forma breve la motivación y


contexto en el que se desarrolla la investigación, para después dar solución a la
pregunta que guiará la investigación. El mismo está dirigido a dos tipos de
audiencia, tanto tecnólogos en el área de bibliotecas digitales y tecnología
semántica, así como también responsables de colecciones de patrimonio cultural
que desean encontrar una forma de publicar su información al público general.

1.1 Motivación
Presentar una manera que permita fomentar la preservación de recursos de
Patrimonio Cultural en general, al mismo tiempo que permita extenderlo con
acceso alrededor del mundo explotando los recursos que ofrece la tecnología
semántica y la web de datos.

1.2 Contexto
Actualmente, la web ha facilitado la comunicación de manera global, y la cantidad
de información que se encuentra disponible en ella es cada vez mayor. Así surge
la necesidad de interoperar esta información con la ayuda de tecnologías basadas
en estándares y lenguajes que facilitan la accesibilidad y utilización de datos y
bases de datos en la web. Las bibliotecas digitales permiten compartir información
de bibliotecas y museos, utilizando un amplio rango de sistemas de software.
BRICKS y Greenstone son algunas de las que existen en la actualidad (Ceballos,
Sanabria & Lavariega, 2013). Europeana es otra biblioteca digital que además ha
implementado un modelo de datos semántico, permitiendo a los usuarios
encontrar datos culturales específicos y relacionados dentro del patrimonio cultural

1
Capítulo 1. Introducción_ _________

europeo, contribuyendo a su vez con la creación de conocimiento nuevo y


brindando una experiencia de consulta de mayor satisfacción.

Además, existen herramientas que permiten visualizar el contenido de estas


bibliotecas, las cuales mejoran la forma en la que se percibe su contenido y
dependiendo de la herramienta ofrecen otras características que puedan
complementar la información que ofrece patrimonio cultural.

1.3 Pregunta de Investigación

Para guiar la investigación sobre bibliotecas digitales de Patrimonio Cultural


basadas en tecnología semántica y Linked open data se plantea la siguiente
pregunta de investigación:

¿Cuáles de las tecnologías semánticas actuales se pueden utilizar para visualizar


y analizar la información que ofrecen las bibliotecas digitales cuando se aplican al
Linked Open Data de patrimonio cultural (e.g. Europeana y Tec de Monterrey)?

Existen diversos sistemas de software que soportan la creación de bibliotecas


digitales, sin embargo, pocos son los que van más allá de la búsqueda básica,
indexación y recuperación de documentos digitales. Las bibliotecas digitales
semánticas son capaces de integrar información de distintas fuentes y les permite
interoperar con otros sistemas para entregar resultados más robustos, ya que sus
capacidades de búsqueda están basadas en el uso de semántica (Ceballos et al.,
2013).

1.4 Solución

La solución propuesta ante la pregunta de investigación planteada es llevar a cabo


un análisis de herramientas tecnológicas actuales, diseñadas para visualizar
contenido de estructuras de información construida bajo estándares semánticos y
bibliotecas digitales. Este análisis tiene como propósito fomentar la base para
realizar una prueba de concepto, sobre dichas herramientas, utilizando un modelo

2
Capítulo 1. Introducción_ _________

de datos semántico de patrimonio cultural y con la limitación de evaluar


herramientas que sean de uso libre en este caso. Una vez concluido este proceso,
la solución incluye encontrar las ventajas y limitaciones de las herramientas
analizadas.

1.5 Contribuciones principales

Al concluir la investigación se pretende tener un análisis de las tecnologías


semánticas actuales, con el fin de encontrar las que puedan ser utilizadas para la
visualización y análisis de información de Linked Open Data de patrimonio cultural
(del Tecnológico de Monterrey y otros semejantes).

Las contribuciones principales que brinda esta investigación son,

La representación semántica de las colecciones de Patrimonio Cultural del


Tecnológico de monterrey basada en el modelo de datos de Europeana (EDM).

El análisis de las herramientas semánticas de visualización en función de las


facilidades que ofrecen para visualizar Linked Data.

La selección de las herramientas adaptables al consumo de Linked Data de


colecciones patrimoniales en general.

La propuesta1 de una metodología para evaluar las herramientas seleccionadas,


enfocada en el consumo de recursos culturales en formato de Linked Data.

La exposición de ventajas y desventajas de las herramientas seleccionadas


después de haber sido sometidas a la metodología, y de sus respectivas
adaptaciones sugeridas.

El ranking de las herramientas tecnológicas evaluadas, en base a los resultados


obtenidos a partir de la metodología de evaluación.

1
Propuesta basada en metodologías de otros autores que no han trabajado con patrimonio cultural

3
Capítulo 1. Introducción_ _________

1.6 Organización de la Tesis

La presente investigación cuenta con seis capítulos, cuyo contenido se describe


brevemente a continuación,

En el capítulo uno se plantea la introducción de la investigación, que incluye la


motivación para llevarla a cabo y el contexto en el que se desarrolla. Se plantea
también la pregunta que guía la investigación y la solución propuesta ante dicha
pregunta, así como también las contribuciones principales de la investigación.

En el capítulo dos se ofrece el fundamento de los conceptos principales abarcados


en la tesis, los cuales brindan el panorama en el que se desarrolla la investigación.

En el capítulo tres, Visualización de linked data mediante grafos, se introducen las


herramientas que permitirán completar el objetivo de la tesis, así como también
una primera selección justificada en base a sus características, con el fin de
concentrar las que serán utilizadas en el caso de estudio mediante la proposición
de una metodología de evaluación con enfoque especifico de patrimonio cultural.

En el capítulo cuatro se desarrolla el caso de estudio, en el cual se aplica la


metodología propuesta a las herramientas seleccionadas previamente y se
evalúan las herramientas utilizando colecciones de contenido patrimonial. También
se describen detalladamente los resultados obtenidos de cada una de las pruebas
y las adaptaciones sugeridas.

En el capítulo cinco, se exponen las conclusiones encontradas a partir de la


investigación y también se describen trabajos futuros potenciales a partir de
concluida la investigación.

4
Capítulo 2. Marco Teórico ______

Capítulo 2. Marco teórico

Marco teórico

En este capítulo se presentan los conceptos relacionados con el tema de tesis con
la finalidad de dar sustento al contenido de la misma. Este capítulo está dividido en
secciones, las cuales son descritas a continuación. Primeramente en la sección
2.1 se describen las Bibliotecas Digitales, así como también las Bibliotecas
Digitales de Patrimonio Cultural. En la sección 2.2 se describe lo referente a la
Tecnología Semántica, el formato estándar de construcción de ontologías y los
esquemas principales de lenguaje ontológico. En la última sección de este
apartado se describe la estructura de grafos y sus métricas para usabilidad y
visualización. En la figura 2.1 se puede observar el mapa conceptual que relaciona
estas secciones a partir de la aplicación de tecnología semántica a patrimonio
cultural.

Figura 2.1 Mapa conceptual de los temas abarcados dentro del Marco Teórico

5
Capítulo 2. Marco Teórico ______

2.1 Bibliotecas Digitales


Las bibliotecas digitales surgen con el desarrollo de las computadoras personales,
el internet y la World Wide Web, con la finalidad de publicar y compartir de manera
digital los recursos que tradicionalmente se habían compartido de manera física
(Arms, 2000). Arms define una biblioteca digital como la colección administrada de
información, con servicios asociados, donde la información esta almacenada en
formatos digitales y puede ser accedida por medio de la red con fines educativos,
de referencia o entretenimiento.

Aunque el concepto es similar al de las bibliotecas tradicionales, donde se


almacena información y es posible accederla con los mismos fines, el tema de las
bibliotecas digitales es de dominio multidisciplinario, ya que comprende desde
recuperación de información, ciencias informáticas y bibliotecología, hasta
disciplinas de interacción computadora-humano (Tsakonas, 2013).

La ventaja de las bibliotecas digitales reside en la posibilidad de acceder a


materiales y recursos de bibliotecas y museos distribuidos a lo largo del mundo por
medio de la web y su intercambio es posible gracias a normas y protocolos
internacionales que permiten la interoperabilidad entre ellos (Ceballos et al., 2013),
esto brinda la posibilidad a los usuarios de las bibliotecas de mejorar su
experiencia de consulta y acceso a la información, además de que permite la
integración de nuevos tipos de recursos como son imágenes y texto digital,
archivos de audio y video, hojas de cálculo, sitios web, bases de datos interactivas
y transmisión de video en vivo (Kurtz, 2010). Sin embargo, surge la necesidad de
estructurar, estandarizar y ordenar las distintas formas de datos que representan
los millones de recursos en la web para hacer posible su administración y manejo
(Kurtz, 2010), ya que sin una estructura determinada, esta información se
convierte en recursos que no pueden ser fácilmente consultados y a su vez les
resta utilidad.

6
Capítulo 2. Marco Teórico ______

2.1.1 Linked Open Data

Tras la creación de las bibliotecas digitales y la necesidad de su estandarización y


orden, se creó también el concepto de Linked Open Data, LOD o bien, Datos
Abiertos Enlazados, que le permiten a las Bibliotecas Digitales compartir sus
bases de datos utilizando tecnología semántica para establecer relaciones entre
distintos datasets o conjuntos de datos y conformar una red mayor de información
entrelazada. Linked Open Data es la manera en la que se enlazan estructuras de
datos disponibles en la web, fue introducida por Tim Berners Lee, el creador de la
web, basándose en 4 principios básicos que definió de la siguiente manera (Heat
& Bizer, 2011):

Usar URIs para nombrar objetos.

Usar HTTP URIs para acceder a una descripción de los objetos.

Utilizar estándares y lenguajes como RDF y SPARQL para ello.

Y, agregar enlaces entre los objetos.

2.1.2 Bibliotecas Digitales de Patrimonio Cultural

Las instituciones de patrimonio cultural son las encargadas de preservar el pasado


en las sociedades actuales, por lo cual forman parte del capital intelectual del
mundo, y el uso de las tecnologías digitales emergentes para activar, involucrar y
transformar este capital es paralela a los cambios en la cultura de las
organizaciones y la práctica de las instituciones encargadas de su cuidado
(Barceló, 2000). Patrimonio cultural abarca todos los recursos que forman parte de
la historia regional y mundial, como bibliografía, imágenes, piezas y más; este
amplio rango de contenido que aunque varía drásticamente de acuerdo a su tipo y
sus propiedades, esta semánticamente muy entrelazado (Mäkelä & Hyvönen,
2011).

7
Capítulo 2. Marco Teórico ______

Existen algunas experiencias sobre bibliotecas digitales de patrimonio cultural


alrededor del mundo, algunos ejemplos son la Digital Public Library of America,
que es un portal de acceso a patrimonio cultural en América que provee libros,
imágenes, grabaciones históricas y materiales audiovisuales, está conformado por
una colección de archivos de universidades, bibliotecas públicas y otras
organizaciones (DPLA, 2014); existe también la Biblioteca Nacional de España,
que es un proyecto conjunto del Ontology Engineering Group y la Biblioteca
Nacional de España que promueve el uso de recursos bibliográficos contenidos
dentro de su catálogo, el cual esta creado a partir del formato RDF y bajo los
principios de LOD, promoviendo el enriquecimiento de la web de datos (BNE,
2014); otro ejemplo en Francia es la Bibliothèque Nationale de France, que es un
proyecto de recursos bibliográficos abiertos que también está basado en
estándares y herramientas de tecnología semántica (BNF, 2014); todos estos
proyectos están destinados a la preservación del patrimonio cultural en su área.

Además existen otros proyectos con el propósito de preservar el patrimonio


cultural en general, incluyendo tanto bibliotecas, como museos y demás. Un
ejemplo es el caso de Europeana que se explicará con mayor detalle en la sección
2.2.2, que pretende agrupar información de toda la unión europea utilizando
tecnología semántica, aunque los resultados de este proyecto aún no han sido
completamente satisfactorios, lo cual puede ser debido a que comprende una
cantidad bastante grande de recursos y a la vez involucra muchos colaboradores.
También existe CultureSampo, en Finlandia, es un proyecto muy semejante a
Europeana pero acotado solamente a los recursos nacionales, y algunos
contenidos internacionales, este proyecto ha tenido buenos resultados.

2.2 Tecnología Semántica


La web de datos o web semántica fue introducida por Tim Berners Lee en 1995
con el fin de representar y organizar el conocimiento (Guns, 2013), de manera que
se puedan establecer relaciones entre datos y entenderlas. Las relaciones pueden
ser establecidas entre recursos de la web, por ejemplo un recurso está relacionado

8
Capítulo 2. Marco Teórico ______

con otro ya sea porque uno está hecho del otro, es parte del otro o surgió a partir
del otro, de la misma manera un recurso distinto al ya mencionado puede tener las
mismas relaciones con otros y formar redes de información que se conectan entre
sí. Luis Criado, en su libro Nosotros, los constructores de la Web Semántica,
define la web semántica como la vía en la que los datos pueden ser compartidos, y
que permite la integración de aplicaciones, con la finalidad de que los recursos en
la web puedan ser entendidos tanto por personas como por máquinas (Criado,
2013). Por su parte Hitzler, en su libro Foundations of Semantic Web
Technologies, la define como la extensión de la World Wide Web que permite a las
computadoras de manera inteligente buscar, combinar y procesar el contenido de
la web (Hitzler, 2010). Se puede resumir de las definiciones anteriores que el papel
de la web semántica es administrar, con ayuda de la inteligencia artificial, los
recursos que se encuentran en la web. Pero como existe mucha información,
entonces la cantidad de enlaces puede llegar a tener un nivel de complejidad
importante, por lo que la web semántica tiene la capacidad de entender las
relaciones que existen entre distintos recursos, y por medio de la red de nodos o
recursos se puede estructurar la información interrelacionada entre sí. Esto
representa su utilidad, que según Criado, radica en compartir datos, enlazarlos,
integrar sistemas y entender el contenido de ellos (Criado, 2013), para de esta
manera lograr una completa integración de datos aun cuando estos provengan de
fuentes heterogéneas (Mäkelä & Hyvönen, 2011).

De acuerdo con el análisis de Logan y Knox, When to use Semantic Technologies,


en Gartner Intraweb, las tecnologías semánticas incluyen ontologías, taxonomías,
clasificación, categorización y etiquetas, agrupación por clusters, análisis y
monitoreo de contenido (Logan & Knox, 2017). Es ideal utilizarlas cuando se
manejan grandes cantidades de datos. Para lograr la integración de estos datos, la
tecnología semántica esta implementada por estándares, tanto para el modelo de
datos como para el lenguaje de las consultas y ontologías, ejemplos de estos
estándares son RDF, OWL, SPARQL, entre otros, donde cada uno de ellos tiene
su propia función.

9
Capítulo 2. Marco Teórico ______

La tecnología semántica se ha vuelto cada vez más popular por sus aplicaciones
en procesamiento de lenguaje natural, deducción automatizada, verificación
formal, análisis estadístico, entre otras (Pérez, 2014).

2.2.1 RDF y RDFS

RDF
Conocido así por sus siglas en inglés de Resource Description Framework, es un
lenguaje de representación de información en la web (Klyne & Carroll, 2004) que
compone la descripción de un recurso (documento, persona, objeto, lugar, etc.) La
creación del RDF surgió con la intención de que la información que se encuentra
en la web pueda ser procesada por aplicaciones, y entendida de la manera en la
que es entendida por las personas que la pueden visualizar (Schreiber & Raimond,
2014).

El modelo de datos RDF está construido por tripletas conformadas por un sujeto,
un predicado y un objeto, en el mismo orden <sujeto> <predicado> <objeto>,
donde el predicado expresa la naturaleza de la relación que existe entre el sujeto y
el objeto (Schreiber & Raimond, 2014). Un ejemplo de esta sentencia puede ser
<Mona Lisa> <fue creada por> <Leonardo da Vinci> y otro ejemplo puede ser
<Leonardo da Vinci> <nació en> <Italia> (ver fig. 2.2).

Figura 2.2 Ejemplo de tripletas del modelo RDF

10
Capítulo 2. Marco Teórico ______

Otra característica del modelo RDF es que utiliza URIs (Uniform Resource
Identifiers) como identificadores únicos para los recursos, lo cual le permite crear
vínculos entre recursos iguales, con descripciones diferentes en distintos lugares
de la web, es decir que, cualquier descripción que existe en la web para la obra
Mona Lisa, se le es asignada al identificador único (URI) de Mona Lisa, siempre
que haga referencia al mismo recurso, es decir que se refieran a la misma pintura
“Mona Lisa”.

En conjunto los URIs y el esquema de tripletas, de un RDF, permiten la generación


de grafos de información, como el que se observa en la figura 2.2, que muestra de
una manera visual la misma información almacenada en un archivo RDF, esta
visualización es posible gracias a un software que permite hacer la conversión de
RDF a grafo, en este caso se utilizó la herramienta gratuita de creación y
visualización de grafos, Visual Understanding Environment (VUE).

RDFS

El predicado de las sentencias de un RDF representa un vocabulario creado con


fines específicos, también conocido como esquema de metadatos u ontología.
RDF es usado en combinación con otras ontologías para darle semántica al
recurso. La ontología de RDF se llama RDF Schema o RDFS, aunque existen
otros como Dublin Core (DC) que describe obras litararias, Simple Knowledge
Organization System (SKOS) para describor conceptos, Friend Of A Friend
(FOAF) que describe personas, y más. RDFS se utiliza para describir grupos de
recursos relacionados y las relaciones entre ellos, además los recursos son
usados para determinar las características de otros recursos, como el rango y el
dominio de las propiedades.

El vocabulario de RDFS comprende principalmente las siguientes clases para


establecer el tipo de recurso: Recurso (rdfs:Resource), Clase (rdfs:Class), Literal
(rdfs:Literal), Tipo de dato (rdfs:Datatype), Cadena de caracteres (rdf:langString),
HTML (rdf:HTML) y Propiedad (rdf:Property) y comprende también las siguientes

11
Capítulo 2. Marco Teórico ______

propiedades, Rango (rdfs:range), Dominio (rdfs:domain), Tipo (rdf:type), Subclase


(rdfs:subClassOf), Subpropiedad (rdfs:subPropertyOf), Etiqueta (rdfs:label) y
Comentario (rdfs:comment) (Brickley & Guha, 2014).

2.2.2 OWL

El lenguaje OWL (Web Ontology Language) al igual que RDF, se construyó con la
finalidad de que la información contenida en documentos pueda ser entendida y
procesada por aplicaciones, y no solo por humanos. Representa el significado de
los términos que componen los distintos vocabularios, y también las relaciones
que existen entre estos. Aunque este lenguaje tiene mayor facilidad de significado
y semántica que XML y RDF (McGuinness & van Harmelen, 2004). Europeana
utiliza un formato de metadatos codificado en OWL.

Modelo de datos de Europeana

Europeana es un proyecto que inició como una biblioteca virtual, que empezó a
construirse en el año 2007. Nació en Europa con la finalidad de crear una nueva
forma de presentar el acervo cultural europeo al público en general, incluyendo
bibliotecas, museos, archivos y sectores audiovisuales alrededor de la Unión
Europea, accesible de manera digital para el usuario (Europeana Professional,
2015). Está conformada por una colección de recursos virtuales del patrimonio
cultural europeo, de los cuales se cuenta con un registro detallado de metadatos
en la red, con información recabada de distintos sitios o instituciones culturales
asociadas al proyecto. Actualmente Europeana trabaja bajo el Modelo de datos de
Europeana (EDM), que corresponde a la mejora del primer modelo de datos que
utilizó, Elementos Semánticos de Europeana (ESE). Las características de modelo
son que facilita la participación de Europeana en Web Semántica y brinda enlaces
de mayor significado a los datos para resultados más completos. Entre las
ontologías comprendidas dentro del modelo de datos de Europeana están:
RDF/RDFS, OWL, SKOS, DC, ORE, FOAF y EDM.

12
Capítulo 2. Marco Teórico ______

En la figura 2.3 se muestra el ejemplo de un grafo en tripletas, que incluye algunas


propiedades de DC y EDM, las cuales se especifican como prefijo junto con la
propiedad correspondiente separada con dos puntos. Incluye además URIs reales
tomados de bases de datos como DBpedia y GeoNames.

Figura 2.3 Ejemplo de un grafo utilizando propiedades y URIs reales

2.3 Estructura de Grafos

Un grafo en tecnología semántica es la estructura formada por nodos y arcos


entrelazados entre sí para representar las tripletas RDF. En un grafo los recursos
pueden ser clases, individuos o literales y están representados por los nodos. Los
arcos enlazan dos nodos y representan la relación entre dichos nodos o recursos.
Estos arcos pueden ser dirigidos o no dirigidos, lo que implica que la relación entre
dos nodos aplica solo de uno de ellos hacia el otro, cuando es dirigido, y que la
relación aplica de la misma manera en ambos sentidos, cuando es no dirigido. Los
grafos se generan a partir de relaciones semánticas, las cuales sirven para crear
un mapa o red de información relacionada entre sí y el análisis de grafos es un
conjunto de técnicas analíticas que exploran relaciones entre las entidades o
recursos de interés, estas relaciones pueden ser explicitas o inferidas, indicando
fuerza, frecuencia de interacción o probabilidades (Linden & Sallam, 2014). De

13
Capítulo 2. Marco Teórico ______

acuerdo con el Hype Cycle de Gartner sobre la gestión de la información


empresarial del año 2014, el análisis de grafos se encuentra actualmente en un
estado de madurez emergente.

Los grafos pueden llegar a ser muy complejos dependiendo del dataset con el que
se está trabajando y del número de instancias que comprende el diagrama. Una
vez que el grafo se ha creado, la información contenida en el puede ser consultada
por medio de lenguaje SPARQL (Schreiber & Raimond, 2014), sin embargo, la
complejidad de este lenguaje es uno de los factores que limitan la popularidad de
los recursos semánticos (Morato, Sánchez, Ruiz & Moreiro, 2014). Ellos expresan
que “el elevado número de conceptos interrelacionados hace patente la necesidad
e importancia de un método intuitivo para organizar, recuperar, filtrar, visualizar y
navegar entre conceptos y acceder a sus recursos vinculados” (Morato et al.,
2014). Con esta necesidad surgen herramientas que permiten la carga de
información en este formato, y la presentan de manera amigable e interactiva
para el usuario, además le permiten conocer y explorar las relaciones de recursos
sin necesidad de utilizar lenguaje complejo de recuperación o consulta. El objetivo
de estas herramientas es brindar acceso a la información y el contenido
subyacente de manera sencilla y fácil de comprender (Baeza et al., 2004).

2.3.1 Usabilidad y Visualización de Grafos

Con el fin de encontrar herramientas tecnológicas que cumplan con lo antes


mencionado, se presenta una descripción de las características de usabilidad y
visualización. La usabilidad facilita la manera en la que se construye la información
y la visualización facilita la manera en la que esta información es percibida por el
usuario final. A continuación se describen estos dos aspectos.

En primer lugar se considera la usabilidad, definida en 1991 por el protocolo


ISO/IEC 9126 como el conjunto de atributos que soportan el esfuerzo necesario
para el uso de una tecnología, y para un conjunto de usuarios específicos
(ISO/IEC 9126, 1991). De esto se puede interpretar a la usabilidad como la medida

14
Capítulo 2. Marco Teórico ______

de los factores que intervienen para mejorar la experiencia del usuario al hacer
uso de una tecnología específica, con fines específicos y dirigida a un grupo
específico.

Existen en la literatura distintos factores para medir la usabilidad, Palmer propone


el uso de cinco: tiempo de descarga, navegabilidad, contenido, interactividad y
respuesta (Palmer, 2002); Constantine y Lockwood proponen: eficiencia, facilidad
de aprendizaje, facilidad de memorización, confiabilidad en su uso y satisfacción
del usuario (Constantine & Lookwood, 1999); Shneiderman menciona como
factores de usabilidad a la velocidad de desempeño, tiempo de aprendizaje,
retención en el tiempo, tasa de error por los usuarios y satisfacción subjetiva
(Shneiderman, 1992); ISO/IEC 9126-1 propone entendimiento, facilidad de
aprendizaje, operatividad, atractivo y conformidad de uso y entre otras fuentes, el
protocolo ISO 9126-4 propone efectividad, productividad y seguridad (Seffah et al.,
2006).

Además Seffah, Donyaee, Padda y Kline explican que existen también modelos
con el mismo objetivo, buscar factores para medir la usabilidad de un sistema,
algunos de ellos son el modelo McCall que propone: efectividad, productividad y
seguridad; el modelo Bohem que propone utilidad, portabilidad y mantenencia; el
modelo SANe: eficiencia, facilidad de aprendizaje, adaptabilidad, carga de trabajo
cognitiva y corrección de errores y el modelo DRUM que propone: tiempo de tarea,
tiempo de ayuda y búsqueda, efectividad, eficiencia, eficiencia relativa, y periodo
de productividad. Basado en estos modelos, y algunos de los autores aquí
mencionados, Seffah, Donyaee, Padda y Kline proponen un nuevo modelo en el
año 2006, el cual está construido por un conjunto de 10 factores de usabilidad,
compuestos por 26 criterios y 127 métricas, este conjunto representa el modelo de
medidas de usabilidad Quality in use Integrated Measurement, conocido también
como Modelo QUIM. En su artículo, Usability Measurement and Metrics: A
Consolidated Model, mencionan que aun cuando se tiene un modelo de medición
de usabilidad, es difícil saber aplicar los estándares en la práctica para cada caso

15
Capítulo 2. Marco Teórico ______

particular y que es difícil saber cómo medir cada uno de ellos, por lo que la
utilización de este modelo implica analizar el caso de aplicación para adaptar los
factores que realmente se requieren medir.

La tabla 2.1 muestra el condensado de factores del modelo QUIM, por cuestiones
de simplicidad no se muestran dentro de la tabla los criterios relacionados, ni las
127 métricas que maneja el modelo, sino que se limita a los factores de usabilidad,
y su descripción.

Tabla 2.1 Factores del modelo QUIM y su descripción


MODELO QUIM
Factores Descripción
Capacidad de permitir a los usuarios de gastar cantidades
Eficiencia (Efficiency) apropiadas de recursos en relación a la efectividad
alcanzada en un contexto de uso específico.
Efectividad Capacidad de permitir a los usuarios de completar tareas
(Effectiveness) específicas y con precisión.
Es el nivel de efectividad logrado en relación con los
Productividad (Productivity)
recursos consumidos por los usuarios y por el sistema
Se refiere a la respuesta subjetiva de los usuario sobre
Satisfacción (Satisfaction)
cómo se sienten al utilizar el software.
Es la capacidad de permitir a los usuarios sentir que
Facilidad de aprendizaje
pueden utilizar productivamente el software y
(Learnability)
rápidamente aprender nuevas funcionalidades.
Se refiere al límite de riesgo en el que un software puede
Seguridad (Safety) ocasionar riesgos a personas u otros recursos como
hardware o información almacenada.
Es la fidelidad que ofrece el software (Se utiliza
Confiabilidad
potencialmente para e-commerce, pero puede aplicar
(Trustfulness)
para otro tipo de productos de software).
Es la capacidad del software de ser usado por personas
Accesibilidad (Accesability) con algún tipo de discapacidad, ya sea visual, de oído o
psicomotriz.
Se refiere a la capacidad del software de ser utilizado por
Universalidad (Universality)
una diversidad de usuarios con diferentes culturas.
Es permitir a los usuarios del software resolver problemas
Utilidad
reales de manera aceptable. Esta característica también
(Usefulness)
depende de las habilidades y conocimientos del usuario.

16
Capítulo 2. Marco Teórico ______

En segundo lugar se considera la visualización de grafos como parte de la


evaluación de herramientas. En el año 2012 Kirk definió la visualización como la
representación y presentación de datos que explotan nuestras habilidades de
percepción visual con el fin de amplificar la cognición (Kirk, 2012). Herman &
Marshall, en su artículo Graph visualization and navigation in information
visualization, en el cual se describen los aspectos clave que influyen en mejorar la
visualización por parte del usuario ante grafos extensos y abstractos, proponen
como factores de una buena visualización los mostrados en la tabla 2.2 (Herman
et al., 2000).

Tabla 2.2 Factores de Visualización

Herman & Marshall


Factor Clasificación Ejemplo
Tamaño
(Size of Graph)
Distinción entre nodos y arcos
(Discerning between nodes and
edges)
Comprensión de datos
(Data Comprehension)
Análisis detallado
(Detailed Analysis)
Navegación
(Navigation)

Geométrico
(Geometric Zooming)
Acercamiento
(Zoom and Pan)

Semántico
(Semantic Zooming)

Consultas
(Queries)
Predictabilidad
(Predictability)
Complejidad en tiempo
(Time Complexity)

17
Capítulo 2. Marco Teórico ______

Tradicional
(Traditional Layout)

Expansión
(Spanning tree Layout)
Tipo de grafo
(Layout)

Tercera dimensión
(3D Layout)

Hiperbólico
(Hyperbolic Layout)

Agrupación
(Clustering)

A partir de los factores anteriores para usabilidad y visualización se plantea un


marco de referencia para describir herramientas tecnológicas actuales con la
finalidad de encontrar la que se adapte a las necesidades de presentación de
patrimonio cultural bajo los estándares de tecnología semántica, estas
herramientas se presentan en el siguiente capítulo.

18
Capítulo 3. Visualización de Linked Data mediante Grafos ______

Capítulo 3. Visualización de Linked Data mediante Grafos

Visualización de Linked Data mediante Grafos

Se utiliza la visualización mediante grafos con la finalidad de encontrar una


manera ideal de presentar al usuario final el contenido de la información que se
tiene en patrimonio cultural ya sea del Tecnológico de Monterrey o cualquier otra
institución que cuente con contenido patrimonial, de manera que el público en
general pueda explorar la información aun cuando sea ajeno al contenido de esta.

Este capítulo está divido por secciones, la primera de ellas, la sección 3.1 describe
algunas de las herramientas tecnológicas de visualización de grafos existentes en
la actualidad y en la sección 3.2 se detallan sus características en forma de tabla
para facilitar su comprensión y comparación, y se describe el proceso de selección
de herramientas a utilizar. En la sección 3.3 se lleva a cabo la selección de las
herramientas que permitan modelar la descripción de la herramienta ideal de
visualización de Linked Data mediante grafos y en la sección 3.4 se plantea una
guía que conforma la metodología de evaluación de las herramientas
seleccionadas. Por último, en la sección 3.5 se explica cómo fue conformada la
guía de evaluación propuesta.

Figura 3.14Mapa Conceptual de los temas abarcados en el Capítulo 3

19
Capítulo 3. Visualización de Linked Data mediante Grafos ______

3.1 Herramientas de Visualización mediante Grafos

Mediante un proceso de búsqueda en fuentes de información electrónica en la web


se recabó información sobre un total de cuarenta herramientas de visualización
encontradas, con la intención de llevar a cabo una evaluación de las herramientas
actualmente vigentes que permita identificar las que pueden ser utilizadas para
representar las colecciones de patrimonio cultural de manera ideal. La búsqueda
se basó en recolectar las herramientas que ofrecen características de consumo de
linked data y visualización en forma de grafo como principal requisito.

En la tabla 3.1 se presenta una breve descripción de cada herramienta y una


imagen ejemplo de la representación visual que ofrecen.

Tabla 3.1 Visualizadores de Linked Data

Herramienta Ejemplo
Allegrograph / Gruff
Es un visualizador de alto desempeño con uso de memoria
eficiente, sus principales aplicaciones son empresariales.
Soporta SPARQL, RDFS y el razonador Prolog (Franz Inc.,
2014). Fuente: http://franz.com/agraph/gruff

Cytoscape
Es un software para visualizar redes de interacción molecular
y rutas biológicas, e integrar estas redes con anotaciones,
perfiles genéticos y otros datos. Originalmente fue creado con
fines biológicos y actualmente es una plataforma general
para visualización de redes complejas (Cytoscape Consortium,
Fuente: http://www.cytoscape.org/
2014).
Fenfire
Es un proyecto abierto basado en RDF que permite expresar
grafos a partir de datos almacenados. Esta herramienta
permite buscar, navegar y agregar información al contenido
del archivo (Fenfire, 2008). Fuente:http://fenfire.org/screenshots/ff
-0.1/fenfire-hs_notes-2007-01-30.png

20
Capítulo 3. Visualización de Linked Data mediante Grafos ______

GINY
Es una librería de código abierto que permite desarrollar
proyectos gráfico y visuales, utiliza librerías de CERN, y utiliza
Picolo para la parte visual, además de diseños de JUNG
(Christmas, 2014). Fuente:http://csbi.sourceforge.net/scr
eenshots.html

Graphviz
Es un software de visualización para representar información
en forma de grafos y redes. Tiene importantes aplicaciones en
bioinformática, ingeniería de software, bases de datos y
diseño web, aprendizaje automático e interfaz visual
Fuente:http://www.graphviz.org/conte
(Graphviz, 2014). nt/transparency

HyperGraph
Es un proyecto de código abierto que permite construir
diagramas de árbol con geometría hiperbólica por medio de
lenguaje GraphML (HyperGraph, 2003).
Fuente:http://hypergraph.sourceforge.
net/examples_tm_kaq.html

Hypertree
Es una librería para desarrollar visualizaciones de grafos
hiperbólicas, está disponible de manera abierta (Hypertree,
2014).
Fuente:http://hypertree.sourceforge.n
et/
Iconvis
Es una aplicación que permite visualizar y realizar búsquedas
de datos estructurados en forma de ontología de entrada,
además tiene la capacidad de enlazarse con fuentes de datos
en la web, como DBpedia y GeoNames (Iconvis, 2014). Fuente:http://iconvis.polito.it/iconvis/?
q=node/8

21
Capítulo 3. Visualización de Linked Data mediante Grafos ______

Igraph
Es una librería y paquete para análisis de redes, su principal
objetivo es proveer tipos de datos y funciones para la
implementación de algoritmos de grafos y la manipulación de
grafos extensos (Igraph R, 2013). Fuente:http://web.stanford.edu/~mess
ing/CreateBasicNetVis.html

IsaViz
Es una herramienta de creación y búsqueda en archivos RDF,
permite acercamiento, navegación y edición del grafo, y
permite además la importación y exportación de archivos en
distintos formatos. Esta herramienta utiliza lenguaje GSS para
Fuente:http://www.w3.org/2001/11/Isa
construir los grafos (Pietriga, 2007). Viz/images/isv6.png

JUNG
Es una librería de software para modelar y visualizar
información representada como grafos y provee un
marco para desarrollar herramientas de exploración de
Fuente: http://jung.sourceforge.net/
esta información (JUNG, 2010). presentations/JUNG_M2K.pdf

Linked Open Data Demonstrator


Es una plataforma de autoservicio que integra distintas
fuentes de LOD, y provee información estructurada para
construir tu propio Linked Data (Information Workbench,
2015). Es gratuita para algunas funciones pero tiene un
costo para visualización.
Linked Open Graph
Linked Open Graph o LOG es una herramienta web para
buscar y navegar entre recursos o datos mediante el
enlace a datos de distintas fuentes como DBpedia,
Europeana y GeoNames, entre otras, permitiendo Fuente:http://log.disit.org/service/inde
x.php?graph=aaa8eb72b3bfb04942eff
visualizar sus recursos (Bellini et al., 2014). 928a23b6e54&multiple_search=false

22
Capítulo 3. Visualización de Linked Data mediante Grafos ______

Linkurious
Permite hacer búsquedas y explorar recursos por medio
de grafos y permite editar la información de manera
sencilla. Ofrece seguridad a los datos y consultarlos por
medio de búsquedas sencillas o más especializadas en
Fuente: https://linkurio.us/tour/
lenguaje Cypher (Linkurious, 2014).
Lodlive
Es un proyecto de código abierto que muestra de una
manera sencilla los recursos publicados bajo los
estándares de W3C, y brinda la capacidad de navegar
Fuente:http://blog.lodlive.it/presentazi
entre ellos (Lodlive, 2012). one-del-progetto/

Mnemomap
Es una herramienta que combina tecnología de redes
sociales, motores de búsqueda y bases de datos para
mostrar por medio de grafos, información relevante a la Fuente:
http://bitsignals.com/2007/02/19/mnem
consulta (Mnemomap, 2014). omap-un-buscador-conceptual/

Network Workbench
Es un paquete de análisis, modelación y visualización de
redes de gran escala, con fines de investigación en
biomedicina, física y ciencias sociales. Este paquete
permite acceder a distintas bases de datos, así como Fuente: http://nwb.cns.iu.edu/Docs
/NWB_VisualizingTree.pdf
también archivos propios (Network Workbench, 2008).

NetworkX
Es un paquete de software en lenguaje Python para la
creación, manipulación y estudio de la estructura, dinámica y
función de redes complejas, utiliza algoritmos estándar para
Fuente:
la construcción de grafos (NetworkX, 2014). https://networkx.github.io/documentati
on/latest/examples/drawing/random_g
eometric_graph.html

23
Capítulo 3. Visualización de Linked Data mediante Grafos ______

Ontograf
Es una herramienta creada como plug-in para el software de
edición de ontologías Protege, que ayuda a navegar
interactivamente entre las relaciones de una ontología.
Soporta clases, subclases, individuos y propiedades de objeto
Fuente:
y permite filtrar nodos para mejorar la visualización (Falconer, http://protegewiki.stanfordedu/wiki/File
:Ontograf_screenshot 3.png
2013).

Oobian
Es una plataforma distribuida por Maisis que provee
búsqueda y navegación de contenidos con el fin de ofrecer
conocimiento a la organización (Maisis, 2010).
Fuente:https://www.behance.net/galle
ry/4467573/OOBIAN
Otter
Es una herramienta para visualizar redes de datos en forma
de grafos en cualquier formato mediante diversos algoritmos
de presentación, Otter tiene la capacidad de manejar grafos
Fuente:
extensos con uso eficiente de memoria (Huffaker et al., 1999). http://www.caida.org/tools/visualization
/otter/paper/

OWL2Prefuse
Es un paquete que permite crear grafos y diagramas de árbol
a partir de ontologías. Convierte la estructura de un archivo
OWL en estructura Prefuse para utilizarlo en aplicaciones
semánticas (Borsie & Giles, 2014).
Fuente:
http://owl2prefuse.sourceforge.net/

RDF Gravity
Es una herramienta para visualizar ontologías y grafos en
formatos RDF y OWL, ofrece características de visualización,
filtros locales y globales, búsquedas de texto completo y
consultas en lenguaje RDQL, además permite visualizar Fuente:
http://semweb.salzburgresearch.at/ap
múltiples archivos RDF (Goyal & Westenthaler, 2004). ps/rdf-gravity/

24
Capítulo 3. Visualización de Linked Data mediante Grafos ______

Relfinder
Es una herramienta que permite extraer y visualizar las
relaciones entre objetos dados en RDF, y hace estas relaciones
explorables de manera interactiva (Visual Data Web, 2012).
Fuente:http://www.visualdataweb.org/
relfinder/relfinder.php

SemaSpace
Es un editor de grafos de gran escala diseñado para desplegar
y analizar redes semánticas. Crea grafos interactivos en dos y
tres dimensiones y trabaja con redes complejas, permitiendo
incorporar imágenes, sonidos y texto (Offenhuber & Fuente:
http://residence.aec.at/didi/FLweb/
Dirmoser, 2014).
SES
Sus siglas vienen de Semantic Enhancement Server y es un
índice basado en XML de alta velocidad que permite consultar
una ontología o taxonomía en tiempo real ofreciendo
Fuente:
componentes como mapas, búsqueda en facetas, http://www.smartlogic.com/home/prod
ucts/semaphore-modules/semantic-
visualización y contenido relacionado (Smartlogic, 2012). enhancement/ses-overview

SGVizler
Es una herramienta JavaScript que grafica el resultado de
consultas en lenguaje SPARQL a partir del resultado de los
mismos. Utiliza principalmente la visualización de google,
pero también utiliza otras visualizaciones para construir sus Fuente:http://dev.data2000.no/sgvizle
r/#Screenshots
gráficas y ofrece distintos diseños visuales (Skjæveland,
2012).

SNAP
Es una librería de análisis de grafos y minería de datos dentro
de los grafos, soporta estructuras de miles de millones de
datos, y es flexible y amigable al usuario (Leskovec, 2009).

25
Capítulo 3. Visualización de Linked Data mediante Grafos ______

SocNetV
Es una herramienta para el análisis y visualización de redes
sociales, permite construir redes o grafos matemáticos, en
pocos clics o bien, cargar redes en varios formatos y
modificarlos, además permite crear redes a partir de URLs
Fuente:
(Kalamaras, 2014). http://socnetv.sourceforge.net/

SoNIA
Es un paquete de visualización dinámica y redes
longitudinales mediante nodos y arcos y sus relaciones. Opera
como una plataforma de desarrollo, pruebas y comparaciones
entre distintas técnicas de diseño tanto estáticas como
Fuente:http://web.stanford.edu/group/
dinámicas (soNIA, 2014). sonia/

The Brain
Esta herramienta permite conectar conceptos con el fin de
organizar y visualizar la información que se tiene. Se creó
originalmente con la finalidad de organizar aspectos de la
empresa y personales, pero actualmente permite operar con
Fuente:http://www.thebrain.com/produ
cts/thebrain/know-more-mind-map/
grafos de más de un millón de elementos (TheBrain, 2014).

Treebolic
Es un aplicación de Java que permite representar datos
estructurados en forma de visualización hiperbólica de forma
dinámica e interactiva (Treebolic, 2014).
Fuente:http://treebolic.sourceforge.net
/
Tulip
Es un software de visualización y análisis de estructuras de
datos ya existentes, entre sus características permite
navegación en dos y tres dimensiones, soporta grafos
extensos, soporta modificación de grafos, maneja clústeres o
agrupación de nodos semejantes y propiedades compartidas
Fuente:http://tulip.labri.fr/publi_tulip/au
entre grafos y es de uso libre y código abierto (Auber, 2014). berChapterTulipGDSBook.pdf

26
Capítulo 3. Visualización de Linked Data mediante Grafos ______

Visual Browser
Es una aplicación de Java para visualizar archivos RDF en
forma de red de nodos en dos niveles de visualización: de
datos y de perspectiva del usuario y además permite
visualizar clases e instancias (Visual Browser, 2014) Fuente:http://nlp.fi.muni.cz/projekty/vi
sualbrowser/
Visuwords
Es un proyecto de código abierto que utiliza una herramienta
de visualización para mostrar las asociaciones entre palabras,
significados y conceptos existentes y relacionados con cada
palabra de entrada (Visuwords, 2014). Fuente: http://www.visuwords.com/

Vizster
Es un sistema de visualización dirigido a usuarios de servicios
de redes sociales para el descubrimiento de sus comunidades
en línea. Este sistema proporciona herramientas de búsqueda
y patrones de agrupamiento de fácil acceso (Heer & Boyd,
Fuente:http://vis.stanford.edu/jheer/pr
2005). ojects/vizster/images/community.png

VUE
Es un proyecto de código abierto desarrollado en la
Universidad de Tufts, Visual Understanding Environment se
enfoca en el manejo e integración de recursos digitales en
apoyo a la enseñanza, aprendizaje e investigación, además de
Fuente: http://vue.tufts.edu/
proveer un ambiente visual y flexible para la estructura y
presentación de la información digital (VUE, 2013).

Walrus
Es una herramienta de visualización de grafos dirigidos y
extensos de forma interactiva en espacio tridimensional en
diseño de grafo de expansión, aunque debido a su estructura,
a mayor información presenta menos efectividad de
Fuente:http://www.caida.org/tools/visu
contenido (CAIDA, 2013). alization/walrus/

27
Capítulo 3. Visualización de Linked Data mediante Grafos ______

Wikistalker
Es un visualizador gratuito que muestra la relevancia
semántica que existe en las relaciones entre diferentes
objetos a partir de su información contenida en Wikipedia
Fuente: http://sepans.com/wikistalker/
(Sepans & Rashin, 2014).

ZGRViewer
Es un visualizador de grafos en Java que utiliza lenguaje tipo
dot. Está diseñado para manejar grafos extensos y ofrece
interface al usuario ZUI, que permite un acercamiento suave y
una fácil navegación de la estructura, esta herramienta solo Fuente:http://zvtm.sourceforge.net/zgr
viewer.html
trabaja con archivos en formato dot (ZGRViewer, 2014).

28
Capítulo 3. Visualización de Linked Data mediante Grafos ______

3.2 Herramientas y sus Características


Se realizó una investigación general de las características de cada una de las
herramientas descritas en la Tabla 3.1, todas estas herramientas están vigentes
actualmente. Las características consideradas son las siguientes:

Herramienta: Refleja el nombre de la herramienta a describir.

Última versión: Para analizar la versión más completa de cada herramienta hasta
la fecha de su revisión, en el caso que se tenga esta información.

Fecha de actualización: Con el fin de conocer cuales herramientas han tenido


continuidad y mantenimiento, tanto la herramienta en sí como su sitio web oficial.

Punto de Entrada: Que permita acceder a los datos a través de una consulta o
palabra clave de entrada, con el fin de cargar la parte de la ontología deseada y no
extensas ontologías por completo. Puede ser en forma de texto (T), consulta de
SPARQL (S) o URI de entrada (U).

SPARQL endpoint: Si permite acceder a la información de forma progresiva por


medio del acceso a endpoints de SPARQL, en el caso que se tenga esta
información. Si no se da la información, se considera como que no cuenta con esta
característica.

Repositorio de código fuente: Si la herramienta se encuentra dentro de un


repositorio de software de acceso libre y gratuito2.

Código abierto: Si cuenta con la facilidad para modificar su código fuente.

Gratis: Señala si la herramienta o paquete se puede utilizar de manera gratuita.

2
Ver http://en.wikipedia.org/wiki/Comparison_of_open-source_software_hosting_facilities

29
Capítulo 3. Visualización de Linked Data mediante Grafos ______

Tabla 3.24 Comparación general de las herramientas de visualización

Herramientas de análisis y visualización de ontologías


Última Fecha de SPARQL R. Código Open
Herramienta P. de Entrada Gratis
Versión Actualización Endpoint Fuente Source
Allegrograph / Gruff 5.0 - T/U/S    
Cytoscape 3.2.0 -     
Fenfire 0.2 2008     
GINY - -     
Graphviz 2.31 -     
HyperGraph - -     
Hypertree - 2003     1
Iconvis 0.2.2 2013 T/S    
Igraph 0.7.1 2015     
IsaViz 2.1 2007     
JUNG 2.0.1 2010     
Linked Open Graph - 2014 T/U    
Linkurious - 2014 T/S 2    
LOD Demonstrator - - T/S    
Lodlive - 2012 T/U/S    
Mnemomap 0.3 2015 T    
Network Workbench 1.0.0 2009     
NetworkX 1.9.1 2014     
Ontograf 1.0.1 2010 T/S    
Oobian - 2010 T    

Otter - 2008     
OWL2Prefuse 1.2 2007     
RDF Gravity 1.0 2004 T/S 3    
Relfinder - 2012 T/U    
SemaSpace - -     
SES - - T    
SGVizler 0.6 2013 S    
SNAP 2.2 2014     
SocNetV 1.5 2014 T    
soNIA - -     
The Brain 8.0.1.4 2014     
Treebolic 2 -     

30
Capítulo 3. Visualización de Linked Data mediante Grafos ______

Tulip 4.6.1 2015     


Visual Browser 1.5 -     
Visuwords - - T    
Vizster (IDL) - 2014     
VUE 3.2.2 2013     
Walrus 0.6.3 2005     
Wikistalker - 2014 T    
ZGRViewer 0.9.0 2013     
 Si cuenta con / Si se encuentra en / Si es T Punto de Entrada tipo texto
 No cuenta con / No se encuentra en / No es S Punto de entrada tipo consulta de SPARQL
- No se tiene la información U Punto de entrada tipo URI
1
La librería de esta herramienta solo puede ser descargada en algunos países por cuestiones del
aviso legal.
2
El lenguaje de consulta que utiliza es Cypher.
3
El lenguaje de consulta que utiliza es RDQL.

3.3 Selección de herramientas

Dentro de este listado se encuentran tanto librerías como herramientas de


visualización, por lo cual en algunos casos la visualización parte de la unión de
dos o más herramientas, y en otros casos no. Inicialmente se ha definido un
listado de 40 herramientas y sus características generales, sin embargo
consideramos como candidatas a ser descartadas de la lista aquellas
herramientas cuya última fecha de actualización sea anterior al año 2008, en el
caso de que se conozca esta fecha. Además también consideramos como
candidatas a ser descartadas aquellas que no cumplan con la categoría de punto
de entrada, debido a que la gran cantidad de datos que se requiere manejar en el
caso de las visualizaciones de patrimonio cultural requieren de un filtrado inicial
que permita indicar un punto de partida tanto en visualización como en navegación
de contenido. Por último consideramos descartables aquellas herramientas que no
cuentan con la capacidad de conectar con la terminal de SPARQL endpoint de la
colección, porque esta característica es necesaria para acceder al contenido ya
publicado de diferentes bases de datos.

31
Capítulo 3. Visualización de Linked Data mediante Grafos ______

El listado de herramientas final, se muestra en la tabla 3.3 a continuación,


extraída de la tabla 3.2.

Tabla 3.35 Lista de herramientas de visualización a evaluar

Herramientas de análisis y visualización de ontologías


P. de Entrada SPARQL R. Código Open
Herramienta Endpoint Fuente Source
Gratis
T U S
Allegrograph       
Linked Open Graph       
LOD Demonstrator       
Lodlive       
Relfinder       

A continuación se describen las herramientas seleccionadas en la tabla 3.3, con el


objetivo de familiarizarnos con ellas antes de realizar la prueba de concepto. La
descripción fue recolectada del sitio oficial de cada una de ellas.

Allegrograph / Gruff

Esta herramienta ofrece eficiencia en cuanto al uso de memoria y un alto


desempeño. Ofrece además características de seguridad y confiabilidad para el
usuario, como recuperación de información, respaldo y replicación. Con respecto a
la visualización de grafos (ver fig. 3.2), ofrece el manejo de grandes cantidades de
datos, distinción entre arcos y nodos, y la capacidad de hacer consultas a estos
por medio de lenguaje SPARQL. Ofrece un despliegue de grafo en expansión,
acercamiento geográfico y es atractiva visualmente por sus colores.

Linked Open Graph

LOG tiene la capacidad de soportar una amplia cantidad de datos, incluso de


diversos endpoints. Despliega la información en forma de grafo de expansión con
movimiento y permite recorrer de un recurso a otro a partir de cada expansión.
Soporta el uso de imágenes y enlaces dentro de los nodos y es una herramienta
de fácil aprendizaje (ver fig. 3.3).

32
Capítulo 3. Visualización de Linked Data mediante Grafos ______

Figura 3.25 Interface de visualización de Allegrograph


Nota: Fuente: http://franz.com/agraph/gruff

Figura 3.36 Interface de visualización de Linked Open Graph


Nota: Fuente: http://log.disit.org/service/

33
Capítulo 3. Visualización de Linked Data mediante Grafos ______

Linked Open Data Demonstrator

Esta herramienta ofrece utilidad a la empresa, ya que cuenta con servicios de


administración de conocimiento, wiki semántico, herramientas de mejora de
eficiencia y automatización y herramientas que permiten estandarizar procesos y
hacerlos más eficientes, integración de datos y administración de metadatos. En
las características de visualización (ver fig. 3.4), trabaja con grafos de gran escala,
permite exploración y navegación a través de los datos y permite también hacer
consultas a la información en lenguaje SPARQL. La versión de paga ofrece
respaldo de la información y despliegue en forma de grafo de árbol hiperbólico,
radial, dirigido, de expansión, de clases y en forma de ontología.

Figura 3.47 Interface de visualización de Linked Open Data Demonstrator


Nota: Fuente: Morato, J. Sánchez, S. Ruiz, A. & Moreiro, J. (2014). Visualización y
recuperación de información en la web semántica Profesional De La Información, 23(3),
319-329. doi:10.3145/epi.2014.may.12.

Lodlive

Es una plataforma en línea que ofrece representación efectiva de grafos de datos


de gran escala en forma de expansión (ver fig. 3.5) y capacidades de búsqueda de
recursos. Ofrece navegación entre estos recursos basada en el uso de endpoints
de SPARQL y permite también interconectar entre endpoints de distintas fuentes.

34
Capítulo 3. Visualización de Linked Data mediante Grafos ______

Ofrece distinción entre arcos y nodos, agrupación de recursos, capacidad de


expandir y reducir niveles de recursos, visualización de imágenes y también
análisis detallado de información en el panel lateral.

Figura 3.58 Interface de visualización de Lodlive


Nota: Fuente: http://blog.lodlive.it/presentazione-del-progetto/

Relfinder

Esta herramienta permite visualizar extractos de archivos RDF y los presenta de


manera que puedan ser explorados interactivamente. La visualización es en forma
de expansión con movimiento de los nodos y ofrece características de agrupación
y filtrado a nivel global y detallado (ver fig. 3.6), así como también reacomodo de
los nodos según la preferencia del usuario. Ofrece información detallada en la
parte lateral del visualizador y acceso a los recursos por medio de consultas en
SPARQL. La herramienta es de fácil aprendizaje y soporta grafos de gran escala.

35
Capítulo 3. Visualización de Linked Data mediante Grafos ______

Figura 3.69 Interface de visualización de Relfinder


Fuente: http://www.visualdataweb.org/relfinder/relfinder.php

3.4 Metodología de Evaluación

En la tabla 3.4 se propone una guía de evaluación, adaptada de un conjunto de


características tomadas de dos fuentes, (Morato et. al., 2014) y (Dadzie & Rowe,
2011). Originalmente, ambos autores enfocaron su respectiva guía al consumo de
Linked data con criterios de usabilidad y visualización, sin embargo, para fines de
esta investigación se propone una combinación de criterios relevantes para Linked
Data enfocados al consumo de recursos de Patrimonio Cultural en forma
específica.

Por su parte, Morato, Sanchez, Ruiz, y Moreiro realizan una investigación sobre el
funcionamiento de los motores de búsqueda para la web semántica y como la
visualización gráfica mejora la recuperación de información, en base a elementos
de interactividad, filtrado y consultas. Mientras que Dadzie y Row investigan las
características de las herramientas de visualización como solución a la falta de
conocimiento técnico sobre tecnología semántica y consumo de Linked Data.

36
Capítulo 3. Visualización de Linked Data mediante Grafos ______

Tabla 3.46 Guía propuesta para la visualización de Linked Data

Visualización de Linked data


Prioridad alta Referencia
Ofrece búsquedas intuitivas para usuarios promedio,
(Dadzie &
Apoyo para la consulta utilizando lenguaje fácil de entender y características
Rowe, 2011)
que faciliten la selección de conceptos a visualizar*.
Permite expandir la búsqueda por medio de conceptos
Búsqueda con expansión a (Morato et. al.,
relacionados con un recurso específico obtenido a
relacionados 2014)
partir del resultado anterior*.
Permite hacer búsquedas intuitivas en Linked data (Dadzie &
Búsqueda por facetas
multidimensional y revela interrelaciones ocultas. Rowe, 2011)
Da la oportunidad de elegir el recurso deseado a partir
Desambiguación de (Morato et. al.,
de una lista de conceptos homólogos con el fin de
homónimos* 2014)
distinguir entre diferentes contextos*.
Combinado con otras vistas generales, permite al
(Dadzie &
Detalle sobre demanda usuario enfocarse a detalle en el recurso de interés, con
Rowe, 2011)
el fin de profundizar en el análisis de los datos.
(Dadzie &
Escalabilidad Permite manejar grandes cantidades de datos.
Rowe, 2011)
(Dadzie &
Resalta el recurso de interés suprimiendo información
Rowe, 2011)
Filtrado menos relevante. Además por medio de filtros visuales
(Morato et. al.,
y dinámicos provee un método intuitivo de consulta.
2014)
Revisa y retrae caminos, regresa a puntos específicos
(Dadzie &
Historia durante la navegación visual, recupera análisis previos,
Rowe, 2011)
deshace acciones previas.
Permite mostrar los nodos y las propiedades entre ellos (Morato et. al.,
Multilingüismo
en el lenguaje deseado*. 2014)
Soportar la conexión a múltiples SPARQL Endpoints a la
Múltiples Endpoints
vez para enriquecer los resultados de las consultas.
Uso de representaciones pictográficas, gráficas,
imágenes y otras características que exploten la
(Dadzie &
Presentación visual percepción humana para mejorar el entendimiento de
Rowe, 2011)
contenido y mejorar el análisis y descubrimiento
intuitivo.
Para facilitar la búsqueda por parte del usuario final,
Entrada tipo texto donde el público está representado por usuarios no
expertos.
Prioridad media Referencia
Acceso a documentos Entrega en un formato especifico el resultado de las (Morato et. al.,
resultantes búsquedas*. 2014)
Enlaza datos relacionados y combina atributos comunes (Dadzie &
Combinación de datos
para proveer una vista integrada a través de los datos. Rowe, 2011)

37
Capítulo 3. Visualización de Linked Data mediante Grafos ______

Estructuras que muestran los atributos de los datos o


características de representaciones visuales estándar, (Dadzie &
Plantillas de presentación
por ejemplo, foaf:Person mostrado como apellido, Rowe, 2011)
nombre acompañado de una fotografía o imagen.
Representación de nodos con mayor importancia (de
(Dadzie &
acuerdo a la configuración del usuario) en el peso del
Rowe, 2011)
Ranking de resultados* arco. Una especie de filtrado, pero sin eliminar los
(Morato et. al.,
nodos menos relevantes para la búsqueda específica de
2014)
cada usuario.
Prioridad baja Referencia
Búsqueda por varios Iniciar la consulta a partir de más de un solo objeto a la (Morato et. al.,
conceptos concurrentes vez*. 2014)
Verifica que la procedencia de los datos sea confiable
(Dadzie &
Confianza y Procedencia para asegurar las medidas de incertidumbre, fiabilidad
Rowe, 2011)
y calidad.
Descarga de tripletas Permite copiar o descargar el resultado de las consultas (Morato et. al.,
resultantes en forma de tripletas o sentencias*. 2014)
Vista global, de alto nivel sobre los datos, útil para (Dadzie &
Visión General de datos
obtener una vista general de la estructura de datos. Rowe, 2011)
*término o definición adaptada

3.5 Aspectos más relevantes para Patrimonio Cultural

Patrimonio cultural representa las colecciones de preservación de la historia


dirigidas a una comunidad, general o específica, que pueden estar conformadas
por libros, objetos, archivos, mapas, videos, audios, etc. y todos ellos tienen la
capacidad de ser representados de forma física y digital (ver ejemplo en la figura
3.7). Ambas representaciones requieren del uso de metadatos que facilitan su
catalogación y dependiendo de la naturaleza del recurso pueden ser
representados por esquemas como DC (obras literarias), BIBFRAME (datos
bibliográficos), MDA y CIMI (museos), RDF (descripción de recursos), EDM
(objetos culturales) y otros.

38
Capítulo 3. Visualización de Linked Data mediante Grafos ______

Figura 3.710Representación del recurso de patrimonio cultural “National Flag of


México” de la colección de Europeana

Los criterios se obtuvieron de distintos autores y fueron priorizados de acuerdo a


las características de patrimonio cultural que ofrecen las colecciones y la
naturaleza de los objetos que las constituyen. Esta metodología aplica a las
herramientas de visualización, presentadas aquí o no, para cualquier colección de
Patrimonio Cultural. Debido al constante surgimiento de nuevas herramientas de
consumo de linked data es imposible integrar en esta investigación a todas ellas,
sin embargo estas pueden ser sometidas a la misma metodología en cualquier
momento si se requieren ser evaluadas. La selección de criterios se hizo de
manera objetiva siguiendo el mismo procedimiento de los artículos citados.

De la guía original de Morato, Sanchez, Ruíz y Moreiro se eliminó un criterio que


no aplica en este caso:

39
Capítulo 3. Visualización de Linked Data mediante Grafos ______

Visualización de la consulta SPARQL. Esto es debido a que en este


punto de la clasificación de herramientas, todas visualizan el resultado de la
consulta.

Y de la guía original de Dadzie y Rowe se eliminaron los siguientes criterios que


no aplican:

Punto de entrada. Porque este criterio forma parte de la evaluación previa


de las herramientas y todas aquellas que clasificaron cuentan ya con esta
característica.

No dominio específico. Se refiere a complementar las herramientas con


buscadores genéricos que permitan encaminar poco a poco al usuario de
resultados más generales en el Linked data disponible hacia resultados más
sofisticados en herramientas más complejas. Pero en el caso de la
visualización deseada no se necesita explorar linked data ajeno antes de
encontrar los recursos internos, sino que se requiere un enfoque en la
colección elegida aun cuando la información sea complementada con
fuentes externas.

Publicación / Sindicación. Este criterio representa una forma de apoyar al


usuario para publicar los datos en la nube de Linked Open Data. Sin
embargo, no se pretende que el usuario de la herramienta conozca y/o
manipule los archivos a visualizar.

Edición de datos. Este criterio permite a los usuarios finales enriquecer


datos existentes con nuevas anotaciones y metadatos y corregir errores.
Pero nuevamente, estos usuarios no necesariamente conocen la estructura
de la información ni los metadatos relacionados, y por otra parte, no se
desea que puedan editar la información.

De los criterios que si fueron tomados en cuenta en la tabla 3.4, se formaron tres
clasificaciones, de acuerdo con la importancia de estos en el consumo de

40
Capítulo 3. Visualización de Linked Data mediante Grafos ______

patrimonio cultural. La primera clasificación representa los criterios de mayor


prioridad, la segunda clasificación representa los criterios de prioridad media y por
último los criterios de prioridad baja. Esta clasificación también se puede observar
en la tabla 3.4.

En la clasificación de “mayor prioridad” se ubicaron los criterios que mejoran la


experiencia del usuario al que están dirigidas las colecciones de patrimonio
cultural. En esta clasificación se encuentran los criterios de:

Multilingüismo, que ofrece el contenido en el idioma seleccionado por el


usuario y permite mayor cobertura en el público interesado.

Escalabilidad, para manejar grandes cantidades de datos.

La capacidad de mostrar imágenes o mapas contenidos en la colección, lo


que mejora notablemente la visualización y comprensión de contenido.

Detalle sobre demanda, que muestra información detallada del recurso de


interés para complementar la información que ya se tiene y que puede
contener enlaces a páginas web relevantes para el recurso.

Es importante que la experiencia de encontrar un recurso sea sencilla, por


lo cual se considera de mayor prioridad que ofrezca apoyo para llevar a
cabo las consultas ante usuarios que no conocen la estructura de la
información (criterio adaptado) y así facilitarles la consulta de recursos.

Desambiguación de homónimos, para las colecciones que son muy


amplias y pueden contar con el problema de incluir palabras con distinto
significado (criterio adaptado).

Por último también se consideran las características de filtrado,


expansión, muestra de resultados intuitivos y memoria de caminos
recorridos en la colección, como características que mejoran y facilitan la
visualización y navegación, al mismo tiempo.

41
Capítulo 3. Visualización de Linked Data mediante Grafos ______

Además se consideraron dos criterios adicionales a las referencias, que también


son de alta prioridad en el consumo propuesto.

Primeramente soportar la conexión a múltiples endpoints a la vez, para


enriquecer los resultados de las consultas y en segundo lugar entrada tipo
texto, para facilitar la búsqueda de recursos ante los usuarios generales de
este tipo de colecciones.

Se consideran como “prioridad media” los criterios de:

Acceso a documentos resultantes, por ser una característica no


indispensable pero que puede ser útil de acuerdo a las necesidades del
usuario final.

Plantillas de presentación, porque aunque es una característica que


mejora la visualización, la representación por nodos y arcos es la principal
plantilla que se desea exponer en este tipo de colecciones. Esta puede ser
útil en colecciones de información social o publicitaria.

Ranking de resultados, por ser una variación de la característica de


filtrado que puede o no ser útil dependiendo del objetivo del usuario, ya que
se puede suponer que el usuario ya cuenta con la capacidad de filtrar los
resultados que considera poco relevantes.

Y, combinación de datos, porque el hecho de agrupar las propiedades


semejantes no representa gran diferencia en el grafo, aunque si permite
visualizar de manera más rápida las diferentes propiedades del recurso.

Los criterios de baja prioridad son:

Visión general de los datos, porque la visualización es enfocada en el


recurso de interés y sus relacionados, y no enfocada en la colección
completa.

42
Capítulo 3. Visualización de Linked Data mediante Grafos ______

Verificación de la procedencia de los datos, ya que se pretende utilizar


contenido ya verificado y no editable por el usuario.

Búsqueda por conceptos concurrentes, porque de acuerdo a la


estructura de los datos, resulta poco relevante iniciar la búsqueda con más
de un recurso a la vez.

Y, descarga de tripletas resultantes, porque el usuario no esta


necesariamente relacionado con este formato de información.

La nueva guía será utilizada para evaluar de forma cualitativa (sí/no) el uso de las
herramientas seleccionadas, auxiliada con cifras cuantitativas que brinden peso a
la evaluación cualitativa.

43
Capítulo 4. Caso de Estudio _

Capítulo 4. Caso de Estudio

Caso de Estudio

Para llevar a cabo el caso de estudio se requiere realizar pruebas con cada
herramienta seleccionada utilizando una colección real de patrimonio cultural. Una
de las colecciones más amplias es Europeana, y está construida bajo esquemas
de web semántica y linked open data, sin embargo la construcción de la
información de acuerdo a las clases y formatos especificados en el modelo de
datos no coincide estrictamente con el registro real de información de Europeana.

Inicialmente se formuló una guía como referencia para acotar los datos que se
requiere consultar de Europeana (ver Apéndice A) y se intentó extraer información
del endpoint de esta plataforma, para de esta manera evitar trabajar con el dataset
completo del proyecto, que es muy extenso para los fines deseados. Los
resultados fueron limitados y no completamente satisfactorios, principalmente
porque el formato de los datos no es consistente para todos los recursos
consultados, como puede verse en el Apéndice B de este documento, y en
segundo lugar porque algunas instancias no reflejan el modelo de clases
propuesto en la documentación de Europeana. La figura 4.1 muestra uno de los
resultados de la visualización de la información extraída, que refleja las
limitaciones de estos resultados (estas se describen a detalle en el Apéndice B), la
figura se construyó con un software de creación de grafos conocido como d3plus.

Existe un conjunto de colecciones de patrimonio cultural que pertenece al Instituto


Tecnológico de Estudios Superiores de Monterrey, la cual se compone desde
libros, fotografías, mapas, documentos y microfilmaciones, hasta piezas
arqueológicas y hierros coloniales pertenecientes a la institución. Estas
colecciones se han recibido desde la fundación del Tecnológico de Monterrey en
1943 por donaciones, y se han consolidado como el fondo cultural patrimonial, que

44
Capítulo 4. Caso de Estudio _

está ubicado en distintos puntos dentro del Tecnológico de Monterrey (Patrimonio


Cultural Tecnológico de Monterrey, 2009).

Figura 4.11Visualización de la Información extraída de Europeana

Entre otras colecciones que representan el patrimonio cultural del Tecnológico de


Monterrey se encuentran dos colecciones que ya han sido transformadas a
esquema de Linked data, conocidas como Hierros de la Conquista y Fototeca
respectivamente, más pequeñas que Europeana y que si pueden ser utilizadas
para llevar a cabo las pruebas que requiere la investigación. La primera de ellas
está conformada por 358 piezas de los siglos XVI al XVIII, mientras que la
segunda está conformada por un conjunto de alrededor de 7,600 fotografías
digitales (y continúa creciendo) que conforman seis colecciones distintas. Ambas
colecciones son de licencia abierta, convertidas a esquemas RDF y además las
dos colecciones cuentan con ligas hacia fuentes de información complementaria.

Actualmente el contenido total de las distintas colecciones se encuentra en


proceso de integración y publicación de contenido, el cual se expone en el
diagrama de la figura 4.2, ésta representa la conversión de las colecciones de
patrimonio cultural del Tecnológico de Monterrey a aplicaciones semánticas. Este
proceso está divido en tres capas (de izquierda a derecha): infraestructura

45
Capítulo 4. Caso de Estudio _

relacional, infraestructura semántica y la capa de aplicación. En color blanco se


resaltan las etapas que ya han sido completadas. En la primera capa se
encuentran las colecciones de Fototeca y Hierros de la Conquista, mencionadas
anteriormente, y se considera adicionalmente una instancia de DSpace para alojar
los objetos digitales de otras colecciones. La segunda capa describe la tecnología
semántica que se usará para integrar la información de las distintas fuentes en una
plataforma para bases de datos conocida como Marmotta, que permite publicar
los registros de Linked Data y construir aplicaciones en base a ellos (Marmotta,
2015). En la capa de aplicación se encuentra la función de visualización de datos,
esta aplicación facilita la forma de acceder y comprender la información
presentada y contenida en la fuente de datos, de manera que se pueda conocer el
contenido de las colecciones sin necesidad de conocer la estructura de la
información. También se pretende ofrecer la consulta a los datos y reconocimiento
de patrones, como aplicaciones futuras basadas en capacidades semánticas.

Figura 4.212Integración y publicación de las colecciones de patrimonio cultural del


Tecnológico de Monterrey

46
Capítulo 4. Caso de Estudio _

En la figura 4.3 se puede ver un extracto de la colección de Hieros de la Conquista


en forma de grafo, donde se muestran las clases y propiedades correspondientes
a uno de los hierros (HC-002) y en el Apéndice C se muestra el mismo diagrama
en mayor escala. Es importante resaltar que en esta figura se puede notar que la
descripción de los recursos incluye vocabularios tanto de Dublin Core como de
Europeana Data Model (EDM), y además cada recurso incluye varias ligas hacia
fuentes externas de información, que en este caso son DBpedia, para conceptos
clave como “Tecnológico de Monterrey” o “Llave”, y GeoNames para localización
geográfica como “Monterrey”.

Figura 4.313Extracto de la colección de Hierros de la Conquista correspondiente al


Hierro HC-002

Esta imagen representa la transformación de la capa de infraestructura relacional


hacia la capa de infraestructura semántica del diagrama anterior, y una vez en
esquema de RDF se integra al contenido de Marmotta (ver fig. 4.4).

47
Capítulo 4. Caso de Estudio _

Figura 4.414Colección de hierros de la conquista contenida en Marmotta

Una vez que la información de las colecciones ya se encuentra montada en


Marmotta, puede ser explotada por medio de la construcción de aplicaciones
semánticas, entre otras, la visualización de los recursos, que puede ser construida
con ayuda de las herramientas de visualización de grafos del Capítulo 3.

Por otra parte, se muestra el extracto en forma de grafo de la colección de


Fototeca (ver fig. 4.5), al igual que en la colección de Hierros de la Conquista, se
puede ver como se enriqueció el contenido con clases y propiedades de Dublin
Core y EDM, y también con enlaces a DBpedia y GeoNames. Para ver el grafo a
mayor escala consultar Apéndice D.

48
Capítulo 4. Caso de Estudio _

Figura 4.515Extracto de la colección de Fototeca correspondiente a la Foto


120621_104453

En la sección de construcción de las aplicaciones se pretende ofrecer


herramientas que puedan ser utilizadas por usuarios finales con la intención de
exponer de manera digital los recursos culturales con los que cuenta el
Tecnológico de Monterrey, ya que estos recursos ofrecen contenido de gran
riqueza para distintas disciplinas, sin embargo no son explotados como podrían,
por cuestiones de falta de difusión hacia el público en general y otras. La
aplicación a ofrecer se pretende este construida bajo los estándares de Linked
Data y sea adaptable a las diferentes variedades de patrimonio cultural, además
de que sea una herramienta fácil de navegar, fácil de utilizar e intuitiva. La
herramienta debe soportar ontologías de gran escala, ya que las colecciones de
patrimonio cultural, además de ser muy extensas, crecen constantemente. Otras
características que pueden ser de utilidad son que soporte imágenes y mapas, y
enlaces a fuentes de información externa.

49
Capítulo 4. Caso de Estudio _

4.1 Resultados

De las cinco herramientas elegidas en el capítulo 3 (ver tabla 3.3), se llevo a cabo
una visualización del contenido de las colecciones de Patrimonio Cultural del
Tecnológico de Monterrey en cuatro de ellas. Linked Open Data Demonstrator no
se probó ya que, a diferencia de las demás, su uso no es gratuito y la evaluación
se limita al uso de herramientas de acceso libre.

A continuación se muestran los resultados de cada una de las herramientas,


cuando se utilizan para visualizar la colección de Hierros de la Conquista.

4.1.1 Allegrograph

Primeramente se tiene la visualización utilizando AllegroGraph/Gruff. Esta


herramienta es descargable de forma gratuita, aunque fue necesario solicitar una
contraseña al creador para poder utilizar las características de enlace que requería
la visualización de la colección de Hierros de la Conquista por medio de su
SPARQL endpoint (ver fig. 4.6).

Figura 4.616Configuración del Endpoint de HC en Allegrograph

La palabra de entrada es de tipo texto, para usuarios generales, y tipo URI o


SPARQL para usuarios más avanzados (apoyo para la consulta), y permite la
desambiguación de palabras en la búsqueda inicial. La búsqueda es de sólo un

50
Capítulo 4. Caso de Estudio _

recurso a la vez por medio de la opción <Display a Node>, pero se pueden buscar
tantos recursos como se desea. El menú de opciones que ofrece es muy amplio, lo
que hace la herramienta más difícil de utilizar, mientras que la visualización es en
forma de grafo de expansión, simple, no utiliza imágenes pero agrupa las
instancias por colores, de acuerdo a la clase y hace distinción entre las
propiedades por el color del arco (ver figura 4.7), aunque en este no refleja el peso
de la relación.

Figura 4.717Representación de nodos y arcos por Allegrograph

Esta herramienta no revela resultados de forma intuitiva ni interrelaciones ocultas,


ya que la visualización es una representación de la información del dataset tal
como es. El grafo que se va construyendo puede resultar difícil de entender,
debido a la estructura de la información, ya que las propiedades se relacionan
entre nodos y no entre sus etiquetas, las cuales pueden resultar más claras que
las instancias en sí en algunos casos, como “Monterrey” que corresponde a la
etiqueta de la instancia “3995465”, a la cual apuntan otros recursos (ver fig. 4.8),
para manejarlo, se requiere expandir las etiquetas de manera manual para cada
nodo.

51
Capítulo 4. Caso de Estudio _

Figura 4.818Estructura de nodos y etiquetas en Allegrograph/Gruff

La expansión de los nodos puede ser por las propiedades de salida y de entrada
por igual, la opción se encuentra dentro del menú contextual, lo que facilita
navegar entre los recursos (búsqueda con expansión a relacionados) y aunque
soporta grandes cantidades de datos, cuando la expansión de nodos es grande, la
herramienta puede tardar en responder a la petición e incluso, el grafo se vuelve
complejo (ver fig. 4.9).

Figura 4.919Visualización del grafo completo en Allegrograph/Gruff

52
Capítulo 4. Caso de Estudio _

En este caso es recomendable agrupar la cantidad de recursos (hierros) en


subconjuntos más pequeños, ya sea con ayuda de la herramienta o bien,
directamente en el dataset con relaciones entre ellos (edm:isDerivativeOf,
edm:isRepresentationOf, dcterms:isPartOf), que mejoren la experiencia de
búsqueda y eviten excesos en el tiempo de espera. Además con la opción <Select
Current Predicates> del menú <Global Options> se puede elegir que propiedades
mostrar o no, para filtrar los resultados.
También ofrece una vista de información detallada por cada nodo del diagrama
(detalle sobre demanda) como se muestra en la fig. 4.10 y una ventana de vista
general del diagrama completo en miniatura (ver fig. 4.11).

Figura 4.1020Detalle sobre demanda de un recurso en Allegrograph/Gruff

En general la herramienta está muy completa, pero es muy manual, poco dinámica
y poco atractiva para visualizar contenido de patrimonio cultural, debido a la falta
de presentación visual, no muestra imágenes ni mapas en el contenido del grafo.
La ventaja es que ofrece su código fuente de manera abierta.

53
Capítulo 4. Caso de Estudio _

Figura 4.1121Ventana de vista general del grafo con Allegrograph/Gruff

4.1.2 LOG: Linked Open Graph

En segundo lugar, se tiene la visualización utilizando Linked Open Graph, la cual


se puede observar en la figura 4.12. Esta herramienta permitió cargar el dataset de
Hierros de la Conquista de manera directa, sin necesidad de solicitar permiso, ya
que es libre y soporta el enlace con múltiples endpoints a la vez.

Para iniciar a utilizar LOG es necesario un URI de entrada o bien, iniciar la


búsqueda a partir de una palabra clave (apoyo para la consulta), el cual genera
internamente una consulta SPARQL que a su vez construye la visualización inicial
centrada en el recurso de entrada, y puede haber tantas entradas como lo desee
el usuario (aun cuando no haya relación entre ellas).

54
Capítulo 4. Caso de Estudio _

Figura 4.1222Visualización de Patrimonio Cultural del Tecnológico de Monterrey


utilizando LOG

El grafo que se muestra es un grafo dirigido, que no refleja el peso de la relación


en los arcos, lo cual limita en parte la navegación de un nodo a otro, ya que solo
se puede expandir a relacionados mediante las relaciones de salida y no de
entrada (ver fig. 4.13), por lo que es preferente contar con las relaciones inversas
posibles en el dataset original.

Figura 4.1323Expansión de nodos de salida en LOG

55
Capítulo 4. Caso de Estudio _

LOG permite la visualización de imágenes en su estructura. La primera forma de


visualizarlas es por medio de instancias que contengan la liga hacia las imágenes,
en el menú contextual del recurso eligiendo la opción “Open” (ver fig. 4.14).

Figura 4.1424Visualización de imágenes usando el menú contextual de LOG

Además el mismo menú ofrece la opción de expandir o retraer las propiedades con
“Details” (expansión a relacionados), las cuales se complementan con datasets de
otras fuentes, la opción de iniciar una nueva visualización enfocada en el recurso
deseado con “Focus” y la capacidad de mostrar el detalle de la instancia con “Info”
(detalle sobre demanda) que incluye la consulta de SPARQL con la que se obtuvo
el resultado mostrado (fig. 4.15).

La segunda forma de visualizar imágenes es dentro del nodo, agregando la


propiedad foaf:depiction de la ontología friend of a friend en el dataset original (ver
fig. 4.16).

56
Capítulo 4. Caso de Estudio _

Figura 4.1525Detalle sobre demanda de un recurso en LOG

Figura 4.1626Visualización de imágenes con la propiedad depiction en LOG

57
Capítulo 4. Caso de Estudio _

LOG es una herramienta que soporta grafos de gran escala, ya que tiene la
facilidad de mostrar u ocultar (filtrar) las propiedades que se desean. Los círculos
en verde son las propiedades no expandidas y los círculos en rojo representan a
las propiedades expandidas. La herramienta no tiene características de historia en
sí, pero cuenta con la opción de regresar el grafo hacía la forma anterior, tantas
veces como se requiera.

Una de las ventajas de la herramienta es que ofrece al usuario un código con el


cual se puede insertar la visualización en forma de marco en páginas web (ver fig.
4.17), que muestra la consulta inicial y permite seguir expandiendo el grafo,
aunque no ofrece acceso a otro tipo de resultados (documentos/tripletas).

En general la herramienta es atractiva y fácil de utilizar, aunque no ofrece su


código fuente de manera abierta.

Figura 4.1727Vista previa de la visualización con LOG

LOG no es capaz de hacer búsquedas intuitivas por sí mismo, ni ofrece la facilidad


de mostrar los resultados en distintos idiomas, tampoco agrupa las propiedades
semejantes, por lo que cada nodo de un distinto idioma aparece como un nuevo
círculo en el diagrama.

58
Capítulo 4. Caso de Estudio _

4.1.3 LodLive

En tercer lugar por orden alfabético se tiene LodLive, en esta herramienta se


contactó al creador para configurar el endpoint de Patrimonio Cultural del
Tecnológico de Monterrey (ver figura 4.18).

Figura 4.1828Contenido del Tecnológico de Monterrey que ofrece LodLive

Para empezar a visualizar la colección se elige solamente el recurso con el que se


desea iniciar, ya sea por medio de su URI, por palabra clave, o bien, por medio de
texto (apoyo para la consulta) y ofrece opciones para distinguir entre conceptos
diferentes (desambiguación de homónimos). La visualización se presenta en forma
de un grafo dirigido sin peso en los arcos y los nodos se exponen en diferentes
colores, aunque estos colores no representan agrupaciones, clases ni tienen otro
tipo de significado. La estructura del grafo le permite expandirse manualmente
entre los nodos resultantes para navegar entre la colección, la expansión se logra
dando clic a los puntos que rodean el nodo de interés, y la expansión es tanto para

59
Capítulo 4. Caso de Estudio _

relaciones de salida (puntos rellenos) como de entrada (puntos vacíos) (ver fig.
4.19) lo que enriquece la información que rodea a un nodo.

En la parte superior de cada nodo hay un pequeño menú que permite eliminar el
nodo de la visualización (no de la colección), expandir automáticamente todos los
nodos relacionados con el nodo de interés, abrir la liga de éste mismo, y también
redibujar el grafo enfocándose en el recurso deseado.

Figura 4.1929Expansión a relacionados de salida y entrada con LodLive

Enseguida de este menú se encuentra una opción que muestra información


detallada del recurso en un panel que se sobrepone a en la parte derecha del
grafo (detalle sobre demanda) (ver figura 4.20).

Figura 4.2030Detalle sobre demanda de un recurso con LodLive

60
Capítulo 4. Caso de Estudio _

Mientras se expanden los nodos se puede elegir su posición en el espacio, ya que


por sí solos estos pueden llegar a sobreponerse en otros nodos, lo cual reduce la
comprensión visual y puede hacer que el grafo sea poco manejable cuando se
visualiza gran cantidad de recursos a la vez. Además los mapas e imágenes que
muestra la herramienta mientras se está utilizando también pueden llegar a ocultar
parte del grafo, sin embargo, benefician a la visualización ya que explotan el
contenido de la colección (ver figura 4.21 y 4.22).

Figura 4.2131Visualización de imágenes con LodLive

Figura 4.2232Visualización de mapas con LodLive

61
Capítulo 4. Caso de Estudio _

La ventaja de esta herramienta es que su código fuente es abierto y en general, es


atractiva visualmente y fácil de utilizar, pero aunque es capaz de manejar grafos
extensos, presenta problemas en tiempo al tratar de expandir muchos nodos a la
vez, lo cual se puede prever agrupando los recursos en subconjuntos relacionados
entre sí. Una vista general de la herramienta se muestra en la figura 4.23.

Figura 4.2333Visualización de Patrimonio Cultural del Tecnológico de Monterrey


utilizando LodLive

Esta herramienta no ofrece resultados al usuario ni búsquedas intuitivas, tampoco


ofrece características de historia de la navegación.

4.1.4 Relfinder

Por último se tiene Relfinder (ver fig. 4.24), que es una herramienta utilizada
principalmente para encontrar relaciones entre recursos, más que para explorar
recursos en sí. Por una parte, la herramienta no permite navegar entre las
colecciones para descubrir otros recursos a partir de uno, sin embargo, es muy útil

62
Capítulo 4. Caso de Estudio _

para encontrar información como distribución del material del que esta hecho el
recurso, recursos con materiales o nombres en común, fotografías de la misma
época, recursos ubicados en el mismo lugar, etc.

Figura 4.2434Visualización de Patrimonio Cultural del Tecnológico de Monterrey con


Relfinder

Relfinder permite elegir un endpoint de entrada o configurar un endpoint propio


(ver fig. 4.25).

Figura 4.2535Panel de elección o creación del endpoint a utilizar

63
Capítulo 4. Caso de Estudio _

La configuración del endpoint de Hierros de la conquista se muestra en la figura


4.26.

Figura 4.2636Configuraciones del endpoint de HC con Relfinder

64
Capítulo 4. Caso de Estudio _

La entrada del visualizador es una palabra clave dentro del dataset configurado,
por ejemplo, Llave para la colección de Hierros de la Conquista. Una de las
ventajas de la herramienta es que muestra una lista de opciones a partir de la
palabra de entrada, lo cual permite elegir solo los recursos existentes en la
colección (ver fig. 4.27).

El grafo de Relfinder es un grafo de expansión simple con movimiento, sin color ni


imágenes adicionales a la etiqueta principal, aunque si cuenta con un panel lateral
el cual ofrece los enlaces con paginas externas que complementan la información
del recurso deseado (los enlaces deben estar contenidos en el dataset) y muestra
también la foto del recurso, siempre y cuando esta se encuentre anotada con la
propiedad foaf:depiction (ver fig. 4.28).

Figura 4.2737Opciones de entrada para una palabra clave con Relfinder

Figura 4.2838Visualización de imágenes usando depiction con Relfinder

65
Capítulo 4. Caso de Estudio _

Los arcos no reflejan el peso de la relación pero sí la dirección de la propiedad.


Además Relfinder es capaz de resaltar en rojo las relaciones entre dos conceptos
dentro del grafo para enfocarse en ciertas relaciones ante otras.

Otra ventaja de la herramienta es que te permite seleccionar las propiedades,


clases o relaciones que se desean o no ver, en el panel izquierdo de la ventana,
lo cual refina el resultado visualizado (ver fig. 4.29).

Figura 4.2939Panel de filtrado de clases y propiedades en Relfinder

El número de recursos a relacionar depende del usuario y el numero de recursos


que conforman el camino de una relación es 2, (se puede ajustar en la
configuración inicial, pero a partir de 3 el grafo resultante ya es muy extenso y
difícil de comprender), aunque ofrece características de resaltado y filtrado de
nodos que pueden llegar a facilitar el análisis de la información.

Relfinder es una herramienta de código abierto, por lo cual puede ser adaptada de
acuerdo a lo requerido y además ofrece la facilidad de integrarla en el proyecto
particular del Tecnológico de Monterrey, sin necesidad de compilar código, el
procedimiento para lograrlo se encuentra en el sitio web oficial de la herramienta3.

3
Integración de Relfinder: http://www.visua ldataweb.org/integrating.php

66
Capítulo 4. Caso de Estudio _

4.2 Tabla Comparativa

En base a la tabla 3.4, Guía propuesta para la visualización de Linked Data, se


califican las cuatro herramientas probadas con la colección de Hierros de la
Conquista de Patrimonio Cultural y el resultado se puede ver en la tabla 4.1.

Tabla 4.17Calificación de herramientas enfocada en Hierros de la Conquista

Visualización de Linked Data


Característica Allegrograph LOG Lodlive Relfinder
Apoyo para la consulta Sí Sí Sí Sí
Búsqueda con expansión a relacionados Sí Sí Sí No
Búsqueda por facetas No No No Si
Desambiguación de homónimos Sí No Sí Sí
Detalle sobre demanda Sí Sí Sí Parcial
Entrada tipo texto Sí Sí Sí Sí
Escalabilidad Parcial Sí Sí Sí
Filtrado Sí Sí Sí Sí
Historia No Parcial No No
Multilingüismo No No Sí No
Múltiples Endpoints No Sí No No
Presentación visual No Sí Sí Parcial
TOTAL DE Sí / TOTAL DE CRITERIOS 0.5 0.67 0.75 0.5
Acceso a documentos resultantes Sí No Sí No
Combinación de datos No No Sí No
Plantillas de presentación No Sí Sí No
Resaltar enlaces No No No No
TOTAL DE Sí / TOTAL DE CRITERIOS 0.25 0.25 0.75 0
Búsqueda por varios conceptos
Sí Sí No Sí
concurrentes
Confianza y Procedencia No No No No
Descarga de tripletas resultantes Sí No No No
Visión general de los datos Sí No No No
TOTAL DE Sí / TOTAL DE CRITERIOS 0.75 0.25 0 0.25

Aun cuando éstas herramientas ya han sido calificadas de acuerdo a la guía de


visualización, se cuenta con la ventaja de que algunas de ellas, como
Allegrograph-Gruff, Lodlive y Relfinder, son paquetes de código abierto que
permiten hacer las modificaciones que sean consideradas para mejorar la
experiencia de visualizar y navegar por las colecciones de Patrimonio Cultural que
ofrece el Tecnológico de Monterrey.

67
Capítulo 4. Caso de Estudio _

En la tabla 4.2 se muestra el lugar en el que se posiciona cada herramienta de


acuerdo a los resultados (total de sí / total de criterios) de la tabla 4.1.

Tabla 4.28Resultados de acuerdo a la prioridad de criterios

Lugar de la Herramienta
Prioridad
Posición 1 Posición 2 Posición 3
Alta (3) Lodlive (0.75) LOG (0.67) Allegrograph/Relfinder (0.5)
Media (2) Lodlive (0.75) Allegrograph/LOG (0.25) Relfinder (0)
Baja (1) Allegrograph (0.75) LOG/Relfinder (0.25) Lodlive (0)

En esta tabla, cada posición tiene asignados dos factores. El primero corresponde
a el numero obtenido en la Tabla 4.1 correspondiente a la casilla de “total de sí /
total de criterios” y el segundo corresponde a la casilla de prioridad. La
multiplicación de estos factores representa el resultado en cifras de la herramienta,
el cual indica la herramienta que mejor se adapta al consumo de Patrimonio
Cultural de acuerdo con la metodología de evaluación.

Lodlive: ((3 x 0.75)+(2 x 0.75)+(1 x 0) = 3.75pts)

Allegrograph: ((3 x 0.5)+(2 x 0.25)+(1 x 0.75) = 2.75pts)

Linked Open Graph: ((3 x 0.67)+(2 x 0.25)+(1 x 0.25) = 2.75pts)

Relfinder: ((3 x 0.5)+(2 x 0)+(1 x 0.25) = 1.75pts)

Al sumar los resultados para cada herramienta se puede observar que Lodlive es
la herramienta con mayor puntaje (3.75pts.), seguida por Allegrograph (2.75 pts.) y
LOG (2.75pts.) en la misma posición, y finalmente Relfinder (1.75pts.).

68
Capítulo 4. Caso de Estudio _

4.3 Ventajas de la visualización de Patrimonio Cultural como


Linked Open Data

Las herramientas analizadas son las cuatro mejor adaptadas de un total de 40, de
acuerdo con las características y limitaciones de la colección de Hierros de la
Conquista. En general, las cuatro cumplen diferentes propósitos, por lo cual sus
características difieren de una a otra. El propósito general es encontrar la
herramienta que facilite el entendimiento del contenido de las colecciones del
Tecnológico de Monterrey aun cuando se desconozca su estructura, de manera
que pueda ser explorada por usuarios de cualquier área de conocimiento, en
cualquier lugar, y que no cuenten necesariamente con conocimiento y habilidades
en tecnología semántica. Las herramientas que se presentaron cumplen parte de
este propósito aunque pueden ser mejor adaptadas al consumo de Patrimonio
Cultural, ya que algunas de ellas ofrecen su código fuente con este fin.

La gran ventaja de las herramientas en general es que no requieren un tratamiento


adicional de la información con la que actualmente se cuenta, ya que la
visualización ocurre a partir del endpoint de Marmotta que ya forma parte de la
integración y publicación de las colecciones de Fototeca y Hierros de la Conquista
del Tecnológico de Monterrey.

4.4 Adaptaciones sugeridas

Además de adaptar las herramientas al consumo de recursos de patrimonio


cultural, también se pueden adaptar en su medida los datasets de Hierros de la
Conquista y Fototeca a las herramientas, de acuerdo a lo que estas requieren. De
esta manera se puede enriquecer la colección, brindando la posibilidad de ofrecer
mayor y mejor contenido y más completo, y sobre todo una mejor experiencia de
visualización y navegación entre recursos, tanto internos como externos a la
colección.

69
Capítulo 4. Caso de Estudio _

El procedimiento puede consistir en enriquecer la colección con propiedades,


subconjuntos de datos, imágenes y otros enlaces importantes, por ejemplo,
información adicional del recurso de interés en su sitio oficial. También se propone
hacer algunas modificaciones en el dataset de Hierros de la Conquista, y
próximamente en el resto de las colecciones que mejoren la interoperabilidad con
otras fuentes de información, estas modificaciones se listan a continuación.

 Evitar usar números de puerto en los URIs para evitar que los recursos puedan
ser bloqueados por el Firewall de la red en la que se consume la información.

 Adicionalmente a la propiedad edm:isShownBy para mostrar la imagen de los


recursos, utilizar la propiedad foaf:depiction apuntando a la imagen de los
recursos que cuentan con una. Esto porque se encontró que las herramientas
de visualización utilizan propiedades de uso general como foaf:depiction para
mostrar imágenes.

 Agregar títulos a todos los objetos, utilizando propiedades como dc:title y


rdfs:label, indicando el idioma en el que se encuentra la etiqueta. Esta etiqueta
identifica al recurso en la visualización.

 Agregar ligas a LinkedGeoData4 que complementen las que ya se tienen hacia


GeoNames. Porque algunas herramientas de visualización utilizan sólo uno de
estos Linked Data para localizar recursos en un mapa.

4
Linked Geo Data: http://datahub.io/dataset/geolinkeddata

70
Capítulo 6. Trabajo Futuro _

Capítulo 5. Conclusiones

Conclusiones

Presentar de forma visual y digital el contenido de patrimonio cultural fomenta el


uso de recursos de los que no siempre se conoce su existencia, o es difícil
accederlos. Esto representa una manera de preservar el acervo cultural, aun
cuando sea consultado por diversos usuarios, en diversos lugares y en repetidas
ocasiones.

Utilizar tecnología semántica para lograr este propósito, además de facilitar la


construcción y consumo de la información, también es una forma de estandarizar
la cultura globalmente. Esto queda demostrado con la existencia de tantas
herramientas tecnológicas que utilizan tecnología semántica para visualizar y
analizar contenido de diversas fuentes con esquemas de Linked Data y RDF.

Después de concluida la investigación se cuenta con un listado de herramientas


semánticas que pueden ser utilizadas para visualizar y analizar linked data de
patrimonio cultural. También se comprueban los resultados de esta visualización
después de probar cada una de ellas con el dataset de las colecciones del
Tecnológico de Monterrey.

Estas colecciones han sido adaptadas al modelo de datos de Europeana,


utilizando clases y propiedades del mismo, para complementar la información que
se tiene de las colecciones y complementar su representación semántica,
específicamente para Hierros de la Conquista y Fototeca, y próximamente para el
resto de las colecciones.

Se analizaron 40 herramientas tecnológicas de visualización en forma de grafo de


expansión y con este análisis se logró encontrar las cinco herramientas que
facilitan el consumo de linked data en base a sus características de actualización,
capacidad de conexión por medio de endpoint de SPARQL y entrada tipo texto

71
Capítulo 6. Trabajo Futuro _

para usuarios promedio. Después se decidió utilizar únicamente cuatro de ellas,


debido a que estas ofrecen la facilidad de ser utilizadas de manera gratuita, lo que
permitió probarlas con contenido semántico abierto de información cultural.

En base a trabajos relacionados de investigación en el ámbito de visualización de


contenido, se elaboró una guía de evaluación basada en criterios. Estos criterios
fueron recabados y adaptados de dos autores que trabajaron en visualización de
linked data previamente. La guía se diseñó con la finalidad de proponer una
metodología para evaluar de una manera consistente las cuatro herramientas y se
adecuó a las características que requieren las colecciones de patrimonio cultural
(visualizar, navegar, expandir, filtrar, etc.), incluso se priorizaron los criterios en
orden de importancia asignando un peso a cada prioridad para que los resultados
estuvieran más apegados a lo requerido por las colecciones.

Tanto el análisis de las características generales de las herramientas, como la


metodología planteada en esta investigación tienen la ventaja de ser una guía de
evaluación para futuras herramientas de este tipo, lo cual permitirá seguir
encontrando herramientas para visualizar el contenido de las colecciones
patrimoniales alrededor del mundo.

Las cuatro herramientas seleccionadas fueron sometidas a la metodología y los


resultados permitieron contabilizar la facilidad de la herramienta para los
propósitos que se busca cumplir.

Con los resultados fue posible encontrar ventajas y desventajas de cada


herramienta, y proponer adaptaciones a los datos para mejorar la experiencia de
visualización y análisis. Por ejemplo, utilizar nuevas propiedades como depiction y
agregar propiedades inversas de las ya utilizadas en el dataset de prueba.

Con base en la evaluación se obtuvo un puntaje para cada herramienta, el cual


permite proponer que Lodlive es la herramienta más adaptable al consumo de
colecciones de patrimonio cultural, de acuerdo a los criterios de la metodología.
Seguida por herramientas como Allegrograph y Linked Open Graph, que siguen

72
Capítulo 6. Trabajo Futuro _

siendo adaptables en menor medida y por último Relfinder, que es también


adaptable pero con propósitos diferentes.

Además, se prevé que la innovación introducida por este tipo de tecnologías se


puede comercializar en forma de un servicio, que consiste en la conversión del
repositorio institucional a esquemas de tecnología semántica, así como la
integración y publicación de este contenido, el cual puede ser visualizado
utilizando las herramientas expuestas en esta investigación.

Su importancia se refleja en que se trata del primer trabajo de datos abiertos


enlazados de patrimonio cultural en México (con base en la retroalimentación
obtenida en el octavo encuentro de catalogación y metadatos de la UNAM en el
año 2014).

El mercado al que se dirige este servicio consiste en Instituciones culturales como


museos, cine, televisión, instituciones educativas, galerías y comercializadoras de
artículos culturales que se beneficien de exponer sus productos al público de
manera visual. Ofreciendo como propuesta de valor la interoperabilidad con
colecciones de distintas instituciones/proveedores de información y la web de
datos.

73
Capítulo 6. Trabajo Futuro _

5.1 Trabajo Futuro

El resultado de la investigación representa la aplicación de la tecnología semántica


en la visualización de colecciones de patrimonio cultural y a partir de este
resultado surgen propuestas para aplicar el conocimiento obtenido durante el
desarrollo de la investigación.

En primer lugar, llevar a cabo una tercera referencia de evaluación en forma de


encuesta, siendo la primera referencia la comparación general de las herramientas
de visualización, correspondiente a la tabla 3.2 y la segunda referencia la guía
propuesta para la visualización de linked data, correspondiente a la tabla 3.4. Esta
tercera referencia representará la evaluación de la herramienta con mayor puntaje
en el ranking de herramientas final, en este caso Lodlive. Pero a diferencia de las
anteriores, dicha evaluación será efectuada por parte de los usuarios finales de la
herramienta, que pueden pertenecer a áreas como historia, arqueología, diseño,
educación, bibliotecología, etc. con la finalidad de encontrar y resolver las áreas de
oportunidad de la herramienta de acuerdo con la experiencia de uso del público al
que se dirige la aplicación. Una plantilla de esta referencia de evaluación se puede
consultar en el Apéndice E: Guía de evaluación para usuarios finales.

En segundo lugar, mejorar la adaptabilidad de una o más herramientas, siempre y


cuando sean herramientas de código abierto, esta característica se puede
consultar en la tabla de comparación general de las herramientas de visualización
(tabla 3.2). Las mejoras estarán basadas en los resultados de la investigación y en
el caso de contar con los resultados de los usuarios finales, también se podrán
tomar en cuenta para dichas mejoras.

74
Glosario

A continuación se ofrece un listado de palabras incluidas en el documento, así como su


significado, con el fin de mejorar la comprensión y entendimiento del mismo.

A Aplicación 10,27,45
Accesibilidad 1,16 Herramienta de software que da solución a una
Capacidad del software de ser usado por necesidad. Permite al usuario llevar a cabo una
personas con algún tipo de discapacidad. o varias tareas a la vez.

Acercamiento Geográfico 17,32 Arco 13,17,26,32,38,51,55,59


Capacidad del software de permitir un Es la representación gráfica del enlace entre dos
acercamiento a los datos en el área que el recursos conocidos como nodos en teoría de
usuario desea. grafos.

Acercamiento Semántico 17 B
Capacidad del software de permitir un Base de datos 1,7,13,21,31
acercamiento a los datos en el conjunto de Formato estructurado para organizar y
datos que el usuario desea. mantener información y que puede ser
fácilmente consultada.
Acervo Cultural 12
Conjunto de bienes comunes de ámbito cultural. Biblioteca Digital 1,2,5,6,7
Representación digital del contenido de una
Adaptabilidad 15 biblioteca.
Capacidad del software (etc.) de ser modificado
de acuerdo a las necesidades de quien lleva a Biblioteca Digital Semántica 2
cabo dicha modificación. Biblioteca digital con información construida
bajo estándares de tecnología semántica.
Algoritmo 22
Conjunto de reglas ordenadas para resolver un C
problema. Cadena de caracteres 11
Tipo de representación de datos compuesto por
Análisis de grafos 13,14,25 caracteres seguidos de otros.
Es el área en la cual se extrae información de
estructuras de datos en forma de redes para Capital Intelectual 7
convertirla en conocimiento mediante la teoría Es el conocimiento de una organización
de redes o grafos. Estas redes pueden ser conformado por sus individuos, es intangible
sociales, de transporte, de información, de pero representa valor para la empresa.
internet, eléctricas, biológicas, genéticas, etc.
Catalogación 38
Análisis estadístico 10 Es la parte del control bibliográfico, que
Es la parte del análisis de datos que se encarga representa la organización de la información
de recoger datos en forma de muestras y para su posterior recuperación.
obtener resultados a partir de la aplicación de la
estadística.

75
CIMI 38 DC 11,12,13,38,47
Computer Interchange of Museum Information, Principal estándar de metadatos utilizado en
Iniciativa que permite el intercambio de datos y bibliotecas y centros de documentación.
estandarización de bases de datos para los
museos. Deducción automatizada 10
Subespecialidad de la lógica computacional que
Clase 11,13,24,34,47,51,66 se encarga de simular el procesamiento del
Es un conjunto de instancias definidas por una razonamiento humano de manera automática
misma propiedad. Pueden ser conjuntos, con un enfoque interactivo guiado por el
colecciones, conceptos, tipos de objeto o tipo de humano.
cosas. Ejemplo (Clase Agent: Para agrupar
personas u organizaciones). Dominio 11,12
Valores que puede tomar el sujeto de una
Cluster 9,26 propiedad (Dominio > Propiedad > Rango).
Agrupación de datos/nodos.
Dot 28
Clustering 18 Lenguaje de programación descriptivo, diseñado
Agrupamiento de datos/nodos. para crear grafos que sean entendibles por
personas y máquinas.
Código abierto 23,29
Descripción para el software cuyo código fuente E
original está disponible para ser usado, EDM 12,13,38,44
compartido o modificado. Europeana Data Model o EDM es el nombre que
recibe el modelo de datos del proyecto
Código Fuente 29,53,58,62 Europeana para definir la estructura de la
Código formado por una lista de comandos que información que recibe, y la descripción de sus
al ser compilado conforma un programa clases y propiedades.
computacional.
Efectividad 15
CultureSampo 8 Capacidad de permitir a los usuarios de un
Proyecto de preservación de patrimonio cultural software, de completar tareas específicas y con
nacional en Finlandia que opera bajo estándares precisión.
de tecnología semántica y esquemas de
metadatos. Eficiencia 15,32
Capacidad de permitir a los usuarios de un
Cypher 23 software, de gastar cantidades apropiadas de
Lenguaje de consulta para estructuras de datos recursos en relación a la efectividad alcanzada
en formato Neo4j (base de datos de código en un contexto de uso específico.
abierto orientada a grafos).
Endpoint 29,32,37,59,63
D Punto de entrada a un servicio o proceso
Dataset 7,53,55,65,69 ofrecido.
Registro de datos del mismo tipo, almacenados
en un archivo con formato específico. Entidad 14
Representación de un objeto real que se
DBpedia 13,21,47 describe en una base de datos.
Proyecto que extrae información de wikipedia y
la ofrece en formato de linked data.

76
Escalabilidad 37,67 G
Capacidad del software de aceptar cierto GeoNames 13,21,47,70
tamaño o cantidad de recursos o configuración Es un dataset en la nube de linked data que
para adaptarse a las circunstancias contiene información sobre ubicaciones
geográficas del mundo.
Estado de madurez 14
Evolución por la que se desenvuelve una Grafo 4,5,11,13,14,19,20,32,47,55
tecnología existente. Según el hype cycle de Conjunto de nodos y arcos unidos entre sí que
Gartner puede ser: lanzamiento, pico de conforman una estructura de información
expectativa, desilusión, consolidación y representada en tripletas
productividad.
Grafo tradicional 18
Estándar 1,8,16,23 Diagrama de un grafo cuya estructura
Reglas, guías o características establecidas por representa una jerarquía por niveles en los
medio de un documento aprobado por un nodos.
cuerpo reconocido para ser utilizadas de forma
general. Grafo de expansión 18,27,32,51,65
Diagrama de un grafo cuya estructura
Estándar Semántico 2 representa nodos expandidos en el espacio sin
Estándar construido bajo esquemas de orden específico.
tecnología semántica.
Grafo en 2D 25
Estandarización 7
Diagrama de un grafo cuya estructura está
Proceso de establecer un estándar para un
representada en dos dimensiones (largo y alto).
conjunto de productos o procesos.

Estructura de Información 2 Grafo en 3D 18,25


Datos ordenados que constituyen una base de Diagrama de un grafo cuya estructura está
datos a analizar. representada en tres dimensiones (largo, alto y
profundidad).
Europeana 1,3,8,12,22,44
Proyecto de difusión de información de Grafo hiperbólico 18,21,34
patrimonio cultural de la Unión Europea en Diagrama de un grafo cuya estructura está
formato digital. representada en forma de árbol donde las
ramificaciones del mismo se concentran hacia el
F extremo al que apuntan y puede ser en dos o
FOAF 11,12,38,56,70 tres dimensiones.
Vocabulario estándar para representar
información relacionada con personas u GraphML 21
organizaciones. Formato para representar e intercambiar
grafos, basado en XML (extensible markup
Formato Digital 6 language).
Es la representación de personas, objetos o
recursos por medio del uso de la tecnología para GSS 22
ser compartidos, transferidos y/o mostrados al Graph Stylesheets es un lenguaje para la
público. construcción de grafos en modelo RDF.

77
I Librería 21,31
Indexación 2 Conjunto de código y datos utilizados para el
Proceso de asignación de palabras a páginas o desarrollo de software.
sitios web utilizando metadatos que les permite
ser recuperados fácilmente con ayuda de un Linked Data 3,4,19,20,36,39,40,45
motor de búsqueda. Es una manera de publicar datos estructurados
entrelazados entre sí, para mejorar su
Individuo 13,24 utilización, mediante tecnología semántica.
Representación de los recursos de un dataset.
Cando un individuo es asignado a una clase Linked Open Data 2,3,7,8,22,40,44
recibe el nombre de Instancia. Es una forma de Linked data en la cual la
información es abierta, para compartirla sin
Instancia 14,27,44,51,56 infringir los derechos de autor y evitar
Representa al miembro de una clase y tiene almacenar la misma información en distintas
atributos asignados. fuentes confiables.

Inteligencia Artificial 9 LinkedGeoData 70


Área que estudia la creación y diseño de Es un dataset en formato de RDF y bajo el
entidades basadas en la inteligencia humana esquema de linked Data que contiene
para resolver problemas por sí mismas, basadas información sobre dimensiones espaciales con
en cómputo, lógica y otras disciplinas. información de OpenStreetMap.

Interactividad15 Literal 11,13


Comportamiento de un sistema en relación con Es el tipo de recurso que no cambia cuando se
el usuario y cómo este lo experimenta. traduce a lenguaje de máquina. Puede ser
entendido como un mensaje.
J
JUNG 21 M
Java Universal Network/Graph Framework es Maisis 24
una librería que provee un lenguaje de Compañía portuguesa de desarrollo de
modelación, análisis y visualización de datos en paquetes de software.
forma de grafo o red.
Marco 58
Formas de representar información en html
L
como vistas independientes en forma de
Lenguaje 1,14,21,32
Forma de representar una serie de indicaciones ventanas o subventanas.
que se dan a una computadora para llevar a
MDA 38
cabo un proceso. Museum Documentation Association Data
Standard es un estándar de documentación
Lenguaje natural 10
Lengua o idioma utilizado por los seres para museos.
humanos para comunicarse.
Metadato 11,12,34,38
Dato que describe otro dato. Los metadatos se
Lenguaje ontológico 5
Lenguaje diseñado para la construcción de utilizan para describir recursos.
ontologías.

78
Minería de datos 25 OWL 9,12,24
Es un campo de la computación dedicado a la Ontoloy Web Language o Lenguaje de
extracción de información que permita ontologías para la World Wide Web, es el
descubrir patrones en datos de gran volumen. lenguaje utilizado para crear ontologías.

Modelo de Datos 3,12,44 P


Es la forma para describir las estructuras de Patrimonio Cultural 1,2,3,4,5,7,19,20,36
datos de una base de datos, el tipo de datos que 38,44,50
contiene y sus relaciones. Colección de recursos culturales del pasado de
una comunidad, que preserva para las
Modelo de Datos Semántico 1 generaciones futuras.
Es el modelo de datos construido bajo
estándares semánticos. Python 23
Lenguaje de programación de sintaxis legible
Motor de búsqueda 23,36 creado por Python Software Foundation.
Servicio de localización de información en la
web a partir de palabras u otras entradas. Plug-in 24
Pequeño programa que añade alguna
N funcionalidad al software.
Navegabilidad 15
Facilidad de una herramienta de software para Portabilidad 15
ser recorrida sin perderse en ella. Capacidad de un software de ser capaz de
ejecutarse en distintas plataformas reutilizando
Nodo 9,13,17,24,32,38,51,55,59 su código fuente.
Es una unidad de información que se utiliza en
teoría de grafos para unir redes de datos. Portal 8
Sitio web que ofrece información al usuario por
Número de Puerto 70 medio de enlaces, documentos, foros,
Es un número asignado a un puerto virtual en el buscadores y más.
que se realizan conexiones por http, ftp, ssh o
algún protocolo similar. Predictabilidad 17
Característica de un software de responder al
O usuario de la manera esperada.
Ontología 5,9,11,12,21,34,49,56
Vocabulario formal de un dominio específico Prefuse 24
que comprende conceptos como propiedades y Herramienta creada en Java que sirve para
reglas que rigen su funcionamiento. crear aplicaciones de visualización.

Operatividad 15 Prolog 20
Capacidad del software de trabajar, operar o Programa computacional para crear
funcionar de forma correcta. aplicaciones de inteligencia artificial.

ORE 12
Object Reuse and Exchange es el vocabulario Propiedad 11,12,13,24,42,47,51,58,66,70
utilizado para definir la descripción e Atributo de un recurso representado por un URI
intercambio de agregaciones de recursos web. y un significado concreto.

79
Protege 24 SPARQL 7,9,14,20,29,32,40,50,54
Software de creación y edición de ontologías Lenguaje de tecnología semántica dedicado a
creado por la Universidad de Stanford. formular consultas a la información de un
dataset construido bajo esquemas semánticos.
Protocolo 1,6
Formato o conjunto de reglas y procedimientos SPARQL endpoint 31,37,44,50
para interoperar dispositivos o programas. Acceso de un repositorio de información que
permite realizar consultas por medio de
R lenguaje SPARQL.
Rango 11,12
Valores que puede tomar el objeto de una Subclase 12,24
propiedad (Dominio > Propiedad > Rango). Es la clase que a su vez pertenece a una clase
más general.
Ranking 3,38
Clasificación por orden de prioridad de un Subpropiedad 12
conjunto de elementos evaluados. Es la propiedad que a su vez pertenece a una
propiedad más general.
Razonador 20
Herramienta deductiva en base a reglas T
diseñada para desarrollar inteligencia artificial Tasa de error 15
por parte de un programa. Porcentaje que representa la probabilidad de
error al utilizar una herramienta o software.
RDF 7,8,10,12,13,20,35,38,45
Resource Description Framework o Marco de Taxonomía 9,25
Descripción de Recursos. Es un lenguaje Estructura ordenada por medio de taxones
estándar para describir recursos formalmente anidados entre ellos.
en tecnología semántica.
Tecnología Semántica 1,2,3,5,7,8,9,13
RDFS 11,12,20 18,36,69
Lenguaje de definición de ontologías basado en Es la tecnología que contribuye al tratamiento
el esquema RDF. de la información contenida en la web, para que
sea entendida por las máquinas, así como es
RDQL 24 entendida por los humanos.
Es un lenguaje de consulta de archivos RDF
derivado de Squish. Tiempo de descarga 15
Representa el tiempo en segundos que tarda un
S paquete de software o contenido en ser
Semántica 2,3,11,12,24,34,45,46 descargado de la web.
Interpretación de los términos, y representa a lo
que tiene significado. Tipo de dato 11
Formato de representación de datos en
SKOS 11,12 programación. Puede ser: numérico, carácter,
Simple Knowledge Organization System es cadena de caracteres, etc.
vocabulario para compartir y enlazar sistemas
de conocimiento. Tripleta 10,13,38
Elemento básico de un modelo RDF conocido
Software 1,2,11,20,29 también como sentencia. Se compone de sujeto,
Representa los sistemas y programas que utiliza predicado y objeto. Indica que el sujeto tiene
una computadora para funcionar. una propiedad cuyo valor es el objeto.

80
U W
URI 7,11,13,29,50,59,70 Web 1,6,9,10,20,41
Universal Resource Identifier. Una cadena Medio de comunicación en Internet conocido
algorítmica que se usa para identificar un también como world wide web.
documento o recurso en la Web.
Web semántica 8,9,12,36,44
URL 26 Representación de una web extendida definida
Uniform Resource Locator. Sistema de con mayor significado, que permite encontrar
direccionamiento de archivos y funciones en información más exacta, con mayor rapidez y de
Internet. forma más sencilla utilizando esquemas y
lenguajes específicos.
Usabilidad 5,14,36
Es el conjunto de características que describen W3C 23
el uso de una tecnología o herramienta, dirigida World Wide Web Consortium es un consorcio
a usuarios específicos internacional encargado de crear las
recomendaciones para la world wide web.
Usuario 17,27,32,37,41,54,62
Persona o individuo que tiene la función de
utilizar una herramienta especifica.
X
XML 12,25
Usuario final 14,19,37 Extensible Markup Language, desarrollado por
Usuario que utiliza la función más general de W3C para describir información contenida en la
una herramienta específica, y por lo ismo no hay web a través de estándares y formatos para que
usuarios que utilicen la herramienta después del el usuario pueda buscar, comparar y compartir
usuario final. información en la red. El formato de XML es
muy parecido al del HTML aunque no es una
V extensión ni un componente de éste.
Verificación formal 10
Es la corrección en base a algoritmos de un Z
sistema respecto a una especificación formal o ZUI 28
propiedad usando métodos formales. Es un graficador que permite cambiar la escala
de la visualización, para ver mayor o menor
Visualización 5,14,19,20,31,36,40,50 detalle dependiendo de la preferencia del
Característica de un software de mostrar de usuario.
manera visual y en forma de diagramas,
gráficas, grafos u otros formatos, la información
contenida.

Vocabulario 11,12,13
Es una especificación en web semántica que
define los conceptos y las relaciones o términos
usados para describir y representar un área
particular.

81
Apéndice A: Guía para la extracción de información de Europeana

La siguiente guía se diseñó con el objetivo de tener una referencia con la cual
extraer información del extenso dataset de Europeana. La información que se
quiere obtener gira en torno al pintor Leonardo da Vinci que vivió durante el siglo
XV y la información más relacionada a este, como sus obras, pintores de la misma
época, ubicación de sus obras, variaciones de sus obras, y más.

Primeramente se señala la una oración que resalta un grupo específico de


información a extraer, seguida de un diagrama que representa el universo de
información relacionada con la oración principal. Este universo también representa
información a extraer, que esta enlazada con el resto de la información.

GUÍA
1. Pintores de la época de Leonardo da Vinci
Ejemplo:

Leonardo da Vinci s. XV s. XVIII s. XIII

Pintor III Pintor II Pintor IV Pintor V

s. XVI Pintor VIII


Pintor XI Pintor VII
s. XIX
Pintor X Pintor VI Pintor IX

2. Pinturas del Siglo XV


Ejemplo:

Leonardo da Vinci Pintura IV Pintura


VIII
Pintura III Pintura VII
Pintura I Pintura V
Pintura VI
s. XV Pintura II Pintura IX Pintura X

Pintor Pintura VII Pintor III

Pintura XI Pintura VIII

82
3. Obras de da Vinci ubicadas “Le musée de Louvre”
Ejemplo:

Obra I
Museo de Louvre Ubicación II

Obra IV Obra VII


Obra II
Obra V
Obra VIII
Obra III Obra VI Ubicación III

Obra XI
Obra IX Obra X

Ubicación IV Ubicación VII

Obra XII Obra XIII Obra XIV

Ubicación V Ubicación VI Ubicación VIII

4. Autores de derivados de la “La Gioconda” de da Vinci


Ejemplo:

Autor I Derivadas Versiones

Autor II Autor III Autor VI Autor VII

Partes Autor VIII


Autor IV Autor X Representacione
Autor V
Autor IX Autor XI

5. Obras del siglo XV creadas en Florencia, Italia


Ejemplo:

Florencia Obra IV

Obra III
Obra I Obra II Obra V

París Obra VII Londres


Obra VIII
Obra VI

83
6. Escritos importantes del siglo XV
Ejemplo:

Leonardo da Autor II

Escrito I Escrito III Escrito IV

Escrito II Escrito V
Autor III

Escrito VI Escrito VIII Escrito IX

Escrito VII
Autor IV Autor V

Una vez localizada la información en el dataset se extrae con ayuda de consultas


SPARQL directamente del endpoint de Europeana.

84
Apéndice B: Exploración de datos de Europeana

Enseguida se presentan las consultas de prueba que se realizaron para la


extracción de información en el dataset original de Europeana. Las consultas se
muestran en lenguaje SPARQL y se incluyen los resultados arrojados por
Europeana.

Resultado 1

La clase Agente, que está diseñada para asignarse a personas u organizaciones,


sólo se utiliza para proveedores de datos, lo que demuestra que Europeana no
cuenta con información de personas que tienen relación con las obras registradas
(como Leonardo da Vinci).

Consulta SPARQL Resultados


select ?Person
Person
where {?Person rdfs:range edm:Agent} edm:dataProvider
edm:provider

Resultado 2

Las propiedades utilizadas para asignar el nombre de “Leonardo da Vinci” con un


recurso son: título, descripción, creador, sujeto, relación, ha conocido y está
relacionado con. Por lo que se puede inferir que la propiedad “dc:title” puede
apuntar a la referencia para ”Leonardo da Vinci” (ver resultado 3) y la propiedad
“dc:creator” lo relaciona con sus obras (ver resultado 4).

Consulta SPARQL Resultados


select distinct ?Property Results for select distinct... (7)
where { Property
?Leonardo ?Property "Leonardo da Vinci" dc:title
dc:description
} dc:creator
dc:subject
dc:relation
edm:hasMet
edm:isRelatedTo

85
Resultado 3

Sin embargo, este resultado demuestra que las fechas relacionadas con
únicamente cuatro de los recursos con “dc:title” apuntando hacia “Leonardo da
Vinci” no coinciden con su época, por lo que estos recursos son obras y no
agentes.

Consulta SPARQL Resultados


select distinct ?Date Results for PREFIX dc:... (4)
where { Date
?Person dc:title "Leonardo da Vinci" . unknown
1834
?Person dc:date ?Date 2004
} [1895]

Resultado 4

Y la consulta para las obras de Leonardo da Vinci regresa sólo 14 resultados.

Consulta SPARQL Resultados


select ?Item Results for PREFIX dc:... (14)
where { Item
?URI_Item dc:creator "Leonardo da Vinci" . Madonna Litta
Flügel (ohne Firmenmarke)
?URI_Item dc:title ?Item Battaglia di Anghiari
} Ritratto di Leonardo da Vinci
Battesimo di Cristo e due angeli
Ritratto di donna
Adorazione dei Magi
Annunciazione
Des vortreflichen Florentinischen Mahlers…
Leonardo da Vinci. On the eye and vision.
Illustration by L. da Vinci
Trattato della pittura di Lionardo da Vinci...
Leonardo da Vinci válogatott írásai
Ízelítő a polihisztor életművéből

86
Resultado 5

De las 14 obras de Leonardo registradas en Europeana, solamente seis muestran


fecha, utilizando la propiedad “dc:date” y el formato difiere entre ellas.

Consulta SPARQL Resultados


select ?Item ?year Results for PREFIX dc:... (6)
where { Item year
?URI_Item dc:creator "Leonardo da Vinci" . Madonna Litta 1490
Flügel (ohne Firmenmarke) 1978
?URI_Item dc:title ?Item . Des vortreflichen Florentinischen [1724]
?URI_Item dc:date ?year Mahlers Lionardo da Vinci höchst-
nuetzlicher Tractat von der Mahlerey
}
Leonardo da Vinci. On the eye and 1912 -
vision. 1916
Illustration by L. da Vinci 1721
Trattato della pittura di Lionardo da [1733]
Vinci nuovamente dato in luce, colla
vita …

Resultado 6

De las 14 obras de Leonardo registradas en Europeana, solamente una muestra la


fecha utilizando la propiedad “dct:temporal”.

Consulta SPARQL Resultados


select ?Item ?Temporal Results for PREFIX dc:... (1)
where { Item Temporal
?URI_Item dc:creator "Leonardo da Trattato della pittura di Lionardo da Vinci 1733
nuovamente dato in luce, colla vita
Vinci" .
dell'istesso autore, scritta da Rafaelle du
?URI_Item dc:title ?Item . Fresne. Si sono giunti tre libri della Pittura,
ed il trattato della Statua di Leon Battista
?URI_Item dct:temporal ?Temporal
Alberti, colla Vita del medesimo. E di nuovo
} ristampato, corretto ed a maggior
perfezione condotto.

Resultado 7

Y de las 14 obras de Leonardo registradas en Europeana, solamente diez


muestran la fecha de creación utilizando la propiedad “dct:created” y el formato
difiere entre ellas. En el caso de la última obra de la tabla (abreviada por cuestión

87
de espacio) muestra la misma fecha en el mismo formato para las tres
propiedades diferentes.

Consulta SPARQL Resultados


select ?Item ?Date Results for PREFIX dc:... (10)
where { Item Date
Battaglia di start=1563 ante;end=1563 ca. [Create]
?URI_Item dc:creator "Leonardo da
Anghiari
Vinci" . Battesimo di Cristo start=1470;end=1480 [Create]
?URI_Item dc:title ?Item . e due angeli
Battesimo di Cristo name=cronologia generica;value=199x172
?URI_Item dct:created ?Date e due angeli con cornice [Create]
} Ritratto di donna name=cronologia generica;value= [Create]
Ritratto di donna start=1500;end=1599 [Create]
Adorazione dei name=cronologia generica;value=253x264
Magi con cornice [Create]
Adorazione dei start=1480;end=1482 ca. [Create]
Magi
Annunciazione name=cronologia generica;value=119x237
con cornice [Create]
Annunciazione start=1472 ca.;end=1475 ca. [Create]
Trattato della… 1733

Resultado 8

De las 14 obras de da Vinci registradas en Europeana, solamente 7 muestran la


ubicación del recurso, y las últimas dos reflejan un formato distinto de información.

Consulta SPARQL Resultados


select ?Item ?Coverage Results for PREFIX dc:... (7)
where { Item Coverage
?URI_Item dc:creator "Leonardo da Vinci" . Madonna Litta St. Petersburg
Madonna Litta Ermitage
?URI_Item dc:title ?Item . Flügel (ohne Firmenmarke) Leipzig
?URI_Item dc:coverage ?Coverage Flügel (ohne Firmenmarke) Messegelände
Illustration by L. da Vinci London
}
Leonardo da Vinci válogatott írásai 15-16. sz.
Ízelítő a polihisztor életművéből 15-16. sz.

88
Resultado 9

De las 14 obras de da Vinci registradas en Europeana, solamente 7 muestran de


que está hecha la obra, con la propiedad “dct:medium”, más no hay una propiedad
que refleje que tipo de obra es (pintura, escultura, escrito, etc.).

Consulta SPARQL Resultados


select ?Item ?Format Results for PREFIX dc:... (10)
where { Item Format
?URI_Item dc:creator "Leonardo Battaglia di Anghiari olio su tavola
Ritratto di Leonardo da Vinci olio su tavola
da Vinci" . Battesimo di Cristo e due angeli olio su tavola
?URI_Item dc:title ?Item . Battesimo di Cristo e due angeli tempera su tavola
Battesimo di Cristo e due angeli matita su tavola
?URI_Item dct:medium ?Format
Ritratto di donna olio su tavola
} Adorazione dei Magi tempera mista a olio su
tavola
Adorazione dei Magi lacca rossa/ lacca verde/
biacca su tavola
Annunciazione olio su tavola
Trattato della pittura … unknown

89
Apéndice C: Grafo para Hierros de la Conquista

La siguiente imagen corresponde a la vista en mayor escala de la Figura 4.3


“Extracto de la colección de Hierros de la Conquista correspondiente al Hierro HC-
002”.

90
Apéndice D: Grafo para Fototeca

La siguiente imagen corresponde a la vista en mayor escala de la Figura 4.5


“Extracto de la colección de Fototeca correspondiente a la Foto 120621_104453”

91
Apéndice E: Guía de evaluación para usuarios finales

El siguiente formulario tiene el objetivo de valorar la usabilidad y percepción visual del


software que se probó previamente. La duración del mismo se estima a un tiempo de
30 minutos.

Favor de leer cuidadosamente las instrucciones.

1. Marca con una x el espacio que más se acerca a tu opinión, dónde 1


representa completamente en desacuerdo, y 7 significa completamente de
acuerdo.
2. En caso de dudas preguntar a la persona a cargo
3. En caso de tener comentarios, estos se pueden hacer al final de la encuesta en
el espacio que dice comentarios, (si son muy específicos para un inciso
particular, favor de señalar el inciso al que se refieren)

a. El software permite usar los distintos tipos de recurso que ofrece (filtrado,
movimiento, ajustes, vistas, menús, etc.) en un tiempo apropiado.
1 2 3 4 5 6 7

b. El software permite usar los distintos tipos de recurso que ofrece (filtrado,
movimiento, ajustes, vistas, menús, etc.) en forma apropiada, con precisión y
sin problemas.
1 2 3 4 5 6 7

c. Se siente satisfecho al completar las tareas utilizando el software.


1 2 3 4 5 6 7

d. Considera que sería fácil volver a utilizar el software considerando que ya lo


utilizó una vez.
1 2 3 4 5 6 7

e. Considera que la información que maneja el software es ofensiva, representa


un daño a terceros, representa un daño para el equipo (puede contener virus) o
bien, no está segura dentro del software.
1 2 3 4 5 6 7

92
f. Considera que el contenido de la información puede ser entendido por distintos
usuarios, de diferentes lugares, con diferentes culturas.
1 2 3 4 5 6 7

g. La cantidad de recursos que permite visualizar el software cumple con la


cantidad de recursos que se desea visualizar.
1 2 3 4 5 6 7

h. Es fácil distinguir en la visualización entre un recurso (nodo) y una propiedad


(arco).
nodo
nodo arco

1 2 3 4 5 6 7

i. La información que maneja la visualización es fácil de entender.


1 2 3 4 5 6 7

j. Se puede encontrar información detallada del recurso de interés


1 2 3 4 5 6 7

k. Cómo calificaría su experiencia de navegación entre los datos.


1 2 3 4 5 6 7

l. Califique la satisfacción con la que utilizo los siguientes criterios del software

1 2 3 4 5 6 7

i. Zoom
1 2 3 4 5 6 7

ii. Clustering
1 2 3 4 5 6 7

iii. Forma del grafo

93
m. Está de acuerdo con el tiempo de respuesta en la expansión de cada grafo.
1 2 3 4 5 6 7

n. La respuesta del software para cada instrucción del usuario corresponde con la
respuesta esperada por el mismo.
1 2 3 4 5 6 7

o. Comentarios:

¡GRACIAS POR SU TIEMPO!

94
Referencias

Arms, W. (2000). Digital libraries. Cambridge, Mass: MIT Press, c2000.


Auber, D. (2014). Tulip – A Huge Visualization Framework. Recuperado el 17 de
Julio de 2014 de http://tulip.labri.fr/publi_tulip/auberChapterTulipGDSBook.pdf
Baeza, R., Rivera, C. & Velasco, J. (2004). Arquitectura de la información y
usabilidad en la web. El profesional de la información. V. 13, n. 3, pp. 168-178.
Barceló, J.A. (2000). Visualizing What Migth Be: An Introduction to Virtual Reality
Techniques in Arqueology. 9-36. Oxford:Archaeopress.
Bellini, P., Nesi, P., & Venturi, A. (2014). Linked open graph: Browsing multiple
SPARQL entry points to build your own LOD views. Journal Of Visual
Languages And Computing, 25(Distributed Multimedia Systems DMS2014 Part
I), 703-716. doi:10.1016/j.jvlc.2014.10.003
Borsie, J., & Giles, J. (2014). Welcome to the OWL2Prefuse project page.
OWL2Prefuse. Recuperado de http://owl2prefuse.sourceforge.net/
Brickley, D. & Guha, R.V. (ed.). (2014). RDF Schema 1.1. W3C Recommendation.
Recuperado el 7 de Julio de 2014 de http://www.w3.org/TR/rdf-
schema/#ch_classes
BNE. (2014). Datos Enlazados de la BNE. Biblioteca Nacional de España.
Recuperado el 8 de Julio de 2014 de http://www.bne.es/es/Inicio/Perfiles/
Bibliotecarios/DatosEnlazados/index.html
BNF. (2014). Reference Information About Authors, Bibliothèque Nationale de
France. Works and Topics. Recuperado el 8 de Julio de 2014 de
http://data.bnf.fr/
CAIDA (2013). Walrus - Graph Visualization Tool. Center for Applied Internet
Analysis. Recuperado el 4 de Diciembre de 2014 de
http://www.caida.org/tools/visualization/walrus
Ceballos, H. G., Sanabria, D. J., & Lavariega, J. C. (2013). Building the
Tecnologico de Monterrey’s Cultural Heritage Linked Open Data. Workshop on
Semantic Web and Linked Open Data. ENC 2013. Morelia, Mexico. October
30-31, 2013. Sitio Web: http://semtech.mty.itesm.mx/catedra/?page_id=347

95
Christmas, R. (2014). Project Rationale. Graph INterface librarY a.k.a. GINY.
Recuperado el 4 de Diciembre de 2014 de http://csbi.sourceforge.net/
Constantine, L.L. & Lockwood, L.A.D. (1999). Software for use: A practical Guide
to the Models and Methods of Usage-Center Design.
Criado, L. (2013). Nosotros, los constructores de la Web Semántica. Cimientos:
Open Data y Linked Open Data. Publisher: Luis Criado Fernandez. ISBN:
8461605152, 9788461605156
Cytoscape Consortium. (2014). What is Cytoscape?. Cytoscape. Recuperado el
18 de Julio de 2014, de http://www.cytoscape.org/what_is_cytoscape.html
Dadzie, A. & Rowe, M. (2011) Approaches to Visualising Linked Data: A Survey.
Semantic Web Journal. 1570-0844/11
DPLA. (2014). History. Digital Public Library of America. Recuperado el 7 de Julio
de 2014 de http://dp.la/info/about/history/
Europeana Professional. (2015). Why join Europeana? A brief overview what
Europeana is, why cultural organizations should join and how. Dsiponible en:
http://pro.europeana.eu/web/guest/provide-data
Falconer, S. (2013). OntoGraf. Protégé. Recuperado el 18 de Julio de 2014, de
http://protegewiki.stanford.edu/wiki/OntoGraf
Fenfire. (2008). Everything has to do with everything else. Fenfire. Recuperado el
15 de Octubre de 2014 de http://fenfire.org
Franz Inc. (2014). AllegroGraph 4.13. Franz Inc. Recuperado el 13 de Julio de
2014, de http://franz.com/agraph/allegrograph/
Goyal, S. & Westenthaler, R. (2004). RDF Graph Visualization Tool. RDF Gravity.
Recuperado el 17 de Julio de 2014, de http://semweb.salzburgresearch.at/
apps/rdf-gravity/index.html
Graphviz. (2014). Welcome to Graphviz. Graphviz. Recuperado el 14 de Julio de
2014, de http://www.graphviz.org/
Guns, R. (2013). Tracing the origins of the semantic web. Journal Of The American
Society For Information Science & Technology, 64(10), 2173-2181.
doi:10.1002/asi.22907

96
Heath, T. & Bizer, C. (2011) Linked Data: Evolving the Web into a Global Data
Space (1st edition). Synthesis Lectures on the Semantic Web: Theory and
Technology, 1:1, 1-136. Morgan & Claypool.
Heer, J. & Boyd, D. (2005). Vizster: Visualizing online social networks.
Visualization, 2005. INFOVIS IEEE. Recuperado de http://ieeexplore.ieee.org/
xpls/abs_all.jsp?arnumber=1532126
Herman, I., Melancon, G. & Marshall, M. (2000). Graph visualization and navigation
in information visualization: A survey. Ieee Transactions On Visualization And
Computer Graphics, 6(1), 24-43.
Hillmann, H. (2005). Using Dublin Core. Dublin Core Metadata Initiative.
Recuperado el 7 de Julio de 2014 de http://dublincore.org/
documents/usageguide/
Hitzler, P., Krotzsch, M. & Rudolph, S. (2010). Foundation of Semantic Web
Technologies. Champan & Hall. Fl. US. ISBN: 978 1 4200 9050 5
Huffaker, B., Nemeth, E. & Claffy, K. (1999). Otter: A general-purpose network
visualization tool. International Networking Conference (INET) '99. Recuperado
el 4 de Diciembre de 2014 de http://www.caida.org/tools/visualization/
otter/paper/
HyperGraph (2003). Hyperbolics Graphs and Trees: Examples. Hypergraph.
Recuperado el 4 de Diciembre de 2014 de http://hypergraph.sourceforge.net/
examples.html
Hypertree (2014). Hypertree Java Library. Hypertree. Recuperado el 4 de
Diciembre de 2014 de http://hypertree.sourceforge.net/
Iconvis (2014). Visualizing data through ontologies. ICONVIS. Recuperado el 4 de
Diciembre de 2014 de http://iconvis.polito.it/iconvis
Igraph R Package. (2013). R igraph manual pages. Igraph.Recuperado el 13 de
Julio de 2014, de http://igraph.org/r/doc/aaa-igraph-package.html
Information Workbench. (2015). Linked Open Data Demonstrator. Information
Workbench. Recuperado el 20 de Octubre de 2014, de http://iwb.fluidops.com/
resource/Help:Start?view=wiki

97
ISO9241–11. (1998). Ergonomic Requirements for Office Work with Visual Display
Terminals (VDTs). Part 11: Guidance on Usability
ISO/IEC 9126. (1991). Information Technology, Software Product Evaluation,
Quality Characteristics and Guidelines for their Use.
JUNG (2010). Java Universal Network/Graph Framework: Overview. JUNG.
Recuperado el 4 de Diciembre de 2014 de http://jung.sourceforge.net/
index.html
Kalamaras, D. (2014). The SocNetV Manual. SocNetV. Recuperado el 17 de Julio
de 2014 de http://socnetv.sourceforge.net/docs/manual.html
Kirk, A. (2012). Data Visualization : A Successful Design Process. Birmingham:
Packt Pub.
Klyne, G. & Carroll, J. (2004) . Resource Description Framework (RDF): Concepts
and Abstract Syntax. Recuperado el 7 de Julio de 2014 de
http://www.w3.org/TR/2004/REC-rdf-concepts-20040210/
Krivov, S., Williams, R. & Villa, F. (2007). GrOWL: A tool for visualization and
editing of OWL ontologies. Web Semantics: Science, Services and Agents on
the World Wide Web. 5(2), 54–57. doi:10.1016/j.websem.2007.03.005
Kurtz, M. (2010). Dublin Core, DSpace, and a Brief Analysis of Three University
Repositories. Information Technology & Libraries. 29(1), 40-46.
Leskovec, J. (2009). Stanford University SNAP System. SNAP. Recuperado el 14
de Julio de 2014 de http://snap.stanford.edu/snap/
Linden, A. & Sallam, R. L. (2014) Hype Cycle for Enterprise Information
Management, 2014: Graph Analysis. Gartner Intraweb. Recuperado el 20 de
Febrero de 2015.
Linkurious (2014). The easiest way to explore graph databases. Linkurious.
Recuperado el 4 de Diciembre de 2014 de https://linkurio.us/
Lodlive. (2012). What is Lodlive. Lodlive. Recuperado el 20 de Octubre de 2014 de
http://en.lodlive.it/
Logan, D. & Knox, R. E. (2007). When to Use Semantic Technologies. Gartner
Intraweb. Recuperado el 20 de Febrero de 2015.

98
Marmotta. (2015). Apache Marmotta. The Apache Software Foundation.
Recuperado el 14 de Mayo de 2015 de http://marmotta.apache.org/index.html
Masis. (2010). Insight, Share, Logic, Connect. Oobian. Recuperado el 20 de
Octubre de 2014 de http://www.oobian.com/home/about
Mäkelä, E. & Hyvönen, E. (2011). How to deal with massively heterogeneous
cultural heritage data – lessons learned in CultureSampo. Interoperability,
Usability, Applicability. 2011 (Vol. 0).
McGuiness, D. L. & van Harmelen, F. (2004). OWL Web Ontology Language
Overview. W3C Recommendation. Recuperado el 21 de Febrero de 2015 de
http://www.w3.org/TR/owl-features/
Mnemomap (2014). About Mnemomap: What is Mnemomap?. Mnemomap.
Recuperado el 4 de Diciembre de 2014 de http://mnemomap.de/about/
Morato, J., Sánchez-Cuadrado, S., Ruiz-Robles, A. & Moreiro-González, J. (2014).
Visualización Y Recuperación De Información En La Web Semántica.
(Spanish). El Profesional De La Información. 23(3), 319-329.
doi:10.3145/epi.2014.may.12
Network Workbench. (2008). Welcome to Network Workbench: A Workbench for
Network Scientists. Network Workbench. Recuperado el 13 de Julio de 2014,
de http://nwb.cns.iu.edu/about.html
NetworkX. (2014). High-productivity software for complex networks. NetworkX.
Recuperado el 13 de Julio de 2014, de https://networkx.github.io/
Offenhuber, D. & Dirmoser, G. (2014). SemaSpace – Semantic Networks as
Memory Theatre. Recuperado el 3 de Diciembre de 2014 de
http://residence.aec.at/didi/FLweb/semaspace.pdf
Palmer, J. W. (2002). Web Site Usability, Design, and Performance
Metrics. Information Systems Research, 13(2), 151-167.
Patrimonio Cultural Tecnológico de Monterrey. (2009). Información General.
Patrimonio Cultural. Recuperado el 8 de Julio de 2014 de
http://www.patrimoniocultural.com.mx/informacion.html
Pietriga, E. (2007). A Visual Authoring Tool for RDF. Isaviz. Recuperado el 15 de
Octubre de 2014 de http://www.w3.org/2001/11/IsaViz/

99
Perez, H. (2014). Semantic Technologies for the Enterprise. Haiku Deck.Disponible
en: http://www.haikudeck.com/p/RmQJx9w2yY/semantic-technologies-for-the-
enterprise#
Schreiber, G. & Raimond, Y. (ed.). (2014). RDF 1.1 Primer. W3C Working Group
Note. Recuperado el 7 de Julio de 2014 de http://www.w3.org/TR/2014/NOTE-
rdf11-primer-20140624/
Seffah, A., Donyaee, M., Padda, H. & Kline, R. (2006). Usability measurement and
metrics: A consolidated model. Software Quality Journal, 14(2), 159-178.
Sepans & Rashin. (2014). About Wikistalker. Wikistalker. Recuperado el 20 de
Octubre de 2014 de http://sepans.com/wikistalker/#
Shneiderman, B. (1992). Designing the user interface : strategies for effective
human--computer interaction / Ben Shneiderman. Reading, Mass. : Addison-
Wesley, c1992.
Skjæveland, M. G. (2012) Sgvizler: A JavaScript Wrapper for Easy Visualization of
SPARQL Result Sets. In: 9th Extended Semantic Web Conference (ESWC
2012), workshop and demo proceedings. Heraklion, Crete, Greece.
Smartlogic. (2012). Semantic Enhancement Server. SmartLogic. Recuperado el 13
de Julio de 2014, de http://www.smartlogic.com/home/products/semaphore-
modules/semantic-enhancement/ses-overview
soNIA (2014). What is it?. Social Network Image Animator. Recuperado el 4 de
Diciembre de 2014 de http://web.stanford.edu/group/sonia/
TheBrain (2014). Know more. Map your mind. The Brain. Recuperado el 3 de
diciembre de 2014, de http://www.thebrain.com/products/thebrain/know-more-
mind-map/
Treebolic (2014). Treebolic2. Treebolic. Recuperado el 5 de Diciembre de 2014 de
http://treebolic.sourceforge.net/en/index.html
Tsakonas, G., Mitrelis, A., Papachristopoulos, L. & Papatheodorou, C. (2013). An
exploration of the digital library evaluation literature based on an ontological
representation. Journal Of The American Society For Information Science &
Technology. 64(9), 1914-1926. doi:10.1002/asi.22900.

100
Visual Browser (2014). About the application. Visual Browser. Recuperado el 4 de
Diciembre de 2014 de http://nlp.fi.muni.cz/projekty/visualbrowser/index.html
Visual Data Web. (2012). Visually Experiencing the Data Web. Visual Data Web.
Recuperado el 20 de Octubre de 2014 de http://www.visualdataweb.org/
relfinder.php
Visuwords (2014). Online Graphical Dictionary. Visuwords. Recuperado el 4 de
Diciembre de 2014 de http://visuwords.com/
VUE (2013). Visual Understanding Enviroment. Recuperado el 5 de Agosto de
2014, de http://vue.tufts.edu/
ZGRViewer (2014). What is ZGRViewer?. ZGRViewer. Recuperado el 5 de Agosto
de 2014, de http://zvtm.sourceforge.net/zgrviewer.html

101

Você também pode gostar