La carencia de un modelo bien definido de representacin de la informacin en la web ha trado consigo problemas de cara a diversos aspectos relacionados con su procesamiento. Para intentar solucionarlos, el W3C, organismo encargado de guiar la evolucin de la web, ha propuesto su transformacin hacia una nueva web denominada web semntica. En este trabajo se presentan las posibilidades que ofrece este nuevo escenario, as como las dificultades para su consecucin, prestando especial atencin a las ontologas, herramientas de representacin del conocimiento fundamentales para la web semntica. Por ltimo, se analiza el papel del profesional de la biblioteconoma y documentacin en este nuevo entorno. No obstante, a pesar de los importantes avances aportados por las nuevas tecnologas, el usuario de la web an carece de un sistema que permita procesar y acceder a la informacin documental contenida en sitios web de una manera fiable. El problema estriba en al menos tres aspectos: en primer lugar, la web es un sistema descentralizado y heterogneo completamente distinto de los escenarios para los que estaban ms o menos bien preparadas las disciplinas clsicas vinculadas con la documentacin y la recuperacin de la informacin. En segundo lugar, lo que sucede en la www es una recuperacin de informacin con adversario (adversarial information retrieval), otro aspecto nunca contemplado por la recuperacin de informacin cl- sica. Por ltimo, originalmente el mtodo de marcado de la informacin, html, combina elementos de contenido con otros de presentacin. Para un ser humano no hay ningn problema en interpretar el ttulo de un documento a partir, por ejemplo, de su preeminencia, su formato y su lugar en la pgina, pero si el autor ha marcado el ttulo con un elemento de formato () en lugar de uno semntico, para un ordenador resultar imposible identificar el ttulo. En todo caso es de esperar que los logros aportados por este nuevo entorno web sean adecuadamente incorporados a cualesquiera otros escenarios dedicados a la gestin de la informacin documental. Qu metodologa se impondr para la generacin de esta futura Web: el procesado manual o el semiautomtico? Por un lado, las descripciones de los contenidos y las ontologas elaboradas por expertos humanos son de gran calidad, aunque su coste en tiempo y dinero es inabarcable (adems cabe la posibilidad de fraude); por otro, la utilizacin de herramientas automticas para agilizar el desarrollo de las descripciones y las ontologas supone una disminucin considerable de los costes, a cambio de descripciones y ontologas ms someras (a menudo meras taxonomas o clasificaciones) que, adems, pueden ser errneas, y que difcilmente satisfacen las exigencias mnimas de las especificaciones del W3C.
La Web semntica es un proyecto a corto, medio y largo plazo del organismo de
regulacin ms importante del mundo en relacin a Internet: el World Wide Web Consortium (W3C a partir de ahora). El proyecto de la Web semntica incluye transformaciones que ya estn afectando a los mbitos de la creacin, edicin y publicacin de pginas y sitios Web2 y que seguirn teniendo una importancia creciente en el futuro.