Você está na página 1de 8

METS: introduccin y tutorial

Introduccin
La gestin de una biblioteca de objetos digitales requiere la gestin de metadatos sobre esos objetos. Los metadatos necesarios para gestionar y usar con xito objetos digitales son ms cmplejos que los que se emplean para gestionar colecciones de documentos impresos y materiales con soporte fsico. Una biblioteca puede registrar metadatos descriptivos sobre un libro de su coleccin, pero el libro nunca se disolver en una serie de pginas independientes, desconectadas, si la biblioteca no registra los metadatos estructurales relativos a la organizacin del libro; tampoco los usuarios se vern incapacitados para valorar la obra si la biblioteca no registra que el libro se produjo usando una prensa offset de un tipo determinado. Sin embargo, esto mismo no podra afirmarse para la versin digital de ese mismo libro. Sin metadatos estructurales, las imgenes y los archivos de texto que conforman el objeto digital tienen poca utilidad, y sin los metadatos tcnicos relativos al proceso de digitalizacin los usuarios no pueden evaluar en qu medida la obra digital es un fiel reflejo del original impreso. Para la gestin interna, la biblioteca debe conocer los metadatos tcnicos para poder refrescar y migrar regularmente los contenidos y asegurar la preservacin de estos valiosos recursos. El proyecto Making of America II (MOA2) trat de afrontar estos problemas y propuso un formato de codificacin de metadatos descriptivos, administrativos y estructurales para obras textuales y basadas en imgenes. METS, una iniciativa de la Digital Library Federation, se desarroll a partir del trabajo de MOA2, y ofrece un formato basado en XML para codificar los metadatos necesarios para la gestin de objetos digitales y para su intercambio entre repositorios (o entre repositorios y sus usuarios). Dependiendo de cmo se aplique, un documento METS podra usarse como un Submission Information Package (SIP), Archival Information Package (AIP), o Dissemination Information Package (DIP) dentro del modelo de referencia Open Archival Information System (OAIS). Un documento METS consta de siete secciones: 1. Cabecera METS - contiene metadatos que describen el propio documento METS, e incluye datos como su creador, editor, etc. 2. Metadatos Descriptivos - Esta seccin puede: a) apuntar a metadatos descriptivos externos al documento METS (por ejemplo, un registro MARC en un OPAC o un documento EAD disponible en un servidor web); b) contener internamente los metadatos descriptivos, o c) combinar ambas aproximaciones. En la seccin Metadatos Descriptivos se pueden incluir mltiples metadatos descriptivos, tanto internos como externos. 3. Metadatos Administrativos - ofrece informacin sobre cmo se crearon y almacenaron los archivos que conforman el objeto digital, derechos de propiedad intelectual, metadatos sobre el objeto original a partir del cual se obtuvo la representacin digital, e informacin sobre la procedencia de los archivos que conforman el objeto digital (es decir, relaciones entre copias maestras y derivadas, migraciones y transformaciones). Al igual que sucede con los metadatos descriptivos, los metadatos administrativos pueden ser externos o codificarse dentro del propio documento METS. 4. Seccin Archivo - lista todos los archivos con contenidos que forman parte del objeto digital. Los archivos pueden agruparse en elementos <fileGrp>, uno para cada una de las distintas versiones del objeto. 5. Mapa Estructural - es la parte principal de un documento METS. Recoge la estructura jerrquica del objeto digital, y enlaza sus secciones con los archivos de contenido y los metadatos correspondientes a cada una de ellas.

6. Enlaces Estructurales - permite registrar la existencia de hiperenlaces entre las secciones del mapa estructural. Tiene gran valor cuando se usa METS para archivar sitios web.

7. Comportamientos - se puede usar para vincular comportamientos ejecutables con los

contenidos del documento METS. Cada comportamiento tiene una definicin de interfaz y un "mecanismo" que identifica un mdulo de cdigo ejecutable que implementa y ejecuta el comportamiento definido de forma abstracta por la interfaz.

Los siguientes apartados recogen una explicacin ms detallada de cada una de estas secciones y sus interrelaciones.

Cabecera METS
El elemento Cabecera METS (METS Header) permite registrar - dentro del propio documento METS - unos mnimos metadatos descriptivos sobre el propio documento METS. Estos metadatos incluyen la fecha de creacin del documento METS, fecha de ltima modificacin y estado. Tambin se puede registrar el nombre de uno o ms agentes que han desempeado alguna funcin en el ciclo de vida del documento METS, especificar dicha funcin y aadir una breve nota sobre estas actividades. Finalmente, se puede registrar una variedad de identificadores alternativos para el documento METS adicionales al identificador principal que se registrar en el atributo OBJID del elemento raz METS. El siguiente fragmento recoge un ejemplo de Cabecera METS:
<metsHdr CREATEDATE="2003-07-04T15:00:00" RECORDSTATUS="Complete"> <agent ROLE="CREATOR" TYPE="INDIVIDUAL"> <name>Jerome McDonough</name> </agent> <agent ROLE="ARCHIVIST" TYPE="INDIVIDUAL"> <name>Ann Butler</name> </agent> </metsHdr>

En este ejemplo el elemento <metsHdr> contiene dos atributos: CREATEDATE y RECORDSTATUS. Indican respectivamente la fecha y hora en que se cre el documento METS y su estado. Se listan dos agentes que han trabajado en este documento: la persona responsable de su creacin y un archivero responsable del material original. Los atributos ROLE y TYPE del elemento <agent> toman sus valores de vocabularios controlados. Los valores permitidos para el atributo ROLE son: "ARCHIVIST," "CREATOR," "CUSTODIAN," "DISSEMINATOR," "EDITOR," "IPOWNER" y "OTHER." Los valores permitidos para el atributo TYPE son: "INDIVIDUAL," "ORGANIZATION" y "OTHER."

Metadatos Descriptivos
La seccin Metadatos Descriptivos consiste en uno o ms elementos <dmdSec> (Descriptive Metadata Section). Cada elemento <dmdSec> puede: a) contener un puntero a metadatos externos (elemento <mdRef>); b) contener metadatos internamente (dentro de un elemento <mdWrap>), o c) combinar estas dos opciones. Metadatos descriptivos externos (mdRef): un elemento mdRef recoge una URI en la que se pueden recuperar metadatos externos. Por ejemplo, la siguiente referencia apunta a un instrumento de descripcin externo para un objeto digital:
<dmdSec ID="dmd001"> <mdRef LOCTYPE="URN" MIMETYPE="application/xml" MDTYPE="EAD" LABEL="Berol Collection Finding Aid">urn:x-nyu:fales1735</mdRef> </dmdSec>

El elemento <mdRef> de este <dmdSec> contiene cuatro atributos. El atributo LOCTYPE especifica el tipo de localizador que se usa; los valores aceptados para LOCTYPE son: 'URN,' 'URL,' 'PURL,' 'HANDLE,' 'DOI,' y 'OTHER.' El atributo MIMETYPE especifica el tipo MIME de los metadatos descriptivos externos, y MDTYPE a qu tipo de metadatos se hace referencia. Los valores aceptados para MDTYPE incluyen MARC, MODS, EAD, VRA (VRA Core), DC (Dublin Core), NISOIMG (NISO Technical Metadata for Digital Still Images), LC-AV (Library of Congress Audiovisual Metadata) , TEIHDR (TEI Header), DDI (Data Documentation Initiative), FGDC (Federal Geographic Data Committee Metadata Standard [FGDC-STD-001-1998] ), y OTHER. LABEL ofrece un mecanismo para describir estos metadatos para aquellas personas que vean el documento METS. Metadatos descriptivos internos (mdWrap): el elemento mdWrap contiene los metadatos dentro del propio documento METS. Estos metadatos podrn ser: 1. metadatos codificados en XML, en cuyo caso se indicar que pertenecen a un espacio de nombres distinto de METS, o 2. metadatos en cualquier otro formato binario o textual (no XML), siempre que los metadatos se codifiquen en Base64 y se escriban dentro de un elemento <binData> contenido dentro del elemento mdWrap. Los siguientes ejemplos muestran el uso del elemento mdWrap:
<dmdSec ID="dmd002"> <mdWrap MIMETYPE="text/xml" MDTYPE="DC" LABEL="Dublin Core Metadata"> <xmlData> <dc:title>Alice's Adventures in Wonderland</dc:title> <dc:creator>Lewis Carroll</dc:creator> <dc:date>between 1872 and 1890</dc:date> <dc:publisher>McCloughlin Brothers</dc:publisher> <dc:type>text</dc:type> </xmlData> </mdWrap> </dmdSec> <dmdSec ID="dmd003"> <mdWrap MIMETYPE="application/marc" MDTYPE="MARC" LABEL="OPAC Record"> <binData>MDI0ODdjam0gIDIyMDA1ODkgYSA0NU0wMDAxMDA...(etc.) </binData> </mdWrap> </dmdSec>

Debemos sealar que todos los elementos <dmdSec> deben contar con un atributo ID. Este atributo asigna un identificador interno, nico en el documento, a cada elemento <dmdSec>. Este identificador podr usarse en el mapa estructural para enlazar una divisin particular de la jerarqua del documento con un elemento <dmdSec> especfico. Esto permite enlazar metadatos descriptivos con secciones especficas del objeto digital.

Metadatos Administrativos
Los elementos <amdSec> contienen los metadatos administrativos correspondientes a los archivos que conforman el objeto digital, y tambin los del material original a partir del cual se cre la representacin digital. En los documentos METS hay cuatro tipos de metadatos administrativos: 1. Metadatos tcnicos (informacin relativa a la creacin del archivo, su formato y caractersticas de uso), 2. Metadatos sobre derechos de propiedad intelectual (copyright e informacin sobre licencias), 3. Metadatos sobre el origen (metadatos descriptivos y administrativos sobre el documento origen a partir del cual se ha generado el objeto digital), y 4. Metadatos sobre la procedencia digital (informacin sobre la relacin entre el documento original y su representacin digital, incluyendo la relacin entre copias maestras y derivadas, migraciones y transformaciones realizadas sobre los archivos desde su digitalizacin inicial). Cada uno de estos cuatro tipos de metadatos administrativos tienen un elemento propio dentro de la seccin <amdSec>: <techMD>, <rightsMD>, <sourceMD>, y <digiprovMD>. Todos pueden repetirse. Los elementos <techMD>, <rightsMD>, <sourceMD> y <digiprovMD> tienen el mismo modelo de contenido que <dmdSec>: pueden contener un elemento <mdRef> para apuntar a

metadatos administrativos externos, un elemento <mdWrap> para incorporar metadatos administrativos dentro del propio documento METS, o combinar ambas opciones. Un documento METS puede incorporar mltiples instancias de estos elementos. y todos ellos deben contar con un atributo ID de forma que otros elementos del documento METS (como las divisiones del mapa estructural o los elementos <file>) puedan hacerles referencia. Por ejemplo, podramos tener un elemento <techMD> con los metadatos tcnicos para un archivo:
<techMD ID="AMD001"> <mdWrap MIMETYPE="text/xml" MDTYPE="NISOIMG" LABEL="NISO Img. Data"> <xmlData> <niso:MIMEtype>image/tiff</niso:MIMEtype> <niso:Compression>LZW</niso:Compression> <niso:PhotometricInterpretation>8</niso:PhotometricInterpretation> <niso:Orientation>1</niso:Orientation> <niso:ScanningAgency>NYU Press</niso:ScanningAgency> </xmlData> </mdWrap> </techMD>

Y un elemento <file> dentro de un elemento <fileGrp> en el que se apuntase a esos metadatos administrativos mediante un atributo ADMID:
<file ID="FILE001" ADMID="AMD001"> <FLocat LOCTYPE="URL">http://dlib.nyu.edu/press/testimg.tif</FLocat> </file>

Seccin Archivo
La seccin archivo (<fileSec>) contiene uno o ms elementos <fileGrp>. Estos agrupan archivos relacionados entre s. Un <fileGrp> rene todos los archivos que conforman una misma versin electrnica del objeto digital. Por ejemplo, puede haber elementos <fileGrp> para las miniaturas, las copias maestras (alta resolucin) de las imgenes, la versin en pdf , la versin codificadas en TEI, etc. El siguiente ejemplo muestra una seccin Archivo para un registro sonoro del que hay tres versiones: una transcripcin codificada en TEI, una copia maestra audio en formato WAV y una versin audio derivada de la anterior en formato MP3:
<fileSec> <fileGrp ID="VERS1"> <file ID="FILE001" MIMETYPE="application/xml" SIZE="257537" CREATED="2001-06-10"> <FLocat LOCTYPE="URL">http://dlib.nyu.edu/tamwag/beame.xml</FLocat> </file> </fileGrp> <fileGrp ID="VERS2"> <file ID="FILE002" MIMETYPE="audio/wav" SIZE="64232836" CREATED="2001-05-17" GROUPID="AUDIO1"> <FLocat LOCTYPE="URL">http://dlib.nyu.edu/tamwag/beame.wav</FLocat> </file> </fileGrp> <fileGrp ID="VERS3" VERSDATE="2001-05-18"> <file ID="FILE003" MIMETYPE="audio/mpeg" SIZE="8238866" CREATED="2001-05-18" GROUPID="AUDIO1"> <FLocat LOCTYPE="URL">http://dlib.nyu.edu/tamwag/beame.mp3</FLocat> </file> </fileGrp> </fileSec>

En este caso, <fileSec> contiene tres elementos <fileGrp>, uno para cada versin del objeto. El primero es una transcripcin codificada en XML, el segundo es una versin audio en formato WAV, y el tercero una versin audio en formato MP3. Aunque en este ejemplo puede no parecer necesario utilizar elementos <fileGrp> para las distintas versiones del objeto, <fileGrp> sera mucho ms til si el objeto consistiese en un gran nmero de imgenes escaneadas, o si cada versin del objeto constase de un mayor nmero de archivos. En estos casos, ser capaz de

agrupar los elementos <file> en distintos <fileGrp> facilita la identificacin de los archivos que pertenecen a cada versin. En el ejemplo anterior se puede apreciar la presencia de atributos GROUPID con idnticos valores en los elementos <file> correspondientes a los archivos de audio; esto indica que esos dos archivos recogen la misma informacin, aunque forman parte de distintas versiones (tambin se puede usar GROUPID para indicar equivalencias entre archivos de imagen en objetos digitales que contengan varias pginas escaneadas). Podemos ver igualmente que todos los elementos <file> tienen un nico atributo ID. Este atributo da un identificador nico a cada archivo, para poder hacerles referencia desde otras secciones del documento. Estas referencias se describen en la seccin correspondiente al Mapa Estructural. Debemos mencionar que los elementos <file> pueden incluir un elemento <FContent> en lugar de un elemento <FLocat>. Los elementos <FContent> se usan para incorporar los contenidos dentro del propio documento METS; de hacerse as, los contenidos del archivo pueden ser datos en formato XML o datos codificados en Base64. La inclusin de archivos empotrados no es algo que se haga frecuentemente en documentos METS creados para mostrar objetos digitales a los usuarios, pero puede ser interesante para intercambiar objetos digitales entre repositorios o para archivar objetos digitales (almacenamiento off-site).

Mapa Estructural
La seccin Mapa Estructural de un documento METS define una estructura jerrquica que puede presentarse a los usuarios para navegar a travs del objeto digital. El elemento <structMap> establece esta jerarqua como una serie de elementos <div> anidados. Cada <div> cuenta con atributos que especifican de qu tipo de divisin se trata; tambin puede contener mltiples punteros METS (<mptr>) y punteros a archivos (<fptr>) para identificar los contenidos correspondientes a esa seccin. Los punteros METS apuntan a documentos METS aparte que contienen la informacin sobre los archivos relevantes para la seccin <div>. Son tiles cuando se codifican grandes colecciones de materiales (por ejemplo, una revista completa) y se quiere mantener el tamao de cada documento METS relativamente pequeo. Los punteros a archivos indican qu archivos (o en ciertos casos, qu grupos de archivos o partes de un archivo) previamente declarados en la seccin <fileSec> del documento METS se corresponden con la seccin representada por el elemento <div>. A continuacin se muestra un ejemplo de mapa estructural:
<structMap TYPE="logical"> <div ID="div1" LABEL="Oral History: Mayor Abraham Beame" TYPE="oral history"> <div ID="div1.1" LABEL="Interviewer Introduction" ORDER="1"> <fptr FILEID="FILE001"> <area FILEID="FILE001" BEGIN="INTVWBG" END="INTVWND" BETYPE="IDREF" /> </fptr> <fptr FILEID="FILE002"> <area FILEID="FILE002" BEGIN="00:00:00" END="00:01:47" BETYPE="TIME" /> </fptr> <fptr FILEID="FILE003"> <area FILEID="FILE003" BEGIN="00:00:00" END="00:01:47" BETYPE="TIME" /> </fptr> </div> <div ID="div1.2" LABEL="Family History" ORDER="2"> <fptr FILEID="FILE001"> <area FILEID="FILE001" BEGIN="FHBG" END="FHND" BETYPE="IDREF" /> </fptr> <fptr FILEID="FILE002"> <area FILEID="FILE002" BEGIN="00:01:48"END="00:06:17"

BETYPE="TIME" /> </fptr> <fptr FILEID="FILE003"> <area FILEID="FILE003" BEGIN="00:01:48" END="00:06:17" BETYPE="TIME" /> </fptr> </div> <div ID="div1.3" LABEL="Introduction to Teachers' Union" ORDER="3"> <fptr FILEID="FILE001"> <area FILEID="FILE001" BEGIN="TUBG" END="TUND" BETYPE="IDREF" /> </fptr> <fptr FILEID="FILE002"> <area FILEID="FILE002" BEGIN="00:06:18" END="00:10:03" BETYPE="TIME" /> </fptr> <fptr FILEID="FILE003"> <area FILEID="FILE003" BEGIN="00:06:18" END="00:10:03" BETYPE="TIME" /> </fptr> </div> </div> </structMap>

Este mapa estructural se corresponde con un registro sonoro (una entrevista al Alcalde Abraham Beame de la ciudad de Nueva York) e incluye tres subsecciones: una introduccin por parte del entrevistador, la historia familiar por parte del Alcalde Beame, y una discusin de cmo lleg a participar en el sindicato de maestros de Nueva York. Cada una de estas subsecciones o divisiones est enlazada con tres archivos (los mismos que usamos en el ejemplo anterior): una transcripcin XML, un archivo audio maestro y uno correspondiente a una versin derivada. El elemento hijo <area> se usa en cada <fptr> para indicar que la divisin se corresponde nicamente con una parte del archivo al que se hace referencia, y con l se identifica la parte exacta del archivo. Por ejemplo, la primera divisin (la introduccin por parte del entrevistador) est enlazada a un fragmento del archivo con la transcripcin XML (FILE001) que se encuentra entre las dos etiquetas del archivo cuyos atributos ID recogen los valores "INTVWBG" y "INTVWND". Tambin est enlazado a los dos archivos de audio; en esos casos, en lugar de especificar valores del atributo ID para acotar el fragmento, su inicio y fin se indica en forma de tiempo HH:MM:SS. As, la introduccin del entrevistador se puede encontrar en los archivos de audio en los fragmentos que comienzan en el instante 00:00:00 y que tienen una duracin de 00:01:47.

Enlaces Estructurales
La seccin Enlaces Estructurales es la ms sencilla de todas las secciones METS, y contiene un nico elemento <smLink> (que puede repetirse). La seccin tiene como finalidad registrar la presencia de hiperenlaces entre las distintas partes del mapa estructural, codficadas mediante elementos <div>. Es til si se quiere usar METS para archivar sitios web y mantener un registro de su estructura hipertextual a parte de la que se establecen mediante los hiperenlaces de las propias pginas HTML. Como ejemplo, veamos un documento METS para una pgina web que contiene una imagen que sirve de origen de un enlace a otra pgina. El elemento <structMap> contendra probablemente <divs> como los siguientes para las dos pginas:
<div ID="P1" TYPE="page" LABEL="Page 1"> <fptr FILEID="HTMLF1"/> <div ID="IMG1" TYPE="image" LABEL="Image Hyperlink to Page 2"> <fptr FILEID="JPGF1"/> </div> <div ID="P2" TYPE="page" LABEL="Page 2"> <fptr FILEID="HTMLF2"/> </div>

Si se quisiese indicar que el archivo de imagen est enlazado al archivo HTML de la segunda pgina <div>, tendramos un elemento <smLink> dentro de la seccin <structLink> como la siguiente:
<smLink from="IMG1" to="P2" xlink:title="Hyperlink from JPEG Image on Page 1 to Page 2" xlink:show="new" xlink:actuate="onRequest" />

El elemento <smLink> anterior usa la sintaxis XLink ligeramente modificada; todos los atributos XLink se utilizan, pero los atributos "to" y "from" se declaran de tipo IDREF en lugar de NMTOKEN, como se hace en la especificacin original XLink. Esto permite indicar la presencia de enlaces entre cualquier par de divisiones del mapa estructural, y tambin usar herramientas de procesamiento XML para confirmar que las dos divisiones existen realmente.

Seccin Comportamiento
Una seccin Comportamiento (behavior) puede usarse para asociar comportamientos ejecutables al contenido de un documento METS. Una seccin Comportamiento contiene uno o ms elementos <behavior>, y cada uno de ellos tiene un elemento de definicin de interfaz. Un <behavior> tambin tiene un elemento <mechanism> que apunta a un mdulo de cdigo ejecutable que implementa el comportamiento definido de forma abstracta por la definicin de la interfaz. Los comportamientos de objetos digitales pueden implementarse como enlaces a servicios web distribuidos, como en el siguiente ejemplo del proyecto Mellon Fedora.
<METS:behavior ID="DISS1.1" STRUCTID="S1.1" BTYPE="uva-bdef:stdImage" CREATED="2002-05-25T08:32:00" LABEL="UVA Std Image Disseminator" GROUPID="DISS1" ADMID="AUDREC1"> <METS:interfaceDef LABEL="UVA Standard Image Behavior Definition" LOCTYPE="URN" xlink:href="uva-bdef:stdImage"/> <METS:mechanism LABEL="A NEW AND IMPROVED Image Mechanism" LOCTYPE="URN" xlink:href="uva-bmech:BETTER-imageMech"/> </METS:behavior>

Vase adems: Fedora: especificacin tcnica (pdf) Objeto digital (ejemplo) (codificado en METS) Objeto de definicin de comportamiento (ejemplo) (codificado en METS) Objeto de mecanismo de comportamiento (ejemplo) (codificado en METS)

Conclusin
El esquema METS ofrece un medio flexible para codificar metadatos descriptivos, administrativos y estructurales para un objeto digital, y expresar las complejas relaciones entre estos tipos de metadatos. Ofrece un estndar til para el intercambio de objetos digitales entre repositorios. Adems, METS permite asociar objetos digitales con comportamientos o servicios. Los prrafos anteriores destacan las principales caractersticas del esquema, pero se recomienda un examen ms detallado del esquema y de su documentacin para comprender todas sus posibilidades.

Traducido por el profesor Ricardo Eito Brun, Ciencias de Bibliotecologia e Information de la Universidad Carlos III de Madrid, Espaa.

Você também pode gostar