Escolar Documentos
Profissional Documentos
Cultura Documentos
Resumo
Índice de Conteúdos
Introdução ................................................................... 8
Agradecimentos e Colaboradores (versão 1.0) .............................................. 8
Agradecimentos e Colaboradores (versão 2.0) .............................................. 8
Editores ........................................................................................ 8
Peritos e Revisores ........................................................................... 8
Sobre o DRIVER .................................................................................. 9
O que é o DRIVER............................................................................. 9
DRIVER como infra-estrutura de dados...................................................10
O espaço de informação actual do DRIVER ..............................................10
Desafios..........................................................................................10
O que esperam os investigadores .........................................................10
O desafio do texto integral ................................................................11
O que se segue? .............................................................................11
Sobre as Directrizes DRIVER ..................................................................12
Porquê utilizar as Directrizes DRIVER? ...................................................12
Como cumprir as Directrizes DRIVER? (validação) ......................................12
E se não cumprir? ...........................................................................12
Existe suporte? ..............................................................................13
Âmbito das Directrizes DRIVER ............................................................13
Mais Recursos ................................................................................16
Esboço – Sumário das Directrizes DRIVER ...................................................18
PARTE A – Recursos Textuais ..............................................................18
PARTE B - Metadados .......................................................................19
PARTE C – Implementação OAI-PMH ......................................................20
O que é novo .............................................................. 22
Capítulo 1: Uso do OAI-PMH ..................................................................22
Atribuição de nome ao conjunto DRIVER ................................................22
Tamanho do lote de recolha ...............................................................23
Testemunho de reatamento (resumption token) .......................................23
Introdução
A criação das Directrizes DRIVER 2.0 contou com a experiência de muitas pessoas.
Todas essas pessoas são especialistas e gestores de repositórios. Este grupo tem
trabalhado em conjunto para conseguir a interoperabilidade para que possa ser
aplicada na prática. Neste contexto, as pessoas referidas em seguida, aprovam e
apoiam as Directrizes DRIVER 2.0.
Editores
Peritos e Revisores
Sobre o DRIVER
O que é o DRIVER
A fase inicial do DRIVER criou os pilares para uma rica e ambiciosa infra-estrutura pan-
europeia de repositórios. A paisagem dos repositórios digitais é multifacetada no que
concerne aos diferentes países, aos diferentes tipos de recursos como texto, dados ou
multimédia, às diferentes plataformas tecnológicas, às diferentes políticas de
metadados, etc. No entanto, existem bases comuns que se aplicam a grande parte
deste espectro: o tipo de recurso mais comum nos repositórios digitais é o texto e a
principal forma de oferecer estes recursos textuais é o protocolo OAI-PMH. Por esse
motivo, a fase actual do DRIVER centra-se nos recursos textuais que podem ser
recolhidos através do protocolo OAI-PMH.
Desafios
cultura actual no panorama dos repositórios digitais não suporta completamente estas
expectativas. Embora muitos serviços de valor acrescentado tenham sido
implementados para pesquisar e recuperar registos bibliográficos (metadados), o
recurso em si mesmo é, por vezes, ocultado por detrás de várias páginas intermédias,
obscurecido por procedimentos de autorização, apresentado de forma incompleta ou
totalmente irrecuperável. No entanto, para conseguir uma comunicação científica
óptima seria necessário que o recurso fosse obtido com apenas um clique do rato.
Adicionalmente, uma recuperação simples do texto integral e dos metadados facilita o
tratamento automático do conteúdo. Nem o registo bibliográfico recolhido nem o
texto completo recuperado em separado - apenas a combinação de ambos - permitem
o desenvolvimento de serviços avançados e integrados, como a pesquisa por assuntos
combinada com a navegação através de classificações, análise de citações, etc.
Favorecer o acesso directo a recursos textuais foi identificado como um grande desafio
na fase de testes do DRIVER. Embora o consórcio DRIVER dedique todos os esforços
possíveis para abordar este desafio do ponto de vista tecnológico através do
processamento de dados agregados, os detentores de repositórios digitais podem
apoiar localmente o DRIVER através do fornecimento de conteúdos de uma forma
específica. As Directrizes DRIVER aqui apresentadas irão facultar orientações para que
os fornecedores de conteúdos locais saibam como disponibilizar os seus conteúdos.
O que se segue?
Num futuro próximo, o DRIVER oferecerá aos repositórios locais um modo para aferir o
grau de conformidade com as directrizes através de uma interface Web1. O DRIVER
também oferece suporte via Web (ver em baixo “Existe Suporte?”). Se os pontos
obrigatórios das Directrizes DRIVER forem cumpridos, o repositório recebe o estatuto
de fornecedor DRIVER validado. Se também forem cumpridos os pontos recomendados,
o repositório recebe o estatuto de fornecedor DRIVER certificado para o futuro. Os
repositórios DRIVER validados podem reutilizar dados do DRIVER para desenvolver
serviços locais. Passam a integrar a rede de fornecedores de conteúdos DRIVER.
E se não cumprir?
1
Para a validação das Directrizes DRIVER 1.0 ver:
http://validator.driver.research-infrastructures.eu/
Existe suporte?
O DRIVER oferece suporte aos repositórios locais para que possam implementar as
directrizes numa base individual. O suporte pode ser obtido através da internet2 ou
pode ser pessoal3. O DRIVER está empenhado em qualquer solução possível que possa
realizar-se através do processamento central de dados. Não obstante, o caminho
sustentável, transparente e escalável para serviços melhorados passa pelos
repositórios locais.
Não. Embora o uso de normas como o OAI-PMH proporcione certamente uma base
sólida para criar uma rede como o DRIVER, são necessárias directrizes adicionais. O
principal motivo é que as normas ainda dão lugar a interpretações e implementações
locais. Sem isso, uma norma não poderia existir. Porém esta abertura pode-se
converter num obstáculo para a obtenção de serviços de alta qualidade quando se
combinam implementações divergentes.
2
Website de suporte DRIVER: http://www.driver-support.eu
3
Ver documento: “Advice for implementation of the DRIVER guidelines”,
www.driver-support.eu/documents/Advice_for_implementation_of_the_DRIVER_guidelines.pdf
pelo DRIVER. Não estão pensadas para serem utilizadas como instruções de introdução
de dados na inserção de metadados nos sistemas de repositório locais.
Não. As directrizes não indicam que recursos possuem o nível de qualidade requerido
no que respeita ao conteúdo científico. Assumiremos que esta distinção já foi feita ao
nível dos repositórios, isto é, assumiremos que a qualidade dos recursos expostos
através da recolha é suficientemente boa.
Nesta fase do projecto DRIVER estamos focados nos recursos textuais. Como definições
de trabalho utilizamos as seguintes:
Muitos repositórios são utilizados para depositar diferentes tipos de recursos, por
exemplo, artigos, livros, fotografias, vídeos, conjuntos de dados (data sets) ou
recursos de aprendizagem. Estes recursos possuem registos de metadados que os
descrevem. Normalmente, os recursos encontram-se em formato digital (mas nem
sempre) e estes ficheiros digitais são usualmente armazenados numa base de dados
que é parte do sistema do repositório (mas nem sempre). O acesso aos recursos é
geralmente livre (mas nem sempre). No DRIVER almejamos um subconjunto do vasto
domínio de recursos existentes nos repositórios europeus: focamos recursos textuais
em formato digital e que são de acesso livre.
Estudos indicam que deste modo poderemos cobrir mais de 80% de todos os recursos
disponíveis. Por este motivo, a primeira directriz obrigatória da Parte A refere: “o
repositório contém recursos textuais digitais”. Isto não significa que o repositório não
possa incluir outros materiais ou itens não-digitais. A afirmação é uma expressão do
foco do DRIVER em recursos textuais. Uma lista completa de recursos textuais é
apresentada no elemento dc:type nas directrizes de metadados no capítulo “Uso de
vocabulários e semânticas” secção “Vocabulário tipo de publicações”. Para a
implementação no dc:type ver capítulo “Uso de metadados OAI_DC” secção “Type
(Tipo)”. Ou para mapear os tipos de acordo com os mapeamentos actualmente
conhecidos ver secção “Mapeamento de tipos DRIVER” no capítulo “Uso das práticas
recomendadas com OAI_DC”.
Mais Recursos
Foram utilizados recursos existentes como contributo para elaborar estas Directrizes
DRIVER e prestou-se particular atenção para evitar soluções especiais. Assim, poder-
se-á afirmar que as Directrizes DRIVER exploram ao máximo a experiência prática e
outras directrizes existentes a nível internacional.
4
http://www.dini.de/documents/dini-zertifikat2007-en.pdf
https://www.surfgroepen.nl/sites/oai/metadata/Shared%20Documents/Use%20of%20MODS%20f
or%20institutional%20repositories-version%201.doc
6
http://www.lse.ac.uk/library/vif/Framework/Essential/taxonomies.html
7
http://www.lse.ac.uk/library/versions/
O seguinte esboço resume as definições básicas DRIVER para os tópicos sobre recursos
textuais, utilização de metadados e implementação do protocolo OAI-PMH. Os detalhes
completos podem ser encontrados nos capítulos seguintes.
obrigatório
8
http://xml.coverpages.org/mpeg21-didl.html
9
http://african.lanl.gov/aDORe/projects/adoreArchive/
10
http://www.loc.gov/standards/mets/mets-profiles.html
11
http://www.openarchives.org/ore/
recomendado
PARTE B - Metadados
obrigatório
recomendado
obrigatório
recomendado
12
Antevisão das MODS guidelines
https://www.surfgroepen.nl/sites/oai/metadata/Shared%20Documents/Use%20of%20MODS%20f
or%20institutional%20repositories-version%201.doc
O que é novo
Explicação: As Directrizes DRIVER são para uma comunidade mais ampla. A recolha de
e-Teses deverá ser reconhecida através dos termos usados no vocabulário de tipos de
publicação.
Aumentar o tamanho de lote de 100-200 registos por lote, para 100-500 registos por
lote. Ver: Tamanho do lote de recolha na página 45.
As Directrizes DRIVER explicam agora de forma mais clara porque razão uma estratégia
persistent/transient é valiosa tanto para o repositório como para o fornecedor de
serviços.
Identifier (Identificador)
Date (Data)
O que fazer quando a data recomendada nas Directrizes DRIVER (data de criação) não
está disponível no repositório?
Nas Directrizes DRIVER: "Use o elemento DC „date‟ para o valor do qualificador: data
de publicação. A data preferencial é a data de publicação, porque é a data mais
significativa e útil para o utilizador final. Se a data de publicação não está disponível,
use outra data disponível. É sempre melhor usar uma data do que nenhuma." Ver: Date
(Data) na página 70.
Rights (Direitos)
Explicação sobre como usar o campo dc:rights. Ver: Rights (Direitos) na página 83.
Language (Idioma)
A recomendação de codificação mudou para ISO 639-3. Ressegurando-se que a ISO 639-
1 e -2 ainda são permitidas, uma vez que podem ser mapeadas correctamente.
Explicação: A codificação ISO 639-3 possui muitos mais idiomas do que ISO 639-1,
mesmo idiomas históricos e idiomas sub-regionais. Isto torna a explicação de certas
publicações mais fácil. A ISO 639-2 possui dois tipos de codificação (b e t), o que a
torna mais ambígua quando utilizada em OAI-DC. A última não proporciona um
atributo que notifica qual dos dois esquemas de codificação foi utilizado.
Ver:
Language (Idioma) na página 80.
Creator (Autor)
Por exemplo
Source (Fonte)
Type (Tipo)
Mudança de vocabulário
Os tipos publicação são tipos bem pensados que não explicam o tipo de documento,
mas o tipo de publicação. Estas publicações têm sido utilizadas em processos
académicos comuns. Os termos são escolhidos para criar um equilíbrio entre não muito
específicos (que só se aplicam a uma comunidade científica) e não muito genéricos.
Outra coisa que estava a faltar era um espaço de nome (namespace) que gerasse um
nível de autoridade de um vocabulário controlado. O URI espaço de nome info:eu-repo
foi especialmente concedido pelas autoridades para ser utilizado neste propósito.
O vocabulário para tipos de publicação do DRIVER foi produzido de acordo com estes
critérios.
Format (Formato)
Explicação: como mapear [x] categorias locais para [y] categorias DRIVER.
DC:SOURCE e DC:RELATION
<didl:DIDL
xmlns:didl="urn:mpeg:mpeg21:2002:02-DIDL-NS"
xmlns:dcterms="http://purl.org/dc/terms/"
xmlns:diext="http://library.lanl.gov/2004-04/STB-RL/DIEXT"
xmlns:dii="urn:mpeg:mpeg21:2002:01-DII-NS"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="
urn:mpeg:mpeg21:2002:02-DIDL-NS http://purl.lanl.gov/STB-
RL/schemas/2004-08/DIDL.xsd urn:mpeg:mpeg21:2002:01-DII-NS
http://purl.lanl.gov/STB-RL/schemas/2003-09/DII.xsd
http://library.lanl.gov/2004-04/STB-RL/DIEXT http://purl.lanl.gov/STB-
RL/schemas/2004-04/DIEXT.xsd">
Passa para:
<didl:DIDL
xmlns:didl="urn:mpeg:mpeg21:2002:02-DIDL-NS"
xmlns:dii="urn:mpeg:mpeg21:2002:01-DII-NS"
xmlns:dip="urn:mpeg:mpeg21:2005:01-DIP-NS"
xmlns:dcterms="http://purl.org/dc/terms/"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="
urn:mpeg:mpeg21:2002:02-DIDL-NS
http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-
21_schema_files/did/didl.xsd
urn:mpeg:mpeg21:2002:01-DII-NS
http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-
21_schema_files/dii/dii.xsd
urn:mpeg:mpeg21:2005:01-DIP-NS
http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-
21_schema_files/dip/dip.xsd">
<didl:DIDL>
<didl:Container>
<didl:Item>…</didl:Item>
<didl:Item>…</didl:Item>
<didl:Item>…</didl:Item>
</didl:Container>
</didl:DIDL>
Passa para:
<didl:DIDL>
<didl:Item>
<didl:Item>…</didl:Item>
<didl:Item>…</didl:Item>
<didl:Item>…/didl:Item>
</didl:Item>
</didl:DIDL>
Passa para:
<didl:Descriptor>
<didl:Statement mimeType="text/plain">metadata</didl:Statement>
</didl:Descriptor>
<didl:DIDL>
<didl:Item>
<didl:Descriptor>
<didl:Statement mimeType="application/xml">
<dii:Identifier>urn:NBN:nl:ui:10-
1705/6748398729821</dii:Identifier>
</didl:Statement>
</didl:Descriptor>
...
<didl:Component>
<!-- Actual resource of Item -->
<didl:Resource mimeType="application/xml"
ref="http://localhost/xmlContainer-
v2.3.xml"/>
</didl:Component>
<didl:Item>...</didl:Item>
<didl:Item>...</didl:Item>
<didl:Item>...</didl:Item>
</didl:Item>
<request metadataPrefix="dare_didl"
Passa para:
<request metadataPrefix="didl"
Foram produzidos dois vocabulários para reduzir a ambiguidade dos conceitos e termos
utilizados na comunicação científica na Europa.
Identificadores persistentes para recursos Web são necessários para criar uma infra-
estrutura estável e fiável. Isto não diz respeito a aspectos técnicos, mas,
principalmente, a acordos a um nível organizacional.
Para aferir valor do Acesso Livre e oferecer serviços adicionais aos seus autores, os
repositórios devem pensar na agregação de estatísticas de utilização.
Este capítulo aborda uma temática importante sobre direitos de utilização e direitos
de depósito. Na prática, isto deve ser implementado. As Directrizes DRIVER devem
dizer algo sobre a forma como os direitos de utilização e direitos de acesso devem ser
expostos e formatados nos metadados.
Introdução
Este capítulo explica como usar o OAI-PMH para que os repositórios e os fornecedores
de serviços possam trabalhar perfeitamente em conjunto, criando interoperabilidade
ao nível do protocolo.
Nota:
Os exemplos usados para DIDL, NÃO devem ser utilizados literalmente! Para o uso
correcto do documento DIDL ver a versão actual do documento especificações DIDL.
Esse documento irá sobrepor-se a todos os exemplos DIDL mencionados aqui.
Agradecimentos
Fonte de informação
Ver: http://www.openarchives.org/OAI/openarchivesprotocol.html
Item e Registo
Identificador (identifier)
Dentro do
repositório
Harvester A Harvester B
Ver:
http://www.openarchives.org/OAI/openarchivesprotocol.html#MetadataNamespaces
Documento DIDL
<OAI-PMH ...>
<...>
<record>
<metadata>
<didl:DIDL>
<didl:Item>...</didl:Item>
Ver: http://www.openarchives.org/OAI/openarchivesprotocol.html#Datestamp,
http://www.openarchives.org/OAI/openarchivesprotocol.html#Dates e
http://www.w3.org/TR/NOTE-datetime
O valor das datas de registo (datestamps) tanto nos pedidos como nas respostas deve
estar em conformidade com as especificações de UTCdatetime referida nesse
documento. O acordo DRIVER apoia o uso granular opcional no que concerne ao tempo
com segundos YYYY-MM- DDThh:mm:ssZ.
Este valor está de acordo com as especificações para o UTCdatetime nas secções 3.3.1
no documento do protocolo OAI-PMH. Registos de datas são codificados usando a
norma ISO8601 e expressos em UTC.
<OAI-PMH ...>
<...>
<GetRecord>
<record>
<header>
<datestamp>2001-12-14T12:01:45Z</datestamp>
<OAI-PMH ...>
<...>
<Identify>
<granularity>YYYY-MM-DDThh:mm:ssZ</granularity>
<...>
Registos eliminados
Ver: http://www.openarchives.org/OAI/openarchivesprotocol.html#DeletedRecords
Ver: http://www.openarchives.org/OAI/openarchivesprotocol.html#Idempotency
Boa prática: o tempo razoável para que um testemunho seja conservado é de pelo
menos vinte e quatro (24) horas. Isto depende do tamanho do repositório e da
velocidade de processamento e por isso a longevidade do testemunho de reatamento
deverá aguentar o tempo suficiente para transportar o lote nesse período de tempo.
Conjuntamente com este tempo de vida existe um tamanho de lote óptimo - ver
secção “Tamanho do lote de recolha”.
<resumptionToken expirationDate="2008-07-14T23:00:24Z"
completeListSize="983" cursor="0">514284267</resumptionToken>
Está acordado que os repositórios DRIVER devem definir o tamanho do lote entre 100 a
500 registos.
Utilizando este tamanho de lote para todos os repositórios DRIVER, permitirá que o
harvester opere com um rendimento óptimo.
Ver: http://www.openarchives.org/OAI/openarchivesprotocol.html#Set
Está acordado que os repositórios DRIVER híbridos que possuem apenas metadados e
metadados acompanhados com recursos em texto integral devem suportar pelo menos
um conjunto (set) DRIVER. O conjunto DRIVER é plano e não possui nenhuma estrutura
hierárquica. O conteúdo do conjunto DRIVER é recursos de Acesso Livre, disponíveis
livremente. Recursos com acesso diferido ou embargados não devem estar nesta lista
para evitar confusão ao utilizador final. A tabela seguinte indica o setName e a
especificação setSpec que se podem utilizar para criar um conjunto DRIVER.
setName setSpec *
O conjunto DRIVER Open Access DRIVERset driver
*Um harvester apenas utiliza o pedido setSpec para realizar recolha selectiva. Os
caracteres devem estar em minúsculas.
O conjunto DRIVER contém registos que devem conter recursos textuais digitais
de acesso livre
<record>
<header>
<identifier>oai:repository:it/0112017</identifier>
<datestamp>2002-02-28</datestamp>
<setSpec>biochemistry</setSpec>
<setSpec>neurophysics</setSpec>
<setSpec>driver</setSpec>
</header>
<metadata>
<oai_dc:dc xmlns:oai_dc="http ....
</record>
Ilustração:
Registos no conjunto
DRIVER Todos os registos no
repositório local
Registos no
conjunto
Biochemistry
Registos no conjunto
Neurophysics
Ver: http://www.openarchives.org/OAI/openarchivesprotocol.html#Identify
Num futuro próximo pretendemos que o harvester forneça uma resposta imediata ao
administrador do repositório para informar sobre os erros que este repositório DRIVER
<OAI-PMH ...>
<...>
<Identify>
<adminEmail>somebody@loc.gov</adminEmail>
<adminEmail>anybody@loc.gov</adminEmail>
<...>
Boa prática: Use este contentor (container) para descrever o maior número possível de
informações comuns sobre o repositório quanto com inclusão de exemplos. Isto inclui
esquemas de classificação (em que formato em que elemento), vocabulários utilizados
(tipo, idioma), políticas e informações de contextualização.
Boa prática: Use o elemento provenance na tag about dos metadados para
relacionar com o fornecedor do documento original.
Exemplo:
<about>
<provenance xmlns="http://www.openarchives.org/OAI/2.0/provenance"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/provenance
http://www.openarchives.org/OAI/2.0/provenance.xsd">
<originDescription harvestDate="2002-02-02T14:10:02Z" altered="true">
<baseURL>http://the.oa.org</baseURL>
<identifier>oai:r2.org:klik001</identifier>
<datestamp>2002-01-01</datestamp>
<metadataNamespace>http://www.openarchives.org/OAI/2.0/oai_dc/</metadata
Namespace>
<originDescription harvestDate="2002-01-01T11:10:01Z" altered="false">
<baseURL>http://some.oa.org</baseURL>
<identifier>oai:r2.org:klik001</identifier>
<datestamp>2001-01-01</datestamp>
<metadataNamespace>http://www.openarchives.org/OAI/2.0/oai_dc/</metadata
Namespace>
</originDescription>
</originDescription>
</provenance>
</about>
O uso recomendado de prefixos e espaços de nomes indica que estas entidades devem
ser declaradas no primeiro elemento desse espaço de nomes. Com isto, evita-se
“dificuldades operacionais” conforme descritas em: http://www.w3.org/TR/REC-xml-
names/#ns-using.
“O prefixo do espaço de nomes (namespace prefix), a não ser que seja xml ou xmlns,
DEVE ter sido declarado num atributo da declaração de espaço de nomes na etiqueta
<OAI-PMH
xmlns="http://www.openarchives.org/OAI/2.0/"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns:didl="urn:mpeg:mpeg21:2002:02-DIDL-NS"
xmlns:dii="urn:mpeg:mpeg21:2002:01-DII-NS"
xmlns:dcterms="http://purl.org/dc/terms/"
xsi:schemaLocation="
http://www.openarchives.org/OAI/2.0/
http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd
urn:mpeg:mpeg21:2002:02-DIDL-NS
http://standards.iso.org/.../didl.xsd
urn:mpeg:mpeg21:2002:01-DII-NS http://standards.iso.org/.../dii.xsd
"
>
<...>
<metadata>
<didl:DIDL>
<...>
</didl:DIDL>
</metadata>
</...>
<OAI-PMH>
Validação XML
Para que um validador possa validar um documento XML, deve ser utilizado dentro do
documento o xsi:schemaLocation(s).
<OAI-PMH
xmlns="http://www.openarchives.org/OAI/2.0/"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="
http://www.openarchives.org/OAI/2.0/
http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"
>
<oai_dc:dc
xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xsi:schemaLocation="
http://www.openarchives.org/OAI/2.0/oai_dc/
http://www.openarchives.org/OAI/2.0/oai_dc.xsd
http://purl.org/dc/elements/1.1/
http://dublincore.org/schemas/xmls/simpledc20021212.xsd"
>
urn:mpeg:mpeg21:2002:01-DII-NS
http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-
21_schema_files/dii/dii.xsd
urn:mpeg:mpeg21:2005:01-DIP-NS
http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-
21_schema_files/dip/dip.xsd">
(http://helpdesk.driver.research-infrastructures.eu/)
Agradecimentos
Ver: http://www.intute.ac.uk/publications/eprints-uk/simpledc-guidelines.html
Definições
“Um repositório institucional (RI) é um serviço composto por hardware, software,
dados e procedimentos, que contém recursos digitais que representam qualquer tipo
de produção científica…”
Notas introdutórias
Âmbito
13
Compact Oxford Dictionary of Current English third edition
14
Especificações OAI-PMH “For purposes of interoperability, repositories must disseminate
Dublin Core, without any qualification.”
http://www.openarchives.org/OAI/openarchivesprotocol.html#MetadataNamespaces
Requisitos mínimos
Recomendações
Simplificação e Qualificadores
Formato interno
245 $aMain title$sSub-title
DC Qualificado
<dc:title>Main title</dc:title>
<dcterms:alternative>Sub- title</dcterms:alternative>
DC Não qualificado
<dc:title>Main title:Sub-title </dc:title>
No DRIVER, isto significa que o elemento „date‟ (data) está sempre associado à data de
publicação, etc. Recomenda-se que todos os fornecedores de conteúdos facultem esta
informação a harvesters externos como informação sobre seu repositório (na resposta
ao Identify OAI-PMH).
Title (Título)
Nome do Title
elemento
Definição Nome atribuído ao recurso. Normalmente, o título é o nome pelo qual o
DCMI recurso é formalmente conhecido.
Uso Obrigatório
Instruções Conservar o texto original, a ordem e a ortografia do título do recurso.
de uso Utilizar maiúsculas apenas para nomes próprios. A pontuação não tem
que reflectir o uso do original. Os subtítulos devem separar-se do título
com
Exemplos <dc:title>Título principal : Título paralelo</dc:title>
<dc:title>Dewey Classificatie in Archief systemen:Dewey
Classification in Archival systems</dc:title>
<dc:title>Preliminary studies for the "Philosophical
Investigations", generally known as the blue and brown books
</dc:title>
Creator (Autor)
Nome do Creator
elemento
Definição A principal entidade responsável pela criação dos conteúdos do recurso.
DCMI Normalmente, o nome de um „Creator‟ deverá ser utilizado para indicar
a entidade.
Uso Obrigatório
Instruções Uma pessoa, uma organização ou um serviço podem ser um „Creator‟. Se
de uso necessário, repetir este elemento para múltiplos autores.
Subject (Assunto)
Nome do Subject
elemento
Definição O assunto do recurso. Normalmente, o elemento „subject‟ será expresso
DCMI como palavras-chave, frases chave ou códigos de classificação que
descrevam o conteúdo intelectual do recurso.
Uso Obrigatório se aplicável
Instruções No elemento DC „subject‟ admitem-se dois tipos de valores possíveis:
de uso pode-se registar uma palavra-chave ou uma classificação. Se ambos estão
disponíveis, utilizar instâncias separadas deste elemento.
<dc:subject>info:eu-repo/classification/ddc/641</dc:subject>
<dc:subject>Anatomy</dc:subject>
Description (Descrição)
Nome do Description
elemento
Definição Informação sobre o conteúdo do recurso. A descrição pode incluir, mas
DCMI não se limita a: um resumo, sumários, referências a representações
gráficas do conteúdo ou texto livre com informação do conteúdo.
Uso Obrigatório se aplicável
Instruções Este elemento é utilizado para uma descrição textual do conteúdo.
de uso Quando um recurso consiste em vários ficheiros de objectos físicos
independentes, não usar dc:description para listar os URL‟s destes
ficheiros.
Predefinido = abstract
Não
confundir (n.a.)
com
Exemplos <dc:description>Prefácio [por] Hazel Anderson;
Publisher (Editor)
Nome do Publisher
elemento
Definição Uma entidade responsável pela disponibilização dos recursos. Uma
DCMI pessoa, uma organização ou um serviço podem constituir exemplos de
Editor. Normalmente, o nome de um Editor deverá ser utilizado para
mencionar a entidade.
Uso Obrigatório se aplicável
Instruções O Editor (comercial ou não-comercial) do recurso e não a instituição à
de uso qual o autor está afiliado. O Editor utiliza-se unicamente no sentido
bibliográfico/funcional, não num sentido organizacional. Utilizar apenas
o nome completo (comercial) do Editor, não o de uma organização ou
instituto que esteja associado (num sentido mais amplo) ao autor.
Contributor (Colaborador)
Nome do Contributor
elemento
Definição Uma entidade responsável por realizar contributos para o conteúdo do
DCMI recurso. Uma pessoa, uma organização ou um serviço podem constituir
exemplos de um colaborador. Normalmente, o nome de um colaborador
deverá ser utilizado para referenciar a entidade.
Uso Opcional
Instruções Exemplos de colaboradores: orientadores, editores, técnicos ou
de uso colectores de dados.
Date (Data)
Nome do Date
elemento
Definição A data associada a um evento no ciclo de vida do recurso. Normalmente,
DCMI a Data está associada à criação ou disponibilização do recurso. A prática
recomendada para codificar o valor data é definido na norma ISO 8601
[W3CDTF] e segue o formato YYYY-MM-DD.
Uso Obrigatório
Instruções O formato da data deverá estar de acordo com as W3C encoding rules
de uso for dates and times:
onde:
- YYYY [ano com quatro dígitos] é obrigatório
- MM [mês com dois dígitos (01=Janeiro, etc.)] é opcional
- DD [dia do mês com dois dígitos (de 01 até 31)] é opcional
Datas imprecisas:
Para datas imprecisas utilizar um ano lógico que melhor represente o
período em causa, ex. "1650" ao invés de “Século 17”
Type (Tipo)
Nome do Type
elemento
Definição O tipo de resultado científico do qual o recurso é uma manifestação. No
DCMI elemento DC „type‟, descreve-se o tipo de divulgação ou o tipo de
conteúdo intelectual do recurso. Utiliza-se para explicar ao utilizador
que tipo de recurso está a visualizar. Se é um livro ou um artigo. Se foi
escrito para uso interno ou externo. etc.
Uso O elemento DC „type‟ é utilizado com três propósitos:
1. Obrigatório: Tipo de publicação (controlado): para indicar o tipo
de publicação baseado no vocabulário controlado de tipo de
publicações DRIVER,
2. Opcional: Tipo de publicação (livre): para indicar o tipo de
publicação baseado num vocabulário de repositório local
3. Recomendado: Versão (controlado): para indicar o estado do
info:eu-repo/semantics/article
info:eu-repo/semantics/bachelorThesis
info:eu-repo/semantics/masterThesis
info:eu-repo/semantics/doctoralThesis
info:eu-repo/semantics/book
info:eu-repo/semantics/bookPart
info:eu-repo/semantics/review
info:eu-repo/semantics/conferenceObject
info:eu-repo/semantics/lecture
info:eu-repo/semantics/workingPaper
info:eu-repo/semantics/preprint
info:eu-repo/semantics/report
info:eu-repo/semantics/annotation
info:eu-repo/semantics/contributionToPeriodical
info:eu-repo/semantics/patent
info:eu-repo/semantics/other
3. Versão (controlado):
info:eu-repo/semantics/draft
info:eu-repo/semantics/submittedVersion
info:eu-repo/semantics/acceptedVersion
info:eu-repo/semantics/publishedVersion
info:eu-repo/semantics/updatedVersion
Para o mapeamento dos tipos DRIVER a partir das Directrizes DRIVER 1.0
ver Mapeamento de tipos DRIVER.
Não Format
confundir
com O elemento DC „type‟ descreve o tipo de produção académica do qual o
recurso é uma representação. O elemento DC „format‟ descreve o tipo
de meio do recurso.
Esquemas Tipos de publicação: ver a secção Vocabulário tipo de publicações na
página 121 no capítulo “Uso de vocabulários e semânticas”.
ou
<dc:type>info:eu-repo/semantics/other</dc:type> <!--1-->
<dc:type>image</dc:type><!--2-->
Format (Formato)
Nome do Format
elemento
Definição Manifestação física ou digital do recurso. Normalmente, o elemento
DCMI „Format‟ pode incluir o tipo de meio ou as dimensões do recurso. O
elemento „Format‟ pode utilizar-se para determinar o software, o
hardware ou outro equipamento necessário para mostrar ou operar o
recurso. Exemplos de dimensões são o tamanho e a duração. A prática
recomendada é seleccionar um valor de um vocabulário controlado (por
exemplo, a lista de tipos de meios da Internet [MIME] que define os
formatos para os equipamentos informáticos).
Uso Recomendado
Instruções Baseado em práticas recomendas, utiliza-se a lista registada da IANA de
de uso tipos de meios da Internet (tipos MIME) para seleccionar uma designação.
Para a lista completa ver o esquema de localização em baixo. Em seguida
apresenta-se uma lista de IANA MIME types:
Tipo Subtipo
text plain
richtext
enriched
tab-separated-values
html
sgml
xml
application octet-stream
postscript
rtf
applefile
<dc:format>application/pdf</dc:format>
Identifier (Identificador)
Nome do Identifier
elemento
Definição Referência inequívoca do recurso num contexto determinado.
DCMI
Uso Obrigatório
Instruções Recomenda-se a identificação do recurso mediante uma sequência ou
de uso número de acordo com um sistema de identificação formal. Alguns
exemplos de sistemas de identificação formal incluem o Uniform Resource
Identifier (URI) (incluindo o Uniform Resource Locator (URL), o Digital
Object Identifier (DOI) e o URN:NBN
Prática recomendada:
<oai_dc:dc>
...
<dc:identifier>http://hdl.handle.net/1234/5628
</dc:identifier>
<dc:identifier>http://arno.unimaas.nl/show.cgi?fid=5628
</dc:identifier>
<dc:identifier>http://n2t.info/urn:nbn:nl:ui:14-
Source (Fonte)
Nome do Source
elemento
Definição Referência a um recurso do qual deriva o recurso actual.
DCMI
Uso Opcional
Instruções O recurso actual pode derivar total ou parcialmente do recurso fonte
de uso (Source). A prática recomendada consiste em referenciar o recurso
através de uma sequência ou um número em conformidade com um
sistema de identificação formal.
Language (Idioma)
Nome do Language
elemento
Definição Idioma do conteúdo intelectual do recurso.
DCMI
Uso Recomendado
Instruções Um recurso específico (uma instância de um resultado/publicação
de uso científica) é escrito num ou vários idiomas humanos. Nestes casos, todos
os idiomas utilizados são descritos no elemento DC „language‟. Se um
recurso específico (uma instância de um resultado/publicação científica)
está escrito numa linguagem humana e é traduzido para outros idiomas
legíveis, as traduções diferenciam-se da versão original e por conseguinte
são descritas separadamente.
[http://www.sil.org/ISO639-3/codes.asp]
Relation (Relação)
Nome do Relation
elemento
Definição Referência a um recurso relacionado.
DCMI
Uso Opcional
Instruções A prática recomendada consiste em relacionar o recurso através de uma
de uso sequência ou um número em conformidade com um sistema de
identificação formal. O elemento DC „relation‟ pode ser utilizado para
indicar distintos tipos de relações entre vários registos de metadados. Se
as relações entre os registos de metadados se tornam visíveis através do
uso de metadados o seguinte serve para a distinção entre versões (versão
do autor e versão da editor, preprint, postprint, etc.):
---Documento B:---
<dc:type>info:eu-repo/semantics/acceptedVersion</dc:type>
<dc:identifier> http://hdl.handle.net/20</dc:identifier>
<dc:relation>http://hdl.handle.net/10</dc:relation>
Coverage (Cobertura)
Nome do Coverage
elemento
Definição Extensão ou âmbito do conteúdo do recurso. Normalmente, a cobertura
DCMI inclui a localização espacial (nome do lugar ou coordenadas geográficas),
um período temporal (etiqueta de período, data ou intervalo de datas) ou
a jurisdição (por exemplo, o nome de uma entidade administrativa).
Uso Opcional
Instruções A prática recomendada consiste na selecção do valor de um vocabulário
de uso controlado (por exemplo, o Getty Thesaurus of Geographic Names ou
TGN) e quando for apropriado, utilizar preferencialmente nomes de
locais ou períodos de tempo em vez de identificadores numéricos, como
por exemplo, conjuntos de coordenadas ou intervalos de datas. Se
necessário, repetir este elemento para inserir múltiplas localizações ou
períodos.
Não
confundir
com
Rights (Direitos)
Nome do Rights
elemento
Definição Informação sobre os direitos no recurso e sobre o recurso.
DCMI
Uso Recomendado
Instruções Normalmente, o elemento „Rights‟ conterá uma declaração dos direitos
de uso para aceder ou utilizar o objecto ou uma referência a um serviço que
proporcione essa informação. A informação de direitos abrange,
frequentemente, direitos de propriedade intelectual, copyright e outros
Audience (Público)
Nome do Audience
elemento
Definição Um tipo de entidade para a qual o recurso é dirigido ou útil.
DCMI
Uso Opcional
Instruções Um tipo de entidade poderá ser determinado pelo autor ou editor ou por
de uso um terceiro. No website Metadata Reference do U.S. Department of
Education, são apresentados exemplos de públicos:
http://www.ed.gov/admin/reference/index.jsp
Administrators
Community Groups
Counsellors
Federal Funds Recipients and Applicants
Librarians
News Media
Other
Parents and Families
Policymakers
Researchers
School Support Staff
Student Financial Aid Providers
Students
Teachers
Não
confundir
com
Este estudo visa serviços genéricos de comunicação científica que recolham OAI_DC.
No contexto específico de serviços e-teses recomendamos a utilização de outros
esquemas de metadados, para além do OAI_DC onde todos os aspectos relativos a e-
teses sejam proporcionados.
O campo dc:date field deve conter sempre a data de publicação (não a data
de defesa. A data de defesa é significativa em contextos específicos de serviços
de e-teses)
Utilizar apenas um campo data. Mais campos de data serão considerados
ambíguos, porque o DC não comporta a especificação de outros tipos de datas.
O campo dc:contributor deve conter sempre o nome do orientador.
(Utilizando campos contributor com nomes de outros perfis será considerado. O
DC não comporta a especificação de outros perfis de contributor.)
Os restantes campos deverão seguir exactamente as Directrizes DRIVER. Ter em
atenção que o campo dc:language dever estar preferencialmente codificado em
iso639-3. Notar por favor que campo dc:identifier é o único que contém um
URL que aponta para um documento com o texto integral de uma tese ou uma
página intermédia de acesso livre ao documento com o texto integral de uma
tese. O campo dc:date deve estar de acordo com a norma ISO8601 (YYYY-MM-
DD). Os campos dc:creator e dc:contributor são formatados seguindo o estilo
"apelido, nome".
Exemplo
Nesta secção é apresentado um exemplo para uma tese electrónica. Neste caso é uma
"Habilitation" um tipo de tese alemã que é usada quando uma pessoa se torna
Professor. Este é um trabalho académico que é considerado ainda mais do que uma
Tese de Doutoramento na Alemanha. Nas Directrizes DRIVER apenas suportamos os
termos utilizados na convenção de Bolonha, para que o gestor de repositório possa
usar a regra "tudo igual e superior a uma Tese de doutoramento será colocado na
categoria doctoralThesis". Nas Directrizes DRIVER é permitido colocar a informação
adicional "habilitation", com o intuito de manter particularidades locais.
O XML que é usado pode assemelhar-se ao seguinte (os comentários entre <!-- e -->
não deve estar for a do XML, mas servem como uma ajuda de leitura.):
<oai_dc:dc >
<dc:title>Mixing Oil and Water : </dc:title>
<dc:type>info:eu-repo/semantics/doctoralThesis</dc:type> <!--
Tipo DRIVER v2.0 para Teses de Doutoramento, utilizado para
interoperabilidade -->
<dc:type>info:eu-repo/semantics/publishedVersion</dc:type> <!--
<dc:identifier>http://some.url.to/the_jump-off_page.html
</dc:identifier>
...
</oai_dc:dc>
Nas publicações utilizar o campo DC:SOURCE para inserir informação que uma pessoa
possa utilizar para efectuar uma citação do registo que encontrou. Utilizar
preferencialmente o estilo APA para elaborar referências.
Por exemplo
O campo DC:RELATION pode ser usado tipicamente para descrever relações para
outras expressões ou versões do documento.
Este registo com ID 1111, é um trabalho que foi submetido para revisão
científica. Este trabalho possui uma relação com o artigo com revisão
científica com o ID 2222.
Introdução e Objectivo
Quando usada correctamente, esta especificação irá criar um registo XML MPEG-21
DIDL válido para uso com respostas OAI-PMH. Esta especificação de documento DIDL
para repositórios é baseada em decisões propostas inicialmente durante o
desenvolvimento deste formato XML para utilizar MPEG-21 DIDL. A proposta constituiu
um esboço de um formato de empacotamento (wrapper) com espaço para recursos de
Contextualização
O DIDL está em uso no DARE desde o verão de 2006. Um dos resultados é que conteúdo
de todos os repositórios holandeses faz agora parte do E-Depot da Koninklijke
Bibliotheek, Biblioteca Nacional dos Países Baixos.
O documento DIDL faz parte de uma resposta OAI-PMH. O documento DIDL será
devolvido dentro de um registo OAI quando se utiliza didl como valor do pedido
metadataPrefix. Isto permite que o repositório possa gerar o formato DIDL concreto
<OAI-PMH ...>
...
<request ... metadataPrefix="didl_document">
...
<record>
<header>...</header>
<metadata>
<didl:DIDL
xmlns:didl="urn:mpeg:mpeg21:2002:02-DIDL-NS"
xmlns:dcterms="http://purl.org/dc/terms/"
xmlns:dii="urn:mpeg:mpeg21:2002:01-DII-NS"
xmlns:dip="urn:mpeg:mpeg21:2005:01-DIP-NS"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="
urn:mpeg:mpeg21:2002:02-DIDL-NS
http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-
21_schema_files/did/didl.xsd
urn:mpeg:mpeg21:2002:01-DII-NS
http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-
21_schema_files/dii/dii.xsd
urn:mpeg:mpeg21:2005:01-DIP-NS
http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-
21_schema_files/dip/dip.xsd">
...
</didl:DIDL>
</metadata>
<about>...</about>
</record>
...
</OAI-PMH>
Observações:
<metadata>
DIDL[1..1]
<didl:DIDL ...>
Item[1..1]
<didl:Item> Item[1..∞] (of type 1 metadata)
<didl:Item>...</didl:Item>
Item[1..∞] (of type 2 objectFile)
<didl:Item>...</didl:Item>
Item[0..1] (of type 3 start page)
<didl:Item>...</didl:Item>
</didl:Item>
</didl:DIDL>
</metadata>
<didl:DIDL
DIDLDocumentId="urn:nbn:nl:ui:10-15290" <!-- Identificação -->
...
>
Observações:
15
ISO/NP 15511: International Standard Identifier for Libraries and Related Organizations (ISIL)
http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=52666
Observações:
1. No caso de elementos Item derivados do elemento Item raiz indica que este
elemento Identifier NÃO é igual ao OAI identifier ou DIDL identifier
utilizados.
2. O atributo Identifier do elemento Item raiz PODE coincidir com os
identificadores DIDL ou OAI Identifier, embora não seja recomendado
3. O espaço de nomes (namespace) para dii deve ser declarado na etiqueta DIDL.
4. O identificador DEVE ESTAR descrito, quando aplicável, como um URI.
O segundo Descriptor contém uma data de modificação. Quando algo muda dentro de
um elemento Item, este elemento data de modificação deve ser actualizado. Esta data
de modificação especifica-se mediante o elemento modified do espaço de nome
dcterms:
<didl:Item>
<didl:Item>
...
<didl:Descriptor>
<didl:Statement mimeType="application/xml">
<dcterms:modified>2006-12-20T10:29:12Z</dcterms:modified>
</didl:Statement>
Observações:
<didl:Item>
<didl:Item>
...
<didl:Descriptor>
<didl:Statement mimeType="application/xml">
<dip:ObjectType>info:eu-repo/semantics/descriptiveMetadata
</dip:ObjectType>
</didl:Statement>
</didl:Descriptor>
...
</didl:Item>
...
</didl:Item>
Observações:
O elemento Item de topo contém pelo menos dois tipos de objectos (ObjectTypes)
obrigatórios do elemento Item. Estes tipos de objectos do Item são expressões do Item
raiz: um para os metadados e outro para o ficheiro do objecto digital (por exemplo, um
ficheiro PDF), tal como se descreve nos metadados. Opcionalmente, pode existir um
terceiro tipo de objecto do elemento Item para uma página de transição (jump-off-
page). Uma página de transição é uma página HTML intermédia que se utiliza para
apresentações legíveis para o ser humano quando um Item contém mais de um ficheiro
digital. Normalmente, esta situação ocorre com dissertações com ficheiros
independentes (ex. quando a tese consiste num agrupamento de artigos previamente
publicados). Também ocorre quando o fornecedor de conteúdo tem uma versão PDF,
MS Word DOC e HTML do mesmo artigo.
<didl:DIDL ...>
<didl:Item>
<didl:Item>...</didl:Item> <!-- metadados -->
<didl:Item>...</didl:Item> <!-- objectos -->
<didl:Item>...</didl:Item> <!-- página de transição -->
</didl:Item>
</didl:DIDL>
O primeiro elemento Item contém os metadados como Dublin Core (DC) (obrigatório)
que é normalmente utilizado no formato OAI_DC de acordo com as directrizes de
metadados que pertencem a uma arquitectura Digital Item Processing. O segundo
elemento Item contém uma ou mais ligações para os objectos digitais e o terceiro Item
contém uma hiperligação para uma página de transição.
<didl:Item>
<didl:Item> <!-- uma ou mais ocorrências -->
<didl:Descriptor>
<didl:Statement mimeType="application/xml">
<dip:ObjectType>info:eu-
repo/semantics/descriptiveMetadata</dip:ObjectType>
</didl:Statement>
</didl:Descriptor>
...
</didl:Item>
<didl:Item> <!-- uma ou mais ocorrências -->
<didl:Descriptor>
<didl:Statement mimeType="application/xml">
<dip:ObjectType>info:eu-
repo/semantics/objectFile</dip:ObjectType>
</didl:Statement>
</didl:Descriptor>
...
</didl:Item>
<didl:Item> <!-- zero ou uma ocorrência -->
<didl:Descriptor>
<didl:Statement mimeType="application/xml">
<dip:ObjectType>
info:eu-repo/semantics/humanStartPage</dip:ObjectType>
</didl:Statement>
</didl:Descriptor>
...
</didl:Item>
</didl:Item>
info:eu-repo/semantics/descriptiveMetadata
(Este Item ocorre 1 ou várias vezes)
info:eu-repo/semantics/objectFile
(Este Item ocorre 1 ou várias vezes)
info:eu-repo/semantics/humanStartPage
(Este Item ocorre 0 ou 1 time)
Observações:
http://info-uri.info/registry/OAIHandler?verb=GetRecord&metadataPrefix=reg&identifier=info:eu-repo/
A semântica dos tipos de objecto (ObjectTypes) implica, por exemplo, que este
Item indique que o primeiro sub-Item tem ou contém metadados descritivos.
O segundo Item ObjectType contém uma hiperligação para um objecto digital. Isto é
sempre “by-reference” para limitar o tamanho do ficheiro, quando usada para
propósitos de transferência de metadados. (“by-value” é possível mas aumenta o
tamanho do ficheiro e toca no assunto da propriedade, usar codificação base64, não
exemplificada aqui), e o elemento Item possui uma declaração ObjectType com um
URI info:eu-repo/semantics/objectFile. Um Item objectFile pode ocorrer mais do
que uma vez. Ver o seguinte:
<didl:Item>
...
<!-- Abaixo desta linha pode-se encontrar ligações para um ou vários
objectos digitais -->
<didl:Item> <!-- Primeiro Item para um File/Bitstream -->
<didl:Descriptor>
<didl:Statement mimeType="application/xml">
<dip:ObjectType>info:eu-repo/semantics/objectFile</dip:ObjectType>
</didl:Statement>
</didl:Descriptor>
...
<didl:Component>
<didl:Resource mimeType="application/pdf"
ref="http://my.server.nl/report.pdf"/></didl:Component>
Observações:
1. A ordem dos componentes do objecto deve seguir uma ordem lógica de leitura!
O Item com o capítulo 1 deve ser seguido do elemento imediato que contém o
capítulo 2, etc... Deste modo, o fornecedor de serviços poderá realizar uma
O terceiro elemento ObjectType Item contém uma hiperligação para uma página de
transição. Isto é realizado da mesma forma que para o elemento „Object Item‟.
Actualmente, isto está restringido a 1 Item deste tipo; não existem elementos de data
„identifier‟ ou „modification‟ presentes. Este elemento Item é opcional:
<didl:Item>
...
<!-- Abaixo desta linha; um Item com uma hiperligação para uma página
intermediária opcional -->
<didl:Item>
<didl:Descriptor>
<didl:Statement mimeType="application/xml">
<dip:ObjectType>
info:eu-repo/semantics/humanStartPage
</dip:ObjectType>
</didl:Statement>
<!-- Implementação da versão 2.3. utilizada no contexto SURFshare (nl) e DRIVER (eu) -->
<!--
<didl:DIDL> é o empacotador ou contentor que pode ser visto como uma entidade
autónoma que pode existir fora do contexto OAI-PMH.
urn:mpeg:mpeg21:2002:01-DII-NS
http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-
21_schema_files/dii/dii.xsd
urn:mpeg:mpeg21:2005:01-DIP-NS
http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-
21_schema_files/dip/dip.xsd">
<!-- O Item é a entidade complexa composta que é uma representação de um trabalho -->
<didl:Item>
<didl:Descriptor>
<didl:Statement mimeType="application/xml">
<dii:Identifier>urn:NBN:nl:ui:10-6748398729821</dii:Identifier>
</didl:Statement>
</didl:Descriptor>
<didl:Descriptor>
<didl:Statement mimeType="application/xml">
<dcterms:modified>2006-12-20T10:29:12Z</dcterms:modified>
</didl:Statement>
</didl:Descriptor>
<didl:Component>
&metadataPrefix=didl&identifier=oai%3Adspace.library.uu.nl%3A1874%2F15290"/>
</didl:Component>
<!-- Introdução da área de metadados -->
<didl:Item>
<didl:Descriptor>
<!-- ObjectType of Item -->
<didl:Statement mimeType="application/xml">
<dip:ObjectType>info:eu-
repo/semantics/descriptiveMetadata</dip:ObjectType>
</didl:Statement>
</didl:Descriptor>
<didl:Component>
<!-- Recurso actual do Item -->
<didl:Resource mimeType="application/xml">
<oai_dc:dc xmlns="http://www.w3.org/2001/XMLSchema"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/"
xmlns:dc="http://purl.org/dc/elements/1.1/" xsi:schemaLocation="
http://www.openarchives.org/OAI/2.0/oai_dc/
http://www.openarchives.org/OAI/2.0/oai_dc.xsd
http://purl.org/dc/elements/1.1/
http://dublincore.org/schemas/xmls/simpledc20021212.xsd">
<dc:title>Neonatal Glucocorticoid Treatment and Predisposition
to Cardiovascular Disease in Rats</dc:title>
<dc:creator>Bal, M.P.</dc:creator>
<dc:subject>Geneeskunde</dc:subject>
<dc:subject>glucocorticoid</dc:subject>
<dc:subject>dexamethasone</dc:subject>
<dc:subject>
<!--etc...-->
</dc:subject>
<dc:subject>cellular hypertrophy</dc:subject>
<dc:subject>contractile proteins</dc:subject>
<dc:description>The present thesis describes the issue of
"neonatal glucocorticoid
treatment and predisposition to cardiovascular disease in rats".
</dc:description>
<dc:publisher>Utrecht University</dc:publisher>
<dc:date>2006-12-12</dc:date>
<dc:type>Doctoral thesis</dc:type>
<dc:format>image/jpeg</dc:format>
<dc:format>image/pdf</dc:format>
<dc:format>image/pdf</dc:format>
<dc:format>
<!--etc...-->
</dc:format>
<dc:identifier>
http://igitur-archive.library.uu.nl/dissertations/2006-1206-
200250/UUindex.html
</dc:identifier>
<dc:language>en</dc:language>
<dc:rights>(c) Bal, M.P., 2006</dc:rights>
</oai_dc:dc>
</didl:Resource>
</didl:Component>
</didl:Item>
<!-- Introdução da area de metadados MODS -->
<didl:Item>
<didl:Descriptor>
<!-- ObjectType de Item -->
<didl:Statement mimeType="application/xml">
<dip:ObjectType>info:eu-
repo/semantics/descriptiveMetadata</dip:ObjectType>
</didl:Statement>
</didl:Descriptor>
<didl:Component>
<didl:Resource mimeType="application/xml">
<mods version="3.2"
xmlns="http://www.loc.gov/mods/v3"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.loc.gov/mods/v3
http://www.loc.gov/standards/mods/v3/mods-3-2.xsd">
<titleInfo xml:lang="en">
<role>
<roleTerm authority="marcrelator" type="code">aut</roleTerm>
</role>
</name>
<name type="personal" ID="n2">
<namePart type="family">Winter, de</namePart>
<namePart type="given">R.J.</namePart>
<role>
<roleTerm authority="marcrelator" type="code">aut</roleTerm>
</role>
</name>
<extension>
<daiList xmlns:dai="info:eu-repo/dai" xsi:schemaLocation="info:eu-
repo/dai
http://www.surfgroepen.nl/sites/oai/metadata/Shared%20Documents/dai-
extension.xsd">
<identifier IDref="n2" authority="info:eu-
repo/dai/nl">157455590</identifier>
<identifier IDref="n1" authority="info:eu-
repo/dai/nl">123456678</identifier>
</daiList>
</extension>
</mods>
</didl:Resource>
</didl:Component>
</didl:Item>
<!-- Introdução da área para objectos digitais de texto integral -->
<!--Bitstream n.º: [0] -->
<didl:Item>
<didl:Descriptor>
<!-- ObjectType de Item -->
<didl:Statement mimeType="application/xml">
<dip:ObjectType>info:eu-repo/semantics/objectFile</dip:ObjectType>
</didl:Statement>
</didl:Descriptor>
<didl:Component>
<!-- Recurso actual de Item -->
<didl:Resource mimeType="text/html"
ref="https://dspace.library.uu.nl:8443/bitstream/1874/15290/18/index.htm"/>
</didl:Component>
</didl:Item>
<!--Bitstream n.º: [1] -->
</didl:Statement>
</didl:Descriptor>
<didl:Component>
<!-- Recurso actual de Item -->
<didl:Resource mimeType="image/jpeg"
ref="https://dspace.library.uu.nl:8443/bitstream/1874/15290/16/bal.jpg"/>
</didl:Component>
</didl:Item>
<!--Bitstream no: [2] -->
<didl:Item>
<didl:Descriptor>
<!-- ObjectType de Item -->
<didl:Statement mimeType="application/xml">
<dip:ObjectType>info:eu-repo/semantics/objectFile</dip:ObjectType>
</didl:Statement>
</didl:Descriptor>
<didl:Component>
<!-- Recurso actual de Item -->
<didl:Resource mimeType="application/pdf"
ref="https://dspace.library.uu.nl:8443/bitstream/1874/15290/15/c1.pdf"/>
</didl:Component>
</didl:Item>
<!--Bitstream n.º: [3] -->
<didl:Item>
<didl:Descriptor>
<!-- ObjectType de Item -->
<didl:Statement mimeType="application/xml">
<dip:ObjectType>info:eu-repo/semantics/objectFile</dip:ObjectType>
</didl:Statement>
</didl:Descriptor>
<didl:Component>
<!-- Recurso actual de Item -->
<didl:Resource mimeType="application/pdf"
ref="https://dspace.library.uu.nl:8443/bitstream/1874/15290/14/c2.pdf"/>
</didl:Component>
</didl:Item>
<!--Bitstream no: [etc...] -->
<!-- Introdução à página intermédia -->
<didl:Item>
<didl:Descriptor>
<!-- ObjectType de Item -->
<didl:Statement mimeType="application/xml">
<dip:ObjectType>info:eu-repo/semantics/humanStartPage</dip:ObjectType>
</didl:Statement>
</OAI-PMH>
Utilizando este espaço de nomes todos os termos utilizados possuem uma "presença
Web". Nesse sentido já não é uma sequência arbitrária, pois comporta significado. Esta
utilização torna-o válido para o futuro.
Identificação de autor
(esta informação é citada e modificada do projecto europeu NEEO16)
16
Network of European Economists Online (NEEO): informações do projecto em
http://www.nereus4economics.info/neeo.html. Para informação sobre DAI ver especificações:
http://homepages.ulb.ac.be/~bpauwels/NEEO/WP5/WP5%20Technical%20guidelines.pdf
Um DAI pode ser atribuído aos autores a nível nacional (como nos Países Baixos, onde
cada autor recebe um identificador único no sistema METIS), ou a um nível
institucional. É da exclusiva responsabilidade de cada RI garantir que um autor pode
ser identificado através de um DAI e que cada DAI atribuído é único num Repositório
Institucional (RI).
Formato de um DAI
Cada RI poderá entregar os seus DAI's, no formato que entender, desde que a parte
autoridade que funciona como uma Agência de Registo possa ser reconhecida no
esquema. No entanto, recomenda-se a utilização do número International Standard for
Name Identification (ISNI)17. Todos DAI's devem ser globalmente únicos. Isto é
alcançado através da combinação do DAI com a sua autoridade (valor do atributo de
autoridade do elemento identificador) ou fazer o DAI um URI completo que é único.
Alguns exemplos de codificações válidas de um DAI:
info:eu-repo/dai/nl/12456454
http://staff.university.eu/19262
urn:isni:1234567-2
Persistência de um DAI
17
(ISNI): norma em desenvolvimento, nenhuma Agência de Registo implementada até ao
momento. O projecto termina em 2009. Os números DAI nos Países Baixos são compatíveis com
ISNI devido ao seu envolvimento via OCLC.
http://www.collectionscanada.gc.ca/iso/tc46sc9/docs/sc9n429.pdf
Classificação de assuntos
18
http://www.loc.gov/catdir/cpso/lcco/
19
http://www.oclc.org/dewey/
20
http://www.udcc.org/
O vocabulário dos tipos de publicações listados em baixo tem uma história bastante
enraizada na comunidade de repositórios europeia. É uma combinação dos tipos de
utilizados pelo DARE das directrizes DC, dos tipos enumerados no certificado DINI e dos
tipos de publicações e-Prints21. Com base na autoridade destas directrizes, foram
produzidas directrizes melhoradas para o DRIVER "Uso do MODS para repositórios
institucionais”22, que está em consonância com os tipos de publicação utilizados
usualmente pelos Current Research Information Systems (CRIS) como o METIS. Esse
documento foi a base para os tipos de publicação apresentados em baixo.
21
Vocabulário do perfil de aplicação Eprints (Scholarly Works Application Profile - SWAP)
http://www.ukoln.ac.uk/repositories/digirep/index/Eprints_Type_Vocabulary_Encoding_Scheme
22
https://www.surfgroepen.nl/sites/oai/metadata/Shared%20Documents/Use%20of%20MODS%20f
or%20institutional%20repositories-version%201.doc
Para os tipos publicação é usado um espaço de nome especial para que seres humanos
e máquinas possam reconhecer o vocabulário que é utilizado. Este nome é o espaço de
nomes “info:eu-repo/semantics/” (ver a primeira coluna da tabela seguinte). O URI é
utilizado como um prefixo para o termo que representa um tipo de publicação. Por
exemplo, o URI de artigos é “info:eu repo/semantics/article”. A terceira coluna
contém as descrições dos tipos de publicações. Isso deverá facilitar as decisões de
mapeamento que devem ser feitas nos repositórios locais.
Derivado de:
<dc:type>info:eu-repo/semantics/article</dc:type>
<dc:type>info:eu-repo/semantics/accepted</dc:type>
Mais sobre a utilização de DC:type com versões ver secção Type (Tipo) na página 72
no capítulo “Uso de metadados OAI_DC”.
Vocabulário de versões
info:eu- Descrição
repo/semantics/
draft A versão inicial colocada em circulação como trabalho em
progresso
submittedVersion A versão que foi submetida a uma revista para revisão
científica
acceptedVersion A versão produzida pelo autor que incorpora comentários de
revisão científica e que foi aceite para versão de publicação
publishedVersion A versão produzida pelo Editor e publicada
updatedVersion A versão actualizada desde a publicação
Esquemas de codificação
23
CNRI: http://www.cnri.reston.va.us/
e https://www.pilin.net.au/
24
Hilse, H., Kothe, J., Implementing Persistent Identifiers, KNAW,
http://www.knaw.nl/ecpa/publ/pdf/2732.pdf
25
Tonkin, E., Persistent Identifers: Considering the Options, Ariadne, issue 56,
http://www.ariadne.ac.uk/issue56/tonkin/
26
DNS-URN integration
http://www.persistent-identifier.de/english/335-project-proposal.php#URNscope
27
NAPTR Record: http://en.wikipedia.org/wiki/NAPTR_record
28
Global Resolution Proof of Concept:
http://www.surfgroepen/sites/surfshare/public/software/pihandler
29
Projecto Persistent Identifier Linking Infrastructure: https://www.pilin.net.au/
30
Projecto ARROW: http://www.arrow.edu.au/
OA-Statistik
Objectivos de estatísticas OA
Existem duas questões primordiais abordadas por todas as normas existentes que
geram a maior parte das correcções necessárias:
Nota: Os nomes dos campos podem ainda estar sujeitos a alterações à medida que o
projecto evoluir.
Sugestões adicionais
Exemplos:
Deve haver informação fiável sobre a origem do cliente (ou seja, a referência
original). Por exemplo, deveria ser possível dizer se um cliente acedeu ao ficheiro
através da página principal ou através de uma hiperligação do RSS-Feed do repositório.
A base para esta secção será a Copyright Toolbox desenvolvida pela fundação SURF e
pelo JISC e que reflecte os princípios Zwolle.
Para mais informação sobre copyright e as licenças para depositar, usar e reusar, ver:
http://www.surffoundation.nl/smartsite.dws?ch=AHO&id=13591
Com o Open Access (Acesso Livre), os direitos de propriedade intelectual devem ser
geridos de uma forma correcta. Mesmo que um documento esteja em Acesso Livre, o
copyright pode limitar o uso do material que foi encontrado. As licenças Creative
Commons (CC) propiciam ferramentas gratuitas que permitem a autores, cientistas,
artistas e educadores marcar facilmente o seu trabalho criativo com o grau de
Para a ciência, poder disseminar o conhecimento da forma mais livre possível, sem
perder noção de propriedade, pode-se usar a Licença Creative Commons BY-SA na área
jurisdicional em causa.
Isto significa:
Se usa o copyright, recomendamos que utilize com uma boa descrição de utilização.
Por exemplo http://creativecommons.org/licenses/by-sa/3.0/nl/
No Dublin Core não qualificado as licenças são de leitura digital da seguinte forma:
<dc:rights>http://creativecommons.org/licenses/by-
sa/2.0/uk/</dc:rights>
<dc:rights>cc-by-sa, Andrew Smith</dc:rights>
Para uma visão técnica completa ver secção Rights (Direitos) na página 83.
http://copyrighttoolbox.surf.nl/copyrighttoolbox/
http://sciencecommons.org/projects/publishing/
http://creativecommons.org
http://www.surffoundation.nl/smartsite.dws?ch=AHO&id=13591