Você está na página 1de 39

METADADOS INTEROPERÁVEIS PARA REPRESENTAÇÃO DOS DOCUMENTOS

DE UM ACERVO DE TRABALHOS DE CONCLUSÃO DE CURSO 1

Israel Silva Gonçalves2

RESUMO

A falta de interoperabilidade devido a carência de padronização dos metadados, nos vocabulários


controlados e nas estruturas de softwares, afeta a vida de pessoas e processos em instituições
públicas e privadas, de forma direta e indireta, gerando falta de segurança e confiabilidade nas
informações e dificultado a sua recuperação. O acervo de trabalhos de conclusão de curso (TCC)
da graduação em Arquivologia da UFES está sendo digitalizado e organizado por um grupo de
trabalho (GT) formado por professores e alunos do curso. Deseja-se que esse acervo possua
metadados padronizados e com bom nível de interoperabilidade para disseminação e acesso ao
conteúdo. Os objetivos dessa pesquisa são construir um conjunto de metadados organizados e
capazes de representar de forma completa os dados dos TCCs e selecionar esquemas de
metadados interoperáveis disponíveis na web e com grande potencial de representá-los. A
pesquisa possui abordagem qualitativa com método exploratório, sendo adotada a metodologia de
estudo de caso aplicada ao contexto do acervo de TCCs. Como resultados, foram criados
metadados para representação dos TCCs no acervo e foram selecionados nove esquemas de
metadados para servirem de base na transformação dos metadados originais para os seus termos
semelhantes, isto é, com a mesma função e semântica, e, principalmente, interoperáveis. Apesar
do contexto pequeno do estudo de caso, acredita-se que a mesma metodologia empregada possa
ser aplicada em outros acervos ou contextos diferentes e maiores.

Palavras chave: metadado, interoperabilidade, vocabulário controlado, esquema de metadados,


trabalho de conclusão de curso.

ABSTRACT

The lack of interoperability due to the lowering of metadata standardization, in controlled


vocabularies and in software structures, affects the lives of people and processes in public and
private institutions, directly and indirectly, generating a lack of security and reliability in information
and making it difficult your recovery. The collection of completion of course work (CCW) of the

1
Trabalho de conclusão de curso, na modalidade de artigo, apresentado no segundo semestre letivo
especial de 2020 para obtenção do título de Bacharel em Arquivologia, com orientação do professor
Henrique Monteiro Cristovão, e-mail: henrique.cristovao@ufes.br.
2
Graduando em Arquivologia pela Universidade Federal do Espírito Santo (UFES), e-mail:
israelsg2015@gmail.com.
2

undergraduate course in Archivology at UFES is being digitized and organized by a working group
(WG) formed by professors and students of the course. It is hoped that this collection has
standardized metadata and a good level of interoperability for dissemination and access to content.
The objectives of this research are to build a set of organized metadata capable of fully
representing the CCW data and to select interoperable metadata schemas available on the web
and with great potential to represent them. The research has a qualitative approach with an
exploratory method, adopting the case study methodology applied to the context of the CCW
collection. As a result, metadata were created to represent the CCWs in the collection and nine
metadata schemas were selected to serve as a basis for transforming the original metadata into
their similar terms, that is, with the same function and semantics, and mainly interoperable. Despite
the small context of the case study, it is believed that the same methodology used can be applied
in other collections or different and larger contexts..

Keyword: metadata, interoperability, controlled vocabulary, metadata schema, completion of


course work.

1 INTRODUÇÃO

No mundo contemporâneo as informações produzidas em seus diversos suportes e formatos tem


mostrado cada vez mais a importância do arquivista, tanto para preservar como para disseminar a
informação contida em cada documento e em consonância com critérios especificados em Leis,
como a lei 12.527/2011 (BRASIL, 2011) conhecida como a Lei de Acesso à Informação (LAI).
Referente a isso, Cook (2012) destaca que "[...] o âmago do trabalho intelectual da Arquivologia
deveria estar mais centrado no esclarecimento do contexto funcional e estrutural dos documentos,
e sua evolução ao longo do tempo [...]" de forma a auxiliar a construção de sistemas que lidam
com conhecimento e que fossem capazes de capturar, recuperar, exibir e compartilhar
informações em direção a atividades de disseminação para viabilização ao acesso à informação
por meio de "[...] dispositivos políticos, culturais, materiais e intelectuais que garantam o exercício
efetivo desse direito" (JARDIM, 1999).

Segundo Jardim (1999), o acesso jurídico à informação não se consolida sem o acesso intelectual
à informação, pois o acesso jurídico apenas garante o acesso físico à informação, mas não ao
acesso intelectual. Mesmo com o importante passo dado pela LAI em direção a transparência
pública, estudos, como de Pedroso, Tanaka e Cappelli (2013), apontam para a sua não efetividade
com publicações de documentos em determinados formatos que impedem a interoperabilidade
dos seus dados. Gerar dados interoperáveis requer organizar conhecimento que, segundo
Hjørland (2008), engloba descrever, representar, arquivar e organizar documentos e
representações de documentos, bem como assuntos e conceitos tanto por humanos quanto por
3

máquinas. Segundo Loureiro et al. (2021), dados abertos de qualidade e publicados


adequadamente possibilitam o uso da inteligência coletiva com contribuições de diversos
segmentos da sociedade sendo o insumo para a construção de ferramentas úteis para acesso a
serviços públicos, como por exemplo, consultas de dados na Câmara dos Deputados ou para
permitir modificação de dados como ocorre em um agendamento para emissão de passaporte na
Polícia Federal.

No contexto da Arquivologia e segundo o CONARQ (2016), metadados são “[...] dados


estruturados que descrevem e permitem encontrar, gerenciar, compreender e/ou preservar
documentos arquivísticos ao longo do tempo”. A importância dos metadados na identificação dos
documentos arquivísticos é inegável e está em consonância com a literatura científica. Cook
(2012) chama atenção para novas tendências onde o contexto e o uso dos documentos
arquivísticos mudam ao longo do tempo uma vez que eles não são mais objetos passivos, ou
simples registros de evidências, mas agentes ativos que desempenham papéis permanentes na
vida de indivíduos, organizações e sociedade. Assim, segundo Cook, os metadados devem ser
continuamente renovados para acompanhar a dinâmica dos documentos arquivísticos. A
preocupação com a gerência dos metadados é tão forte que alguns autores já denominam essa
área como gestão de metadados. Prado Filho (2019) afirma que a gestão de metadados é uma
parte indissociável da gestão de documentos arquivísticos e serve a uma diversidade de funções
e propósitos.

Interoperabilidade é a capacidade de dois ou mais sistemas ou componentes de trocar


informações e usar as informações que foram trocadas (NISO, 2011). Luz (2018) sinaliza que a
“[...] necessidade de interoperabilizar a informação é básica para os tempos de comunicação em
rede [...]”, pois a “[...] interoperabilidade garante o uso e a encontrabilidade dos metadados
estruturados dos objetos informacionais”. Os metadados interoperáveis sustentam processos de
negócios e de gestão de documentos de arquivo, protegendo e assegurando a acessibilidade e
usabilidade dos documentos arquivísticos ao longo do tempo (PRADO FILHO, 2019). Luz (2018)
acrescenta que uma parte do processo de organização da informação digital é sobretudo aplicar
técnicas de catalogação e estabelecer o processo de descrição e de indexação por meio de
metadados interoperáveis. Segundo Fritzsche et al. (2017), a "[...] interoperabilidade entre
sistemas continua sendo uma necessidade e expectativa onipresentes [...]", seja para profissionais
da informação como também para "[...] organizações, grupos de pesquisa e indivíduos que
buscam criar experiências ideias, minimizar a sobrecarga operacional, reduzir custos, e
impulsionar futuras inovações utilizando novas tecnologias e recursos”.

A falta de interoperabilidade devido a carência de padronização nos metadados, nos vocabulários


controlados e nas estruturas de softwares, afeta a vida de pessoas e processos em instituições
4

públicas e privadas, de forma direta e indireta, gerando falta de segurança e confiabilidade nas
informações e também dificultando a sua recuperação. A fim de contribuir na melhoria da
infraestrutura de suporte à reutilização de dados acadêmicos, Wilkinson et al. (2016) compilaram
um conjunto de princípios com o objetivo de servir de diretriz para aqueles que querem o
aprimoramento da capacidade das máquinas nas buscas e utilização de dados, além de servir de
apoio na reutilização por pessoas. Esses princípios são denominados de FAIR, um acrônimo para
findable, accessible, interoperable, reutilizable, tem como foco orientações diretas para que os
dados tenham as capacidades de serem localizáveis, acessíveis, interoperáveis e reutilizáveis,
que estão sintetizados no Quadro 6 do ANEXO I.

Segundo o CONARQ (2016), um documento arquivístico é um “documento produzido (elaborado


ou recebido), no curso de uma atividade prática, como instrumento ou resultado de tal atividade, e
retido para ação ou referência”. Logo, um TCC composto de um documento de conteúdo, um
conjunto de metadados, e uma ata de aprovação, pode ser considerado um documento
arquivístico, uma vez que, ele é elaborado no decorrer de uma disciplina de um curso de
graduação, sendo também um resultado dessa disciplina e, após a aprovação, é retido para
consulta ou como prova de cumprimento de requisito para conclusão do curso. Além disso, o
acervo de TCCs possui uma organicidade que, de acordo com o CONARQ, é um “[...] atributo de
um acervo documental decorrente da existência de relação orgânica entre seus documentos [...]”,
onde, uma relação orgânica, ou archival bond em inglês, é composta por “[...] vínculos que os
documentos arquivísticos guardam entre si e que expressam as funções e atividades da pessoa
ou organização que os produziu”. Nesse caso, o curso, juntamente com a instituição, constitui-se
na organização a qual os TCCs foram produzidos e estão vinculados.

O acervo de trabalhos de conclusão de curso (TCC) da graduação em Arquivologia/UFES está


sendo digitalizado e organizado por um grupo de trabalho (GT) formado por professores e alunos
do curso. O plano de ação desse GT é composto por nove dimensões organizadas em atividades
e tarefas. As nove dimensões são: (1) Gestão do Conhecimento e Política de Informação, (2)
Levantamento e Identificação, (3) Digitalização e Entrada de Metadados, (4) Padronização e
Interoperabilidade, (5) Organização, Representação e Modelagem, (6) Armazenamento em
Repositórios, (7) Disseminação, Compartilhamento e Acesso, (8) Recuperação e Descoberta de
Informação e Conhecimento, e (9) Visualização de Informação e Conhecimento. A presente
pesquisa se insere na dimensão “4 – Padronização e Interoperabilidade”, pois irá investigar e
estabelecer esquemas de metadados interoperáveis que possam representar os documentos
arquivísticos referentes aos TCCs.

Dessa forma, o problema dessa pesquisa aparece pela necessidade de representar o acervo de
TCCs, que está sendo digitalizado e organizado pelo GT, com metadados padronizados e com
5

bom nível de interoperabilidade para disseminação e acesso ao conteúdo. Como consequência


desse problema, o objetivo da pesquisa é representar o acervo de TCCs com metadados
padronizados e interoperáveis. Como objetivos específicos, tem-se: (i) construir um conjunto de
metadados organizados e capazes de representar de forma completa os dados dos TCCs e, (ii)
selecionar esquemas de metadados interoperáveis disponíveis na Web com grande potencial de
representá-los.

2 INTEROPERABILIDADE NA ARQUIVÍSTICA

Segundo Luz (2018), a área de atuação da Arquivística, englobando o documento e a gestão da


produção, processamento e disseminação da informação, que é necessária e básica para a
tomada de decisões na administração contemporânea, gera como produto a informação
arquivística. O autor ainda destaca que devido a tantos avanços na tecnologia em seus diversos
campos, e a explosão de informação de maneira exponencial sem padrões e critérios, e a falta de
predefinição estrutural (arquitetura de dados) e sintática (linguagem de dados), trouxeram como
consequência o aumento da dificuldade no acesso, busca e disseminação de informação
arquivística. Isto é, falta de interoperabilidade, que segundo Clark e Zeng et al. (2012), ela vem
para suportar as tecnologias emergentes, como serviços da Web; a publicação, agregação e troca
de dados em sistemas de organização do conhecimento (KOS)3 por várias mídias e formatos; a
exploração nos bastidores de vocabulários controlados na navegação, filtragem e expansão de
pesquisa nos repositórios em rede. Um fator importante à interoperabilidade é a padronização dos
metadados que, segundo Luz (2018), os padrões de descrição de dados e sua estruturação
alinham linguagens e facilitam as trocas de informações entre instituições. Os metadados
interoperáveis,

[...] sustentam processos de negócios e de gestão de documentos de arquivo: protegendo


os documentos de arquivo como prova e assegurando a sua acessibilidade e usabilidade ao
longo do tempo; facilitando a capacidade de compreensão dos documentos de arquivo;
apoiando e assegurando o valor probatório dos documentos de arquivo; auxiliando na
garantia da autenticidade, da confiabilidade e da integridade dos documentos de arquivo;
apoiando e gerenciando o acesso, a privacidade e os direitos; apoiando a recuperação
eficiente; apoiando o reuso e a reproposição de documentos de arquivo; apoiando as
estratégias de interoperabilidade, proporcionando a captura oficial de documentos de
arquivo produzidos em diversos ambientes técnicos e de negócios e sua sustentabilidade
pelo tempo que for necessário; fornecendo ligações lógicas entre os documentos de arquivo
e o contexto de sua produção, mantendo-os de forma estruturada, confiável e significativa
[...] (PRADO FILHO, 2019).

3
Knowledge Organization System.
6

Luz (2018), destaca a falta de interoperabilidade no processo de organização da informação digital


que evidencia a "[...] essência informacional de cada registro, estabelecendo o processo de
descrição e de indexação por meio de metadados e assim garantindo sua preservação. Esse
tratamento da informação é objeto de trabalho dos profissionais da informação". O autor completa
dando exemplo dos metadados e padrões definidos para a descrição arquivística.

Zeng (2019) define quatro camadas de interoperabilidade que servem de base e padrões, tal
como mostrado na Figura 1. Para Zeng, cada camada tem suas especificidades: (i) Camadas de
Sistema, a interoperabilidade soluciona problemas de incompatibilidade entre hardware e
sistemas operacionais, para o intercâmbio técnico de dados através de redes, computadores,
aplicativos e serviços da web; ​(ii) Camada Sintática, a ênfase é nas diferenças da codificação,
decodificação e representação dos dados; os padrões mais importantes de linguagem de dados
que permitem a troca de dados por meio de formatos comuns de dados são as recomendações
oficiais do W3C (World Wide Web Consortium) desenvolvidas para a Web Semântica; (iii) Camada
estrutural, é onde são consideradas ​as variações da arquitetura de informações em estruturas de
dados, modelos de dados, e esquemas; nos esforços para permitir o intercâmbio de dados por
meio de estruturas predefinidas, modelos conceituais foram estabelecidos pelas comunidades
LAM (library, archive and museum, ou biblioteca, arquivo e museu); os modelos conceituais são
independentes de qualquer sintaxe de codificação específica e sistemas de aplicativos; (iv)
Camada Semântica, é dedicada à interoperabilidade do dicionário de sinônimos com outros tipos
de KOS; os princípios e a prática do mapeamento são seu foco principal, e o seu escopo inclui a
interoperabilidade do dicionário de sinônimos com esquemas de classificação, taxonomias,
esquemas de cabeçalho de assunto, ontologias, terminologias, listas de autoridades de nomes e
anéis de sinônimos.

Figura 1 - Camadas da interoperabilidade

Fonte: adaptado de Zeng (2019)


7

3 VOCABULÁRIO CONTROLADO

Segundo Kobashi (2008), vocabulário controlado é uma linguagem artificial que constitui termos
organizados em uma estrutura relacional com o objetivo de facilitar a entrada e saída de dados no
sistema de informação. Para Zeng (2005) a necessidade de um vocabulário controlado surge de
duas características: (i) os termos podem ser usados ​para representar um único conceito e, (ii)
uma palavra com a mesma grafia pode ter mais de um significado e conceito. Partindo da
segunda característica percebe-se que é necessário ter o controle e padronização desses
metadados. Ainda segundo Zeng, o controle de vocabulário pode ser alcançado com três
métodos: o primeiro define o significado dos termos, o segundo usa a relação de equivalência
para associar termos sinônimos e quase sinônimos e, o último distingue entre palavras
homógrafas (possuem a mesma grafia). O principal objetivo dos vocabulários controlados é
fornecer um meio de organizar informações.

De acordo com Zeng (2005) existem alguns tipos de vocabulários controlados que são comuns: (i)
Listas simples de termos ou “listas de seleção”, que é um conjunto limitado de termos organizados
como uma lista alfabética simples ou de alguma outra forma logicamente evidente, como por
exemplo uma lista simples em ordem alfabética, semelhante à um pauta de chamada escolar ou
por alguma ordem lógica como à ordem dos planetas no sistema solar; (ii) Anéis de sinônimos,
são um conjunto de termos considerados equivalentes com a finalidade de recuperação, valendo
ressaltar que a finalidade do Anel de sinônimo é diferente dos outros tipos de vocabulários
controlados, pois estes não podem ser usados no processo de indexação, eles são usados
somente durante a recuperação pois segundo Zeng o uso de anéis de sinônimos garante que um
conceito pode ser descrito por vários termos sinônimos ou quase sinônimos e é recuperado se
qualquer um dos termos for usado em uma pesquisa. (iii) Taxonomias consistem em termos
preferenciais, que estão conectados em uma ou mais de uma hierarquia, (iv) Tesauros é um
vocabulário controlado organizado em uma ordem conhecida e estruturada de forma que as várias
relações entre os termos sejam exibidas claramente e identificadas por indicadores de
relacionamento padronizados.

Vocabulários controlados devem atender os sistemas de informação nos quais foram elaborados e
também atender à linguagem dos seus usuários, mantendo sempre atualizados esses sistemas
informacionais, para que assim as consultas e pesquisas possam ser realizadas, de acordo com a
necessidade dos seus usuários Kobashi (2008). Destaca-se também os princípios dos
vocabulários controlados que, segundo Zeng (2005), têm como objetivo controlar o vocabulário e
garantir que cada conceito distinto se refira à uma única forma. Esses relacionamentos
linguísticos devem ser controlados e regularizados para que as informações fornecidas ao usuário
8

sejam reunidas em um só lugar, mesmo que circule por vários pontos e acessos, e também para
eliminar ambiguidades no sistema (SMIT; KOBASHI, 2003).

Smit e Kobashi também ressaltam que os conjuntos de documentos devem possuir características
que os individualizam dos demais dando condição de recuperação com precisão, onde a
identificação das características desses documentos seja: (I) eficiente, ocupando o menor tempo
possível, tanto do arquivista quanto do usuário do sistema; (II) eficaz, permitindo que o objetivo do
arquivo seja atingido, isto é, a correta recuperação dos documentos e informações. Dessa forma,
identificam-se os documentos e os seus conjuntos e as categorias informacionais que serão
utilizadas na busca da informação, podendo se utilizar, por exemplo, as normas ISAD(G) e
ISAAR(CPF) que dispõem dessas categorias informacionais ou documentos isolados e
observando os princípios arquivísticos.

O manual apresentado por Smit e Kobashi (2003) apresenta vantagens advindas da adoção do
controle de vocabulários no seu preenchimento e destacando que que ele possibilita uma melhor
organização e recuperação de documentos. Para as autoras, o controle de vocabulário é um meio
para produzir confiança no sistema de organização e busca de informações arquivísticas.

4 METADADOS

O termo metadados, ou dados sobre dados, foi adotado e agregado por diversas comunidades e
sua definição foi ampliada para abranger quase tudo que irá descrever outras coisas. Gill (2016)
define que metadados são uma descrição estruturada dos atributos essenciais de um objeto.
Gilliland (2016) observou que os profissionais de informação e patrimônio cultural, como
registradores de museus, catalogadores de bibliotecas e processadores de arquivos aplicam o
termo metadados às informações de valor agregado, criadas para organizar, descrever, rastrear e
aprimorar as informações dos itens físicos e coleções relacionadas aos objetos. Assim, os
metadados são regidos por padrões e práticas desenvolvidas e recomendadas, visando garantir à
qualidade, consistência e interoperabilidade.

Gilliland (2016) destaca que o termo metadado é amplamente usado e também é entendido de
diversas maneiras por comunidades profissionais diferentes que projetam, criam, descrevem,
preservam e usam sistemas e recursos de informação. Ainda segundo o autor, metadado se
refere a um conjunto de padrões disciplinares ou da indústria, bem como documentação interna e
externa adicional e outros dados necessários para a identificação, representação,
interoperabilidade, gestão técnica, desempenho e uso de dados contidos em um sistema de
informação. Segundo Penteado (2020), os metadados são essenciais para potencializar o
reaproveitamento de dados abertos, uma vez que a ideia é que esses dados sejam utilizados para
9

o público geral, em seus mais diversos cenários possíveis e não somente em casos específicos.
Existem recomendações de metadados para diversos contextos, por exemplo, o Decreto nº
10.278, de 18 de Março de 2020 (BRASIL, 2020), estabeleceu padrões técnicos mínimos de
metadados na digitalização de documentos como mostrados nos Quadros 7 e 8 do ANEXO II.

Gilliland (2016) acredita que, independente da forma física ou intelectual, os objetos de


informação possuem três características: (I) o conteúdo que está relacionado ao que o objeto
contém ou trata e é intrínseco a um objeto de informação; (II) o contexto que indica a quem, o
quê, porquê, onde e como os aspectos associados com a criação do objeto e vida subsequente e
é extrínseco a um objeto de informação; e (III) a estrutura que está relacionada ao conjunto
formal de associações dentro ou entre objetos de informação individuais e pode ser intrínseca,
extrínseca ou ambos.

Conforme resgata Gill (2016), o canadense Cory Doctorow listou sete grandes obstáculos na
criação de metadados por humanos: (i) Pessoas mentem, os metadados não são confiáveis por
terem diversos criadores de conteúdos desonestos que publicam metadados enganosos, visando
conseguir mais tráfego para estes sites; (ii) Pessoas são preguiçosas, pois a grande quantidade
dos editores de conteúdos não se encontram motivados para realizar toda a catalogação com o
cuidado necessário que a ocupação exige; (iii) Há grande quantidade de estúpidos, ou seja, não
são inteligentes o suficiente para controlar com eficácia o conteúdo que produzem; (iv) Metadados
na web não são confiáveis, pois existem muitos criadores de conteúdos que publicam
inadvertidamente os conteúdos; (v) Alguns esquemas de metadados não são neutros, isto é, eles
são esquemas de classificação subjetivos; (vi) As métricas influenciam os resultados dificultando a
interoperabilidade entre os sistemas; (vii) Há mais de uma maneira de descrever algo, isto é, a
descrição de um recurso é subjetiva.

Entre os argumentos de Doctorow, há elementos frágeis, conforme assinala Gill, por exemplo nos
conteúdos criados por bibliotecas, museus e arquivos, os especialistas que trabalham no campo
da informação, como arquivistas, bibliotecários entre outros, são profissionais treinados e
diligentes e, de modo geral, não são desonestos e preguiçosos, eles descrevem recursos de
maneiras padronizadas desenvolvidas ao longo de décadas de esforços colaborativos. Por outro
lado, Gill reconhece que o primeiro argumento é forte, pois é muito fácil para editores desonestos
incluir metadados descritivos deliberadamente enganosos nas páginas de Web com o intuito de
aumentar a possibilidade dessas páginas terem maior visibilidade nos nos mecanismos de busca
da Web e, como consequência, aumentando drasticamente a quantidade de tráfego de um site,
resultando em lucros maiores no caso de sites comerciais.
10

Metadados são normalmente classificados para facilitar a sua criação e organização. Gilliland
(2016) sugere uma classificação contendo cinco categorias: (i) Metadados Administrativos, para o
gerenciamento e administração de coleções e recursos de informação; (ii) Metadados Descritivos,
para a identificação, autenticação e descrição de coleções e recursos de informação; (iii)
Metadados de Preservação, para a gestão da preservação de coleções e recursos de informação;
(iv) Metadados Técnicos, para o funcionamento do sistema ou comportamento de metadados; e
(v) Metadados de Uso, para registrar o nível e tipo de uso de coleções e recursos de informação.
Exemplos de cada uma dessas categorias estão listados no Quadro 9 do ANEXO III. Gilliland
ainda sugere outra categorização de metadados em atributos e características, pois a autora
considera que o entendimento das perspectivas de concepção de metadados podem ser
confusas.

5 ESQUEMAS DE METADADOS NA WEB E NA ARQUIVÍSTICA

De acordo com Baca (2016), os metadados e o domínio dos recursos online estão em constante e
rápido crescimento e evolução. De fato, Gill (2016) relembra que no início da Web as pessoas,
especialmente ligadas à comunidade emergente de bibliotecas digitais, já viam os metadados
como, solução em longo prazo, para os problemas de descobertas na Web. E com o tempo os
catálogos de bibliotecas provaram sua eficácia no fornecimento do acesso de grandes coleções
bibliográficas. Seguindo a linha do tempo, Gilliland (2016) afirma que a automação dos metadados
será inevitável e irá se expandir mais ainda com a evolução e o aumento da implementação do
Resource Description Framework (RDF), que se refere aos dados abertos da WEB semântica. A
ideia é oferecer um suporte à interoperabilidade, que é a capacidade dos sistemas de se
comunicarem de forma significativa (GILL, 2016).

Como resultado dessa evolução e organização, vários padrões de metadados foram aparecendo e
evoluindo desde simples marcações até esquemas de metadados também chamados
simplesmente de vocabulários, que nada mais são do que conjuntos de metadados para uma
determinada finalidade. Atualmente existe uma quantidade muito grande de esquemas de
metadados disponíveis na Web como pode ser verificado no site Linked Open Vocabularies (UPM,
2021) que reúne uma grande coletânea de vocabulários para serem usados em Linked Data na
Web Semântica. Alguns esquemas de metadados ficaram mais populares do que outros,
possivelmente influenciados por terem foco de aplicação mais aberto como é o caso do Dublin
Core Metadata Element Set que, segundo Gill (2016), é um dos vocabulários mais utilizados no
mundo, possui originalmente quinze elementos de descrição aplicados a uma extensa variedade
de recursos interdisciplinares e entre sistemas, sendo o esquema preferido para mapeamento e
coleta de metadados.
11

Loscio et al. (2017) desenvolveram um conjunto de 35 boas práticas de publicação e uso de


dados na Web, recomendado pela W3C, visando principalmente um ecossistema que se auto
sustenta para facilitar a comunicação entre quem publica e os seus consumidores. Entre essas
práticas recomendadas existem várias que são do escopo de metadados, como por exemplo, a
prática 1 que indica o fornecimento de metadados, a prática 12 que indica o uso de formatos de
metadados padronizados, a prática 15 que indica a reutilização de esquemas de metadados
padronizados, entre outras. Segundo Penteado (2020), essas recomendações têm como prática
geral o reaproveitamento de padrões já estabelecidos na Web, para a recuperação de
informações.

Os documentos nato-digitais, muito frequentes hoje em dia, estão possibilitando com mais
facilidade que sejam interoperáveis auxiliando no acesso à informação e na difusão, pois eles
carregam sentido por intermédio de esquemas de metadados (LUZ, 2018). O autor ainda afirma
que para alavancar a interoperabilidade e a Web semântica é necessária a padronização de
tecnologias de linguagens e de metadados descritivos de forma que todos os usuários da Web
obedeçam a determinadas regras padrão. Luz também argumenta que a descrição arquivística é
um dos pilares da Arquivologia, disponibilizando ao usuário a informação sobre o documento sem
a necessidade do manuseio e evitando a corruptibilidade do mesmo. Assim, preserva-se o objeto
físico e essa descrição produz um instrumento de pesquisa que são produtos de informação e
podem ser utilizados para localizar objetos informacionais e descrever seu conteúdo.

Luz (2018) apresenta os esquemas de metadados Encoded Archival Description (EAD) e Encoded
Archival Context (EAC) que foram concebidos para o contexto arquivístico, e faz um paralelo com
as normas de descrição arquivística ISAD(G) e a NOBRADE. A NOBRADE além de ter os itens
da ISAD-G, que é uma norma internacional, complementou com a área 8.1, ponto de Acesso, com
mais dois elementos de descrição. Luz assinala que além de aplicar o modelo internacional já
adotado "[...] amplia-se o potencial da interoperabilidade de dados pois o oitavo elemento da
NOBRADE abre a possibilidade de uso de vocabulários e ontologias leves".

Segundo o autor, a utilização de regras de padronização de descrição podem disponibilizar de


forma padronizada os dados descritivos dos acervos e dos geradores desse acervo, um desses
exemplos de padronização é a ISAD-G que consolida a visão de padrões EAD e EAC, sendo
essas versões Web para a descrição arquivística. Uma vez que a ISAD-G é estruturada
digitalmente em EAD e EAC, aumenta a nitidez da informação arquivística, podendo assim ser
empregada como um padrão de definição de elementos processados na Web semântica. O EAD
tem se tornado um padrão de descrição arquivística bastante utilizado como instrumento de
pesquisa em plataformas on-line. Ele tem formato aberto para a codificação de instrumentos de
pesquisa com informações detalhadas e seguindo padrões específicos de documentos
12

decorrentes da descrição de arquivos. Outro fator que se destaca é que devido ao formato ser
aberto a outros custodiadores de arquivos que podem fornecer informações de suas coleções e
acervos. De fato o EAD não é um sistema utilizado para a gestão, mais focado na
interoperabilidade da informação.

O autor ainda destaca que a ISAD-G estruturada em EAD eleva a nitidez da informação, pois ela
pode ser um padrão de definições de elementos da Web alcançando o objetivo de fornecer uma
descrição minuciosa do conteúdo e intelectual das coleções de arquivos. Outra estrutura utilizada
na ISAD-G é o EAC que representa o contexto de criação dos arquivos tanto para a Web quanto
para os sistemas informatizados também compostos por ontologia para representar o contexto
dos seus elementos. O acrônimo EAC-CPF adiciona a parte Corporate Bodies, Persons and
Families e é utilizado no contexto arquivístico para entidades coletivas como empresas, pessoas e
famílias, com objetivo de fornecer informações do contexto e em quais circunstâncias foi realizada
a criação das coleções e documentos, tendo como sua finalidade padronizar a codificação de
descrições sobre indivíduos que permitam o compartilhamento, descoberta e entrega de
informações em plataformas digitais.

6 PROCEDIMENTOS METODOLÓGICOS

A pesquisa, de abordagem qualitativa, seguiu o método exploratório que, segundo Gil (2002) e
Braga (2007), visa proporcionar maior familiaridade, reunir dados, informações e padrões sobre o
problema proposto investigando as relações existentes entre conceitos e processos do contexto.
Além disso, foi adotada a metodologia de estudo de caso, uma vez que ela foi útil enquanto “[...]
investigação empírica que investiga um fenômeno contemporâneo dentro de seu contexto da vida
real, especialmente quando os limites entre o fenômeno e o contexto não estão claramente
definidos” (YIN, 2001). Dessa forma, o contexto mencionado por Gil, Braga e Yin, na presente
pesquisa, foi o acervo de TCCs do curso de graduação em Arquivologia da UFES considerando
seus potenciais usuários. O fenômeno contemporâneo investigado foi a escolha de esquemas de
metadados interoperáveis capazes de representar o acervo dos TCCs.

Como parte da construção dos conhecimentos necessários à fundamentação teórica foi realizada
pesquisa documental e bibliográfica, e pesquisa por trabalhos correlatos, na literatura científica
por meio de portais de busca, tal como o Portal de Periódicos CAPES (2020), publicações em
Congressos relevantes da área, normas técnicas NISO-ISO, ABNT-NBR, específicas de
descrição arquivística NOBRADE e ISAD(G), legislação pertinente e outros materiais discutidos no
âmbito do grupo de pesquisa ao qual esse trabalho é inserido. Além disso, a realização de
reuniões e debates, principalmente na fase da construção dos metadados para a representação
dos TCCs, entre os membros participantes do projeto foi fundamental para o entendimento do
13

contexto e da problemática da pesquisa, bem como na seleção e escolha definitiva dos


metadados que fossem relevantes para a representação do contexto, conforme objetivo dessa
pesquisa.

Na fase da seleção e escolha dos esquemas de metadados interoperáveis para a representação


dos metadados da planilha de cadastro foram consultadas bibliografias especializadas e,
principalmente, portais com coletânea de padrões interoperáveis, tais como o Society of American
Archivists (SAA, 2021), Librarians and Archivists, Library of Congress (LOC, 2021), American
Library Association (ALA, 2021) e Linked Open Vocabularies (UPM, 2021). Os critérios usados na
seleção foram, principalmente, (i) a pertinência ao contexto do acervo de TCCs; (ii) se o esquema
de metadado foi concebido para apoiar funções da Arquivologia; (iii) a frequência de citações em
obras de referência; e (iv) o quanto o esquema é conhecido e usado em bases interoperáveis.

7 RESULTADOS E DISCUSSÃO

De forma cooperativa, alguns integrantes do Grupo de Trabalho Gestão do Conhecimento no


Acervo de TCCs da graduação em Arquivologia (GT), incluindo o autor da presente pesquisa,
trabalharam na criação dos metadados necessários para a representação dos TCCs do acervo. O
resultado pode ser visto no Quadro 5 do APÊNDICE A. Foram estabelecidos 85 metadados,
organizados em nove grupos a saber: (i) Identificação do cadastro - três metadados; (ii) Conteúdo
- 30 metadados; (iii) Autoria - 14 metadados; (iv) Orientação - dez metadados; (v) Banca - dez
metadados; (vi) Avaliação - cinco metadados; (vii) Forma - três metadados; (viii) Suporte e
digitalização - oito metadados; e (ix) Direitos e disseminação - dois metadados.

Para a escolha dos metadados, considerando o contexto da pesquisa, foram também


consideradas as recomendações do Decreto nº 10.278 (BRASIL, 2020) que estabelece padrões
técnicos mínimos de metadados na digitalização de documentos, como mostrados nos Quadros 7
e 8 do ANEXO III, uma vez que muitos TCCs do acervo, com versão apenas impressa, estão
sendo digitalizados pelo GT. O Quadro 5 do APÊNDICE A também mostra a categorização dos
metadados conforme classificação sugerida por Gilliland (2016).

Foi implementada pelo GT uma planilha de cadastro dos metadados com interface adequada para
utilização pelo próprio aluno após a aprovação do seu trabalho e no processo de encaminhamento
à secretaria e coordenação do curso. A Figura 2, do APÊNDICE B, apresenta a tela inicial dessa
planilha. Ela foi usada de forma piloto por alguns alunos e já conta com cerca de 30 TCCs
cadastrados.
14

Na implementação do cadastro de metadados foram planejados e construídos alguns vocabulários


controlados com o intuito de evitar ambiguidades e facilitar a recuperação precisa de informações,
conforme sinaliza Smit e Kobashi (2003). Eles são do tipo lista de seleção conforme classificação
de Zeng (2005). Foram nove vocabulários controlados criados, a saber: (i) Área Cnpq - possui a
grande área, área, subárea e especialidade conforme classificação do CNPq4; (ii) Palavra Chave
Português - contém palavras chaves disponíveis no Tesauro Brasileiro de Ciência da Informação
(TBCI)5; (iii) Palavra Chave Inglês - usa o próprio TBCI para fornecer a palavra chave equivalente
na língua inglesa; (iv) Avaliador - contém os dados do orientador e membros da banca de
avaliação; (v) Modalidade Avaliação - se a avaliação foi feita de forma online, assíncrona ou
presencial; (vi) Formato - se o TCC foi feito em forma de monografia ou artigo científico; (vii)
Idioma - a língua usada na escrita do TCC; (viii) Modalidade Digital - como foi concebido o arquivo
digital, se nato-digital, ou se digitalizado por imagem ou OCR6; e (ix) Tipo PDF/A - as classes do
formato autocontido PDF/A que podem variar entre tipo 1, tipo 2 ou tipo 3. A associação do uso
dos referidos vocabulários controlados com cada metadado está registrada no Quadro 5 do
APÊNDICE A.

Ainda no Quadro 5 do APÊNDICE A, existe uma coluna para o tipo dos valores que podem ser
usados para preenchimento dos metadados. Eles são baseados na forma como a maioria dos
SGBDs (Sistemas Gerenciadores de Banco de Dados) representam os dados. A maioria deles é
do tipo String (uma sequência de caracteres quaisquer), alguns são mais restritos como o Numeric
(números) e Boolean (aceita apenas dois valores lógicos, como "sim" e "não"), e o tipo Date que
representa datas e horários aceitos pela norma internacional ISO 8601:2004 Data elements and
interchange formats - Information interchange - Representation of dates and times7. Essa norma
estabelece as regras para a representação de datas e horários usadas de forma interoperável em
várias partes do mundo.

O próximo passo foi a pesquisa por esquemas de metadados que pudessem oferecer um bom
nível de interoperabilidade. A partir de bibliografia especializada com escopo na Arquivologia ou
Ciência da Informação (CI), e com foco em interoperabilidade nível estrutural, segundo
classificação de Zeng (2019). Foram selecionados aqueles mais promissores, segundo julgamento
do autor dessa pesquisa e discussões no âmbito do GT. Esse levantamento encontra-se no
Quadro 1 onde, para cada esquema de metadados, é informado o seu nome e sigla, tal como
conhecido na literatura, o prefixo (uma abreviatura, e também conhecido por namespace), a

4
Informações disponíveis em:
http://lattes.cnpq.br/documents/11871/24930/TabeladeAreasdoConhecimento.pdf
5
TBCI disponível em: http://www.uel.br/revistas/informacao/tbci/vocab/
6
Optical Character Recognition.
7
ISO 8601:2004 disponível em: https://www.iso.org/standard/40874.html
15

página web principal onde ele é publicado para consulta humana, o foco de sua aplicação e, para
alguns deles, observações complementares.

Quadro 1 - Esquemas de metadados com bom nível de interoperabilidade.


Dublin Core (DC)
● Prefixo: dcterms
● Página principal: http://dublincore.org/documents/dcmi-terms
● Foco: aplicação genérica com capacidade de descrever objetos digitais, tais como,
vídeos, sons, imagens, textos e sites na web.
● Obs.: é uma extensão dos 15 primeiros termos do Dublin Core.

Encoded Archival Description (EAD)


● Prefixo: ead
● Página principal: https://www.loc.gov/ead
● Foco: descrição arquivística.
● Obs.: é mantido pela Society of American Archivists (Sociedade Americana de
Arquivistas) em parceria com a Library of Congress (Biblioteca do Congresso
Americano).

Encoded Archival Context, Corporate bodies, Persons, and Families (EAC-CPF)


● Prefixo: eac-cpf
● Página principal: http://culturalis.org/eac-cpf
● Foco: descrição do contexto da produção de objetos digitais, isto é, os sujeitos
(entidades, pessoas e famílias) envolvidos na sua produção.
● Obs.: tem forte relação com a arquivística.

Metadata Object Description Schema (MODS)


● Prefixo: mods
● Página principal: http://www.loc.gov/standards/mods
● Foco: descrição de elementos bibliográficos e uma variedade de propósitos,
particularmente, aplicações de bibliotecas.
● Obs.: é mantido pela Library of Congress (Biblioteca do Congresso Americano).

Metadata Authority Description Schema (MADS)


● Prefixo: mads
● Página principal: http://www.loc.gov/standards/mads/rdf
● Foco: descrição de dados de autoria com aplicabilidade em contextos de bibliotecas,
museus, arquivos e outras instituições culturais.
● Obs.: é mantido pela Library of Congress (Biblioteca do Congresso Americano).

Preservation Metadata Maintenance Activity (PREMIS)


● Prefixo: premis
● Página principal: http://id.loc.gov/ontologies/premis.html
● Foco: preservação de objetos digitais e garantia da sua usabilidade em longo prazo.
● Obs.: é mantido pela Library of Congress (Biblioteca do Congresso Americano).

Friend of a Fried (FOAF)


16

● Prefixo: foaf
● Página principal: http://www.foaf-project.org
● Foco: descrição de dados gerais de pessoas.

Data Catalog Vocabulary (DCAT)


● Prefixo: dcat
● Página principal: http://www.w3.org/TR/vocab-dcat
● Foco: representação de catálogo de dados publicados na web.

Schema.org
● Prefixo: schema
● Página principal: http://schema.org
● Foco: representação para variedade de aplicações tais como páginas da Web e
mensagens de e-mail.
● Obs.: mais de 10 milhões de sites usam esse esquema, entre eles, Google e Microsoft.

Bibliographic Framework Initiative (BIBFRAME)


● Prefixo: bibframe
● Página principal: https://www.loc.gov/bibframe
● Foco: descrição bibliográfica.
● Obs.: esse esquema é oriundo do MARC 21. Ele é mantido pela Library of Congress
(Biblioteca do Congresso Americano).

Machine-Readable Cataloging (MARC 21)


● Prefixo: marc
● Página principal: https://www.loc.gov/marc/umb
● Foco: descrição bibliográfica.
● Obs.: esse esquema evoluiu para o BIBFRAME.

Visual Resources Association Core (VRA Core)


● Prefixo: vra
● Página principal: https://www.loc.gov/standards/vracore
● Foco: descrição de obras de cultura visual e as imagens que as documentam.

Lightweight Information Describing Objects (LIDO)


● Prefixo: lido
● Página principal: http://www.lido-schema.org/schema/v1.0/lido-v1.0-schema-listing.html
● Foco: descrição de conteúdo para repositórios de patrimônio cultural.

Metadata and Archival Description Registry and Analytical System (MADRAS)


● Prefixo: madras
● Documento publicado na web:
http://www.interpares.org/display_file.cfm?doc=ip1-2_dissemination_ws_rocha~rondinelli
_2006.pdf
● Foco: descrição arquivística.

Extended Date/Time Format (EDTF)


● Prefixo: edtf
17

● Página principal: https://www.loc.gov/standards/datetime


● Foco: definição de recursos a serem suportados em data/hora.

Document, Discover and Interoperate (DDI)


● Prefixo: ddi
● Página principal: https://ddialliance.org
● Foco: descrição de dados produzidos por pesquisas e outros métodos de observação
nas ciências sociais, comportamentais, econômicas e da saúde.

Fonte: autoria própria.

O Quadro 2 apresenta um levantamento da frequência de citações dos esquemas de metadados


selecionados no Quadro 1. A primeira coluna, denominada de 'Prefixo', representa a típica
abreviatura, ou namespace, adotada para representar o esquema de metadados, tal como
informado no Quadro 1. A última coluna apresenta a frequência de citação dos esquemas de
metadados nas obras selecionadas, e as demais colunas são as referências dessas obras. As
obras foram escolhidas principalmente pelo critério de abordar assunto relacionados a metadados
em contextos da CI, como Gilliland (2016), Gill (2016), Luz (2018) e Zeng (2020), ou por ser um
portal com coletânea de padrões em recomendados à instituições no contexto da CI, como SAA
(2021), LOC (2021) e ALA (2021), ou outras que, apesar de estarem fora do contexto da CI, são
atuais e com foco sobre o uso de metadados interoperáveis, como Penteado (2020).

Quadro 2 - Frequência de referências aos esquemas de metadados selecionados nas obras


selecionadas

Prefixo Gilliland Gill Luz Penteado Zeng SAA LOC ALA Freq.
(2016) (2016) (2018) (2020) (2020) (2021) (2021) (2021)

dcterms X X X X X X 6

ead X X X X X X X 7

eac-cpf X X 2

mods X X X X 4

mads X X 2

premis X X 2

foaf X X X 3

dcat X 1

schema X X 2
18

bibframe X X X X X 5

marc X X 3

vra X X X X 4

lido X X 2

madras X X 2

edtf X 1

ddi X 1

Fonte: autoria própria.

Desses 16 esquemas de metadados analisados no Quadro 2, foram escolhidos nove para


fornecerem os metadados interoperáveis capazes de representar os metadados originais criados
para o acervo de TCCs. Os critérios para escolha, ainda que subjetivos, foram balizados,
principalmente, pela pertinência ao contexto da pesquisa (acervo de trabalhos de conclusão de
curso), pela frequência de citações nas obras selecionadas, pela identificação daqueles que
foram concebidos para apoiar funções de representação na Arquivologia, e o quanto o esquema é
conhecido e usado em bases interoperáveis.

O Quadro 3 apresenta os nove esquemas de metadados selecionados para servirem de base na


transformação dos metadados dos TCCs, disponíveis no Quadro 5 no Apêndice A, para os seus
equivalentes com um bom nível de interoperabilidade. Nesse Quadro 3, além do nome do
esquema, seu prefixo e página principal de acesso web, também é apresentada uma breve
justificativa de sua escolha, o endereço web onde encontram-se os seus termos para consulta
humana e o comando '@prefix' usado na criação de bases de dados ligados com o endereço web
onde são encontrados os termos para leitura por máquina. Ainda no Quadro 3, os esquemas de
metadados selecionados estão em ordem de preferência para aplicação no contexto da presente
pesquisa. Dessa forma, as conversões de um determinado metadado original para a sua versão
interoperável será realizada dando-se preferência à escolha de termos existentes nos esquemas
ordenados em primeiro.

Quadro 3 - Esquemas de metadados selecionados para representação do acervo de TCCs em


ordem de importância.
1º) Dublin Core (DC)
● Prefixo: dcterms
● Página principal:: http://dublincore.org/documents/dcmi-terms
19

● Justificativa para escolha: é um dos esquemas de metadados mais usados no mundo e,


consequentemente, tem excelente nível de interoperabilidade.
● Termos disponíveis pra consulta humana: http://dublincore.org/documents/dcmi-terms
● Namespace para a URI do esquema:
@prefix dcterms: <http://purl.org/dc/terms/>

2º) Encoded Archival Description (EAD)


● Prefixo: ead
● Página principal:: https://www.loc.gov/ead
● Justificativa para escolha: grande frequência de citações no Quadro 2. Foi concebido
para apoiar funções de representação na Arquivologia.
● Termos disponíveis para consulta humana: https://www.loc.gov/ead/EAD3taglib
● Namespace para a URI do esquema:
@prefix ead: <http://ead3.archivists.org/schema/>

3º) Encoded Archival Context, Corporate bodies, Persons, and Families (EAC-CPF)
● Prefixo: eac-cpf
● Página principal:: http://culturalis.org/eac-cpf
● Justificativa para escolha: Possui forte relação com a arquivística.
● Termos disponíveis para consulta humana:
https://eac.staatsbibliothek-berlin.de/schema/taglibrary/cpfTagLibrary2019_EN.html
● Namespace para a URI do esquema:
@prefix eac-cpf: <http://culturalis.org/eac-cpf#>

4º) Metadata Object Description Schema (MODS)


● Prefixo: mods
● Página principal:: http://www.loc.gov/standards/mods
● Justificativa para escolha: boa frequência de citações no Quadro 2.
● Termos disponíveis para consulta humana:
https://www.loc.gov/standards/mods/userguide/userguide-index.html
● Namespace para a URI do esquema:
@prefix mods: <http://www.loc.gov/mods/v3>

5º) Metadata Authority Description Schema (MADS)


● Prefixo: mads
● Página principal:: http://www.loc.gov/standards/mads/rdf
● Justificativa para escolha: possui boa aplicabilidade em instituições arquivísticas.
● Termos disponíveis para consulta humana: http://www.loc.gov/standards/mads/rdf
● Namespace para a URI do esquema:
@prefix mads: <http://www.loc.gov/mads/rdf/v1#>

6º) Preservation Metadata Maintenance Activity (PREMIS)


● Prefixo: premis
● Página principal:: http://id.loc.gov/ontologies/premis.html
● Justificativa para escolha: no contexto da preservação, poderá ser útil para o escopo de
preservação dos metadados dos TCCs.
● Termos disponíveis para consulta humana: https://id.loc.gov/ontologies/premis.html
20

● Namespace para a URI:


@prefix premis: <http://www.loc.gov/premis/rdf/v1#>

7º) Bibliographic Framework Initiative (BIBFRAME)


● Prefixo: bibframe
● Página principal:: https://www.loc.gov/bibframe
● Justificativa para escolha: boa frequência de citações no Quadro 2 e é uma versão
melhorada do MARC.
● Termos disponíveis para consulta humana:
https://id.loc.gov/ontologies/bibframe-category.html
● Namespace para a URI do esquema:
@prefix bibframe: <http://id.loc.gov/ontologies/bibframe/>

8º) Friend of a Fried (FOAF)


● Prefixo: foaf
● Página principal:: http://www.foaf-project.org
● Justificativa para escolha: aborda elementos do contexto da pesquisa, sendo também
um esquema mundialmente conhecido e com excelente nível de interoperabilidade.
● Termos disponíveis para consulta humana: http://xmlns.com/foaf/spec
● Namespace para a URI do esquema:
@prefix foaf: <http://xmlns.com/foaf/0.1/>

9º) Schema.org
● Prefixo: schema
● Página principal:: http://schema.org
● Justificativa para escolha: aplicabilidade genérica com popularidade de uso e adotado
por grandes corporações, o que lhe dá bom nível de interoperabilidade.
● Termos disponíveis para consulta humana: https://schema.org/docs/full.html
● Namespace para a URI do esquema:
@prefix schema: <http://schema.org/>

Fonte: autoria própria.

Entre as escolhas do Quadro 3, destaca-se o esquema DC em primeiro lugar pelo fato de ser
muito usado mundialmente e com alto nível de interoperabilidade, apesar de não ter sido
concebido para contextos da Arquivologia como é o caso do EAD e o EAC-CPF que aparecem em
segundo e terceiro lugares respectivamente, sendo que o EAD é citado em todas as obras ligadas
a Arquivologia. O esquema MADS, apesar de poucas citações, tem grande pertinência para
representação dados de autoria para o acervo de TCCs.

Alguns esquemas do Quadro 3 não foram escolhidos, como o VRA Core que, apesar de boa
frequência de citações no Quadro 2, estava fora do contexto do acervo de TCCs. Os esquemas
MARC 21, LIDO, MADRAS e DDI que, apesar de terem ligação com a CI, foram referenciados
poucas vezes nas obras selecionadas.
21

Alguns exemplos de conversão de metadados, originalmente criados para o acervo de TCCs, para
a sua versão interoperável com o uso de um dos esquemas de metadados escolhido, entre
aqueles do Quadro 3, são apresentados no Quadro 4. Esse quadro apresenta, nessa ordem, a
identificação do metadado original, disponível no Quadro 5 do APÊNDICE A, o termos do
metadado interoperável, o nome do esquema de metadados, disponível no Quadro 3, e a URI
(Uniform Resource Identifier) que o identifica de forma inequívoca.

Quadro 4 - Exemplos de conversão de metadados originais para o seu equivalente interoperável.


● Título:
○ Metadado interoperável: title
○ Esquema de metadado: Dublin Core
○ URI: http://purl.org/dc/terms/title
● Resumo:
○ Metadado interoperável: abstract
○ Esquema de metadado: Dublin Core
○ URI: http://purl.org/dc/terms/abstract

● Tamanho:
○ Metadado interoperável: disk size
○ Esquema de metadado: Dublin Core
○ URI: http://purl.org/dc/terms/abstract

● Nome do Autor:
○ Metadado interoperável: name
○ Esquema de metadado: Dublin Core
○ URI: http://purl.org/dc/terms/abstract

● Data da defesa:
○ Metadado interoperável: date
○ Esquema de metadado: Dublin Core
○ URI: http://purl.org/dc/terms/abstract

● Número de páginas:
○ Metadado interoperável: pages
○ Esquema de metadado: Dublin Core
○ URI: http://purl.org/dc/terms/abstract

Fonte: autoria própria.

Mesmo após a seleção dos nove esquemas de metadados, apresentados no Quadro 4, é possível
que nem todos sejam efetivamente usados para fornecer termos interoperáveis aos metadados
22

originais do acervo de TCCs. Em contrapartida, todos os metadados originais, listados no Quadro


5 do APÊNDICE A, serão cobertos por esse conjunto.

Entre as melhores práticas de publicação de dados na Web, recomendadas por Lóscio et at.
(2017), pode-se destacar três que são amplamente atendidos nos resultados dessa pesquisa: (i)
Fornecer metadados tanto para o homem quanto para as máquinas; (ii) Use formatos de dados
padronizados legíveis por máquina; (iii) Reutilizar vocabulários, de preferência padronizados.
Penteado (2020) também destaca que os metadados são essenciais para potencializar o
reaproveitamento dos dados. A lista dos esquemas do Quadro 3 atende a essas recomendações.

Conforme as camadas de interoperabilidade apresentadas por Zeng (2019), a presente pesquisa


se enquadra na Camada Sintática, pois os problemas sintáticos, que afetam diretamente os
esforços de interoperabilidade, são as diferenças na codificação, decodificação e representação
de dados, os padrões de linguagens de dados mais importantes permitem a troca de dados por
meio de formatos de dados comuns são recomendados. A presente pesquisa fornece condições
para a implantação de metadados interoperáveis que, conforme já destacado anteriormente por
Luz (2018), vem para facilitar o acesso, a busca e disseminação de informação arquivística e,
segundo Zeng (2019), estão sintonizados com tecnologias emergentes e ainda, Gilliland (2016),
são regidos por padrões e práticas desenvolvidas e recomendadas com foco no aumento da
qualidade e consistência dos dados.

Os quatro princípios FAIR, Wilkinson et al. (2016), listados no ANEXO I, são amplamente cobertos
pela presente pesquisa: (i) Localizável, pois estão sendo criados metadados interoperáveis que
possibilitam a sua localização; (ii) Acessível, pois os valores dos metadados ficarão disponíveis
para acesso; (iii) Interoperável, pois haverá a possibilidade dos metadados serem compartilhados
e lidos por máquinas uma vez que são usados termos interoperáveis advindos de esquemas
conhecidos, e (iv) Reutilizável, pois o acesso fácil e com bom nível de interoperabilidade leva à
facilidade de sua reutilização. Além disso, a presente pesquisa colabora no atendimento da LAI
(BRASIL, 2011), na abertura dos dados, mesmo considerando o contexto de estudo de caso
pequeno e restrito, contudo, os procedimentos empregados serão semelhantes quando aplicados
a um domínio diferente e maior.

Ainda que o Quadro 3 seja uma lista de esquemas de metadados com grande potencial para a
conversão para o formato interoperável, ainda é importante enfatizar que, conforme Baca (2016),
os metadados e domínios estão em constante crescimento e evolução. Dessa forma, é
necessário fazer a sua manutenção para que fiquem adequados às mudanças do contexto e que
mantenham um bom nível de interoperabilidade.
23

8 CONSIDERAÇÕES FINAIS

A presente pesquisa investigou a questão da Interoperabilidade no contexto dos metadados e


tendo como estudo de caso o GT da Gestão do Conhecimento sobre o acervos de TCCs do curso
de graduação em Arquivologia da UFES. Utilizou-se principalmente de pesquisas bibliográficas
sobre o tema, busca de esquemas de metadados em publicações e portais especializados, e da
interação e construção coletiva com membros do GT.

Observando as peculiaridades do acervo digital dos TCCs, bem como o decreto de lei nº 10.278
de 18 de Março de 2020, que estabelece os requisitos para a digitalização de documentos
públicos, foram criados metadados para a sua representação bem como vocabulários controlados
com o intuito de obter mais qualidade e precisão na busca, acesso e recuperação da informação e
até mesmo na preservação. Foram também construídos alguns vocabulários controlados visando
evitar ambiguidades e buscando facilitar a recuperação da informação. Para cadastro dos valores
dos metadados, foi preparada uma planilha de entrada com endereço disponível na web e com
uma interface adequada para uso do próprio aluno, após a aprovação de seu TCC. Dessa forma,
cumpriu-se um dos objetivos da pesquisa.

Em seguida, para cumprir o outro objetivo do trabalho, buscou-se por esquemas de metadados
com bom nível de interoperabilidade. Desses esquemas foram selecionados nove para, de fato,
contribuírem na conversão dos termos dos metadados originais do acervo de TCCs para termos
semelhantes, isto é, com a mesma função e semântica, e, principalmente, interoperáveis. Para a
escolha desses esquemas, foram considerados os critérios de pertinência ao contexto da
pesquisa, da frequência de citações em bibliografia e portais especializados, daqueles que foram
concebidos para apoiar funções de representação na Arquivologia, e o quanto é conhecido e
usado em bases interoperáveis.

O trabalho foi desenvolvido no contexto da camada sintática de interoperabilidade, conforme


Zeng (2019). Os nove esquemas de metadados selecionados atenderam a três das melhores
práticas de publicação de dados na Web elencadas por Lóscio et at. (2017), e atenderam também
aos princípios FAIR, segundo Wilkinson et al. (2016). Ainda que os metadados e domínios estejam
em constante crescimento e evolução, conforme destaca Baca (2016), os metadados criados e os
esquemas de metadados selecionados representam, no momento, um bom encaminhamento em
direção à abertura dos dados, conforme determina a LAI (BRASIL, 2011), e na representação do
contexto do estudo de caso dessa pesquisa.

A criação dos metadados e a seleção dos esquemas de metadados interoperáveis foram frutos da
pesquisa realizada sobre o estudo de caso em um contexto pequeno, o acervo de TCCs. Porém, a
24

mesma metodologia empregada nesse caso poderá ser aplicada em outros acervos ou contextos
diferentes, ainda que bem maiores. Sugere-se como continuidade desse trabalho, no âmbito do
GT, a conversão de todos os metadados do acervo de TCCs para os seus equivalentes em
formato interoperável, o mapeamento em forma de dados ligados na Web Semântica e a sua
publicação em um servidor aberto que ofereça o serviço de consulta.

REFERÊNCIAS

ALA. Metadata Standards and Resources. 2021 1996. ALA, American Library Association. [web
page]. Disponível em:
https://www.alastore.ala.org/nealschuman/companionwebsite/metadata-digital-collections/MDC_R
esources.html. Acesso em: 10 abr. 2021.

BACA, M. Introduction to metadata. 3. ed. Los Angeles, CA: Getty Publications, 2016. Disponível
em: http://www.getty.edu/publications/intrometadata.

BRAGA, K. S. Aspectos relevantes para a seleção de metodologia adequada à pesquisa social em


Ciência da Informação. In: MUELLER, S. P. M.Métodos para a pesquisa em Ciência da
Informação. Brasília: Tesaurus, 2007. p. 17–38.

BRASIL. Decreto No 10.278, 18 de março de 2020. 18 mar. 2020. Disponível em:


https://www.in.gov.br/en/web/dou/-/decreto-n-10.278-de-18-de-marco-de-2020-248810105.

BRASIL. Lei no 12.527, de 18 de novembro de 2011. Regula o acesso a informações... Diário


oficial [da] República Federativa do Brasil. 18 nov. 2011. Disponível em:
http://www.planalto.gov.br/ccivil_03/_ato2011-2014/2011/lei/l12527.htm.

CAPES/MEC. Acesso remoto via CAFe: portal de periódicos CAPES/MEC. 2020. CAPES-MEC.
[web page]. Disponível em: https://www.periodicos.capes.gov.br/. (cafe - comunidade acadêmica
federada).

CONARQ. Glossário: documentos arquivísticos digitais, 7a versão. Rio de Janeiro: Conselho


Nacional de Arquivos - CONARQ/Câmara Técnica de Documentos Eletrônicos - CTDE, 2016.
Disponível em:
http://conarq.arquivonacional.gov.br/documentos-eletronicos-ctde/glossario-ctde.html.

COOK, T. Arquivologia e pós-modernismo: novas formulações para velhos conceitos. Informação


Arquivística, v. 1, n. 1, p. 26, 2012. Disponível em:
http://www.aaerj.org.br/ojs/index.php/informacaoarquivistica/article/view/9.

GIL, A. C. Como elaborar projetos de pesquisa. São Paulo: Atlas, 2002.

GILL, T. Metadata and the web. In: BACA, M. (org.). Introduction to metadata. 3. ed. Los
Angeles, CA: Getty Publications, 2016. Disponível em:
http://www.getty.edu/publications/intrometadata.
25

GILLILAND, A. J. Setting the Stage. In: BACA, M. (org.). Introduction to metadata. 3. ed. Los
Angeles, CA: Getty Publications, 2016. Disponível em:
http://www.getty.edu/publications/intrometadata.

HJØRLAND, B. What is knowledge organization (KO)? Knowledge organization. International


journal devoted to concept theory, classification, indexing and knowledge representation,
2008. Disponível em: http://hdl.handle.net/10150/106183. Acesso em: 14 nov. 2016.

JARDIM, J. M. O acesso à informação arquivística no Brasil problemas de acessibilidade e


disseminação. O acesso à informação arquivística no Brasil problemas de acessibilidade e
disseminação, , p. 16, 1999. Disponível em:
https://arquivoememoria.files.wordpress.com/2009/05/informacao-arquivistica-no-brasil.pdf.

KOBASHI, N. Y. Vocabulário controlado: estrutura e utilização. [Escola Nacional de


Administração Pública.], 3 dez. 2008. Disponível em:
https://repositorio.enap.gov.br/bitstream/1/1289/41/Vocabul%C3%A1rio%20controlado%20-%20es
trutura%20e%20utiliza%C3%A7%C3%A3o.pdf. Acesso em: 27 dez. 2020.

KOBASHI, Nair Yumiko; SMIT, J. W. Como elaborar vocabulário controlado para aplicação em
arquivos como fazer volume 10. São Paulo: [s. n.], 2003. Disponível em:
https://www.arqsp.org.br/arquivos/oficinas_colecao_como_fazer/cf10.pdf.

LOC. Standards. 2021. Librarians and Archivists, Library of Congress, LOC. [web page].
Disponível em: https://www.loc.gov/librarians/standards. Acesso em: 10 abr. 2021.

LÓSCIO, B. F.; BURLE, C.; CALEGARI, N. Data on the web best practices. 31 jan. 2017. W3C.
Disponível em: https://www.w3.org/TR/dwbp/.

LOUREIRO, B. P.; CAMPAGNUCCI, F.; SVAB, H.; OLIVEIRA, L.; LANGENEGGER, N.; BAPTISTA,
V. Publicadores de dados: da gestão estratégica à abertura. São Paulo: Open Knowledge
Brasil, 2021. Disponível em: https://www.ok.org.br/publicacoes/. Acesso em: 20 abr. 2021.

LUZ, C. Ontologia digital arquivística: a representação do contexto de arquivo nos sistemas


informatizados e na web. São Paulo: Bookess, 2018. Disponível em:
https://www.academia.edu/38808706/Ontologia_Digital_Arquiv%C3%ADstica.

NISO. ISO 25964 – the international standard for thesauri and interoperability with other
vocabularies | NISO website. [S. l.: s. n.], 2011. Disponível em:
https://www.niso.org/schemas/iso25964. Acesso em: 31 out. 2019.

PEDROSO, L.; TANAKA, A.; CAPPELLI, C. A Lei de acesso à informação brasileira e os desafios
tecnológicos dos dados abertos governamentais. In: SIMPÓSIO BRASILEIRO DE SISTEMAS DE
INFORMAÇÃO, 9., 2013. Simpósio Brasileiro de Sistemas de Informação [...]. João Pessoa:
UFPB, 2013. v. 9, . Disponível em: https://sol.sbc.org.br/index.php/sbsi/article/view/5718. Acesso
em: 25 fev. 2016.
26

PENTEADO, B. E. Modelo de infraestrutura para publicação de dados abertos


governamentais conectados de qualidade. 2020. Tese – (Doutorado em Ciências de
Computação e Matemática Computacional) - Instituto de Ciências Matemáticas e de Computação,
Universidade de São Paulo, São Carlos, 2020. DOI 10.11606/T.55.2020.tde-14092020-175138.
Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-14092020-175138/.
Acesso em: 7 jan. 2021.

PRADO FILHO, H. R. do. A Qualidade dos metadados dos documentos de arquivo. Revista
Digital AdNormas, 29 out. 2019. Disponível em:
https://revistaadnormas.com.br/2019/10/29/a-qualidade-dos-metadados-dos-documentos-de-arqui
vo/. Acesso em: 31 out. 2019.

SAA. Standards Portal. 2021 1997. SAA, Society of American Archivists. [web page].
Disponível em: https://www2.archivists.org/standards. Acesso em: 10 abr. 2021.

UPM. Linked Open Vocabularies (LOV). 2021. Ontology Engineering Group - UPM. [web page,
search engine]. Disponível em: https://lov.linkeddata.es/dataset/lov. Acesso em: 30 mar. 2021.

WILKINSON, M. D.; DUMONTIER, M.; AALBERSBERG, Ij. J.; APPLETON, G.; AXTON, M.;
BAAK, A.; BLOMBERG, N.; BOITEN, J.-W.; DA SILVA SANTOS, L. B.; BOURNE, P. E.;
BOUWMAN, J.; BROOKES, A. J.; CLARK, T.; CROSAS, M.; DILLO, I.; DUMON, O.; EDMUNDS,
S.; EVELO, C. T.; FINKERS, R.; … MONS, B. The FAIR guiding principles for scientific data
management and stewardship. Scientific Data, v. 3, n. 1, p. 160018, 15 mar. 2016. DOI
10.1038/sdata.2016.18. Disponível em: https://www.nature.com/articles/sdata201618. Acesso em:
15 jul. 2020.

YIN, R. K. Estudo de caso: planejamento e métodos. 2. ed. Porto Alegre: Bookman, 2001.

ZENG, M. L. Construction of controlled vocabularies, a primer. 2005. Disponível em:


https://marciazeng.slis.kent.edu/Z3919/index.htm.

ZENG, M. L. Interoperability. Knowledge Organization, v. 46, n. 2, p. 122–146, 2019. Disponível


em: http://www.isko.org/cyclo/interoperability.
27

APÊNDICE A

O Quadro 5 apresenta o conjunto de metadados criados, de forma cooperativa pelo GT, para
representar os dados dos TCCs.

As categorias de metadados apresentadas no Quadro 5 são oriundas de Gilliland (2016):


● ADM - Administrativo: usados ​no gerenciamento e administração de coleções e recursos
de informação;
● DESC - Descritivo: usados ​para identificar, autenticar e descrever coleções e recursos de
informações;
● PRES - Preservação: relacionados com a gestão da preservação de coleções e recursos
de informação;
● TEC - Técnico: relacionados ao seu comportamento ou ao funcionamento do sistema.

Os tipos do dado no Quadro 5 corresponde a tipos amplamente conhecidos na estruturação de


banco de dados:
● String: equivalente ao VARCHAR em alguns SGBDs, representa uma sequência de
caracteres;
● Numeric: representa números inteiros ou decimais;
● Bollean: representa valores lógicos;
● Date: representa datas e horários usando a ISO 8601:20048.

Os seguintes vocabulários controlados (VC), apresentados no Quadro 5, foram criados para


organização e cadastro controlado dos dados:
● VC - Área Cnpq: possui a grande área, área, subárea e especialidade conforme
classificação do CNPq9;
● VC - Palavra Chave Português: contém palavras chaves disponíveis no Tesauro Brasileiro
de Ciência da Informação (TBCI)10;
● VC - Palavra Chave Inglês: usa o próprio TBCI para fornecer a palavra chave equivalente
na língua inglesa.
● VC - Avaliador: contém os dados de professores, entre outros, para preenchimento dos
metadados referentes a orientação e membros da banca;
● VC - Modalidade Avaliação: se a avaliação foi feita de forma online, assíncrona ou
presencial;
● VC - Formato: se o TCC foi feito em forma de monografia ou artigo científico;

8
ISO 8601:2004 disponível em: https://www.iso.org/standard/40874.html
9
Informações disponíveis em:
http://lattes.cnpq.br/documents/11871/24930/TabeladeAreasdoConhecimento.pdf
10
TBCI disponível em: http://www.uel.br/revistas/informacao/tbci/vocab/
28

● VC - Idioma: a língua usada na escrita do TCC;


● VC - Modalidade Digital: como foi concebido o arquivo digital, se nato-digital, ou se
digitalizado por imagem ou OCR;
● VC - Tipo PDF/A: as classes de PDF/A que podem variar entre tipo 1, tipo 2 ou tipo 3.

Quadro 5 - Metadados para representação do acervo de TCCs

Vocabu-
Tipo do
Grupo Identificação Descrição Categoria lário
dado
controlado
Identificação única do TCC,
Identificação única gerada automaticamente pelo ADM String -
sistema.

Nome completo do usuário


Identificação Usuário ADM String -
que fez o cadastro.
Cadastro
Data do cadastro dos
metadados gerada Date
Data/horário do cadastro ADM -
automaticamente pelo ISO 8601
sistema.

Título Título completo do TCC. DESC String -

Resumo do TCC.
Resumo DESC String -

Abstract do TCC.
Abstract DESC String -

Grande área de
Grande área 1 conhecimento do TCC.

Área de conhecimento do
VC
Área 1 TCC .
Área 1 Área
DESC String
Conteúdo (CNPq) Cnpq
Subárea de conhecimento do
Subárea 1 TCC.

Especialidade de conteúdo do
Especialidade 1 TCC.

Grande área 2
VC
Área 2 Área
Área 2 Informações da primeira área
DESC String Cnpq
(CNPq) secundária do TCC.
Subárea 2

Especialidade 2

Grande área 3
Área 3 Informações da segunda área VC
DESC String
(CNPq) secundária do TCC. Área
Área 3 Cnpq
29

Subárea 3

Especialidade 3

Palavra chave 1 1ª palavra chave original do


(original) TCC -
1ª palavra chave escolhida VC
Palavra em vocabulário controlado Palavra
chave 1 Palavra chave 1 DESC String Chave
(Português - VC) Português
1ª palavra chave em língua VC
inglesa escolhida em Palavra
Palavra chave 1 vocabulário controlado Chave
(Inglês - VC) Inglês

Palavra chave 2 2ª palavra chave original do


(original) TCC -
2ª palavra chave escolhida VC
Palavra em vocabulário controlado Palavra
chave 2 Palavra chave 2 DESC String Chave
(Português - VC) Português
2ª palavra chave em língua VC
inglesa escolhida em Palavra
Palavra chave 2 vocabulário controlado Chave
(Inglês - VC) Inglês

Palavra chave 3 3ª palavra chave original do


(original) TCC -
3ª palavra chave escolhida VC
Palavra em vocabulário controlado Palavra
chave 3 Palavra chave 3 DESC String Chave
(Português - VC) Português
3ª palavra chave em língua VC
inglesa escolhida em Palavra
Palavra chave 3 vocabulário controlado Chave
(Inglês - VC) Inglês

Palavra chave 4 4ª palavra chave original do


(original) TCC -
4ª palavra chave escolhida VC
Palavra em vocabulário controlado Palavra
chave 4 Palavra chave 4 DESC String Chave
(Português - VC) Português
4ª palavra chave em língua VC
inglesa escolhida em Palavra
Palavra chave 4 vocabulário controlado Chave
(Inglês - VC) Inglês

P. chave 5 5ª palavra chave original do


(original) TCC -
Palavra 5ª palavra chave escolhida VC
chave 5 DESC String Palavra
em vocabulário controlado
Palavra chave 5 Chave
(Português - VC) Português
30

5ª palavra chave em língua VC


Palavra chave 5 inglesa escolhida em Palavra
(Inglês - VC) vocabulário controlado Chave
Inglês

Nome completo Nome completo do primeiro


autor 1 autor.

Nome do primeiro autor


Referência usado em referência.
autor 1

Orcid autor 1 Orcid do primeiro autor.


Autor 1 DESC String -
Matrícula UFES Matrícula UFES do primeiro
autor 1 autor.

Endereço curto do currículo


Lattes autor 1 Lattes do primeiro autor.

E-mail autor 1 Email do primeiro autor.

Telefone autor 1 Telefone do primeiro autor.


Autoria

Nome completo Nome completo do segundo


autor 2 autor.

Referência Nome do segundo autor


autor 2 usado em referência.

Orcid autor 2 Orcid do segundo autor.

Autor 2 Matrícula UFES Matrícula UFES do segundo DESC String -


autor 2 autor.

Endereço curto do currículo


Lattes autor 2 Lattes do segundo autor.

E-mail autor 2 Email do segundo autor.

Telefone autor 2 Telefone do segundo autor.


Nome completo Nome completo do orientador.
orientador

Referência Nome do orientador usado


orientador em citação

Orienta- Orcid do orientador VC


Orcid orientador DESC String
dor Avaliador
Instituição Principal instituição que o
orientador orientador atua.
Orientação
Lattes Endereço curto do currículo
orientador Lattes do orientador.

Nome completo Nome completo do


coorientador coorientador.
Coorien- VC
Nome do coorientador usado DESC String
tador Referência Avaliador
coorientador em citação
31

Orcid Orcid do coorientador


coorientador

Instituição Principal instituição que o


coorientador coorientador atua.

Lattes Endereço curto do currículo


coorientador Lattes do coorientador.

Nome completo Nome completo do primeiro


membro 1 membro da banca.

Referência Nome do primeiro membro da


membro 1 banca usado em citação

Orcid do primeiro membro da


banca VC
Membro 1 Orcid membro 1 DESC String
Avaliador
Principal instituição que o
Instituição primeiro membro da banca
membro 1 atua.

Endereço curto do currículo


Lattes Lattes do primeiro membro da
membro 1 banca.
Banca
Nome completo Nome completo do segundo
membro 2 membro da banca.

Referência Nome do segundo membro


membro 2 da banca usado em citação

Orcid do segundo membro da


banca VC
Membro 2 Orcid membro 2 DESC String
Avaliador
Principal instituição que o
Instituição segundo membro da banca
membro 2 atua.

Endereço curto do currículo


Lattes Lattes do segundo membro
membro 2 da banca.
VC
Modalidade assíncrona, online
Modalidade avaliação String Modalidade
ou presencial.
Avaliação
Data defesa/avaliação Data da defesa ou avaliação. Date
DESC
(aaaa-mm-dd) ISO 8601
Hora da defesa, apenas para
Hora defesa - aval. Date
Avaliação avaliação online ou DESC
presencial ou online ISO 8601
presencial.

Local defesa - aval. Sala/prédio ou plataforma


DESC String
presencial virtual, se for o caso.

Semestre letivo Semestre letivo que o aluno


DESC String -
(ano/semestre) cursou a disciplina de TCC.

Formato de monografia ou VC
Formato DESC String
Forma artigo científico. Formato
32

Idioma que o TCC foi escrito. VC


Idioma DESC String
Idioma
Número de páginas totais do
Número páginas DESC Numeric
TCC.

Local onde foi guardada a Sala/prédio onde se encontra


PRES String -
cópia impressa. a cópia impressa.

Se é nato-digital, se
VC
digitalizado por processo de
Modalidade digital TEC String Modalidade
OCR ou se digitalizado como
Digital
imagem.

Nome da pessoa que realizou


Digitalizador PRES String -
a digitalização.

Data digitalização Data que a digitalização foi Date


PRES -
Suporte e (aaaa-mm-dd) terminada. ISO 8601
Digitalização
Nome do arquivo PDF que
Nome PDF TEC Numeric -
contém o conteúdo do TCC.

Um dos três tipos: PDF/A-1, VC


Tipo PDF/A TEC String
PDF/A-2 ou PDF/A-3. Tipo PDF/A

Tamanho em KB do arquivo
Tamanho KB TEC Numeric -
PDF do TCC.

Descrição de todos os
Descrição dos anexos documentos anexos (no caso TEC String -
de PDF/A-2 ou A-3).

Se os metadados poderão ser


Disseminar metadados ADM Boolean -
Direitos e públicos ou não.
Dissemina-
ção Se o conteúdo do TCC
Disseminar PDF ADM Boolean -
poderá ser público ou não.

Fonte: Grupo de Trabalho Gestão do Conhecimento no Acervo de TCCs da graduação em


Arquivologia/UFES
33

APÊNDICE B

A Figura 2 apresenta a tela inicial de um cadastro de metadados de um TCC iniciado por meio da
planilha de cadastro.

Figura 2 - Tela da planilha de cadastro de metadados

Fonte: Grupo de Trabalho Gestão do Conhecimento no Acervo de TCCs da graduação em


Arquivologia/UFES
34

ANEXO I

O Quadro 6 apresenta de forma resumida os principais elementos dos princípios FAIR, segundo
Wilkinson et al. (2016).

Quadro 6 : Os Princípios Orientadores do Fair

Localizável
Metadados são atribuídos a um identificador globalmente único e persistente.

Os dados são descritos com metadados enriquecidos.

Metadados incluem clara e explicitamente o identificador dos dados que


descreve.

Metadados são registrados ou indexados em um recurso pesquisável.

Acessível Metadados são recuperáveis ​por seu identificador usando um protocolo de


comunicação padronizado.

O protocolo é aberto, gratuito e universalmente implementável.

O protocolo permite um procedimento de autenticação e autorização, quando


necessário.

Metadados são acessíveis, mesmo quando os dados não estão mais


disponíveis.

Interoperável Metadados usam uma linguagem formal, acessível, compartilhada e


amplamente aplicável para a representação do conhecimento.

Metadados usam vocabulários que seguem os princípios FAIR.

Metadados incluem referências qualificadas a outros metadados .


35

Reutilizável
Metadados são ricamente descritos com uma pluralidade de atributos precisos
e relevantes.

Metadados são liberados com uma licença de uso de dados clara e acessível.

Metadados estão associados à proveniência detalhada.

Metadados atendem aos padrões da comunidade relevantes para o domínio.

Fonte: Wilkinson et al. (2016, tradução nossa)


36

ANEXO II

Os Quadros 7 e 8 mostram os metadados mínimos recomendados pelo decreto nº 10.278, de 18


de Março de 2020, como padrões técnicos mínimos na digitalização de documentos.

Quadro 7 - Metadados mínimos exigidos para todos os documentos.

Metadados Definição

Assunto Palavras-chave que representam o conteúdo do documento.

Pode ser de preenchimento livre ou com o uso de vocabulário


controlado ou tesauro.

Autor (nome) Pessoa natural ou jurídica que emitiu o documento.

Data e local da digitalização Registro cronológico (data e hora) e tópico (local) da digitalização do
documento.

Identificador do documento digital Identificador único atribuído ao documento no ato de sua captura para
o sistema informatizado (sistema de negócios).

Responsável pela digitalização Pessoa jurídica ou física responsável pela digitalização

Título Elemento de descrição que nomeia o documento. Pode ser formal ou


atribuído:

• formal: designação registrada no documento;

• atribuído: designação providenciada para identificação de um


documento formalmente desprovido de título.

Tipo documental Indica o tipo de documento, ou seja, a configuração da espécie


documental de acordo com a atividade que a gerou.

Hash (chekcsum) da imagem Algoritmo que mapeia uma sequência de bits (de um arquivo em
formato digital), com a finalidade de realizar a sua verificação de
integridade.
37

Quadro 8 - Metadados mínimos exigidos para documentos digitalizados por pessoas jurídicas de
direito público interno.

Metadados Definição

Classe Identificação da classe, subclasse, grupo ou subgrupo do documento


com base em um plano de classificação de documentos.

Data de produção (do documento Registro cronológico (data e hora) e tópico (local) da produção do
original) documento.

Destinação prevista (eliminação ou Indicação da próxima ação de destinação (transferência, eliminação ou


guarda permanente) recolhimento) prevista para o documento, em cumprimento à tabela de
temporalidade e destinação de documentos das atividades-meio e das
atividades-fim.

Gênero Indica o gênero documental, ou seja, a configuração da informação no


documento de acordo com o sistema de signos utilizado na
comunicação do documento.

Prazo de guarda Indicação do prazo estabelecido em tabela de temporalidade para o


cumprimento da destinação.
38

ANEXO III

O Quadro 9 mostra categorias de metadados, apresentadas por Gilliland (2016), contendo o


nome, a definição e alguns exemplos para cada categoria.

Quadro 9 : Categorias de metadados

Categoria Definição Exemplos

Administrativo Metadados usados ​no ● Informações de aquisição e avaliação


gerenciamento e administração de ● Rastreamento de direitos e reprodução
coleções e recursos de informação ● Documentação de requisitos e protocolos
legais, culturais e de acesso à comunidade
● Informação de localização
● Critérios de seleção para digitalização
● Documentação digital de repatriação

Descritivo Metadados usados ​para identificar, ● Metadados gerados pelo criador original e
autenticar e descrever coleções e sistema
recursos de informações confiáveis ● Pacote de informações de envio
​relacionados ● Registros de catalogação
● Encontrar ajudas
● Controle de versão
● Índices especializados
● Informação curatorial
● Relações vinculadas entre recursos
● Descrições, anotações e emendas por
criadores e outros usuários

Preservação Metadados relacionados com a ● Documentação da condição física dos recursos


gestão da preservação de coleções ● Documentação de ações tomadas para
e recursos de informação preservar versões físicas e digitais de recursos
(por exemplo, atualização de dados e
migração)
39

● Documentação de quaisquer alterações


ocorridas durante a digitalização ou
preservação

Técnico Metadados relacionados a como um ● Documentação de hardware e software


sistema funciona ou os metadados ● Informações procedurais geradas pelo sistema
se comportam (por exemplo, roteamento e metadados de
eventos)
● Informações de digitalização técnica (por
exemplo, formatos, taxas de compressão,
rotinas de dimensionamento)
● Rastreamento de tempos de resposta do
sistema
● Dados de autenticação e segurança (por
exemplo, chaves de criptografia, senhas)

Uso Metadados relacionados ao nível e ● Registros de circulação


tipo de uso de coleções e recursos ● Registros físicos e digitais da exposição
de informação ● Uso e rastreamento de usuário
● Reutilização de conteúdo e informações de
multiversão
● Logs de pesquisa
● Metadados de direitos

Fonte: Gilliland (2016, tradução nossa)

Você também pode gostar