Você está na página 1de 15

EIXO TEMÁTICO:

Metadados, Acesso e Recuperação de dados e Informação

ESTRUTURAS DE REPRESENTAÇÃO DE DADOS AGRICOLAS: TRAJETORIA


EM PERIODICOS E EVENTOS CIENTIFICOS

REPRESENTATION STRUCTURES OF AGRICULTURAL DATA: TRAJECTORY


IN SCIENTIFIC JOURNALS AND CONFERENCES

Resumo: Apresenta-se uma análise da trajetória nas publicações a partir da Ciência da Informação sobre
a representação de dados agrícolas nos periódicos A1, A2 e nos eventos Dublin Core Metadata Iniciative
e o Encontro Nacional de Pesquisa em Ciência da Informação, com o estudo da definição e aplicação
do eXtensible Markup Language (XML) e o Resource Description Framework (RDF) como apoios
tecnológicos a partir da Ciência da Informação, desde a perspectiva de promover a disponibilização de
dados agrícolas. Conjuntamente, descreve a formulação estrutural da representação do AGROVOC
quanto tesauro com as tecnologias XML e RDF. A abordagem metodológica que busca cumprir com os
objetivos deste trabalho, é mediante pesquisa exploratória e descritiva, desenvolvendo pesquisa
bibliográfica de documentos especializados. Conclui-se que há uma discussão limitada desde a Ciência
da Informação no referente as representações com XML e RDF dentro do domínio da Agricultura. Além
disso, RDF e XML constituem os formatos fundamentais de representação dentro da busca da
interoperabilidade semântica dos tesauros para sua transição em direção aos dados enlaçados.

Palavras-chave: Representação dados; RDF; XML; AGROVOC; SKOS

Abstract: It presents an analysis of the trend in publications from the Information Science on the
representation of agricultural data in periodic A1, A2 and events Dublin Core Metadata Initiative and
the Encontro Nacional de Pesquisa em Ciência da Informação, with the study of definition and
application of the eXtensible Markup Language (XML) and the Resource Description Framework
(RDF) and technological support from the Information Science, from the perspective of promoting the
availability of agricultural data. Together, describes the structural formulation of the representation of
the AGROVOC thesaurus as with XML and RDF technologies. The methodological approach that seeks
to meet the objectives of this work is through exploratory and descriptive research, developing literature
of specialized documents. It is concluded that there is limited discussion from the Information Science
in respect representations with XML and RDF in the field of Agriculture. In addition, RDF and XML
are the key formats of representation within the search semantic interoperability of thesauri for their
transition towards linked data.

Keywords: Data Representation; RDF; XML; AGROVOC; SKOS

III Encontro Internacional – Dados, Tecnologia e Informação (III DTI) 2016. Marília: Universidade Estadual Paulista “Júlio de Mesquita
Filho”, Programa de Pós-Graduação em Ciência da Informação (PPGCI/UNESP).
1 INTRODUÇÃO

O panorama atual dos dados e informações disponibilizados por governos e por


empresas privadas que se acrescentaram à consciência coletiva de dispor seus ativos
informáticos, como parte do desenvolvimento do seu entorno local ou nacional, pode-se
delinear com uma grande variedade de adjetivos que indiquem movimento, destacando o
dinamismo e o aprimoramento.
A Ciência da Informação (CI), como Ciência Interdisciplinar e como tal segundo
Saracevic1, (1996, citado por SIMIONATO, 2015, p. 16) visa a contextualização de estratégias
e métodos desenvolvidos para disponibilizar as informações de modo que possam ser
recuperadas com o auxílio de tecnologias.
Alguns dados e informações por seu papel fundamental na economia e sociedade torna-
se objeto de esforços comuns em seus processos de recuperação, como é o caso do domínio da
agricultura. Segundo o Instituto Brasileiro de Geografia e Estatística (IBGE), o Produto Interno
Bruto do setor Agropecuário, composto por Produção Agrícola e Produção Pecuária, teve um
crescimento de 1,8% no ano 2015 com respeito a 2014, enquanto a taxa acumulada do pais
sofreu uma contração de 3.8% com relação ao ano anterior, o que chama a manter a atenção
dos grupos acadêmicos e de pesquisa nesse sector da economia Brasileira. (INDICADORES
IBGE, 2016).
Segundo Santos (2005, p. 130) “O papel a ser desempenhado pela CI é estratégico,
considerando-se o desenvolvimento do conhecimento coletivo e do aprendizagem contínuo,
tornando mais fácil o compartilhamento de problemas, perspectivas, ideias e soluções.”
É por esta responsabilidade com o desenvolvimento geral da sociedade que a presente
pesquisa estuda o que está surgindo a partir da Ciência da Informação sobre a representação de
dados agrícolas nos periódicos A1, A2 e nos eventos DCIM e ENANCIB.
A abordagem metodológica que busca cumprir com os objetivos deste trabalho, segundo
Gonsalves (2001), é mediante pesquisa exploratória e descritiva, efetuando pesquisa
bibliográfica de caráter qualitativa das tecnologias eXtensible Markup Language (XML) e o
Resource Description Framework (RDF), dentro do domínio da agricultura mapeando e

1SARACEVIC, T. Ciência da informação: origem, evolução e relações. Perspectivas em Ciência da Informação, Belo
Horizonte, v. 1, n. 1, 1996. p. 41-62.

III Encontro Internacional – Dados, Tecnologia e Informação (III DTI) 2016. Marília: Universidade Estadual Paulista “Júlio de Mesquita
Filho”, Programa de Pós-Graduação em Ciência da Informação (PPGCI/UNESP).
discutindo as definições aplicadas dessas tecnologias em os documentos especializados das
revistas A1 e A2, e nos websites dos eventos DCIM e ENANCIB, visando a disponibilização
de dados agrícolas representados a traves destes linguagens de marcação. Conjuntamente,
descreve a formulação estrutural da representação do AGROVOC quanto tesauro com as
tecnologias XML e RDF. O recorte da pesquisa atingiu o período 2006 a 2015 nas bases de
dados indicadas, com publicações em português, castelhano e inglês.
O trabalho está desenvolvido em duas etapas: a primeira coletando artigos com os
termos “XML e AGRICULTURA”, “RDF e AGRICULTURA”, buscando nas revistas A1
segundo a classificação QUALIS 2014 disponível no portal
https://sucupira.capes.gov.br/sucupira.
Na segunda etapa são estendidos tanto os termos da pesquisa como as bases de dados,
assim amplia-se os termos a “XML e AGRICULTURA”, “RDF e AGRICULTURA” e
“AGROVOC”, pesquisando nas bases de dados das revistas A1, A2 e nos websites dos eventos
DCIM e ENANCIB.
Para atingir o objetivo deste trabalho, foi feita leitura inicialmente do resumo dos
documentos recuperados, contudo, se não foi suficiente com a informação contida no resumo,
realizou-se a leitura completa dos documentos.
Em primeiro lugar este estudo apresenta um breve marco teórico percorrendo os
conceitos dos dois formatos escolhidos para falar sobre representação de dados e informação,
XML e RDF e sua contextualização dentro da Web Semântica. A seguinte seção, descreve os
resultados obtidos, para continuar com a análise das tendências observadas e finalmente expõe-
se as reflexões e as propostas futuras a desenvolver.

2 A JUNÇÃO DO BÁSICO: XML E RDF EM AÇÃO

Na atualidade o processo de recuperação da informação é o assunto de suma importância


e que recebe a atenção de grupos científicos, académicos e empresariais. Santos e Alves (2009,
p. 1) reiteram sobre o ambiente informacional web que: “A valorização da informação e o
crescimento exponencial dos tipos de recursos informacionais ainda se constituem como um
dos fatores que dificultam a busca, a localização, o acesso e a recuperação desses mesmos
recursos disponibilizados em ambientes informacionais diversos”.

III Encontro Internacional – Dados, Tecnologia e Informação (III DTI) 2016. Marília: Universidade Estadual Paulista “Júlio de Mesquita
Filho”, Programa de Pós-Graduação em Ciência da Informação (PPGCI/UNESP).
O reconhecimento e atenção dos profissionais da CI com referência à grande quantidade
de dados e informação presentes na Web é inquirido por Ramalho (2015, p. 67) onde afirma
que:
Atualmente é inegável que o ambiente o Web constitui-se como uma das mais
ricas fontes de informações, contudo tal fato que se caracteriza como uma de
suas principais características, também se apresenta como um fator crítico
para seu crescimento, devido à crescente demanda por instrumentos e métodos
que possibilitem uma melhor organização, e representação mais adequada, dos
conteúdos disponibilizados.

Assim, foi manifesta a necessidade de criar linguagens, estruturas, formatos que


permitam a representação olhando à recuperação da informação dentro do ambiente Web. Neste
contexto surge a Linguagem de Marcado Extensível (XML) abordando os dados e sua própria
descrição, como foi descrito por Santarém Segundo (2010, p. 75),
[...] a XML ainda tem um mecanismo pratico de descrever os dados no
documento, isto é, um documento XML, que, além de carregar os dados em
si, aborda conjuntamente a descrição desses dados. Esta característica faz de
uma aplicação XML um ótimo modo de compartilhar as informações com
outras aplicações via Internet.

XML como metalinguagem, permite definir outras linguagens que estruturem conteúdo,
sendo assim um modelo de metadados basilar para a Web Semântica.
Além disso, RDF vem como um marco de trabalho que define uma norma para criar
esquemas de metadados, utilizando XML, permitindo interoperabilidade de dados pela sua
estruturação, o que sem dúvida assegura a busca e recuperação de dados e informações dentro
da Web Semântica. (MENDEZ, 2002).

3 RESULTADOS NA BUSCA DE DADOS E INFORMAÇÕES PARA A


AGRICULTURA REPRESENTADOS COM XML E RDF.

Na primeira etapa desta pesquisa, a busca foi realizada com os termos “XML e
Agricultura”, “RDF e Agricultura”, no período contemplado entre os anos 2006 e 2015, nas
bases de dados das revistas A1.
Para cada um dos trabalhos recuperados foram atribuídas uma ou mais categorias,
seguindo a categorização proposta por Santos e outros em 2013: a) teoria, b) desenvolvimento,

III Encontro Internacional – Dados, Tecnologia e Informação (III DTI) 2016. Marília: Universidade Estadual Paulista “Júlio de Mesquita
Filho”, Programa de Pós-Graduação em Ciência da Informação (PPGCI/UNESP).
c) uso, d) avaliação, e) políticas e f) ética, segundo a abordagem feito desde as tecnologias
XML, RDF e do AGROVOC.
Na primeira etapa da pesquisa, foi obtido só um artigo com possibilidade de análise, o
qual se apresenta no quadro 1.

Categoria
Revista/ Ano de
Título Autores Instituições (SANTOS, et.
Evento publicação
al.; 2013)
Jasist Terminology 2014 Golub, K. Univ. of Bath, UK Teoria, Uso
Registries for Tudhope, D. Univ. of South
Knowledge Zeng, M.L. Wales, UK
Organization Žumer, M. Kent State Univ.,
Systems: USA
Functionality, Use, Univ. of
and Attributes Ljubljana, SLO

Quadro 1- Trabalho recuperado na primeira etapa da pesquisa


Fonte: Os autores

O artigo recuperado logra resumir as características dos diversos tipos de Terminology


Registries (TR) e apresenta uma visão generalizada da sua funcionalidade.
Um TR registra sistematicamente Sistemas de Organização do Conhecimento
com estruturas padronizadas para inspeção com acesso tanto por humanos
como de maquinas. Ele identifica, descreve e sinala conjuntos de vocabulários
controlados disponíveis para usar dentro de sistemas de informação e de
serviços. [...] TR são um elemento crucial de uma infraestrutura para
descobrimento de recursos. (Golub, 2014, p. 1901, tradução nossa).

Dentro do seu corpo, os autores examinaram vários TR, um dos quais foi AGROVOC,
que é o Thesauro da Food and Agriculture Organization of the United Nations (FAO).
AGROVOC é um Thesauro multilíngue desenvolvido pela FAO e a Comissão das
Comunidades Europeias a princípios de 1980. Presentemente continua sendo atualizado pela
FAO em colaboração com as organizações associadas em diferentes países, estando disponível
em línea para 19 idiomas (Morshed, 2010). É usado em o mundo tudo pelos governos,
pesquisadores, bibliotecários e gestores de informação para a indexação, recuperação e
organização de dados em sistemas de informação agrícola. (CARACCIOLO, 2012).
A recuperação dos trabalhos na primeira etapa desta pesquisa, leva aos autores a
determinar uma ampliação e, ter assim, uma segunda etapa, estendendo-se a pesquisar os termos
“XML e Agricultura”, “RDF e Agricultura” e, adicionalmente, o termo “AGROVOC”. Em

III Encontro Internacional – Dados, Tecnologia e Informação (III DTI) 2016. Marília: Universidade Estadual Paulista “Júlio de Mesquita
Filho”, Programa de Pós-Graduação em Ciência da Informação (PPGCI/UNESP).
quanto aos periódicos, buscando além das revistas A1, nas revistas A2 e os web sites dos
eventos DCIM e ENANCIB, mantendo o período de tempo da primeira etapa. O quadro 2
relaciona as bases de dados abordadas nas duas etapas deste trabalho com a respetiva URL.

PERIODICO / EVENTO URL


A1
Comunicar http://www.revistacomunicar.com/
EPI http://www.elprofesionaldelainformacion.com/contenidos.html
JASIST http://onlinelibrary.wiley.com/journal/10.1002/(ISSN)2330-1643
Investigação Bibliotecológica http://www.ies.ufpb.br/ojs/index.php/ies/index
Informação & Sociedade http://www.ies.ufpb.br/ojs/index.php/ies/index
Transinformação http://periodicos.puc-
campinas.edu.br/seer/index.php/transinfo/index
Perspectivas em Ciência da http://portaldeperiodicos.eci.ufmg.br/index.php/pci
Informação
Revista Española de Documentación http://redc.revistas.csic.es/index.php/redc
Científica
Hermès (Paris. 1988) http://www.cairn-int.info/resultats_recherche.php
Information Sciences http://www.journals.elsevier.com/information-sciences
Information Research http://www.informationr.net/ir/
International Journal of http://ijoc.org/index.php/ijoc
Communication (Online)
Knowledge Organization http://www.isko.org/ko.html
Sociétés (Paris) https://www.cairn.info/revue-societes.htm
A2
Revista General de Información y http://revistas.ucm.es/index.php/RGID
Documentación
Revista Interamericana de http://aprendeenlinea.udea.edu.co/revistas/index.php/RIB
Bibliotecología
EVENTOS
DCIM http://dcpapers.dublincore.org/pubs
ENANCIB http://enancib.ibict.br/index.php/enancib/index

Quadro 2- Listado de periódicos e eventos objetos desta pesquisa


Fonte: Os autores

Nesta nova etapa, que acrescentou termos, periódicos e eventos foram recuperados vinte
(20) artigos relevantes para ser analisados por quanto estão relacionados com os objetivos desta
pesquisa, estes artigos são relacionados no quadro 3.

Categoria
Revista/
Data Título (SANTOS et al., Autores Instituições
Evento
2013)

Comparing Human and LAUSER, B. FAO


Automatic Thesaurus Desenvolvimento JOHANNSEN, G. FAO
DCIM 2008
Mapping Approaches in , Uso, Avaliação
the Agricultural Domain CARACCIOLO, C. FAO

III Encontro Internacional – Dados, Tecnologia e Informação (III DTI) 2016. Marília: Universidade Estadual Paulista “Júlio de Mesquita
Filho”, Programa de Pós-Graduação em Ciência da Informação (PPGCI/UNESP).
Categoria
Revista/
Data Título (SANTOS et al., Autores Instituições
Evento
2013)

KEIZER, J. FAO
HAGE, W.R.V. Univ. Vrije
MAYR, P. GESIS
Interlinking Two AUBIN, S. INRA
Institutional KOS about
Agroecology: using LOD AVENTURIER, P. INRA
DCIM 2015 AGROVOC to Circumvent Uso JÚNIOR, I.P. EMBRAPA
the Language Barrier in
identifying terminological OLIVEIRA, L.H.M. EMBRAPA
intersections
PEROT
LIANG, A.C. SYSTEMS,
From AGROVOC to the
FAO
Agricultural Ontology
Service / Concept Server Desenvolvimento LAUSER, B. FAO
DCIM 2006
An OWL model for , Uso, Avaliação SINI, M. FAO
creating ontologies in the
agricultural domain KEIZER, J. FAO
KATZ, S. FAO
MORSHED, A. FAO
Thesaurus Alignment for CARACCIOLO, C. FAO
DCIM 2011 Uso, Avaliação
Linked Data Publishing JOHANNSEN, G. FAO
KEIZER, J. FAO
JAQUES, Y. FAO
ANIBALDI, S. FAO
Proof and Trust in the CELLI, F. FAO
Desenvolvimento
DCIM 2012 OpenAGRIS
FAO
Implementation , Uso SUBIRATS, I.
Univ. of Tor
STELLATO, A.
Vergata
KEIZER, J. FAO
Mapping AGROVOC and LIANG, A.C. FAO
the Chinese Agricultural
KO LITERATURE 2006 Desenvolvimento
Thesaurus: Definitions, SINI, M. FAO
tools, procedures
LAUSER, B. FAO
AGROVOC Web Services: SINI, M. FAO
Improved, Real-time
KO LITERATURE 2006 Teoria SALOKHE, G. FAO
access to na Agricultural
Thesaurus KEIZER, J. FAO
KATZ, S. FAO
SINI, M. FAO
LAUSER, B. FAO
The AGROVOC Concept
KO LITERATURE 2008 Server: rationale, goals Teoria SALOKHE, G. FAO
and usage
KEIZER, J. FAO
KATZ, S. FAO

III Encontro Internacional – Dados, Tecnologia e Informação (III DTI) 2016. Marília: Universidade Estadual Paulista “Júlio de Mesquita
Filho”, Programa de Pós-Graduação em Ciência da Informação (PPGCI/UNESP).
Categoria
Revista/
Data Título (SANTOS et al., Autores Instituições
Evento
2013)

CARACCIOLO, C. FAO
MORSHED, A. FAO
Thesaurus Maintenance, Univ. of Tor
Alignment and Publication Desenvolvimento STELLATO, A. Vergata
KO LITERATURE 2012
as Linked Data: The , Uso, Avaliação
AGROVOC Use case JOHANNSEN, G. FAO
JAQUES, Y. FAO
KEIZER, J. FAO
Reg.
Inform.
The Persian Agrovoc in an Desenvolvimento Center for
KO LITERATURE 2011 FUMANI, M.R.F.Q.
indexing context , Uso, Avaliação Science and
Technology
of Iran.
Univ. of
GOLUB, K.
Bath
Univ. of
Terminology Registries for TUDHOPE, D. South
Knowledge Organization
JASIST 2014 Teoria, Uso Wales
Systems: Functionality,
Use, and Attributes Kent State
ZENG, M.L.
Univ.
Univ. of
ŽUMER, M.
Ljubljana
A Random Walk on an Univ. of
WILLIS, C.
Ontology: Using Illinois
Desenvolvimento
JASIST 2013 Thesaurus Structure for Univ. of
, Avaliação
Automatic Subject LOSEE, R.M. North
Indexing Carolina
Domain-Independent Univ. of
MEDELYAN, O.
Automatic Keyphrase Desenvolvimento Waikato
JASIST 2007
Indexing with Small , Uso, Avaliação Univ. of
Training Sets WITTEN, I.H.
Waikato
Concordia
MESGARI, M.
Univ.
Concordia
“The Sum of All Human MOLSON, C.O.J.
Univ.
Knowledge”: A Systematic
Concordia
JASIST 2015 Review of Scholarly Uso, Avaliação MEHDI, M.
Research on the Content of Univ.
Wikipedia Univ. of
NIELSEN, F. A.
Denmark
Univ. of
LANAMÄKI, A.
Oulu
Univ. of
KLESS, D.
Thesaurus and Ontology Melbourne
Structure: Formal and Univ. of
JASIST 2015 Avaliação MILTON, S.
Pragmatic Differences and Melbourne
Similarities Univ. of
KAZMIERCZAK, E.
Melbourne

III Encontro Internacional – Dados, Tecnologia e Informação (III DTI) 2016. Marília: Universidade Estadual Paulista “Júlio de Mesquita
Filho”, Programa de Pós-Graduação em Ciência da Informação (PPGCI/UNESP).
Categoria
Revista/
Data Título (SANTOS et al., Autores Instituições
Evento
2013)
Indep.
LINDENTHAL, J. Inform.
Cons.
Advantages of thesaurus PASTOR- Univ. de
representation using the SANCHEZ, J.A. Murcia
INFORMATION Simple Knowledge Teoria, MARTINEZ- Univ. de
2009
RESEARCH Organization System Avaliação MÉNDEZ, F.J. Murcia
(SKOS) compared with RODRIGUEZ- Univ. de
proposed alternatives MUÑOZ, J.V. Murcia
Univ.
PESET, F. Politec. de
Linked open data y Open Valencia
data. Su impacto en el área Uso, Avaliação, Univ.
EPI 2011
de bibliotecas y Políticas FERRER-SAPENA,
Politec. de
documentación. A.
Valencia
SUBIRATS, I. FAO
Univ.
SANCHEZ-
Carlos III
CUADRADO, S.
de Madrid
Univ.
Tesauros: Estándares y COLMENERO-
EPI 2012 Teoria Carlos III
Recomendaciones RUIZ, M.J.
de Madrid
Univ.
MOREIRO, J.A. Carlos III
de Madrid
Univ.
MENDEZ, E. Carlos III
Datos enlazados para
Teoria, de Madrid
EPI 2012 vocabularios abiertos y
marco general de HIVE Avaliação Univ.
GREENBERG, J. Carlos III
de Madrid
PASTOR- Univ. de
Aplicación de SKOS para SANCHEZ, J.A. Murcia
la interoperabilidad de
Teoria, MARTINEZ- Univ. de
EPI 2015 vocabularios controlados
en el entorno de linked Avaliação MÉNDEZ, F.J. Murcia
open data RODRÍGUEZ- Univ. de
MUÑOZ, J.V. Murcia

Quadro 3- Trabalhos recuperados com ampliação de termos e fontes na pesquisa


Fonte: Os autores

4 TENDÊNCIA NAS PUBLICAÇÕES RECUPERADAS.

Com o fim de realizar uma análise quantitativo dos trabalhos recuperados pela
categorização utilizada, amostra-se no gráfico 1 as frequências em cada uma delas.

III Encontro Internacional – Dados, Tecnologia e Informação (III DTI) 2016. Marília: Universidade Estadual Paulista “Júlio de Mesquita
Filho”, Programa de Pós-Graduação em Ciência da Informação (PPGCI/UNESP).
Teoria Desenvolvimento Uso Avaliação Políticas Ética

15 13
11
10 8
7

5
1
0
0
Frequência

Gráfico 1- Frequência dos trabalhos por categorias


Fonte: Os autores

Nestes eventos e periódicos as discussões a partir da CI sobre as tecnologias XML, RDF


no domínio da Agricultura foram abordadas fazendo uso delas como ferramentas para o
baseamento tecnológico na criação, manutenção e adaptação de tesauros para a
interoperabilidade semântica. Os trabalhos recuperados encontram-se dentro do foco da CI
como Ciência Social aplicada, direcionando os:
[...] princípios e métodos que são partes da análise, do projeto e da evolução
dos sistemas de informação. [...] Eles sustentam a capacidade para a busca de
soluções e tomada de decisões como parte da vida diária, envolvendo a
manipulação de dados, o acesso à informação e a apropriação do
conhecimento. (SANTOS; SANTANA, 2015, p. 200).

Os formatos XML e RDF estão dentro do grupo de elementos categorizados como ativos
semânticos, assim definido pela União Europeia2, estabelecendo estes esquemas de
representação de dados junto com outros elementos que auxiliam nos processos
representacionais dos domínios do conhecimento. (GOLUB, 2014).
Evidencia-se no percorrido feito pelos trabalhos analisados que os padrões de
representação primeiro XML, após logo RDF vem sendo usados na busca da Interoperabilidade
semântica em especial dentro da representação dos tesauros.
Esquemas como XML tem recebido muita atenção como pre-requisito para a
interoperabilidade. (MORSHED et al., 2011; NOY, 2004).
Além, nota-se dentro da busca da interoperabilidade semântica o uso de padrões dentro
do domínio da Agricultura, no uso de fontes de dados representados com RDF em sua versão

2
https://joinup.ec.europa.eu/asset/adms/asset_release/adms#download-links

III Encontro Internacional – Dados, Tecnologia e Informação (III DTI) 2016. Marília: Universidade Estadual Paulista “Júlio de Mesquita
Filho”, Programa de Pós-Graduação em Ciência da Informação (PPGCI/UNESP).
RDF/XML, acrescentando simpleza na integração e processamento dos dados entre fontes
representadas usando essas mesmas estruturas de marcado. (LAUSER, 2006).
De maneira similar acontece com o Sistema de Organização de Conhecimento Simples
(SKOS), que faz parte de nossos resultados por quanto vem sendo utilizado na serialização do
tesauro AGROVOC.
O Instituto Nacional da Pesquisa Agronômica (INRA) da França e a Empresa Brasileira
de Pesquisa Agropecuária (EMBRAPA) na busca da interoperabilidade semântica dos seus
termos equivalentes, utilizam o AGROVOC serializado em RDF SKOS em uma metodologia
proposta para resolver esta situação. (Aubin, 2015).
AGROVOC tem como objetivo proporcionar serviços baseados na semântica dos
usuários no sector agrícola (Morshed, 2010), com o intuito de manter a comunicação entre seus
usuários, evitando a duplicidade de esforços, conseguindo extensão e reuso da informação
contida nele.
Segundo Ramalho (2015, p. 67) os sistemas SKOS “proporcionam um modelo para a
representação formal da estrutura básica e conteúdo de Sistemas de Organização do
Conhecimento; como tesauros [...]”. A codificação de SKOS, é baseada em RDF. (Ramalho,
2015, p. 67).
No trabalho de Pastor-Sanchez, Martínez-Méndez e Rodriguez-Muñoz (2015), o qual
está centrado na solução do problema da representação de esquemas conceituais como os
tesauros, conclui adotando o SKOS como modelo comum para representa-los de maneira
padronizada.
Para Sanchez-Cuadrado, Colmenero-Ruiz e Moreiro (2012), referindo-se as abordagens
de SKOS, o definem como uma formalização simples que tem trazido facilidade e uso eficiente
dos tesauros na Web Semântica.
SKOS/RDF constitui o modelo de representação de outros tesauros como EUROVOC
tesauro de assuntos parlamentários administrado pela União Europeia e GEMET, que é um
tesauro europeio que abrange o domínio do meio ambiente (Morshed, 2011), mais evidências
do escopo das representações com XML e RDF, ainda acrescentando-se com que os processos
de mapeamento de vocabulários em busca da interoperabilidade entre eles marcando uma
tendência nas representações de dados.
Adicionalmente, organizam-se mapeamentos entre os vocabulários, realizados por
maquinas e também por humanos. Estes processos têm o propósito não só de ingressar na

III Encontro Internacional – Dados, Tecnologia e Informação (III DTI) 2016. Marília: Universidade Estadual Paulista “Júlio de Mesquita
Filho”, Programa de Pós-Graduação em Ciência da Informação (PPGCI/UNESP).
Linked Open Data (LOD), como já tem feito os tesauros mencionados, AGROVOC,
EUROVOC, GEMET. Os vocabulários enlaçados fazem parte da tendência crescente em
iniciativas que permitem busca e indexação a traves de múltiplos vocabulários. (MENDEZ;
GREENBERG, 2012).
O Sistema de Informação Internacional de Ciência e Tecnologia Agricultural(AGRIS),
é uma base de dados bibliográfica para a pesquisa agricultural, a qual tem vindo evoluindo com
as tecnologias de representação de dados. Possui “[...] um dos mais amplos sistemas de
recuperação de dados e informação agrícola na web, apoiado por uma base de dados de domínio
público global com mais de sete milhões de registros bibliográficos estruturados em ciência e
tecnologia agrícola [...]”. (MOREIRA et al., 2015, p. 3).
Agora bem, como parte da decisão da FAO de expressar todo o repositório cientifico
AGRIS em RDF, nasce um mashup semântico nomeado OpenAGRIS com o intuito de permitir
a desambiguação presente pela ausência de metadados administrativos nos documentos que vão
ser acessados. Utilizou-se RDF na conversão das revistas que publicaram os artigos como parte
do processo. (JAQUES, 2012).
Outro uso de RDF e XML na representação de recursos informacionais tem sido como
ferramentas para a desambiguação de dados pela ausência de metadados administrativos.

5 CONSIDERAÇÕES.

Com o desenvolvimento deste trabalho, evidencia-se nas bases de dados consultadas


uma discussão limitada a partir da CI no que se refere as representações com XML e RDF
dentro do domínio da Agricultura. Do total das revistas A1, A2 e nos eventos DCIM e
ENANCIB consultados, unicamente 27.8% forneceram resultados relevantes para o objetivo
desta pesquisa.
As linguagens RDF e XML constituem-se como os formatos basilares de representação
de dados e informações dentro da busca da interoperabilidade semântica dos tesauros na sua
transição ao LOD, usando a representação SKOS/RDF como formalização simples do
conhecimento.
Pode concluir-se também, que o AGROVOC está agindo como pivô em processos de
mapeamento de termos, conceitos, e relações com alguns dos mais usados tesauros dentro do
domínio agricultural, com alinhamentos realizados em regiões como a Europa, China e Irã.

III Encontro Internacional – Dados, Tecnologia e Informação (III DTI) 2016. Marília: Universidade Estadual Paulista “Júlio de Mesquita
Filho”, Programa de Pós-Graduação em Ciência da Informação (PPGCI/UNESP).
Finalmente a CI como ciência multi-disciplinar pode atuar a partir dos governos
sinalizando a importância na representação de dados e informações para facilitar o reuso por
parte de agentes de todo sector da sua sociedade. Propõe-se como trabalhos futuros, focar a
análise das redes de colaboração que estão sendo estabelecidas e nas que podem estar surgindo.
De igual forma, explorar os embasamentos bibliográficos usados nos trabalhos prévios e o
relacionamento das produções científicas com as suas regiões geográficas.

REFERÊNCIAS BIBLIOGRÁFICAS.
AUBIN, S.; et al. Interlinking two institutional KOS about agroecology: using LOD agrovoc to
circumvent the language barrier in identifying terminological intersections. Proceedings of the 2015
International Conference on Dublin Core and Metadata Applications. Dublin Core Metadata Initiative,
2015. p. 195-197.

CARACCIOLO, C.; et al. Thesaurus maintenance, alignment and publication as linked data: the
AGROVOC use case. International Journal of Metadata, Semantics and Ontologies, 2012, vol. 7, no 1,
p. 65-75.

FUMANI, M.R.F.Q. The Persian Agrovoc in an indexing context. The Indexer, 2011, vol. 29, no 1, p.
23-29.

GOLUB, K.; et al. Terminology registries for knowledge organization systems: Functionality, use, and
attributes. Journal of the Association for Information Science and Technology, (2014), vol. 65, no 9,
p.1901–1916. doi: 10.1002/asi.23090.

GONSALVES, E.P., Conversas sobre iniciação à pesquisa científica. Campinas: ALÍNEA, 2001.

INDICADORES IBGE. Contas Nacionais Trimestrais 4 Trim. 2015. Disponível em:


<ftp://ftp.ibge.gov.br/Contas_Nacionais/Contas_Nacionais_Trimestrais/Fasciculo_Indicadores_IBGE/
pib-vol-val_201504caderno.pdf> Acesso em: 21 jul. 2016.

KLESS, D. et al. Thesaurus and ontology structure: Formal and pragmatic differences and
similarities. Journal of the Association for information science and technology, 2015, vol. 66, no 7, p.
1348-1366. Disponível em: <http://onlinelibrary.wiley.com/doi/10.1002/asi.23268/full> Acesso em:
30 Jun. 2016.

JAQUES, Y.; et al. Proof and Trust in the OpenAGRIS Implementation. International Conference on
Dublin Core and Metadata Applications. Dublin Core Metadata Iniciative, 2012.

LAUSER, B.; et al. From AGROVOC to the Agricultural Ontology Service/Concept Server. An OWL
model for creating ontologies in the agricultural domain. International Conference on Dublin Core and
Metadata Applications. Dublin Core Metadata Iniciative, 2006.

LAUSER, B. et al. Agrovoc Web Services: Improved, real-time access to an agricultural


thesaurus. IAALD Quarterly Bulletin, 2006, p. 79-81.

III Encontro Internacional – Dados, Tecnologia e Informação (III DTI) 2016. Marília: Universidade Estadual Paulista “Júlio de Mesquita
Filho”, Programa de Pós-Graduação em Ciência da Informação (PPGCI/UNESP).
LAUSER, B. et al. Comparing human and automatic thesaurus mapping approaches in the agricultural
domain. Universitätsverlag Göttingen, 2008, p. 43. Disponível em:
<http://dcpapers.dublincore.org/pubs/article/view/918>. Acesso em: 10 jul. 2016.

LIANG, A.C.; SINI, M. Mapping AGROVOC and the Chinese Agricultural Thesaurus: definitions,
tools, procedures. New Review of Hypermedia and Multimedia, 2006, vol. 12, no 1, p. 51-62.

MEDELYAN, O.; WITTEN, I.H. Domain‐independent automatic keyphrase indexing with small
training sets. Journal of the American Society for Information Science and Technology, 2008, vol. 59,
no 7, p. 1026-1040. Disponível em: <http://onlinelibrary.wiley.com/doi/10.1002/asi.20790/full>.
Acesso em: 1 Jul. 2016.

MENDEZ, E. Metadatos y recuperación de información. Estándares, problemas y aplicabilidad en


bibliotecas digitales. Gijón, 2002.

MÉNDEZ, Eva; GREENBERG, Jane. Datos enlazados para vocabularios abiertos: marco global de
HIVE. El profesional de la información, vol. 21, no 3, p. 236-244. Disponível em:
<http://recyt.fecyt.es/index.php/EPI/article/view/33368/17917>. Acesso em: 25 Jun. 2016.

MOREIRA, F.M.; et al. Tecnologias da Web Semântica para a recuperação de dados agrícolas: um
estudo sobre o International Information System of the Agricultural Science and Technology
(AGRIS). Em Questão, vol. 21, no 1, p. 173-192.

MORSHED, A.; et al. Thesaurus alignment for linked data publishing. International Conference on
Dublin Core and Metadata Applications. Dublin Core Metadata Iniciative, 2011.

MORSHED, A.; et al. Bridging End Users’ Terms and AGROVOC Concept Server Vocabularies.
International Conference on Dublin Core and Metadata Applications. Disponível em:
<http://dcpapers.dublincore.org/pubs/article/view/1015/981>. Acesso em: 15 jul. 2016.

MESGARI, M. et al. “The sum of all human knowledge”: A systematic review of scholarly research
on the content of Wikipedia. Journal of the Association for Information Science and Technology,
2015, vol. 66, no 2, p. 219-245. Disponível em
<http://onlinelibrary.wiley.com/doi/10.1002/asi.23172/full>. Acesso em: 30 Jun. 2016.

NOY, N.F. Semantic integration: a survey of ontology-based approaches. ACM Sigmod Record, 2004,
v. 33, no 4, p. 65-70.

PASTOR, J.A.; MARTINEZ, F.J.; RODRIGUEZ J.V. Advantages of thesaurus representation using
the Simple Knowledge Organization System (SKOS) compared with proposed alternatives"
Information Research, 2009. Disponível em: <http://InformationR.net/ir/14-4/paper422.html>. Acesso
em: 15 jul. 2016.

PASTOR, J.A.; MARTINEZ, F.J.; RODRIGUEZ J.V. Aplicación de SKOS para la interoperabilidad
de vocabularios controlados en el entorno de linked open data. El profesional de la información, 2012,
vol. 21, no 3, p. 245-253. Disponível em:
<http://recyt.fecyt.es/index.php/EPI/article/view/epi.2012.may.04/17918>. Acesso em: 27 Jun. 2016.

PESET, M.M.F.; FERRER-SAPENA, A.; SUBIRATS-COLL, I. Open data y Linked open data: su
impacto en el área de bibliotecas y documentación. En El profesional de la información. EPI SCP,

III Encontro Internacional – Dados, Tecnologia e Informação (III DTI) 2016. Marília: Universidade Estadual Paulista “Júlio de Mesquita
Filho”, Programa de Pós-Graduação em Ciência da Informação (PPGCI/UNESP).
2011. p. 165-173. Disponível em:
<http://recyt.fecyt.es/index.php/EPI/article/view/epi.2011.mar.06/21218>. Acesso em: 20 Jun. 2016.

RAMALHO, R.A.S. Análise do Modelo de Dados SKOS: Sistema de Organização do Conhecimento


Simples para a Web. Informação & Tecnologia, 2015, vol. 2, no 1, p. 66-79.

SÁNCHEZ-CUADRADO, S.; COLMENERO-RUIZ, M. J.; MOREIRO-GONZÁLEZ, J.A. Tesauros:


estándares y recomendaciones. El Profesional de la Información, 2012, v. 21, no 3.

SANTAREM SEGUNDO, J.E. Representação iterativa: Um modelo para repositórios digitais. 2010.
Tese (Doutorado em Ciência da Informação) - Faculdade de Filosofia e Ciências, Universidade
Estadual Paulista, Marília, 2010.

SANTOS, P.L.V.A.C. Informação e tecnologia para o conhecimento: Desafios da ciência da


informação. Em: Del Roio, M (Org.). A Universidade entre o conhecimento e o trabalho: o dilema das
Ciências. Marília: UNESP, 2005.

SANTOS, P.L.V.A. da C, et al. Mapeamento do termo tecnologia em periódicos da CI no escopo do


GT-Informação e Tecnologia. 2014. Disponível em:
<http://enancib.sites.ufsc.br/index.php/enancib2013/XIVenancib/paper/view/201>. Acesso em: 08 de
jul. 2016.

SANTOS, P.L.V.A. da C; ALVES, R.C.V. Metadados e Web Semântica para estruturação da Web 2.0
e Web 3.0.Revista de Ciência da Informação, 2009, vol. 10, no 6.

SANTOS, P.L.V. A. da C.; SANTANA, R.C.G. Dado e Granularidade na perspectiva da Informação e


Tecnologia: uma interpretação pela Ciência da Informação. Ciência da Informação, [S.l.], v. 42, n. 2,
jan. 2015. ISSN 1518-8353. Disponível em: <http://revista.ibict.br/ciinf/article/view/1382/1560.>
Acesso em: 15 aug. 2016. doi:http://dx.doi.org/10.18225/ci.inf..v42i2.1382.

SIMIONATO, A.C.; et al. Modelagem conceitual DILAM: princípios descritivos de arquivos,


bibliotecas e museus para o recurso imagético digital. 2015. Tese (Doutorado em Ciência da
Informação) - Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília, 2015.

SINI, M. et al. The AGROVOC Concept Server: rationale, goals and usage. Library Review, 2008,
vol. 57, no 3, p. 200-212.

WILLIS, C.; LOSEE, R.M. A random walk on an ontology: Using thesaurus structure for automatic
subject indexing. Journal of the American Society for Information Science and Technology, 2013, vol.
64, no 7, p. 1330-1344. Disponível em: <http://onlinelibrary.wiley.com/doi/10.1002/asi.22853/full>.
Acesso em: 10 Jul. 2016

III Encontro Internacional – Dados, Tecnologia e Informação (III DTI) 2016. Marília: Universidade Estadual Paulista “Júlio de Mesquita
Filho”, Programa de Pós-Graduação em Ciência da Informação (PPGCI/UNESP).

Você também pode gostar