Você está na página 1de 104

Diretrizes para a

Integrao de Dados de
Biodiversidade
REPBLICA FEDERATIVA DO BRASIL
Presidenta
Dilma Rousseff
Vice-Presidente
Michel Temer

MINISTRIO DO MEIO AMBIENTE


Ministra
Izabella Mnica Teixeira
Secretria de Biodiversidade e Florestas
Ana Cristina Fialho de Barros

INSTITUTO CHICO MENDES DE CONSERVAO DA BIODIVERSIDADE


Presidente
Cludio Carrera Maretti
Diretor de Pesquisa, Avaliao e Monitoramento da Biodiversidade
Marcelo Marcelino de Oliveira
Coordenadora Geral de Pesquisa e Monitoramento
Ktia Torres Ribeiro
Coordenadora de Monitoramento da Conservao da Biodiversidade
Tathiana Chaves de Souza

Flona da Restinga de Cabedelo (PB)


Foto: Wigold B. Schffer
Ministrio do Meio Ambiente
Secretaria de Biodiversidade e Florestas

Diretrizes para a
Integrao de Dados de
Biodiversidade

MMA
Braslia
2015
INSTITUTO CHICO MENDES DE CONSERVAO DA BIODIVERSIDADE

Diretoria de Pesquisa, Avaliao e Monitoramento da Biodiversidade


Coordenao Geral de Pesquisa e Monitoramento

EQSW 103/104 Centro Administrativo Setor Sudoeste Bloco D 2 andar


Tel: (61) 2028-9090 fax: (61) 2028-9068
CEP: 70670-350 Braslia/DF

www.icmbio.gov.br/monitoramento

Catalogao na Fonte
Instituto Brasileiro do Meio Ambiente e dos Recursos Naturais Renovveis

D597 Diretrizes para a Integrao de Dados de Biodiversidade / Daniel Lins da Silva... [et al].
- Braslia: MMA, 2015.
100 p.

ISBN 978-85-7738-195-1

1. Guia. 2. Banco de dados (Biodiversidade). 3. Biodiversidade. I. Silva, Daniel


Lins da. II. Corra, Pedro Luiz Pizzigatti. III. Juarez, Keila Macfadem. IV. Fonseca,
Rafael Lus. V. Ministrio do Meio Ambiente. VI. Secretaria de Biodiversidade e
Florestas. VII. Ttulo.

CDU(2.ed.)504.7(036)

Referncia para citar a publicao:


SILVA, D.L.; CORRA, P.L.P.; JUAREZ, K.M.; FONSECA, R.L. Diretrizes para a Integrao de Dados de
Biodiversidade. Braslia: MMA, 2015. 100 p.

A reproduo desta obra permitida desde que citada a fonte. Essa permisso no se aplica s fotos e ilustraes, que
foram cedidas exclusivamente para esta publicao.

Esta obra no pode ser comercializada.


Diretrizes para a Integrao de Dados de Biodiversidade

COORDENAO EDITORIAL
Keila Macfadem Juarez e Rafael Lus Fonseca.

AUTORES
Daniel Lins da Silva, Pedro Luiz Pizzigatti Corra, Keila Macfadem Juarez e Rafael Lus Fonseca.

COLABORAO NOS TEXTOS E ACOMPANHAMENTO DO ESTUDO


Eduardo Dalcin e Jan Kleine Bning.

REVISO GRAMATICAL
Renata Cando de Oliveira

PROJETO GRFICO
ngela Ester Magalhes Duarte / AM Design

FICHA CATALOGRFICA
Heliondia Oliveira

FOTOS
As fotos publicadas neste livro foram cedidas sem custos pelos autores.
Agradecemos gentilmente aos fotgrafos que as cederam para compor este livro.

CAPA
Composio com fotos de Maurcio Mercadante e Wigold B. Schffer.

REALIZAO

Esta publicao foi realizada pelo Projeto Monitoramento da Biodiversidade com Relevncia para o
Clima em nvel de UC, considerando medidas de adaptao e mitigao. um projeto do governo
brasileiro, coordenado pelo Ministrio do Meio Ambiente (MMA) e o Instituto Chico Mendes de
Conservao da Biodiversidade (ICMBio), no contexto da Cooperao Brasil-Alemanha, no mbito da
Iniciativa Internacional de Proteo ao Clima (IKI), do Ministrio Federal do Meio Ambiente, Proteo
da Natureza, Construo e Segurana Nuclear da Alemanha (BMUB). Prev apoio tcnico da Deutsche
Gesellschaft fr Internationale Zusammenarbeit (GIZ) GmbH.
Diretrizes para a Integrao de Dados de Biodiversidade

Eugenia punicifolia(Kunth) DC. MYRTACEAE


Jardim Botnico de Braslia (DF)
Foto: Maurcio Mercadante
Sumrio
Apresentao.......................................................................................................................................................................................................9

1. Introduo.......................................................................................................................................................................................................11
1.1 Objetivos do Livro...........................................................................................................................................................................11
1.2 GT de Integrao de Dados do Ministrio do Meio Ambiente.......................................................................13
1.3 Referncias...........................................................................................................................................................................................13

2. Infraestruturas para gesto de dados de biodiversidade.....................................................................................15


2.1 Iniciativas para gesto de dados de biodiversidade..............................................................................................15
2.1.1 GBIF..................................................................................................................................................................................................15
2.1.2 NBII..................................................................................................................................................................................................16
2.1.3 DATAONE....................................................................................................................................................................................16
2.1.4 IABIN PTN....................................................................................................................................................................................16
2.2 Sistema de Informao de Biodiversidade do MMA..............................................................................................17
2.3 Arquitetura Bsica de Interoperabilidade......................................................................................................................20
2.3.1 Provedor de Dados..............................................................................................................................................................22
2.3.2 Agregador de Dados..........................................................................................................................................................22
2.3.3 Publicador de Dados...........................................................................................................................................................23
2.3.4 Portal Web..................................................................................................................................................................................23
2.3.5 Servios WEB.............................................................................................................................................................................24
2.4 Definio de Conceitos e Nomenclaturas......................................................................................................................25
2.5 Metadados............................................................................................................................................................................................26
2.5.1 Importncia dos Metadados.........................................................................................................................................28
2.5.2 O que um padro de metadados?........................................................................................................................29
2.5.3 Estrutura de um padro de metadados................................................................................................................29
2.5.4 Vocabulrios Controlados...............................................................................................................................................31
2.5.5 Padres sugeridos pelo GT de Integrao de Dados da MMA..............................................................32
2.6 Tipos de dados...................................................................................................................................................................................32
2.6.1 Dados Taxonmicos.............................................................................................................................................................32
2.6.2 Dados de Ocorrncias........................................................................................................................................................33
2.6.3 Colees e Provedores de Dados...............................................................................................................................34
2.6.4 Dados Geoespaciais.............................................................................................................................................................35
2.6.5 Dados Bibliogrficos............................................................................................................................................................35
2.6.6 Multimdia...................................................................................................................................................................................36
2.7 Referncias............................................................................................................................................................................................36
3. Padres de Dados e Metadados...................................................................................................................................................41
3.1 Darwin Core.........................................................................................................................................................................................41
3.1.1 Apresentao...........................................................................................................................................................................41
3.1.2 Verses do Darwin Core....................................................................................................................................................41
3.1.3 Objetivos......................................................................................................................................................................................42
3.1.4 Detalhamento da Estrutura............................................................................................................................................43
3.1.5 Definio dos termos..........................................................................................................................................................44
3.1.6 Exemplo de registro Darwin Core..............................................................................................................................45
3.1.7 Simple Darwin Core.............................................................................................................................................................46
3.1.8 Darwin Core Archive (DwC-A).......................................................................................................................................47
3.1.9 Referncias.................................................................................................................................................................................50
3.2 Dublin Core...........................................................................................................................................................................................51
3.2.1 Apresentao............................................................................................................................................................................51
3.2.2 Objetivos......................................................................................................................................................................................52
3.2.3 Detalhamento da Estrutura............................................................................................................................................52
3.2.4 Definio dos termos..........................................................................................................................................................53
3.2.5 Exemplo de registro Dublin Core...............................................................................................................................54
3.2.6 Referncias.................................................................................................................................................................................55
3.3 EML.............................................................................................................................................................................................................56
3.3.1 Apresentao...........................................................................................................................................................................56
3.3.2 Objetivos......................................................................................................................................................................................57
3.3.3 Detalhamento da Estrutura............................................................................................................................................58
3.3.4 Definio dos elementos.................................................................................................................................................60
3.3.5 Exemplo de registro EML..................................................................................................................................................63
3.3.6 Referncias.................................................................................................................................................................................63
3.4 Audubon Core....................................................................................................................................................................................65
3.4.1 Apresentao............................................................................................................................................................................65
3.4.2 Objetivos......................................................................................................................................................................................65
3.4.3 Detalhamento da Estrutura............................................................................................................................................66
3.4.4 Definio dos termos..........................................................................................................................................................67
3.4.5 Exemplo de registro Audubon Core.........................................................................................................................68
3.4.6 Referncias..................................................................................................................................................................................68
3.5 Plinian Core...........................................................................................................................................................................................68
3.5.1 Apresentao............................................................................................................................................................................68
3.5.2 Objetivos......................................................................................................................................................................................69
3.5.3 Detalhamento da Estrutura............................................................................................................................................69
3.5.4 Definio dos Termos..........................................................................................................................................................70
3.5.5 Exemplo de registro Plinian Core...............................................................................................................................71
3.5.6 Referncias.................................................................................................................................................................................72
3.6 Padres OGC........................................................................................................................................................................................72
3.6.1 Apresentao............................................................................................................................................................................72
3.6.2 Objetivos......................................................................................................................................................................................74
3.6.3 Detalhamento da Estrutura............................................................................................................................................74
3.6.4 Referncias.................................................................................................................................................................................75

4. Ferramentas e Protocolos para Manipulao de Dados de Biodiversidade...........................................77


4.1 TAPIR..........................................................................................................................................................................................................77
4.1.1 Apresentao............................................................................................................................................................................77
4.1.2 Funcionamento.......................................................................................................................................................................78
4.1.3 TAPIR Wrappers.......................................................................................................................................................................81
4.1.4 TapirLink.......................................................................................................................................................................................82
4.1.5 Referncias.................................................................................................................................................................................82
4.2 IPT................................................................................................................................................................................................................83
4.2.1 Apresentao..........................................................................................................................................................................83
4.2.2 Funcionamento.....................................................................................................................................................................83
4.2.3 Referncias................................................................................................................................................................................84
4.3 HIT...............................................................................................................................................................................................................85
4.3.1 Apresentao..........................................................................................................................................................................85
4.3.2 Funcionamento.....................................................................................................................................................................85
4.3.3 Referncias................................................................................................................................................................................87

5. Ferramentas de apoio...........................................................................................................................................................................89
Fmea de Sa-azul alimentando-se de frutos da Magnlia-amarela (Michelia champaca).
Foto: Maurcio Mercadante
Apresentao
A necessidade de integrar dados e gerar informaes de qualidade para rpida tomada
de deciso fundamental para a implementao de estratgias efetivas de conservao da
biodiversidade. Diversos temas relacionados a biodiversidade, como por exemplo, definio
de reas prioritrias para conservao ou elaborao de planos de ao para as espcies amea-
adas ou gesto de sistemas de reas protegidas, necessitam de um grande esforo prvio de
compilao de dados e qualificao da informao.
Infelizmente, nem sempre possvel acessar de forma simples e direta os dados e as in-
formaes necessrias que do suporte a esses processos. Embora existam uma quantidade
grande de dados e informaes sobre a biodiversidade brasileira, em sua maioria, encontram-
-se espalhadas em diversas instituies e armazenadas em estruturas no padronizadas e em
sistemas de informao independentes. Em muitos casos, h redundncia de sistemas, falta de
qualificao de dados e tambm de esforos para levantamento e anlises de dados primrios.
No caso especfico de instituies governamentais, as informaes precisam ser compar-
tilhadas de forma transparente, seja internamente entre os componentes de sua estrutura, seja
externamente com a sociedade. Esse fluxo de informao propicia maior integrao entre os
processos de gesto, melhoria na tomada de deciso nas estruturas de governana, bem como
aumento da qualidade e confiabilidade dos resultados e impactos esperados.
A proposta deste livro apresentar diretrizes tcnicas para armazenamento, compartilha-
mento e publicao de dados e informaes de biodiversidade. evidente que as tecnologias
e ferramentas computacionais so bastantes dinmicas e se atualizam com grande velocidade.
Porm, o conhecimento bsico e conceitual sobre infraestrutura de dados, padres de proto-
colos e metadados, e ferramentas computacionais aplicadas gesto de dados, fundamental
para que gestores pensem em melhores prticas e polticas para o armazenamento, comparti-

Diretrizes para a Integrao de Dados de Biodiversidade


lhamento e gesto de informaes, seja no mbito de suas organizaes, seja no ambiente de
redes inteorganizacionais.
A publicao tambm resultado de um longo e profundo processo de discusso com
gestores e especialistas do tema, realizados pelo Grupo de Trabalho de Integrao de Dados do
Ministrio do Meio Ambiente ao longo dos anos de 2011 at 2013. Todas as recomendaes e
diretrizes foram referendadas por esse grupo e, certamente, sero de grande valia para todos
que trabalham com o uso de dados e informaes para as polticas de biodiversidade.
Este livro um passo importante na direo da integrao das bases de dados sobre a
biodiversidade brasileira, seja no mbito do MMA e suas vinculadas, seja entre instituies
pblicas ou privadas.
Carlos Alberto de Mattos Scaramuzza
Dr. em Ecologia
Diretor do Departamento de Conservao da Biodiversidade
Secretaria de Biodiversidade e Florestas (SBF)
Ministrio do Meio Ambiente (MMA) 9
Diretrizes para a Integrao de Dados de Biodiversidade

Dalechampi linearis Baill. EUPHORBIACEAE


Parque Nacional da Chapada dos Veadeiros (GO)
Foto: Maurcio Mercadante
10
1. Introduo
1.1 Objetivos do Livro
O objetivo desta publicao apresentar um guia com os padres e protocolos
sugeridos pelo Grupo Tcnico de Integrao de Dados de Biodiversidade do Ministrio
do Meio Ambiente (GT-MMA) para a implementao de uma arquitetura para a
interoperabilidade de dados de biodiversidade. Este guia foi criado a partir da compilao
de informaes de diversas fontes tcnicas, como livros, manuais e sites de organizaes
tecnicamente relevantes na rea da biodiversidade. Entre estas organizaes destacam-
se o Global Biodiversity Information Facility (GBIF)1, o Data Observation Network for Earth
(DATAONE)2, o Biodiversity Information Standards (TDWG)3 e o Atlas of Living Australia (ALA)4.

As informaes foram estruturadas sob a forma de um guia tcnico da rea de inte-


roperabilidade de sistemas de biodiversidade, incluindo um catlogo de referncias para as
principais fontes de dados tcnicos relacionados aos assuntos abordados.

Este guia pretende atender a diferentes necessidades, conforme o perfil do leitor:

1. Um gestor de dados de biodiversidade poder ler o guia para conhecer


o contexto tecnolgico que envolve a interoperabilidade de dados de
biodiversidade, considerando os conceitos, padres e tecnologias
relevantes na rea;

Diretrizes para a Integrao de Dados de Biodiversidade


2. Um analista ou desenvolvedor de sistemas, poder ler o documento e
estender seus estudos s referncias e links apresentados durante o texto
e no final de cada captulo, obtendo o conhecimento necessrio para a
implantao de um ou mais componentes que compem a arquitetura
apresentada; e
3. Um pesquisador ou estudante poder compreender os principais
conceitos, padres e tecnologias empregadas na rea de informtica para
biodiversidade na atualidade, alm de obter informaes sobre instituies,
projetos e iniciativas existentes. Estas informaes definem uma viso geral da
rea, que poder apoiar o pesquisador na execuo de projetos de pesquisa
relacionados ao tema de integrao e gesto de dados de biodiversidade.

1
Portal do GBIF http://www.gbif.org
2
Portal do DataONE https://dataone.org
3
Portal do TDWG http://www.tdwg.org 11
4
Portal do Atlas of Living Australia http://www.ala.org.au
Este documento est estruturado nos seguintes grandes temas:

Conceitos e iniciativas internacionais de infraestrutura para gesto de dados


de biodiversidade;

Apresentao de uma arquitetura padro para interoperabilidade de dados


de biodiversidade e os componentes que a compem;

Conceitos de metadados e definio dos tipos de dados geridos pela arquitetura


apresentada;

Descrio dos padres utilizados para a interoperabilidade de dados e


metadados de biodiversidade;

Descrio dos protocolos e ferramentas que apoiam o processo de


compartilhamento e publicao dos dados de biodiversidade.
Diretrizes para a Integrao de Dados de Biodiversidade

12
1.2 GT de Integrao de Dados do Ministrio do Meio Ambiente
Esta publicao uma iniciativa do Grupo Tcnico de Integrao de Dados de Biodiversidade
do Ministrio do Meio Ambiente (GT-MMA) e faz parte de um projeto mais amplo que busca a defini-
o de uma arquitetura computacional brasileira para a integrao dos diversos provedores e consu-
midores de dados de biodiversidade do Pas, sejam eles de instituies ligadas ao Ministrio do Meio
Ambiente, instituies no-governamentais, universidades e/ou instituies privadas.

No prximo captulo so apresentadas algumas das principais iniciativas mundiais na gesto


de dados de biodiversidade.

1.3 Referncias
ALA (Atlas of Living Australia). Disponvel em: <http://www.ala.org.au/>. Acesso em: 30 jun. 2013.

DATAONE (Data Observation Network for Earth). Disponvel em: <https://www.dataone.org/>. Acesso
em: 30 jun. 2013.

GBIF (Global Biodiversity Information Facility). Disponvel em: <http://www.gbif.org/>. Acesso em: 30
jun. 2013.

TDWG (Biodiversity Information Standards). Disponvel em: <http://www.tdwg.org/>. Acesso em: 30


jun. 2013.

Diretrizes para a Integrao de Dados de Biodiversidade

13
Diretrizes para a Integrao de Dados de Biodiversidade

Peltaea polymorpha(A.St.-Hil.) Krapov. & Cristbal MALVACEAE


Jardim Botnico de Braslia (DF)
14 Foto: Maurcio Mercadante
2. Infraestruturas para gesto de dados de
biodiversidade
Uma infraestrutura para gesto de dados de biodiversidade, tambm chamada de
rede (network), um conjunto de instituies, sistemas e servios, que so interligados de
forma estruturada para possibilitar a interoperabilidade e o acesso unificado a diversos re-
cursos computacionais distribudos como ns em uma rede. Estas redes tambm se apoiam
em normas, padres e protocolos que possibilitam a interoperabilidade dos diversos am-
bientes, sistemas e seus dados heterogneos.

2.1 Iniciativas para gesto de dados de biodiversidade


Neste livro so consideradas algumas das principais iniciativas para gesto de dados
de biodiversidade:
GBIF - Global Biodiversity Information Facility;
NBII - National Biological Information Infraestructure5;
DATAONE - Data Observation Network for Earth;
IABIN PTN Inter American Biodiversity Information Network Pollinators Thematic
Network6.

2.1.1 GBIF

Diretrizes para a Integrao de Dados de Biodiversidade


O GBIF foi estabelecido como uma iniciativa cientfica global com o objetivo de pro-
mover a utilizao eficiente do conhecimento sobre a diversidade biolgica do planeta
Terra, um dos grandes desafios do sculo XXI. O GBIF apresenta como sua viso um mun-
do onde a informao sobre biodiversidade gratuita e universalmente disponvel para a
cincia, para a sociedade e para um futuro sustentvel. A misso do GBIF se tornar a mais
importante fonte global de informaes sobre biodiversidade e ser um gerador de solues
inteligentes para o meio ambiente e o bem estar. Para alcanar estes objetivos o GBIF enco-
raja uma grande variedade de fontes/publicadores de dados de todo o mundo a descobrir,
organizar, digitalizar e publicar seus dados por meio de sua rede de biodiversidade.

5
Portal do NBII Arquive Team http://www.archiveteam.org/index.php?title=NBII
6
Portal de dados da IABIN PTN http://www.biocomp.org.br/dataportal/
15
2.1.2 NBII

O NBII foi um programa coordenado pelo setor de Biological Informatics da United States
Geological Survey (USGS)7. Seu objetivo principal foi facilitar o acesso aos dados e informaes dos
provedores de dados biolgicos dos Estados Unidos, englobando agncias do governo, instituies
acadmicas, organizaes no-governamentais e organizaes privadas.

O NBII coordenou uma pesquisa na comunidade cientfica americana sobre sistemas de in-
formao que armazenavam dados biolgicos relevantes e que pudessem ser integrados e dispo-
nibilizados. Em seguida foram desenvolvidas uma organizao metodolgica e uma infraestrutura
computacional, baseadas em padres abertos, para a integrao e gesto destes dados.

Para o usurio final (pesquisadores, instituies e o pblico em geral), toda a infraestrutura


de integrao era transparente, pois o acesso aos dados dos diversos provedores era feito de forma
integrada, por meio de um Portal WEB.

O NBII foi finalizado no dia 15 de janeiro de 2012, mas deixou um legado de boas prticas e
estratgias para organizao, agregao e distribuio de dados biolgicos.

2.1.3 DATAONE

O DATAONE um programa patrocinado pela National Science Foundation (NSF)8


dentro do programa DataNet9. Seu objetivo principal o armazenamento de dados ecolgicos e
ambientais produzidos por cientistas do mundo inteiro. A meta do DATAONE preservar e dar aces-
so a dados multiescalas, multidisciplinares e multinacionais.
Diretrizes para a Integrao de Dados de Biodiversidade

O DATAONE interliga uma infraestrutura computacional existente para disponibilizar um mo-


delo distribudo, que utiliza tecnologias robustas para gesto dos dados, com foco na preservao
de dados de biodiversidade a longo prazo.

2.1.4 IABIN PTN

O IABIN PTN uma rede temtica de polinizadores que compe uma das seis redes temticas
estabelecidas no mbito da Inter-American Biodiversity Information Network (IABIN)10. Seu obje-
tivo principal desenvolver um banco de dados interligado e integrado entre as principais fontes de

7
Portal do USGS http://www.usgs.gov
8
Portal do National Science Foundation http://www.nsf.gov
16 9
Wikipdia Datanet http://en.wikipedia.org/wiki/Datanet
10
Portal da IABIN http://www.iabin.net/
dados de polinizadores e membros IABIN que compartilham contedo crtico relacionado a polini-
zadores por meio de um conjunto comum de padres e protocolos de compartilhamento de dados.

O IABIN PTN disponibiliza um catlogo online dinmico e interligado de polinizadores do he-


misfrio ocidental, que inclui dados sobre (1) nomes (checklists) de abelhas, beija-flores, morcegos
e outras espcies polinizadores de grande importncia; (2) exemplares nas principais colees; (3)
contato dos polinizadores e especialistas; (4) associaes polinizadores-plantas; (5) literatura sobre
polinizadores e (6) demais informaes relacionadas (como, por exemplo, dados geogrficos, cdi-
gos de barras genticos etc.).

2.2 Sistema de Informao de Biodiversidade do MMA


O Sistema de Informao para Integrao de Dados de Biodiversidade do Ministrio do Meio
Ambiente responsvel por integrar, compartilhar, publicar e sintetizar dados de biodiversidade
gerados e manipulados no mbito do MMA e em suas instituies vinculadas (Instituto Brasileiro
do Meio Ambiente e dos Recursos Naturais Renovveis (Ibama)11, Instituto Chico Mendes de
Conservao de Biodiversidade (ICMBio)12, Jardim Botnico do Rio de Janeiro (JBRJ)13, Agncia
Nacional de guas (ANA)14 e o Servio Florestal Brasileiro (SFB)15, de acordo com a Figura 1.

Diretrizes para a Integrao de Dados de Biodiversidade

Figura 1 Viso Geral do Sistema de Informao para Integrao de Dados do MMA (Corra, 2013).
11
Portal do Ibama http://www.ibama.gov.br
12
Portal do ICMBio http://www.icmbio.gov.br
13
Portal do JBRJ http://www.jbrj.gov.br
14
Portal da ANA http://www.ana.gov.br 17
15
Portal do SFB http://www.florestal.gov.br
O Sistema de Informao de Biodiversidade do MMA disponibiliza uma infraestrutura de infor-
mao integrando fornecedores e consumidores de informao biolgica, articulada com sistemas
de informao relacionados a iniciativas complementares como o Global Biodiversity Information
Facility (GBIF), o Sistema Brasileiro de Biodiversidade (SIBBr)16, a Infraestrutura Nacional de
Dados Espaciais (INDE)17, o Specieslink18 e a Scielo19.

A Figura 2 apresenta a viso da arquitetura de referncia e de suas camadas funcionais pro-
posta para o Sistema de Informao de Biodiversidade do MMA.
Diretrizes para a Integrao de Dados de Biodiversidade

Figura 2 - Camadas funcionais da arquitetura de referncia proposta para o Portal de Biodiversidade do MMA
(Silva e Corra, 2013).
16
Portal do SIBBr http://www.sibbr.gov.br
17
Portal da INDE http://www.inde.gov.br
18 18
Portal de dados do SpeciesLink http://splink.cria.org.br
19
Portal do SciELO http://www.scielo.org
Os Consumidores de Informao Biolgica so aqueles que gerenciam, estudam e
utilizam dados biolgicos, recursos e ferramentas computacionais. Os consumidores podem ser
dos setores pblico e privado: cientistas, formuladores de polticas pblicas, analistas ambientais
do MMA e outros rgos federais e estaduais, governos locais, da indstria, professores, estudan-
tes e cidados.

Os requisitos dos consumidores de informao biolgica so variados e os principais so des-


critos abaixo:

Cientistas e Pesquisadores precisam ter acesso a dados de alta qualidade e em


quantidade para planejar e direcionar suas pesquisas;

Os gestores de rgos Pblicos e Instituies Vinculadas ao MMA precisam ter


acesso fcil aos dados biolgicos disponveis, tanto para o planejamento e priorizao
de polticas pblicas voltadas conservao da biodiversidade, como tambm para o
monitoramento das aes realizadas;

Para o gerenciamento de reas protegidas, tais como Unidades de Conservao;

O Setor Privado precisa de informaes para que a produo de bens e servios


possa ter impactos reduzidos na biodiversidade. Alm disso, a informao sobre a
biodiversidade essencial no processo de licenciamento ambiental;

Educadores, em todos os nveis, precisam de informaes atualizadas, alm de recursos


disponveis para preparao de material didtico adequado para o processo o ensino-
aprendizagem de seus alunos;

Diretrizes para a Integrao de Dados de Biodiversidade


O Pblico em Geral precisa de informao qualificada e contextualizada sobre
tendncias regionais, locais e globais, abordando os principais impactos gerados pela
sociedade e suas consequncias para a biodiversidade e para o prprio ser humano;

A Sociedade Civil Organizada (ONGs, Fundaes etc.) que utiliza a informao para
acompanhar, sugerir e fiscalizar a tomada de deciso e formulao de politicas pblicas.

19
A Camada de Consumo dos Dados representada pelas ferramentas computacionais que
consomem os dados disponibilizados pelos servios da Camada de Compartilhamento. Os portais
de dados e as ferramentas de anlise, so alguns das aplicaes existentes nesta camada.

A Camada Funcional de Compartilhamento (dos Dados) responsvel por disponibilizar


servios computacionais para acesso aos dados de biodiversidade. Essa camada organizada em
mdulos, conforme o domnio dos dados: dados de espcimes, dados de espcies, dados geoespa-
ciais, referncias bibliogrficas, etc.

A Camada de Armazenamento responsvel pelo armazenamento e gesto dos dados con-
solidados, que foram previamente integrados e processados por meio da camada de Processamento
em Batch.

A Camada de Processamento em Batch responsvel pelo Harvesting (Coleta) e Indexao


dos dados replicados das bases de dados dos sistemas de informao de biodiversidade das institui-
es vinculadas e de rgos do MMA (Ns de Informao do MMA).

2.3 Arquitetura Bsica de Interoperabilidade


As iniciativas para gesto de dados apresentadas anteriormente possuem arquiteturas com-
putacionais distintas, mas que consideram componentes em comum, existentes nas principais ar-
quiteturas para interoperabilidade de dados de biodiversidade.

Na Figura 3 apresentada uma arquitetura padro para a interoperabilidade de dados de


Diretrizes para a Integrao de Dados de Biodiversidade

biodiversidade. Em seguida, sero descritos os componentes desta arquitetura e detalhadas suas


funes. importante considerar que estes componentes podem ser implementados de diferentes
formas dentro de uma infraestrutura computacional, podendo ser agrupados em um mesmo servi-
dor/aplicao ou distribudos em diversos servidores dentro de uma arquitetura distribuda.

20
Diretrizes para a Integrao de Dados de Biodiversidade
Figura 3 Arquitetura para interoperabilidade de dados de biodiversidade (Silva, 2013).

21
2.3.1 Provedor de Dados

Os provedores de dados so os responsveis por coletar, armazenar e disponibilizar, por


meio de interfaces padronizadas, dados de biodiversidade e os metadados que descrevem estes
dados, garantindo a pesquisa e o acesso aos mesmos.

Estes provedores utilizam formatos comuns para a troca de dados, com estruturas padroni-
zadas que claramente definem como a informao ser compartilhada, facilitando assim, o trabalho
realizado pelos agregadores de dados no agrupamento e indexao das informaes de diversos
provedores.

A padronizao no compartilhamento dos dados permite que diversas instituies


disponibilizem seus dados de forma organizada e eficiente, independente da tecnologia e da
estrutura dos dados existentes nos sistemas e nas suas bases de dados locais.

Como alternativa para a implementao dessas interfaces de compartilhamento, existem


ferramentas computacionais criadas exclusivamente para essa finalidade. Essas ferramentas ma-
peiam os dados de um provedor, com base em padres de metadados, e disponibilizam os dados
para outros sistemas por meio de servios Web ou arquivos com estruturas padronizadas. So exem-
plos destas ferramentas o TAPIRLink20, baseado no protocolo TAPIR, e o Integrated Publishing Toolkit
(IPT), que sero detalhados no Captulo 4.

2.3.2 Agregador de Dados


Diretrizes para a Integrao de Dados de Biodiversidade

Os agregadores de dados so os responsveis por gerenciar o processo de harvesting (co-


leta) dos dados e metadados provenientes dos provedores de dados. Aps a coleta dos dados
dos diversos provedores, o agregador realiza a organizao e indexao destes dados em uma base
de dados comum. O mesmo ocorre com os metadados, que sero utilizados principalmente para o
processo de descoberta e descrio dos dados.

Os metadados no so obrigatoriamente associados a dados digitalizados e/ou dispo-


nveis para consulta on-line. Os metadados podem simplesmente identificar a existncia de
um objeto em um provedor de dados e descrever seus detalhes, possibilitando que o pesqui-
sador interessado realize uma consulta in loco na instituio.

20
TDWG Wiki TapirLink http://wiki.tdwg.org/twiki/bin/view/TAPIR/TapirLink
22
2.3.3 Publicador de Dados

Os publicadores de dados so os responsveis por publicar os dados de uma forma inte-


grada e padronizada. A publicao realizada em geral seguindo duas estratgias. A primeira a
utilizao de um Portal Web21, onde os usurios realizam pesquisas nos dados e metadados, com o
objetivo de localizar as informaes de interesse. Esses portais tambm disponibilizam ferramentas
para a apresentao, anlise e download dos dados pesquisados.

A segunda estratgia a disponibilizao de servios Web22 para a consulta e recuperao


automatizada de informaes. Em geral, os mesmos dados disponibilizados pelo Portal Web podem
ser acessados via servios Web, possibilitando que outros sistemas computacionais utilizem esses
servios para o consumo dos dados.

Ferramentas de anlise tambm utilizam os servios para a aquisio de dados para experi-
mentos. Um exemplo de ferramenta o Open Modeller23, utilizado na modelagem computacional
de nichos ecolgicos. A verso 1.1.0 da ferramenta possui plug-ins para acesso aos servios Web
disponibilizados pelo Portal de dados do GBIF e do SpeciesLink24.

O SpeciesLink um sistema distribudo de informao que integra dados primrios de co-


lees cientficas. O sistema foi desenvolvido a partir da parceria de diversas instituies nacionais.

2.3.4 Portal Web

Os Portais Web de Biodiversidade so sistemas baseados na Internet que possuem como


principal objetivo permitir o acesso a uma ou mais bases de dados de biodiversidade. Sua principal

Diretrizes para a Integrao de Dados de Biodiversidade


aplicao a disponibilizao de dados de ocorrncias a partir de colees de espcimes e observa-
es. Existem tambm Portais Web de biodiversidade que disponibilizam informaes taxonmicas,
como lista de nomes (checklists), e aplicaes de mapas, que utilizam dados geogrficos de ocorrn-
cias juntamente com informaes ambientais para a anlise dessas informaes.

Alguns exemplos de Portais Web de biodiversidade, e seus respectivos endereos para acesso,
so citados a seguir:
GBIF Data Portal: http://www.gbif.org
IABIN PTN: http://www.biocomp.org.br/dataportal
Integrated Taxonomic Information Systems (ITIS)25: http://www.itis.gov
21
Wikipdia Portal Web http://pt.wikipedia.org/wiki/Portal_(internet)
22
Wikipdia Servios WEB http://pt.wikipedia.org/wiki/Web_service
23
Portal do Open Modeller http://openmodeller.sourceforge.net
24
Portal do SpeciesLink http://splink.cria.org.br 23
Atlas of Living Australia (ALA): http://www.ala.org.au
Sistema de Informacin sobre Biodiversidad de Colombia (SiB Colombia)26:
http://www.sibcolombia.net/web/sib
Comisin Nacional para el Conocimiento y Uso de la Biodiversidad (CONABIO)27:
http://www.conabio.gob.mx/informacion/gis
SpeciesLink Portal: http://www.splink.org.br/index?lang=pt
Lista da Flora Brasileira: http://floradobrasil.jbrj.gov.br
Portal de Servios de Geoprocessamento do ICMBio:
http://www.icmbio.gov.br/portal/servicos/geoprocessamento.html
Sistema de Informao sobre a Biodiversidade Brasileira (SiBBr): http://www.sibbr.gov.br/

2.3.5 Servios WEB

Os servios WEB so oferecidos para possibilitar o consumo dos dados de biodiversidade de


forma automatizada por outros sistemas. Conforme os objetivos do publicador de dados, os servi-
os podem oferecer recursos tanto para a validao de dados taxonmicos, quanto para a consulta
de ocorrncias e dados geogrficos. Alguns sistemas tambm disponibilizam servios com foco em
qualidade e anlise de dados.

Para possibilitar uma maior abrangncia e facilidade na utilizao destes servios, reco-
mendada a utilizao de padres e boas prticas na sua implementao. Tambm recomendada
a publicao na WEB de um manual para descrever e apoiar o processo de utilizao dos servios
disponibilizados.
Diretrizes para a Integrao de Dados de Biodiversidade

Alguns exemplos de sistemas de biodiversidade que disponibilizam servios para a consulta


de dados so citados a seguir, juntamente com os endereos de acesso aos seus manuais:
GBIF: http://data.gbif.org/ws/rest/network
Integrated Taxonomic Information Systems (ITIS):
http://www.itis.gov/ws_description.html
Atlas of Living Australia (ALA):
http://www.ala.org.au/about-the-atlas/downloadable-tools/web-services

25
Portal do ITIS http://www.itis.gov
26
Portal do SiB Colombia http://www.sibcolombia.net/web/sib
24 27
Portal do CONABIO http://www.conabio.gob.mx
2.4 Definio de Conceitos e Nomenclaturas
Considerando o escopo de uma arquitetura para interoperabilidade de dados de biodiversida-
de, importante a definio dos seguintes conceitos e nomenclaturas (Figura 4):

Figura 4 - Representao das colees e seus metadados em um provedor de dados de biodiversidade.

Os dados de biodiversidade publicados por meio de uma rede de interoperabilidade so


organizados em Colees (Datasets) provenientes de Provedores de Dados (Data Providers
ou Data Sources).
Uma Coleo um conjunto de Registros de Dados sobre um determinado assunto.
As Colees so descritas a partir de Metadados, que disponibilizam informaes sobre a
origem, as caractersticas e o propsito destes dados.

Diretrizes para a Integrao de Dados de Biodiversidade


Um registro de dados um conjunto de termos, tambm chamados de elementos,
propriedades ou atributos. Um registro de dados pode descrever, por exemplo, uma
observao de um espcime. Um dos termos mais comuns em um registro de dados o
nome cientfico (scientific Name).
Um termo contm o valor da informao. Um exemplo de valor do termo nome cientfico
poderia ser Panthera onca.
Dados primrios (do ingls primary data ou primary biodiversity data) so considerados
os registros de dados textuais ou multimdia que detalham fatos sobre uma instncia
(ocorrncia) de um organismo (o que, onde, quando, como e por quem).

25
Dados secundrios so dados sintetizados ou interpretativos, gerados normalmente
com base em grande quantidade de dados primrios. Estes dados so apresentados
normalmente em formas de mapas, registros e publicaes.

2.5 Metadados

Metadados so dados que descrevem dados e so considerados essenciais em um


sistema de gerenciamento e compartilhamento de informaes, descrevendo vrios aspectos
das colees e seus dados:

Quem criou estes dados?

Qual o contedo dos dados?

Quando os dados foram gerados?

Onde os dados foram gerados?

Como os dados foram gerados?

Porque os dados foram gerados?

O registro dos metadados preservam a utilidade dos dados ao longo do tempo, detalhando os
mtodos de coleta dos dados e a criao de bancos de dados. Os metadados minimizam a duplica-
o de esforos na coleta dos dados e facilita o compartilhamento de dados digitais e o rastreamento
da informao.
Diretrizes para a Integrao de Dados de Biodiversidade

No contexto dos sistemas de interoperabilidade de dados de biodiversidade, vrias questes


podem ser respondidas durante o compartilhamento de dados por meio dos seus metadados:
Quais processos foram utilizados na criao dos dados?
Quando foi a ltima atualizao dos dados?
Qual a escala foi utilizada para a gerao de um Mapa?
Quem pode ser contatado para a obteno de mais informaes sobre o dado publicado?
Quais so as limitaes dos dados?

A digitalizao dos metadados fundamental no processo de preparao dos dados para a


sua publicao em uma rede de biodiversidade, conforme demonstrado na Figura 5.

26
Diretrizes para a Integrao de Dados de Biodiversidade
Figura 5 - Publicao de dados, com seus respectivos metadados, em uma rede de interoperabilidade de
dados de biodiversidade.

27
2.5.1 Importncia dos Metadados

Os metadados possuem mltiplas finalidades e so importantes para os geradores dos da-


dos, para os consumidores dos dados e tambm para as organizaes envolvidas.

Para os geradores dos dados os registros de metadados ajudam a evitar a duplicao de


esforos, pois os pesquisadores podem determinar se dados semelhantes j existem antes da reali-
zao de um projeto de coleta de dados. Os pesquisadores podem compartilhar informaes confi-
veis, identificando a origem, a qualidade dos dados e seu mtodo de coleta. Alm disso, os metada-
dos garantem a divulgao dos geradores das informaes, agregando valor ao trabalho realizado e
reconhecimento aos profissionais responsveis pelos dados.

Para os consumidores dos dados estes metadados permitem a pesquisa e recuperao das
informaes provenientes dos provedores. As buscas realizadas nos metadados possibilitam resul-
tados mais ricos e detalhados, por meio da utilizao de restries temporais, geogrficas e organi-
zacionais durante as buscas. Permitem tambm que os consumidores possam decidir pela utilizao
ou no destes dados em uma aplicao especfica por meio de critrios como qualidade, metodolo-
gia de coleta e responsveis.

Para as organizaes envolvidas, a manuteno destes metadados contribui para a garantia


dos seus investimentos na gesto dos dados, por meio da reteno de informaes relevantes sobre
como os dados foram coletados, processados e qualificados, criando um registro permanente da
histria destes dados. Com isso, as informaes deixam de depender de pessoas e passam a gerar
conhecimento na organizao, garantindo sua reutilizao em projetos futuros, por novos pesquisa-
dores e parceiros de projetos.
Diretrizes para a Integrao de Dados de Biodiversidade

Os metadados tambm podem descrever dados em diferentes nveis de um recurso digital.


Embora geralmente as descries sejam realizadas de forma individual (uma foto, um arquivo de
vdeo, um registro de observao de espcie), tambm podem ser realizadas a partir da agregao
de recursos (datasets de registros de ocorrncia, listas de verificao de espcies).

Alm da utilizao em diferentes nveis, os metadados podem descrever recursos em diferen-


tes camadas (fases). Por exemplo, na Tabela 1, a pintura original da Mona Lisa descrita com me-
tadados, em seguida so descritas a reproduo da obra de arte em um slide e a sua representao
digital (arquivo digital).

28
O desafio na criao dos metadados decidir quais nveis e camadas precisam ser descritos, a
quantidade de detalhes em cada uma delas e como os metadados sero organizados.

Tabela 1 - Diferentes camadas de informaes identificadas pelos Metadados.


010010100101
010010100101
001010101010
100001001010
101010101001
010100101010
011001010101
Imagem Original Imagem em Slides Imagem Digital
Criador John Brown
Leonardo da Vinci Jane Smith [Fotgrafo]
[Tcnico de Digitalizao]
Formato Transparncia
Pintura Imagem .JPEG
fotogrfica

Localizao Museu de Louvre Coleo de Slide ABC A:\images\0023.jpg


... ... ... ...
Fonte: JISC Digital Media28.

2.5.2 O que um padro de metadados?

Um padro de metadados prev elementos comuns que so utilizados de forma


universal, permitindo que o compartilhamento destas informaes se torne mais prtico e
seguro. As normas estabelecidas tambm garantem a definio de regras consistentes e

Diretrizes para a Integrao de Dados de Biodiversidade


vocabulrios padronizados, que possibilitam uma comunicao eficiente entre os gerado-
res e consumidores de dados. A estrutura padronizada permite tambm a pesquisa unificada
nestes dados.

2.5.3 Estrutura de um padro de metadados

Um esquema de metadados ou estrutura de metadados formado por um conjunto de


elementos projetados para uma finalidade especfica, como a descrio de um tipo particular de
informao. A definio ou significado dos elementos chamada de semntica do esquema. J os
valores inseridos em cada elemento so chamados de contedo.
28
JISC Digital Media http://www.jiscdigitalmedia.ac.uk/guide/an-introduction-to-metadata
29
Os esquemas de metadados normalmente definem os nomes dos elementos e sua semntica.
Opcionalmente so definidas regras de como o contedo deve ser identificado, descrito e os respec-
tivos valores permitidos para o contedo.

Tambm podem ser definidas no esquema as regras de sintaxe de como os elementos e seu
contedo podem ser codificados. Um esquema de metadados sem regras de sintaxe chama-
do de independente. Os metadados podem ser codificados em qualquer sintaxe definida, como
SGML29(Standard Generalized Markup Language), XML30(Extensible Markup Language), entre outras.

A Figura 6 apresenta uma representao dos componentes de um esquema do padro Dar-


win Core, descrito com mais detalhes no Captulo 3.1. O esquema de metadados Darwin Core
possui vrios grupos que organizam os elementos dentro do esquema. O grupo Record-level Terms
possui o elemento dwc:basisOfRecord. Por sua vez, este elemento associado a um vocabulrio
controlado que define quais informaes so permitidas no seu contedo.

Um esquema de metadados projetado para o compartilhamento de informaes


de biodiversidade e no para a gesto destes dados. Por isso, os bancos de dados dos sis-
temas computacionais de biodiversidade e as planilhas para registro destes dados devem
possuir, primeiramente, uma estrutura baseada nas necessidades dos projetos e da institui-
o, e no simplesmente uma cpia de um esquema de metadados. Com o conhecimento
dos padres de metadados existentes, obtida uma viso mais ampla e padronizada de
importantes elementos a serem considerados durante a definio de um modelo de dados de
biodiversidade e como os mesmos podem ser compartilhados mais tarde.
Diretrizes para a Integrao de Dados de Biodiversidade

Figura 6 - Representao estrutural de um elemento do Darwin Core e seu vocabulrio controlado.


29
Wikipdia SGML http://pt.wikipedia.org/wiki/SGML
30
Wikipdia XML http://pt.wikipedia.org/wiki/XML
30
2.5.4 Vocabulrios Controlados

Os vocabulrios controlados so uma maneira de organizar o conhecimento para posterior


recuperao. Eles so usados em esquemas de indexao de assuntos, cabealhos de registros, the-
saurus, ontologias e em outros sistemas de organizao do conhecimento. Esquemas de vocabulrio
controlado obrigam a utilizao de termos autorizados, que foram pr-selecionados pelo criador do
vocabulrio. Ao contrrio do vocabulrio de linguagem natural, onde no h restrio ao vocabul-
rio utilizado. Algumas das vantagens na utilizao destes vocabulrios so:
Consistncia;
Acurcia;
Simplificao na entrada dos dados;
Qualidade;
Interoperabilidade;
Facilidade na procura e descoberta dos dados.

Um vocabulrio controlado pode ser incorporado facilmente em processos automatizados. Em


um sistema computacional, um vocabulrio pode simplificar a entrada e contribuir para a qualidade
dos dados, fornecendo aos usurios ou outros sistemas a lista de entradas permitidas para os elemen-
tos dos metadados, alm de ser usado para a validao de dados importados de outros sistemas.

Na Tabela 2 apresentado o vocabulrio controlado do elemento basisOfRecord (http://


rs.tdwg.org/dwc/terms/basisOfRecord) do Darwin Core. Este elemento responsvel por especi-
ficar a natureza do registro de dado armazenado. Informaes adicionais sobre este vocabulrio
podem ser encontradas no documento Darwin Core Type Vocabulary31.

Diretrizes para a Integrao de Dados de Biodiversidade


Tabela 2 Termos recomendados no vocabulrio controlado do elemento BasisOfRecord do
Darwin Core.
Termo Definio
Occurrence Um recurso que descreve uma instncia da Classe Ocorrncia.
Event Uma ocorrncia no persistente, com base no tempo. Para Darwin Core,
um recurso que descreve uma instncia da Classe Evento.
Location Um recurso que descreve uma instncia da Classe Localizao.
Taxon Um recurso que descreve uma instncia da Classe Taxonomia.
PreservedSpecimen Um recurso que descreve um Espcime preservado.
FossilSpecimen Um recurso que descreve um Espcime fossilizado.
LivingSpecimen Um recurso que descreve um Espcime vivo.
HumanObservation Um recurso que descreve uma observao realizada por uma ou mais pessoas.
MachineObservation Um recurso que descreve uma observao realizada por uma mquina.
NomenclaturalChecklist Um recurso que descreve uma lista de nomes.
31
31
Darwin Core Type Vocabulary http://rs.tdwg.org/dwc/terms/type-vocabulary/index.htm
2.5.5 Padres sugeridos pelo GT de Integrao de Dados da MMA

Os padres sugeridos pelo GT-MMA e considerados neste livro so:


Darwin Core;
Dublin Core;
EML;
Audubon Core;
Plinian Core;
Padres OGC (OpenGIS).

Esses padres esto apresentados e detalhados no Captulo 3.

2.6 Tipos de dados


Os principais tipos de dados considerados em uma infraestrutura computacional para biodi-
versidade so os dados taxonmicos das espcies, ocorrncias, provedores de dados e bancos
de dados, dados geoespaciais, dados bibliogrficos e arquivos multimdia.

2.6.1 Dados Taxonmicos

So dados que se referem a informaes de um txon e no de uma instncia especfica (ocor-


rncia) de um indivduo dentro desse txon. O txon uma unidade taxonmica, essencialmente
associada a um sistema de classificao cientfica32. O txon pode estar em qualquer nvel de um
Diretrizes para a Integrao de Dados de Biodiversidade

sistema de classificao.

Um exemplo de coleo de dados taxonmicos seria um checklist de espcies de aves,


onde cada registro de dados disponibiliza a informao sobre uma nica espcie. Na Figura 7
apresentado um exemplo de txon (Oryzoborus angolensis) disponibilizado pela Encyclopedia of
Life (EOL)33:

32
Wikipdia Classificao Cientfica http://pt.wikipedia.org/wiki/Classifica%C3%A7%C3%A3o_cient%C3%ADfica
33
Portal da Encyclopedia of Life http://eol.org
32
Taxon recognized by
Avibase - IOC World Bird Names (2011):
Animalia
Chordata
Aves
Passeriformes
Thaupidae
Oryzoborus
Oryzoborus angolensis
Oryzoborus atriostris
Oryzoborus crassirostris
Oryzoborus funereus
Oryzoborus maximiliani
Oryzoborus nuttingi

Figura 7 - Dados do Txon Oryzoborus angolensis (http://eol.org/pages/1050362/overview).

Um dos padres utilizado na definio destas informaes o Darwin Core (DwC)34, que est
detalhado no Captulo 3.1 deste livro.

2.6.2 Dados de Ocorrncias

Os dados de ocorrncias so relacionados a uma instncia especfica de um txon, na na-


tureza ou em uma coleo de uma instituio. Estes dados determinam a presena ou ausncia de
espcies no espao e no tempo. Um exemplo destes dados seria uma coleo de observaes de

Diretrizes para a Integrao de Dados de Biodiversidade


aves que descrevem detalhes sobre os avistamentos de diversas espcies de aves. Outro exemplo
seria o registro de uma exsicata armazenada em um herbrio.

Um dos padres utilizado para definir estas informaes o Darwin Core (DwC).

A ocorrncia de espcies biolgicas em termos espaciais e temporais so os dados


fundamentais para os servios de anlise destes dados.

34
Portal do Darwin Core Group http://www.tdwg.org/activities/darwincore
35
Portal do Missouri Botanical Garden http://www.missouribotanicalgarden.org
33
Na Figura 8 apresentado um registro de ocorrncia disponibilizado pelo Missouri Botanical
Garden35 e publicado a partir do Data Portal do GBIF.
Diretrizes para a Integrao de Dados de Biodiversidade

Figura 8 - Registro de dados de uma ocorrncia consultada no GBIF Data Portal.

2.6.3 Colees e Provedores de Dados

As informaes das colees e provedores de dados de biodiversidade so compartilhadas a


partir dos seus metadados. Estes metadados descrevem informaes sobre as colees e provedo-
res, e como acess-las. Tambm so disponibilizadas informaes sobre os dados, como e por quem
foram coletados, seus responsveis, o seu uso indicado, entre outras informaes.

34
Existem diversos padres de metadados para a descrio de colees e provedores de da-
dos de biodiversidade. O GBIF utiliza o padro GBIF Metadata Profile (GMP)36, e sua utilizao
detalhada no guia GBIF Metadata Profile How-to-Guide37. O padro de metadados sugerido pelo
GT-MMA para a disponibilizao destes dados o Ecological Metadata Language (EML)38, que ser
detalhado posteriormente no Captulo 3.3.

2.6.4 Dados Geoespaciais

Os dados geogrficos, geoespaciais ou georeferenciados so dados em que a dimenso es-


pacial refere-se ao seu posicionamento no planeta Terra e no seu espao prximo, num determinado
instante ou perodo de tempo.

Os dados espaciais so quaisquer tipos de dados que descrevem fenmenos que este-
jam associados a alguma dimenso espacial. A medida observada de um fenmeno ou ocor-
rncia sobre ou sob a superfcie terrestre o que se denomina dado geogrfico.

Os dados geogrficos possuem caractersticas espaciais, no espaciais e temporais. As carac-


tersticas espaciais informam a posio geogrfica do fenmeno e sua geometria. As caractersticas
no espaciais descrevem o fenmeno, j as caractersticas temporais informam o tempo de validade
dos dados geogrficos e suas variaes sobre o tempo.

Os dados geogrficos esto cada vez mais presentes na rea da biodiversidade, e grande parte
das anlises realizadas nesta rea consideram estas informaes.

Os padres para a descrio, disponibilizao e consumo de dados espaciais sugerido pelo

Diretrizes para a Integrao de Dados de Biodiversidade


GT-MMA so os padres definidos pela Open Geospacial Consortium (OGC)39, que sero apresen-
tados no Captulo 3.5.

2.6.5 Dados Bibliogrficos

Em uma arquitetura de dados de biodiversidade os dados bibliogrficos contemplam as in-


formaes sobre publicaes (livros, manuais, artigos cientficos e documentos em geral), digi-
tais ou no digitais. Estas publicaes podem ser relacionados a dados taxonmicos ou ocorrncias
de espcies, possibilitando a localizao destes dados para sua utilizao em anlises cientficas e
demais estudos.
36
The GBIF Metadata Profile http://rs.gbif.org/schema/eml-gbif-profile
37
GBIF Metadata Profile http://links.gbif.org/gbif_metadata_profile_how-to_en_v1
38
EML Specification http://knb.ecoinformatics.org/software/eml 35
39
Portal da OGC http://www.opengeospatial.org/standards/is
Estes tipos de dados podem ser descritos por meio de um padro de metadados criado espe-
cificamente para a descrio de fontes de informao chamado de Dublin Core40. Este padro ser
detalhado posteriormente no Captulo 3.2.

2.6.6 Multimdia

As imagens e demais recursos multimdia (sons, desenhos, vdeos, etc.) esto frequentemente
presentes em sistemas de biodiversidade, seja no registro de observaes ou em exsicatas e amos-
tras de colees biolgicas. Para possibilitar a descoberta destes recursos e seu relacionamento com
os demais dados de biodiversidade, necessria a utilizao de metadados para descrio destes
objetos. Os padres mais utilizados para esta finalidade so o Dublin Core, o Darwin Core, a partir
de uma de suas extenses, e o Audubon Core41, que ser detalhado no Captulo 3.4. Este ltimo
um padro criado a partir de uma parceria entre o GBIF e o Biodiversity Information Standards
(TDWG)42, onde foi definido um conjunto de termos para representar recursos multimdia de biodi-
versidade.

2.7 Referncias
ANA (Agncia Nacional de guas). Disponvel em: <http://www2.ana.gov.br/Paginas/default.aspx>.
Acesso em: 30 jun. 2013.

JISC DIGITAL MEDIA. An Introduction to Metadata. Disponvel em: <http://www.jiscdigitalmedia.


ac.uk/guide/an-introduction-to-metadata/>. Acesso em: 30 jun. 2013.
Diretrizes para a Integrao de Dados de Biodiversidade

AUDUBON Core Term List. DRAFT of 1.0 normative - GBIF-Terms. Disponvel em: <http://terms.gbif.
org/wiki/Audubon_Core_Term_List_(1.0_normative)>. Acesso em: 30 jun. 2013.

WIKIPDIA (Enciclopdia livre). Classificao cientfica. Disponvel em: <http://pt.wikipedia.org/


wiki/Classifica%C3%A7%C3%A3o_cient%C3%ADfica>. Acesso em: 30 jun. 2013.

CONABIO (Comisso Nacional da Biodiversidade). Disponvel em: <http://www.conabio.gob.mx/>.


Acesso em: 30 jun. 2013.

DARWIN Core Type Vocabulary. Disponvel em: <http://rs.tdwg.org/dwc/terms/type-vocabulary/in-


dex.htm>. Acesso em: 30 jun. 2013.
40
Portal do DCMI http://dublincore.org
41
Audubon Core Term List http://terms.gbif.org/wiki/Audubon_Core_Term_List
36
42
Portal do TDWG http://www.tdwg.org
CORRA, P. L. P. Arquitetura para Integrao de Sistemas de Informao de Biodiversidade: As-
sessoria do Ministrio do Meio Ambiente na Integrao de Sistemas de Informao em Biodiversida-
de no mbito do PROBIO II. Braslia: MMA, maio. 2013.

WIKIPEDIA (Encyclopedia free). Datanet. Disponvel em: <http://en.wikipedia.org/wiki/Datanet>.


Acesso em: 30 jun. 2013.

DCMI (Dublin Core Metadata Initiative). Disponvel em: <http://dublincore.org/>. Acesso em: 30 jun. 2013.

EML (Ecological Metadata Language). Disponvel em: <http://knb.ecoinformatics.org/software/


eml/>. Acesso em: 30 jun. 2013.

EML (Ecological Metadata Language). Disponvel em: <http://knb.ecoinformatics.org/software/


eml/>. Acesso em: 30 jun. 2013.

ENCYCLOPEDIA OF LIFE. Animals - Plants - Pictures & Information. Disponvel em: <http://eol.
org/>. Acesso em: 30 jun. 2013.

FRAME, M. DataONE Science Librarian Assessment. In: Problems in Information Sciences. Univer-
sity of Tennessee - Information Science, 2013.

GBIF Resources (Global Biodiversity Information Facility). Disponvel em: <http://rs.gbif.org/schema/


eml-gbif-profile/>. Acesso em: 30 jun. 2013.

IABIN PTN (Inter American Biodiversity Information Network Pollinators Thematic Network Pollina-

Diretrizes para a Integrao de Dados de Biodiversidade


tors Thematic Network). Disponvel em: <http://www.biocomp.org.br/dataportal/>. Acesso em: 30
jun. 2013.

IBAMA (Instituto Brasileiro do Meio Ambiente e dos Recursos Naturais Renovveis. Disponvel em:
<http://www.ibama.gov.br/>. Acesso em: 30 jun. 2013.

INDE (Infraestrutura Nacional de Dados Espaciais). Disponvel em: <http://www.inde.gov.br/>.


Acesso em: 30 jun. 2013.

ICMBIO (Instituto Chico Mendes de Conservao da Biodiversidade). Disponvel em: <http://www.


icmbio.gov.br/portal/). Acesso em: 30 jun. 2013.

37
JBRJ (Instituto de Pesquisas Jardim Botnico do Rio de Janeiro). Disponvel em: <http://www.jbrj.gov.
br/>. Acesso em: 30 jun. 2013.
Diretrizes para a Integrao de Dados de Biodiversidade
ITIS (Integrated Taxonomic Information System). Disponvel em: http://www.itis.gov/. Acesso em: 30
jun. 2013.

IABIN (Inter-American Biodiversity Information Network). Disponvel em: <http://www.oas.org/en/


sedi/dsd/iabin/>. Acesso em: 30 jun. 2013.

MISSOURI Botanical Garden. Disponvel em: <http://www.missouribotanicalgarden.org/>. Acesso


em: 30 jun. 2013.

NBII- ARQUIVETEAM (National Biological Information Infraestructure). Archiveteam. Disponvel


em:<http://www.archiveteam.org/index.php?title=NBII>. Acesso em: 30 jun. 2013.

NSF (National Science Foundation). Disponvel em: <http://www.nsf.gov/#1>. Acesso em: 30


jun. 2013.

TUAMA, E.; BRAAK, K.; REMSEN, D. GBIF Metadata Profile, How-to guide. Copenhagen: Global
Biodiversity Information Facility, 2011.

OGC (Open Geospacial Consortium). Disponvel em: <http://www.opengeospatial.org/standards/


is>. Acesso em: 30 jun. 2013.

OPEN Modeller. Disponvel em: http://openmodeller.sourceforge.net/. Acesso em: 30 jun. 2013.


Diretrizes para a Integrao de Dados de Biodiversidade

WICIPDIA (Enciclopdia livre). Disponvel em:<http://pt.wikipedia.org/wiki/Portal_(internet)>.


Acesso em: 30 jun. 2013.

SIB COLOMBIA (Sistema de Informacin Sobre Biodiversidad de Colombia). Disponvel em: <http://
www.sibcolombia.net/web/sib/>. Acesso em: 30 jun. 2013.

REMSEN, D.; DORING, M.; ROBERTSON, T. Getting Started, Overview of data publishing in the GBIF
Network. Copenhagen: Global Biodiversity Information Facility, 2011.

SCIELO (Scientific Electronic Library Online). Disponvel em: <http://www.scielo.org/php/index.


php>. Acesso em: 30 jun. 2013.

38
SFB (Servio Florestal Brasileiro). Disponvel em: <http://www.florestal.gov.br/>. Acesso em: 30
jun. 2013.
Diretrizes para a Integrao de Dados de Biodiversidade
SIBBR (Sistema de Informao sobre a Biodiversidade Brasileira). Disponvel em: <http://www.sibbr.
gov.br/>. Acesso em: 30 jun. 2013.

WIKIPDIA (Enciclopdia livre). SGML. Disponvel em: <http://pt.wikipedia.org/wiki/SGML>. Acesso


em: 30 jun. 2013.

SPECIESLINK. Sistema de Informao Distribudo para Colees Biolgicas. Disponvel em:


<http://splink.cria.org.br/>. Acesso em: 30 jun. 2013.

TAPIRLINK. TWiki. Disponvel em: <http://wiki.tdwg.org/twiki/bin/view/TAPIR/TapirLink>. Acesso


em: 30 jun. 2013.

TDWG (Taxonomic Databases Working Group). DarwinCore. Disponvel em: <http://www.tdwg.org/


activities/darwincore/>. Acesso em: 30 jun. 2013.

TDWG (Taxonomic Databases Working Group). Disponvel em: <http://www.tdwg.org/>. Acesso em:
30 jun. 2013.

WIKIPDIA (Enciclopdia livre). Web service. Disponvel em: <http://pt.wikipedia.org/wiki/Web_ser-


vice>. Acesso em: 30 jun. 2013.

USGS/US (United States Geological Survey Geological Survey). Disponvel em: http://www.usgs.gov/.

Diretrizes para a Integrao de Dados de Biodiversidade


Acesso em: 30 jun. 2013.

WIKIPDIA (Enciclopdia livre). XML. Disponvel em: <http://pt.wikipedia.org/wiki/XML>. Acesso


em: 30 jun. 2013.

39
Reserva Biolgica de Poo das Antas (RJ)
Foto: Wigold B. Schffer
3. Padres de Dados e Metadados
Neste captulo sero descritos os padres de metadados considerados na arquitetura
computacional definida pelo GT de interoperabilidade do Ministrio do Meio Ambiente.

3.1 Darwin Core

3.1.1 Apresentao

O Darwin Core um conjunto de normas definido pelo Biodiversity Information Stan-


dards ou Taxonomic Databases Working Group (TDWG)43, baseado nas definies do Dublin
Core Metadata Initiative (DCMI)44. A especificao do padro inclui um glossrio de termos,
tambm chamados de elementos, atributos ou conceitos, destinados a facilitar o compar-
tilhamento de informaes sobre a biodiversidade, fornecendo definies de referncia,
exemplos e comentrios sobre os mesmos.

O Darwin Core baseado principalmente em dados taxonmicos e em sua ocorrn-


cia na natureza, documentada por meio de observaes de espcimes e amostras. Nas
normas do padro so includos documentos que descrevem como estes termos podem ser
utilizados, gerenciados e como um conjunto destes termos pode ser estendido para novas
necessidades.

3.1.2 Verses do Darwin Core

Diretrizes para a Integrao de Dados de Biodiversidade


O Darwin Core foi criado originalmente como um perfil Z39.50 pelo ZBIG (Z39.50 Bio-
logy Implementers Group), financiado por fundos do USA National Science Foundation Award.
O nome Darwin Core foi definido por Allen Allison durante a primeira reunio do ZBIG, rea-
lizada na Universidade de Kansas em 1998, ao comentar a semelhana conceitual com o
perfil Dublin Core. O perfil Darwin Core, mais tarde, foi definido como um documento de
esquema XML para uso com o protocolo Distributed Generic Information Retrieval (Di-
GIR)45. Posteriormente, o grupo de trabalho TDWG foi criado para revisar esse padro, e uma
ratificao do Darwin Core foi publicado oficialmente em 9 de outubro de 2009 (Darwin
Core Terms).

43
Taxonomic Databases Working Group (TDWG) http://www.tdwg.org/activities/darwincore
44
Dublin Core Metadata Initiative (DCMI) http://dublincore.org/documents/dcmi-terms
45
Distributed Generic Information Retrieval (DiGIR) http://digir.net 41
Apesar de publicado como um padro do TDWG, o Darwin Core possuiu vrias verses ante-
riores, conforme descrito na Tabela 3.

Tabela 3 - Verses publicadas do Padro Darwin Core.


Nmero de
Nome Data de Publicao
termos
Darwin Core 1.0 24 1998

Darwin Core 1.2 (Classic) 46 11/Nov/2001

Darwin Core 1.21 (MaNIS/HerpNet /ORNIS/FisNet2) 63 15/Mar/2003

Darwin Core OBIS 27 10/Jul/2005

Darwin Core 1.4 (Draft Standard) 45 10/Jul/2005

Darwin Core Terms (properties) 172 09/Out/2009

Mais informaes sobre a histria do Darwin Core podem ser consultadas na pgina do pa-
dro na Wikipdia: http://en.wikipedia.org/wiki/Darwin_Core.

Para participar das discusses e do processo de evoluo do padro ou para se manter infor-
mado sobre as atualizaes do Darwin Core, acesse o Portal do projeto Darwin Core46.

3.1.3 Objetivos

O padro Darwin Core (tambm abreviado como DwC) um formato padro para a codifica-
o de informaes relacionadas a espcies. Este formato de dados foi criado para facilitar o com-
Diretrizes para a Integrao de Dados de Biodiversidade

partilhamento de informaes sobre a ocorrncia espao-temporal de espcies e a existncia de


espcimes em colees fsicas e digitais. Atualmente este padro se tornou bastante amplo e ver-
stil. Extenses para o padro Darwin Core fornecem um mecanismo para o compartilhamento de
informaes adicionais, podendo considerar dados de domnios especficos ou apenas complemen-
tares s informaes j existentes no ncleo do padro.

O DwC possui um glossrio de termos que podem ser usados para descrever a maioria das
informaes comuns sobre um espcime. Por meio de definies semnticas estveis, este formato
tem como objetivo fornecer um alto grau de reutilizao das informaes em diferentes contextos.

Os termos descritos no Darwin Core so parte de um conjunto maior de vocabulrios e especi-


ficaes tcnicas em desenvolvimento e so mantidas pelo Biodiversity Information Standards (TDWG)47.

46
Portal do projeto Darwin Core https://code.google.com/p/darwincore
42 47
Biodiversity Information Standards (TDWG) http://www.tdwg.org/standards
O Darwin Core utilizado em geral para o compartilhamento de dados de espcies
(taxonmicos) e de suas ocorrncias na natureza (observaes e amostras). Com a evolu-
o de sua estrutura o mesmo passou a ser utilizado tambm como base para a definio de
outros formatos para compartilhamento de dados.

3.1.4 Detalhamento da Estrutura

O Darwin Core possui um conjunto de termos de semntica bem definida, que podem ser
compreendidos por pessoas ou interpretados por computadores, tornando possvel determinar o
uso apropriado dos dados nele codificados. Os termos so organizados em nove categorias, que
correspondem aos termos definidos como Classes (termos que possuem outros termos para deta-
lhamento). Destas categorias, seis abrangem aspectos mais amplos (evento, localizao, contexto
geolgico, ocorrncia, txon e identificao) no domnio da biodiversidade. As demais categorias
abrangem relaes com outros recursos, medidas e informaes genricas sobre os registros.

Especialmente na categoria Record-Level Terms, o Darwin Core recomenda o uso de diversos


termos originrios do padro Dublin Core (type, modified, language, rights, rightsHolder, accessRights,
bibliographicCitation, references). Os nomes destes termos iniciam com dcterms, que identificam que
os mesmos so controlados pelo DCMI. Na Tabela 4 so apresentadas as categorias do Darwin Core
e as informaes gerais contidas em cada uma delas.

Tabela 4 - Categorias do Darwin Core: O Simple Darwin Core considera


apenas as sete primeiras categorias.

Termos do Dublin Core, instituies, colees,


Record-level Terms
natureza do registro de dados.

Diretrizes para a Integrao de Dados de Biodiversidade


Evidncia de espcies na natureza, observaes,
Occurrence
comportamentos, mdias associadas, referncias.
Protocolos e mtodos de amostragem,
Event Darwin Core
data, hora, notas de campo.
Simples
Location Geografia, descries de localizao, dados espaciais.
(Simple DwC)
Identification Ligao entre Taxon e Occurrence.
Nomes cientficos, nomes populares, nomes utilizados,
Taxon
conceitos do taxon e o relacionamento entre eles.
Tempo geolgico, cronoestratigrafia,
GeologicalContext
bioestratigrafia, litoestratigrafia.
Relacionamento explcito entre os recursos identificados
ResourceRelationship Darwin Core
(exemplo: um organismo para o outro, taxon e localizao).
Genrico
MeasurementOrFact Medies, fatos, caractersticas, afirmaes e referncias.

43
Embora o Darwin Core seja insuficiente para as necessidades biolgicas de todas as discipli-
nas, ele pode ser adaptado para servir a novos propsitos. O padro pode ser estendido pela adi-
o de novos termos para o compartilhamento de informaes. Para fazer isso, necessrio estar
familiarizado com as recomendaes e procedimentos definidos na Poltica de Nomes do Darwin
Core48. Basicamente, antes da proposta de um novo termo, deve-se considerar os termos existentes
no Darwin Core e em outros padres compatveis, para se determinar se este novo conceito poder
ser acomodado em um termo j existente, por meio de uma simples reviso da descrio e dos co-
mentrios, sem a perda do significado original do termo.

Um dos princpios fundamentais deste padro manter a definio dos termos inde-
pendente da tecnologia utilizada para compartilhamento, por exemplo, XML, TXT ou RDF.

3.1.5 Definio dos termos

Em sua documentao, os termos do Darwin Core so descritos geralmente pelos seguin-


tes atributos:
Nome do termo: O nome pelo qual a verso mais recente do termo conhecido;
Identificador: O identificador exclusivo para a verso mais recente do termo;
Classe: A categoria principal de termos (Class) que este termo descreve;
Definio: Uma descrio da natureza do contedo do termo;
Comentrio: Comentrios adicionais sobre o uso do termo, com exemplos e referncias
para mais informaes;
Detalhes: Um link para as informaes completas sobre o termo, incluindo o acesso ao seu
histrico.
Diretrizes para a Integrao de Dados de Biodiversidade

A Tabela 5 apresenta a descrio do termo catalogNumber:

Tabela 5 - Descrio do Termo catalogNumber no Darwin Core Terms: A quick reference guide.
Term Name: catalogNumber
Identifier http://rs.tdwg.org/dwc/terms/catalogNumber

Class http://rs.tdwg.org/dwc/terms/Occurrence

Definition An identifier (preferably unique) for the record within the data set or collection.

Examples: 2008.1334, 145732a, 145732. For discussion seehttp://code.google.


Comment
com/p/darwincore/wiki/Occurrence

Details catalogNumber

44 48
Poltica de Nomes do Darwin Core http://rs.tdwg.org/dwc/terms/namespace
O conjunto completo dos termos atuais do Darwin Core com suas descries e demais infor-
maes esto disponveis no Guia Darwin Core Terms: A quick reference guide49, publicado pelo
TDWG. Outro importante documento o Darwin Core Terms: A complete historical record50,
que inclui a descrio de todos os termos, o histrico de mudanas entre as verses do Darwin Core
e seu relacionamento com outros termos e padres.

3.1.6 Exemplo de registro Darwin Core

Na Listagem 1 apresentado o trecho de um arquivo Darwin Core que descreve o registro de


uma observao de ave.

Diretrizes para a Integrao de Dados de Biodiversidade


Listagem 1 - Trecho de um registro Darwin Core codificado em XML.

49
Darwin Core Terms: A quick reference guide http://rs.tdwg.org/dwc/terms/index.htm
50
Darwin Core Terms: A complete historical record http://rs.tdwg.org/dwc/terms/history/index.htm
45
3.1.7 Simple Darwin Core

O Simple Darwin Core51 ou Darwin Core Simplificado um subconjunto predefinido dos ter-
mos que possuem uso comum em uma ampla variedade de aplicaes de biodiversidade. Os termos
utilizados neste esquema so encontrados nas classes do Darwin Core de nomes taxonmicos, luga-
res e eventos, e possibilitam o registro de ocorrncias biolgicos. Os dois princpios deste esquema
so a simplicidade e a flexibilidade.

Sua simplicidade decorre da necessidade de uma estrutura plana (flat), utilizando apenas li-
nhas e colunas. Desta forma os nomes dos termos podem ser considerados como os nomes dos
campos e assim um registro do Simple Darwin Core pode ser definido em uma planilha ou em uma
nica tabela em um banco de dados.

O Simple Darwin Core no possui campos obrigatrios, o que possibilita o compartilhamento


de qualquer combinao significativa de campos. Por exemplo, apenas nomes ou lugares, observa-
es individuais realizadas na natureza em um determinado local e tempo. Essa flexibilidade pro-
move a reutilizao dos termos e mecanismos de compartilhamento por uma ampla variedade de
servios.

Na Listagem 2 apresentado um trecho do registro de ocorrncia de um espcime preserva-


do utilizando o padro Simple Darwin Core.

Diretrizes para a Integrao de Dados de Biodiversidade

Listagem 2 - Trecho de um registro Simple Darwin Core em XML.

51
Padro Simple Darwin Core http://rs.tdwg.org/dwc/terms/simple/index.htm

46
As regras e demais informaes necessrias para a utilizao do Simple Darwin Core podem
ser consultadas no documento de referncia do padro.

3.1.8 Darwin Core Archive (DwC-A)

O Darwin Core Archive (DwC-A) um padro para o compartilhamento de dados de biodi-


versidade que faz uso dos termos do Darwin Core para produzir um conjunto de registros de ocor-
rncias e/ou de dados taxonmicos. Por meio da utilizao de extenses outras informaes po-
dem ser agregadas ao esquema. Estas extenses so descritas no GBIF Resources52.

O DwC-A composto por um conjunto de arquivos texto, com os dados separados por vr-
gulas ou tabulao, juntamente com um arquivo descritor em XML (meta.xml), para informar como
os arquivos texto so organizados, e um arquivo de metadados em EML (eml.xml), para descrever
o conjunto de dados publicado. Este conjunto de arquivos so compactados em um nico arquivo
(Archive). Este formato o preferido pelo GBIF para a publicao de dados na rede GBIF Network.

A ideia central de um Archive que os arquivos com os dados estejam logicamente organiza-
dos em um modelo estrela ou star-schema (Figura 9), onde um arquivo principal (ncleo) rodeado
por diversos arquivos de extenses. Cada arquivo de extenso (ou linha do arquivo de extenso)
aponta para um registro do arquivo de ncleo. Desta forma, muitos registros de extenso podem
existir para cada registro do ncleo.

Diretrizes para a Integrao de Dados de Biodiversidade

Figura 9 - Componentes de um arquivo Darwin Core Archive (DwC-A).

52
Portal do GBIF Resources http://rs.gbif.org
47
Compartilhar um ou mais conjuntos de dados completos em um archive, em substituio a
utilizao de servios Web que utilizam arquivos XML, permite uma transferncia de dados mais efi-
ciente, pois os arquivos so transferidos em arquivos texto compactados, o que diminui o tamanho
dos dados transferidos.

Lembrando que tanto as tcnicas que utilizam os arquivos XML quanto as que utilizam arqui-
vos texto possuem vantagens e desvantagens, que devem ser consideradas na escolha da estratgia
mais adequada para cada aplicao.

Conforme descrito anteriormente, o arquivo do ncleo pode ser um arquivo texto, com os
dados separados por tabulao, conforme a Listagem 3:
Diretrizes para a Integrao de Dados de Biodiversidade

Listagem 3 - Exemplo de arquivo do ncleo do DwC-A.

48
O arquivo do ncleo, apresentado na Listagem 3, e os demais arquivos de extenso considera-
dos devem ser descritos por meio de um arquivo chamado de meta.xml. Este arquivo (Listagem 4)
descreve a estrutura de cada um dos arquivos que compem o modelo estrela.

Listagem 4 - Exemplo de arquivo (meta.xml) que descreve a estrutura dos demais arquivos de um DwC-A.

Diretrizes para a Integrao de Dados de Biodiversidade


Informaes adicionais sobre o Darwin Core Archive podem ser consultadas nos guias
Darwin Core Text Guide53 e Darwin Core Archive How to Guide54.

53
Darwin Core Text Guide http://rs.tdwg.org/dwc/terms/guides/text/index.htm
54
Darwin Core Archive How to Guide http://imsgbif.gbif.org/CMS_ORC/?doc_id=2816&download=1
49
3.1.9 Referncias

DARWIN CORE Namespace Policy. Disponvel em: <http://rs.tdwg.org/dwc/terms/namespace/>.


Acesso em: 30 jun. 2013.

DARWIN CORE Terms: A complete historical record. Disponvel em: <http://rs.tdwg.org/dwc/terms/


history/index.htm>. Acesso em: 30 jun. 2013.

DARWIN CORE Terms: A quick reference guide. Disponvel em: <http://rs.tdwg.org/dwc/terms/in-


dex.Htm>. Acesso em: 30 jun. 2013.

DARWIN CORE Text Guide. Disponvel em: <http://rs.tdwg.org/dwc/terms/guides/text/index.htm>.


Acesso em: 30 jun. 2013.

DARWIN CORE. Project site for discussion and development - Google Project Hosting. Disponvel
em: <https://code.google.com/p/darwincore/>. Acesso em: 30 jun. 2013.

DCMI Metadata Terms. Disponvel em: <http://dublincore.org/documents/dcmi-terms/>. Acesso em:


30 jun. 2013.

DIGIR - Table of Contents. Disponvel em: <http://digir.net/>. Acesso em: 30 jun. 2013.

DRING, M.; ROBERTSON, T.; REMSEN, D. Darwin Core Archive Format, Reference Guide to the
XML Descriptor File. Copenhagen: Global Biodiversity Information Facility, 2011.
Diretrizes para a Integrao de Dados de Biodiversidade

FRAME, M. Darwin Core. In: Problems in Information Sciences. University of Tennessee - Informa-
tion Science, 2013.

GBIF Resources. Disponvel em: <http://rs.gbif.org/>. Acesso em: 30 jun. 2013.

GBIF: Darwin Core Archives. Disponvel em: <http://www.gbif.org/informatics/standards-andtools/


publishing-data/data-standards/darwin-core-archives/>. Acesso em: 30 jun. 2013.

REMSEN, D.; DORING, M.; ROBERTSON, T. GBIF Darwin Core Archive, How-to Guide. Copenhagen:
Global Biodiversity Information Facility, 2010.

50
REMSEN, D. P.; DRING, M.; ROBERTSON, T. Create your own Darwin Core Archive, Step-by-Step
Guide. Copenhagen: Global Biodiversity Information Facility, 2010.

REMSEN, D.; SOOD, R. Darwin Core Archive Assistant, User Guide. Copenhagen: Global Biodiver-
sity Information Facility, 2010.

SIMPLE Darwin Core. Disponvel em: <http://rs.tdwg.org/dwc/terms/simple/index.htm>. Acesso em:


30 jun. 2013.

TDWG: Darwin Core. Disponvel em: <http://www.tdwg.org/activities/darwincore/>. Acesso em: 30


jun. 2013.

TDWG: Standards. Disponvel em: <http://www.tdwg.org/standards/>. Acesso em: 30 jun. 2013.


WIECZOREK, J.; De GIOVANNI, R.; VIEGLAIS, D.; REMSEN, D. P.; DRING, M.; ROBERTSON, T. Darwin
Core Quick Reference Guide. Copenhagen: Global Biodiversity Information Facility, 2010.

WIECZOREK, J.; BLOOM, D.; GURALNICK, R.; DORING, M.; et al. Darwin Core. An Evolving Community-
Developed Biodiversity Data Standard. PLoS ONE, v. 7, n. 1, p. 29715, 6 jan. 2012.

3.2 Dublin Core

3.2.1 Apresentao

Diretrizes para a Integrao de Dados de Biodiversidade


O Dublin Core Metadata Initiative (DCMI)55 uma organizao dedicada a promover a ado-
o de padres de interoperabilidade de metadados e desenvolver vocabulrios especializados para
descrever fontes que tornem mais inteligentes os sistemas para descoberta de informaes.

O padro Dublin Core56 um vocabulrio de quinze elementos para a descrio de recursos.


O nome Dublin devido a sua origem ter ocorrido em um workshop na cidade de Dublin (Repbli-
ca da Irlanda) em 1995. O Core devido os seus elementos serem amplos e genricos, podendo ser
utilizados na descrio de uma ampla gama de recursos.

Estes elementos foram aprovados pelos seguintes padres de referncia:


ISO Standard 15836:200957;
55
Dublin Core Metadata Initiative (DCMI) http://dublincore.org
56
Wikipdia - Dublin Core http://pt.wikipedia.org/wiki/Dublin_Core
57
ISO 15836:2009 http://www.iso.org/iso/search.htm?qt=15836&searchSubmit=Search&sort=rel&type=simple&published=on 51
ANSI/NISO Standard Z39.85-200758;
IETF RFC 501359.

Os quinze elementos do Dublin Core fazem parte de um conjunto maior de vocabulrios de


metadados e especificaes tcnicas mantidas pela DCMI. O conjunto completo de vocabulrios
tambm inclui um conjunto de recursos de classes, esquemas para codificao de vocabulrios e
sintaxes. Mais informaes podem ser consultadas no Guia DCMI Metadata Terms60.

3.2.2 Objetivos

O Dublin Core possui como objetivo a descrio de objetos, tais como documentos (livros,
artigos, padres, protocolos, relatrios, etc.), vdeos, sons, imagens, textos e sites da Web. Aplicaes
do Dublin Core utilizam o XML e o RDF (Resource Description Framework).

O Dublin Core um conjunto de metadados para descoberta de recursos. Ele no adequado


para a descrio e compreenso de um recurso, pois no possui elementos de descrio de atributos,
metodologia, qualidade, entre outras informaes necessrias no detalhamento de recursos.

Em sistemas de biodiversidade a utilizao mais comum do Dublin Core na descri-


o de referncias bibliogrficas de documentos (livros, artigos cientficos, relatrios tcnicos).
Outra utilizao do padro a descrio de recursos em sistemas de gerenciamento de con-
tedo com o objetivo de facilitar a pesquisa, descoberta e interpretao dos mesmos.

3.2.3 Detalhamento da Estrutura


Diretrizes para a Integrao de Dados de Biodiversidade

O Dublin Core possui dois nveis: Simples e Qualificado. O nvel simples inclui quinze ele-
mentos, j o qualificado possui trs elementos adicionais (audincia, provenincia e detentor de di-
reitos), juntamente com um grupo para refinamento dos elementos existentes (tambm chamados
de qualificadores), que refinam a semntica dos elementos de maneira que sejam teis no processo
de descoberta dos recursos.

Todos os seus elementos so opcionais e podem ser repetidos, alm disso, no existem restri-
es quanto a ordem dos elementos. Na Figura 10 so descritos os diversos elementos do Dublin
Core Qualificado.

58
ANSI/NISO Standard Z39.85-2007 http://www.niso.org/standards/z39-85-2007
59
IETF RFC 5013 http://www.ietf.org/rfc/rfc5013.txt
52 60
DCMI Metadata Terms http://dublincore.org/documents/dcmi-terms
Figura 10 Elementos, refinamentos, codificaes e tipos que compem o padro Dublin Core.

3.2.4 Definio dos termos

Em sua documentao, os termos do Dublin Core so descritos geralmente pelos seguintes


atributos:
Nome: O nome inserido no URI do namespace do DCMI para criar o URI do termo;
URI (Uniform Resource Identifier): Identificador e denominador do termo na Internet;
Rtulo: O nome pelo qual o termo conhecido;
Definio: Uma descrio da natureza do contedo do termo;

Diretrizes para a Integrao de Dados de Biodiversidade


Tipo do Termo: O tipo do termo conforme descrito no DCMI Abstract Model (DCAM)61.

Quando aplicveis, outros atributos so disponibilizados com informaes adicionais sobre o


termo, como:
Comentrio: Comentrios adicionais sobre o uso do termo;
Referncias: Referncia do dicionrio utilizado no termo;
Verso: A descrio histrica de um termo.

A Tabela 6 apresenta a descrio do termo coverage:

61
DCMI Abstract Model (DCAM) http://dublincore.org/documents/abstract-model/

53
Tabela 6 - Descrio do Termo coverage no DCMI Metadata Terms.

Term Name: coverage


URI http://purl.org/dc/elements/1.1/coverage
Label Coverage
Definition The spatial or temporal topic of the resource, the spatial applicability of the resource,
or the jurisdiction under which the resource is relevant.
Comment Spatial topic and spatial applicability may be a named place or a location specified
by its geographic coordinates. Temporal topic may be a named period, date, or date
range. A jurisdiction may be a named administrative entity or a geographic place
to which the resource applies. Recommended best practice is to use a controlled
vocabulary such as the Thesaurus of Geographic Names [TGN]. Where appropriate,
named places or time periods can be used in preference to numeric identifiers such
as sets of coordinates or date ranges.
References [TGN] http://www.getty.edu/research/tools/vocabulary/tgn/index.html

A descrio e demais informaes dos termos que fazem parte do nvel simplificado do Dublin
Core esto disponveis no Guia Dublin Core Metadata Element Set, Version 1.162. J o Dublin
Core qualificado est disponvel no Guia DCMI Metadata Terms63.

3.2.5 Exemplo de registro Dublin Core

Na Listagem 5 apresentado o trecho de um arquivo Dublin Core que descreve o Guia Darwin
Core Quick Reference do GBIF (Figura 11).
Diretrizes para a Integrao de Dados de Biodiversidade

Figura 11 Guia Darwin Core Quick Reference publicado pelo GBIF.

62
Dublin Core Metadata Element Set, Version 1.1 http://dublincore.org/documents/dces/
63
DCMI Metadata Terms http://dublincore.org/documents/dcmi-terms/
54
Listagem 5 - Exemplo de arquivo Dublin Core referente ao arquivo digital do Darwin Core Quick Reference
Guide.

3.2.6 Referncias

ANSI/NISO Z39.85-2007. The Dublin Core Metadata Element Set - National Information Stan-
dards Organization. Disponvel em: <http://www.niso.org/apps/group_public/project/details.
php?project_id=57>. Acesso em: 30 jun. 2013.

CDP METADATA WORKING GROUP. Dublin Core Metadata Best Practices. Denver: Collaborative
Digitization Program at the University of Denver, 2006. Disponvel em: <http://www.mndigital.org/

Diretrizes para a Integrao de Dados de Biodiversidade


digitizing/standards/metadata.pdf>. Acesso em: 30 jun. 2013.

DCMI (Dublin Core Metadata Initiative). Abstract Model. Disponvel em: <http://dublincore.org/do-
cuments/abstract-model/>. Acesso em: 30 jun. 2013.

DCMI (Dublin Core Metadata Initiative). Disponvel em: <http://dublincore.org/>. Acesso em: 30
jun. 2013.

DCMI (Dublin Core Metadata Initiative). Metadata Terms. Disponvel em: <http://dublincore.org/
documents/dcmi-terms/>. Acesso em: 30 jun. 2013.

55
WIKIPDIA (Enciclopdia Livre). Dublin Core Disponvel em: <http://pt.wikipedia.org/wiki/Dub-
lin_Core>. Acesso em: 30 jun. 2013.

DUBLIN CORE Metadata Element Set, Version 1.1. Disponvel em: <http://dublincore.org/documents/
dces/L>. Acesso em: 30 jun. 2013.

FRAME, M. Dublin Core. In: Problems in Information Sciences. University of Tennessee - Informa-
tion Science, 2013.

ISO 15836:2009. Information and documentation - The Dublin Core metadata element set. Dispo-
nvel em: <http://www.iso.org/iso/home/store/catalogue_tc/catalogue_detail.htm?csnumber=52142>.
Acesso em: 30 jun. 2013.

KUNZE, J. A.; BAKER, T. RFC 5013 - The Dublin Core Metadata Element Set The IETF Trust, 2007.
Disponvel em: <http://www.ietf.org/rfc/rfc5013.txt>. Acesso em: 30 jun. 2013.

QUAM, E. Minnesota metadata guidelines for dublin core metadata: training manual, 2002. Dis-
ponvel em: <http://cdigital.uv.mx/handle/123456789/10372>. Acesso em: 30 jun. 2013.

3.3 EML

3.3.1 Apresentao
Diretrizes para a Integrao de Dados de Biodiversidade

O Ecological Metadata Language (EML)64 uma especificao de metadados aberto para


facilitar o compartilhamento, preservao e interpretao de dados cientficos entre instituies e
grupos de pesquisa. Ele baseado nos trabalhos realizados pelo Ecological Society of America65,
juntamente com alguns parceiros de pesquisa, como o Knowledge Network for Biocomplexity66.
O EML foi estruturado de forma modular e extensvel para descrever diversos tipos de dados prove-
nientes das cincias ecolgicas. Estes dados abrangem uma srie de domnios distintos da cincia,
incluindo estudos de biodiversidade, funes do ecossistema, meteorologia, cincias do solo, hidro-
logia, sensoriamento remoto e muitas outras.

O EML permite ao cientista fornecer descries padronizadas de dados desses diversos dom-
nios em um formato de texto acessvel. As descries do EML podem ser extremamente resumidas
64
Wikipdia - Ecological Metadata Language (EML) http://en.wikipedia.org/wiki/Ecological_Metadata_Language
65
Portal da Ecological Society of America http://www.esa.org/esa
56 66
Portal do Knowledge Network for Biocomplexity http://knb.ecoinformatics.org/index.jsp
(Listagem 6) ou incrivelmente ricas (incluindo descries completas da sintaxe dos dados, esquema
e semntica). Assim, o EML pode ser aplicado em uma grande variedade de aplicaes de pesquisa,
da descoberta de dados simples at o processamento automatizado de dados detalhados.

O EML foi criado com base nas seguintes premissas:

Aberto: para possibilitar a leitura humana e facilitar o arquivamento de dados em longo


prazo;

Modular: para promover o reuso das estruturas/sesses dos metadados;

Extensvel: para possibilitar a incluso de metadados que no esto definidos


originalmente no EML;

Estruturado: para possibilitar o processamento computacional realizado por aplicaes


de anlise e outras aplicaes de software;

Fcil de implementar: para minimizar os requisitos e esforos necessrios na utilizao


do padro.

3.3.2 Objetivos

A arquitetura EML foi projetada para atender as necessidades da comunidade cientfica e pos-
sibilitar o benefcio gerado pelo reaproveitamento de trabalhos realizados em outros padres de
metadados. O EML possui caractersticas de diversos padres existentes, alm de facilitar o processa-
mento e a integrao automtica de conjuntos de dados por meio de seus metadados.

O EML tem grande valor para o armazenamento de dados em longo prazo, por ser um arquivo

Diretrizes para a Integrao de Dados de Biodiversidade


de texto que pode ser lido por cientistas e gestores dos dados, mas que tambm possui uma ampla
utilizao em aplicaes de software devido seu formato estruturado, que possibilita o processa-
mento computacional de seus dados.

Na Listagem 6, um arquivo simplificado em EML apresentado. Este arquivo descreve um


conjunto de dados a partir do seu nome (ttulo) e das informaes do seu criador. Este nvel de deta-
lhamento til apenas para a descoberta de dados pela comunidade cientfica. Para outras aplica-
es, devem ser criados documentos com maior riqueza de informaes.

57
Listagem 6 - Trecho de arquivo EML simplificado para descoberta de conjunto de dados.

Informaes mais detalhadas so desejveis em grande parte das aplicaes que utilizam estes
metadados. No entanto, devido a gerao e documentao de metadados consumirem uma quanti-
dade considervel de recursos, estas atividades devem ser planejadas desde a concepo dos projetos.
Alm disso, tambm aconselhvel uma definio prvia do nvel de detalhamento dos metadados
considerados, com base nas diretrizes e necessidades da instituio ou projeto de pesquisa.

O principal repositrio internacional que considera a utilizao do EML o Knowledge Network


for Biocomplexity (KNB). Alguns repositrios nacionais que tambm consideram a infraestrutura da
rede KNB so gerenciados pelo Instituto Nacional de Pesquisas da Amaznia (INPA), como os reposit-
rios do PPBio e do PELD.

O EML um conjunto de documentos XML, que podem ser utilizados de forma modu-
Diretrizes para a Integrao de Dados de Biodiversidade

lar e extensvel para documentar dados ecolgicos. Cada mdulo EML projetado para
descrever uma parte dos metadados que so inclusos nos conjuntos de dados ecolgicos. O
seu principal objetivo disponibilizar para a comunidade cientfica um padro de metada-
dos extensvel e flexvel para utilizao na anlise e armazenamento dos dados.

3.3.3 Detalhamento da Estrutura

Um documento EML fornece metadados para um nico recurso, que pode ser um conjunto de
dados, uma citao de literatura, um protocolo cientfico ou um software. Para um determinado re-
curso descrito, uma vasta variedade de outros tipos de metadados, incluindo outros recursos, podem
ser considerados. Por exemplo, ao descrever um recurso de conjunto de dados, comum a referncia
a uma ou mais citaes da literatura, bem como as descries dos modelos de dados e seus valores.

58
Na Tabela 7 so descritos os mdulos do EML (verso 2.0.0):

Tabela 7 - Descrio dos mdulos do EML (verso 2.0.0).


General modules
eml Mdulo global contendo metadados EML e metadados adicionados por meio de
extenses.
eml-resource Descrio geral de um recurso, contendo campos comuns a todos os recursos,
como quem os criou, ttulo e palavras-chave.
eml-dataset Campos para descrever recursos de dados, incluindo tabelas, imagens espaciais e
outros tipos de entidades.
eml-literature Campos para descrio de recursos literrios relacionados s suas citaes
bibliogrficas.
eml-protocol Campos para descrio de protocolos cientficos para a gerao ou processamento
de dados.
eml-software Campos para descrio de recursos de software.
Entities and Attributes
eml-entity Campos gerais para descrio de todos os tipos de entidades no conjunto de
dados, como tabelas e imagens espaciais.
eml-attribute Campos para descrio de todos os atributos (variveis) em uma entidade de dados.
eml-constraint Campos para definio das restries de integridade (principalmente relacional)
entre entidades.
eml-physical Campos para descrio das caractersticas fsicas de um objeto de dados (arqui-
vos e streams), bem como as informaes para a sua distribuio.
eml-dataTable Campos especializados para descrio de dados tabulares.
eml-spatialRaster Campos especializados para descrio de dados espaciais do tipo Raster.
eml-spatialReference Campos especializados para descrio de dados espaciais.
eml-spatialVector Campos especializados para descrio de dados vetoriais espaciais.

Diretrizes para a Integrao de Dados de Biodiversidade


eml-storedProcedure Campos especializados para descrio de procedimentos armazenados
encontrados em um sistema de gerenciamento de dados.
eml-view Campos especializados para descrio das vises encontradas em um sistema de
gerenciamento de dados.
Research Context
eml-party Campos para identificao e fornecimento de informaes de contato das pessoas
e organizaes envolvidas.
eml-coverage Campos para descrio taxonmica, espacial e temporal do conjunto de dados.
eml-methods Campos para descrio de mtodos cientficos (coleta dos dados, qualificao e
experimentos)
eml-project Campos para descrio de projetos de pesquisa que esto associados a um
recurso de dados ou outros tipos de recurso.

59
Tabela 7 - Descrio dos mdulos do EML (verso 2.0.0), (continuao).

Miscellaneous
eml-access Campos para especificao de restries de acesso a dados e metadados.
eml-text Campos para fornecimento de descries de textos estruturados e no
estruturados a serem utilizadas nos diversos mdulos do EML.
stmml A linguagem para definir as unidades de medida personalizadas e os fatores de
converso das unidades relacionadas.

O EML foi criado com o objetivo de permitir uma fcil implementao, por isso, a maioria dos
mdulos da Tabela 7 so opcionais. Sendo que o fornecimento apenas dos metadados mnimos no
considerado uma boa prtica em uma perspectiva de gerenciamento de dados.

Em um mundo ideal, os dados relevantes devem ser descritos por meio do conjunto completo
do EML, mas devido a limitao de recursos, muitos cientistas podem fornecer apenas descries
gerais de seus conjuntos de dados. Sendo que mesmo os metadados mnimos, quando fornecidos
em EML, possibilitam a gerao de uma base para a construo de servios de compartilhamento
e processamento dos dados, servios analticos, servios de visualizao baseados na Web, entre
outras aplicaes.

3.3.4 Definio dos elementos

Em sua documentao, o detalhamento do padro EML organizado conforme a sua estru-


tura. So descritos os mdulos, os elementos, os atributos dos mdulos e os seus tipos complexos.
Diretrizes para a Integrao de Dados de Biodiversidade

Os mdulos do EML so detalhados por meio dos seguintes atributos (Tabela 8):
Utilizao recomendada: Demonstra quais as situaes recomendadas para a utilizao
do mdulo;
Importado: Identifica os elementos/padres importados para utilizao neste mdulo;
Importado por: Identifica os mdulos que importam o mdulo atual;
Stand-alone: Informa se o mdulo pode ser utilizado de forma isolada;
Visualizao de Imagem do esquema: Apresenta um diagrama que representa a estrutura
do mdulo (Figura 12).

60
Tabela 8 - Descrio do mdulo eml-access.

Module details: eml-access


Recommended Usage: all data where controlling user access to the dataset is an issue

Stand-alone: Yes

Imports: eml-documentation, eml-resource

Imported By:

View an image of the Schema: eml-access image

Diretrizes para a Integrao de Dados de Biodiversidade


Figura 12 - Diagrama do esquema do mdulo eml-access.

61
J os elementos, so documentados por meio dos seguintes atributos:
Nome do elemento: O nome pelo qual o elemento conhecido;
Valor padro: Valor padro definido para o campo;
Descrio do elemento: Descreve o objetivo do campo e quais informaes podem ser
utilizadas, incluindo tambm alguns exemplos de preenchimento;
Tipo: O tipo do dado utilizado no preenchimento do campo. Este tipo pode ser simples ou
complexo. Os tipos complexos tambm so detalhados na documentao do EML.

A Tabela 9 apresenta a descrio do elemento Access:

Tabela 9 - Descrio do elemento Access.

Element Definitions
Name Access

Default Value This element has no default value.

Type AccessType

The access element contains a list of rules defining permissions for this resource.
Description of For descriptions of the individual elements, see the AccessType.The permission rules
this field defined here can be overridden by rules added to an access tree in the PhysicalDistr
butionType at the entity level.

A especificao detalhada do padro EML, verso 2.1.1, pode ser consultada no Guia Ecologi-
cal Metadata Language (EML) Specification67.
Diretrizes para a Integrao de Dados de Biodiversidade

67
Ecological Metadata Language (EML) Specification http://knb.ecoinformatics.org/software/eml/eml-2.1.1/index.html
62
3.3.5 Exemplo de registro EML

Listagem 7 - Trecho de um arquivo EML que descreve os campos ttulo, resumo e palavras-chave de um data-

Diretrizes para a Integrao de Dados de Biodiversidade


set por meio de duas lnguas (ingls e portugus).

3.3.6 Referncias

EML (Ecological Metadata Language). Wikipedia, the free encyclopedia. Disponvel em: <http://
en.wikipedia.org/wiki/Ecological_Metadata_Language>. Acesso em: 30 jun. 2013.

EML (Ecological Metadata Language). Specification. Disponvel em: <http://knb.ecoinformatics.org/


software/eml/eml-2.1.1/index.html>. Acesso em: 30 jun. 2013.

63
ECOLOGICAL SOCIETY OF AMERICA. Disponvel em: <http://www.esa.org/esa/>. Acesso em: 30
jun. 2013.

EML (Ecological Metadata Language). Best Practives for LTER Sites. . [s.l.] LTER Information Management,
2011. Disponvel em: <http://im.lternet.edu/sites/im.lternet.edu/files/emlbestpractices-2.0-
FINAL-20110801_0.pdf>. Acesso em: 30 jun. 2013.

FEGRAUS, E. H.; ANDELMAN, S.; JONES, M. B.; SCHILDHAUER, M. Maximizing the value of ecological data
with structured metadata: an introduction to ecological metadata language (EML) and principles for
metadata creation. Bulletin of the Ecological Society of America, v. 86, n. 3, p. 158-168, 2005.

KNB (The Knowledge Network for Biocomplexity). Disponvel em: <http://knb.ecoinformatics.org/


index.jsp>. Acesso em: 30 jun. 2013.

LEITE, M. de Q. Arquitetura de sistemas orientada a servios para anlise de experimentos am-


bientais em Weblabs de abelhas. Dissertao (Mestrado). Disponvel em: <http://www.teses.usp.
br/teses/disponiveis/3/3141/tde-08122011-160506/pt-br.php>. Acesso em: 30 jun. 2013.

MICHENER, W. K.; BRUNT, J. W. Nongeospatial Metadata for the Ecological Sciences. Ecological Appli-
cations, v. 7, n. 1, p. 330-342, 1 fev. 1997.

MICHENER, W. K.; PORTER, J.; SERVILLA, M.; VANDERBILT, K. Long term ecological research and infor-
mation management. Ecological Informatics, v. 6, n. 1, p. 13-24, jan. 2011.

BLANKMAN, D.; McGANN, J. Ecological Metadata Language: Practical Application for Scientists.
Diretrizes para a Integrao de Dados de Biodiversidade

In: ALBUQUERQUE, N. M. LTER Network Office, 2003. Disponvel em: <http://im.lternet.edu/sites/


im.lternet.edu/files/emlHandbook.pdf>. Acesso em: 30 jun. 2013.

64
3.4 Audubon Core

3.4.1 Apresentao

O Audubon Core (AC)68 um conjunto de metadados projetados para representar recursos e


colees multimdia de biodiversidade. Recursos multimdia so objetos fsicos ou digitais que nor-
malmente abrangem mais do que texto puro. Eles incluem fotos, ilustraes, desenhos, som, vdeo,
animaes, materiais de apresentao e mdia on-line interativa. A coleo multimdia um conjun-
to destes objetos, que passaram ou no por um processo de curadoria, eletronicamente acessveis
ou no. A especificao deste padro de metadados considera como recurso multimdia tanto as
colees com diversos recursos multimdia quanto um recurso nico isolado. A verso 1.0 do AC est
em processo de reviso e avaliao pelo TDWG.

O Audubon Core tambm se tornou uma extenso do Darwin Core, chamada de Audubon
Core v1.0.1, e pode ser consultada no GBIF Vocabularies Audubon Core69.

3.4.2 Objetivos

Os vocabulrios do AC descrevem informaes que identificam se os recursos multimdia esto


aptos para serem utilizados em aplicaes cientficas especficas, antes mesmo da obteno destes
recursos. Entre diversas informaes, os vocabulrios do padro descrevem questes relacionadas
ao gerenciamento do arquivo ou da coleo, descries do seu contedo, sua taxonomia, geografia,
cobertura temporal e a forma indicada para recuperao, reproduo e utilizao dos mesmos.

O AC compartilha as terminologias e as preocupaes consideradas em outros padres co-

Diretrizes para a Integrao de Dados de Biodiversidade


nhecidos durante a descrio de recursos como o Dublin Core, o Darwin Core, o Adobe Extensible
Metadata Platform (XMP), o International Press and Telecommunications Council (IPTC), o Metadata
Working Group Schema (MWG) e o Natural Collections Schema (NCD).

Muitas colees multimdia de biodiversidade j so descritas em Darwin Core ou Dublin Core.


Mas o Audubon Core surge como uma alternativa e pretende tornar mais fcil a reutilizao das des-
cries j existentes, possibilitando o detalhamento com informaes adicionais quando necessrio.

O Audubon Core foi projetado para facilitar a publicao e descoberta de recursos


multimdia relacionados a biodiversidade, por meio da descrio consistente de um recurso
ou de um conjunto de recursos.
68
Audubon Core (AC) http://terms.gbif.org/wiki/Audubon_Core_Term_List
69
GBIF Vocabularies Audubon Core http://vocabularies.gbif.org/node/126782
65
3.4.3 Detalhamento da Estrutura

O Audubon Core possui na sua estrutura duas camadas de termos, tambm chamadas de
Layers, que caracterizam principalmente o nvel de detalhes na descrio de um recurso:
Camada 1 (Layer 1): Fornece o vocabulrio mais bsico para descrever o recursos multimdia
com os termos do AC.
Cammada 2 (Layer 2): Fornece vocabulrios adicionais e mais ricos para descrever os
recursos.

Os termos da Camada 1 so considerados os mais comuns e descrevem a grande maioria dos


recursos multimdia, mesmo possuindo poucos termos obrigatrios. Durante a utilizao do AC
deve-se considerar a utilizao do maior nmero possvel de termos da Camada 1. J os termos da
Camada 2 so necessrios em tipos particulares de recursos ou em aplicaes que necessitam de
descries altamente detalhadas dos seus recursos.

O AC possui 80 termos no seu esquema, sendo apenas seis obrigatrios, conforme a


Tabela 10.

Tabela 10 - Termos obrigatrios do Audubon Core.

Termo Definio
Um cdigo exclusivo para o recurso, sendo uma coleo ou um item multimidia.
Identifier
obrigatrio um identificador para as colees e recomendado um identificador
(dcterms:identifier)
para os itens de mdia.
Type So aceitos tipos definidos pelo DCMI (http://dublincore.org/documents/dcmi-
(dcterms:type) type-vocabulary/#H7).
Diretrizes para a Integrao de Dados de Biodiversidade

Title Ttulo, nome ou rtulo da instituio, coleo ou recurso individual.


(dcterms:title)
Metadata Language Linguagem da descrio e outros metadados, representado na ISO639-1 ou
(ac:MetadataLanguage) ISO639--3.
Copyright Owner O nome do proprietrio dos direitos. Unknown um valor aceito.
(xmpRights:Owner)
Informao sobre os direitos existentes relacionados ao recurso. O texto completo
Copyright Statement da declarao de direitos autorais, conforme exigido pela legislao nacional do
(dcterms:rights) detentor do copyright. Em colees isso se aplica a todos os objetos contidos, a
menos que um objeto unitrio possua uma prpria declarao diferente.

Mais informaes sobre a estrutura do Audubon Core podem ser consultadas no Guia Audu-
bon Core (DRAFT of 1.0 Normative)70.

70
Audubon Core (DRAFT of 1.0 Normative) http://terms.gbif.org/w/index.php?oldid=9000
66
3.4.4 Definio dos termos

Em sua documentao, os termos do AC so descritos por meio dos seguintes atributos:

URI normativo: URL que identifica o termo;

Rtulo: Identificao do termo no AC;

Atributos: Identifica o nvel do termo, sua obrigatoriedade de preenchimento e se o mesmo


pode ser repetido;

Definio: Uma descrio sobre a funo do termo e seus possveis valores;

Definido por: Termo ou vocabulrio no qual o atributo foi baseado. Em geral baseado em
elementos de outros padres de metadados como o Dublin Core;

Notas: Descreve informaes adicionais sobre a utilizao do termo e seu mapeamento


com os dados do recurso descrito.

A Tabela 11 apresenta a descrio do termo Identifier:

Tabela 11 - Descrio do termo Identifier.

Termo Identifier (dcterms:identifier)

Normative URI: http://purl.org/dc/terms/identifier

Label Identifier
Layer: 1 Required: Yes for media collections, No for media resources (but pre-
ferred if available). Repeatable: Yes
An arbitrary code that is unique for the resource, with the resource being either a
Definition:

Diretrizes para a Integrao de Dados de Biodiversidade


provider, collection, or media item.
Defined by: dcterms:identifier
Using multiple identifiers implies that they have a same-as relationship, i.e. they all
Notes identify the same object (e. g. an object may have all of an http-URL, an lsid-URI,
and a UUID).

A descrio e demais informaes dos termos que fazem parte do Audubon Core esto dispo-
nveis no Guia Audubon Core Term List71.

71
Audubon Core Term List http://terms.gbif.org/wiki/Audubon_Core_Term_List_%281.0_normative%29
67
3.4.5 Exemplo de registro Audubon Core

Listagem 8 - Trecho de um arquivo Audubon Core que descreve uma imagem na Internet.

3.4.6 Referncias

AUDUBON Core Term List (DRAFT of 1.0 normative) - GBIF-Terms. Disponvel em: <http://terms.gbif.
org/wiki/Audubon_Core_Term_List_(1.0_normative)>. Acesso em: 30 jun. 2013.

AUDUBON Core (DRAFT of 1.0 normative) - GBIF-Terms. Disponvel em: <http://terms.gbif.org/w/in-


dex.php?oldid=9000>. Acesso em: 30 jun. 2013.

AUDUBON Core v 1.0.1 | GBIF Vocabularies. Disponvel em: <http://vocabularies.gbif.org/


node/126782>. Acesso em: 30 jun. 2013.
Diretrizes para a Integrao de Dados de Biodiversidade

3.5 Plinian Core

3.5.1 Apresentao

O Plinian Core72 um padro de dados desenvolvido para organizar e compartilhar informa-


es de espcies. A principal diferena deste esquema em relao aos outros esquemas que funcio-
nam de maneira similar (como o Taxon Concept Schema TCS ou o Darwin Core), o fato de que o
Plinian Core considera no apenas informaes taxonmicas, mas inclui tambm informaes refe-
rentes ao comportamento, natureza, influncia e gentica de uma espcie.

72
Portal do Plinian Core http://www.pliniancore.org
68
3.5.2 Objetivos

O desenvolvimento do Plinian Core foi iniciado em 2005, nas filiais espanhola e costa-riquenha
do GBIF. O objetivo inicial foi realizar um mapeamento das informaes associadas as espcies que
so publicadas na web e uma avaliao dos padres existentes que consideravam estes dados. O
resultado dessa pesquisa demonstrou a necessidade da criao de um padro de dados universal,
capaz de integrar informaes de biodiversidade importantes e disponibilizar uma variedade de in-
formaes advindas de diferentes bancos de dados de forma padronizada.

O Plinian Core apresenta uma estrutura de dados simples, de fcil entendimento, e com um
nvel de detalhes suficiente para atender os campos de interesse e necessidades de todo o pblico-
-alvo, que inclui profissionais ligados biodiversidade, pesquisadores, professores, alunos, formado-
res de opinio e profissionais de outras reas que podem se beneficiar desse conhecimento.

3.5.3 Detalhamento da Estrutura

O esquema Plinian Core faz uso de um arquivo .XSD para estruturar os elementos de infor-
mao sobre espcies, definindo os dados a serem publicados pelos provedores de dados. Nesse
esquema, as informaes so subdivididas na seguinte estrutura:
Metadados
Informaes taxonmicas
Elementos bsicos
Nomenclatura e Classificao
Descrio

Diretrizes para a Integrao de Dados de Biodiversidade


Histria Natural
Habitat e Distribuio
Democracia e Conservao
Uso e Gesto
Documentao

Cada subdiviso da estrutura apresenta uma srie de elementos (obrigatrios e no obrigat-


rios) para a padronizao no esquema Plinian Core. O objetivo do padro de dados permitir o ma-
peamento destas informaes em diferentes bancos de dados e possibilitar que estes dados sejam
distribudos de maneira padronizada.

69
3.5.4 Definio dos Termos

Em sua documentao, os termos do Plinian Core so descritos por meio dos seguintes
atributos:
Nome: Identificao do elemento no Plinian Core;
Descrio: Descrio de caractersticas do termo (estrutura, obrigatoriedade);
Referncia: Informaes sobre o preenchimento do termo, seu objetivo, origem e pblico-
alvo. Os dicionrios controlados (quando existirem) tambm so detalhados nesse atributo;
Classe: Detalhamento do tipo da informao do termo.

A Tabela 12 apresenta a descrio do termo TaxonRecordID:

Tabela 12 Descrio do termo TaxonRecordID.

TaxonRecordID
Description
Obligatory element
Quick Reference:
A unique identifier inside the database, for the species record.
Class:
http://code.google.com/p/pliniancore/wiki/NormalString

A descrio e demais informaes dos termos que fazem parte do Plinian Core esto dispon-
veis no Repositrio do padro Plinian Core73. Os arquivos .XSD com o esquema da estrutura de da-
Diretrizes para a Integrao de Dados de Biodiversidade

dos do Plinian Core tambm podem ser encontrados no Portal do Plinian Core. Seguindo a estrutura
definida nestes arquivos, um provedor de informaes de biodiversidade pode disponibilizar seus
dados no padro Plinian Core.

73
Repositrio do padro Plinian Core https://code.google.com/p/pliniancore
70
3.5.5 Exemplo de registro Plinian Core

Diretrizes para a Integrao de Dados de Biodiversidade

Listagem 9 - Trecho de um arquivo Plinian Core que descreve a espcie Phocoena sinus.

71
3.5.6 Referncias

DATA PROVIDER. SSTN IABIN (Species Specimen Thematic Network American Biodiversity Informa-
tion Network). Disponvel em: <http://larus.inbio.ac.cr/dokuwiki/sstn/doku.php?id=dataprovider>.
Acesso em: 30 jun. 2013.

PLINIAN CORE. Disponvel em: <http://www.pliniancore.org/>. Acesso em: 30 jun. 2013.

PLINIAN CORE. PliC 3.0 - Google Project Hosting. Disponvel em: <https://code.google.com/p/pli-
niancore/>. Acesso em: 30 jun. 2013.

SUFROSTICO/DwC-A-PHP-Library GitHub. Disponvel em: <https://github.com/Sufrostico/DwC-A-


-PHP--Library>. Acesso em: 30 jun. 2013.

3.6 Padres OGC

3.6.1 Apresentao

As funcionalidades para manipulao de mapas e dados georeferenciados so requisitos es-


senciais em grande parte dos sistemas de biodiversidade. Estes recursos so considerados em diver-
sos processos, como na insero e visualizao de dados primrios, alm da utilizao na gerao
Diretrizes para a Integrao de Dados de Biodiversidade

de dados secundrios, a partir da atividades como consolidao e anlise de dados. Para a adoo
destes recursos recomendada a utilizao de padres de dados geogrficos.

As duas principais organizaes mundiais de padronizao de dados geogrficos so: a Inter-


national Organization for Standartization (ISO)74 e a Open Geospacial Consortium (OGC)75.

A ISO foi fundada em 1947 e composta por 156 pases. A organizao possui um comit
especial para a normatizao de dados geogrficos digitais (ISO/TC 211)76 que est envolvido em
projetos de modelagem de dados geogrficos, metadados, referncias e outros.

J a OGC uma organizao internacional que lidera o desenvolvimento e a padronizao

74
International Organization for Standartization (ISO) http://www.iso.org/iso/home.html
75
Open Geospacial Consortium (OGC) http://www.opengeospatial.org
72 76
(ISO/TC 211) http://www.isotc211.org
de contedos nas reas geoespacial e de servios baseados em localizao (LBS). Esta organizao
tambm composta por diversos membros, sendo eles empresas e rgos governamentais, compa-
nhias privadas e universidades, que participam da definio de especificaes pblicas.

As especificaes OpenGIS, uma marca registrada da OGC, servem de apoio a solues inte-
roperveis que habilitam os servios geogrficos para diversos ambientes tecnolgicos. Por meio da
definio de padres e procedimentos, o OGC auxilia os produtores e usurios de geotecnologias
no acesso, manipulao e explorao de dados geogrficos, independente do sistema ou tecnologia
utilizada.

Dentre as principais especificaes existentes esto:

Geography Markup Language (GML)77;

Web Feature Service (WFS)78;

Web Map Service (WMS)79;

Web Coverage Service (WCS)80;

OpenGIS Catalog Service81;

Keyhole Markup Language (KML)82;

Simple Features Interface Standard (SFS)83;

Mais informaes sobre os padres OGC podem ser consultadas no guia OGC Reference
Model84 ou nas documentaes especficas de cada padro.

Alm da adoo dos padres definidos pela OGC, para fazer parte da Infraestrutura Nacional
de Dados Geoespaciais (INDE)85, os provedores de dados geogrficos nacionais devem seguir as

Diretrizes para a Integrao de Dados de Biodiversidade


normas definidas pela Comisso Nacional de Cartografia (CONCAR) e pelo e-PING (Programa de
Interoperabilidade do Governo Eletrnico)86. Estas normas podem ser consultadas nos documen-
tos disponibilizados na rea de Normas e Padres do Portal da INDE87.

77
Geography Markup Language (GML) http://portal.opengeospatial.org/files/?artifact_id=20509
78
Web Feature Service (WFS) http://portal.opengeospatial.org/files/?artifact_id=8339
79
Web Map Service (WMS) http://portal.opengeospatial.org/files/?artifact_id=14416
80
Web Coverage Service (WCS) http://portal.opengeospatial.org/files/?artifact_id=41437
81
OpenGIS Catalog Service http://portal.opengeospatial.org/files/?artifact_id=20555
82
Keyhole Markup Language (KML) http://portal.opengeospatial.org/files/?artifact_id=27810
83
Simple Features Interface Standard (SFS) http://portal.opengeospatial.org/files/?artifact_id=25355
84
OGC Reference Model http://www.opengis.net/doc/orm/2.1
85
Infraestrutura Nacional de Dados Geoespaciais (INDE) http://www.inde.gov.br
86
e-PING (Programa de Interoperabilidade do Governo Eletrnico) http://eping.governoeletronico.gov.br
87
Normas e Padres do Portal da INDE http://www.inde.gov.br/?page_id=70 73
3.6.2 Objetivos

O objetivo principal dos padres OGC possibilitar o acesso a dados espaciais, localmente ou
remotamente, sem a preocupao com os modelos de dados proprietrios, formatos de arquivos ou
Sistemas de Informao Geogrfica (SIGs) que gerenciam estes dados em seus provedores.

Considerando estes padres nos sistemas de biodiversidade, suas aplicaes so variadas e


algumas das principais utilizaes so:

Os dados podem ser obtidos e referenciados como pontos individuais no espao geogrfi-
co, no caso de ocorrncias de espcies;
Os dados podem ser transformados em informaes categorizadas, camadas (layers), tais
como as que so usadas para produzir mapas de recursos naturais, como os tipos de solo,
categorias de vegetao e clima;
Os dados podem ser utilizados como parmetros espaciais na pesquisa dos dados;
Os dados podem ser disponibilizados e consumidos por meio de servios e padres de
codificao para a utilizao em sistemas GIS, sistemas de anlise e modelagem de dados
de biodiversidade.

3.6.3 Detalhamento da Estrutura

As especificaes dos padres OGC so definidas a partir de diversos documentos. Os princi-


pais so:
Especificao Abstrata (Abstract Specification)88: Fornece a viso conceitual para as
Diretrizes para a Integrao de Dados de Biodiversidade

atividades de desenvolvimento dos padres OGC. Os padres OGC so construdos e


referenciados por meio destas especificaes abstratas, permitindo assim a interoperabilidade
entre diferentes empresas e sistemas de processamento espacial distintos.
Implementao do Padro (Implementation Standard)89: Documentos tcnicos que
detalham as interfaces e codificaes definidas pelo OGC. Desenvolvedores de software
utilizam estes documentos para a construo de interfaces abertas e codificaes nos
seus produtos e servios. Estas especificaes so detalhadas em nvel de implementao,
possibilitando que implementaes distintas, realizadas por diferentes desenvolvedores,
sejam compatveis.
Melhores prticas (Best Practices)90: Documentos contendo as melhores prticas
relacionadas ao uso e/ou implementao dos padres OGC.
88
OGC Abstract Specification http://www.opengeospatial.org/standards/as
89
OGC Implementation Standard http://www.opengeospatial.org/standards/is
74 90
OGC Best Practices http://www.opengeospatial.org/standards/bp
3.6.4 Referncias

CARTILHA Tcnica para Publicao de Dados Abertos no Brasil v1.0. Portal Brasileiro de Dados Abertos.
Disponvel em: <http://dados.gov.br/cartilha-publicacao-dados-abertos/>. Acesso em: 30 jun. 2013.

CEMG-CONCAR. (Comit de Estruturao de Metadados Geoespaciais). Perfil de Metadados Geoes-


paciais do Brasil (Perfil MGB). Comisso Nacional de Cartografia, nov. 2009. Disponvel em: <http://
www.concar.ibge.gov.br/arquivo/Perfil_MGB_Final_v1_homologado.pdf>. Acesso em: 30 jun. 2013.

ISO (International Organization of Standardization). ISO 19115 - Geographic information - Meta-


data. Suia: International Organization of Standardization, 1 maio. 2003. Disponvel em: <https://
www.ghrsst.org/files/download.php?m=documents&f=ISO%2019115%20.pdf>. Acesso em: 30
jun. 2013.

ISO (International Organization for Standardization). Disponvel em: <http://www.iso.org/iso/home.


html>. Acesso em: 30 jun. 2013.
OGC (Open Geospatial Consortium). Reference Model. Disponvel em: <http://www.opengeospa-
tial.org/>. Acesso em: 30 jun. 2013.

WIKIPEDIA (Encyclopedia free). List of geographic information systems software. Disponvel em:
<http://en.wikipedia.org/wiki/List_of_geographic_information_systems_software>. Acesso em: 30
jun. 2013.

OGC (Open Geospatial Consortium). Reference Model. Open Geospatial Consortium, 19 dez. 2011.
Disponvel em: <https://portal.opengeospatial.org/files/?artifact_id=47245>. Acesso em: 30
jun. 2013.

Diretrizes para a Integrao de Dados de Biodiversidade


PING (Padres de Interoperabilidade de Governo Eletrnico). Disponvel em: <http://eping.gover-
noeletronico.gov.br/>. Acesso em: 30 jun. 2013.

SANTANA, F. S. Uma infraestrutura orientada a servios para a modelagem de nicho ecol-


gico. Tese (Doutorado). Disponvel em: <http://www.teses.usp.br/teses/disponiveis/3/3141/tde-
13072009-165044/pt-br.php>. Acesso em: 30 jun. 2013.

75
Diretrizes para a Integrao de Dados de Biodiversidade

Reserva Extrativista de Cassurub (BA)


Foto: Wigold B. Schffer

76
4. Ferramentas e Protocolos para Manipulao
de Dados de Biodiversidade
A arquitetura de interoperabilidade de sistemas de biodiversidade apresentada no
Captulo 2.2 sugere a utilizao de protocolos e ferramentas livres e de cdigo aberto que
garantem a comunicao entre os diversos sistemas envolvidos.

Os provedores de dados podem utilizar estas ferramentas para apara o compartilha-


mento dos dos seus dados cientficos com outras instituies e com a comunidade cientfica.

Os agregadores de dados utilizam estas ferramentas para a consulta automatizada


dos dados compartilhados pelos diversos provedores existentes e, em diversas situaes,
realiza a coleta (harvesting) destes dados nas suas bases centralizadas.

Por fim, os publicadores de dados utilizam estas ferramentas geralmente para a pu-
blicao dos dados em Portais na Web, que disponibilizam ferramentas para a localizao,
manipulao e reutilizao dos dados. Os agregadores de dados muitas vezes tambm fa-
zem o papel de publicadores de dados e disponibilizam as informaes (provenientes de
diversos provedores) em um portal na Web.

4.1 TAPIR

4.1.1 Apresentao

Diretrizes para a Integrao de Dados de Biodiversidade


O TAPIR (TDWG Access Protocol for Information Retrieval)91 um protocolo de web
services para a realizao de consultas em banco de dados distribudos de estrutura fsica e
lgica variada. O TAPIR destina-se a comunicao entre aplicaes, utilizando o HTTP como
o mecanismo de transporte. Suas funcionalidades esto disponveis por meio de cinco ope-
raes de solicitao/resposta:
Recuperar metadados de servio;
Recuperar as configuraes de servio;
Inspecionar contedo disponvel;
Realizar consultas;
Monitorar a disponibilidade de servio.
91
TAPIR (TDWG Access Protocol for Information Retrieval) http://wiki.tdwg.org/TAPIR

77
O protocolo TAPIR baseado na troca de mensagens de requisio/resposta entre um
provedor (que possui os dados e os disponibiliza por meio dos servios Web) e um cliente
(consumidor), que conhece o protocolo e requisita as informaes destes provedores.

O TAPIR especifica um padro sem estado (stateless), transmitido por HTTP, baseado em um
protocolo de pedido e resposta em XML, para acessar dados estruturados que podem estar armaze-
nados em um grande nmero de bases de dados distribudas com variadas estruturas fsicas e lgi-
cas. O TAPIR considerado uma evoluo dos protocolos BioCaSe92 e DiGIR93 como alternativa para
a comunicao entre aplicaes clientes e provedores de dados, utilizando a internet.

As principais premissas deste protocolo so:


Sem vnculo a um especfico sistema operacional;
Sem vnculo com um especfico padro de metadados;
Sem vnculo com um especfico modelo de sada dos dados;
Flexvel na utilizao de extenses dos padres;
Gratuito e de uso livre.

O TAPIR foi desenvolvido para ser utilizado com colees de dados de biodiversidade, mas
pode ser aplicado em diversos domnios, devido flexibilidade no uso de padres de metadados.

4.1.2 Funcionamento
Diretrizes para a Integrao de Dados de Biodiversidade

O protocolo TAPIR e os padres de metadados (Exemplo: Darwin Core ou Plinian Core) no


possuem dependncias diretas entre si, pois ambos so isolados de forma a terem suas funes de-
finidas e independentes, conforme descrito a seguir:
Padres de metadados: So utilizados para determinar quais campos e formatos de cam-
po sero mapeados e transportados durante a comunicao entre os sistemas. Possibilita
o uso de extenses dos metadados que permitem o mapeamento de uma maior quanti-
dade de campos, com o objetivo de detalhar as informaes disponibilizadas.
Protocolo: Fornece meios, atravs do uso de rede de computadores, do recebimento de
solicitaes de um requisitante e da criao de pacotes de dados padronizados (baseado
no padro de metadados) para transmiti-los do provedor para o cliente.

92
Portal do BioCaSe http://www.biocase.org/products/protocols
93
Portal do DiGIR http://digir.net
78
Baseado nestes conceitos foi definida uma arquitetura abrangente que permite a integrao
entre o protocolo e diferentes verses de padres (Figura 13).

Figura 13 - Arquitetura de alto nvel do TAPIR/DiGIR (DIGIR, 2013).

A comunicao nesta arquitetura toda baseada em XML, para facilitar tanto as solicitaes
como os retornos de dados. O protocolo aplicado tanto no Provedor quanto no Cliente, represen-
tado pelo Portal na Figura 13. O servio de Registro dos Provedores opcional nesta arquitetu-
ra, pois pode ser realizado pelo prprio Cliente.

Diretrizes para a Integrao de Dados de Biodiversidade


Nos provedores TAPIR os objetivos so mais especficos:
Efetuar a comunicao com a base de dados local;
Realizar o mapeamento dos dados locais baseados no padro de metadados utilizado;
Fornecer servios de requisio, para que outros sistemas possam solicitar os dados disponveis.

J nos clientes TAPIR os objetivos so:


Fornecer as regras necessrias para a formulao das requisies dos dados, conforma as
regras do protocolo;

79
Retornar os dados em formato padronizado, baseado no padro utilizado, de forma que o siste-
ma possa interpretar e armazenar os dados recebidos em sua base de dados local.

Em relao ao mapeamento e disponibilizao de dados utilizando o protocolo TAPIR, as tec-


nologias e os modelos de dados dos provedores TAPIR so irrelevantes para os clientes TAPIR durante
as suas requisies, pois todas as consultas so direcionadas aos elementos (conceitos) da camada
de abstrao dos dados (esquemas conceituais), e no diretamente nos dados armazenados no
banco de dados do provedor (Figura 14).
Diretrizes para a Integrao de Dados de Biodiversidade

Figura 14 Camada de Abstrao de dados na configurao do Provedor TAPIR (SILVA; CORREA, 2012).

80
Conforme apresentado na Figura 14, por meio de uma camada de abstrao, os
dados armazenados no modelo de dados do provedor so mapeados por um esquema
conceitual, baseado em um padro de metadados, como o Darwin Core. Com isso, os da-
dos e a estrutura do modelo de dados do provedor so escondidos e os servios TAPIR
passam a visualizar apenas os elementos do modelo de dados conceitual.

A partir da, toda a troca de informaes entre os sistemas, realizada pelo protocolo
TAPIR, realizada a partir deste modelo de dados conceitual.

O TAPIR tambm foi projetado para ser independente de qualquer estrutura parti-
cular para as respostas das consultas (conhecidos como modelos de sada). necessria a
definio de pelo menos um modelo de sada, ou referenciar um modelo j existente, para
ser utilizado nas respostas das operaes de busca.

A especificao completa do protocolo TAPIR pode ser consultada no documento


de especificao do protocolo TAPIR (verso 1.0)94. Outras informaes relacionadas ao
TAPIR, sua utilizao e evoluo podem ser consultadas na Wiki do Protocolo TAPIR95.

4.1.3 TAPIR Wrappers

Os Wrappers do TAPIR so classes codificadas em algumas linguagens de progra-


mao que implementam as principais funes do protocolo TAPIR. Com a utilizao des-
tes wrappers possvel incorporar as funcionalidades do protocolo TAPIR em sistemas
computacionais existentes ou em novos sistemas, sem a necessidade da implementao
completa do protocolo, sendo necessria apenas a realizao de algumas customizaes.

Diretrizes para a Integrao de Dados de Biodiversidade


Existem iniciativas (ativas e inativas) de wrappers para TAPIR nas seguintes linguagens de
programao:
Java;
PHP;
.NET;
Python.

Os detalhes sobre os wrappers do TAPIR podem ser consultados na Wiki do


TapirSoftware96.

94
Protocolo TAPIR http://www.tdwg.org/dav/subgroups/tapir/1.0/docs/tdwg_tapir_specification_2010-05-05.htm
95
Wiki do Protocolo TAPIR http://wiki.tdwg.org/TAPIR
96
TapirSoftware http://wiki.tdwg.org/twiki/bin/view/TAPIR/TapirSoftware 81
Alm dos wrappers existem softwares livres que tambm implementam os servios do proto-
colo TAPIR e podem ser utilizados e estendidos de forma simples. O mais utilizado o TapirLink, que
ser comentado a seguir.

4.1.4 TapirLink

O TAPIRLink97 uma ferramenta genrica para provedores TAPIR baseado no PHP DiGIR pro-
vider. Ele utiliza a biblioteca PHP ADOdb para acessar diferentes tipos de bancos de dados relacio-
nais. Uma nica instncia do TapirLink possibilita o acesso a mltiplas fontes TAPIR, cada uma com
seus servios prprios. O TapirLink tambm possibilita que cada fonte de dados seja mapeada com
uma ou mais camadas de abstrao de dados e que as respostas das suas solicitaes sejam retorna-
das em diferentes formatos.

O processo de instalao e configurao do TapirLink pode ser verificado a partir do Manual


do TapirLink98.

4.1.5 Referncias

DIGIR (Distributed Generic Information Retrieval). Table of Contents. Disponvel em: <http://digir.
net/>. Acesso em: 30 jun. 2013.

BIOCASE PROTOCOLS. Disponvel em: <http://www.biocase.org/products/protocols/>. Acesso em:


30 jun. 2013.

SALVANHA, P. Modelo para anlise de desempenho do processo de replicao de dados em


Diretrizes para a Integrao de Dados de Biodiversidade

portais de biodiversidade. Dissertao (Mestrado). Disponvel em: http://www.teses.usp.br/teses/


disponiveis/3/3141/tde-11082010-161042/pt-br.php. Acesso em: 30 jun. 2013.

SILVA, D. L.; CORREA, P. L. P. Arquitetura de Interoperabilidade do Herbrio Virtual de Plantas


Repatriadas do JBRJ: Projeto REFLORA. Universidade de So Paulo, 13 ago. 2012.

TAPIR (TDWG Access Protocol for Information Retrieval). Disponvel em: <http://www.tdwg.org/dav/
subgroups/tapir/1.0/docs/tdwg_tapir_specification_2010-05-05.htm>. Acesso em: 30 jun. 2013.

TAPIRLINK. Tapir TWiki. Disponvel em: <http://wiki.tdwg.org/twiki/bin/view/TAPIR/TapirLink>.


Acesso em: 30 jun. 2013.
97
TAPIRLink http://wiki.tdwg.org/twiki/bin/view/TAPIR/TapirLink
98
Manual do TapirLink http://wiki.tdwg.org/twiki/bin/view/TAPIR/TapirLinkManual
82
TAPIRLINK. Tapir Link Manual. Disponvel em: <http://wiki.tdwg.org/twiki/bin/view/TAPIR/Tapir-
LinkManual>. Acesso em: 30 jun. 2013.

TAPIRLINK. Tapir Software. TAPIR TWiki. Disponvel em: <http://wiki.tdwg.org/twiki/bin/view/TA-


PIR/TapirSoftware>. Acesso em: 30 jun. 2013.

TAPIR TWiki. Disponvel em:< http://wiki.tdwg.org/TAPIR/>. Acesso em: 30 jun. 2013.

4.2 IPT

4.2.1 Apresentao

O Integrated Publishing Toolkit (IPT)99 uma aplicao Web livre e de cdigo aberto para a
publicao de dados de biodiversidade. Desenvolvida pelo GBIF, com o apoio de diversas institui-
es de biodiversidade, a ferramenta recomendada pelo GBIF para a publicao de dados no GBIF
Network, embora tambm sejam aceitos pelo GBIF dados publicados por outras aplicaes e proto-
colos, como TAPIR, DiGIR ou BioCASE.

O IPT desenvolvido na linguagem de programao Java e possibilita a publicao de conte-


do de bancos de dados e arquivos texto utilizando os padres abertos Darwin Core (DwC) e Ecolo-
gical Metadata Language (EML).

4.2.2 Funcionamento

Diretrizes para a Integrao de Dados de Biodiversidade


O IPT realiza o gerenciamento e a publicao de trs tipos de dados:
Dados Primrios de Biodiversidade (dados de ocorrncias): Consistem em textos ou da-
dos multimdia que detalham a ocorrncia de uma espcie, tais como descrio, local, data,
coletor e condies da coleta.
Nomes de espcies (dados taxonmicos): Trata-se de um checklist taxonmico, ou seja,
um conjunto de nomes vlidos (cientficos e comuns) de espcies conhecidas.
Metadados de recursos: Descrio das colees de dados. Incluem a localizao, prove-
nincia, proprietrio e qualidade dos dados das colees, podendo tambm abranger as-
pectos tcnicos.
99
Integrated Publishing Toolkit (IPT) http://www.gbif.org/ipt

83
As principais funcionalidades do IPT so:

Criao de colees de dados a partir da importao de registros provenientes debancos de


dados diversos, arquivos texto estruturados (CSV), arquivos no formato EXCEL (XLS e XLSX)
ou arquivos Darwin Core Archive (DwC-A);

Gerenciamento dos metadados das colees na prpria interface Web da ferramenta. Os


metadados so estruturados de acordo com o GBIF Metadata Profile100, um subconjunto
de elementos do padro EML;

Publica a coleo de dados no padro Darwin Core Archive, no padro Ecological Metadata
Language (EML V2.1.1) e RSS (apenas para informaes sobre as atualizaes nas colees);

Registra o conjunto de dados/instituio no GBIF Registry101, possibilitando que seus dados


sejam publicados no GBIF Network.

Para a publicao destes dados na rede GBIF, um provedor de dados deve ser criado e descrito
por meio de metadados, a origem dos dados deve ser identificada pelo carregamento de arquivos
ou pela configurao de uma conexo com um banco de dados, e a realizao do mapeamento que
possibilitar a correta transformao dos dados nos termos estabelecidos pelo padro Darwin Core
e pelas suas extenses, caso sejam utilizadas.

A documentao completa da ferramenta pode ser consultada no manual de usurio do


IPT Outras informaes relacionadas ao IPT, sua utilizao e evoluo podem ser consultadas na
102

Wiki do IPT103.

4.2.3 Referncias
Diretrizes para a Integrao de Dados de Biodiversidade

Gbif.org: Publishing. Disponvel em: <http://www.gbif.org/ipt>. Acesso em: 30 jun. 2013.

gbif-providertoolkit - A Java web application for publishing biodiversity data on the web and the
GBIF network - Google Project Hosting. Disponvel em: <http://code.google.com/p/gbif-provider-
toolkit/>. Acesso em: 30 jun. 2013.

GBRDS-Registry. Disponvel em: <http://gbrds.gbif.org/index#>. Acesso em: 30 jun. 2013.

IPT2 Manual Notes - gbif-providertoolkit - A Java web application for publishing biodiversity data on
the web and the GBIF network - Google Project Hosting. Disponvel em: <http://code.google.com/p/
gbif-providertoolkit/wiki/IPT2ManualNotes?tm=6>. Acesso em: 30 jun. 2013.

O TUAMA, E.; BRAAK, K. GBIF Metadata Profile, Reference Guide. GBIF, 2011.

100
GBIF Metadata Profile http://www.gbif.org/orc/?doc_id=2820
84
101
GBIF Registry http://gbrds.gbif.org
102
Manual de usurio do IPT http://code.google.com/p/gbif-providertoolkit/wiki/IPT2ManualNotes?tm=6
103
Wiki do IPT http://code.google.com/p/gbif-providertoolkit
4.3 HIT

4.3.1 Apresentao

O Harvesting and Indexing Toolkit (HIT)104 uma ferramenta criada pelo GBIF com o propsi-
to de facilitar o trabalho de agregar registros e dados relacionados biodiversidade. Trata-se de um
software de gerenciamento de dados baseado em Java que realiza a construo de um conjunto de
dados indexado, com base nos registros coletados de variados provedores de dados.

O conceito do HIT se mostra interessante devido ao cenrio atual das coletas de dados de
biodiversidade, onde as instituies muitas vezes utilizam diferentes protocolos (e verses) para
o compartilhamento dos seus dados, gerando uma heterogeneidade de redes de publicao de
difcil gesto.

Uma vez que as fontes de publicaes que adotam um protocolo de transferncia padro
no costumam adotar novos protocolos na mesma frequncia com que estes so desenvolvidos,
existe a necessidade de que os agregadores continuem trabalhando com todos os protocolos que
ainda possuem suporte ao mesmo tempo em que se adaptam aos novos. Esse cenrio de maior
complexidade acaba por dificultar o trabalho dos usurios finais, responsveis por coletar e agre-
gar estes dados.

nesse cenrio que surge o HIT. A ferramenta conta com uma interface desenvolvida
especialmente para abstrair a complexidade existente na transferncia de dados e no conjunto de
operaes gerenciadas pelo usurio. Ao esconder as diferenas entre os protocolos e agregar todos

Diretrizes para a Integrao de Dados de Biodiversidade


os registros em uma base de dados nica e padronizada, o HIT oferece um mecanismo de fcil acesso
para o agregador ou publicador de dados, que tem controle sobre todos os registros coletados em
um nico ambiente.

4.3.2 Funcionamento

A ferramenta HIT suporta a coleta de registros nos trs protocolos de maior utilizao em pu-
blicaes de biodiversidade:

DiGIR;

BioCASe;
104
Harvesting and Indexing Toolkit (HIT) https://code.google.com/p/gbif-indexingtoolkit/
85
TAPIR.

Cada um desses protocolos permite ao usurio definir como suas requisies XML sero codi-
ficadas. O HIT d suporte nativo s codificaes (verses) listadas abaixo:

DiGIR

DwC 1.0

DwC 1.4

BioCASe

ABCD 1.2

ABCD 2.06

TAPIR

DwC 1.4

ABCD 1.2

ABCD 2.06

O HIT tambm permite a importao de arquivos no padro Darwin Core Archive (DwC-A).

Esta ferramenta foi desenvolvida de forma a possibilitar uma extensa customizao do usu-
rio, de modo que possvel desenvolver de forma simples o suporte a novos protocolos ou novas
verses dos protocolos e padres j existentes.

No entanto, o suporte ao HIT foi descontinuado pelo GBIF, e a sua ltima verso oficial lanada
Diretrizes para a Integrao de Dados de Biodiversidade

foi a 1.43-RC1, de maro de 2012.

Tambm foi identificado nesta ltima verso da ferramenta uma falha de segurana, causada
por uma vulnerabilidade no Struts2, o framework computacional utilizado no desenvolvimento do
HIT. Por isso, recomendvel a utilizao desta ferramenta apenas em redes internas, sem sua dispo-
nibilizao aberta na internet.

Como alternativas ao HIT, esto disponveis na internet bibliotecas para processamento de


arquivos Darwin Core Archive e para a comunicao utilizando os protocolos TAPIR e DiGIR. Estas
bibliotecas podem ser utilizadas no desenvolvimento de ferramentas ou scripts para a agregao
de dados provenientes de diversos provedores. Outra alternativa a utilizao de ferramentas j

105
Manual de usurio do HIT https://code.google.com/p/gbif-indexingtoolkit/wiki/UserManual
106
Wiki do HIT https://code.google.com/p/gbif-indexingtoolkit/
86
desenvolvidas pela comunidade cientfica, como o Biocache-Store (Atlas of Living Australia) e o Ca-
nadensys-Harvester (Canadensys).

A documentao completa da ferramenta pode ser consultada no manual de usurio do


HIT . Outras informaes relacionadas do HIT, sua utilizao e evoluo podem ser consultadas na
105

Wiki do HIT106.

4.3.3 Referncias

GBIF (Global Biodiversity Information Facility). Gbif.org: Indexing. Disponvel em: <https://code.
google.com/p/gbif-indexingtoolkit/>. Acesso em: 30 jun. 2013.

GBIF (Global Biodiversity Information Facility). gbif-indexingtoolkit - The GBIF Harvesting and In-
dexing Toolkit (HIT) - Google Project Hosting. Disponvel em: <https://code.google.com/p/gbif-
-indexingtoolkit/>. Acesso em: 30 jun. 2013.

GBIF (Global Biodiversity Information Facility). User Manual - gbif-indexingtoolkit - User Manual
aimed at end-users - The GBIF Harvesting and Indexing Toolkit (HIT) - Google Project Hosting.
Disponvel em: <https://code.google.com/p/gbifindexingtoolkit/wiki/UserManual>. Acesso em: 30
jun. 2013.

Diretrizes para a Integrao de Dados de Biodiversidade

87
Diretrizes para a Integrao de Dados de Biodiversidade

Ceiba speciosa (Chorisia speciosa) Malvaceae (Bombacaceae)


http://www.gbif.org/page/201
Foto: Maurcio Mercadante
88
5. Ferramentas de apoio

Na Tabela 13 so apresentadas algumas das principais ferramentas e servios de apoio uti-


lizadas nos diversos processos de registro, mapeamento, gerao de metadados, validao e apre-
sentao dos dados. A maior parte destas ferramentas so livres e de cdigo aberto (algumas com o
projeto de desenvolvido encerrado), mas existem tambm ferramentas com verses pagas.

Com a utilizao destas ferramentas alguns dos problemas mais comuns na manipulao de
dados de biodiversidade podem ser simplificados e at solucionados.

Tabela 13 Ferramentas de apoio no processo de gesto de dados de biodiversidade.

Ferramentas Descrio URL


Biblioteca para a apresentao de dados em https://developers.google.com/
API Google Maps
mapas nos navegadores de internet. maps/?hl=pt-br

Arc GIS http://www.esri.com/software/


Visualizador de mapas gratuito.
Explorer arcgis/explorer/download.html

Conjunto de aplicaes e ferramentas que


Atlas of Living https://github.com
formam a infraestrutura do Portal de Dados
Australia AtlasOfLivingAustralia
do Atlas of Living Australia.

Ferramenta de base de dados para gesto


de informaes sobre biodiversidade, http://www.gbif.es/bibmaster/
Bibmaster
com nfase na literatura e informaes bibmaster.php
nomenclaturais.

Diretrizes para a Integrao de Dados de Biodiversidade


Ferramenta utilizada para a gesto,
manuteno, anlise e disseminao de https://code.google.com/p/biolink/
BioLink
dados taxonmicos, de biodiversidade e wiki/BioLink
informaes do meio ambiente.

Bionomenclature Compilao de termos utilizados na http://bionomenclature-glossary.


Glossary Bionomenclatura. gbif.org/

Conjunto de aplicaes e ferramentas que


Canadensys
formam a infraestrutura do Portal de Dados https://github.com/Canadensys
Canadensys.

Ferramenta baseada na Web para a gesto


CollectiveAccess completa de colees de museus e demais http://collectiveaccess.org/
colees digitais.

89
Ferramentas Descrio URL

Ferramenta que converte diferentes tipos de


http://splink.cria.org.br/
Conversor representao de coordenadas geogrficas e
conversor?criaLANG=pt
datums.

Ferramenta para converso de coordenadas


Coordinate http://data.canadensys.net/tools/
geogrficas de GGMMSS para graus
conversion coordinates
decimais.

Ferramenta que converte latitudes e


C-Squares longitudes em c-squares (quadrados), que http://www.marine.csiro.au/
Mapper so georeferenciados, representado uma csquares/
rea da superfcie terrestre.

Ferramenta para validao de registros nos http://www.gbif.es/darwin_test/


Darwin Test
formatos Darwin Core, verses 1.2 e 1.4. Darwin_Test_in.php

Ferramenta que possibilita a anlise das


caractersticas de dados vindos de fontes http://sourceforge.net/projects/
Data Profiler
de dados em diversos formatos (XML, JDBC dataprofiler/
ou CSV).
Listagem de vrios softwares utilizados nos
DataONE
diversos processos de armazenamento, http://www.dataone.org/all-
Software Tools
compartilhamento, publicao, anlise e software-tools
Catalog
gesto de dados biolgicos.
Ferramenta que identifica os padres de http://data.canadensys.net/tools/
Date parsing
datas e os padroniza. dates
Ferramenta que transforma dados coletados
http://sourceforge.net/projects/
DC Meta Toolkit em diferentes formatos em metadados
dcmetatoolkit/
Dublin Core.

Ferramenta simples de ajuda, para aplicaes http://www.ukoln.ac.uk/metadata/


DC-Assist
Diretrizes para a Integrao de Dados de Biodiversidade

que utilizam o Dublin Core. dcassist/

Servio que recupera uma pgina Web


http://www.ukoln.ac.uk/metadata/
DC-dot e gera automaticamente um registro de
dcdot/
metadados Dublin Core.

Implementao em Java do DELTA (http://


delta-intkey.com/). um mtodo flexvel https://code.google.com/p/open-
DELTA
para a codificao de descries taxonmicas delta/
para o processamento computacional.

DIVA-GIS Sistema de informao geogrfico gratuito. http://www.diva-gis.org/

Ferramenta Web que possibilita a gerao de


Dublin Core http://dublincoregenerator.com/
um registro no padro Dublin Core por meio
Generator generator_nq.html
do preenchimento de um formulrio.

90
Ferramentas Descrio URL

https://code.google.
Biblioteca Java que realiza a leitura de
DwC Reader com/p/darwincore/wiki/
arquivos DwC-A.
DarwinCoreArchiveReader

Assistente para o processo de criao de um http://tools.gbif.org/dwca-


DwC-A Assistant
arquivo DwC-A. assistant/

Assistente para a criao de um arquivo


DwC-A Spreadsheet http://tools.gbif.org/spreadsheet-
DwC-A a partir de dados armazenados em
Processor processor/
uma planilha eletrnica.

Validador de arquivos Darwin Core Archive http://tools.gbif.org/dwca-


DwC-A Validator
(DwC-A). validator/

Ferramenta para a importao de arquivos


https://code.google.com/p/
dwca2sql Darwin Core Archive para um banco de
canadensys/wiki/dwca2sql
dados relacional.

Disponibiliza grades geogrficas (Lat./Lon., http://www.earthpoint.us/Grids.


Earth Point
UTM, UPS, MGRS e USNG) no Google Earth. aspx

Editor-Converter Ferramenta para edio de registros Dublin


http://www.library.kr.ua/dc/
Dublin Core Core publicados na internet e sua converso
dceditunie.html
metadata no formato UNIMARC.

Pacote de software para Web com foco http://www.ala.org.au/get-


Field Data Software na comunidade cientfica para registrar e involved/citizen-science/fielddata-
gerenciar dados de biodiversidade. software/

Ferramenta que extrai nomes cientficos


FindIt2Darwin http://sourceforge.net/projects/
armazenados em documentos PDF,
Core findit2darwinco/
localizados em um endereo Web.

Diretrizes para a Integrao de Dados de Biodiversidade


Aplicao Web do antigo Portal de Dados
do GBIF. Apesar de descontinuado, ainda URL: https://code.google.com/p/
GBIF Data Portal
bastante utilizado na gerao de novos gbif-dataportal/
Portais de Dados de Biodiversidade.

Navegador para pesquisa e consulta de


GBIF Resource http://tools.gbif.org/resource-
informaes referentes aos termos do
Browser browser/
Darwin Core e suas extenses.

Portal que disponibiliza informaes sobre


GBIF Vocabularies a utilizao de diversos vocabulrios e http://vocabularies.gbif.org/
extenses para padro Darwin Core.

91
Ferramentas Descrio URL

Ferramenta para georeferenciamento a


http://www.museum.tulane.edu/
Geo Locate partir da anlise de descries textuais de
geolocate/
localizao.

Projeto livre e de cdigo aberto para


Geo Network catalogao de recursos espacialmente http://geonetwork-opensource.org/
referenciados.

Ferramenta para a obteno de coordenadas


a partir do clique em mapas. possvel
geo:truc http://www.geotruc.net/?hl=es_ES
a gerao das coordenadas em diversos
padres.

Ferramenta que auxilia o trabalho de


http://splink.cria.org.br/
geoLoc georeferenciamento dos acervos das
geoloc?criaLANG=pt
colees biolgicas.

Servidor de cdigo aberto que possibilita o


http://geoserver.org/display/GEOS/
GeoServer compartilhamento, processamento e edio
Welcome
de dados geoespaciais.

Ferramenta que possibilita a converso


http://earth-info.nima.mil/GandG/
GeoTrans geogrfica de coordenadas entre uma ampla
geotrans/
variedade de sistemas de coordenadas.

Aplicao Desktop e Web para visualizao http://www.google.com.br/intl/pt-


Google Earth
de mapas e dados geoespaciais. BR/earth/index.html

Ferramenta para visualizao de modelos http://www.google.com.br/intl/pt-


Google Earth
tridimensionais do globo terrestre. BR/earth/index.html
Diretrizes para a Integrao de Dados de Biodiversidade

Servio de Mapas na Web que tambm


Google Maps disponibiliza fotos de satlite, rotas e http://googlemaps.com
diversas informaes geogrficas.

Ferramenta para visualizar pontos e trajetos


GPS Visualizer em um mapa, permitindo a correo de http://www.gpsvisualizer.com/
coordenadas.

http://www.gbif.es/herbar/herbar.
Herbar Ferramenta para gesto de herbrios.
php

Ferramenta para informatizao e gesto de


HZL http://www.gbif.es/hzl/hzl.php
colees botnicas e zoolgicas.

92
Ferramentas Descrio URL

Software baseado no MapServer


http://www.softwarepublico.gov.
que possibilita o compartilhamento,
I3GEO br/ver-comunidade?community_
processamento e edio de dados
id=1444332
geoespaciais.

Ferramenta que auxilia na validao de http://splink.cria.org.br/


infoXY
dados geogrficos. infoxy?criaLANG=pt

Ferramenta para validao de nomes


iPlant Collaborative http://tnrs.iplantcollaborative.org/
cientficos de plantas.

Biblioteca Java que disponibiliza uma API


http://knb.ecoinformatics.org/
Itislib para acesso a base de dados taxonmica do
software/download.jsp#itislib
ITIS*ca.

Ferramenta para a construo flexvel e


Jalama customizada de formulrios de entrada de http://jalama.ecoinformatics.org/
dados.

Sistema de workflow cientfico que permite


Kepler a criao de workflows e sua execuo https://kepler-project.org/
eficiente utilizando diversas abordagens.

Sistema de gesto da Lista de Espcies


Lista de Espcies da
da Flora do Brasil que realiza a validao http://floradobrasil.jbrj.gov.br/
Flora do Brasil
taxonmica da flora do Brasil.

Servidor de cdigo aberto que possibilita o


MapServer compartilhamento, processamento e edio http://www.mapserver.org/
de dados geoespaciais.

Diretrizes para a Integrao de Dados de Biodiversidade


uma arquitetura de banco de dados de
metadados flexvel, que utiliza XML como http://knb.ecoinformatics.org/
Metacat
sintaxe comum para representar padres de software/metacat/
contedo pelos ecologistas.

Ferramenta para a anlise exploratria de


dados. Seu objetivo apoiar a anlise e http://knb.ecoinformatics.org/
Monarch
sntese de arquivos de dados por meio de software/monarch
metadados.

Ferramenta que permite a criao e gesto


http://knb.ecoinformatics.org/
Morpho de metadados em EML, alm de seu
morphoportal.jsp
compartilhamento.

Ferramenta online para criao e edio de


http://www.isn-oldenburg.de/
My Meta Maker metadados de publicaes online (acesso
services/mmm/
aberto).

93
Ferramentas Descrio URL

Servio Web do ECAT que analisa nomes


Name Parser cientficos e realiza a diviso do nome nos http://tools.gbif.org/nameparser/
seus componentes.

Verso em MS Access da ferramenta Name


Parser, que analisa nomes cientficos e os http://www.gbif.es/name_parser/
Name Parser Access
divide em componentes (gnero, espcie, Name_Parser.php
autor etc.)

Ferramenta livre, flexvel e aberta para


Omeka a publicao na internet de dados de http://omeka.org/
bibliotecas, museus e colees acadmicas.

Biblioteca Javascript cdigo aberto para


Open Layers a visualizao de dados em mapas nos http://www.openlayers.org/
navegadores de internet.

Ferramenta para modelagem de distribuio


http://openmodeller.sourceforge.
Open Modeller espacial, utilizada para prever a distribuio
net/
de espcies.

Antigo Google Refine, uma ferramenta


para manipulao de dados confusos
Open Refine http://openrefine.org/
e bagunados, possibilitando sua
transformao e limpeza.

Ferramenta que gera arquivos RDF para http://www.webposible.com/


Photo RDF-Gen descrio de imagens, especialmente utilidades/photo_rdf_generator_
fotogrficas. en.html

Extenso espacial para o banco de dados


PostGIS PostgreSQL, permitindo a manipulao de http://postgis.net/
Diretrizes para a Integrao de Dados de Biodiversidade

dados geoespaciais.

Desktop GIS livre e cdigo aberto, que


Quantum GIS possibilita a visualizao, edio e anlise http://www.qgis.org/
dos dados.

http://fm2.fieldmuseum.org/
Rapid Color Guides Repositrio de guias de campos.
plantguides/

Ferramenta para validao de arquivos CSV http://sandbox.ala.org.au/


SandBox
utilizando o padro Darwin Core. datacheck/

Simple DwC Terms http://darwincore.googlecode.com/


Tabela do Simple Darwin Core no MS Access.
(Access) files/SimpleDwCMSAccess.mdb

94
Ferramentas Descrio URL

Simples DwC Terms Esquema do Simple Darwin Core no MS http://darwincore.googlecode.


(Excel) Excel. com/files/SimpleDwCMSExcel.xls

Base de dados genrica para gesto de http://splink.cria.org.br/


speciesBase
registros taxonmicos. speciesbase?criaLANG=pt

Ferramenta que possibilita a visualizao de


speciesMapper http://splink.cria.org.br/mapper
coordenadas em um mapa.

Ferramenta de deteco de outliers para os http://splink.cria.org.br/


spOutlier
parmetros latitude, longitude e altitude. outlier?criaLANG=pt

uma arquitetura cliente-servidor para


Storage Resource http://www.npaci.edu/DICE/SRB/
interligar uma rede distribuda de recursos
Broker (SRB) index.html
de dados heterogneos.

Ferramenta de anlise de dados que define


http://www.talend.com/products/
Talent Open Profiler o contedo, estrutura e qualidade de dados
data-quality
complexos.

Aplicao Web que localiza, identifica e


Taxon Tagger extrai nomes cientficos de pginas Web e http://tools.gbif.org/taxontagger/
arquivos PDF.

TDWG Subgroup on Listagem de vrios softwares utilizados na


http://www.bgbm.org/TDWG/acc/
Biological Collection gesto de colees biolgicas (softwares
Software.htm
Data livres e produtos comerciais).

Biblioteca GIS de cdigo aberto que


TerraLib possibilita que bancos de dados relacionais http://www.terralib.org/
manipulem dados geoespaciais.

Diretrizes para a Integrao de Dados de Biodiversidade


Servio para extrao de textos de arquivos
Text Extraction
binrios em formatos como PDF, MS Word, http://ecat-dev.gbif.org/ws-tika/
Service Help
MS Excel, MS PowerPoint entre outros.

API para utilizao das ferramentas de


http://data.canadensys.net/tools/
Tools API converso de coordenadas e anlise de
api
datas.
Ferramenta online para testar se uma URL
Viewer-Generator possui um registro de metadados Dublin
http://www.library.kr.ua/dc/
Dublin Core Core. Tambm gera automaticamente um
lookatdce.html
metadata registro DC para pginas que possuem
apenas metadados HTML.

Aplicao para gesto de colees de http://www.gbif.es/zoorbar/


Zoorbar
Histria Natural. zoorbar.php

95
Diretrizes para a Integrao de Dados de Biodiversidade

96
Anotaes
97
Diretrizes para a Integrao de Dados de Biodiversidade
Diretrizes para a Integrao de Dados de Biodiversidade

98
99
Diretrizes para a Integrao de Dados de Biodiversidade
Diretrizes para a Integrao de Dados de Biodiversidade

100
Diretrizes para a Integrao de Dados de Biodiversidade

101
Mico-Leo-Dourado
Foto: Wigold B. Schffer
Diretrizes para a Integrao de Dados de Biodiversidade

102

Você também pode gostar